目錄
1、labelstudio安裝
2、yolo(txt)轉json
3、COCO轉yolo(僅針對coco格式標注信息)
4、設置環境變量并啟動labelstudio
5、進入label studio創建工程并設置任務標簽
6、安裝http-server并啟動文件映射服務
7、進入label studio導入json文件即可
1、labelstudio安裝
labelStudio簡介:Label Studio ?是一個開源的數據標注工具,由 Human Signal (原 Heartex )推出,主要用于機器學習和數據科學領域,幫助用戶對各種類型的數據進行標注和注釋,以生成高質量的訓練數據。它支持文本、圖像、音頻、視頻等多種數據類型的標注,適用于自然語言處理、圖像識別、語音識別等多種應用場景?。
安裝方法:
pip install label-studio
啟動命令(先不著急啟動,后面步驟會有):
label-studio start --data-dir /data/label-studio
2、yolo(txt)轉json
第一步,先將標注信息(yolo格式的txt)轉為json。
txt格式如下:
txt轉為json代碼如下:
修改其中的圖片來源地址(images_path)、標注信息來源地址(labels_path)、網址服務地址(root_path)和標簽字典(label_dict)。
代碼生成的json格式如下:
3、COCO轉yolo(僅針對coco格式標注信息)
如果原始標注數據是coco格式則先轉為yolo格式再進入第一步。
coco格式如下:
coco轉為yolo代碼如下:
修改其中的標注信息地址(coco_json_path)和yolo文件輸出地址(output_dir)。
4、設置環境變量并啟動labelstudio
先用腳本設置環境變量:
export LABEL_STUDIO_LOCAL_FILES_SERVING_ENABLED=true
export LABEL_STUDIO_LOCAL_FILES_DOCUMENT_ROOT=/data/label-studio。
然后啟動labelstudio
nohup /root/anaconda3/envs/label-studio/bin/python3.1 /root/anaconda3/envs/label-studio/bin/label-studio start --data-dir /data/label-studio &
如果實在不知道怎么配置pycharm,也可以直接用終端命令來生成:
先用cd命令進入ui文件所在的路徑下,然后執行命令:pyuic5 -o demo.py demo.ui
5、進入label studio創建工程并設置任務標簽
選擇標注任務類型并根據第一步生成json時代碼中的標注類別(label_dict)來設計labels。
例如,代碼中的類別label_dict如下::
則labelstudio的任務類型選擇為目標檢測,然后逐一add labels
6、安裝http-server并啟動文件映射服務
先安裝http-server:
apt install npm
npm install http-server -g
然后編輯啟動腳本,啟動的sh腳本如下:
修改其中的網址列表存儲文件(OUTPUT_FILE)和服務端口號(PORT)。
啟動服務來映射圖片地址(一定要用http-server加上--cors來啟動)
nohup sh serve_local_files.sh /data/label-studio/media/upload/1/ *.png &
注意配置圖片所在文件夾地址。
7、進入label studio導入json文件即可
流程如下:
然后可以看到項目下的圖片及標注框:
完整代碼見倉庫:https://github.com/Trisyp/labelstudio_data_transfer