1. Embedding模型配置
使用ollama模型,導入qwen3的embedding-8B模型,導入流程參考:
Ollama離線部署模型
qwen3-Embedding模型文件可從魔塔社區下載:
Qwen3-Embedding-8B
1.2 Coze配置
在coze_studio/docker目錄下輸入:
vim .env
找到Embedding設置:
將EMBEDDING_TYPE改為ollama,并修改下面的ollama調用的url和模型名稱
ollama中的模型如下:
ollama list
配置完成后輸入 :wq 保存vim編輯的內容;
然后返回docker目錄下輸入:
docker停止:
docker stop $(docker ps -q)
coze啟動:
docker-compose --profile ‘*’ up -d
coze啟動后在資源庫中創建知識庫,并上傳文件
然后創建設置:
分段預覽和數據處理:
在cmd命令行輸入nvidia-smi:
可以看到GPU使用情況:
2. PaddleOCR模型配置
2.1 paddle-ocr安裝和代碼編寫
首先安裝PaddleOCR:
pip install paddleocr
pip install paddlepaddle
pip install fastapi uvicorn
paddlerocr運行代碼,注意inference參數可能需要自己下載:
from flask import Flask, request, jsonify
from paddleocr import PaddleOCR
import base64, numpy as np, cv2ocr = PaddleOCR(use_angle_cls=True, use_gpu=False,det_model_dir='./inference/ch_PP-OCRv3_det_infer',rec_model_dir='./inference/ch_PP-OCRv3_rec_infer',cls_model_dir='./inference/ch_ppocr_mobile_v2.0_cls_infer')app = Flask(__name__)@app.route("/ocr", methods=["POST"])
def ocr_api():img_b64 = request.json["image"]img = cv2.imdecode(np.frombuffer(base64.b64decode(img_b64), np.uint8), 1)res = ocr.ocr(img, cls=True)return jsonify(res)if __name__ == "__main__":app.run(host="0.0.0.0", port=8999)
然后創建paddle_structure.py
from fastapi import FastAPI, UploadFile, File
from paddleocr import PaddleOCR, PPStructure
import uvicorn
import osapp = FastAPI()# 初始化版面結構化 OCR
table_engine = PPStructure(show_log=True, lang='ch')UPLOAD_DIR = "uploads"
os.makedirs(UPLOAD_DIR, exist_ok=True)@app.post("/structure")
async def do_ocr_structure(file: UploadFile = File(...)):file_path = os.path.join(UPLOAD_DIR, file.filename)with open(file_path, "wb") as f:f.write(await file.read())result = table_engine(file_path)return {"code": 0, "msg": "success", "data": result}if __name__ == "__main__":uvicorn.run(app, host="0.0.0.0", port=9999)
對于離線環境,需要下載paddler-ocr的inference文件并配置:
inference下載和使用
2.2 Coze配置
終端 coze的docker目錄下輸入:
vim .env
對OCR進行配置并保存:
然后返回docker目錄下輸入:
docker停止:
docker stop $(docker ps -q)
coze啟動:
docker-compose --profile ‘*’ up -d
coze啟動后在資源庫中創建知識庫,并上傳文件,勾選掃描件(OCR)選項,點擊下一步之后進行數據處理
解析結果如下: