Coze添加知識庫解析的Embedding和PaddleOCR模型配置

1. Embedding模型配置

使用ollama模型，導入qwen3的embedding-8B模型，導入流程參考：
Ollama離線部署模型
qwen3-Embedding模型文件可從魔塔社區下載：
Qwen3-Embedding-8B

1.2 Coze配置

在coze_studio/docker目錄下輸入:

vim .env

找到Embedding設置：
將EMBEDDING_TYPE改為ollama，并修改下面的ollama調用的url和模型名稱

ollama中的模型如下：
ollama list

配置完成后輸入 :wq 保存vim編輯的內容;

然后返回docker目錄下輸入：
docker停止：

docker stop $(docker ps -q)

coze啟動:

docker-compose --profile ‘*’ up -d

coze啟動后在資源庫中創建知識庫，并上傳文件
在這里插入圖片描述
然后創建設置：

分段預覽和數據處理：

在cmd命令行輸入nvidia-smi：
可以看到GPU使用情況:
ollama調用

2. PaddleOCR模型配置

2.1 paddle-ocr安裝和代碼編寫

首先安裝PaddleOCR:

pip install paddleocr
pip install paddlepaddle
pip install fastapi uvicorn

paddlerocr運行代碼,注意inference參數可能需要自己下載:

from flask import Flask, request, jsonify
from paddleocr import PaddleOCR
import base64, numpy as np, cv2ocr = PaddleOCR(use_angle_cls=True, use_gpu=False,det_model_dir='./inference/ch_PP-OCRv3_det_infer',rec_model_dir='./inference/ch_PP-OCRv3_rec_infer',cls_model_dir='./inference/ch_ppocr_mobile_v2.0_cls_infer')app = Flask(__name__)@app.route("/ocr", methods=["POST"])
def ocr_api():img_b64 = request.json["image"]img = cv2.imdecode(np.frombuffer(base64.b64decode(img_b64), np.uint8), 1)res = ocr.ocr(img, cls=True)return jsonify(res)if __name__ == "__main__":app.run(host="0.0.0.0", port=8999)

然后創建paddle_structure.py

from fastapi import FastAPI, UploadFile, File
from paddleocr import PaddleOCR, PPStructure
import uvicorn
import osapp = FastAPI()# 初始化版面結構化 OCR
table_engine = PPStructure(show_log=True, lang='ch')UPLOAD_DIR = "uploads"
os.makedirs(UPLOAD_DIR, exist_ok=True)@app.post("/structure")
async def do_ocr_structure(file: UploadFile = File(...)):file_path = os.path.join(UPLOAD_DIR, file.filename)with open(file_path, "wb") as f:f.write(await file.read())result = table_engine(file_path)return {"code": 0, "msg": "success", "data": result}if __name__ == "__main__":uvicorn.run(app, host="0.0.0.0", port=9999)

對于離線環境，需要下載paddler-ocr的inference文件并配置:
inference下載和使用

2.2 Coze配置

終端 coze的docker目錄下輸入:

vim .env

對OCR進行配置并保存：
在這里插入圖片描述
然后返回docker目錄下輸入：
docker停止：

docker stop $(docker ps -q)

coze啟動:

docker-compose --profile ‘*’ up -d

coze啟動后在資源庫中創建知識庫，并上傳文件，勾選掃描件(OCR)選項,點擊下一步之后進行數據處理
在這里插入圖片描述
解析結果如下:

在這里插入圖片描述

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/921481.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/921481.shtml
英文地址，請注明出處：http://en.pswp.cn/news/921481.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！