在當今數字化快速發展的時代,OCR(光學字符識別)技術已經成為從圖像中提取文本信息的重要工具。無論是在自動化辦公、智能文檔處理還是在內容創作領域,OCR 技術的應用都極大地提高了工作效率和準確性。本文將詳細介紹如何利用算力魔方4060這一硬件平臺,結合Cherry Studio軟件,安裝并配置PaddleOCR MCP服務器實現自動化的文本識別與分析。
一,算力魔方簡介
算力魔方??是一款可以DIY的迷你主機,采用了抽屜式設計,后續組裝、升級、維護只需要拔插模塊。通過選擇不同算力的計算模塊,再搭配不同的 IO 模塊可以組成豐富的配置,適應不同場景。
性能不夠時,可以升級計算模塊提升算力;IO 接口不匹配時,可以更換 IO 模塊調整功能,而無需重構整個系統。
本文以下所有步驟將在帶有英特爾i7-1165G7處理器英偉達4060獨立顯卡的算力魔方上完成驗證。
二,安裝Cherry Studio
Cherry Studio是一款跨平臺的集成了AI大模型和知識庫、網絡搜索、MCP服務器等相關工具桌面客戶端應用程序,方便用戶配置出自己的AI智能體助手。具體安裝教程可閱讀該文章。
三,安裝PaddleOCR_MCP庫
首先,在命令提示行執行命令安裝源頭庫
git clone https://github.com/PaddlePaddle/PaddleOCR.git
然后再執行命令,安裝MCP服務驅動:
pip install -e mcp_server
若需驗證MCP服務器安裝是否成功,可輸入命令
paddleocr_mcp --help
四,在CheryStudio中使用PaddleOCR MCP服務器
首先,打開Cherry Studio在軟件的“MCP服務器”管理頁面,安裝好UV和Bun。
然后,在Cherry Studio的“MCP服務器”管理頁面,點擊“+ 添加服務器-從JSON導入”,填入下面的參數:
{
"mcpServers": {
"paddleocr-ocr": {
"command": "請注意,如果你使用的是Anaconda,請在Anaconda安裝的隔離環境中輸入where paddleocr_mcp來獲取對應的MCP路徑。否則無法使用",
"args": [],
"env": {
"PADDLEOCR_MCP_PIPELINE": "OCR",
"PADDLEOCR_MCP_PPOCR_SOURCE": "local"
}
}
}
}
最后,點擊“確定”按鈕,完成在Cherry Studio中,配置PaddleOCR MCP。
五,PaddleOCR MCP服務器運行
首先,啟用MCP服務器輸入需要進行的操作與對應的圖片路徑:
根據圖片路徑C:\Users\PX22\PP-OCRv5_OpenVINO\images\ancient_demo.png,從圖像中提取文本、公式和其他信息,同時保留文檔結構
如何用算力魔方4060安裝PaddleOCR MCP 服務器
六,總結
借助于Cherry Studio +大模型+ PaddleOCR MCP的強大功能,用戶不僅可以從各種類型的圖片中準確提取文字信息,還能進一步處理如結構化數據提取等高級任務。更重要的是,結合Cherry Studio提供的靈活配置選項,用戶可以根據自身需求定制出最適合自己的AI助手,極大提升了工作和生活的效率。
如果你有更好的文章,歡迎投稿!
稿件接收郵箱:nami.liu@pasuntech.com
更多精彩內容請關注“算力魔方?”!