所有源碼都在文章中,大家不要私信來要源碼,當然,評論區歡迎交流技術
目錄
Paddle OCR
配置環境
示例
deepseek接入
環境配置
api 調用代碼
sliconflow
Paddle OCR
配置環境
清華源下載 paddlepaddle:
pip install paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simple
清華源下載 paddlehub:
pip install paddlehub -i https://pypi.tuna.tsinghua.edu.cn/simple
飛槳官網安裝:
開始使用_飛槳-源于產業實踐的開源深度學習平臺
根據自己電腦的配置進行選擇,選擇 GPU 或者 CPU,GPU 要選擇 CUDA 版本,可在cmd輸入指令查看:
nvcc --version
release 后面的就是 CUDA? 版本,還未下載 CUDA 的可以看我之前配置 YOLO8GPU 環境,有CUDA 、Cudnn教程:
CV -- 基于GPU版CUDA環境+Pycharm YOLOv8 目標檢測_python+yolo+opencv+cuda-CSDN博客
官網復制適合自己的指令,在控制臺下載(我這只是示例):
python -m pip install paddlepaddle-gpu==3.0.0rc1 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
下載完后再下載??paddleocr
pip install paddleocr
示例
配置完成,下面進行一個簡單示例(官方示例):
from paddleocr import PaddleOCR
import os
os.environ['KMP_DUPLICATE_LIB_OK'] = 'TRUE'#我的電腦因為報某些錯誤需要加上這個
# Paddleocr目前支持的多語言語種可以通過修改lang參數進行切換
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch",use_gpu = True) # need to run only once to download and load model into memory use_gpu 開啟gpu(顯卡)進行推理
img_path = 'F:\全棧\Django\YOLO_django\\app01\static\img\\2.jpg'
result = ocr.ocr(img_path, cls=True)
for idx in range(len(result)):res = result[idx]for line in res:print(line)
原圖片是這樣的:
運行代碼,識別文字:
識別是一行一行來的,第一個數據是該文字在圖片的位置信息是,第二個是文字識別的內容,第三個則是置信度。
可以看到,由于我識別的圖片拍的比較清晰,所有文字的識別置信度都在0.998之上,大家也可以放點不清晰的看看效果咋樣。
deepseek接入
環境配置
先去?deepseek?官網注冊,申請?api:
DeepSeek
這樣獲取的 api 是沒有免費額度的:
但我們也試試代碼。
api 調用代碼
安裝 openai
pip install openai
運行代碼:
from openai import OpenAIclient = OpenAI(api_key='你的api',base_url="https://api.deepseek.com")
response = client.chat.completions.create(model="deepseek-chat",messages=[{"role":"system","content":"你好呀"},{"role":"user","content":"很好"}],stream=False,
)
print(response.choices[0].message.content)
這樣是會報錯的:
因為自己 deepseek 官網沒有 token 請求次數,大部分小伙伴又不想花錢,API就沒辦法調用。當然,大大家有能力也可以自己去充值,充值了就有 token 使用權力,就可以正常調用 api。
sliconflow
沒超能力就無法調用 deepseek 了嗎?當然不是,大家也可注冊獲取使用Deepseek模型的平臺 sliconflow:
去這個網站注冊,注冊即送兩千萬 token,白飄黨的福利:Models
新建密鑰:
使用硅基平臺的 api 時,在調用時,需要修改部分代碼,修改如下:
base_url="http://api.siliconflow.cn/v1"model="deepseek-ai/DeepSeek-V3"
完整代碼如下:
from openai import OpenAIclient = OpenAI(api_key='你的api密鑰',base_url="http://api.siliconflow.cn/v1")
response = client.chat.completions.create(model="deepseek-ai/DeepSeek-V3",messages=[{"role":"system","content":"我是DeepSeek Chat,由深度求索公司(DeepSeek)創造的人工智能助手!"},{"role":"user","content":"怎么去重慶"}],stream=False,
)
print(response.choices[0].message.content)
message 中是上下文,model 可以根據 message 生成結果,role 是發送消息的對象,content 是內容,這里 role 有系統和用戶,系統就是 model 上次的回答,用戶則是你自己?。當然 message 中也可以不止放這兩行上下文,能放很多。
運行代碼:
可以看到是能給出推理的,這里也歡迎大家去重慶旅游哈哈(本人重慶的)。
?
下文更新,在Django中使用圖像識別、deepseek,盡情交互!!!