文章目錄
- 引言
- deepseek-r1
- IDE或者終端工具
- 算力平臺
- 體驗deepseek-r1模型
- 總結
引言
在現代的機器學習和深度學習應用中,模型部署和服務化是每個開發者面臨的重要任務。無論是用于智能推薦、自然語言處理還是圖像識別,如何高效、穩定地將深度學習模型部署到生產環境中,都是提升系統性能和用戶體驗的關鍵環節。在本文中,我們將詳細介紹如何在服務器上成功部署DeepSeek-R1模型,幫助你一步步了解從環境搭建到模型上線的全過程。
deepseek-r1
最近熱度十分高的DeepSeek-R1大家相比都聽過,它是幻方量化旗下大模型公司 DeepSeek 研發的系列推理模型,于 2025 年 1 月 20 日正式發布并開源權重。它使用強化學習訓練,推理時包含大量反思和驗證,思維鏈長,在數學、代碼、自然語言推理等復雜任務上表現出色,與 ==OpenAI o1 ==性能相當 ,在 AIME、MATH-500、SWE-Bench Verified 等基準測試中成績優異,還能自我事實核查降低錯誤風險。模型參數達 6710 億,也有 15 億至 70 億參數的蒸餾版本,最小版可在普通筆記本運行。
目前,DeepSeek-R1 已在多個平臺接入部署,如數碼視訊、天翼云、聯通云、青云科技基石智算 CoresHub 等
下圖是模型出處
https://www.modelscope.cn/models/deepseek-ai/DeepSeek-R1/summary
IDE或者終端工具
這里我們選擇IDE(VScode或Pycharm)或者終端工具,都可以,這里我選擇使用Pycharm,當然別的也行,這里可以自行選擇
算力平臺
算力平臺,我這里選擇藍耕云智算
我們選擇一個3090的顯卡試試水
體驗deepseek-r1模型
在體驗之前,我們需要下載必要的文件,這里我給大家一個網址
https://github.com/1692775560/deepseek_project
我們只需要將其放到服務器上面,就可以完成體驗了
根據我們之前下載好的IDE,我們現在連接一下,然后就可以開心愉快的使用嘍~下面的具體的鏈接過程
第一步
復制賬戶密碼
第二步
粘貼下圖所示的位置,進行連接等待本地文件傳輸到服務器
備注:username填寫root即可,host,填寫@后面的即可
這樣就是成功了,當然我們還有配置一下環境,這里參考我下面的三小步即可
第三步
接下來,我們只需要在終端輸入代碼進行體驗,但是進入我們要記得進入那個文件夾里面哦,下圖是進入終端的方法
在進入到對應文件夾內,我們記得下載庫啊,pip install -r requirements.txt
下載完之后,運行python run_model.py即可
總結
大模型發展速度是真的很快,過去可能國外更加領先一點,但是如今我國的deepseek-r1模型甚至可以擠進了世界前三,對于我們大部分人來說,自己構建一個大模型可能需要龐大的算力,數據等等,但是若我們學會如何使用,如何部署那么對我們日常工作學習也是起到了一個 促進作用,希望我的視頻對你有幫助~~~
文末附上服務器的注冊地址https://cloud.lanyun.net//#/registerPage?promoterCode=0131