一、下載安裝 --Ollama
Ollama是一個開源的 LLM(大型語言模型)服務工具,用于簡化在本地運行大語言模型,降低使用大語言模型的門檻,使得大模型的開發者、研究人員和愛好者能夠在本地環境快速實驗、管理和部署最新大語言模型,包括如Llama 3、Phi 3、Mistral、Gemma等開源的大型語言模型。
下載方式:
方式1:官網下載:
官網地址:https://ollama.com/download
如果官網地址一直卡住下載不下來,選用下面的方法
方式2:GitHub下載:
GitHub官方鏈接:https://github.com/ollama/ollama
點擊GitHub鏈接,relase 跳轉到要下載的資源文件,鼠標右擊點擊復制鏈接。如以下示例類型:
https://github.com/ollama/ollama/releases/download/v0.4.3/OllamaSetup.exe
替換如下域名加速:
https://github.xzc888.top/
替換之后示例為:
https://github.xzc888.top/ollama/ollama/releases/download/v0.4.3/OllamaSetup.exe
下載安裝,打開cmd執行ollama -h
,回顯成功:
PS C:\Users\Administrator> ollama -h
Large language model runnerUsage:ollama [flags]ollama [command]Available Commands:serve Start ollamacreate Create a model from a Modelfileshow Show information for a modelrun Run a modelstop Stop a running modelpull Pull a model from a registrypush Push a model to a registrylist List modelsps List running modelscp Copy a modelrm Remove a modelhelp Help about any commandFlags:-h, --help help for ollama-v, --version Show version informationUse "ollama [command] --help" for more information about a command.
打開ollama的Models:https://ollama.com/search
,搜索deepseek-r1,復制命令行執行即可。
如果你的顯卡有8G以上顯存,可以嘗試7b的模型,如果沒有就直接選擇1.5b模型:
ollama run deepseek-r1
常用命令:
ollama list #獲得已安裝模型列表
ollama run llama3.1 #ollama run + 模型名 運行模型
ollama rm #ollama rm +模型名 刪除模型
二、可視化頁面 --Chatbox
下載Chatbox AI:https://chatboxai.app/zh
安裝完成后進行如下設置即可:
參數說明:
Temperature(溫度值),是大語言模型生成文本時用于調節輸出隨機性和多樣性的參數。
- 數值越高,模型選擇低概率詞語的可能性越大,輸出更加隨機且富有創意;
- 數值越低,模型更傾向選擇高概率詞語,輸出更確定且保守。
通過調整溫度值,可在創造性和準確性之間進行平衡,以適應不同的應用場景。如創作者寫文案可以調到最大。
另外,在專屬對話設置中,還可以設置角色以及TopP:
TopP(又稱核采樣)是一種調節語言模型生成隨機性的機制,通過對詞匯的累積概率進行截斷篩選,僅保留累積概率不超過閾值 p 的候選詞,并從中按概率分布采樣生成下一個詞。
- 較高的 p 值(如 0.9 - 1.0):保留更多候選詞,生成結果更具多樣性,但也可能增加隨機性。
- 較低的 p 值(如 0.1 - 0.3):保留更少的候選詞,生成結果更加集中和確定。
與溫度參數不同,TopP 動態地調整候選詞的數量,適用于控制生成文本的隨機性和連貫性。
提示詞筆記:
1.真誠對話
幫我整理這份報告,我需要把這個報告上交給我的領導看,希望文字更加的清晰整潔,每一段話都能在句首列出重點;
2.通用公式
我要XX,要給XX用,希望能夠達到XX效果,擔心出現XX問題,幫我達到XX效果最大化;
舉例:我要做一份旅游攻略,給我和女朋友旅游福建的時候用,希望能夠更加提高我們的互動效果,能夠達到更多的肢體接觸,擔心會不會出現太油膩太唐突的問題,幫我達到情侶感情升溫的最大化,
3.問完問題之后,直接加上“說人話”這三個字
比如問“流體力學”是什么,一般情況會很官方的回答,但是如果你加上說人話三個字,那么將會很普通話的給你解析這個問題,適合;
4.反方向提問法
直接提問如果你是老板,你怎么批評這個方案?;這個結果你滿意嗎?請幫我復盤
5.反復問同一個問題;
Deepseek具有深度思考模型,如果你反復提問同一個問題,它就會總結累計回答的問題,為什么回答不夠滿意等,以及把思考的小細節顯示出來,你會發現它的思考方式超級像一個邏輯能力超強的人類;
6.模仿思考
給一段誰誰的的語句,讓它模仿學習,以它的思想去思考問題,比如,幫我以愛因斯坦的思想去思考這個問題,是否能夠有什么解決方案
7.假設法
假設你是談過10000次戀愛的感情達人;假設你是硅谷資深投資人,投過上百家互聯網公司;假設你是健身教練,你應該怎么給你的學員準備增肌的一日三餐;
三、安裝自己的知識庫 --AnythingLLM
四、DeepSeek API使用
1,注冊deepseek并生成apikey
deepseek的api平臺:https://www.deepseek.com/
選中apikeys菜單 -》 創建API-KEY
官方文檔:https://api-docs.deepseek.com/zh-cn/
本地調用案例如下:
curl http://127.0.0.1:11434/v1/chat/completions \-H "Content-Type: application/json" \-H "Authorization: Bearer <DeepSeek API Key>" \-d '{"model": "deepseek-r1","messages": [{"role": "system", "content": "You are a helpful assistant."},{"role": "user", "content": "Hello!"}],"stream": false}'
其中model可以在本地cmd里查看:ollama list
。測試結果:
2,在idea插件codegpt中配置deepseek
打開idea的File->Settings->Tools->CodeGPT->Providers->Custom OpenAI
- Preset Template 選擇 OpenAI
- API key 填入第二步中生成的key
- Chat Completions的URL填寫
https://api.deepseek.com/v1/chat/completions
- 切換到Body,model配置為deepseek-reasoner(r1)或deepseek-chat(v3)