使用 .NET Core 的本地 DeepSeek-R1

使用 .NET 在我的 MacBook Pro 上與當地 LLM 聊天的歷程。?

????????如今,只需使用瀏覽器即可輕松使用 ChatGPT 或其他 genAI。作為開發人員,我們可以通過直接集成 OpenAI API 等來做更復雜的事情。如果我們想在自己的機器上運行 LLM,只是為了找人聊天或開發一些有趣的東西,該怎么辦??

????????DeepSeek最近發布的模型在軟件和技術行業引起了轟動。得益于蒸餾技術,更小、資源更便宜的模型現在可以在特定任務上發揮同樣強大的作用。無論是在 genAI 還是 ML 世界中,Python 都是占主導地位的堆棧。雖然我個人很了解 Python,但作為#EverythingInCSharp系列的傳統。在這篇文章中,我記錄了如何deepseek-ai/DeekSeek-R1-Distill-Llama-8B在 C# 程序中運行模型。

1、先決條件

Python 3 +
.NET8+
支持 lfs 的Git

????????由于 .NET 無法直接以格式使用 Hugging Face 模型.safetensors,因此您需要將.safetensors格式轉換為(GPT 生成的統一格式)或下載其他人.gguf轉換并上傳到Hugging Face 的格式(例如這個)。如果您不想自己轉換,請跳到第 5 點。

2.下載模型

使用以下 git 命令克隆模型存儲庫,請注意模型文件有 15GB 大:

git clone https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-8B

3. 克隆 Llama.cpp 倉庫

您將需要里面的轉換腳本將 HuggingFace 格式轉換為 GGUF 格式。

git clone https://github.com/ggerganov/llama.cpp.git

4.轉換模型

在成功運行轉換腳本之前,我必須:

4.1 設置虛擬環境

cd llama.cpp
python3 -m venv .
source bin/activate

4.2 安裝以下軟件包

python3 -m pip install numpy torch sentencepiece gguf safetensors transformers

python3 convert_hf_to_gguf.py ?--outfile your_filename.gguf ../DeepSeek-R1-Distill-Llama-8B

完成后您將看到以下內容:

5.創建一個新的C#控制臺程序

dotnet new console

6.安裝所需的軟件包

由于該模型是基于駱駝的,我們需要LlamaSharp

dotnet add package LLamaSharp

我正在使用 Macbook Pro,因此我也需要安裝一個特定的backends:

dotnet add package LLamaSharp.Backend.Cpu

如果您不使用 Mac,請參閱此處backends提供的官方列表。

7.創建聊天會話的代碼

我將從自述文件中復制示例代碼LlamaSharp來復制最小的聊天會話設置:

using LLama;
using LLama.Common;
using LLama.Sampling;

string modelPath = @"DeepSeek-R1-Distill-Llama-8B.gguf"; // change it to your own model path.

var parameters = new ModelParams(modelPath)
{
? ? ContextSize = 1024, // The longest length of chat as memory.
? ? GpuLayerCount = 5 // How many layers to offload to GPU. Please adjust it according to your GPU memory.
};
using var model = LLamaWeights.LoadFromFile(parameters);
using var context = model.CreateContext(parameters);
var executor = new InteractiveExecutor(context);

// Add chat histories as prompt to tell AI how to act.
var chatHistory = new ChatHistory();
chatHistory.AddMessage(AuthorRole.System, "Transcript of a dialog, where the User interacts with an Assistant named Bob. Bob is helpful, kind, honest, good at writing, and never fails to answer the User's requests immediately and with precision.");
chatHistory.AddMessage(AuthorRole.User, "Hello, Bob.");
chatHistory.AddMessage(AuthorRole.Assistant, "Hello. How may I help you today?");

ChatSession session = new(executor, chatHistory);

InferenceParams inferenceParams = new InferenceParams()
{
? ? MaxTokens = 256, // No more than 256 tokens should appear in answer. Remove it if antiprompt is enough for control.
? ? AntiPrompts = new List<string> { "User:" }, // Stop generation once antiprompts appear.

? ? SamplingPipeline = new DefaultSamplingPipeline(),
};

Console.ForegroundColor = ConsoleColor.Yellow;
Console.Write("The chat session has started.\nUser: ");
Console.ForegroundColor = ConsoleColor.Green;
string userInput = Console.ReadLine() ?? "";

while (userInput != "exit")
{
? ? await foreach ( // Generate the response streamingly.
? ? ? ? var text
? ? ? ? in session.ChatAsync(
? ? ? ? ? ? new ChatHistory.Message(AuthorRole.User, userInput),
? ? ? ? ? ? inferenceParams))
? ? {
? ? ? ? Console.ForegroundColor = ConsoleColor.White;
? ? ? ? Console.Write(text);
? ? }
? ? Console.ForegroundColor = ConsoleColor.Green;
? ? userInput = Console.ReadLine() ?? "";
}

8.運行并嘗試

dotnet run

在?M3 Pro 12 核 CPU 的 Macbook 上,token 生成占用了 45% 的 CPU 時間,同時占用了大約 16GB 的內存。內存使用量與模型本身的大小基本相同。?

生成令牌時的 CPU 使用率

生成 token 時的內存使用情況

不生成 token 時的內存使用情況

盡情享受吧!🎉迫不及待地去看看你的 C# 代碼能用你本地的 LLM 做什么!?

如果您喜歡此文章,請收藏、點贊、評論,謝謝,祝您快樂每一天。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/73978.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/73978.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/73978.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

將 VOC 格式 XML 轉換為 YOLO 格式 TXT

目錄 1. 導入必要的模塊 2. 定義類別名稱 3. 設置文件路徑 完整代碼 1. 導入必要的模塊 import os import xml.etree.ElementTree as ET os&#xff1a;用于文件和目錄操作&#xff0c;例如創建目錄、遍歷文件等。 xml.etree.ElementTree&#xff1a;用于解析XML文件&#…

Visual Studio調試的技巧

1.什么是bug&#xff1f; bug&#xff1a;程序漏洞&#xff0c;也就是程序中存在的問題。 2.什么是調試&#xff1f; 當我們發現了程序中的問題后就會解決問題&#xff0c;前提是要找到問題&#xff0c;那么進行調試&#xff08;debug&#xff09;以此來找到問題。 3.debug…

C++ 各種map對比

文章目錄 特點比較1. std::map2. std::unordered_map3. std::multimap4. std::unordered_multimap5. hash_map&#xff08;SGI STL 擴展&#xff09; C 示例代碼代碼解釋 特點比較 1. std::map 底層實現&#xff1a;基于紅黑樹&#xff08;一種自平衡的二叉搜索樹&#xff09…

fontTools工具的使用介紹

前言 python工具庫fontTools&#xff0c;我是用來壓縮前端字體的&#xff0c;優化前端請求速度的&#xff1b;使用的過程中&#xff0c;遇到了不少的坑&#xff0c;把這個過程記錄下來&#xff0c;防止再犯。 安裝 # fontTools 4.56.0 pip install fontTools提取子字體集 方…

利用大語言模型生成的合成數據訓練YOLOv12:提升商業果園蘋果檢測的精度與效率

之前小編分享過關于《YOLO11-CBAM集成&#xff1a;提升商業蘋果園樹干與樹枝分割的精準度》&#xff0c;改進YOLO11算法后&#xff0c;進行蘋果樹的實例分割。本期文章我們將分享關于最新的YOLO12算法改進的蘋果目標檢測。 論文題目&#xff1a;Improved YOLOv12 with LLM-Gen…

設計模式 二、創建型設計模式

GoF是 “Gang of Four”&#xff08;四人幫&#xff09;的簡稱&#xff0c;它們是指4位著名的計算機科學家&#xff1a;Erich Gamma、Richard Helm、Ralph Johnson 和 John Vlissides。他們合作編寫了一本非常著名的關于設計模式的書籍《Design Patterns: Elements of Reusable…

redis,tar.gz安裝后,接入systemctl報錯解決

1. WARNING Memory overcommit must be enabled! 這種報錯&#xff0c;有兩種解決方法 1.1 修改系統參數 編輯 /etc/sysctl.conf 文件&#xff0c;設置 overcommit_memory 為 1 vm.overcommit_memory 11.2 修改redis的最大使用內存 修改配置文件 redis.conf maxmemory 1g…

Python繪圖技巧,主流繪圖庫

一、主流繪圖庫概覽 1. 核心工具對比 庫名稱特點適用場景Matplotlib基礎繪圖庫&#xff0c;高度可定制科學繪圖、論文圖表Seaborn基于Matplotlib&#xff0c;統計圖表優化數據分布、關系可視化Plotly交互式可視化&#xff0c;支持網頁輸出儀表盤、動態數據展示Pandas內置簡易…

網絡安全之前端學習(HTML篇)

前言&#xff1a;網絡安全中有一個漏洞叫xss漏洞&#xff0c;就是利用網頁引發彈窗&#xff0c;這就要求我們看得懂源碼&#xff0c;所以我會持續更新前端學習&#xff0c;可以不精通&#xff0c;但是一定要會&#xff0c;主要掌握HTML&#xff0c;css&#xff0c;js這三項技術…

Qt 多線程設計:死循環與信號槽的權衡

在開發音視頻播放器時&#xff0c;多線程設計是不可避免的挑戰。音頻和視頻的解碼、播放需要高效運行&#xff0c;同時還要與主線程或其他線程同步&#xff0c;例如通過信號通知播放進度。本文基于一個實際案例&#xff0c;分析了兩種線程設計在死循環和信號槽使用中的表現&…

knowledge-微前端(多個前端應用聚合的一個應用架構體系,每個小的應用可獨立運行,獨立開發,獨立部署上線)

1.前言 微前端&#xff0c;將一個大的前端應用拆分為多個小型的&#xff0c;獨立開發的前端應用&#xff0c;每一個小型的應用都可以單獨的開發&#xff0c;部署和運行。這種結構允許不同的團隊使用不同的技術棧來開發應用的不同部分&#xff0c;提高開發的效率與靈活性。 2.實…

工廠函數詳解:概念、目的與作用

一、什么是工廠函數&#xff1f; 工廠函數&#xff08;Factory Function&#xff09;是一種設計模式&#xff0c;其核心是通過一個函數來 創建并返回對象&#xff0c;而不是直接使用 new 或構造函數實例化對象。它封裝了對象的創建過程&#xff0c;使代碼更靈活、可維護。 二、…

旋轉位置編碼(Rotary Positional Encoding, RoPE):中文公式詳解與代碼實現

旋轉位置編碼&#xff08;Rotary Positional Encoding, RoPE&#xff09;&#xff1a;中文公式詳解與代碼實現 在序列模型中&#xff0c;位置信息對于任務的理解至關重要。傳統的絕對和相對位置編碼各有優缺點&#xff0c;而RoPE作為一種創新的位置編碼方法&#xff0c;展現了…

C語言-指針變量和變量指針

指針 預備知識 內存地址 字節&#xff1a;字節是內存的容量單位&#xff0c;英文名Byte&#xff0c;1Byte8bits 地址&#xff1a;系統為了便于區分每一個字節面對它們的逐一進行編號&#xff08;編號是唯一的&#xff09;&#xff0c;稱為內存地址&#xff0c;簡稱地址。int…

unityAB包(1/2)

unityAB包學習 1.AB包的導出擴展BuildAssetBundleOptions無特殊選項壓縮相關選項 2.AB包資源管理3.Resource和AssetBundle加載方式的區別4.預設體5.Unity Asset Bundle Browser 工具5為什么要勾選拷貝到StreamingAsset里面。6.AB包的加載 1.AB包的導出 首先在Project窗口&…

算法——廣度優先搜索——跨步迷宮

原題鏈接 思路&#xff1a;找出最短路徑&#xff0c;然后判斷是否存在連續三個點是橫縱坐標相等的&#xff0c;如果有就步數減1 但是有兩個樣例過不了 錯誤原因&#xff1a;在錯誤的測試案例中&#xff0c;最短路徑可能有多條&#xff0c;而我剛好選了一條比較曲折的&#x…

某酒企數字化轉型及電商規劃項目啟動會暨培訓會v(60頁PPT)(文末有下載方式)

詳細資料請看本解讀文章的最后內容。 在當今數字化浪潮席卷之下&#xff0c;企業的發展面臨著前所未有的機遇與挑戰。對于某酒企而言&#xff0c;數字化轉型和電商規劃已成為其實現 “二次騰飛”、邁向世界級酒企的關鍵戰略舉措。本次啟動會暨培訓會&#xff0c;為該酒企的轉型…

NET6 WebApi第5講:中間件(源碼理解,俄羅斯套娃怎么來的?);Web 服務器 (Nginx / IIS / Kestrel)、WSL、SSL/TSL

一、NET6的啟動流程 區別&#xff1a; .NET6 WebApi第1講&#xff1a;VSCode開發.NET項目、區別.NET5框架【兩個框架啟動流程詳解】_vscode webapi-CSDN博客 2、WebApplicationBuilder&#xff1a;是NET6引入的一個類&#xff0c;是建造者模式的典型應用 1>建造者模式的…

vue中根據html動態渲染內容

需求&#xff1a;根據數據中的html&#xff0c;因為我是在做填空&#xff0c;所以是需要將html中的_____替換成input&#xff0c;由于具體需求我使用的是元素contenteditable代替的可編輯的input html部分 <div class"wrap"><component :is"rendered…

【AI】AI編程助手:Cursor、Codeium、GitHub Copilot、Roo Cline、Tabnine

文章目錄 一、基本特性對比二、收費標準三、私有部署能力1、Tabnine2、Roo Code 三、代碼補全與自然語言生成代碼四、安裝獨立的IDE安裝插件安裝 五、基本使用&#xff08;一&#xff09;Cursor&#xff08;二&#xff09;GitHub Copilot1、獲取代碼建議2.聊天1&#xff09;上下…