使用DeepSeek的技巧筆記

來源:新年逼自己一把,學會使用DeepSeek R1_嗶哩嗶哩_bilibili

前言

? ? ? ? 對于DeepSeek而言,我們不再需要那么多的提示詞技巧,但還是要有兩個注意點:你需要理解大語言模型的工作原理與局限,這能幫助你更好的知道AI可完成任務的邊界;在和R1合作時,你最好有管理者的思維和經驗,你需要知道如何向R1這個聰明程度比你高很多的下屬布置你的任務。

? ? ? ? 如果不勾選深度思考這個選項,那么就是使用系統默認的V3大模型;最近(2025/2/6)因為網絡攻擊的問題,聯網搜索可能使用效果不佳,但事實上如果想要獲取的知識是在2023年12月之前的,那么就沒有打開聯網搜索的必要。

推理模型與指令模型

? ? ? ? OpenAI的ChatGpt、豆包和DeepSeek-v3都屬于指令模型(instruct model),而我們的深度思考R1屬于推理模型。instruct model這類模型是專門設計用于遵循指令來生成內容而推理模型是專注于邏輯推理問題解決的模型,能夠自主處理需要多步驟分析因果推斷或者復雜決策的這種任務。

理解大模型語言的本質

特點1

大模型在訓練時是將內容token化的,大模型所看到的和理解的世界和我們不太一樣。

大型語言模型的預訓練,本質上是讓模型建立文本片段之間關聯的規律,為了實現這個目標,所有給大模型投喂的數據資料都會經過特殊處理。首先是將文本切割名為token的基本單元;

然后將這些token轉換為數字編碼,有點類似于將現實世界的自然語言轉換為只有大模型才可以理解的“密碼本”;

由于這一種訓練方式,導致很多指令型大語言模型無法正確回答strawberry(草莓)這個單詞有幾個英文字母“r”。

因為strawberry被切割為了str、aw、berry三個toekn,隨后語言模型只數了str和berry的數字編碼。雖然推理模型可以做到這種功能,但實際過程也很麻煩。

特點2

大模型知識是存在截至時間的。最經典的例子:

對于大模型而言它的知識儲備存在三重壁壘,它的預訓練需要處理PB級別的原始數據,而這種原始數據的清洗需要經過大量的工序會占用非常多的時間。訓練完成之后,他還要經過監督微調強化學習以及基于人類反饋的強化學習等耗時工序。DeepSeek R1的知識庫訓練截止時間是在2023年的10月至12月之間,恰好是Faker選手奪取四冠之前。想要突破這些局限性,可以選擇聯網搜索、提供文獻和輸入提示詞等方法來解決。

特點3

大模型缺乏自我認知/自我意識

大模型既不能回應你叫他的具體名字,也無法回答你對它的詳細特點的提問。關于大模型的使用技巧,往往你也無法詢問他本身。

但是一些比較成熟的指令模型已經約束了常見的問答內容。

特點4

記憶有限(64K/128K)

大模型在對話過程中的上下文長度是受限的,R1現在只有64K長度的token。一次性投喂超過4萬字的文檔,它就只會通過RAG(搜索增強的方式)。

特點5

輸出長度受限(4K/8K)

單詞回答最多輸出2000-4000個中文字符

使用技巧

技巧1:提出明確的要求
技巧2:要求特定的風格
技巧3:提供充分的任務背景信息
技巧4:主動標注自己的知識狀態
技巧5:定義目標,而非過程
技巧6:提供AI不具備的知識背景

技巧7:從開放到收斂

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/68158.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/68158.shtml
英文地址,請注明出處:http://en.pswp.cn/web/68158.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【工具篇】ChatGPT:開啟人工智能新紀元

一、ChatGPT 是什么 最近,ChatGPT 可是火得一塌糊涂,不管是在科技圈、媒體界,還是咱們普通人的日常聊天里,都能聽到它的大名。好多人都在討論,這 ChatGPT 到底是個啥 “神器”,能讓大家這么著迷?今天咱就好好嘮嘮。 ChatGPT,全稱是 Chat Generative Pre-trained Trans…

【centOS】搭建公司內網git環境-GitLab 社區版(GitLab CE)

1. 安裝必要的依賴 以 CentOS 7 系統為例,安裝必要的依賴包: sudo yum install -y curl policycoreutils openssh-server openssh-clients postfix sudo systemctl start postfix sudo systemctl enable postfix2. 添加 GitLab 倉庫 curl -sS https:/…

$route 和 $router 的區別是什么?

在 Vue Router 中,$route 和 $router 是兩個不同的對象,它們各自承擔著不同的角色。下面是它們的主要區別: 一、$route 定義$route 是當前路由的信息對象,包含了與當前路由相關的狀態和參數。它是一個只讀對象。 2. 主要屬性 params:動態路由參數,例如 /user/:id 中的 …

node.js 08 express的使用和熱重載nodemon的安裝

一.express的安裝和使用 安裝 npm i express 使用 //引入express const express require(express)//啟動服務器 const app express()//設置get請求地址,獲取請求地址信息,和發送返回的數據 app.get(/bailan,(req, res) > {//req.query可以獲取到客…

Python因為網絡原因安裝依賴庫報錯

現象 在終端運行以下指令 pip install pyautogui pillow keyboard 出現報錯,終端信息如下: PS D:\code\Python> pip install pyautogui pillow keyboard Collecting pyautoguiUsing cached PyAutoGUI-0.9.54.tar.gz (61 kB)Installing build depe…

面試問題記錄1

問題一:性能測試步驟 性能測試步驟主要包括以下幾個階段: ?1. 需求分析階段? 明確測試目標,了解性能測試需求,包括業務列表、性能指標、測試環境、數據量等詳細需求?12。熟悉項目相關的資源,如架構設計、軟硬件環…

開源 GPU 集群管理器 GPUStack 輕松拉起deepseek各版本模型

GPUStack 是一個用于運行 AI 模型的開源 GPU 集群管理器。 項目地址:gpustack/gpustack: Manage GPU clusters for running AI modelshttps://github.com/gpustack/gpustackhttps://github.com/gpustack/gpustackhttps://github.com/gpustack/gpustackhttps://githu…

ESP32開發學習記錄---》GPIO

she 2025年2月5日,新年后決定開始充電提升自己,故作此記,以前沒有使用過IDF開發ESP32因此新年學習一下ESP32。 ESPIDF開發環境配置網上已經有很多的資料了,我就不再贅述,我這里只是對我的學習經歷的一些記錄。 首先學習一個…

3-kafka服務端之控制器

文章目錄 概述控制器的選舉與故障恢復控制器的選舉故障恢復 優雅關閉分區leader的選舉 概述 在Kafka集群中會有一個或多個broker,其中有一個broker會被選舉為控制器(Kafka Controler),它負責管理整個集群中所有分區和副本的狀態。…

物聯網的三層架構:感知層、網絡層與應用層

物聯網(Internet of Things, IoT)作為現代科技的重要組成部分,正在深刻改變我們的生活和工作方式。它將物理世界與數字世界無縫連接,通過智能設備、傳感器和網絡技術,實現數據的采集、傳輸和應用。物聯網的架構通常分為…

react的antd表單校驗,禁止輸入空格并觸發校驗提示

首先需要用到form組件&#xff0c;在form.item內添加rules屬性&#xff0c;寫正則表達式 <Form.Itemlabel"員工姓名"name"name"rules{[{ required: true, message: 員工姓名 },{ pattern: /^(?!\s*$).$/, message: 不能全是空格 },]}> <Input p…

JavaScript addEventListener事件列表

addEventListener 方法用于向指定元素添加事件監聽器&#xff0c;當該對象觸發指定的事件時&#xff0c;指定的回調函數就會被執行。以下是一些常見的事件類型 鼠標事件 click: 當用戶點擊某個對象時觸發。 dblclick: 當用戶雙擊某個對象時觸發。 contextmenu&#xff1a;當…

IDEA 中集成 Maven,配置環境、創建以及導入項目

目錄 在 IntelliJ IDEA 中集成 Maven 并配置環境 1. 打開 IDEA 設置 2. 定位 Maven 配置選項 3. 配置 Maven 路徑 4. 應用配置 創建 Maven 項目 1. 新建項目 2. 選擇項目類型 3. 配置項目信息 4. 確認 Maven 設置 5. 完成項目創建 導入 Maven 項目 1. 打開導入窗口…

神經網絡常見激活函數 1-sigmoid函數

sigmoid 1 函數求導 sigmoid函數 σ ( x ) 1 1 e ( ? x ) \sigma(x) \frac{1}{1e^{(-x)}} σ(x)1e(?x)1? sigmoid函數求導 d d x σ ( x ) d d x ( 1 1 e ? x ) e ? x ( 1 e ? x ) 2 ( 1 e ? x ) ? 1 ( 1 e ? x ) 2 1 1 e ? x ? 1 ( 1 e ? x ) 2 …

窮舉vs暴搜vs深搜vs回溯vs剪枝系列一>黃金礦工

目錄 決策樹&#xff1a;代碼設計代碼&#xff1a; 決策樹&#xff1a; 代碼設計 代碼&#xff1a; class Solution {boolean[][] vis;int ret,m,n;public int getMaximumGold(int[][] grid) {m grid.length;n grid[0].length;vis new boolean[m][n]; for(int i 0; i <…

rabbitMQ消息轉換器

消息轉換器 Spring的消息發送代碼接收的消息體是一個Object&#xff1a; 而在數據傳輸時&#xff0c;它會把你發送的消息序列化為字節發送給MQ&#xff0c;接收消息的時候&#xff0c;還會把字節反序列化為Java對象。 只不過&#xff0c;默認情況下Spring采用的序列化方式是J…

Java 如何覆蓋第三方 jar 包中的類

目錄 一、需求描述二、示例描述三、操作步驟四、驗證結果五、實現原理 背景&#xff1a; 在我們日常的開發中&#xff0c;經常需要使用第三方的 jar 包&#xff0c;有時候我們會發現第三方的 jar 包中的某一個類有問題&#xff0c;或者我們需要定制化修改其中的邏輯&#xff0c…

CS 與 BS 架構的差異

在數字化的今天&#xff0c;選擇軟件架構模式對系統的性能、維護、安全和成本都有很大影響。BS架構和CS架構是最常見的兩種模式&#xff0c;了解它們的區別和特點對開發人員和企業決策者都很重要。 CS架構最早出現&#xff0c;當時用戶直接從主機獲取數據。隨著客戶端和服務端…

HTML之table表格學習

HTML table使用 thead、tbody、tfoot均可省略&#xff1b; 瀏覽器解析的時候會自動套上tbody tr 行 td 列 th 標題列屬性 colspan 列占用數 rowspan 行占用數 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8">…

常用抓包工具tcpdump、Fiddler、Charles、Wireshark 和 Sniffmaster 下載地址

抓包大師官網下載地址 Sniff Master Download - Free TCP and HTTPS Proxy Sniffing Tool, Supports IOS Sniffing Fiddler classic官網下載地址 Download Fiddler Web Debugging Tool for Free by Telerik Fiddler Everywhere官網下載地址 The Ultimate Web Debugging Tool …