基于 BERT 微調一個意圖識別(Intent Classification)模型

基于 BERT 微調一個意圖識別(Intent Classification)模型,你的意圖類別包括:

  • 查詢天氣
  • 獲取新聞咨詢
  • 想聽音樂
  • 想添加備忘
  • 查詢備忘
  • 獲取家政服務
  • 結束對話
  • 增加音量
  • 減小音量
  • 其他

具體實現步驟(詳細版)

1. 準備你的數據集

你的數據集應該是這樣的格式(通常是 CSV 或 JSON):

textlabel
今天上海天氣怎么樣?查詢天氣
給我放首輕音樂想聽音樂
新聞頭條是什么?獲取新聞咨詢
記一下明天開會想添加備忘
查看一下我的備忘錄查詢備忘
叫個鐘點工來打掃獲取家政服務
不聊了,再見結束對話
聲音大一點增加音量
小點聲減小音量
亂說的話其他

每一行是一個用戶輸入(text)和它對應的意圖(label)。

注意:BERT只能識別數字標簽,所以需要把意圖文字映射成數字,比如:

label2id = {"查詢天氣": 0,"獲取新聞咨詢": 1,"想聽音樂": 2,"想添加備忘": 3,"查詢備忘": 4,"獲取家政服務": 5,"結束對話": 6,"增加音量": 7,"減小音量": 8,"其他": 9
}
id2label = {v: k for k, v in label2id.items()}

2. 安裝需要的庫
pip install transformers datasets torch scikit-learn

3. 代碼:BERT意圖識別模型訓練
import torch
from datasets import load_dataset, Dataset
from transformers import BertTokenizer, BertForSequenceClassification, Trainer, TrainingArguments
from sklearn.model_selection import train_test_split# 1. 準備數據
texts = ["今天上海天氣怎么樣?", "給我放首輕音樂", "新聞頭條是什么?","記一下明天開會", "查看一下我的備忘錄", "叫個鐘點工來打掃","不聊了,再見", "聲音大一點", "小點聲", "亂說的話"
]
labels = [0, 2, 1, 3, 4, 5, 6, 7, 8, 9]  # 使用數字標簽# 切分成訓練集和驗證集
train_texts, val_texts, train_labels, val_labels = train_test_split(texts, labels, test_size=0.2, random_state=42
)# 2. 加載分詞器
tokenizer = BertTokenizer.from_pretrained("bert-base-chinese")# 3. 對數據進行編碼
def tokenize_function(texts):return tokenizer(texts, padding="max_length", truncation=True, max_length=32)train_encodings = tokenize_function(train_texts)
val_encodings = tokenize_function(val_texts)# 4. 構建 PyTorch Dataset
class IntentDataset(torch.utils.data.Dataset):def __init__(self, encodings, labels):self.encodings = encodingsself.labels = labelsdef __len__(self):return len(self.labels)def __getitem__(self, idx):item = {key: torch.tensor(val[idx]) for key, val in self.encodings.items()}item["labels"] = torch.tensor(self.labels[idx])return itemtrain_dataset = IntentDataset(train_encodings, train_labels)
val_dataset = IntentDataset(val_encodings, val_labels)# 5. 加載預訓練BERT分類模型
model = BertForSequenceClassification.from_pretrained("bert-base-chinese", num_labels=10)# 6. 設置訓練參數
training_args = TrainingArguments(output_dir="./results",num_train_epochs=5,per_device_train_batch_size=8,per_device_eval_batch_size=8,evaluation_strategy="epoch",save_strategy="epoch",logging_dir="./logs",logging_steps=10,learning_rate=2e-5,
)# 7. 用Trainer訓練
trainer = Trainer(model=model,args=training_args,train_dataset=train_dataset,eval_dataset=val_dataset,
)trainer.train()

4. 訓練好以后,保存模型
model.save_pretrained("./intent_bert_model")
tokenizer.save_pretrained("./intent_bert_model")

5. 推理(用來預測意圖)
from transformers import pipeline# 加載保存好的模型
classifier = pipeline("text-classification", model="./intent_bert_model", tokenizer="./intent_bert_model", device=0 if torch.cuda.is_available() else -1)# 測試
text = "幫我叫個保潔阿姨"
prediction = classifier(text)
predicted_label = int(prediction[0]["label"].split("_")[-1])  # 如果是默認模型格式
print(f"預測的標簽是:{id2label[predicted_label]}")

補充說明

  • 數據集:建議你準備更多的數據樣本,每個意圖至少幾十條,效果更好。
  • 小批量數據:小批量很少時,可以使用數據增強方法(例如同義詞替換、輕微打亂順序等)擴充數據。
  • 模型優化:可以調整學習率、batch size、epoch數來進一步優化效果。
  • 多意圖識別:如果未來一個句子可能有多個意圖,需要做成多標簽分類(現在是單標簽分類)。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/77710.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/77710.shtml
英文地址,請注明出處:http://en.pswp.cn/web/77710.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SSM書籍管理(環境搭建)

整合SSM:SpringSpringMVCMybatis 環境要求:IDEA、MySQL5、Tomcat9、Maven3 數據庫搭建 數據庫準備以下數據用于后續實驗:創建一個ssmbuild數據庫,表books,該表有4個字段,并且插入3條數據用于后續。 CRE…

API文檔生成與測試工具推薦

在API開發過程中,文檔的編寫和維護是一項重要但繁瑣的工作。為了提高效率,許多開發者會選擇使用API文檔自動生成工具或具備API文檔生成功能的API門戶產品。選擇能導入API文檔的工具生成測試腳本, 本文將全面梳理市面上符合OpenAPI 3.0規范的文檔生成工具…

linux修改環境變量

添加環境變量注意事項。 vim ~/.bashrc 添加環境變量時,需要source ~/.bashrc后才能有效。同時只對當前shell窗口有效,當打開另外的shell窗口時,需要重新source才能起效。 1.修改bashrc文件后 2.source后打開另一個shell窗口則無效&#xff…

springboot項目中,MySQL數據庫轉達夢數據庫

前言 前段時間,公司要求要把某幾個項目的數據庫換成達夢數據庫,說是為了國產化。我就挺無語的,三四年的項目了,現在說要換數據庫。我一開始以為這個達夢數據庫應該是和TIDB差不多的。 我之前做的好幾個項目部署到測試服、正式服…

【Quest開發】透視環境下摳出身體并能遮擋身體上的服裝

軟件:Unity 2022.3.51f1c1、vscode、Meta XR All in One SDK V72 硬件:Meta Quest3 僅針對urp管線 博主搞這個主要是想做現實里的人的變身功能,最后效果如下 可以看到雖然身體是半透明的,但是裙子依舊被完全遮擋了 原理是參考…

前端安全中的XSS(跨站腳本攻擊)

XSS 類型 存儲型 XSS 特征:惡意腳本存儲在服務器(如數據庫),用戶訪問受感染頁面時觸發。場景:用戶評論、論壇帖子等持久化內容。影響范圍:所有訪問該頁面的用戶。 反射型 XSS 特征:惡意腳本通過…

(第三篇)Springcloud之Ribbon負載均衡

一、簡介 1、介紹 Spring Cloud Ribbon是Netflix發布的開源項目,是基于Netflix Ribbon實現的一套客戶端負載均衡的工具。主要功能是提供客戶端的軟件負載均衡算法,將Netflix的中間層服務連接在一起。Ribbon客戶端組件提供一系列完善的配置項如連接超時&…

大模型——使用coze搭建基于DeepSeek大模型的智能體實現智能客服問答

大模型——使用coze搭建基于DeepSeek大模型的智能體實現智能客服問答 本章實驗完全依托于coze在線平臺,不需要本地部署任何應用。 實驗介紹 1.coze介紹 扣子(coze)是新一代 AI 應用開發平臺。無論你是否有編程基礎,都可以在扣子上快速搭建基于大模型的各類 AI 應用,并…

【計算機視覺】目標檢測:深度解析YOLOv9:下一代實時目標檢測架構的創新與實戰

深度解析YOLOv9:下一代實時目標檢測架構的創新與實戰 架構演進與技術創新YOLOv9的設計哲學核心創新解析1. 可編程梯度信息(PGI)2. 廣義高效層聚合網絡(GELAN)3. 輕量級設計 環境配置與快速開始硬件需求建議詳細安裝步驟…

【SpringBoot】基于MybatisPlus的博客管理系統(1)

1.準備工作 1.1數據庫 -- 建表SQL create database if not exists java_blog_spring charset utf8mb4;use java_blog_spring; -- 用戶表 DROP TABLE IF EXISTS java_blog_spring.user_info; CREATE TABLE java_blog_spring.user_info(id INT NOT NULL AUTO_INCREMENT,user_na…

貴族運動項目有哪些·棒球1號位

10個具有代表性的貴族運動: 高爾夫 馬術 網球 帆船 擊劍 斯諾克 冰球 私人飛機駕駛 深海潛水 馬球 貴族運動通常指具有較高參與成本、歷史底蘊或社交屬性的運動,而棒球作為一項大眾化團隊運動,與典型貴族運動的結合較為罕見。從以下幾個角度探…

【Tauri2】035——sql和sqlx

前言 這篇就來看看插件sql SQL | Taurihttps://tauri.app/plugin/sql/ 正文 準備 添加依賴 tauri-plugin-sql {version "2.2.0",features ["sqlite"]} features可以是mysql、sqlite、postsql 進去features看看 sqlite ["sqlx/sqlite&quo…

全鏈路自動化AIGC內容工廠:構建企業級智能內容生產系統

一、工業化AIGC系統架構 1.1 生產流程設計 [需求輸入] → [創意生成] → [多模態生產] → [質量審核] → [多平臺分發] ↑ ↓ ↑ [用戶反饋] ← [效果分析] ← [數據埋點] ← [內容投放] 1.2 技術指標要求 指標 標準值 實現方案 單日產能 1,000,000 分布式推理集群 內容合規率…

是否想要一個桌面哆啦A夢的寵物

是否想擁有一個在指定時間喊你的桌面寵物呢(手動狗頭) 如果你有更好的想法,歡迎提出你的想法。 是否考慮過跟開發者一對一,提出你的建議(狗頭)。 https://wwxc.lanzouo.com/idKnJ2uvq11c 密碼:bbkm

Unity AI-使用Ollama本地大語言模型運行框架運行本地Deepseek等模型實現聊天對話(二)

一、使用介紹 官方網頁:Ollama官方網址 中文文檔參考:Ollama中文文檔 相關教程:Ollama教程 使用版本:Unity 2022.3.53f1c1、Ollama 0.6.2 示例模型:llama3.2 二、運行示例 三、使用步驟 1、創建Canvas面板 具體…

從 BERT 到 GPT:Encoder 的 “全局視野” 如何喂飽 Decoder 的 “逐詞糾結”

當 Encoder 學會 “左顧右盼”:Decoder 如何憑 “單向記憶” 生成絲滑文本? 目錄 當 Encoder 學會 “左顧右盼”:Decoder 如何憑 “單向記憶” 生成絲滑文本?引言一、Encoder vs Decoder:核心功能與基礎架構對比1.1 本…

數據結構入門:詳解順序表的實現與操作

目錄 1.線性表 2.順序表 2.1概念與結構 2.2分類 2.2.1靜態順序表 2.2.2動態順序表 3.動態順序表的實現 3.1.SeqList.h 3.2.SeqList.c 3.2.1初始化 3.2.2銷毀 3.2.3打印 3.2.4順序表擴容 3.2.5尾部插入及尾部刪除 3.2.6頭部插入及頭部刪除 3.2.7特定位置插入…

LeetCode熱題100--53.最大子數組和--中等

1. 題目 給你一個整數數組 nums ,請你找出一個具有最大和的連續子數組(子數組最少包含一個元素),返回其最大和。 子數組是數組中的一個連續部分。 示例 1: 輸入:nums [-2,1,-3,4,-1,2,1,-5,4] 輸出&…

python:練習:2

1.題目:統計一篇英文文章中每個單詞出現的次數,并按照出現次數排序輸出。 示例輸入: text "Python is an interpreted, high-level, general-purpose programming language. Created by Guido van Rossum and first released in 1991…

AI Agent 孵化器?開源框架CAMEL

簡介 CAMEL(Communicative Agents for Mind Exploration of Large Scale Language Model Society)是一個開源框架,大語言模型多智能體框架的先驅者。旨在通過角色扮演和自主協作,探索大語言模型(LLM)在多智…