目錄
1. 意圖
1.1. 意圖分類
1.1.1 入口意圖(Entry Intent)
1.1.2 對話意圖(Dialog Intent)
1.2. 意圖類型切換操作步驟
2. 語料
2.1 語料分類詳解
2.2 語料編寫規范詳解
2.3 標簽符號深度說明
3. 詞槽
3.1 符類型要求
3.2 格式規范示例
3.3 特殊處理建議
3.4 應用場景示例
3.5 錯誤示范
1. 意圖
意圖指一個明確的用戶目的或用戶想要完成的具體任務。在對話系統中,意圖識別是理解用戶輸入的關鍵環節。
例如:
-
在餐廳技能中,"訂位"意圖對應預訂餐桌功能,"點餐"意圖對應菜品選擇功能
-
在天氣技能中,"查詢天氣"意圖對應獲取天氣信息功能
意圖是對話技能的基礎組成部分,每個意圖通常代表:
-
一個獨立功能(如"查詢余額")
-
一組相關功能(如"賬戶管理"可能包含查詢余額、修改密碼等子意圖)
-
特定場景下的交互流程(如"投訴處理"可能包含多個步驟的對話)
1.1. 意圖分類
1.1.1 入口意圖(Entry Intent)
-
特點:獨立性強,不需要依賴歷史對話信息即可響應
-
觸發條件:用戶首次使用技能或切換技能時的初始請求
-
示例:
-
直接說"打開餐廳技能"觸發入口意圖
-
"我要訂餐"作為首次請求觸發訂餐入口意圖
-
-
作用:確定交互場景,建立技能上下文
1.1.2 對話意圖(Dialog Intent)
-
特點:需要基于已有交互上下文才能正確響應
-
觸發條件:必須在該技能的對話流程中才能識別
-
工作機制:
-
先通過入口意圖確定技能范圍
-
在后續對話中識別對話意圖
-
-
示例:
-
在餐廳技能中,先觸發"訂位"入口意圖后
-
接著詢問"需要幾人位"識別為"人數確認"對話意圖
-
-
設計目的:
-
避免不同技能間的意圖混淆
-
確保對話流程的連貫性
-
支持多輪對話的上下文理解
-
1.2. 意圖類型切換操作步驟
-
登錄系統后,在左側導航欄中找到"意圖管理"模塊并點擊進入
-
在意圖列表中找到需要修改的意圖(可通過搜索框輸入意圖名稱快速定位)
-
點擊該意圖名稱或右側的"詳情"按鈕,進入意圖詳情頁面
-
在意圖詳情頁面上方找到并點擊"編輯"按鈕(通常顯示為鉛筆圖標或"編輯"文字按鈕)
-
在編輯模式下,定位到"意圖類型"設置項(通常位于基本信息區域)
-
點擊意圖類型下拉菜單,系統會顯示可選類型,如:
-
問答型
-
任務型
-
導航型
-
推薦型
-
-
選擇新的意圖類型(注意不同類型可能對應不同的參數配置)
-
確認修改無誤后,點擊頁面底部的"保存"按鈕
-
系統會彈出保存成功的提示,并自動返回意圖詳情頁面
注意事項:
-
意圖類型切換可能會影響與該意圖關聯的對話流程
-
某些特定類型之間可能存在轉換限制
-
建議在非業務高峰期進行此類操作
-
修改前可通過"歷史版本"功能備份當前配置
2. 語料
2.1 語料分類詳解
模板語料(推薦使用)
模板語料采用結構化方式定義,由固定文本和可變槽位組成,使用{}包裹槽位名稱。每個槽位可以綁定特定實體類型(如時間、地點等)或輔助詞,實現靈活匹配。
典型特征:
-
結構清晰,便于系統解析
-
支持多種參數化組合
-
示例擴展:
-
{city}{date}天氣
→ "北京今天天氣"、"上海明天天氣" -
查一下{product}的價格
→ "查一下手機的價格"、"查一下筆記本電腦的價格"
-
例句語料
由完整自然語句構成,需要通過手動標注方式標記槽位。適用于以下場景:
-
收集真實用戶表達樣本
-
處理特殊表達句式
-
示例標注過程: 原始例句:"幫我訂明天上午的機票" 標注后:"幫我訂{date}{time}的機票"
重要限制:
-
同一意圖內禁止混合使用兩種語料類型
-
模板語料優先用于可抽象的場景
-
例句語料適合處理固定說法
2.2 語料編寫規范詳解
模板語料字符集
允許使用范圍更廣的符號集,包含:
-
基礎字符:漢字、數字、字母(大小寫)
-
數學符號:+ - × ÷ / =
-
標點符號:英文,.!? 中文,。!
-
特殊符號:<>{}|_#'"°%
應用示例:
-
查詢{stock_code}[的股價]
→ 可匹配"查詢AAPL"和"查詢AAPL的股價" -
設置鬧鐘為{time}(am|pm)
→ 匹配"設置鬧鐘為8:30am"
例句語料字符集
限制較多,主要包含:
-
基本標點:,。.!?
-
運算符號:+ - × ÷ /
-
特殊符號:_#'"°%
典型用例:
-
"訂單號ABC123_456,盡快發貨!"
-
"當前室溫25°C,濕度60%"
2.3 標簽符號深度說明
詞槽標記 {}
-
命名規范示例:
-
合法:{user_name}、{order.no}、{item_3}
-
非法:{用戶名}(含中文)、{date!}(含特殊符號)
-
-
綁定示例:
{city}天氣
+ 綁定"city"到"城市"實體 → 可識別"北京天氣"、"上海天氣"
必選分組 ()
-
實現分支匹配:
(打開|關閉)燈
等效于:-
"打開燈"
-
"關閉燈"
-
-
嵌套使用:
(查詢|查找)(機票|酒店)
生成4種組合
可選標記 []
-
多級可選:
[請][幫我]查詢余額
匹配:-
"查詢余額"
-
"請查詢余額"
-
"幫我查詢余額"
-
"請幫我查詢余額"
-
-
組合應用:
[查詢]{product}[的](價格|售價)
可匹配: "手機價格"、"查詢筆記本電腦的售價"等8種組合
特殊注意事項
-
符號必須成對出現
-
嵌套層級建議不超過3層
-
避免過度復雜化,如:
[([{date}]的)]天氣
(不易維護) -
性能考慮:單句語料總組合數建議控制在100種以內
-
例句語料如需配置詞槽可有可無,可將對應詞槽轉換為輔助詞,并取消勾選表述必須。
3. 詞槽
詞槽是自然語言處理中用于結構化信息提取的重要工具,建議使用以下規范來填充詞槽內容:
3.1 符類型要求
-
優先使用小寫字母(a-z)
-
數字(0-9)可用于表示數量、編號等信息
-
下劃線(_)可用于連接單詞或短語
-
連字符(-)可用于表示范圍或連接
3.2 格式規范示例
-
日期格式:2023-08-15
-
時間格式:14:30
-
電話號碼:+86_13800138000
-
商品編號:item_2023_001
3.3 特殊處理建議
-
避免使用空格、中文標點等特殊字符
-
統一大小寫格式(推薦全小寫)
-
對于專有名詞可保留首字母大寫
-
超過15個字符時建議使用縮寫
3.4 應用場景示例
-
航班預訂:"departure_city=shanghai"
-
酒店查詢:"check_in_date=2023-12-25"
-
電商購物:"product_id=phone_x200"
3.5 錯誤示范
-
包含空格:"new york"(應改為"new_york")
-
使用中文字符:"北京"(應改為"beijing")
-
特殊符號:"price=¥100"(應改為"price=100")