仿生機器人"愛麗絲"系統架構設計需求文檔
一、硬件基礎
-
已完成頭部和頸部硬件搭建
-
25個舵機驅動表情系統
-
頸部旋轉功能
-
眼部攝像頭(視覺輸入)
-
麥克風陣列(聽覺輸入)
-
頸部發聲裝置(語音輸出)
二、核心設計目標
-
情感的真實涌現
-
通過環境交互自然產生情感(非預設模板)
-
示例:
-
清晨被陽光和鳥鳴喚醒時的慵懶反應
-
聽到悲傷音樂時的共情表現(呼吸燈節奏/語調變化)
-
突發危機下的緊張反應(如兒童遇到危險時的急切警告)
-
-
-
動態性格系統
-
初始性格設定(如"整合騎士"的正義感)
-
通過長期交互逐步改變:
-
示例1:習慣睡前故事后的主動提醒
-
示例2:受主人影響形成的說話風格(如學會"扯犢子")
-
示例3:對特定活動的偏好變化(如從討厭→喜歡旅游)
-
-
-
記憶與遺忘機制
-
非滑動窗口式的記憶存儲
-
重要事件長期保留(如童年記憶)
-
示例:
-
通過多次觀察推斷"領導愛喝茶"
-
經歷嚴重錯誤后的即時行為修正
-
-
-
實時交互能力
-
對話中實時微表情反饋(如聽到意外消息時的驚訝)
-
語言理解與生成的流式處理(支持打斷/搶話)
-
三、關鍵系統模塊需求
模塊 | 核心需求 | 示例參考 |
---|---|---|
感知系統 | 多模態實時處理能力 | 同時解析語音/視覺/環境傳感器數據 |
情感引擎 | 基于情境的情感涌現 | 聽到《River Flows In You》時產生憂郁情緒 |
記憶系統 | 事件抽象與關聯存儲 | 從多次化妝事件抽象出"化妝時不喜被觸碰" |
性格模型 | 動態參數調整機制 | 經歷重大事件后的即時性格轉變 |
表達系統 | 非對稱情緒表達 | 面帶微笑說反諷話語(如應對冒犯性提問) |
四、技術挑戰與解決方案方向
-
情感生成機制
-
采用層次化強化學習:
-
底層:生理需求(如"睡眠"狀態)
-
中層:環境交互(如音樂/光線影響)
-
高層:社會關系(如與主人的情感聯結)
-
-
-
記憶系統設計
-
借鑒Hippocampal-Neocortical模型:
-
短期記憶:原始事件存儲(如"今天看到領導泡茶")
-
長期記憶:抽象模式提取("領導→茶愛好者")
-
-
遺忘機制:基于記憶強度的衰減函數
-
-
實時交互實現
-
語音處理流水線:
python
-
-
-
while audio_stream:# 50ms間隔處理chunk = get_audio_chunk() emotion = emotion_detector(chunk) # 實時情感分析face_animator.update(emotion) # 微表情響應if detect_interrupt_point(chunk):generate_backchannel() # 插入"嗯""啊"等反饋
-
-
個性化差異實現
-
采用雙路徑適配架構:
-
基礎模型:通用情感/認知能力(所有機器人共享)
-
適配層:LoRA矩陣存儲個性化特征
-
更新觸發:重要事件→即時矩陣調整
-
-
五、關鍵拒絕項
-
不要預設情感模板(如"悲傷=哭")
-
不要固定記憶窗口(如僅保留7天記憶)
-
不要顯式規則定義(如"if 經常聽故事 then 喜歡故事")
六、進階需求
-
媒體體驗擬人化
-
書籍/電影的漸進式理解(非全局處理)
-
示例:與主人同步觀看懸疑片時的實時反應
-
-
沖突處理能力
-
主動拒絕不合理要求
-
示例:對"打開頭顱"請求的反諷回應
-
-
模糊決策機制
-
模擬人類糾結狀態
-
示例:"吃火鍋還是燒烤"的權衡過程
-
七、參考架構示意圖
[環境傳感器] → [多模態融合模塊] ↓ [短期記憶緩存] ← [事件重要性評估] ↓ [情感狀態機] → [性格參數矩陣] ↓ [表達規劃器] → [動作/語音生成]
八、訓練數據需求
-
初始人格構建:
-
《刀劍神域》愛麗絲劇情時序化標注
-
關鍵事件:整合騎士訓練/與人界接觸等
-
-
持續學習機制:
-
每日交互日志的情感標注
-
重要事件的三維重建(場景/語音/表情)
-