基于 Amazon Bedrock 和 Amazon Connect 打造智能客服自助服務 – 設計篇

隨著 GenAI 技術不斷的發展和演進,人工智能技術廣泛地被應用在呼叫中心服務領域,主要包括虛擬坐席(即自助服務)、坐席助手和呼叫中心運營的數據洞察和智能分析。本博客主要針對自助服務應用場景的實現。

1. 傳統自助服務系統瓶頸

1.1 交互方式僵化
  • 交按鍵導航依賴:用戶需通過固定數字按鍵選擇菜單,操作路徑冗長且容錯率低,易因誤操作重復流程。

  • 缺乏自然語言理解:無法解析口語化表達或多輪對話,用戶需嚴格遵循預設選項,靈活性差。

  • 單向輸出為主:信息傳遞多為語音播報,難以整合圖文、鏈接等多媒體形式,信息接收效率低。

1.2 智能化能力缺失
  • 無主動學習與迭代:傳統系統依賴人工規則配置,無法通過用戶行為數據優化流程,服務模式靜態化。

  • 個性化服務不足:無法基于用戶歷史記錄、偏好或實時情境(如位置、設備)提供定制化解決方案。

  • 意圖識別能力弱:對復雜或模糊需求(如“我要改套餐但保留原號碼”)難以精準定位,導致頻繁轉人工。

1.3 數據處理與洞察力薄弱
  • 數據分析表層化:僅能統計基礎指標(如接通率、平均處理時長),缺乏用戶情緒分析、需求聚類等深度洞察。

  • 實時反饋缺失:無法動態監測用戶不滿信號(如語音急促、重復詢問)并觸發干預策略(如優先轉接人工)。

1.4 運營效率與成本瓶頸
  • 維護復雜度高:菜單結構調整需專業技術支持,更新周期長,難以快速響應業務變化。

  • 人力依賴性強:簡單問題無法有效分流,導致人工坐席負擔過重,運營成本居高不下。

2. 基于 GenAI 的智能客服自助系統設計需要考慮的因素

  • 首先要綜合考慮智能客服接入的渠道有哪些,如電話,文字聊天,短信,社交媒體,郵件等。這些渠道可以分成兩個大類,一是語音,二是文本。

  • 如果接入渠道支持語音,則在整體實現過程中增加 NLP 語音轉文字的組件,未來可以通過支持語音的大語言模型,本次設計采用 AWS Lex 服務作為 NLP模塊。

  • 考慮大語言模型延時對客戶體驗的影響,盡量采用延時低的模型。

  • 考慮多種語音混合的場景及需要。

  • 由于語音內容寬泛需要制定策略來做意圖識別,更精準地捕獲客戶的實際意圖。

3. 基于 Amazon Bedrock 的智能客服自助系統架構設計

3.1 需求拆解

首先需要對客戶需求進行分析并確定不同要求采用不同的對應方式。可以采用大語言模型 LLM 實現智能識別,代替傳統 IVR 按鍵式意圖分類,確定意圖后根據不同的意圖采用不同的應對模式。

如果是咨詢類問題,可以采用 RAG 知識庫方式通過 GenAI 模式來實現智能應答,如客戶問題不在知識范圍內可以再轉人工坐席服務,這樣可以大大減輕坐席的壓力;如果是操作類的問題,比如賬戶余額查詢,修改密碼等可以利用基于大語言模型 LLM 的 Agent 代理服務來提供智能服務;如果需要人工服務,可以直接轉接 Amazon Connect 系統并有空閑的坐席提供服務;如果識別到是閑聊或敏感話題,則可以按照客戶策略進行警告提醒或直接終止服務。

當然,在服務過程中往往需要實現多輪問答,為更好地理解客戶的問題,并結合上下文,可以啟用 Prompt Catching 功能實現緩存。這些都可以通過智能 LLM 編排來實現,見圖 1。

圖 1. 客戶自助服務需求分析

3.2 解決方案 High Level 設計

鑒于目前 Amazon Connect 服務的原理及設計規則,采用 Amazon Lex 作為 NLP 語音轉文字的模塊,首先由 Lex 語音轉文字并在 Lex 中通過調用 Lambda 來實現調用 Amazon Bedrock 上的 Claude 3 Haiku 模型實現意圖分類,不同的意圖會對應不同的處理流程,詳見圖 2。

圖 2. 解決方案 High Level 設計

3.3 系統架構設計

整個解決方案可以同時支持電話及文字聊天等多渠道呼叫中心解決方案,不同的接入渠道采用統一的流程管理。整體方案設計中以 Amazon Connect 作為呼叫中心平臺核心服務平臺,同時采用 Amazon Lex 作為自主服務組件,Amazon Lex 以及 Amazon Connect Content Flow 通過調用 Lambda 來實現對 Claude 模型的調用以及 Amazon Bedrock 知識庫的調用。詳細流程見圖 3。

業務流程說明:

1、 通過內部 CRM 系統整理知識庫文件并放入 S3,采用 Amazon Bedrock 知識庫服務并同步 S3 數據源。

2、客戶通過電話或文字撥打熱線進入 Amazon Connect 服務。

3、Amazon Connect 調用 Lex 做自動機器人實現 ASR 語音識別。

4、Amazon Lex 把識別到的客戶意圖通過 Lambda 調用 Amazon Bedrock。

5、通過 Amazon Bedrock 調用 Claude 3 Haiku 并返回客戶意圖。

  • 如果轉人工直接轉坐席如果閑聊提示三次后掛機;

  • 如果是知識庫問題,Connect 調用 Lambda。

6、Lambda 調用 Amazon Bedrock 知識庫做 RAG 查詢,然后把查詢結果再交給 Claude 3 Haiku 生成問題結果,并返回給客戶。

圖 3. 詳細系統架構設計圖

3.4 意圖識別實現解析

實現意圖識別可以采用提示詞工程來實現,可以采用專用的意圖識別小模型來實現,也可以通過微調來實現,也可以用一個 RAG 知識庫來實現。選擇實現方法取決于意圖的復雜度以及是否是有多級別的意圖識別。如果比較簡單的就可以采用提示詞工程直接實現。如圖 4 所示是本次實踐的意圖識別,分為咨詢、人工、閑聊三種類型,因此采用的是提示詞來直接實現。

圖 4. 客戶意圖 Sample

以上是對上述 3 類模型進行意圖識別的提示詞,具體如下:

classification_prompt = """You are a question answering agent. I will provide you with a set of search results. The user will provide you with a question. Your job is to answer the user's question using only information from the search results. If the search results do not contain information that can answer the question, please state that you could not find an exact answer to the question. Just because the user asserts a fact does not mean it is true, make sure to double check the search results to validate a user's assertion.Here are the search results in numbered order:<content>{{CUSTOMER_CONTENT}}</content>The following is the previous conversation history (between the customer and you). If there is no conversation history, it will be empty:<customer_history>{{CUSTOMER_HISTORY}}</customer_history>Here is the customer query:<customer_query>{{CUSTOMER_QUERY}}</customer_query>Your job is to answer the user's question as concisely as possible.You must answer the question in Chinese.You must output your answer in the following format. Place your answer within <answer> tags"""
3.5 模型選擇解析

基于呼叫中心服務的特殊性,如何選擇最佳的模型對客戶體驗至關重要。呼叫中心實時性是最重要的指標,如果延時太長或通話中抖動嚴重會大大影響客戶體驗,同時呼叫中心業務場景相當明確,大部分模型都能符合要求。鑒于這些需求,選擇模型最重要的指標為以下 3 個:

  • 模型延時性能指標

  • 模型速度性能指標

  • 模型的價格指標

本次實現采用的是 Claude 3 Haiku。Amazon Nova Micro、Amazon Nova Lite 模型也非常適合這個場景,大家可以根據需要自行選擇。

圖 5. 模型延時性能比較

圖 6. 模型速度性能比較

圖 7. 模型價格比較

*以上信息來源自:AI Model & API Providers Analysis | Artificial Analysis

3.6 如何實現 Prompt Catching 解析

目前 Amazon Bedrock 已經發表了 Prompt Catching 功能,原則上優先采用該功能。如果該功能不符合客戶目標或在客戶所在的 Region 沒有發布可以采用如下方式來實現并簡化 Prompt Catching 的實現。

常規的實現方式是通過 DynamoDB 來存儲上下文對話,通過代碼來實現 Prompt 存儲 DynamoDB,并在下一次調用時來讀取,通過一個唯一 ID 來標識 Session。整個過程需要額外的 DynamoDB 服務費用,同時需要編寫代碼來控制,同時要維護 Session 的生命周期。

針對 Amazon Connect 在其 Contact Flow 設計過程中支持隨路數據,用來保存當前 Session 的信息,比如主角號碼、被叫號碼等,這個隨路數據也是 Amazon Connect 與 Amazon Lex、Amazon Lambda 等服務傳遞和返回參數的實現原理,該隨路數據的數據格式和內容支持自定義,且完全基于 Session 來控制,當前會話結束后會自動清除數據。

這和 Prompt Catching 實現機制完全匹配,因此通過隨路數據自定義一個字段來存放 Prompt 即可,且這部分不會產生任何的額外費用,同時 Session 生命周期也不用自己管理,由 Amazon Connect 服務來自動維護,大大節省了成本,并簡化了實現的難度。

圖 8. 采用 Amazon Connect 隨路數據實現上下文記憶

4. 解決方案成本分析

針對采用傳統 IVR 及人工的呼叫中心以及采用基于 GenAI 的智能解決方案做了詳細的成本分析。

傳統解決方案主要成本:

  • 大量的人工費用,包括人員費用、人員對應的場地、設備等費用,這部分費用及其昂貴。

  • 通信費用,由于人工服務或者傳統 IVR 模式的自助服務效率比較低,解決一個客戶問題需要更長的通話時長來完成一個業務,同時也會因為重復的提示和引導導致通話時長過長,這將產生大量的通話費用。

基于 GenAI 智能客服解決方案優勢:

  • 由于 AI 的引入,更多的業務類型可以采用自助的服務來提供服務,只有非常緊急或復雜的業務才轉由人工來服務。這可以大大節省人工費用支出,也可以大大提升人工坐席效率。

  • 可以大大降低每個通話的平均通話時長,通過智能意圖識別快速捕捉客戶意圖,大大減少通信費用開支。

  • 雖然增加了 GenAI 服務費用,但由于亞馬遜云科技 GenAI 成本優勢,可以減少這部分開支,同時相對于采用 GenAI 技術節省的通信費用和人力成本,這些費用不是一個數量級,可以大大節省整體費用。

  • 可以提升客戶體驗和滿意度,同時提升處理速度。

以下是一個呼叫中心調用 Amazon Bedrock 上的 Claude 3 Haiku 的成本分析。

  • 假設每個通話需要 8 輪,1 輪需要 2 次對話,每天 2000 通通話

  • 第一輪意圖識別輸入 Token 平均 500,輸出 Token 為 50

  • 第二輪 RAG 輸入 Token 平均 500,輸出 Token 為 200

那么:

  • 每天輸入 Token 數量 = (500+500)82000=16000K

  • 每天輸出 Token 數量 = (50+200)82000=4000K

  • 每天 Haiku 輸入費用 = 0.00025*16000K/1000=$4

  • 每天 Haiku 輸出費用 = 0.00125*4000K/1000=$5

5. 總結

本篇文章討論了基于亞馬遜云科技 Amazon Connect 和 Amazon Bedrock 的智能化呼叫中心架構的設計及成本分析。文章從用戶實際需求出發,提供了一個可行的解決方案,并結合技術和成本綜合考慮提供了最佳實踐。本設計充分考慮了呼叫中心的特殊性,采用提示詞工程結合 RAG 知識庫等不同技術方式,提供最佳的客戶體驗;采用 Amazon Connect 特有的隨路數據作為 Prompt 提示詞的緩存機制,簡化了提示詞緩存的實現機制;還對模型選擇和成本做了詳細的分析,讓讀者可以清楚了解成本和費用的細節。

*前述特定亞馬遜云科技生成式人工智能相關的服務僅在亞馬遜云科技海外區域可用,亞馬遜云科技中國僅為幫助您了解行業前沿技術和發展海外業務選擇推介該服務。

本篇作者

本期最新實驗《多模一站通 —— Amazon Bedrock 上的基礎模型初體驗》

? 精心設計,旨在引導您深入探索Amazon Bedrock的模型選擇與調用、模型自動化評估以及安全圍欄(Guardrail)等重要功能。無需管理基礎設施,利用亞馬遜技術與生態,快速集成與部署生成式AI模型能力。

??[點擊進入實驗] 即刻開啟 AI 開發之旅

構建無限, 探索啟程!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/80714.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/80714.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/80714.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

java高效實現爬蟲

一、前言 在Web爬蟲技術中&#xff0c;Selenium作為一款強大的瀏覽器自動化工具&#xff0c;能夠模擬真實用戶操作&#xff0c;有效應對JavaScript渲染、Ajax加載等復雜場景。而集成代理服務則能夠解決IP限制、地域訪問限制等問題。本文將詳細介紹如何利用JavaSelenium快代理實…

【計算機視覺】OpenCV實戰項目:基于OpenCV的車牌識別系統深度解析

基于OpenCV的車牌識別系統深度解析 1. 項目概述2. 技術原理與算法設計2.1 圖像預處理1) 自適應光照補償2) 邊緣增強 2.2 車牌定位1) 顏色空間篩選2) 形態學操作3) 輪廓分析 2.3 字符分割1) 投影分析2) 連通域篩選 2.4 字符識別 3. 實戰部署指南3.1 環境配置3.2 項目代碼解析 4.…

Python核心數據類型全解析:字符串、列表、元組、字典與集合

導讀&#xff1a; Python 是一門功能強大且靈活的編程語言&#xff0c;而其核心數據類型是構建高效程序的基礎。本文深入剖析了 Python 的五大核心數據類型——字符串、列表、元組、字典和集合&#xff0c;結合實際應用場景與最佳實踐&#xff0c;幫助讀者全面掌握這些數據類型…

GPT-4.1和GPT-4.1-mini系列模型支持微調功能,助力企業級智能應用深度契合業務需求

微軟繼不久前發布GPT-4.1系列模型后&#xff0c;Azure OpenAI服務&#xff08;國際版&#xff09;現已正式開放對GPT-4.1和GPT-4.1-mini的微調功能&#xff0c;并通過Azure AI Foundry&#xff08;國際版&#xff09;提供完整的部署和管理解決方案。這一重大升級標志著企業級AI…

構造+簡單樹狀

昨日的牛客周賽算是比較簡單的&#xff0c;其中最后一道構造題目屬實眼前一亮。 倒數第二個題目也是一個很好的模擬題目&#xff08;考驗對二叉樹的理解和代碼的細節&#xff09; 給定每一層的節點個數&#xff0c;自己擬定一個父親節點&#xff0c;構造一個滿足條件的二叉樹。…

apache2的默認html修改

使用127.0.0.1的時候&#xff0c;默認打開的是index.html&#xff0c;可以通過配置文件修改成我們想要的html vi /etc/apache2/mods-enabled/dir.conf <IfModule mod_dir.c>DirectoryIndex WS.html index.html index.cgi index.pl index.php index.xhtml index.htm <…

mysql性能提升方法大匯總

前言 最近在開發自己的小程序的時候&#xff0c;由于業務功能對系統性能的要求很高&#xff0c;系統性能損耗又主要在mysql上&#xff0c;而業務功能的數據表很多&#xff0c;單表數據量也很大&#xff0c;又涉及到很多場景的數據查詢&#xff0c;所以我針對mysql調用做了優化…

多模態RAG與LlamaIndex——1.deepresearch調研

摘要 關鍵點&#xff1a; 多模態RAG技術通過結合文本、圖像、表格和視頻等多種數據類型&#xff0c;擴展了傳統RAG&#xff08;檢索增強生成&#xff09;的功能。LlamaIndex是一個開源框架&#xff0c;支持多模態RAG&#xff0c;提供處理文本和圖像的模型、嵌入和索引功能。研…

LabVIEW中算法開發的系統化解決方案與優化

在 LabVIEW 開發環境中&#xff0c;算法實現是連接硬件數據采集與上層應用的核心環節。由于圖形化編程范式與傳統文本語言存在差異&#xff0c;LabVIEW 中的算法開發需要特別關注執行效率、代碼可維護性以及與硬件資源的適配性。本文從算法架構設計、性能優化到工程實現&#x…

OpenCV中的光流估計方法詳解

文章目錄 一、引言二、核心算法原理1. 光流法基本概念2. 算法實現步驟 三、代碼實現詳解1. 初始化設置2. 特征點檢測3. 光流計算與軌跡繪制 四、實際應用效果五、優化方向六、結語 一、引言 在計算機視覺領域&#xff0c;運動目標跟蹤是一個重要的研究方向&#xff0c;廣泛應用…

零基礎入門MySQL:10分鐘搞定數據庫基本操作

&#x1f4da; 一、MySQL是什么&#xff1f; MySQL 是一個關系型數據庫管理系統&#xff08;簡單理解&#xff1a;用“表格”存儲數據的倉庫&#xff09;。 就像Excel表格一樣&#xff0c;數據按行和列整齊存放&#xff0c;方便快速查找和管理&#xff01; 為什么要學MySQL&a…

LeetCode 3335.字符串轉換后的長度 I:I先遞推

【LetMeFly】3335.字符串轉換后的長度 I&#xff1a;I先遞推 力扣題目鏈接&#xff1a;https://leetcode.cn/problems/total-characters-in-string-after-transformations-i/ 給你一個字符串 s 和一個整數 t&#xff0c;表示要執行的 轉換 次數。每次 轉換 需要根據以下規則替…

Linux 系統如何掛載U盤

一、問題描述 Linux系統不像Windows系統有圖形化界面&#xff0c;對于機房服務器安裝的Linux尤其如此&#xff0c;那么有時候需要拷貝U盤或者光盤的文件到Linux系統中去&#xff0c;與 Windows 系統自動為 U 盤分配盤符不同&#xff0c;Linux 系統需要手動將 U 盤掛載到指定目…

Qt進階開發:QTcpServer的詳解

文章目錄 一、QTcpServer 簡介二、常用成員函數的使用三、信號函數的使用四、虛函數的使用五、連接多客戶端-服務端示例一、QTcpServer 簡介 QTcpServer 是 Qt 網絡模塊中的一個核心類,用于實現 基于 TCP 協議的服務端(Server),它負責監聽端口、接收客戶端連接請求,并通過…

大項目k8s集群有多大規模,多少節點,有多少pod

1. 實際參與過生產級 K8s 集群 回答示例&#xff1a; 目前我負責的 K8s 集群規模為 300 個物理節點&#xff0c;分布在 3 個可用區&#xff08;AZ&#xff09;&#xff0c;采用多控制平面高可用架構。集群日常運行約 12,000 個 Pod&#xff0c;資源利用率保持在 65%-75%&#…

是 OpenCV 的 CUDA 模塊中用于在 GPU 上對圖像或矩陣進行轉置操作函數cv::cuda::transpose

操作系統&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 編程語言&#xff1a;C11 算法描述 cv::cuda::transpose 是 OpenCV 的 CUDA 模塊中的一個函數&#xff0c;用于在 GPU 上對圖像或矩陣進行轉置操作&#xff08;Transpose&#xff0…

使用 goaccess 分析 nginx 訪問日志

介紹 goaccess 是一個在本地解析日志的工具, 可以直接在命令行終端環境中使用 TUI 界面查看分析結果, 也可以導出為更加豐富的 HTML 頁面. 官網: https://goaccess.io/ 下載安裝 常見的 Linux 包管理器中都包含了 goaccess, 直接安裝就行. 以 Ubuntu 為例: sudo apt instal…

Google LLM prompt engineering(谷歌提示詞工程指南)

文章目錄 基本概念AI輸出配置&#xff1a;調整AI的回答方式輸出長度溫度&#xff08;Temperature&#xff09;Top-K和Top-P 提示技術&#xff1a;讓AI更好地理解你零樣本提示&#xff08;Zero-shot&#xff09;少樣本提示&#xff08;Few-shot&#xff09;系統提示&#xff08;…

簡單介紹Qt的屬性子系統

深入理解Qt的屬性系統 ? 筆者最近正在大規模的開發Qt的項目和工程&#xff0c;這里筆者需要指出的是&#xff0c;這個玩意在最常規的Qt開發中是相對比較少用的&#xff0c;筆者也只是在Qt的QPropertyAnimation需要動畫感知筆者設置的一個屬性的時候方才知道這個東西的。因此&…

NestJS 框架深度解析

框架功能分析 NestJS 是一個基于 Node.js 的漸進式框架&#xff0c;專為構建高效、可擴展的服務器端應用程序而設計。其核心理念結合了 面向對象編程&#xff08;OOP&#xff09;、函數式編程&#xff08;FP&#xff09; 和 函數式響應式編程&#xff08;FRP&#xff09;&…