對話式 AI workshop:Voice Agent 全球五城開發實錄

過去幾個月,TEN Framework 團隊與 Agora 和聲網圍繞 “對話式AI”題,踏上了橫跨全球五大城市的精彩旅程——東京、舊金山、巴黎、北京、京都。 五場精心籌備的Workshop 場場爆滿, 匯聚了來自當地及全球的開發者、創業者、產品經理與語音技術愛好者。得益于 RTE 開發者社區與全球多地 AI 社區的鼎力支持,我們得以深入探討 Voice Agent 的前沿趨勢、真實應用場景與落地開發實踐。

每一站,都上演著不同的故事,碰撞出獨特的火花。 現在,就讓我們一起回顧這趟旅程的精彩瞬間!

東京站|Avatar實時交互,引爆現場興奮點

四月,東京,旅程啟航。 首場Workshop聚焦于Avatar驅動的實時交互體驗。

🤩 核心印象: Avatar + 實時交互 = 未來感十足!

🎤 重量級分享: Microsoft 深入解析 GPT-4o Realtime API 的語音對話落地;TEN Framework 揭秘開源語音代理框架的最佳實踐;聲網和 Agora 展示對話式方案的卓越效果與客戶案例;Dify 社區大使 Alec Lee 則帶來結合 TEN 和 Dify 構建語音交互數字人的創新方案。現場討論熱烈,焦點集中在部署細節、延遲優化及Demo的驚艷效果。

💻 實戰演練: 參與者親自動手,在本地部署 TEN Agent,并通過 Playground 接入 Azure OpenAI 語音服務,親手搭建出可實時對話的 Voice Agent。 從原理到實操,體驗全鏈路打通。現場還有 Felo(AI翻譯)、MeltingHack & TUM.ai(AI社群)、UniConvo(Chatbot)、EMQ(MQTT通信)等伙伴交流互動,氣氛火熱。在這里插入圖片描述
在這里插入圖片描述

舊金山站|VAD & 輪次檢測首秀,開發者聚焦語音體驗“魔鬼細節”

五月,微軟大廈,舊金山站。 這里聚集了來自 Oracle、Google、字節跳動等大廠,以及AI教育、企業效率、醫療等領域的創業者和高校學生,背景極其多元。

🤩核心印象: 技術控的盛宴,VAD & 輪次檢測解決關鍵痛點!

🎤技術深度解析: Microsoft、TEN 與聲網和 Agora 持續輸出干貨。TEN 團隊首次開源 VAD(語音活動檢測)與 Turn Detection(輪次檢測)模塊成為焦點! 該組件能精準判斷語音起止和對話輪次,顯著提升實時對話的流暢度與自然度。 現場提問不斷,低延時、模型選擇、成本與應用落地是開發者最關心的話題。

💻實戰反饋: 動手環節體驗 TEN Agent + Azure 實時語音交互。甚至有去年就使用過 TEN 的老用戶驚喜反饋:部署和編排體驗進步巨大!

在這里插入圖片描述
在這里插入圖片描述

巴黎站|深聊語音 AI 爆發點,探討 Voice Agent 落地路徑

五月,巴黎,Vivatech大會同期活動。 我們采用 “Keynote + 圓桌” 的形式,吸引了眾多活躍于歐洲語音技術領域的創業公司和開發者,包括歐洲知名 Voice AI 社區 Voice AI Space。

🤩 核心印象: C端應用探索活躍,歐洲視角碰撞新火花!

🎤 趨勢與落地碰撞: TEN、聲網、Agora、Microsoft 帶來主題演講。圓桌討論“Voice Agent in Action” 更是干貨滿滿,嘉賓們與特邀的歐洲本地伙伴——ASR 服務商 Gladia 和數字人服務商 Trulience——深入探討語音 Agent 的真實場景落地。 話題覆蓋熱門應用場景、社區反饋、核心挑戰與未來突破。

🍷 巴黎Mingle 時刻: 晚間的 Demo 展示與自由交流環節,在葡萄酒與輕食的伴隨下,技術討論也染上了濃濃的巴黎風情。

在這里插入圖片描述
在這里插入圖片描述

北京站|從 TTS 到產品,語音 Agent 的全鏈路探討

六月,北京,極客公園 AGI Playground。 我們特別設置了兩場Workshop:上半場看趨勢,下半場動手干。

🤩 核心印象: 技術走向縱深,落地需求旺盛,開發者上手更快!

🎤 前沿洞察: RTE 開發者社區重磅啟動《對話式AI白皮書》共建計劃;TEN 分享框架設計理念與核心能力;MiniMax 架構師馮雯詳解其 Speech 模型在低延遲語音合成與音色定制上的優勢;FoloToy 聯合創始人郭興華則從兒童陪伴產品切入,分享“把技術藏起來”的落地心得。

📱 Lightning Demo: 現場觀眾即興展示 AI 兒童教育 Metabooks 和旅行助手項目,展現語音AI在生活場景的滲透。

深度實戰: TEN 團隊與階躍星辰協作,帶領參與者完成本地 Voice Agent 的部署與定制開發(模型接入、界面設置、交互邏輯)。經過大半年迭代,現場開發者的“跑通率”顯著提升,一小時即可完成搭建!

在這里插入圖片描述
在這里插入圖片描述

京都站|扎根本土:ASR、大模型與會議實時翻譯

7月,京都,日本創業大會 IVS 現場。 氛圍開放輕松,聚焦日本本土化需求。

🤩 核心印象: 本土化應用開花結果,實時翻譯場景亮眼!

🎤本地化視角: 除了TEN、聲網和 Agora 的分享,特邀日本本土ASR技術專家 Paraparas 團隊帶來“以人為中心的信息轉化平臺”理念,提供極具本地特色的思考。

📱Lightning Demo: 7個 AI 項目輪番登場! FoloToy(AI 語音玩具)、Mosumosu(二次元助手)、Uniconvo(多場景語音 AI bot)、Flowith、MyShell(Agent 平臺)、Pasoo(客服實時翻譯 Agent)等,現場演示日語店家與英文顧客的無縫溝通,驚艷全場。 在披薩的香氣中,大家自由體驗 demo,暢談合作可能。

在這里插入圖片描述
在這里插入圖片描述

🔜 WHAT’S NEXT?下一站?

從東京啟航,經舊金山、巴黎、北京,抵達京都——TEN 團隊攜手全球伙伴,跨越五座城市,與超過 300 位 Voice AI 領域的探索者面對面交流。

我們不僅分享了對話式 AI 的最新進展,更深刻感受到不同地區對 Voice Agent 的獨特關注:

  • 日本: 企業級需求旺盛,電話客服與商業場景是核心。

  • 歐洲: C端產品創新活躍,創業者熱情高漲。

  • 舊金山: 開發者生態成熟,對底層框架、性能優化(如VAD、延遲)細節孜孜以求。

盡管對許多朋友而言,這是與 TEN Framework 的初次邂逅,但大家對其架構設計、技術能力及現場體驗給予了積極反饋和寶貴建議。 我們由衷感謝每一位參與者的熱情與支持!

Voice Agent 的旅程遠未結束。 TEN 團隊將繼續深耕這一領域,期待與更多伙伴攜手,共同探索對話式 AI 的無限可能!

歡迎給我們一個🌟 https://github.com/TEN-framework/ten-framework

在這里插入圖片描述

更多 Voice Agent 學習筆記:

語音能否徹底取代鍵盤?Wispr Flow 融資 3000 萬美金背后的思考丨Voice Agent 學習筆記

11Labs 增長負責人分享:企業級市場將從消費級或開發者切入丨Voice Agent 學習筆記

實時多模態如何重塑未來交互?我們邀請 Gemini 解鎖了 39 個實時互動新可能丨Voice Agent 學習筆記

級聯vs端到端、全雙工、輪次檢測、方言語種、商業模式…語音 AI 開發者都在關心什么?丨Voice Agent 學習筆記

a16z 最新報告:AI 數字人應用層即將爆發,或將孕育數十億美金市場丨 Voice Agent 學習筆記

a16z合伙人:語音交互將成為AI應用公司最強大的突破口之一,巨頭們在B2C市場已落后太多丨Voice Agent 學習筆記

ElevenLabs 33 億美元估值的秘密:技術驅動+用戶導向的「小熊軟糖」團隊丨Voice Agent 學習筆記

端側 AI 時代,每臺家居設備都可以是一個 AI Agent丨Voice Agent 學習筆記

世界最炙手可熱的語音 AI 公司,舉辦了一場全球黑客松,冠軍作品你可能已經看過

多模態 AI 怎么玩?這里有 18 個腦洞

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/89784.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/89784.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/89784.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

算法學習筆記:6.深度優先搜索算法——從原理到實戰,涵蓋 LeetCode 與考研 408 例題

在計算機科學領域,搜索算法是解決問題的重要工具,其中深度優先搜索(Depth-First Search,簡稱 DFS)憑借其簡潔高效的特性,在圖論、回溯、拓撲排序等眾多場景中發揮著關鍵作用。無論是 LeetCode 算法題&#…

vue create 和npm init 創建項目對比

以下是關于 vue create 和 npm init 的對比分析: 1. 定位與功能 vue create 定位:Vue 官方提供的腳手架工具,基于 Vue CLI,用于快速創建標準化的 Vue 項目,支持 Vue 2 和 Vue 3。功能:提供交互式配置&…

C++ bitset 模板類

bitset<256> 數據類型詳解 bitset<256> 是 C 標準庫中的一個模板類&#xff0c;用于處理固定大小的位集合&#xff08;Bit Set&#xff09;。它可以高效地操作和存儲二進制位&#xff0c;特別適合需要處理大量布爾標志或簡單計數的場景。 基本定義與特性 1. 模板參…

通信握手言和:PROFINET轉EtherCAT網關讓汽輪機振動數據“破壁”傳輸

某大型電廠的關鍵汽輪機設備采用EtherCAT振動傳感器進行實時監測&#xff0c;但由于工廠PLC振動分析系統基于PROFINET協議&#xff0c;數據無法直接接入&#xff0c;導致振動數據延遲、預警滯后&#xff0c;嚴重影響設備健康管理。傳統的人工巡檢和定期維護難以捕捉早期機械故障…

golang 中當 JSON 數據缺少結構體(struct)中定義的某些字段,會有異常嗎

目錄關鍵影響示例演示潛在問題與解決方案問題 1&#xff1a;邏輯錯誤&#xff08;零值干擾&#xff09;問題 2&#xff1a;忽略可選字段問題 3&#xff1a;第三方庫驗證最佳實踐總結在 Go 語言中&#xff0c;當 JSON 數據缺少結構體&#xff08;struct&#xff09;中定義的某些…

Fiddler 中文版怎么配合 Postman 與 Wireshark 做多環境接口調試?

現代項目中&#xff0c;開發、測試、預發布、生產環境往往分離配置&#xff0c;前端在開發過程中需要頻繁切換接口域名、驗證多環境表現。而接口升級或項目迭代時&#xff0c;還需要做回歸測試&#xff0c;確保老版本接口仍能兼容&#xff0c;避免線上事故。這些環節若僅靠代碼…

釘釘小程序開發技巧:getSystemInfo 系統信息獲取全解析

在釘釘小程序開發中&#xff0c;獲取設備系統信息是實現跨平臺適配和優化用戶體驗的關鍵環節。本文將深入解析 dd.getSystemInfo 接口的使用方法、技術細節與實際應用場景&#xff0c;幫助開發者高效應對多終端開發挑戰。一、接口功能與核心價值dd.getSystemInfo 是釘釘小程序提…

Java項目Maven配置JDK1.8全攻略

目錄 &#x1f9e9; 一、全局環境變量配置&#xff08;推薦系統級統一&#xff09; ?? 二、Maven全局配置&#xff08;多項目統一&#xff09; &#x1f4c2; 三、項目級配置&#xff08;推薦團隊協作&#xff09; &#x1f4bb; 四、IDE配置&#xff08;輔助驗證&#x…

使用tensorflow的線性回歸的例子(六)

波士頓房價 import matplotlib.pyplot as plt %matplotlib inline import tensorflow as tf import numpy as np from sklearn.datasets import load_boston import sklearn.linear_model as sk boston load_boston() features np.array(boston.data) labels np.arra…

YOLOv11深度解析:Ultralytics新一代目標檢測架構創新與實戰指南

?? 2024年Ultralytics重磅推出YOLOv11**:在精度與速度的平衡木上再進一步,參數減少22%,推理速度提升2%,多任務支持全面升級! ?? 一、YOLOv11核心創新:輕量化與注意力機制的完美融合 YOLOv11并非顛覆性重構,而是通過模塊級優化實現“少參數、高精度、快推理”的目標…

基于 SpringBoot+Vue.js+ElementUI 的 “花開富貴“ 花園管理系統設計與實現7000字論文

摘要 本論文詳細闡述了基于 SpringBoot、Vue.js 和 ElementUI 的 "花開富貴" 花園管理系統的設計與實現過程。該系統旨在為花園管理者提供高效、便捷的花園信息管理平臺&#xff0c;實現花卉信息、員工、客戶、訂單等全方位管理功能。論文首先分析了花園管理系統的研…

RESTful API 安裝使用教程

一、RESTful API 簡介 REST&#xff08;Representational State Transfer&#xff09;是一種基于 Web 的架構風格&#xff0c;RESTful API 是使用 HTTP 協議并遵循 REST 原則設計的 API 接口。其核心思想是&#xff1a;使用標準 HTTP 方法&#xff08;GET、POST、PUT、DELETE&…

【行云流水ai筆記】粗粒度控制:推薦CTRL、GeDi 細粒度/多屬性控制:推薦TOLE、GPT-4RL

TOLE模型完整啟動方法指南 TOLE (Token-level Optimization with Language Models) 是一種基于強化學習的可控文本生成方法&#xff0c;通過token級別的反饋實現對文本多個屬性的精確控制。以下是完整的啟動方法指南&#xff1a; 1. 環境準備 1.1 創建虛擬環境 conda creat…

【沉浸式解決問題】idea開發中mapper類中突然找不到對應實體類

目錄 一、問題描述二、場景還原三、原因分析四、解決方案 一、問題描述 mapper類繼承了mybatis-plus的BaseMapper&#xff0c;泛型需要填入實體類&#xff0c;但是不知怎么地突然實體類就報錯了&#xff0c;顯示沒有這個類 二、場景還原 實體類就是死活報錯找不到&#xff0c;所…

初學python的我開始Leetcode題11-2

提示&#xff1a;100道LeetCode熱題-11-1主要是二分查找相關&#xff0c;包括三題&#xff1a;搜索旋轉排序數組、尋找旋轉排序數組中的最小值、尋找兩個正序數組的中位數。由于初學&#xff0c;所以我的代碼部分僅供參考。前言上次的三道二分查找題較為基礎&#xff0c;主要是…

Python 數據分析與可視化 Day 12 - 建模前準備與數據集拆分

? 今日目標 掌握建模前常見準備步驟學會使用 train_test_split() 將數據劃分為訓練集和測試集理解特征&#xff08;X&#xff09;與標簽&#xff08;y&#xff09;的區分學習常見建模流程的輸入要求&#xff08;格式、維度&#xff09;&#x1f4d8; 一、建模前準備流程概覽 數…

Swagger 安裝使用教程

一、Swagger 簡介 Swagger 是一套開放源代碼的 API 文檔生成工具鏈&#xff0c;現歸屬于 OpenAPI 規范。它支持 RESTful API 的定義、生成、測試和文檔自動化。常見的使用工具包括 Swagger UI、Swagger Editor、Swagger Codegen 以及 SpringFox&#xff08;Spring 集成庫&…

【seismic unix相速度分析-頻散曲線】

介紹Seismic Unix Seismic Unix&#xff08;SU&#xff09;是一個開源的地震數據處理軟件包&#xff0c;主要用于地震數據的處理、分析和可視化。它由科羅拉多礦業學院的Center for Wave Phenomena開發&#xff0c;廣泛應用于學術研究和工業領域。SU提供了一系列命令行工具&am…

3.前端和后端參數不一致,后端接不到數據的解決方案

目錄 1.問題背景: (1).前端代碼: (2).后端代碼: (3).問題分析: [1]前端參數構造錯誤: [2].Api請求配置錯誤: 2.解決方案 (1).修改 role.js 中的 API 方法 (2).前端組件中的調用方式改成下面的而不是繼續拼接了 3.總結: 1.問題背景: 我在接口開發過程中&#xff0c;前…

SpringBoot:整合quartz實現定時任務-MisFire的處理

文章目錄 一、什么是MisFire二、MisFire發生的情況三、MisFire的補償策略四、代碼實現 一、什么是MisFire 簡單理解為&#xff1a;定時任務&#xff0c;所錯過的觸發 二、MisFire發生的情況 1、資源緊張&#xff0c;定時任務請求不到對應的線程。 2、調度器關閉。 3、設置定…