【最后203篇系列】014 AI機器人-1

說明

終于開張了,我覺得AI機器人是一件真正正確,具有商業價值的事。

把AI機器人當成一筆生意,我如何做好這筆生意?一端是業務價值,另一端是技術支撐。如何構造高質量的內容和服務,如何確保技術的廣度和深度?

正好在做這件事,所以我想不太多談技術,把核心的理念和故事串一串。為技術而技術是沒有價值的,為商業價值而產品又是沒有生命力的,怎么讓商業背后自然銜接到技術,而技術又如何自然衍生出商業價值,這是最為關鍵的。

內容

1 Manus

最近這個話題很火,就不多說了。有一點是,大家都模模糊糊的有了大致的方向,而且其實很多都是殊途同歸的。不管怎么樣,manus炒作了一把,我覺得也算是一個poc,大家可以有一些共識。

2 AI機器人

我現在的應用,是在現在的產品中嵌入一個機器人,精確基于產品的數據,而非大模型的通用能力回答問題。

時間非常緊張,大約在2周時間,完成了從poc,到上線的過程。整體上還是屬于達到且稍微超過預期的一個狀態,還有不少缺點,但能夠用了。

還是挺感謝老板理解的,因為時間這么短,里面有很多東西是非常粗糙的,但正如馬斯克說的:東西先做出來最重要,慢慢會改好的。

然后在這段時間內發現按常規方法是行不通的:anythingllm, dify, langchain, 這些成熟的套件工具沒有那么熟,其實嘗試過,發現在很多地方“不聽話”,很難控制好。另外,關于數據應該怎么整合,如何描述給大模型完成對接,也沒法按教科書那樣去做。

整個過程我就奔著一個上線目標,想想第一性原理,然后迅速推進。然后我覺得有很多東西 (還有待驗證)可能也如馬斯克說的:世界就是一群草臺班子構成的。

我用自己零散的工具和知識,也完成類似RAG和Agent Flow這樣的效果,而且,似乎這個是可以不斷疊加,最后由強化學習去自我優化的。我想用那些成熟工具也許是更浪費時間,而且可能是沒法達到我的目標的。

自己用零件進行開發和拼裝,爭取在半年左右把AI機器人作出高度

這又回到我的二八理論,最終要登頂還是要靠自己。

3 結構

還是會稍微提到一點技術

  • 1 向量化。為了 更好的進行語義相似性匹配,還是需要把用戶的問題轉為向量。
  • 2 向量數據庫。用于存儲和檢索近似的問題。
  • 3 FastAPI。構造流式響應服務。
  • 4 Redis。存儲各種緩存,包括當前的知識數據。
  • 5 Kafka。保存會話數據。
  • 6 大模型接口。完成邏輯判斷,數據整合分析。

其實可以看到,這個結構是非常簡陋的,但是可以行得通。

4 問題

  • 1 服務的并發性。這個算是部分解決了,但還不夠徹底。向量化的服務本來是處理批量數據的,但是在問答情況下只能一次一條,影響并發。
  • 2 當前的會話,前端沒有帶歷史消息,回答有時看起來就會很傻。
  • 3 要問的很具體才有效。由于數據是簡單糅合的,如果用戶的問題偏了,機器人不會拉回來對齊,然后回答的質量就很低。
  • 4 很慢。簡單問題1-3秒開始輸出,中等問題大約要5-10秒才會看到回復,復雜問題可能會30秒, 這個從體驗上很糟糕。
  • 5 沒有過程輸出。除了一個思考中的提示,沒有給到中間過程。

5 第一期的改進

  • 1 讓前端帶2輪歷史會話。
  • 2 用session_id的方式,讓前端可以輪詢到整個任務框架和任務完成情況
  • 3 確保能夠統計到用戶訪問和使用的各種情況。

小步快跑,后面我再持續更新。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/71983.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/71983.shtml
英文地址,請注明出處:http://en.pswp.cn/web/71983.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【大模型統一集成項目】如何封裝多個大模型 API 調用

🌟 在這系列文章中,我們將一起探索如何搭建一個支持大模型集成項目 NexLM 的開發過程,從 架構設計 到 代碼實戰,逐步搭建一個支持 多種大模型(GPT-4、DeepSeek 等) 的 一站式大模型集成與管理平臺&#xff…

AI4CODE】3 Trae 錘一個貪吃蛇的小游戲

【AI4CODE】目錄 【AI4CODE】1 Trae CN 錐安裝配置與遷移 【AI4CODE】2 Trae 錘一個 To-Do-List 這次還是采用 HTML/CSS/JAVASCRIPT 技術棧 Trae 錘一個貪吃蛇的小游戲。 1 環境準備 創建一個 Snake 的子文件夾,清除以前的會話記錄。 2 開始構建 2.1 輸入會…

【簡答題002】Java變量簡答題

博主會經常補充完善這里面問題的答案。希望可以得到大家的一鍵三連支持,你的鼓勵是我堅持下去的最大動力!謝謝! 001 什么是Java變量? Java變量是用來存儲數據并在程序中引用的命名空間。 002 Java變量有哪些類型? J…

從零開發Chrome廣告攔截插件:開發、打包到發布全攻略

從零開發Chrome廣告攔截插件:開發、打包到發布全攻略 想打造一個屬于自己的Chrome插件,既能攔截煩人的廣告,又能優雅地發布到Chrome Web Store?別擔心,這篇教程將帶你從零開始,動手開發一個功能強大且美觀…

基于騰訊云高性能HAI-CPU的跨境電商客服助手全鏈路解析

跨境電商的背景以及痛點 根據Statista數據,2025年全球跨境電商市場規模預計達6.57萬億美元,年增長率保持在12.5% 。隨著平臺規則趨嚴(如亞馬遜封店潮),更多賣家選擇自建獨立站,2024年獨立站占比已達35%。A…

maven的項目構建

常用構建命令 命令說明mvn clean清理編譯結果(刪掉target目錄)mvn compile編譯核心代碼,生成target目錄mvn test-compile編譯測試代碼,生成target目錄mvn test執行測試方法mvn package打包,生成jar或war文件mvn insta…

定時任務和分布式任務框架

文章目錄 一 Spring Task1.@Scheduled注解介紹2 基本用法(1)使用@EnableScheduling修飾啟動類(2)創建定時任務的類(3)fixedDelay(4)fixedRate(5)cron3 執行多個任務4 設置異步執行5 @Async使用自定義線程池6 缺點二 xxl-job介紹架構圖與其他任務調度平臺的比較運行調…

git安裝,配置SSH公鑰(查看版本、安裝路徑,更新版本)git常用指令

目錄 一、git下載安裝 1、下載git 2、安裝Git?: 二、配置SSH公鑰 三、查看安裝路徑、查看版本、更新版本 四、git常用指令 1、倉庫初始化與管理 2、配置 3、工作區與暫存區管理 4、提交 5、分支管理 6、遠程倉庫管理 7、版本控制 8、其他高級操作 一…

[Web]ServletContext域(Application)

簡介 Web應用的Application域的實現是通過ServletContext對象實現的。整個Web應用程序的所有資源共享這個域。生命周期與Web應用程序相同,即當前Web應用程序啟動時(以服務器視角而非訪客視角)出生,Web應用服務程序關閉時停止。 通…

qt c++ 進程和線程

在Qt C開發中,進程(Process)和線程(Thread)是兩種不同的并發模型,各有適用場景和實現方式。以下是詳細對比和實際開發中的用法總結: 一、進程(Process) 進程是操作系統資…

【鴻蒙開發】OpenHarmony調測工具hdc使用教程(設備開發者)

00. 目錄 文章目錄 00. 目錄01. OpenHarmony概述02. hdc簡介03. hdc獲取04. option相關的命令05. 查詢設備列表的命令06. 服務進程相關命令07. 網絡相關的命令08. 文件相關的命令09. 應用相關的命令10. 調試相關的命令11. 常見問題12. 附錄 01. OpenHarmony概述 OpenHarmony是…

手寫簡易Tomcat核心實現:深入理解Servlet容器原理

目錄 一、Tomcat概況 1. tomcat全局圖 2.項目結構概覽 二、實現步驟詳解 2.1 基礎工具包(com.qcby.util) 2.1.1 ResponseUtil:HTTP響應生成工具 2.1.2 SearchClassUtil:類掃描工具 2.1.3 WebServlet:自定義注解…

【Java開發指南 | 第三十四篇】IDEA沒有Java Enterprise——解決方法

讀者可訂閱專欄:Java開發指南 |【CSDN秋說】 文章目錄 1、新建Java項目2、單擊項目名,并連續按兩次shift鍵3、在搜索欄搜索"添加框架支持"4、勾選Web應用程序5、最終界面6、添加Tomcat 1、新建Java項目 2、單擊項目名,并連續按兩次…

在MATLAB中實現PID控制仿真

在MATLAB中實現PID控制仿真可以通過代碼編程或Simulink圖形化建模兩種方式完成。以下是兩種方法的詳細操作步驟和示例: 方法1:使用MATLAB腳本編程(基于控制系統工具箱) 步驟1:定義被控對象的數學模型 假設被控對象是…

Conda常用命令匯總

Conda 是一個流行的包管理器和環境管理工具,廣泛應用于數據科學、機器學習等領域。它可以幫助我們管理 Python 包以及不同版本的環境,避免包沖突,提升項目的可復現性。以下是一些常用的 Conda 命令,涵蓋環境創建、管理、包安裝等常…

大數據實時分析:ClickHouse、Doris、TiDB 對比分析

1. 引言 在大數據分析領域,實時分析需求越來越重要。ClickHouse、Doris 和 TiDB 作為當前流行的實時分析數據庫,各自針對不同的應用場景和數據特性進行了優化。本文將對比它們的核心架構、適用場景以及查詢優化方法,幫助數據開發人員選擇合適的工具。 2. 核心架構對比 2.…

藍橋杯歷年真題題解

1.軌道炮&#xff08;數學模擬&#xff09; #include <iostream> #include <map> using namespace std; const int N1010; int x[N],y[N],v[N]; char d[N]; int main() {int n;int ans-100;cin>>n;for(int i1;i<n;i)cin>>x[i]>>y[i]>>v…

Pytorch的一小步,昇騰芯片的一大步

Pytorch的一小步&#xff0c;昇騰芯片的一大步 相信在AI圈的人多多少少都看到了最近的信息&#xff1a;PyTorch最新2.1版本宣布支持華為昇騰芯片&#xff01; 1、 發生了什么事兒&#xff1f; 在2023年10月4日PyTorch 2.1版本的發布博客上&#xff0c;PyTorch介紹的beta版本…

嵌入式硬件篇---手柄控制控制麥克納姆輪子

文章目錄 前言1. 變量定義2. 搖桿死區設置3. 模式檢查4. 搖桿數據處理4.1 右搖桿垂直值&#xff08;psx_buf[7]&#xff09;4.2 右搖桿水平值&#xff08;psx_buf[8]&#xff09;4.3 左搖桿水平值&#xff08;psx_buf[5]&#xff09;4.4 左搖桿垂直值&#xff08;psx_buf[6]&am…

阿里千問大模型(Qwen2.5-VL-7B-Instruct)部署

參考鏈接 知乎帖子 B站視頻 huggingface 鏡像網站&#xff08;不太全&#xff0c;比如 Qwen/Qwen2.5-VL-7B-Instruct就沒有&#xff09; huggingface 5種下載方式匯總 通過huggingface-cli下載模型 不一樣的部分是預訓練權重的下載和demo 首先安裝huggingface_hub pip insta…