2024 年被很多人稱為大模型應用的元年,毫無疑問,大模型已經成為共識,下一步更急迫的問題也擺在了大家的面前——大模型到底能夠用在哪?有哪些場景能落地?怎么做才能創造真正的價值?
在剛剛過去的 AICon 全球人工智能開發與應用大會上,InfoQ 采訪了在大模型應用領域的領跑企業數勢科技創始人兼 CEO 黎科峰博士,交流大模型商業化落地的可行性路徑,為行業提供啟發。
1大模型在 ToB 領域蘊藏巨大機遇,企業出海或將成為落地加速器
當前,許多傳統企業對于如何將大模型技術整合到現有業務中感到迷茫。大模型應用產品提供企業難以找到合適的變現方式。大模型應用企業究竟該如何突破商業化之困?ToB 和 ToC,呈現出兩種不同的路徑。
ToC 市場似乎擁有一種天然的魔力,在中國的互聯網領域中,它催生了一批又一批的殺手級應用,并不斷吸引著更多企業加入這個生態系統。ToC 市場如火如荼,ToB 市場發展因為投資回報率、數據安全性等問題導致相對發展緩慢。但縱觀中國科技發展史, ToB 市場經歷了 20 多年的從信息化到數字化再到智能化等多個技術階段的演變與發展,每一次技術革命都經歷了探索和融合期,最終幫助企業更好地為用戶提供個性化產品、滿足特定需求。
因此黎科峰認為,大模型在 ToB 市場同樣蘊藏著更大的機遇。從用戶的角度來看,廣大用戶,包括企業管理者、技術人員和業務人員,已經開始熟悉并運用大模型進行日常的數據處理、知識獲取等,當企業公民使用率提升后,將反向推動 To B 軟件的發展,真正實現軟件產品“從管到用”的進化。從市場選擇來看,企業出海也許將加速大模型商業化落地。一方面,由于海外企業用戶更傾向選擇公有云部署,能夠為大模型商業化提供更加全面的場景數據積累,不斷豐富和優化場景應用;另一方面,SaaS 付費模式在海外接受程度高于國內市場,有利于大模型應用企業更輕量、高效地實現商業化落地。
2大模型 +Agent,將在企業經營分析領域落地
大模型具備知識、智商、學習能力和推理能力,能夠總結和生成新的見解,疊加 Agent,讓企業應用具備了記憶、反思和學習能力,能夠調用企業內部工具并不斷迭代反思,真正實現業務價值的落地。據行業調研表明,數據分析和決策被視為這一結合最重要的應用方向。
在企業考慮引入數據分析 Agent 產品時,成本、數據安全以及實際落地價值將是關注重點。部署千億級別參數的大模型成本高昂,目前或許只有頭部企業才能承擔。同時,數據安全問題也不容忽視,特別是在受嚴格監管的金融等行業。再者,企業也需要確保大模型投入后能對業務產生實質性的幫助。
黎科峰表示,為解決這些問題,數勢科技為企業提供了規模適中、符合企業經營分析場景的 Agent 產品,來降低企業成本和使用門檻。同時,通過云端私有化的專屬數據空間以及支持私有化和本地化部署的方式,確保數據安全。
3SwiftAgent 2.0 發布,實現企業數據分析與決策的范式變革
自大模型技術發布之初,數勢科技便迅速擁抱這一變革,并在此基礎上推出了 SwiftAgent 的新一代產品。黎科峰在采訪中介紹,SwiftAgent 2.0 版本與 1.0 相比,主要新增了五大亮點功能,包括增加了指標和標簽語義層、多模態和多源異構數據鏈接、用戶可干預、可持續性學習和數據加速引擎,這些亮點體現了產品如何針對企業數據分析的現有問題提供解決辦法。
“統一語義層的構建”,SwiftAgent 2.0 通過添加指標和標簽語義層,解決了大模型對底層業務語義理解的難題,并統一了企業各部門的數據口徑,從而避免了數據的混亂。
“多模態和多源異構數據鏈接”使得結構化數據和非結構化數據能夠結合,提供更豐富的分析結論。
“用戶可干預機制”允許用戶參與到數據分析過程中,通過反饋和確認來訓練和優化 Agent。
“數據加速引擎”則確保了實時數據處理的能力,實現了秒級數據查詢,真正達到了實時人機交互的水平。底層選用了性能優異的數據分析引擎,如 StarRocks、Doris,并結合對數據加工和使用場景的優化,提供了基于視圖的預計算能力和基于預計算結果的查詢優化能力。
此外,數據虛擬化技術的應用,使得數據定義與物理數據解耦,實現了指標 / 標簽的靈活加工使用,無需排期開發,進一步提高了數據處理的效率。
4大模型應用商業化落地的關鍵:找到產品的業務價值
在商業化方面,大模型仍然屬于新興事物。為了讓更多行業看到大模型在真實業務場景中的應用價值,數勢科技也在致力于創造實際的落地標桿。“只有通過口口相傳和業務價值的真實感知,才能讓有價值的產品被更多人接受和使用。”黎科峰認為。
目前,SwiftAgent 已經與行業頭部客戶簽訂了合同,并實現了真正的付費使用。這標志著數勢科技在大模型領域的領先地位,其產品已經在金融、零售、消費和高端制造等多個行業中得到了應用,幫助企業解決實際的業務問題。
以一家頭部茶飲連鎖企業為例,黎科峰介紹說明,SwiftAgent 通過在集團層面部署語義層和數據分析框架,并將 Agent 提供給每位店長,使得他們能夠通過對話式查詢快速獲取數據和分析結果,從而提升門店運營效率。這種數字化工具的應用,為企業提供了一個經營閉環,改變了過去門店靠經驗經營的困境,極大地促進了業務發展。
數勢科技 SwiftAgent 2.0 實現了大模型技術在企業經營場景下的價值驗證,也提升了產品的智能化程度,正在顛覆企業企業數據分析與決策范式。黎科峰表示,數勢科技的愿景便是以科技創新實現數據價值的普惠化,讓每一個企業、每一位員工都能體會到數據帶來的價值。
未來,我們期待看到更多像數勢科技這樣的企業,通過創新的技術和產品,推動大模型商業化進程,為各行各業帶來價值提升。
如何學習大模型 AI ?
由于新崗位的生產效率,要優于被取代崗位的生產效率,所以實際上整個社會的生產效率是提升的。
但是具體到個人,只能說是:
“最先掌握AI的人,將會比較晚掌握AI的人有競爭優勢”。
這句話,放在計算機、互聯網、移動互聯網的開局時期,都是一樣的道理。
我在一線互聯網企業工作十余年里,指導過不少同行后輩。幫助很多人得到了學習和成長。
我意識到有很多經驗和知識值得分享給大家,也可以通過我們的能力和經驗解答大家在人工智能學習中的很多困惑,所以在工作繁忙的情況下還是堅持各種整理和分享。但苦于知識傳播途徑有限,很多互聯網行業朋友無法獲得正確的資料得到學習提升,故此將并將重要的AI大模型資料包括AI大模型入門學習思維導圖、精品AI大模型學習書籍手冊、視頻教程、實戰學習等錄播視頻免費分享出來。
第一階段(10天):初階應用
該階段讓大家對大模型 AI有一個最前沿的認識,對大模型 AI 的理解超過 95% 的人,可以在相關討論時發表高級、不跟風、又接地氣的見解,別人只會和 AI 聊天,而你能調教 AI,并能用代碼將大模型和業務銜接。
- 大模型 AI 能干什么?
- 大模型是怎樣獲得「智能」的?
- 用好 AI 的核心心法
- 大模型應用業務架構
- 大模型應用技術架構
- 代碼示例:向 GPT-3.5 灌入新知識
- 提示工程的意義和核心思想
- Prompt 典型構成
- 指令調優方法論
- 思維鏈和思維樹
- Prompt 攻擊和防范
- …
第二階段(30天):高階應用
該階段我們正式進入大模型 AI 進階實戰學習,學會構造私有知識庫,擴展 AI 的能力。快速開發一個完整的基于 agent 對話機器人。掌握功能最強的大模型開發框架,抓住最新的技術進展,適合 Python 和 JavaScript 程序員。
- 為什么要做 RAG
- 搭建一個簡單的 ChatPDF
- 檢索的基礎概念
- 什么是向量表示(Embeddings)
- 向量數據庫與向量檢索
- 基于向量檢索的 RAG
- 搭建 RAG 系統的擴展知識
- 混合檢索與 RAG-Fusion 簡介
- 向量模型本地部署
- …
第三階段(30天):模型訓練
恭喜你,如果學到這里,你基本可以找到一份大模型 AI相關的工作,自己也能訓練 GPT 了!通過微調,訓練自己的垂直大模型,能獨立訓練開源多模態大模型,掌握更多技術方案。
到此為止,大概2個月的時間。你已經成為了一名“AI小子”。那么你還想往下探索嗎?
- 為什么要做 RAG
- 什么是模型
- 什么是模型訓練
- 求解器 & 損失函數簡介
- 小實驗2:手寫一個簡單的神經網絡并訓練它
- 什么是訓練/預訓練/微調/輕量化微調
- Transformer結構簡介
- 輕量化微調
- 實驗數據集的構建
- …
第四階段(20天):商業閉環
對全球大模型從性能、吞吐量、成本等方面有一定的認知,可以在云端和本地等多種環境下部署大模型,找到適合自己的項目/創業方向,做一名被 AI 武裝的產品經理。
- 硬件選型
- 帶你了解全球大模型
- 使用國產大模型服務
- 搭建 OpenAI 代理
- 熱身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地計算機運行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何優雅地在阿里云私有部署開源大模型
- 部署一套開源 LLM 項目
- 內容安全
- 互聯網信息服務算法備案
- …
學習是一個過程,只要學習就會有挑戰。天道酬勤,你越努力,就會成為越優秀的自己。
如果你能在15天內完成所有的任務,那你堪稱天才。然而,如果你能完成 60-70% 的內容,你就已經開始具備成為一名大模型 AI 的正確特征了。