百川大模型拿下國產第一,AI助手「百小應」上線,比Kimi強不少

最近幾天,國內 AI 創業公司正在連續刷新大模型的能力上限。

5 月 22 日,百川智能發布最新一代基座大模型 Baichuan 4,同時推出了首款 AI 助手「百小應」。

相較 1 月份發布的 Baichuan 3,新一代模型在各項能力上均有大幅提升,其中通用能力提升超過 10%,數學和代碼能力分別提升 14% 和 9%,在國內權威大模型評測機構 SuperCLUE 的評測中,Baichuan-4 大模型能力排名國內第一,超越了 SenseChat V5。

「在通往 AGI 的路上,我們需要超級模型 + 超級應用的雙輪驅動。這是百川自去年成立時確立的基本理念,」百川智能創始人、CEO 王小川表示。「模型能力與超級應用都非常重要。這次的發布,是我們在這條道路上的進步。」

圖片

本次更新的 Baichun 4 大模型首次帶來了多模態能力。百川表示,新模型在各大評測基準上表現優異,領先 Gemini Pro、Claude3-sonnet 等多模態模型。

盡管帶來了多模態能力,但接下來的技術發展規劃中,自然語言仍然是重點。王小川表示,大模型的核心是語言智能,推理能力仍然需要突破,多模態沒有智力,只是對世界的復現。

「今天的大模型自洽性都不夠,模型思考缺乏嚴謹性。有足夠好的邏輯是更加重要的事。我不認為模型的長文本是唯一的事情,現在 AI 公司在長文本上競爭,但長文本只是做大的必要條件,不是充分條件。我認為模型本身未來更要強調內在的自洽性和推理能力,這兩件事并不是靠長窗口去解決的,」王小川表示。

在 Baichuan 4 強大能力的基礎上,百川智能將搜索技術與大模型深度融合,推出懂搜索、會提問的 AI 助手「百小應」。

圖片

百小應不僅可以隨時回答用戶提出的各種問題,速讀文件、整理資料、輔助創作等,還具備多輪搜索、定向搜索等搜索能力,能更精準地理解用戶需求,為用戶提供專業、豐富的知識和資源。此外還會在用戶問題的基礎上通過一系列提問來幫助用戶明確自身需求,給出更精準的答案。

百小應現在已經在 Web 端、iOS 和安卓應用商店同步上線,鏈接:https://ying.baichuan-ai.com/chat

此外,百川智能還宣布開放 Baichuan 4、Baichuan3-Turbo、Baichuan3-Turbo-128k、Assistant API 四款 API,所有開發者、企業用戶均可登錄百川智能開發者中心選擇并接入相應 API,便捷高效地體驗百川智能新一代模型的強大能力。

圖片

新模型能力國內第一

多項能力超越國外主流模型

作為百川智能發布的最新一代基座大模型,Baichuan 4 在國內權威大模型評測機構 SuperCLUE 的評測中,模型能力國內第一,相較上一代大模型 Baichuan 3 提升顯著。

圖片

不僅如此,與國外主流大模型對比,Baichuan4 在知識百科、長文本、生成創作等文科類中文任務上明顯優于國外大模型。

圖片

Baichuan 4 能在較短的時間內取得突破,源于其在訓練過程中引入了諸多業界領先的技術優化手段。例如,其在預訓練階段采用了基于 Model-based+Human-based 的協同數據篩選優化方法,以及對長文本建模位置編碼科學的 Scaling Law,有效提升了模型對數據的利用。

在對齊階段,新模型重點優化了模型 Reasoning、Planning、Instruct following 能力,通過 loss 驅動的數據選取與訓練,多階段爬坡,多模型參數融合等方式有效提升了模型的關鍵指標和穩定性。同時突破 RLHF 和 RLAIF 融合的 RLxF 強化學習對齊技術,大幅提升模型的指令遵循等能力。

此外,Baichuan 4 還具備行業領先的多模態能力,在 MMMU、MMBench-EN、CMMMU、MMBench-CN、MathVista 等評測基準上表現優異,大幅領先 Gemini Pro、Claude3-sonnet 等多模態模型。

圖片

首款 AI 助手百小應

懂搜索、會提問

「百小應」是百川智能成立之后推出的首款 AI 應用。百川智能認為,不同于信息時代工具屬性的產品,大模型創造的是新物種,讓 AI 從工具變為伙伴。雖然受限于模型能力,當下的 AI 應用還無法完全做到如同人一樣,能夠使用工具、會思考、有情感等,但隨著模型能力的持續提升,相關應用一定會逐步具備完整能力。

為了讓用戶能夠擁有更優質的智能體驗,百小應很好地融合了 Baichan 4 行業領先的通用能力與百川智能前沿的搜索技術,具備多步搜索、智能定向搜索等能力,將百小應打造成一款懂搜索、會提問的 AI 助手。

百川著重展示了百小應交互中的多輪搜索能力。針對用戶提出的問題,百小應可以逐步解析,深入探究,解鎖問題的核心答案。相比單輪搜索,在市場調研、產業分析等復雜場景下,多輪搜索能夠有效地獲取更專業、更有深度的信息。定向搜索則能讓百小應精準定位問題領域,直接訪問權威站點,快速、準確地找到相關信息。

在搜索結果呈現方面,百小應同樣與其他在單次搜索后「簡單總結網頁信息」的應用不同,會將搜索結果作為觀點、論據直接應用到問答結果中。與此同時,其結果的結構化也非常優秀,能夠將搜索結果以表格等結構化形式呈現,優化信息布局,便于用戶快速定位、解讀所需信息,可以為行業分析、調研工作提供助力。此外,百小應還在搜索結果中增加了來源參考,用戶只需點擊引用角標即可快速校驗搜索結果。

不僅如此,針對一部分用戶無法明確表述出自身需求,或者問題過于籠統、抽象的情況,百小應還會通過反問的方式,多輪交互定位需求,構建個性化解決方案,給出更精準的答案。

除了強大的搜索和提問功能以外,用戶還能在百小應中上傳 PDF、word 文檔,或者直接輸入網頁鏈接(URL),閱讀并分析書籍、報告、學術論文等長篇內容,僅用一分鐘便能讀完上市公司財報。在 Baichuan 4 多模態能力的支持下,用戶在提問的同時還可以同步上傳圖片,對圖片內容進行解讀,或者將圖片作為補充材料,獲取更精準的回答;并且,它還支持用戶通過語音的方式進行交互。

百小應的名稱源自「一呼百應」,icon 中的橙色區別于科技領域常用的冷色調,寓意有溫度的人工智能,icon 中的形象由水滴和對話氣泡組合而成,水滴象征百川入海的無盡智慧,對話氣泡象征溝通交流。

圖片

MaaS 1000 萬免費

token、AaaS 免費試用

百川智能認為,企業客戶需要的并不是大模型,而是生產力、生產效率的提升,擁有 MaaS+ AaaS(Agent as a service)雙重能力,企業才能構建出智能化的最佳方案。

秉持這一理念,百川智能推出了全新的 MaaS+AaaS 服務。MaaS 版塊由基座模型組成,分為旗艦版和專業版。旗艦版將全量開放 Baichuan 4 的各項能力,Baichuan 4 不僅擁有國內第一的中文能力,并且具備行業領先的金融知識和問答能力,在 SuperCLUE 的金融知識百科能力上 Baichuan 3 就已取得了 A + 的最高評級。

專業版包含 Baichuan3-Turbo 和 Baichuan3-Turbo-128K 兩款模型,在價格方面相比旗艦版 Baichuan 4 更實惠,且均針對企業用的高頻場景進行了針對性優化,綜合測試相比 GPT3.5 整體效果提升 8.9%。百川智能表示,即日起,MaaS 的新用戶可以獲得 1000 萬免費 token。

Assitants API 是百川智能在 Baichuan 4 基礎上針對 Agent 構建推出的 API 接口,不僅支持 Code interpreter、RAG 內建工具,還支持自定義工具調用,方便企業接入各種豐富復雜的 API。評測結果顯示其工具調用能力接近 Open AI Assistants API,本次發布的 Assitants API 現已正式開啟公測,感興趣的用戶均可申請免費試用。

未來,百川智能將推出零代碼 Agent 創建平臺產品,讓業務人員通過自然語言的方式,也能創建 Agent,更好地賦能企業智能化發展。

不過除此之外,百川似乎并不熱衷于投身目前競爭激烈的大模型 API 價格戰。

「中國商業環境里 to B 的市場規模比 to C 小 10 倍,to B 收的是人民幣,花的是美金。到最后大廠都會卷這件事,只是沒想到大家卷得這么狠,價格已經打到零了。這肯定是大廠射程范圍內的,而我們肯定要做差異化,」王小川表示。

面向消費端的百小應,是百川智能投身超級應用的重要一步。

圖片

百小應不僅沒有上套,還直接點破了這個套路:拼多多成立于2015年9月,所以2010年沒有用戶數據。

百小應與文心一言、Kimi 智能助手相似,面向C端消費市場,主打賣點是“懂搜索,會提問”,這沒有跑出目前很火的AI搜索應用的范疇。

根據介紹,百小應不僅可以隨時回答用戶提出的各種問題,速讀文件、整理資料、輔助創作等,還具備多輪搜索、定向搜索、提供嵌入式搜索結果等三重搜索能力。此外,還會在用戶問題的基礎上,通過一系列提問來幫助用戶明確自身需求,給出更精準的答案。并且,它還支持用戶通過語音進行交互。

基于百川基座大模型的能力,“會提問”也是百小應與其他簡單語音助手的重要差異點。比如當用戶問引擎蓋打不開了怎么辦,它會先詢問車輛的品牌和型號,以及是哪一年的車,再給出精準的回答。王小川對此解釋說,“大模型要理解人的意圖,實現從’助手’向’伙伴’的轉變。”

其實,單從名字上就能看出他對“百小應”的期待:一呼百應,從小問題見大能力。但王小川也承認,百小應和他要的形象還有一定的距離,實際效果沒有達到他想要的“超級應用”狀態。現階段市場上,既沒有超級模型,也沒有超級應用。

如何學習大模型 AI ?

由于新崗位的生產效率,要優于被取代崗位的生產效率,所以實際上整個社會的生產效率是提升的。

但是具體到個人,只能說是:

“最先掌握AI的人,將會比較晚掌握AI的人有競爭優勢”。

這句話,放在計算機、互聯網、移動互聯網的開局時期,都是一樣的道理。

我在一線互聯網企業工作十余年里,指導過不少同行后輩。幫助很多人得到了學習和成長。

我意識到有很多經驗和知識值得分享給大家,也可以通過我們的能力和經驗解答大家在人工智能學習中的很多困惑,所以在工作繁忙的情況下還是堅持各種整理和分享。但苦于知識傳播途徑有限,很多互聯網行業朋友無法獲得正確的資料得到學習提升,故此將并將重要的AI大模型資料包括AI大模型入門學習思維導圖、精品AI大模型學習書籍手冊、視頻教程、實戰學習等錄播視頻免費分享出來。

在這里插入圖片描述

第一階段(10天):初階應用

該階段讓大家對大模型 AI有一個最前沿的認識,對大模型 AI 的理解超過 95% 的人,可以在相關討論時發表高級、不跟風、又接地氣的見解,別人只會和 AI 聊天,而你能調教 AI,并能用代碼將大模型和業務銜接。

  • 大模型 AI 能干什么?
  • 大模型是怎樣獲得「智能」的?
  • 用好 AI 的核心心法
  • 大模型應用業務架構
  • 大模型應用技術架構
  • 代碼示例:向 GPT-3.5 灌入新知識
  • 提示工程的意義和核心思想
  • Prompt 典型構成
  • 指令調優方法論
  • 思維鏈和思維樹
  • Prompt 攻擊和防范

第二階段(30天):高階應用

該階段我們正式進入大模型 AI 進階實戰學習,學會構造私有知識庫,擴展 AI 的能力。快速開發一個完整的基于 agent 對話機器人。掌握功能最強的大模型開發框架,抓住最新的技術進展,適合 Python 和 JavaScript 程序員。

  • 為什么要做 RAG
  • 搭建一個簡單的 ChatPDF
  • 檢索的基礎概念
  • 什么是向量表示(Embeddings)
  • 向量數據庫與向量檢索
  • 基于向量檢索的 RAG
  • 搭建 RAG 系統的擴展知識
  • 混合檢索與 RAG-Fusion 簡介
  • 向量模型本地部署

第三階段(30天):模型訓練

恭喜你,如果學到這里,你基本可以找到一份大模型 AI相關的工作,自己也能訓練 GPT 了!通過微調,訓練自己的垂直大模型,能獨立訓練開源多模態大模型,掌握更多技術方案。

到此為止,大概2個月的時間。你已經成為了一名“AI小子”。那么你還想往下探索嗎?

  • 為什么要做 RAG
  • 什么是模型
  • 什么是模型訓練
  • 求解器 & 損失函數簡介
  • 小實驗2:手寫一個簡單的神經網絡并訓練它
  • 什么是訓練/預訓練/微調/輕量化微調
  • Transformer結構簡介
  • 輕量化微調
  • 實驗數據集的構建

第四階段(20天):商業閉環

對全球大模型從性能、吞吐量、成本等方面有一定的認知,可以在云端和本地等多種環境下部署大模型,找到適合自己的項目/創業方向,做一名被 AI 武裝的產品經理。

  • 硬件選型
  • 帶你了解全球大模型
  • 使用國產大模型服務
  • 搭建 OpenAI 代理
  • 熱身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地計算機運行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何優雅地在阿里云私有部署開源大模型
  • 部署一套開源 LLM 項目
  • 內容安全
  • 互聯網信息服務算法備案

學習是一個過程,只要學習就會有挑戰。天道酬勤,你越努力,就會成為越優秀的自己。

如果你能在15天內完成所有的任務,那你堪稱天才。然而,如果你能完成 60-70% 的內容,你就已經開始具備成為一名大模型 AI 的正確特征了。

這份完整版的大模型 AI 學習資料已經上傳CSDN,朋友們如果需要可以微信掃描下方CSDN官方認證二維碼免費領取【保證100%免費

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/16772.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/16772.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/16772.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何與“病態”的人建立友誼:一種基于理解與接納的視角

在我們的生活中,我們經常會遇到一些行為舉止讓我們感到不適或難以理解的人。這些人可能因為他們的某些行為被標簽為“病態”,但真的應該如此簡單地對他們進行評判嗎?本文將探討如何與被視為“病態”的人建立友誼,以及為什么這種接…

分塊優化思想

適用場景 將長區間(n)的順序枚舉查詢優化至 n \sqrt{n} n ?個塊的順序枚舉,這樣單次查詢枚舉的數量會直接從O(n)降低至O( n \sqrt{n} n ?)。 實現手段: (1&#xff09…

【云擎未來,智信天下】移動云服務器Docker部署+遠程連接Redis

文章目錄 引言: 移動云:云擎未來,智信天下一、什么是Redis?二、Redis 與其他 key-value 存儲有什么不同?Redis 架構 三、環境準備四、部署流程使用Redis Desktop Manager遠程連接操作數據庫總結與未來展望云擎未來&…

安卓Bug總結

為什么寫這篇文章 安卓十年開發遇到過得Bug做一個總結,大同小異,總結教訓。 這里存放BUG目錄列表 文章列表內容關鍵字Gradle常見問題及總結包括以下問題:gradle插件與gradle home版本關系錯誤、Gradle下載太慢、Executionfailed forJetifyTr…

java nio FileChannel堆內堆外數據讀寫全流程分析及使用(附詳細流程圖)

這里是小奏,覺得文章不錯可以關注公眾號小奏技術 背景 java nio中文件讀寫不管是普通文件讀寫,還是基于mmap實現零拷貝,都離不開FileChannel這個類。 隨便打開RocketMQ 源碼搜索FileChannel 就可以看到使用頻率 kafka也是 所以在java中文件讀寫FileCh…

CRC校驗(循環冗余校驗 Cyclic Redundancy Check)(以Modbus通信為例)

文章目錄 CRC校驗在Modbus通信中的應用介紹CRC校驗的基本原理校驗原理核心多項式 CRC在Modbus通信中的實際應用數據格式校驗流程1. 發送方:計算數據包(不包括CRC校驗碼)的CRC校驗碼,然后將校驗碼附加到數據包的末尾。2. 接收方&am…

集合的概述

java集合框架(Java Collections Framework)為開發者提供了一系列通用容器,所謂容器就是可以容納其他對象的對象,在jdk1.2開始,就提供了通用容器。 1.Java集合框架的概述 容器是用于容納其他對象的對象,因此基本數據類型無法直接使…

聚數力 以數興 | 與“閩”同行,共話數字未來

閩江之畔,數智騰飛。5月24日,第七屆數字中國建設峰會在海峽國際會展中心盛大舉辦。本屆展會的主題是“釋放數據要素價值,發展新質生產力”,由國家發展改革委、國家數據局、福建省人民政府等單位共同主辦,福州市人民政府…

SVD求解Ax=0

源于計算機視覺life的LiDAR視覺IMU多傳感器融合SLAM:原理推導源碼逐行詳解項目實戰 SVD求解Ax0 首先,我們需要了解四元數的基本概念。四元數是由三個虛部和一個實部組成的復數擴展,可以用來表示三維空間中的旋轉。四元數的乘法規則如下&…

數據恢復的救星!快速恢復手機數據的2個秘籍!

當我們的照片、視頻、聯系人、短信和應用程序丟失時,許多人可能會感到束手無策,無論是珍貴的照片、重要的工作文件還是個人的聯系方式,一旦丟失,都可能帶來極大的不便和困擾。但隨著數據恢復技術的發展,我們有了更多的…

銳捷網絡與您相約第七屆數字中國建設峰會 共話數字未來

第七屆數字中國建設峰會將于5月24日至25日在福建福州舉辦,本屆峰會是國家數據工作體系優化調整后首次舉辦的數字中國建設峰會,主題是“釋放數據要素價值,發展新質生產力”。作為行業領先的ICT基礎設施及解決方案提供商,銳捷網絡與福建省電子信息集團、星網銳捷,圍繞“發展新質生…

2024中青杯數學建模競賽A題人工智能視域下養老輔助系統的構建思路代碼論文分析

2024中青杯數學建模A題論文和代碼已完成,代碼為A題全部問題的代碼,論文包括摘要、問題重述、問題分析、模型假設、符號說明、模型的建立和求解(問題1模型的建立和求解、問題2模型的建立和求解、問題3模型的建立和求解)、模型的評價…

java練習2

題目要求 創建一個Color枚舉類有RED,BLUE,BLACK,YELLOW,GREEN這五個枚舉值/對象Color有三個屬性redValue,greenValue,blueValue創建構造方法,參數包括這三個屬性每個枚舉值都要給這三個屬性賦值,三個屬性對應的值分別是red&#…

Windows批處理命令和概念

Windows中的BAT文件是一種批處理文件,它允許用戶執行一系列命令和腳本。這些命令可以是簡單的,如復制文件或刪除文件,也可以是更復雜的,如運行程序或調用其他批處理文件。以下是一些常用的Windows批處理指令: ECHO - 顯…

用go語言實現一個有界協程池

寫在文章開頭 本篇文章算是對go語言系列的一個收尾,通過go語言實現一個實現一個簡單的有界協程池。 Hi,我是 sharkChili ,是個不斷在硬核技術上作死的 java coder ,是 CSDN的博客專家 ,也是開源項目 Java Guide 的維護…

HDR視頻相關標準-HDR vivid(二)

上文介紹了HDRvivid的一些技術。今天從全局角度來看看HDR視頻的處理流程,HDR視頻系統,即建立一個比SDR視頻更大的色彩/亮度坐標體系,并改變系統的傳輸函數,以再現更大的色域(WCG)和更高的亮度動態范圍。 菁彩 HDR技術的專業術語 …

【ROSUbuntu】常用工具合集

1. 源 ADM64 ubuntu | 鏡像站使用幫助 | 清華大學開源軟件鏡像站 | Tsinghua Open Source Mirror arm64 ubuntu-ports | 鏡像站使用幫助 | 清華大學開源軟件鏡像站 | Tsinghua Open Source Mirror 2. FileZilla sudo apt-get install filezilla 3. Nomachine8 AMD64

操作系統實戰(四)(linux+C語言)

目錄 實驗目的 前提知識 實驗題目 題目分析 實驗程序 頭文件 頭文件實現 核心代碼文件 (各類進程) 生產者 抽煙者A 抽煙者B 抽煙者C makefile文件 實驗運行 運行結果分析 總結 實驗目的 加深對并發協作進程同步與互斥概念的理解&…

【DNS】linux 中讓系統 NetworkManager 不自動生成無效的 DNS

1. 問題背景 一些系統安裝之后會自動覆蓋/添加無效 DNS 設置,導致反而無法上網。 2. 解決方法 修改 /etc/NetworkManager/NetworkManager.conf 文件,在 [main] 部分下添加或修改如下: [main] dnsnone然后用以下命令重啟 NetworkManager …

C# 類(Class)

1. 類的基本概念 在C#中,類是一種引用類型,用于定義對象的模板。類可以包含字段(Field)、屬性(Property)、方法(Method)、事件(Event)等成員。對象是類的實例,通過類的構造函數創建。 2. 類的聲明和使用 你可以使用class關鍵字來聲明一個類: public class Pers…