谷歌Gemini被罵了?讓子彈飛一會兒;如何構建高效RAG系統;Pika是腐朽王朝的顛覆者;AGI將重塑組織架構;對話月之暗面楊植麟 | ShowMeAI日報

👀日報&周刊合集 | 🎡生產力工具與行業應用大全 | 🧡 點贊關注評論拜托啦!

👀 淘寶 X D.Design 堆友 | 淘寶年終好價節 AIGC 創作大賽

https://d.design/competition/taobao-promotion

淘寶攜手堆友聯合打造了「淘寶年終好價節AIGC品牌共創大賽」。本次比賽以「價格蹦極」為主題,邀請各界AIGC愛好者一同釋放創意的無限潛力。

注意!作品征集和人氣投票都截至12月12日結束!要抓緊啦!

獲獎作品將被制作為淘寶年終好價節品牌官方傳播物料,進行大范圍曝光,并進行獲獎者署名。而且一等獎單人獨攬3萬現金,總獎池10萬💰,獲獎概率賊大 👀


🉑 從王者歸來到被罵作假,Gemini 這跌宕起伏的一天啊……

https://blog.google/technology/ai/google-gemini-ai/#sundar-note

12月6日,谷歌深夜炸場,發布了最新版本的 Gemini 模型,宣傳視頻中的「多模態」能力閃瞎了我們的眼。僅從文章標題「Introducing Gemini: our largest and most capable AI model (Gemini:我們規模最大、能力最強的 AI 模型)」都能感受到谷歌這波的躊躇滿志和萬丈豪情。

簡單來說,谷歌成立 Google DeepMind 就全力押寶 Gemini 大模型,并在本輪發布了針對 Gemini 1.0 的三種優化版本:

  • Gemini Ultra —規模最大且功能最強大的模型,適用于高度復雜的任務 (目前無法體驗,至少要等到12月13日)

  • Gemini Pro — 適用于各種任務的最佳模型 (Bard Experiment 版本已經可以體驗,Bard beta 版本還不可以)

  • Gemini Nano — 端側設備上最高效的模型 (搭載到了 Pixel 8 Pro 智能手機中) ? 官方博客原文(中文版)

社群總結的 Bard 版本切換小竅門:把 Google 賬號系統語言設定為英文,保險起見可以把魔法節點和 Google 賬戶所在地都設為美國,重新進入 Bard(https://bard.google.com)確認左上角已經切換為 Experiment版本

僅僅一天之后,Gemini 的風評急轉直下,從「超越GPT-4」「被OpenAI壓著打了一年后終于王者歸來」到「宣傳視頻被曝作假 ? 鏈接」「中文基準測評遠不如 GPT-4 ? 鏈接」。

個人覺得,目前就對Gemini下判斷為時尚早。官方博文里明確說「它將在 170 多個國家和地區提供英語服務,并且計劃在未來幾個月內擴展不同的模態,并支持新的語言和地區」,也就是對「非英語」任務的支持一般,而且最高性能的 Ultra 版本還沒出來 (演示視頻都是基于 Ultra 版本的)。

讓子彈再飛一會吧。

🉑 devv.ai 是如何構建高效的 RAG 系統的

https://devv.ai

devv.ai 是專門面向開發者的 AI 搜索引擎,目標是替代開發者日常使用 Google / StackOverflow / 文檔等進行查詢的場景,更加快速地處理 coding 過程中的問題。

很多開發者用戶表示,devv.ai 的搜索結果優于 GPT-4,已經設置為默認搜索引擎。devv.ai 開發者 X@Jiayuan 也分享說,產品在一個月時間里收獲了6位數的用戶、日搜索5萬次且每周翻倍,是一次成功的探索。

https://twitter.com/Tisoga/status/1731478506465636749

https://github.com/devv-ai/devv

最近,Jiayuan 在X平臺寫了一條長推,解釋了構建 devv.ai 需要的底層技術。第一篇的主題是「devv.ai 是如何構建高效的 RAG 系統的 🔎」,用通俗易懂且結構化的方式科普了 RAG 的誕生背景和常見的技術解決方案,值得一看~

受限于篇幅,日報將作者分享的核心內容整理如下,推薦去看原文。也推薦 Follow 作者的X賬號和 GitHub 項目更新 (作者說會將本篇及更多內容整理在 GitHub)

RAG (Retrieval Augmented Generation,檢索增強生成) 系統是為了解決「語言模型無法有效獲得與利用新知識」這一問題而設計的一種架構與技術方案,在最近幾年強大語言模型和訓練計算能力的支持下,終于得以實現和應用。

RAG目的是讓語言模型使用外部知識進行生成。RAG 系統由①語言模型②模型所需外部知識集合③當前場景下需要的外部知識這三部分組成。優化 RAG 系統就是分別優化這三個模塊

  1. 語言模型
  • GPT-3 的出現使得RAG系統變得可用,因為它具有較強的理解和生成能力。第一波基于 RAG + GPT-3 的公司 (Copy AI、Jasper等) 都獲得了非常高的估值 & ARR。

  • 從2023年開始,出現了大量的開源和閉源的基座模型,如 GPT-3.5 / GPT-4 (閉源方案) 和Llama 2 / Mistral (開源方案),這些模型都可以在上面構建 RAG 系統。

  1. 模型所需的外部知識集合
  • 這個模塊主要包括兩個部分:embedding 模型存儲 embedding vector 的數據庫

  • 前者基本上都使用 OpenAI 的 embedding 模型,后者可選方案包括Pinecone、Zilliz (國內團隊)、Chroma (開源的解決方案)、關系型數據庫上的 pgvector 等

  • devv.ai 采用的方式:embedding + 傳統的relation db + Elasticsearch,并使用 Rust 構建了整套 knowledge index

  1. 更好地召回當前場景下需要的外部知識
  • 作者團隊在 encoding 過程中對原始 knowledge 數據進行了大量處理,以確保在 retrieve 時獲取到結構化的數據,減少后續處理的復雜性,并提高召回準確率

🉑 月之暗面楊植麟:大模型需要新的組織范式,場景摩爾定律能催生 Super App

https://kimi.moonshot.cn/chat/

月之暗面 (Moonshot AI) 是一家神秘且特別的大模型創業公司。公司目前只發布了一款產品——基于千億大模型的 chatbot 產品「Kimi Chat」,并在發布之初就打出了「長文本」「自研閉源」「toC」等清晰的標簽。

創始人楊植麟畢業于 CMU,師從蘋果 AI 負責人 Ruslan Salakhutdinov,曾在 Meta 和 Google Brain 任職,是 Transformer-XL 與 XLNet 等爆款論文的第一作者。

這篇極客公園創始人張鵬與月之暗面創始人楊植麟的對話,質量非常之高,提問和回答都非常有水平!!不同于其他公司的「公關文」,他們在這場直播里深刻討論戰略、組織、產品和人才,討論OpenAI、AGI、AI Native 和 Super-App,也討論人類即將踏上征程的未知遠方

我們以前善于目標導向,通向有用,但未來把一件事變得有用、普惠的過程中,可能需要一點 moonshot 的精神。你在瞄向一個高位置的東西,不管打不打得中,至少要往宇宙深處走,往星河深處走,我覺得這是讓人興奮的。往往可能是一些興奮的目標,聚集起了真正優秀的人。

我們對問答都做了簡化,方便快速get核心信息。但是強烈推薦你花20分鐘閱讀原文,感受下非常「聰明」的思考方式以及高信息密度的輸出,體會字里行間閃爍的智慧火花。

大模型時代,對組織形態提出了新的要求

  • Q1: 如何做出投身大模型賽道的決定

  • A1: 決策邏輯來源于過去幾年對語言模型認知的變化,以及在 Google 觀察到的現象,認識到構建新的組織形式是通往 AGI 的必經之路

大模型時代的創新很難被規劃

  • Q2: 為什么組織是核心問題

  • A2: AGI 時代的底層邏輯發生了變化,需要新的組織形式來匹配;在新的時代,非常擅長 AGI 的組織出現是大概率會發生的事情

  • Q3: 對 OpenAI 的看法

  • A3: OpenAI 在人才密度、共同愿景和高效聚焦方面做得很好;他自己則更關注如何找到一個系統性的方式去做事情

  • Q4: 如何定義創新組織:bottom-up 還是 top-down

  • A4: top-down 框架在大模型中仍然適用,關鍵是讓組織中的小單元高效地完成任務,以實現整體目標

AGI 的技術路徑已經確定,但產品方向仍然有很多未知

  • Q5: 對 AGI 技術路徑的看法

  • A5: AGI 的技術路徑已確定,但產品層面仍存在很多不確定性;組織和創新在這個時代尤為重要,只有把組織做好,才有可能在AGI路上取得成功

  • Q6: 為什么選擇長文本作為專長方向

  • A6: 長文本是新計算系統的「內存」,具有非常高的價值

閉源路線是為了打造 AGI 時代的 Super App

  • Q7: 對于開源模型和閉源模型的看法

  • A7: 開源和閉源在大模型領域是互補關系,Moonshot 選擇閉源是為了專注于打造超級應用,這是核心策略

  • Q8: 為什么選擇 toC 業務而非 toB

  • A8: 新的技術變革為 toC 領域帶來了新機會,希望建立一個與AGI目標匹配的業務模式,并實現快速閉環和迭代

  • Q9: 對AI Native概念的理解

  • A9: 在 AI Native 的背景下,產品經理需要關注如何通過兩個數據集 (訓練數據和測試數據) 開發產品,以及如何訓練和調試模型

  • Q10: 是否必須端到端地開發 Super-App

  • A10: 要實現真正的 Super App,需要端到端地做這件事,這樣可以形成產品的差異化優勢,并且讓模型跟隨應用共同成長

新時代產品經理需要具備的素質:快速迭代

  • Q11: 當前產品經理的角色變化

  • A11: 新的產品經理需要在「神性」和系統性之間尋找平衡;在AGI時代,系統可能是主力軍,但仍需要“「神性」的指引

  • Q12: 團隊招聘產品人的特質

  • A12: 團隊成員需要具備開放心態、學習能力和快速迭代的特質,團隊希望找到對 AGI、Super-App 和全球市場有激情的人

  • Q13: 對智能摩爾定律的看法

  • A13: 認同智能摩爾定律的觀點,但更關注場景摩爾定律;有多少場景被解鎖,以及如何實現指數級上升,這將是下個時代最偉大的公司的關鍵指標

  • Q14: 硅谷和中國創新者的文化和能力差異

  • A14: 硅谷工程師文化強調技術和創新,而東方文化強調實用性和商業模式;未來最偉大的公司可能會結合這兩種文化,實現技術和商業的雙重成功 ?
    強烈!推薦!完整閱讀原文


👀 從 HeyGen 到 Pika,AI視頻商業化中的生存與生態

AI生成視頻領域最近比較火的兩款應用是 HeyGen 和 Pika。HeyGen靠「Taylor Swift 說中文」「郭德綱說英語」的視頻火爆出圈后,吸引了一大波新用戶并獲得了一筆新的融資。Pika 鋪天蓋地的營銷和被扒出的更多幕后則顯示其「資本寵兒」的身份穩固。

這篇文章的作者 (應該是投資人背景) 從商業化和生態等角度,分析了 HeyGen 和 Pika 面臨的挑戰,以及可能顛覆并重構的新興商業帝國。當我們還在爭論一款AI應用是否好用的時候,已經有人洞察到了未來~ (作者文筆相當凝練,信息密度很好,日報摘錄幾段并推薦閱讀原文)

HeyGen的收入增長能否跟得上它的估值和流量,是決定它未來兩三年資本運作的核心要素

但即使是需要深度耕耘才可能有收獲的場景,也不得不內防同行,外防大廠。阿里的 Animate Anyone 和字節的 MagicAnimate 都在最近發布,可以很明顯的看到這兩款產品對于直播和短視頻的意義

由于大廠可以為自己的業務服務而無需考慮短期收益,會將其能覆蓋到的方向迅速內卷。

互聯網從未真正改變影視行業,只是在舊模式中塞入了新的渠道和資本勢力。內容制作與組織結構仍把持在“圈內人”手中,并很快與互聯網新貴沆瀣一氣。而AI視頻,終于讓我們看到了打破影視領域圈子壟斷的可能性

即使不是Pika,也會是其他視頻生成公司。但凡投資人在人生中對推翻好萊塢霸權有過一點想象,都會理解這項技術代表何種夢想。在這個過程中,落地與否不那么顯眼,因為終點有望得見的巨額金錢

就如同圖片生成網站往往都伴隨一個發布圖片的社區,未來在Pika上制作的電影、劇集或動畫,必然可以直接在Pika發布這可能是第一次,影視行業的制作、發行和渠道在同一家公司身上無縫銜接。不需要采購和投資,只要與創作者約定版權收益的分成比例,就可以把源源不斷的內容提供給觀眾 ? 推薦閱讀原文 (賬號的文章都挺不錯)

🉑 從大模型到 Agent 會改變的游戲規則

最近在跟AI創業者和開發者們討論「生成式AI浪潮對公司組織架構的影響」,有很多觀點的交鋒非常有意思。最近討論這個話題的文章也挺多,有幾篇的內容邏輯和深度非常不錯!今天日報推薦兩篇~

我們一起來深度思考下,除了甚囂塵上的「降本增“笑”」「AI讓我丟掉了工作」這些話題之外,AI怎樣深刻地改變了生產力和生產關系,而這又將如何深刻地影響我們每個人未來的命運

以下是文章完整的邏輯。這位作者的文章質量都很高,就是行文有點…晦澀… 需要集中注意力去理解內在邏輯~ 如果你不關心推導過程想直接看核心內容,從原文中間的「組織力」部分開始看就OK~

智能先要跨過一個個界限,然后才是不同領域的Agent逐步成立,這種界限可以用圖靈測試2.0進行度量。跨過界限之后很可能會對組織方式進行重構。

當組織力的內涵發生變化后,才可能普遍產生10倍的效能,影響一個一個行業這時候沉淀到組織關系中的,不同行業的各種積累可能就會變為負債,反倒是形成真正的從大模型到Agent的新機會 ? 閱讀原文


🉑 AI或將重塑現代公司組織架構 | 附:重塑的例子

接著上方的討論,我們看看這篇文章更當下、更具體的討論。也就是說,面對洶涌澎湃的生成式AI浪潮,面對一定會發生的組織變革,此時此刻的我們可以做些什么

要在AI浪潮下重塑組織,可以遵循以下三點原則:

  1. 授權團隊尋找自己的使用場景:引入AI并非簡單的IT解決方案,而是像引入一位新團隊成員;每個團隊和個人需根據自身場景找到合適的AI應用方式;激勵機制應鼓勵實驗與溝通,公司文化要擁抱自由思想

  2. 擁抱錯誤和不確定性:組織變革需要時間,變革后的組織形態可能固化,因此下一代組織架構需足夠靈活,讓團隊有充分空間迎接新模型

  3. 從今天就開始,不斷迭代:采用現有AI功能后,組織需持續優化;將AI應用的測試周期縮短為數天甚至數小時,會對工作方式產生深刻影響;企業在面對指數級變化時,要么反應過早,要么反應過晚

作者自己團隊是如何納入AI幫助做出更加「智能」決策的呢?這是個復雜且反復的過程:

  1. 使用AI提供反饋:AI可根據用戶定義的角色提供相當滿意的反饋,作為初步反饋手段

  2. 使用AI整理和總結信息:AI可幫助團隊更有效地開會,還能生成產品原型或網頁代碼等使討論更直觀

  3. 改變工作流程:即使是使用現有的AI工具,也可以徹底改變整個工作流程,使理論探討更落地

  4. 未來的AI想象力:我們可以預見一個AI自主地從產品概念開始創造,直至代碼編寫和部署,幾乎不需要人類干預的世界 ? 閱讀原文

👀 ChatGLM: An Alternative to ChatGPT

ShowMeAI知識星球資源編碼:R195

這是 ChatGLM 大模型作者 **@唐杰 老師在 ISWC 2023 大會的演講 keynote,核心內容是 ChatGLM 模型的設計思路、技術創新點和最新進展。

整份報告 60+ 頁,是來自大模型作者第一視角的難得分享,以下是一些頁面截圖,感興趣可以前往星球下載完整報告。

感謝貢獻一手資訊、資料與使用體驗的 ShowMeAI 社區同學們!

? 點擊 👀日報&周刊合集,訂閱話題 #ShowMeAI日報,一覽AI領域發展前沿,抓住最新發展機會!

? 點擊 🎡生產力工具與行業應用大全,一起在信息浪潮里撲騰起來吧!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/213320.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/213320.shtml
英文地址,請注明出處:http://en.pswp.cn/news/213320.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python用turtle畫櫻花飄落,python代碼畫櫻花代碼

這篇文章主要介紹了python用turtle畫櫻花飄落,具有一定借鑒價值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲,下面讓小編帶著大家一起了解一下。 1、python畫櫻花樹代碼為: import turtle as T import random import…

基于ssm保險業務管理系統設計與實現論文

摘 要 現代經濟快節奏發展以及不斷完善升級的信息化技術,讓傳統數據信息的管理升級為軟件存儲,歸納,集中處理數據信息的管理方式。本保險業務管理系統就是在這樣的大環境下誕生,其可以幫助管理者在短時間內處理完畢龐大的數據信息…

銀行數字化轉型導師堅鵬:興業生活APP運營之道

基于招商銀行案例研究的興業生活APP運營之道培訓圓滿結束 ——線上引流平臺流量經營與變現 興業銀行股份有限公司(簡稱“興業銀行”)成立于1988年8月,2022年總資產9.27萬億元,是經國務院、中國人民銀行批準成立的首批股份制商業銀…

python畫圖:legend圖例相關

import matplotlib.pyplot as plt plt.legend(loclower right, fontsize12, frameonTrue, fancyboxTrue, framealpha0.2, borderpad0.3,ncol1, markerfirstTrue, markerscale1, numpoints1, handlelength3.5)#loc:圖例位置,可取(‘best’, ‘upper right’, ‘upper left’, ‘…

在Ascend昇騰硬件用npu加速paddleLite版本ocr(nnadapter)

在Ascend昇騰硬件用npu加速paddleLite版本ocr(nnadapter) 參考文檔* nnadapter參考文檔地址* 華為昇騰 NPU參考文檔地址* PaddleLite的CAPI參考文檔 一.確保cpu版本運行正常二.編譯Ascend上npu加速庫三.跑通npu加速版本Demo1.Demo下載地址2.參考手冊網址…

Jupyter Notebook工具

Jupyter Notebook 是一個交互式的筆記本環境,允許用戶以網頁形式編寫和分享代碼、文本、圖像以及其它多媒體內容。它支持超過 40 種編程語言,最常用的是 Python。 以下是 Jupyter Notebook 工具的一些特點和用法: 1. 特點: 交互式…

vscode eide arm-gcc 編譯環境搭建調試

安裝cube,vscode 1.安裝vscode插件 C/C Extension Pack Chinese (Simplified) (簡體中文) Language Pack Cortex-Debug Embedded IDE 工具鏈設置 2.軟件工程生成 調試 3.生成工程,導入工程 4. 配置工程 編譯完畢

【PTA刷題】 求子串(代碼+詳解)

【PTA刷題】 求子串(代碼詳解) 題目 請編寫函數,求子串。 函數原型 char* StrMid(char *dst, const char *src, int idx, int len);說明:函數取源串 src 下標 idx 處開始的 len 個字符,保存到目的串 dst 中,函數值為 dst。若 len…

【W5500】關于使用外部網絡變壓器的原理圖設計

直接上原理圖 鏈接也放一個吧【鏈接】 按照這個畫,我實驗在立創EDA上打了一個實驗過是可以用的~ 畫出來的板子長這個樣子【就不公開原理圖和PCB了,這個板子還是很容易畫的】~ 注意在立創上找對網口,要無變壓器的網口,相比TB賣的那…

基于Springboot+Vue前后端分離的電影推薦系統(Java畢業設計)

大家好,我是DeBug,很高興你能來閱讀!作為一名熱愛編程的程序員,我希望通過這些教學筆記與大家分享我的編程經驗和知識。在這里,我將會結合實際項目經驗,分享編程技巧、最佳實踐以及解決問題的方法。無論你是…

前端路由(front-end routing)和后端路由(back-end routing)的區別

聚沙成塔每天進步一點點 ? 專欄簡介 前端入門之旅:探索Web開發的奇妙世界 歡迎來到前端入門之旅!感興趣的可以訂閱本專欄哦!這個專欄是為那些對Web開發感興趣、剛剛踏入前端領域的朋友們量身打造的。無論你是完全的新手還是有一些基礎的開發…

滲透測試學習day8

文章目錄 靶機:UnifiedTask1Task2Task3Task4 5-14解題過程Task5Task6Task7Task8Task9Task10Task11Task12Submit user flagSubmit root flag 靶機:Unified Task1 問題:前四個開放端口是哪一個? 22,6789,8080,8443nmap掃一下 T…

解決IDEA配置gitignore不生效

idea gitignore 不生效 原因 之前已經git add 過,之后再設置.gitignore 文件是不會生效的 解決 撤銷 git add 操作,在控制臺輸入命令: git reset重新使用IDEA 提交代碼即可

打包HTML

結合之前的webpack打包 ,對HTML進行相對應的打包 1.在瀏覽器打開npm搜索 html—webpack—插件 2.下劃找到lnstall復制webpack5里的第一句到終端 3.下滑找到用法配置腳本語言 3.1 復制下圖代碼到之前的webpack.config.js腳本里放在開頭的位置 3.2 復制下圖代碼到之…

pandas 使用方法(1)

目錄 1. excel 表格處理 (1) 讀取excel 表格 (2) 抽取excel表部分列數據 (3) 保存數據到excel表格 (4) 保存到 excel 表中的不同sheet 2. 判斷二維數組中的某個數值是否為空 3. 刪除二維數組中的空行 4. 在列表中添加某列屬性 本文是將使用pandas過程中遇到的問題進行了…

功率器件是什么

功率器件 電子元器件百科 文章目錄 功率器件前言一、功率器件是什么二、功率器件的類別三、功率器件的應用實例四、功率器件作用原理總結前言 功率器件可根據其功率承載能力、工作頻率、開通電阻、速度和效率等參數進行選擇,以滿足不同應用的需求。功率器件的應用領域涉及到電…

【Web】SCU新生賽個人wp及完賽感想

目錄 一些碎碎念: Web Guideline 2048 ezupload hardupload ezphp ezweb ezsql webbuilder tarit tarit_revenge VipDinner simplespi 一些碎碎念: scu新生賽是我全心全力打的第二場比賽,歷時七天,期間不免煎熬&…

孜然地址引導頁V9(帶后臺)

剛剛在瀏覽之前經常訪問的網站的時候我發現他不用那個域名了,然后我見這個頁面好看,就把他干下來了,然后把給他寫了個后臺。另外如果你的子頁面收錄多的話,人家百度訪問你的子頁面會顯示404的,所以為了流量可觀安裝這個…

【算法題】字符串變換最小字符串 * (js)

思路: 將字符按字典排序得到minStr,對比原str 如果 minStr str 則本身就是最小字符串 否則從前往后遍歷str,讓str[i]和minStr[i]對比,如果不同則替換 str[i]為minStr[i],并且這個minStr[i]這個字符要從str中尋找, 如果…

抓取真實瀏覽器設備指紋fingerprint寫入cookie方案

一個關于抓取真實瀏覽器設備指紋寫入cookie方案,用戶訪問頁面獲取到用戶設備生成指紋id,通過js把指紋存入cookie,然后用php進行獲取cookie存的指紋值到后臺。 用途:追蹤用戶設備,防惡意注冊,防惡意采集 瀏…