谷歌Gemini被罵了？讓子彈飛一會兒；如何構建高效RAG系統；Pika是腐朽王朝的顛覆者；AGI將重塑組織架構；對話月之暗面楊植麟

👀日報&周刊合集 | 🎡生產力工具與行業應用大全 | 🧡 點贊關注評論拜托啦！

👀 淘寶 X D.Design 堆友 | 淘寶年終好價節 AIGC 創作大賽

https://d.design/competition/taobao-promotion

淘寶攜手堆友聯合打造了「淘寶年終好價節AIGC品牌共創大賽」。本次比賽以「價格蹦極」為主題，邀請各界AIGC愛好者一同釋放創意的無限潛力。

注意！作品征集和人氣投票都截至12月12日結束！要抓緊啦！

獲獎作品將被制作為淘寶年終好價節品牌官方傳播物料，進行大范圍曝光，并進行獲獎者署名。而且一等獎單人獨攬3萬現金，總獎池10萬💰，獲獎概率賊大 👀

🉑 從王者歸來到被罵作假，Gemini 這跌宕起伏的一天啊……

https://blog.google/technology/ai/google-gemini-ai/#sundar-note

12月6日，谷歌深夜炸場，發布了最新版本的 Gemini 模型，宣傳視頻中的「多模態」能力閃瞎了我們的眼。僅從文章標題「Introducing Gemini: our largest and most capable AI model (Gemini：我們規模最大、能力最強的 AI 模型)」都能感受到谷歌這波的躊躇滿志和萬丈豪情。

簡單來說，谷歌成立 Google DeepMind 就全力押寶 Gemini 大模型，并在本輪發布了針對 Gemini 1.0 的三種優化版本：

Gemini Ultra —規模最大且功能最強大的模型，適用于高度復雜的任務 (目前無法體驗，至少要等到12月13日)

Gemini Pro — 適用于各種任務的最佳模型 (Bard Experiment 版本已經可以體驗，Bard beta 版本還不可以)

Gemini Nano — 端側設備上最高效的模型 (搭載到了 Pixel 8 Pro 智能手機中) ? 官方博客原文(中文版)

社群總結的 Bard 版本切換小竅門：把 Google 賬號系統語言設定為英文，保險起見可以把魔法節點和 Google 賬戶所在地都設為美國，重新進入 Bard（https://bard.google.com）確認左上角已經切換為 Experiment版本

僅僅一天之后，Gemini 的風評急轉直下，從「超越GPT-4」「被OpenAI壓著打了一年后終于王者歸來」到「宣傳視頻被曝作假 ? 鏈接」「中文基準測評遠不如 GPT-4 ? 鏈接」。

個人覺得，目前就對Gemini下判斷為時尚早。官方博文里明確說「它將在 170 多個國家和地區提供英語服務，并且計劃在未來幾個月內擴展不同的模態，并支持新的語言和地區」，也就是對「非英語」任務的支持一般，而且最高性能的 Ultra 版本還沒出來 (演示視頻都是基于 Ultra 版本的)。

讓子彈再飛一會吧。

🉑 devv.ai 是如何構建高效的 RAG 系統的

https://devv.ai

devv.ai 是專門面向開發者的 AI 搜索引擎，目標是替代開發者日常使用 Google / StackOverflow / 文檔等進行查詢的場景，更加快速地處理 coding 過程中的問題。

很多開發者用戶表示，devv.ai 的搜索結果優于 GPT-4，已經設置為默認搜索引擎。devv.ai 開發者 X@Jiayuan 也分享說，產品在一個月時間里收獲了6位數的用戶、日搜索5萬次且每周翻倍，是一次成功的探索。

https://twitter.com/Tisoga/status/1731478506465636749

https://github.com/devv-ai/devv

最近，Jiayuan 在X平臺寫了一條長推，解釋了構建 devv.ai 需要的底層技術。第一篇的主題是「devv.ai 是如何構建高效的 RAG 系統的 🔎」，用通俗易懂且結構化的方式科普了 RAG 的誕生背景和常見的技術解決方案，值得一看~

受限于篇幅，日報將作者分享的核心內容整理如下，推薦去看原文。也推薦 Follow 作者的X賬號和 GitHub 項目更新 (作者說會將本篇及更多內容整理在 GitHub)。

RAG (Retrieval Augmented Generation，檢索增強生成) 系統是為了解決「語言模型無法有效獲得與利用新知識」這一問題而設計的一種架構與技術方案，在最近幾年強大語言模型和訓練計算能力的支持下，終于得以實現和應用。

RAG目的是讓語言模型使用外部知識進行生成。RAG 系統由①語言模型、②模型所需外部知識集合、③當前場景下需要的外部知識這三部分組成。優化 RAG 系統就是分別優化這三個模塊。

語言模型

GPT-3 的出現使得RAG系統變得可用，因為它具有較強的理解和生成能力。第一波基于 RAG + GPT-3 的公司 (Copy AI、Jasper等) 都獲得了非常高的估值 & ARR。

從2023年開始，出現了大量的開源和閉源的基座模型，如 GPT-3.5 / GPT-4 (閉源方案) 和Llama 2 / Mistral (開源方案)，這些模型都可以在上面構建 RAG 系統。

模型所需的外部知識集合

這個模塊主要包括兩個部分：embedding 模型和存儲 embedding vector 的數據庫

前者基本上都使用 OpenAI 的 embedding 模型，后者可選方案包括Pinecone、Zilliz (國內團隊)、Chroma (開源的解決方案)、關系型數據庫上的 pgvector 等

devv.ai 采用的方式：embedding + 傳統的relation db + Elasticsearch，并使用 Rust 構建了整套 knowledge index

更好地召回當前場景下需要的外部知識

作者團隊在 encoding 過程中對原始 knowledge 數據進行了大量處理，以確保在 retrieve 時獲取到結構化的數據，減少后續處理的復雜性，并提高召回準確率

🉑 月之暗面楊植麟：大模型需要新的組織范式，場景摩爾定律能催生 Super App

https://kimi.moonshot.cn/chat/

月之暗面 (Moonshot AI) 是一家神秘且特別的大模型創業公司。公司目前只發布了一款產品——基于千億大模型的 chatbot 產品「Kimi Chat」，并在發布之初就打出了「長文本」「自研閉源」「toC」等清晰的標簽。

創始人楊植麟畢業于 CMU，師從蘋果 AI 負責人 Ruslan Salakhutdinov，曾在 Meta 和 Google Brain 任職，是 Transformer-XL 與 XLNet 等爆款論文的第一作者。

這篇極客公園創始人張鵬與月之暗面創始人楊植麟的對話，質量非常之高，提問和回答都非常有水平！！不同于其他公司的「公關文」，他們在這場直播里深刻討論戰略、組織、產品和人才，討論OpenAI、AGI、AI Native 和 Super-App，也討論人類即將踏上征程的未知遠方。

我們以前善于目標導向，通向有用，但未來把一件事變得有用、普惠的過程中，可能需要一點 moonshot 的精神。你在瞄向一個高位置的東西，不管打不打得中，至少要往宇宙深處走，往星河深處走，我覺得這是讓人興奮的。往往可能是一些興奮的目標，聚集起了真正優秀的人。

我們對問答都做了簡化，方便快速get核心信息。但是強烈推薦你花20分鐘閱讀原文，感受下非常「聰明」的思考方式以及高信息密度的輸出，體會字里行間閃爍的智慧火花。

大模型時代，對組織形態提出了新的要求

Q1: 如何做出投身大模型賽道的決定

A1: 決策邏輯來源于過去幾年對語言模型認知的變化，以及在 Google 觀察到的現象,認識到構建新的組織形式是通往 AGI 的必經之路

大模型時代的創新很難被規劃

Q2: 為什么組織是核心問題

A2: AGI 時代的底層邏輯發生了變化，需要新的組織形式來匹配；在新的時代，非常擅長 AGI 的組織出現是大概率會發生的事情

Q3: 對 OpenAI 的看法

A3: OpenAI 在人才密度、共同愿景和高效聚焦方面做得很好；他自己則更關注如何找到一個系統性的方式去做事情

Q4: 如何定義創新組織：bottom-up 還是 top-down

A4: top-down 框架在大模型中仍然適用，關鍵是讓組織中的小單元高效地完成任務，以實現整體目標

AGI 的技術路徑已經確定，但產品方向仍然有很多未知

Q5: 對 AGI 技術路徑的看法

A5: AGI 的技術路徑已確定，但產品層面仍存在很多不確定性；組織和創新在這個時代尤為重要，只有把組織做好，才有可能在AGI路上取得成功

Q6: 為什么選擇長文本作為專長方向

A6: 長文本是新計算系統的「內存」，具有非常高的價值

閉源路線是為了打造 AGI 時代的 Super App

Q7: 對于開源模型和閉源模型的看法

A7: 開源和閉源在大模型領域是互補關系，Moonshot 選擇閉源是為了專注于打造超級應用，這是核心策略

Q8: 為什么選擇 toC 業務而非 toB

A8: 新的技術變革為 toC 領域帶來了新機會，希望建立一個與AGI目標匹配的業務模式，并實現快速閉環和迭代

Q9: 對AI Native概念的理解

A9: 在 AI Native 的背景下，產品經理需要關注如何通過兩個數據集 (訓練數據和測試數據) 開發產品，以及如何訓練和調試模型

Q10: 是否必須端到端地開發 Super-App

A10: 要實現真正的 Super App，需要端到端地做這件事，這樣可以形成產品的差異化優勢，并且讓模型跟隨應用共同成長

新時代產品經理需要具備的素質：快速迭代

Q11: 當前產品經理的角色變化

A11: 新的產品經理需要在「神性」和系統性之間尋找平衡；在AGI時代，系統可能是主力軍，但仍需要“「神性」的指引

Q12: 團隊招聘產品人的特質

A12: 團隊成員需要具備開放心態、學習能力和快速迭代的特質，團隊希望找到對 AGI、Super-App 和全球市場有激情的人

Q13: 對智能摩爾定律的看法

A13: 認同智能摩爾定律的觀點，但更關注場景摩爾定律；有多少場景被解鎖，以及如何實現指數級上升，這將是下個時代最偉大的公司的關鍵指標

Q14: 硅谷和中國創新者的文化和能力差異

A14: 硅谷工程師文化強調技術和創新，而東方文化強調實用性和商業模式；未來最偉大的公司可能會結合這兩種文化，實現技術和商業的雙重成功 ?
強烈！推薦！完整閱讀原文

👀 從 HeyGen 到 Pika，AI視頻商業化中的生存與生態

AI生成視頻領域最近比較火的兩款應用是 HeyGen 和 Pika。HeyGen靠「Taylor Swift 說中文」「郭德綱說英語」的視頻火爆出圈后，吸引了一大波新用戶并獲得了一筆新的融資。Pika 鋪天蓋地的營銷和被扒出的更多幕后則顯示其「資本寵兒」的身份穩固。

這篇文章的作者 (應該是投資人背景) 從商業化和生態等角度，分析了 HeyGen 和 Pika 面臨的挑戰，以及可能顛覆并重構的新興商業帝國。當我們還在爭論一款AI應用是否好用的時候，已經有人洞察到了未來~ (作者文筆相當凝練，信息密度很好，日報摘錄幾段并推薦閱讀原文)

HeyGen的收入增長能否跟得上它的估值和流量，是決定它未來兩三年資本運作的核心要素。

但即使是需要深度耕耘才可能有收獲的場景，也不得不內防同行，外防大廠。阿里的 Animate Anyone 和字節的 MagicAnimate 都在最近發布，可以很明顯的看到這兩款產品對于直播和短視頻的意義。

由于大廠可以為自己的業務服務而無需考慮短期收益，會將其能覆蓋到的方向迅速內卷。

互聯網從未真正改變影視行業，只是在舊模式中塞入了新的渠道和資本勢力。內容制作與組織結構仍把持在“圈內人”手中，并很快與互聯網新貴沆瀣一氣。而AI視頻，終于讓我們看到了打破影視領域圈子壟斷的可能性。

即使不是Pika，也會是其他視頻生成公司。但凡投資人在人生中對推翻好萊塢霸權有過一點想象，都會理解這項技術代表何種夢想。在這個過程中，落地與否不那么顯眼，因為終點有望得見的巨額金錢。

就如同圖片生成網站往往都伴隨一個發布圖片的社區，未來在Pika上制作的電影、劇集或動畫，必然可以直接在Pika發布。這可能是第一次，影視行業的制作、發行和渠道在同一家公司身上無縫銜接。不需要采購和投資，只要與創作者約定版權收益的分成比例，就可以把源源不斷的內容提供給觀眾 ? 推薦閱讀原文 (賬號的文章都挺不錯)

🉑 從大模型到 Agent 會改變的游戲規則

最近在跟AI創業者和開發者們討論「生成式AI浪潮對公司組織架構的影響」，有很多觀點的交鋒非常有意思。最近討論這個話題的文章也挺多，有幾篇的內容邏輯和深度非常不錯！今天日報推薦兩篇~

我們一起來深度思考下，除了甚囂塵上的「降本增“笑”」「AI讓我丟掉了工作」這些話題之外，AI怎樣深刻地改變了生產力和生產關系，而這又將如何深刻地影響我們每個人未來的命運。

以下是文章完整的邏輯。這位作者的文章質量都很高，就是行文有點…晦澀… 需要集中注意力去理解內在邏輯~ 如果你不關心推導過程想直接看核心內容，從原文中間的「組織力」部分開始看就OK~

智能先要跨過一個個界限，然后才是不同領域的Agent逐步成立，這種界限可以用圖靈測試2.0進行度量。跨過界限之后很可能會對組織方式進行重構。

當組織力的內涵發生變化后，才可能普遍產生10倍的效能，影響一個一個行業。這時候沉淀到組織關系中的，不同行業的各種積累可能就會變為負債，反倒是形成真正的從大模型到Agent的新機會 ? 閱讀原文

🉑 AI或將重塑現代公司組織架構 | 附：重塑的例子

接著上方的討論，我們看看這篇文章更當下、更具體的討論。也就是說，面對洶涌澎湃的生成式AI浪潮，面對一定會發生的組織變革，此時此刻的我們可以做些什么。

要在AI浪潮下重塑組織，可以遵循以下三點原則：

授權團隊尋找自己的使用場景：引入AI并非簡單的IT解決方案，而是像引入一位新團隊成員；每個團隊和個人需根據自身場景找到合適的AI應用方式；激勵機制應鼓勵實驗與溝通，公司文化要擁抱自由思想

擁抱錯誤和不確定性：組織變革需要時間，變革后的組織形態可能固化，因此下一代組織架構需足夠靈活，讓團隊有充分空間迎接新模型

從今天就開始，不斷迭代：采用現有AI功能后，組織需持續優化；將AI應用的測試周期縮短為數天甚至數小時，會對工作方式產生深刻影響；企業在面對指數級變化時，要么反應過早，要么反應過晚

作者自己團隊是如何納入AI幫助做出更加「智能」決策的呢？這是個復雜且反復的過程：

使用AI提供反饋：AI可根據用戶定義的角色提供相當滿意的反饋，作為初步反饋手段

使用AI整理和總結信息：AI可幫助團隊更有效地開會，還能生成產品原型或網頁代碼等使討論更直觀

改變工作流程：即使是使用現有的AI工具，也可以徹底改變整個工作流程，使理論探討更落地

未來的AI想象力：我們可以預見一個AI自主地從產品概念開始創造，直至代碼編寫和部署，幾乎不需要人類干預的世界 ? 閱讀原文