
👀日報&周刊合集 | 🎡生產力工具與行業應用大全 | 🧡 點贊關注評論拜托啦!

👀 淘寶 X D.Design 堆友 | 淘寶年終好價節 AIGC 創作大賽

https://d.design/competition/taobao-promotion
淘寶攜手堆友聯合打造了「淘寶年終好價節AIGC品牌共創大賽」。本次比賽以「價格蹦極」為主題,邀請各界AIGC愛好者一同釋放創意的無限潛力。
注意!作品征集和人氣投票都截至12月12日結束!要抓緊啦!
獲獎作品將被制作為淘寶年終好價節品牌官方傳播物料,進行大范圍曝光,并進行獲獎者署名。而且一等獎單人獨攬3萬現金,總獎池10萬💰,獲獎概率賊大 👀
🉑 從王者歸來到被罵作假,Gemini 這跌宕起伏的一天啊……

https://blog.google/technology/ai/google-gemini-ai/#sundar-note
12月6日,谷歌深夜炸場,發布了最新版本的 Gemini 模型,宣傳視頻中的「多模態」能力閃瞎了我們的眼。僅從文章標題「Introducing Gemini: our largest and most capable AI model (Gemini:我們規模最大、能力最強的 AI 模型)」都能感受到谷歌這波的躊躇滿志和萬丈豪情。
簡單來說,谷歌成立 Google DeepMind 就全力押寶 Gemini 大模型,并在本輪發布了針對 Gemini 1.0 的三種優化版本:
Gemini Ultra —規模最大且功能最強大的模型,適用于高度復雜的任務 (目前無法體驗,至少要等到12月13日)
Gemini Pro — 適用于各種任務的最佳模型 (Bard Experiment 版本已經可以體驗,Bard beta 版本還不可以)
Gemini Nano — 端側設備上最高效的模型 (搭載到了 Pixel 8 Pro 智能手機中) ? 官方博客原文(中文版)
社群總結的 Bard 版本切換小竅門:把 Google 賬號系統語言設定為英文,保險起見可以把魔法節點和 Google 賬戶所在地都設為美國,重新進入 Bard(https://bard.google.com)確認左上角已經切換為 Experiment版本
僅僅一天之后,Gemini 的風評急轉直下,從「超越GPT-4」「被OpenAI壓著打了一年后終于王者歸來」到「宣傳視頻被曝作假 ? 鏈接」「中文基準測評遠不如 GPT-4 ? 鏈接」。
個人覺得,目前就對Gemini下判斷為時尚早。官方博文里明確說「它將在 170 多個國家和地區提供英語服務,并且計劃在未來幾個月內擴展不同的模態,并支持新的語言和地區」,也就是對「非英語」任務的支持一般,而且最高性能的 Ultra 版本還沒出來 (演示視頻都是基于 Ultra 版本的)。
讓子彈再飛一會吧。

🉑 devv.ai 是如何構建高效的 RAG 系統的

https://devv.ai
devv.ai 是專門面向開發者的 AI 搜索引擎,目標是替代開發者日常使用 Google / StackOverflow / 文檔等進行查詢的場景,更加快速地處理 coding 過程中的問題。
很多開發者用戶表示,devv.ai 的搜索結果優于 GPT-4,已經設置為默認搜索引擎。devv.ai 開發者 X@Jiayuan 也分享說,產品在一個月時間里收獲了6位數的用戶、日搜索5萬次且每周翻倍,是一次成功的探索。

https://twitter.com/Tisoga/status/1731478506465636749
https://github.com/devv-ai/devv
最近,Jiayuan 在X平臺寫了一條長推,解釋了構建 devv.ai 需要的底層技術。第一篇的主題是「devv.ai 是如何構建高效的 RAG 系統的 🔎」,用通俗易懂且結構化的方式科普了 RAG 的誕生背景和常見的技術解決方案,值得一看~
受限于篇幅,日報將作者分享的核心內容整理如下,推薦去看原文。也推薦 Follow 作者的X賬號和 GitHub 項目更新 (作者說會將本篇及更多內容整理在 GitHub)。
RAG (Retrieval Augmented Generation,檢索增強生成) 系統是為了解決「語言模型無法有效獲得與利用新知識」這一問題而設計的一種架構與技術方案,在最近幾年強大語言模型和訓練計算能力的支持下,終于得以實現和應用。
RAG目的是讓語言模型使用外部知識進行生成。RAG 系統由①語言模型、②模型所需外部知識集合、③當前場景下需要的外部知識這三部分組成。優化 RAG 系統就是分別優化這三個模塊。
- 語言模型
GPT-3 的出現使得RAG系統變得可用,因為它具有較強的理解和生成能力。第一波基于 RAG + GPT-3 的公司 (Copy AI、Jasper等) 都獲得了非常高的估值 & ARR。
從2023年開始,出現了大量的開源和閉源的基座模型,如 GPT-3.5 / GPT-4 (閉源方案) 和Llama 2 / Mistral (開源方案),這些模型都可以在上面構建 RAG 系統。
- 模型所需的外部知識集合
這個模塊主要包括兩個部分:embedding 模型和存儲 embedding vector 的數據庫
前者基本上都使用 OpenAI 的 embedding 模型,后者可選方案包括Pinecone、Zilliz (國內團隊)、Chroma (開源的解決方案)、關系型數據庫上的 pgvector 等
devv.ai 采用的方式:embedding + 傳統的relation db + Elasticsearch,并使用 Rust 構建了整套 knowledge index
- 更好地召回當前場景下需要的外部知識
- 作者團隊在 encoding 過程中對原始 knowledge 數據進行了大量處理,以確保在 retrieve 時獲取到結構化的數據,減少后續處理的復雜性,并提高召回準確率
🉑 月之暗面楊植麟:大模型需要新的組織范式,場景摩爾定律能催生 Super App

https://kimi.moonshot.cn/chat/
月之暗面 (Moonshot AI) 是一家神秘且特別的大模型創業公司。公司目前只發布了一款產品——基于千億大模型的 chatbot 產品「Kimi Chat」,并在發布之初就打出了「長文本」「自研閉源」「toC」等清晰的標簽。
創始人楊植麟畢業于 CMU,師從蘋果 AI 負責人 Ruslan Salakhutdinov,曾在 Meta 和 Google Brain 任職,是 Transformer-XL 與 XLNet 等爆款論文的第一作者。
這篇極客公園創始人張鵬與月之暗面創始人楊植麟的對話,質量非常之高,提問和回答都非常有水平!!不同于其他公司的「公關文」,他們在這場直播里深刻討論戰略、組織、產品和人才,討論OpenAI、AGI、AI Native 和 Super-App,也討論人類即將踏上征程的未知遠方。
我們以前善于目標導向,通向有用,但未來把一件事變得有用、普惠的過程中,可能需要一點 moonshot 的精神。你在瞄向一個高位置的東西,不管打不打得中,至少要往宇宙深處走,往星河深處走,我覺得這是讓人興奮的。往往可能是一些興奮的目標,聚集起了真正優秀的人。
我們對問答都做了簡化,方便快速get核心信息。但是強烈推薦你花20分鐘閱讀原文,感受下非常「聰明」的思考方式以及高信息密度的輸出,體會字里行間閃爍的智慧火花。
大模型時代,對組織形態提出了新的要求
Q1: 如何做出投身大模型賽道的決定
A1: 決策邏輯來源于過去幾年對語言模型認知的變化,以及在 Google 觀察到的現象,認識到構建新的組織形式是通往 AGI 的必經之路
大模型時代的創新很難被規劃
Q2: 為什么組織是核心問題
A2: AGI 時代的底層邏輯發生了變化,需要新的組織形式來匹配;在新的時代,非常擅長 AGI 的組織出現是大概率會發生的事情
Q3: 對 OpenAI 的看法
A3: OpenAI 在人才密度、共同愿景和高效聚焦方面做得很好;他自己則更關注如何找到一個系統性的方式去做事情
Q4: 如何定義創新組織:bottom-up 還是 top-down
A4: top-down 框架在大模型中仍然適用,關鍵是讓組織中的小單元高效地完成任務,以實現整體目標
AGI 的技術路徑已經確定,但產品方向仍然有很多未知
Q5: 對 AGI 技術路徑的看法
A5: AGI 的技術路徑已確定,但產品層面仍存在很多不確定性;組織和創新在這個時代尤為重要,只有把組織做好,才有可能在AGI路上取得成功
Q6: 為什么選擇長文本作為專長方向
A6: 長文本是新計算系統的「內存」,具有非常高的價值
閉源路線是為了打造 AGI 時代的 Super App
Q7: 對于開源模型和閉源模型的看法
A7: 開源和閉源在大模型領域是互補關系,Moonshot 選擇閉源是為了專注于打造超級應用,這是核心策略
Q8: 為什么選擇 toC 業務而非 toB
A8: 新的技術變革為 toC 領域帶來了新機會,希望建立一個與AGI目標匹配的業務模式,并實現快速閉環和迭代
Q9: 對AI Native概念的理解
A9: 在 AI Native 的背景下,產品經理需要關注如何通過兩個數據集 (訓練數據和測試數據) 開發產品,以及如何訓練和調試模型
Q10: 是否必須端到端地開發 Super-App
A10: 要實現真正的 Super App,需要端到端地做這件事,這樣可以形成產品的差異化優勢,并且讓模型跟隨應用共同成長
新時代產品經理需要具備的素質:快速迭代
Q11: 當前產品經理的角色變化
A11: 新的產品經理需要在「神性」和系統性之間尋找平衡;在AGI時代,系統可能是主力軍,但仍需要“「神性」的指引
Q12: 團隊招聘產品人的特質
A12: 團隊成員需要具備開放心態、學習能力和快速迭代的特質,團隊希望找到對 AGI、Super-App 和全球市場有激情的人
Q13: 對智能摩爾定律的看法
A13: 認同智能摩爾定律的觀點,但更關注場景摩爾定律;有多少場景被解鎖,以及如何實現指數級上升,這將是下個時代最偉大的公司的關鍵指標
Q14: 硅谷和中國創新者的文化和能力差異
A14: 硅谷工程師文化強調技術和創新,而東方文化強調實用性和商業模式;未來最偉大的公司可能會結合這兩種文化,實現技術和商業的雙重成功 ?
強烈!推薦!完整閱讀原文
👀 從 HeyGen 到 Pika,AI視頻商業化中的生存與生態

AI生成視頻領域最近比較火的兩款應用是 HeyGen 和 Pika。HeyGen靠「Taylor Swift 說中文」「郭德綱說英語」的視頻火爆出圈后,吸引了一大波新用戶并獲得了一筆新的融資。Pika 鋪天蓋地的營銷和被扒出的更多幕后則顯示其「資本寵兒」的身份穩固。
這篇文章的作者 (應該是投資人背景) 從商業化和生態等角度,分析了 HeyGen 和 Pika 面臨的挑戰,以及可能顛覆并重構的新興商業帝國。當我們還在爭論一款AI應用是否好用的時候,已經有人洞察到了未來~ (作者文筆相當凝練,信息密度很好,日報摘錄幾段并推薦閱讀原文)
HeyGen的收入增長能否跟得上它的估值和流量,是決定它未來兩三年資本運作的核心要素。
但即使是需要深度耕耘才可能有收獲的場景,也不得不內防同行,外防大廠。阿里的 Animate Anyone 和字節的 MagicAnimate 都在最近發布,可以很明顯的看到這兩款產品對于直播和短視頻的意義。
由于大廠可以為自己的業務服務而無需考慮短期收益,會將其能覆蓋到的方向迅速內卷。
互聯網從未真正改變影視行業,只是在舊模式中塞入了新的渠道和資本勢力。內容制作與組織結構仍把持在“圈內人”手中,并很快與互聯網新貴沆瀣一氣。而AI視頻,終于讓我們看到了打破影視領域圈子壟斷的可能性。
即使不是Pika,也會是其他視頻生成公司。但凡投資人在人生中對推翻好萊塢霸權有過一點想象,都會理解這項技術代表何種夢想。在這個過程中,落地與否不那么顯眼,因為終點有望得見的巨額金錢。
就如同圖片生成網站往往都伴隨一個發布圖片的社區,未來在Pika上制作的電影、劇集或動畫,必然可以直接在Pika發布。這可能是第一次,影視行業的制作、發行和渠道在同一家公司身上無縫銜接。不需要采購和投資,只要與創作者約定版權收益的分成比例,就可以把源源不斷的內容提供給觀眾 ? 推薦閱讀原文 (賬號的文章都挺不錯)

🉑 從大模型到 Agent 會改變的游戲規則

最近在跟AI創業者和開發者們討論「生成式AI浪潮對公司組織架構的影響」,有很多觀點的交鋒非常有意思。最近討論這個話題的文章也挺多,有幾篇的內容邏輯和深度非常不錯!今天日報推薦兩篇~
我們一起來深度思考下,除了甚囂塵上的「降本增“笑”」「AI讓我丟掉了工作」這些話題之外,AI怎樣深刻地改變了生產力和生產關系,而這又將如何深刻地影響我們每個人未來的命運。
以下是文章完整的邏輯。這位作者的文章質量都很高,就是行文有點…晦澀… 需要集中注意力去理解內在邏輯~ 如果你不關心推導過程想直接看核心內容,從原文中間的「組織力」部分開始看就OK~
智能先要跨過一個個界限,然后才是不同領域的Agent逐步成立,這種界限可以用圖靈測試2.0進行度量。跨過界限之后很可能會對組織方式進行重構。
當組織力的內涵發生變化后,才可能普遍產生10倍的效能,影響一個一個行業。這時候沉淀到組織關系中的,不同行業的各種積累可能就會變為負債,反倒是形成真正的從大模型到Agent的新機會 ? 閱讀原文
🉑 AI或將重塑現代公司組織架構 | 附:重塑的例子

接著上方的討論,我們看看這篇文章更當下、更具體的討論。也就是說,面對洶涌澎湃的生成式AI浪潮,面對一定會發生的組織變革,此時此刻的我們可以做些什么。
要在AI浪潮下重塑組織,可以遵循以下三點原則:
授權團隊尋找自己的使用場景:引入AI并非簡單的IT解決方案,而是像引入一位新團隊成員;每個團隊和個人需根據自身場景找到合適的AI應用方式;激勵機制應鼓勵實驗與溝通,公司文化要擁抱自由思想
擁抱錯誤和不確定性:組織變革需要時間,變革后的組織形態可能固化,因此下一代組織架構需足夠靈活,讓團隊有充分空間迎接新模型
從今天就開始,不斷迭代:采用現有AI功能后,組織需持續優化;將AI應用的測試周期縮短為數天甚至數小時,會對工作方式產生深刻影響;企業在面對指數級變化時,要么反應過早,要么反應過晚
作者自己團隊是如何納入AI幫助做出更加「智能」決策的呢?這是個復雜且反復的過程:
使用AI提供反饋:AI可根據用戶定義的角色提供相當滿意的反饋,作為初步反饋手段
使用AI整理和總結信息:AI可幫助團隊更有效地開會,還能生成產品原型或網頁代碼等使討論更直觀
改變工作流程:即使是使用現有的AI工具,也可以徹底改變整個工作流程,使理論探討更落地
未來的AI想象力:我們可以預見一個AI自主地從產品概念開始創造,直至代碼編寫和部署,幾乎不需要人類干預的世界 ? 閱讀原文

👀 ChatGLM: An Alternative to ChatGPT

ShowMeAI知識星球資源編碼:R195
這是 ChatGLM 大模型作者 **@唐杰 老師在 ISWC 2023 大會的演講 keynote,核心內容是 ChatGLM 模型的設計思路、技術創新點和最新進展。
整份報告 60+ 頁,是來自大模型作者第一視角的難得分享,以下是一些頁面截圖,感興趣可以前往星球下載完整報告。

感謝貢獻一手資訊、資料與使用體驗的 ShowMeAI 社區同學們!

? 點擊 👀日報&周刊合集,訂閱話題 #ShowMeAI日報,一覽AI領域發展前沿,抓住最新發展機會!
? 點擊 🎡生產力工具與行業應用大全,一起在信息浪潮里撲騰起來吧!