開發者朋友們大家好:
這里是 「RTE 開發者日報」,每天和大家一起看新聞、聊八卦。我們的社區編輯團隊會整理分享 RTE(Real Time Engagement) 領域內「有話題的新聞」、「有態度的觀點」、「有意思的數據」、「有思考的文章」、「有看點的會議」,但內容僅代表編輯的個人觀點,歡迎大家留言、跟帖、討論。
本期編輯:@CY,@JLT,@鮑勃
01有話題的新聞
1、結合自家多模態 AI 助手「Project Astra」,谷歌 I/O 大會展示 AI+AR 眼鏡原型機
今日凌晨,谷歌召開了其 2024 I/O 大會,本次大會核心圍繞 AI,并展示了 Gemini、AI Overviews、Ask Photos 等新產品或新能力。
在這過程中,谷歌展示了一個結合了自家多模態 AI 助手「Project Astra」的 AR 眼鏡演示視頻片段。據了解,Project Astra 除了擁有常見多模態 AI 大模型的音頻、文本以及視覺處理能力外,它還能記住并且推理它所看到的一切。
谷歌表示,Astra 的工作原理是「連續編碼視頻幀,將視頻和語音輸入組合到事件時間線中,并緩存這些信息以進行有效調用」。(@陀螺科技)
2、OpenAI 聯合創始人兼首席科學家伊利亞·蘇茨克沃將離職
北京時間 5 月 15 日早間,OpenAI 聯合創始人伊利亞·蘇茨凱弗(Ilya Sutskever)在社交媒體平臺上宣布,他將在近十年后離開公司。蘇茨凱弗稱:「我對接下來的事情感到興奮——這是一個對我個人非常有意義的項目,我將在適當的時候分享細節。」
在蘇茨凱弗離職之際,奧特曼在社交媒體上表達了自己的想法。他寫道:「這讓我感到很難過,伊利亞無疑是我們這一代最偉大的人之一,是我們這個領域的一盞指路明燈,也是一位親愛的朋友。他的才華和遠見是眾所周知的,但他的熱情和同情心同樣重要。」與此同時,奧特曼還宣布了雅各布·帕奇科(Jakub Pachocki)為該公司新一任的首席科學家。(@騰訊科技)
3、傳 Meta 正開發內置攝像頭 AI 耳機,可識別物體翻譯外語
5 月 14 日消息,據 The Information 報道,Meta 正在探索開發帶有攝像頭的 AI 耳機,希望這種設備能用來識別物體和翻譯外語。
三位「內部人士」透露,該項目的內部代號為 Camerabuds,目前還不清楚該產品的最終設計會是入耳式耳機還是頭戴式耳機,不過 Meta 的 CEO 扎克伯格已經嘗試過幾種可能的設備設計,但他對這些產品原型都不滿意。內部人士表示,Meta 公司領導層原本預計在今年第一季度正式批準一款原型設計,但許多測試人員發現大量問題,包括長發可能會遮擋耳機上的攝像頭、耳機重量太大、續航太短、發熱影響體驗等。
除了 Meta 外,幾家其他科技公司也在研發 AI 可穿戴設備,包括 Humane 和 Rabbit 在內的幾家初創公司最近也推出了自家「AI 專用設備」,Meta 內部人士表示,包括扎克伯格等 Meta 領導層目前都希望加速 AI 耳機的開發過程,因為他們相信 Meta 的競爭對手也將開發類似的設備。(@搜狐科技)
4、騰訊混元文生圖模型全面開源,包含模型權重、推理代碼、模型算法等完整模型
5 月 14 日,騰訊宣布旗下的混元文生圖大模型全面升級并對外開源,目前已在 Hugging Face 平臺及 Github 上發布,包含模型權重、推理代碼、模型算法等完整模型,可供企業與個人開發者免費商用。該模型支持中英文雙語輸入及理解,參數量 15 億。升級后的混元文生圖大模型采用了與 Sora 一致的 DiT 架構,不僅可支持文生圖,也可作為視頻等多模態視覺生成的基礎。(@ CSDN)
5、字節跳動自研大模型家族即將亮相
火山引擎宣布,字節跳動自研大模型家族將于今日 9:30 舉辦的「2024 春季火山引擎 FORCE 原動力大會」首次亮相。同時,火山引擎大模型服務平臺火山方舟也將迎來重大升級。鳳凰網科技此前曾報道,字節跳動在 AI 方面的布局,主要集中在 Flow 部門。該部門目前的核心產品有:
AI 對話助手豆包( 海外版為 Cici)
對標 GPTs 的 AI bot 開發平臺扣子(海外版為 Coze )
面向二次元群體的話爐
另外,在組建 Flow 部門前,字節跳動還在大模型上部署了代號為「seed」的團隊,專注于模型層的研發。(@愛范兒)
6、蘋果 iOS 18 或將推出廣告屏蔽功能,英國報紙集團與新聞媒體協會對其發出警告
據外媒報道,蘋果正準備在 iOS 18 軟件更新中為 Safari 瀏覽器加入一個基于 AI 的隱私功能,該功能可以刪除廣告或其他不需要的網站內容。對此英國報紙集團警告蘋果公司,推出任何屏蔽廣告的「網絡橡皮擦「(web eraser)工具,都將使新聞業的財務面臨可持續性風險。
NMA(News Media Association、英國新聞媒體協會)向蘋果英國政府事務主管表示,這個功能將影響新聞媒體行業在網絡上的收入,新聞媒體行業需要資金來運行,而廣告是他們的主要收入來源。編輯們則擔心 AI 工具會選擇性更改或刪除文章內容,改變文章原意。目前一些新聞媒體已經在其網頁上增加了對廣告攔截插件的檢測,若檢測到廣告攔截插件,會要求用戶將其關閉,否則將不允許用戶繼續瀏覽。(@IT 之家)
02有態度的觀點
1、朱嘯虎評 GPT-4o:稱大模型技術迭代曲線明顯放緩
金沙江創業投資基金主管合伙人朱嘯虎點評 GPT-4o,他認為:
1.大模型的技術迭代曲線明顯放緩。
2.開始卷免費,說明 GPT 的用戶和收入增長都已經碰到瓶頸,不是深度綁定大廠的模型公司基本已經出局。
3.應用會迅速爆發,推理成本再降一個數量級就會普及出現 AI 時代的國民應用。
寫在最后:
我們歡迎更多的小伙伴參與「RTE 開發者日報」內容的共創,感興趣的朋友請通過開發者社區或公眾號留言聯系,記得報暗號「共創」。
對于任何反饋(包括但不限于內容上、形式上)我們不勝感激、并有小驚喜回饋,例如你希望從日報中看到哪些內容;自己推薦的信源、話題、活動等;或者列舉幾個你喜歡看、平時常看的內容渠道;內容排版或呈現形式上有哪些可以改進的地方等。
素材來源官方媒體/網絡新聞