導讀:AI大模型日報,爬蟲+LLM自動生成,一文覽盡每日AI大模型要點資訊!
目前采用“文心一言”(ERNIE-4.0-8K-latest)生成了今日要點以及每條資訊的摘要。歡迎閱讀!
《AI大模型日報》今日要點:今日AI大模型領域的資訊涵蓋了多個方面,從企業級應用到技術創新均有涉及。OpenAI平臺主管的訪談聚焦于如何服務企業級金融,而字節跳動發布的Seed-TTS語音合成大模型則展現了語音生成技術的最新進展,能夠生成與真人幾乎一樣的語音。在視覺生成方面,曠視科技開源的AI人像視頻生成框架MegActor通過輸入靜態肖像圖片即可生成表情豐富的視頻。商湯絕影大模型與吉利集團子品牌翼真汽車的合作,則標志著AI大模型在智能座艙體驗方面的新應用。 同時,在AI生成內容版權問題上,陳丹琦團隊的研究提出了避免生成版權角色的策略。在硬件方面,Etched公司推出的首款大模型專用ASIC芯片Sohu,挑戰了英偉達的市場地位。而新的大模型Benchmark的推出,則引發了對GPT-4等頂尖大模型推理能力的討論。此外在生命科學領域,全新蛋白質大模型ESM3和清華大學團隊發布的細胞大模型scFoundation,均體現了AI在模擬生物進化和細胞研究中的應用潛力。最后,面壁智能CEO李大海分享了對端側模型的看法,強調了其在AI落地中的現實意義。這些進展共同展示了AI大模型在技術創新和應用拓展方面的活力。
標題: OpenAI如何服務企業級金融 | OpenAI平臺主管1.5萬字訪談 (全文+視頻)
摘要:?這個鏈接可能存在安全風險,為了保護您的設備和數據安全,請避免訪問此鏈接。
網址:?OpenAI如何服務企業級金融 | OpenAI平臺主管1.5萬字訪談 (全文+視頻)|aws|openai|人工智能|企業級金融|初創公司|大模型|谷歌_手機網易網
?
標題: 耳朵沒錯,是聲音太真了,字節豆包語音合成成果Seed-TTS技術揭秘
摘要:?Seed-TTS是字節跳動豆包大模型團隊發布的語音生成大模型,能生成與真人幾乎一樣的語音,包括發音瑕疵,且能模仿人類說話。它可以根據文本生成全新語音,并帶上原素材的聲音特征,實現音色定制,甚至可以根據小說情節和不同角色特質,呈現對應人物和情緒的“說書”。該模型已在C端產品上線,并獲得用戶好評。技術亮點包括細節建模、高自然度和穩定性、數據覆蓋量級大、模型設計等,研究價值在于試圖回答過去未解決的問題,如語音建模的適合性、語音表征設計等。此外,Seed-TTS同時提供了基于語言模型和擴散模型的兩種技術方案。
網址:?耳朵沒錯,是聲音太真了,字節豆包語音合成成果Seed-TTS技術揭秘 | 機器之心
?
標題: 曠視開源的AI人像視頻生成太炸了!輸入照片即可模仿任意表情包
?
摘要:?曠視科技發布了新的開源AI人像視頻生成框架MegActor,只需輸入靜態肖像圖片和視頻文件,即可生成表情豐富、動作一致的AI人像視頻。MegActor采用原始視頻驅動方式,能夠捕捉細致表情和運動信息,生成更加保真且動作一致的視頻。該框架通過條件擴散模型、前景背景分割等技術解決了ID泄露和背景干擾問題。MegActor支持不同驅動視頻和畫風,訓練數據全部來自公開可獲取的開源數據集。目前,MegActor已完全開源,供開發者和用戶使用。
網址:?曠視開源的AI人像視頻生成太炸了!輸入照片即可模仿任意表情包 | 機器之心
?
標題: 當AGI遇見「陸地空客」,商湯絕影大模型上車LEVC
?
摘要:?6月25日,吉利集團子品牌翼真汽車(LEVC)首款豪華純電MPV翼真L380在浙江烏鎮發布,被譽為“陸地空客”。該車依托AI大模型,提供創新的智能座艙體驗,由中國智能座艙領軍企業商湯絕影與LEVC聯手打造。商湯“日日新5.0”大模型在多項評測中超越GPT-4,為翼真L380提供“AI閑聊”、“美圖壁紙”和“童話繪本”等解決方案,將為用戶帶來全新智慧出行體驗。此次上市標志著商湯“日日新5.0”首次正式量產上車,為百年英國高端汽車品牌注入通用人工智能(AGI)新活力。
網址:?當AGI遇見「陸地空客」,商湯絕影大模型上車LEVC | 機器之心
?
標題: 陳丹琦團隊新作:教你避免成為任天堂的被告
?
摘要:?陳丹琦團隊發布新研究,教如何避免AI生成版權角色。研究構建評估套件,包含50個流行版權角色,發現模型易生成版權角色,且間接錨定也可能觸發版權內容生成。團隊探討幾種策略,發現結合提示重寫和負面提示最能減少版權角色生成風險,同時保持用戶意圖一致性。研究者提醒用戶和模型部署者需警惕間接錨定,建議結合使用負面提示等技術。該研究由普林斯頓等多所大學共同完成,論文已發布。
網址:?陳丹琦團隊新作:教你避免成為任天堂的被告 | 量子位
?
標題: 一張頂20張H100!首款大模型專用芯片挑戰英偉達,哈佛輟學華人創辦
?
摘要:?科技初創公司Etched推出首款大模型專用ASIC芯片Sohu,該芯片專門針對Transformer算法進行優化,實現每秒處理50萬個tokens的高吞吐量,性能超越英偉達H100達20倍,且成本更低。Etched由兩位哈佛輟學生創辦,已完成1.2億美元A輪融資,Peter Thiel等知名投資人參與。Sohu芯片的推出可能改變AI推理領域的競爭格局,盡管有質疑聲音認為專用芯片可能面臨架構過時的風險,但Etched團隊認為專用化是提升性能和效率的關鍵。業界對此充滿關注與討論。
網址:?一張頂20張H100!首款大模型專用芯片挑戰英偉達,哈佛輟學華人創辦 | 量子位
?
標題: 大模型測試題爆火,GPT-4和Claude3都跪了,LeCun轉發:新Benchmark
摘要:?科技新聞要點: 1. 新的大模型Benchmark在推特上引起熱議,LeCun也轉發并點贊。 2. GPT-4和Claude 3等頂尖大模型在面對邏輯學中的“動物過河”問題時均未能給出正確答案。 3. 網友定義新名詞“劣效比率”來衡量模型表現,但更多是一種玩笑,不太能比較出模型能力。 4. 針對此Benchmark,12款國產大模型如文心一言、通義千問等也進行了測試,結果全軍覆沒。 5. 測試顯示,大模型在推理能力方面仍有不足,且訓練數據對模型輸出有顯著影響。 6. 模型未能仔細讀題,導致無法識別問題中的變化,進一步證實了訓練數據與輸出的關系分析。
網址:?大模型測試題爆火,GPT-4和Claude3都跪了,LeCun轉發:新Benchmark | 量子位
?
標題: 模擬5億年自然進化史,全新蛋白質大模型ESM3誕生!前Meta老將力作LeCun轉贊
?
摘要:?繼AlphaFold 3更新后,生命科學領域又迎來大模型ESM3。該模型由Evolutionary Scale AI初創公司開發,專注于蛋白質序列、結構和功能的推理,具有多模態能力,在27.8億個蛋白質上訓練,能模擬進化過程。ESM3已開源,并與AWS和英偉達合作,但模型權重尚未在HuggingFace公開。該模型訓練參數達98B,使用了Andromeda集群。ESM3通過掩碼語言模型訓練,能實現「全對全」預測,有助于設計新蛋白質。其能力隨規模增加涌現,可自我改進并與實驗結果對齊。ESM3的開發是生物學可編程化的重要一步,旨在模擬5億年的進化。
網址:?模擬5億年自然進化史,全新蛋白質大模型ESM3誕生!前Meta老將力作LeCun轉贊|訓練_新浪新聞
?
標題: 1億參數的細胞大模型來了!登Nature子刊,清華大學團隊發布scFoundation:對2萬基因同時建模
?
摘要:?近年來,大規模預訓練模型在人工智能領域掀起新浪潮,通過從海量數據中提取深層規律,服務于不同領域的多樣化任務。在生命科學領域,基于細胞的“語言”開發人工智能細胞大模型,有望為生命科學和醫學提供全新的研究工具。然而,訓練大規模單細胞數據面臨諸多挑戰,如數據庫缺失、處理難度大等。清華大學張學工教授、馬劍竹教授和百圖生科宋樂博士合作研究,于2024年6月發表題為“Large-scale foundation model on single-cell transcriptomics”的論文,介紹了名為scFoundation的細胞大模型。該模型基于5千萬個細胞的基因表達數據訓練,能同時處理約2萬個基因,采用非對稱設計減少計算和內存挑戰,為基因網絡推斷和轉錄因子識別提供了新的研究思路。此外,該模型在細胞測序深度增強、藥物響應預測等任務中表現出卓越性能,提供了人工智能在單細胞研究中的新范式。研究人員還構建了全面的單細胞數據集,并設計了一種名為RDA的預訓練任務,考慮了測序深度的高方差。該模型有望為生命科學和醫學研究提供強大的新工具。
網址:?1億參數的細胞大模型來了!登Nature子刊,清華大學團隊發布scFoundation:對2萬基因同時建模 - 智源社區
?
標題: 對話面壁智能李大海:離用戶更近的端側模型,才是 AI 落地更現實的途徑
?
摘要:?科技記者提煉要點: 2026年,面壁智能計劃推出達到GPT-4水平的端側模型,基于獨特理解的Scaling Law,在8B模型上已實現多模態能力。在Google和Apple推出端側模型后,該領域變得熱門。面壁智能CEO李大海認為,端側模型因離用戶更近而更具現實意義。在AGI Playground 2024上,李大海分享了心路歷程和對端側模型的看法,強調了效率、隱私和環境互動的重要性。他相信,端側模型將像私人管家一樣,成為用戶信任的伙伴。
網址:?對話面壁智能李大海:離用戶更近的端側模型,才是 AI 落地更現實的途徑 | 極客公園
?