AI大模型日報#0626：首款大模型芯片挑戰英偉達、面壁智能李大海專訪、大模型測試題爆火LeCun點贊

導讀：AI大模型日報，爬蟲+LLM自動生成，一文覽盡每日AI大模型要點資訊！

目前采用“文心一言”（ERNIE-4.0-8K-latest）生成了今日要點以及每條資訊的摘要。歡迎閱讀！

《AI大模型日報》今日要點：今日AI大模型領域的資訊涵蓋了多個方面，從企業級應用到技術創新均有涉及。OpenAI平臺主管的訪談聚焦于如何服務企業級金融，而字節跳動發布的Seed-TTS語音合成大模型則展現了語音生成技術的最新進展，能夠生成與真人幾乎一樣的語音。在視覺生成方面，曠視科技開源的AI人像視頻生成框架MegActor通過輸入靜態肖像圖片即可生成表情豐富的視頻。商湯絕影大模型與吉利集團子品牌翼真汽車的合作，則標志著AI大模型在智能座艙體驗方面的新應用。同時，在AI生成內容版權問題上，陳丹琦團隊的研究提出了避免生成版權角色的策略。在硬件方面，Etched公司推出的首款大模型專用ASIC芯片Sohu，挑戰了英偉達的市場地位。而新的大模型Benchmark的推出，則引發了對GPT-4等頂尖大模型推理能力的討論。此外在生命科學領域，全新蛋白質大模型ESM3和清華大學團隊發布的細胞大模型scFoundation，均體現了AI在模擬生物進化和細胞研究中的應用潛力。最后，面壁智能CEO李大海分享了對端側模型的看法，強調了其在AI落地中的現實意義。這些進展共同展示了AI大模型在技術創新和應用拓展方面的活力。

標題: OpenAI如何服務企業級金融 | OpenAI平臺主管1.5萬字訪談（全文+視頻）
摘要:?這個鏈接可能存在安全風險，為了保護您的設備和數據安全，請避免訪問此鏈接。
網址:?OpenAI如何服務企業級金融 | OpenAI平臺主管1.5萬字訪談（全文+視頻）|aws|openai|人工智能|企業級金融|初創公司|大模型|谷歌_手機網易網
?
標題: 耳朵沒錯，是聲音太真了，字節豆包語音合成成果Seed-TTS技術揭秘

摘要:?Seed-TTS是字節跳動豆包大模型團隊發布的語音生成大模型，能生成與真人幾乎一樣的語音，包括發音瑕疵，且能模仿人類說話。它可以根據文本生成全新語音，并帶上原素材的聲音特征，實現音色定制，甚至可以根據小說情節和不同角色特質，呈現對應人物和情緒的“說書”。該模型已在C端產品上線，并獲得用戶好評。技術亮點包括細節建模、高自然度和穩定性、數據覆蓋量級大、模型設計等，研究價值在于試圖回答過去未解決的問題，如語音建模的適合性、語音表征設計等。此外，Seed-TTS同時提供了基于語言模型和擴散模型的兩種技術方案。
網址:?耳朵沒錯，是聲音太真了，字節豆包語音合成成果Seed-TTS技術揭秘 | 機器之心
?
標題: 曠視開源的AI人像視頻生成太炸了！輸入照片即可模仿任意表情包
?

摘要:?曠視科技發布了新的開源AI人像視頻生成框架MegActor，只需輸入靜態肖像圖片和視頻文件，即可生成表情豐富、動作一致的AI人像視頻。MegActor采用原始視頻驅動方式，能夠捕捉細致表情和運動信息，生成更加保真且動作一致的視頻。該框架通過條件擴散模型、前景背景分割等技術解決了ID泄露和背景干擾問題。MegActor支持不同驅動視頻和畫風，訓練數據全部來自公開可獲取的開源數據集。目前，MegActor已完全開源，供開發者和用戶使用。
網址:?曠視開源的AI人像視頻生成太炸了！輸入照片即可模仿任意表情包 | 機器之心
?
標題: 當AGI遇見「陸地空客」，商湯絕影大模型上車LEVC
?

摘要:?6月25日，吉利集團子品牌翼真汽車（LEVC）首款豪華純電MPV翼真L380在浙江烏鎮發布，被譽為“陸地空客”。該車依托AI大模型，提供創新的智能座艙體驗，由中國智能座艙領軍企業商湯絕影與LEVC聯手打造。商湯“日日新5.0”大模型在多項評測中超越GPT-4，為翼真L380提供“AI閑聊”、“美圖壁紙”和“童話繪本”等解決方案，將為用戶帶來全新智慧出行體驗。此次上市標志著商湯“日日新5.0”首次正式量產上車，為百年英國高端汽車品牌注入通用人工智能（AGI）新活力。
網址:?當AGI遇見「陸地空客」，商湯絕影大模型上車LEVC | 機器之心
?
標題: 陳丹琦團隊新作：教你避免成為任天堂的被告
?

摘要:?陳丹琦團隊發布新研究，教如何避免AI生成版權角色。研究構建評估套件，包含50個流行版權角色，發現模型易生成版權角色，且間接錨定也可能觸發版權內容生成。團隊探討幾種策略，發現結合提示重寫和負面提示最能減少版權角色生成風險，同時保持用戶意圖一致性。研究者提醒用戶和模型部署者需警惕間接錨定，建議結合使用負面提示等技術。該研究由普林斯頓等多所大學共同完成，論文已發布。
網址:?陳丹琦團隊新作：教你避免成為任天堂的被告 | 量子位
?
標題: 一張頂20張H100！首款大模型專用芯片挑戰英偉達，哈佛輟學華人創辦
?

摘要:?科技初創公司Etched推出首款大模型專用ASIC芯片Sohu，該芯片專門針對Transformer算法進行優化，實現每秒處理50萬個tokens的高吞吐量，性能超越英偉達H100達20倍，且成本更低。Etched由兩位哈佛輟學生創辦，已完成1.2億美元A輪融資，Peter Thiel等知名投資人參與。Sohu芯片的推出可能改變AI推理領域的競爭格局，盡管有質疑聲音認為專用芯片可能面臨架構過時的風險，但Etched團隊認為專用化是提升性能和效率的關鍵。業界對此充滿關注與討論。
網址:?一張頂20張H100！首款大模型專用芯片挑戰英偉達，哈佛輟學華人創辦 | 量子位
?
標題: 大模型測試題爆火，GPT-4和Claude3都跪了，LeCun轉發：新Benchmark
摘要:?科技新聞要點： 1. 新的大模型Benchmark在推特上引起熱議，LeCun也轉發并點贊。 2. GPT-4和Claude 3等頂尖大模型在面對邏輯學中的“動物過河”問題時均未能給出正確答案。 3. 網友定義新名詞“劣效比率”來衡量模型表現，但更多是一種玩笑，不太能比較出模型能力。 4. 針對此Benchmark，12款國產大模型如文心一言、通義千問等也進行了測試，結果全軍覆沒。 5. 測試顯示，大模型在推理能力方面仍有不足，且訓練數據對模型輸出有顯著影響。 6. 模型未能仔細讀題，導致無法識別問題中的變化，進一步證實了訓練數據與輸出的關系分析。
網址:?大模型測試題爆火，GPT-4和Claude3都跪了，LeCun轉發：新Benchmark | 量子位
?
標題: 模擬5億年自然進化史，全新蛋白質大模型ESM3誕生！前Meta老將力作LeCun轉贊
?

摘要:?繼AlphaFold 3更新后，生命科學領域又迎來大模型ESM3。該模型由Evolutionary Scale AI初創公司開發，專注于蛋白質序列、結構和功能的推理，具有多模態能力，在27.8億個蛋白質上訓練，能模擬進化過程。ESM3已開源，并與AWS和英偉達合作，但模型權重尚未在HuggingFace公開。該模型訓練參數達98B，使用了Andromeda集群。ESM3通過掩碼語言模型訓練，能實現「全對全」預測，有助于設計新蛋白質。其能力隨規模增加涌現，可自我改進并與實驗結果對齊。ESM3的開發是生物學可編程化的重要一步，旨在模擬5億年的進化。
網址:?模擬5億年自然進化史，全新蛋白質大模型ESM3誕生！前Meta老將力作LeCun轉贊|訓練_新浪新聞
?
標題: 1億參數的細胞大模型來了！登Nature子刊，清華大學團隊發布scFoundation：對2萬基因同時建模
?

摘要:?近年來，大規模預訓練模型在人工智能領域掀起新浪潮，通過從海量數據中提取深層規律，服務于不同領域的多樣化任務。在生命科學領域，基于細胞的“語言”開發人工智能細胞大模型，有望為生命科學和醫學提供全新的研究工具。然而，訓練大規模單細胞數據面臨諸多挑戰，如數據庫缺失、處理難度大等。清華大學張學工教授、馬劍竹教授和百圖生科宋樂博士合作研究，于2024年6月發表題為“Large-scale foundation model on single-cell transcriptomics”的論文，介紹了名為scFoundation的細胞大模型。該模型基于5千萬個細胞的基因表達數據訓練，能同時處理約2萬個基因，采用非對稱設計減少計算和內存挑戰，為基因網絡推斷和轉錄因子識別提供了新的研究思路。此外，該模型在細胞測序深度增強、藥物響應預測等任務中表現出卓越性能，提供了人工智能在單細胞研究中的新范式。研究人員還構建了全面的單細胞數據集，并設計了一種名為RDA的預訓練任務，考慮了測序深度的高方差。該模型有望為生命科學和醫學研究提供強大的新工具。
網址:?1億參數的細胞大模型來了！登Nature子刊，清華大學團隊發布scFoundation：對2萬基因同時建模 - 智源社區
?
標題: 對話面壁智能李大海：離用戶更近的端側模型，才是 AI 落地更現實的途徑
?

摘要:?科技記者提煉要點： 2026年，面壁智能計劃推出達到GPT-4水平的端側模型，基于獨特理解的Scaling Law，在8B模型上已實現多模態能力。在Google和Apple推出端側模型后，該領域變得熱門。面壁智能CEO李大海認為，端側模型因離用戶更近而更具現實意義。在AGI Playground 2024上，李大海分享了心路歷程和對端側模型的看法，強調了效率、隱私和環境互動的重要性。他相信，端側模型將像私人管家一樣，成為用戶信任的伙伴。
網址:?對話面壁智能李大海：離用戶更近的端側模型，才是 AI 落地更現實的途徑 | 極客公園
?