大模型日報
?
2024-05-29
?
大模型資訊
?
- 大型語言模型在金融預測中將超越人類分析師
?
- 摘要: 新研究表明,大型語言模型如ChatGPT在金融預測方面表現優于人類專家,為交易策略提供了寶貴的見解。這意味著未來這些模型將在金融領域發揮更重要的作用,提升投資決策的準確性和效率。
?
- OpenAI成立新的安全委員會并啟動新模型訓練
?
- 摘要: OpenAI宣布成立由Sam Altman、Bret Taylor、John Schulman等人組成的新的安全委員會,并確認已開始訓練其下一個大型模型。
?
- 華為在埃及啟動云區域并發布阿拉伯語大模型
?
- 摘要: 華為宣布在埃及開羅啟動華為云區域,這一區域將覆蓋非洲的28個國家。同時,華為還發布了新的阿拉伯語大語言模型,進一步增強其在該地區的技術影響力。
?
- 亞馬遜投資40億美元推進生成式AI技術
?
- 摘要: 亞馬遜增加對Anthropic的投資,再次注入27.5億美元,以加強與該大語言模型開發公司的合作,旨在將生成式AI技術推向客戶。
?
- 蘋果推出首個多模態AI模型MM1
?
- 摘要: 蘋果發布了MM1系列多模態模型,能夠處理圖像和文本。這是蘋果在人工智能領域的一項重要進展,展示了其在多模態技術方面的創新能力。
?
- 谷歌Bard超越GPT-4登頂聊天機器人排行榜
?
- 摘要: 谷歌Bard在LMSYS聊天機器人競技場排行榜上憑借其新版本Gemini Pro超越了OpenAI的GPT-4,成為新的冠軍。
?
- 大型語言模型在臨床腫瘤學問題上錯誤率高于人類
?
- 摘要: 一項比較評估測試了五種公開的大型語言模型(LLMs)在2044個腫瘤學問題上的表現,涵蓋了該領域的綜合主題。結果顯示,LLMs的錯誤率高于人類。
?
- 改進AI大語言模型有助于更好地與人腦活動對齊
?
- 摘要: 隨著生成式人工智能(GenAI)近年來改變社交互動格局,改進大語言模型(LLMs)能夠幫助它們更好地與人類腦活動對齊,從而提升其表現和應用效果。
?
- Symflower推出DevQualityEval:提升大語言模型代碼質量的新基準
?
- 摘要: Symflower近日推出了DevQualityEval,這是一種創新的評估基準和框架,旨在提升大語言模型的代碼質量。
?
- IBM與AI新加坡合作開發首個東南亞語境大模型
?
- 摘要: 美國跨國科技公司IBM與AI新加坡簽署諒解備忘錄,合作開發首個具有東南亞語境的大型語言模型。這一合作將推動東南亞地區的人工智能技術進步,滿足本地化需求。
?
大模型產品
?
- Jector AI:電商圖片生成利器
?
- 摘要: Jector AI提供優化的AI環境,輕松生成自定義產品背景,提升AI技能,讓您的產品照片脫穎而出!
?
- ReplyMind: 社交增長助手
?
- 摘要: ReplyMind是一款AI工具,幫助忙碌的專業人士在LinkedIn、X(Twitter)和Product Hunt上以有機方式增長社交影響力。現已推出Chrome擴展和安卓應用。
?
- IKI.AI智能知識助手
?
- 摘要: 保存網頁、PDF、視頻或筆記。助手了解所有知識,提供信息、結構化答案、頭腦風暴等功能,支持網絡搜索。
?
- Marlee: AI提升團隊協作與表現
?
- 摘要: Marlee是一款AI工具,幫助個人和團隊在工作中快速提升協作和表現,提供個性化洞察,輕松連接、激勵和發展。
?
- Frontly:無代碼構建AI驅動的SaaS應用
?
- 摘要: Frontly通過AI生成應用,并提供無代碼拖放界面。快速啟動現代響應布局的AI應用,支持高級操作和自動化平臺同步。
?
- AI Menti Builder: 快速生成互動問卷
?
- 摘要: AI Menti Builder 讓您立即創建互動會議或課堂,快速生成工作坊、講座、調查或測驗的初稿,提升參與度。
?
- StartKit.AI:首款AI SaaS模板
?
- 摘要: StartKit.AI結合10年Node.js、Mongo和Stripe經驗及2年AI研究,提供全面的SaaS模板,助您打造AI初創公司。
?
- Reforge擴展:專家隨時指導
?
- 摘要: Reforge擴展在你工作時提供免費指導,利用頂級專家的知識,通過現有工具提升你的工作質量。
?
- Lawformer AI:打造智能合同庫
?
- 摘要: Lawformer AI助力法律團隊拆解合同,創建個性化條款庫,集中管理內部知識,提升工作效率。
?
- Roadway:增長營銷分析自動化平臺
?
- 摘要: Roadway是首個專為增長營銷團隊打造的分析和自動化平臺,快速創建儀表盤和報告,優化和擴展增長渠道。
?
大模型論文
?
- Matryoshka多模態模型: 高效視覺表征
?
- 摘要: 提出M3模型,通過多層嵌套視覺標記表示圖像內容,提高視覺語言模型的效率與靈活性,顯著減少視覺標記數量。
?
- NV-Embed: 提升LLM嵌入模型性能的新方法
?
- 摘要: NV-Embed通過潛在注意力層和兩階段對比訓練方法,顯著提升LLM嵌入模型在檢索和下游任務中的表現。
?
- Reason3D: 大語言模型實現3D理解與分割
?
- 摘要: Reason3D是一種新型大語言模型,通過點云數據和文本提示,實現3D推理分割、層級搜索、精準引用和問答等高級任務,顯著提升了物體識別與分割的精度。
?
- LARM: 長視距自回歸模型在具身智能中的應用
?
- 摘要: LARM結合文本和多視角圖像輸入,以自回歸方式預測動作。通過兩階段訓練,LARM在Minecraft中實現復雜決策鏈,速度提升6.8倍。
?
- 自糾正多模態大語言模型用于機器人操作
?
- 摘要: 提出了一種自糾正多模態大語言模型(SC-MLLM),能夠預測和糾正機器人的操作錯誤,提高操作準確性。
?
- THREAD: 遞歸動態生成提升LLM性能
?
- 摘要: THREAD通過遞歸動態生成子線程,提升LLM在復雜任務和問答中的表現,顯著超過現有框架。
?
- MindMerger:提升非英語LLM推理能力
?
- 摘要: MindMerger通過融合多語言模型的語言理解能力,顯著提升非英語LLM的推理性能,尤其在低資源語言上表現突出。
?
- ReMoDetect: 獎勵模型識別LLM生成文本
?
- 摘要: 研究發現,通過獎勵模型可有效檢測經過對齊訓練的LLM生成文本,并提出兩種訓練方案提升檢測能力。
?
- RTL-Repo: 大規模RTL設計項目評估基準
?
- 摘要: RTL-Repo 提供了一個基準,用于評估LLMs在大型RTL設計項目中的表現,包含4000多個Verilog代碼樣本。
?
- 動態架構聯邦學習在語音識別中的應用
?
- 摘要: 本文提出使用早退出動態架構的聯邦學習方法,解決異構客戶端在自動語音識別中的計算和通信資源限制問題。
?
大模型開源項目
?
- YOLOv10:實時目標檢測
?
- 摘要: THU-MIG團隊發布YOLOv10,基于Python語言的實時端到端目標檢測系統,顯著提升檢測性能。
?
- 企業級Agentic RAG解決方案
?
- 摘要: ragapp是一個用TypeScript編寫的工具,提供了在企業中使用Agentic RAG的最簡便方法。
?
- Jan: 離線運行的開源ChatGPT替代品
?
- 摘要: Jan是一個完全離線運行的開源ChatGPT替代品,支持多引擎(llama.cpp, TensorRT-LLM),使用TypeScript編寫。
?
- CopilotKit:自定義AI助手框架
?
- 摘要: CopilotKit是一個用TypeScript編寫的框架,用于構建應用內AI聊天機器人、AI代理和AI文本區域。
?
- khoj-ai:你的AI第二大腦
?
- 摘要: khoj-ai提供在線和本地AI模型支持,能回答問題并整合筆記。支持多平臺訪問,可自托管或使用云實例。
?
- iyaja: 自組織文件系統
?
- 摘要: iyaja是一個使用Llama 3的自組織文件系統,采用Jupyter Notebook語言編寫,旨在提高文件管理效率。
?
- 構建具備記憶和工具的AI助手
?
- 摘要: phidatahq項目使用Python語言,旨在構建具備記憶、知識和工具的AI助手,提升AI的實用性與智能水平。
?
- Mozilla-Ocho:單文件分發和運行LLM
?
- 摘要: Mozilla-Ocho項目使用C++編寫,實現了通過單個文件分發和運行大語言模型(LLM)的功能,簡化了模型部署過程。
?
- Dataherald: 自然語言轉SQL工具
?
- 摘要: Dataherald使用大語言模型,讓用戶通過自然語言與SQL數據庫交互,實現自然語言到SQL的轉換。
?
- 多語言模型終端界面工具
?
- 摘要: 一個快速、以鍵盤為中心的終端用戶界面,用于與ChatGPT、Claude等大語言模型互動。用Python編寫。