大模型日報
?
2024-05-23
?
大模型資訊
?
- 減少生成型AI和大型語言模型中的幻覺現象
?
- 摘要: Phocuswright即將發布全面報告《從流行詞到實際效益:跟上旅游業中生成型AI的步伐》。該報告預覽指出,降低生成型人工智能及大型語言模型在生成內容時出現的幻覺現象是行業關注的焦點。此舉旨在提高模型的可靠性和實用性,進一步促進AI技術在旅游領域的應用。
?
- 研究發現頂級語言模型的安全保護措施易于被繞過
?
- 摘要: 最新研究揭露,即便是目前公開可用的最大的語言模型(LLMs)中的安全保護措施也能被輕易繞過。該研究表明,現有的一些機制在防止模型被濫用方面存在缺陷,可能對確保人工智能的安全和可靠性構成挑戰。
?
- 減輕大型語言模型幻覺的新方法
?
- 摘要: 大型語言模型(LLMs)是基于人工神經網絡的架構,能夠處理、生成和操縱各種文本。近期,研究人員發現了一種新方法,可以有效減輕這些模型在處理信息時產生的幻覺問題,提高了模型的準確性和可靠性。
?
- 人工智能公司Anthropic揭秘大型語言模型內部機制
?
- 摘要: 近期,人工智能公司Anthropic的研究人員宣稱他們已經找到了大型語言模型內部運作的線索。這一發現可能有助于科學家和工程師更好地理解這些被稱為“黑盒”的復雜系統,進而提升人工智能的透明度和可解釋性。
?
- Anthropic破解AI黑盒之謎
?
- 摘要: 人工智能的神經網絡工作原理在很大程度上對于創造者來說都是個謎。然而,Anthropic的研究人員已經找到了一種方法來探查這些黑盒系統的內部運作。他們的發現可能有助于提高人工智能的透明度和可解釋性。
?
- 華為推出阿拉伯語大型語言模型及埃及首個公共云服務
?
- 摘要: 華為技術有限公司發布了一個阿拉伯語的大型語言模型,并在開羅啟動了埃及首個公共云服務。這是華為在推動生成式人工智能技術方面邁出的重要一步,旨在探索并抓住新的商業機會。
?
- 研究發現:AI模型在理解心智方面挑戰人類但難以把握微妙之處
?
- 摘要: 最新發表在《自然·人類行為》雜志的研究比較了大型語言模型與人類在理論心智能力上的表現。結果顯示,盡管AI在某些方面能與人類相媲美,但在理解情感的微妙差別和復雜社交互動方面仍存在挑戰。
?
- 馬里蘭大學研究者開發自動文本隱私保護框架
?
- 摘要: 馬里蘭大學的研究者們提出了一種新的自動文本隱私保護框架,該框架通過強化學習對大型語言模型進行微調。這一框架旨在提高文本數據的隱私性,防止敏感信息泄露,同時保持文本的可用性和信息的完整性。
?
- 亞馬遜AWS AI實驗室推出SpeechVerse:音頻AI的通用性探索
?
- 摘要: 亞馬遜AWS AI實驗室最新研發的SpeechVerse展示了其在音頻AI領域的突破。這項技術基于大型語言模型(LLMs),在各種自然語言處理任務中表現出色,并展現了強大的理解和執行能力。SpeechVerse旨在進一步拓展語音技術的應用范圍,提升機器對語音的理解和響應能力。
?
- 小型語言模型崛起:小而強大的替代選擇
?
- 摘要: 小型語言模型(SLMs)正在成為大型語言模型(LLMs)的有力競爭者。與龐大的LLMs相比,SLMs在多方面展現出優勢,包括更低的計算成本、更高的效率和靈活性等,逐漸受到業界的關注和青睞。
?
大模型產品
?
- Narrato AI批量內容生成器
?
- 摘要: Narrato AI能在幾分鐘內批量生成數百至數千篇內容。適用于產品描述、社交媒體帖子、廣告文案、登陸頁面、博客文章、電子郵件等,支持預設和自定義AI模板。
?
- Ivee:B2B領域影響者營銷平臺
?
- 摘要: Ivee平臺專注于B2B影響者營銷,能夠通過AI搜索引擎在LinkedIn、YouTube、Substack及Apple Podcast上識別和評估意見領袖,提供獨特的KPI進行受眾洞察,并實現大規模的影響者合作與接洽。
?
- Octoverse:構建高效AI應用代理
?
- 摘要: Octoverse允許開發者在應用中集成AI代理,這些代理能夠理解并完成用戶任務,適用于購物、旅行預訂、視頻流媒體及會議應用等場景,其基礎模型在功能調用上超越了GPT-4o。
?
- Findr 2.0:工作智能搜索助手
?
- 摘要: Findr 2.0是一款AI助手,能夠回答問題、查找信息、撰寫文檔。它通過整合Slack、Notion、Gmail等應用信息,提供即時相關答案,提升工作效率。
?
- Copilot+ PC:超快AI智能新窗口PC
?
- 摘要: Copilot+ PC定義了Windows PC的新極限。搭載高達40+ TOPS的強勁芯片,全天候電池續航,支持最先進的AI模型,讓你的PC使用體驗超越以往。
?
- Neolocus:AI室內設計師
?
- 摘要: Neolocus是您的個人AI室內設計師,幫您設計和布置空間。只需上傳房間照片,即可立即開始設計!
?
- CANVID:AI驅動屏幕錄制工具
?
- 摘要: CANVID for Windows,一款新一代AI屏幕錄制軟件。不僅能捕捉屏幕動態,還能自動優化畫面,如平滑鼠標移動、自動變焦和運動模糊效果,提供高質量的演示、教程和宣傳視頻制作體驗。
?
- Nowadays:智能企業活動策劃助手
?
- 摘要: Nowadays是一款智能助手,專為策劃企業活動而設計。用戶只需輸入活動細節,AI即可自動聯系場地并處理談判等繁瑣工作,大幅簡化活動組織流程。
?
- Tactiq Spaces: 會議知識庫構建
?
- 摘要: Tactiq Spaces允許團隊從會議記錄中構建知識庫。用戶可將記錄分享到不同的項目空間,邀請團隊成員協作添加會議內容,并利用AI技術從會議或空間中生成洞察,確保團隊信息同步。
?
- 垂直洞察:精準定位ICP,優化GTM策略
?
- 摘要: 垂直洞察提供快速ICP識別工具,借助AI技術幫助企業節省時間,降低成本,聚焦理想客戶。旨在最大化收入,縮短銷售周期,并減少客戶流失,迅速鎖定產品市場契合度。
?
大模型論文
?
- 跨層注意力減少變壓器KV緩存
?
- 摘要: 本文提出了跨層注意力(CLA)設計,通過在相鄰層間共享鍵值(KV)頭,進一步減少變壓器模型的KV緩存大小,同時保持了與多查詢注意力(MQA)相近的準確度,有效提升了大規模語言模型的解碼效率。
?
- BiomedParse: 全面生物醫學圖像解析
?
- 摘要: BiomedParse是一種生物醫學基礎模型,能夠跨9種成像模式對82種對象進行分割、檢測和識別,通過聯合學習提高各項任務的準確性,大幅優化生物醫學圖像分析。
?
- 能量等級對齊:化學空間搜索
?
- 摘要: 本文提出了一種名為能量等級對齊(ERA)的算法,利用顯式獎勵函數來優化自回歸策略,實現了高效的化學分子搜索,并且在小規模偏好觀測下表現優異。
?
- 基于熵優化的激活函數搜索方法
?
- 摘要: 本文提出了一種基于信息熵理論的激活函數優化方法(EAFO),通過這種方法衍生出改進的ReLU激活函數CRReLU,并在多個數據集上驗證了其優越性。
?
- 推理聚合:增強大型語言模型答案選擇
?
- 摘要: 本文提出了一個層次化的推理聚合框架AoR,通過評估推理鏈來選擇答案,并根據任務復雜性動態調整推理鏈數量。實驗表明,AoR在復雜推理任務上優于現有集成方法,并提升了性能上限。
?
- 多利益相關者決策:LLMs的SKIG框架
?
- 摘要: 本文提出了Skin-in-the-Game(SKIG)框架,旨在通過考慮多方利益相關者視角來增強大型語言模型(LLMs)在道德推理和倫理決策領域的表現。研究通過責任模擬、共情練習和風險評估驗證了SKIG在多個道德推理基準上的效果。
?
- 混合語言情感與仇恨言論預測
?
- 摘要: 研究了混合語言文本中的情感分析和仇恨言論檢測。創建了針對英語-印地語和英語-斯洛文尼亞語的雙語預訓練語言模型,并對比了多種語言模型在社交媒體文本中的表現。
?
- 高效軟件評審預測模型研究
?
- 摘要: 本文提出了軟件分析中的新挑戰問題,即如何利用有限的示例訓練預測模型,以輔助專家在軟件評審過程中做出決策。研究表明,僅需12至30個標簽即可構建有效模型。
?
- 基于梯度的多樣高質翻譯指令數據選取
?
- 摘要: 針對機器翻譯指令微調中數據多樣性與質量挑戰,本文提出一種新穎的梯度方法,通過影響函數和小規模高質種子數據集自動選擇高質量多樣化的微調數據。通過對WMT22和FLORES任務的廣泛實驗,驗證了方法的有效性和泛化能力。
?
- 基于大型語言模型的文圖生成研究
?
- 摘要: 本文研究了使用大型語言模型(LLMs)作為文本編碼器,以改善文到圖生成中的語言理解。提出了一種三階段訓練流程,通過輕量級適配器有效整合LLMs,實現多語言支持和更長輸入上下文,提升圖像生成質量。
?
大模型開源項目
?
- THUDM:開源多模態GPT4V級模型
?
- 摘要: THUDM是一個基于Llama3-8B的開源多模態GPT4V級別模型項目。它使用Python語言編寫,旨在提供類似GPT-4的AI能力。
?
- Devon:開源AI編程助手
?
- 摘要: Devon是一個名為entropy-research的Github熱門AI項目,旨在提供一個開源的AI編程搭檔。該項目使用Python語言編寫,能夠幫助開發者提高編碼效率,解決編程難題。
?
- mlc-ai:瀏覽器內大型語言模型
?
- 摘要: mlc-ai項目致力于將大型語言模型和聊天功能帶入網絡瀏覽器中。全部運作在瀏覽器內,無需服務器支持,使用TypeScript語言編寫。
?
- OpenBMB:手機上的迷你GPT-4V模型
?
- 摘要: OpenBMB項目推出了MiniCPM-Llama3-V 2.5,這是一個類似GPT-4V水平的多模態語言模型(MLLM),可以在手機上運行,使用Python語言編寫。
?
- naklecha:Llama3矩陣乘法實現
?
- 摘要: naklecha項目是一個基于Jupyter Notebook的AI項目,專注于實現llama3算法,逐個矩陣乘法進行處理和計算,為深度學習和數值分析提供了新的工具。
?
- mendableai:網站轉換為LLM數據
?
- 摘要: mendableai項目,可將整個網站內容轉化為適合大型語言模型(LLM)的markdown或結構化數據。支持抓取、爬取、搜索及數據提取等功能,基于TypeScript語言開發。
?
- CodiumAI:智能測試生成工具
?
- 摘要: CodiumAI Cover-Agent是一款用Python編寫的AI工具,專注于自動化測試生成和代碼覆蓋率提升,旨在幫助開發者高效地發現和修復代碼中的錯誤。
?
- Khoj AI:個人第二大腦助手
?
- 摘要: Khoj AI是一款旨在成為用戶第二大腦的AI助手。它能通過強大的本地或在線大型語言模型(如GPT-4或Mistral)回答問題,支持自托管或網絡應用,并可通過多種平臺如Obsidian、Emacs等訪問。
?
- danielmiessler開源AI增強框架fabric
?
- 摘要: fabric是一個開源框架,旨在使用AI技術增強人類能力。該框架采用模塊化設計,通過眾包AI提示集合解決特定問題,可廣泛應用。基于Python語言開發。