大模型日報
?
2024-05-13
?
大模型資訊
?
- 谷歌推出Gemini生成式AI平臺
?
- 摘要: 生成式人工智能正在改變我們與技術的互動方式。谷歌最近推出了名為Gemini的新平臺,該平臺代表了其在生成式AI領域的最新進展。Gemini平臺集成了一系列先進的工具和功能,旨在為用戶提供更加智能和直觀的技術體驗。
?
- Meta推出新版AI模型并向公眾開放,聲稱其聊天機器人超越免費版ChatGPT
?
- 摘要: Meta公司最近發布了其人工智能模型的新版本,并決定將其開放給公眾使用。該公司聲稱,與OpenAI推出的免費版ChatGPT相比,Meta的AI聊天機器人在性能上更加強大。這一舉措可能會在AI領域引發更激烈的競爭。
?
- 2032年大型語言模型市場預計達到539億美元
?
- 摘要: 根據DataHorizzon研究所發布的報告,2023年大型語言模型市場估值為41億美元。預測顯示,到2032年,該市場規模將顯著增長至539億美元,顯示出在未來十年中該行業的巨大增長潛力。
?
- 清華大學研究人員提出ADELIE模型:以人為中心的任務增強信息提取
?
- 摘要: 清華大學的研究人員提出了一種名為ADELIE的新模型,旨在通過與大型語言模型的對齊,提升以人為中心任務的信息提取性能。ADELIE模型通過與人類的交互和認知過程更緊密地結合,能夠更有效地處理和理解大量數據,從而在信息提取領域實現新的突破。
?
- 日本研究團隊發布基于超級計算機“Fugaku”訓練的大型語言模型“Fugaku-LLM”
?
- 摘要: 日本的研究者團隊最近發布了一款名為“Fugaku-LLM”的大型語言模型,該模型在日本國內領先的超級計算機“Fugaku”上進行訓練,具備了增強的日語處理能力。這標志著日本在人工智能領域的語言處理技術邁出了重要一步。
?
- KnowHalu:檢測大型語言模型文本生成幻覺的新型AI方法
?
- 摘要: KnowHalu是一種新穎的人工智能技術,專門用于識別大型語言模型(LLMs)生成的文本中的幻覺現象。這種方法旨在提高文本生成系統的可靠性與準確性,對于避免誤導信息和提升自然語言處理的質量具有重要意義。
?
- 微軟開發新內部AI模型 或擁有5000億參數量
?
- 摘要: 據報道,微軟正在開發一款新的內部AI模型,該模型的參數量可能高達5000億,這將使其能夠與谷歌等公司開發的開源模型相匹敵。這一消息表明微軟在人工智能領域的競爭力將得到顯著增強。
?
- 加州大學伯克利分校研究者提出新型AI方法LCB
?
- 摘要: 加州大學伯克利分校的研究者們創新性地提出了一種名為Learnable Latent Codes as Bridges(LCB)的人工智能方法。該方法整合了大型語言模型的抽象推理能力與低層次的動作策略,旨在克服機器人領域中模塊化層級策略與端到端策略之間的長期搖擺不定。
?
- Wayve完成10.5億美元C輪融資,推動AI自動駕駛技術發展
?
- 摘要: 自動駕駛技術公司Wayve宣布,在其C輪融資中成功籌集了1.05億美元資金。該公司是基于Embodied AI技術的自動駕駛領域的市場領導者,此次融資將進一步促進其自動駕駛技術的研發和商業化進程。
?
- RELIES在大型語言模型中的應用及其影響深度解析
?
- 摘要: 隨著人工智能(AI)和自然語言處理(NLP)領域的顯著進步,大型語言模型的發展正受到前所未有的關注。最新研究聚焦于如何在NLP中利用語言學專家知識,特別是一個名為RELIES的系統,它在大型語言模型上的應用可能對未來的AI語言理解和生成產生深遠影響。
?
大模型產品
?
大模型論文
?
- 自然語言處理與語言學的關系
?
- 摘要: 大型語言模型(LLMs)能流暢生成文本,但仍需語言學支持。本文探討NLP領域中語言學的六大貢獻:資源、評估、低資源環境、可解釋性、解釋和語言研究。
?
- OpenBA-V2:高壓縮比的快速多階段剪枝
?
- 摘要: OpenBA-V2是一種基于多階段壓縮和持續預訓練的3.4B模型,從原始的15B OpenBA模型衍生而來。該模型實現了77.3%的高壓縮比,同時保持了最小的性能損失,并在常識推理和命名實體識別等下游任務中展現出與15B原模型相當的性能。
?
- 多模態大型語言模型在自動駕駛的應用探究
?
- 摘要: 本文深入探討了多模態大型語言模型(MLLMs)在自動駕駛領域的應用,通過實驗發現其在動態駕駛環境中存在諸多挑戰,特別是在連貫性和邏輯性方面的不足。
?
- Smurfs多智能體工具規劃框架
?
- 摘要: 本文介紹了Smurfs框架,通過將常規大型語言模型轉變為協同多智能體集合,無需額外訓練即可增強任務分解和執行能力。實驗表明,Smurfs在復雜工具使用場景中優于現有模型。
?
- CuMo:多模態大型語言模型擴展
?
- 摘要: 本文提出了CuMo,一種通過共同升級混合專家模塊來擴展多模態大型語言模型(LLMs)的方法。CuMo在視覺編碼器和MLP連接器中集成了稀疏門控混合專家塊,提高了模型性能,同時保持了低推理成本。在開源數據集上的訓練超越了當前最先進的多模態LLMs。
?
- 6G網絡中可信AI生成內容研究
?
- 摘要: 本文提出TrustGAIN模型,旨在6G網絡環境下確保AI生成內容(AIGC)的安全、隱私和公平性。探討了AIGC系統面臨的對抗性攻擊、隱私威脅及保護措施,并強調移動生成服務的無偏性和公平性的重要性。
?
- 微調大型語言模型是否誘發幻覺
?
- 摘要: 研究表明,通過微調向大型語言模型引入新知識可能導致其產生錯誤幻覺。實驗發現,模型吸收新知識較慢,但隨著學習,幻覺傾向線性增加。
?
- Co-driver:自動駕駛助手系統
?
- 摘要: 本研究提出了Co-driver,一個基于視覺語言模型的自動駕駛助手系統,旨在通過理解復雜路況來調整駕駛行為。系統整合了CARLA模擬器及ROS2,并在實際駕駛數據集中展現出高成功率。
?
- FlockGPT:用語言指導無人機編隊
?
- 摘要: 本文介紹了利用生成式AI通過自然語言實現無人機快速編隊控制的首創方法。該方法通過大型語言模型界面,使用戶直觀地指揮任意大小的無人機群體構成預期幾何形態。用戶研究結果表明,即使是無經驗者也能快速構建復雜圖形,并準確識別。
?
- 機器人倫理決策感知框架
?
- 摘要: 本文提出了一個名為'Robots Can Feel'的機器人倫理推理框架,通過模擬情感與邏輯相結合的方式,在道德復雜情境中做決策。研究表明,情感權重系數對決策產生顯著影響。
?
大模型開源項目
?
- Gemma 2B:10M上下文長度AI
?
- 摘要: mustafaaljadery推出的Gemma 2B項目,采用Infini-attention技術,可處理高達10M的上下文長度,基于Python語言編寫,是AI領域的一次創新。
?
- AI一鍵生成高清短視頻工具
?
- 摘要: harry0703項目通過AI大模型技術,實現了一鍵生成高清短視頻的功能。該工具使用Python語言編寫,能夠快速方便地為用戶制作出高質量的視頻內容。
?
- Hydra游戲啟動器:內嵌BT客戶端
?
- 摘要: Hydra是一款使用TypeScript編寫的游戲啟動器,具備內置的bittorrent客戶端和自動管理的游戲重打包資源抓取功能。
?
- Open-WebUI:便捷的LLMs網絡界面
?
- 摘要: Open-WebUI(原名Ollama WebUI)是一個用戶友好的Web界面,專為大型語言模型(LLMs)設計,采用Svelte語言編寫,旨在提升用戶交互體驗。
?
- Bisheng:開源LLM DevOps平臺
?
- 摘要: Bisheng是一個用Python編寫的開源LLM DevOps平臺,旨在為下一代AI應用提供強大支持和便捷的開發運維體驗。
?
- 1Panel-dev: LLM問答系統
?
- 摘要: 1Panel-dev是一個基于大型語言模型(LLM)的知識庫問答系統,易于集成,由1Panel官方推出,使用Python開發。
?
- 免費私密的問答搜索聚合器
?
- 摘要: nashsu開發的FreeAskInternet是一個免費、私密的搜索聚合器,可在本地運行,結合多個LLMs生成答案,無需GPU。它能將搜索結果與LLM結合,生成基于搜索的答案,全程免費使用,使用Python編寫。
?
- lllyasviel:圖像再照明AI項目
?
- 摘要: lllyasviel是一個用Python編寫的Github趨勢AI項目,專注于圖像再照明技術。該項目通過算法改善圖片光照效果,提升視覺體驗。
?
- Roboflow:計算機視覺工具庫
?
- 摘要: Roboflow是一個用Python編寫的Github趨勢AI項目,旨在提供可復用的計算機視覺工具,幫助開發者簡化視覺項目的構建過程,提高開發效率。
?
- OpenDevin:簡化代碼,提高效率
?
- 摘要: OpenDevin項目旨在減少編碼工作量,提高開發效率。該項目使用Python語言編寫,通過簡化的編程接口,使開發者能夠更快地創建和部署應用程序。