2025年6月AI領域重要模型更新與平臺優化匯總
摘要: 本文匯總了2025年6月期間AI領域發布的多項重要模型更新及平臺功能優化信息,涵蓋Google Gemini、阿里通義萬相、字節豆包、百度文心一言、MiniMax海螺02、Google Veo3、快手可靈2.1、FLUX Kontext等模型的最新進展,以及IMYAI平臺的相關功能調整與體驗優化。
2025年06月29日
- Gemini Deep Research 功能上線(后續因難以維護已下線): Google Gemini 模型推出創新功能“Gemini Deep Research”,旨在輔助用戶高效處理復雜研究任務。該功能通過自動化流程,將用戶需求轉化為結構化研究計劃,經用戶確認后,系統將自主進行網絡信息搜索,并根據搜索結果迭代優化分析,最終生成包含關鍵發現及原始來源鏈接的詳細報告。其核心優勢在于“深度”與“迭代”特性,能夠根據新線索調整搜索方向,確保報告的全面性與準確性。該功能基于 Gemini 2.5 Pro 模型,支持多模態(文本、圖像、視頻)分析,結合 Google 搜索索引與知識圖譜技術提供高質量結果。用戶僅需輸入研究問題,即可在較短時間內獲得專業級報告,適用于研究人員、學生及商業用戶進行跨領域知識密集型分析。
2025年06月28日
-
IMYAI 平臺優化與更新:
-
付費擴展包入口調整: AI視頻板塊付費擴展包的額度顯示UI已優化,購買與充值入口移至左側欄底部。
-
AI視頻模型上新:通義萬相(Wan2.1):阿里云推出的視頻生成模型,支持文生視頻、圖生視頻(支持中英文提示)。該模型能夠精準模擬物理規律(如碰撞、反彈)以提升畫面逼真度,并在影視質感與指令遵循方面表現突出。其中,Wan2.1-14B-Turbo為14B模型的加速版,單個視頻生成時間壓縮約30%。注: 該模型在IMYAI平臺僅消耗高級積分額度,不消耗付費拓展包,平臺高級會員及永久會員可無限次使用。
-
BUG修復: 修復了特定情況下(如圖片尺寸過大或過長)上傳圖片卡在99%的問題。
-
2025年06月24日
- AI視頻模型上新:字節豆包 Doubao-Seedance-1.0-pro: 字節跳動推出的先進AI視頻生成模型(即夢3.0 Pro同款)。在Artificial Analysis評測中,其文生視頻與圖生視頻能力均位列全球第一。支持文字/圖片輸入,可生成10秒1080p高清視頻,具備2-3個鏡頭的無縫切換能力,強調鏡頭連貫性與內容穩定性。在視覺質量、創意性及提示詞理解方面表現優異。
2025年06月23日
- 多款AI視頻模型集中上線:
- 海螺02 (Hailuo 02 - MiniMax): 參數量與訓練數據量分別為前代3倍與4倍,擅長生成符合物理規律的高質量復雜場景視頻(如體操翻轉、噴火特效、城市特技、玻璃倒影),在鏡頭運動與動態效果上表現突出,風格化能力強。
- Veo3 (Google): 先進的文生視頻模型,可生成高質量視頻內容并自動匹配音頻,創造沉浸式體驗(如4K ASMR視頻、穿越歷史場景的Vlog)。推動了AI視頻內容的創新與普及。注: 官網API暫不支持圖生視頻。
- 可靈2.1 (Kuaishou): 相比前代,在人物動作、場景細節(如蝴蝶飛行、花瓣飄動)方面物理真實感更高,語義理解能力優化。適用于短視頻、廣告、教育及影視預覽。注: 官網暫不支持文生視頻。
2025年06月20日
- 功能更新: Gemini 2.5 Pro(最新正式版)已支持通過提示詞(如“畫一張XX”)觸發文生圖功能。
2025年06月18日
-
重要模型上線:
-
Google Imagen 4: 新一代文生圖模型。顯著提升圖像質量、細節呈現(如織物紋理、水滴折射、動物毛發)與文本渲染能力,支持生成2K分辨率圖像及多種藝術風格(超現實主義、抽象藝術、插圖、攝影等)。
-
Gemini 2.5 Pro (正式版): Google旗艦多模態大模型(由06-05預覽版升級)。在編程、推理、科學、數學領域表現卓越(LMArena 1470分,WebDevArena 1443分,Aider Polyglot 82.2%通過率超越Claude Opus 4與DeepSeek R1)。支持100萬token上下文,可處理文本、圖像、音頻、視頻等多模態復雜任務。
-
MiniMax-m1 (同期上線): 國產推理模型上線,實際測試表現(如解答高考數學題)有待進一步觀察。
-
2025年06月16日
- 功能上線:即夢圖生圖3.0: 即夢3.0(AI中文海報設計模型)的全量圖生圖能力已開放。用戶可基于上傳圖片進行重繪與設計,保持良好一致性,中文顯示穩定性優于前代,適用于海報制作。
2025年06月13日
- IMYAI 平臺體驗優化:
- AI對話: LaTeX數學公式排版渲染優化,獨立公式居中排列,視覺效果提升。
- AI繪畫:
-
墊圖粘貼框UI優化。
-
進入相冊視圖自動收起左側欄,擴大視野。
-
模型選擇列表UI優化,整理歸類更清晰。
-
GPT-4o多模態生圖支持通過提示詞(“尺寸為橫屏/豎屏”或“尺寸:16:9/9:16”)控制輸出比例(實際分辨率受限于官方規格,如橫屏為1536×1024)。
-
2025年06月11日
- 模型上新:百度文心一言系列:
- ERNIE-4.5-Turbo: 知識增強大模型,在去幻覺、邏輯推理、代碼能力方面有提升。相比4.5版本速度更快。支持多輪長對話和長文檔理解,適用于中文知識問答、創作、寫作、對話、推理、計算及工具調用。
- ERNIE-X1-Turbo: 專注于推理任務,性能與DeepSeek R1相當。具備深度思考能力,擅長多模態推理與高級工具使用(高級搜索、圖像生成/解釋、網頁閱讀、TreeMind概念映射等)。
2025年06月06日
- 知識庫更新: FLUX Kontext 玩法教程已上線。
2025年06月04日
- 模型上線與平臺更新:
- FLUX Kontext (專業繪畫板塊): 支持圖生圖。實測表明,上傳單張參考圖效果最佳。提示詞模板建議:【人物樣貌和姿勢保持不變,背景改為XXX,服裝改為XXX(或保持不變)】。
- 平臺UI/功能優化:
- 專業繪畫板塊新增“相冊布局”,支持調整圖片展示數量、多選圖片批量收藏/下載。
- 合并導出圖片、文檔及分享對話為鏈接按鈕至功能欄。
- 優化語音播報(降低延遲,提高速度)、Suno音樂播放器UI等細節。
- 網站穩定性整體提升。
2025年06月03日
- 模型上線:
-
FLUX Kontext (AI對話板塊): Black Forest Labs開發的多模態圖文生成與編輯工具。核心優勢包括:角色一致性(多次修改保持關鍵元素一致)、精準局部編輯、風格遷移(油畫、3D渲染等)、快速交互(1024×1024圖生成約3-5秒)。FLUX-Kontext-pro適合快速迭代,FLUX-Kontext-max追求極致輸出質量。
-
秘塔搜索升級:
- 極速模式: 最高處理速度達400 tokens/秒,大部分問題響應在2秒內,準確率與邏輯清晰度提升。
- 學術模式: 聚焦專業期刊/論文檢索,提供摘要預覽與原文鏈接跳轉,支持中英文文獻搜索。
-
2025年06月01日
- 新站點上線: IMYAI Midjourney+Grok 直連站正式開放。該站點功能與玩法更為豐富,UI界面還原官網,模型數據由官方賬號實時傳遞。訪問地址:https://ai.imyaichat.com。相關卡密可在商城獲取。