6 月 11 日,在火山引擎 FORCE 原動力大會上,字節跳動旗下火山引擎正式發布豆包大模型 1.6、豆包?視頻生成模型 Seedance 1.0 pro、豆包?語音播客模型,豆包?實時語音模型也在火山引擎全量上線,豆包大模型家族已成為擁有全模態、全尺寸、高性價比的領先模型矩陣。截至 2025 年 5 月底,豆包大模型日均 tokens 使用量超過 16.4 萬億,較去年 5 月剛發布時增長 137 倍。
豆包大模型 1.6:推理、多模態與復雜任務處理的革新
全新發布的豆包大模型 1.6 系列由三個模型組成,為企業提供多樣化選擇。
- doubao-seed-1.6:All-in-One 的綜合模型,是國內首個支持 256K 上下文的思考模型,支持深度思考、多模態理解、圖形界面操作等多項能力。支持選擇開啟或關閉深度思考、自適應思考三種方式,其中自適應思考模式可根據提示詞難度自動決定是否開啟思考,在推理效率與效果間達到精妙平衡。
- doubao-seed-1.6-thinking:豆包大模型 1.6 系列在深度思考方面的強化版本,在代碼、數學、邏輯推理等基礎能力上進一步提升,支持 256K 上下文。其在復雜推理、競賽級數學、多輪對話和指令遵循等測試集上的表現已躋身全球前列,能夠深入分析問題,對各類復雜任務給出高質量解答。
- doubao-seed-1.6-flash:豆包大模型 1.6 系列的極速版本,支持深度思考、多模態理解、256K 上下文,延遲極低,TOPT 僅需 10ms,視覺理解能力比肩友商旗艦模型。該版本在追求速度的同時,沒有犧牲模型對文本、圖像等多模態信息的理解能力,能夠快速響應業務請求,滿足對時效性要求極高的場景。
在推理速度、準確度與穩定性上,豆包大模型 1.6 實現了顯著提升。以高考數學測評為例,有媒體針對今年的高考全國新一卷數學單科做了測評,豆包的成績是 144 分,全國第一。而在高考前,在針對海淀區模擬全卷的測評中,相比去年的模型,豆包大模型 1.6 理科成績顯著提升了 154 分,文科提升了 90 分,充分展現其在復雜知識推理與問題解決上的進步。在多模態理解方面,此前豆包 1.5 的多模態能力在 60 個公開評測基準中取得 38 項最佳成績,已廣泛應用在電商識圖、自動駕駛數據標注、門店巡檢等場景。而豆包大模型 1.6 在此基礎上更進一步,圖形界面操作能力讓其具備 “行動力”,可自動操作瀏覽器完成酒店預訂,識別購物小票并整理成 Excel 表格等任務,將多模態理解與實際操作相結合,更好地處理真實世界問題。
豆包?視頻生成模型 Seedance 1.0 pro:視頻生成技術的新標桿
全新發布的豆包?視頻生成模型 Seedance 1.0 pro 具備三大特性,代表著視頻生成技術的新高度。
- 無縫多鏡頭敘事:通過先進的語義理解和鏡頭語言規劃技術,Seedance 1.0 pro 能夠根據輸入的文本或圖片信息,生成邏輯連貫、情節流暢的多鏡頭視頻。模型能夠精準把握不同鏡頭之間的轉場時機和方式,實現自然流暢的鏡頭切換,避免了傳統視頻生成模型在多鏡頭敘事時容易出現的情節斷裂、場景突兀等問題 。
- 多動作及隨心運鏡:該模型支持多種復雜的人物動作及靈活的運鏡效果。在人物動作生成方面,它能夠分析動作時序與空間關系,生成自然流暢的人物交互動作,使人物的運動軌跡、受力反饋更加契合現實規律。在運鏡上,支持 360 度環繞、航拍、變焦、平移、跟隨、手持等多種鏡頭語言,極大地豐富了視頻的視覺表現形式,為創作者提供了更多創意表達的可能性。
- 穩定運動與真實美感:在視頻生成過程中,Seedance 1.0 pro 能夠保證主體運動的穩定性,即使在復雜的動作和運鏡下,也能確保視頻主體清晰、穩定,不會出現抖動、模糊等現象。同時,模型生成的視頻畫面具有極高的自然度和真實美感,通過專業級光影布局和色彩調和,生成的視頻畫面極具視覺沖擊力,接近實拍效果。
根據第三方權威榜單 Artificial Analysis 最新結果,Seedance 1.0 pro 在文生視頻、圖生視頻兩個維度都超越了業界諸多主流模型,登頂全球競技場第一,彰顯了其在視頻生成技術領域的領先地位。
目前,豆包大模型已涵蓋多模態、視頻、圖像、語音、音樂等豐富的模型品類,正全方位推進智能提升和應用落地,憑借不斷革新的技術為企業的智能化轉型和創新發展持續賦能。