[AI Google] 雙子座模型家族迎來新突破:更快的模型、更長的上下文、AI代理等更多功能

Google發布了Gemini模型家族的更新,包括新的1.5 Flash模型,該模型旨在提高速度和效率,以及Project Astra,這是對未來AI助手愿景的展示。1.5 Flash是專為大規模高頻任務優化的輕量級模型,具有突破性的長上下文窗口。同時,1.5 Pro模型也得到了顯著改進,包括更長的上下文窗口、增強的代碼生成和邏輯推理能力。此外,Gemini Nano現在能夠理解多模態輸入,而Gemma 2則是下一代開放模型,旨在促進負責任的AI創新。Project Astra展示了通用AI代理的未來,這些代理能夠理解和響應復雜世界,并具有更自然的互動能力。


我們很高興地介紹雙子座模型家族的一系列更新,包括新的1.5 Flash——我們的輕量級模型,旨在提高速度和效率,以及Project Astra——我們對未來AI助手愿景的展示。

一張復雜的AI模型網絡連接到另一個更加精簡的模型的插圖,展示了Google DeepMind如何通過大型模型教授和訓練小型模型。

去年12月,我們推出了首個原生多模態模型雙子座1.0,包括Ultra、Pro和Nano三種尺寸。僅僅幾個月后,我們發布了1.5 Pro,它具有增強的性能和突破性的長上下文窗口,可容納100萬個令牌。

開發者和企業客戶已經開始以令人驚嘆的方式使用1.5 Pro,發現它的長上下文窗口、多模態推理能力和總體表現非常有用。

我們從用戶反饋中得知,某些應用需要更低的延遲和更低的服務成本。這激勵我們繼續創新,因此今天,我們推出了雙子座1.5 Flash:一個比1.5 Pro更輕量級的模型,旨在快速且高效地大規模服務。

1.5 Pro和1.5 Flash都可通過Google AI Studio和Vertex AI的公開預覽版獲得,擁有100萬個令牌的上下文窗口。現在,1.5 Pro還可通過等待名單向使用API的開發者和Google Cloud客戶提供,擁有200萬個令牌的上下文窗口。

我們還介紹了雙子座模型家族的更新,宣布了我們的下一代開放模型Gemma 2,并分享了未來AI助手的發展,通過Project Astra。

與雙子座1.5的200萬令牌能力相比,領先的基礎模型的上下文長度

雙子座模型家族的更新

新的1.5 Flash,專為速度和效率優化

1.5 Flash是雙子座模型家族的新成員,也是通過API提供的最快的雙子座模型。它專為大規模的高容量、高頻率任務而優化,服務成本更高效,并具有我們突破性的長上下文窗口。

雖然它比1.5 Pro輕量級,但它在處理大量信息的多模態推理方面表現出色,并為它的尺寸提供了令人印象深刻的質量。

解釋新的雙子座1.5 Flash模型的三個關鍵特性——速度和效率、多模態推理和長上下文窗口的圖標和文本的插圖。

新的雙子座1.5 Flash模型專為速度和效率優化,在多模態推理方面表現出色,并具有我們突破性的長上下文窗口。

1.5 Flash在摘要、聊天應用、圖像和視頻字幕、從長文檔和表格中提取數據等方面表現出色。這是因為通過一種稱為“蒸餾”的過程,由1.5 Pro訓練而來,將更大模型的最關鍵知識和技能轉移到更小、更高效的模型中。

在我們的更新后的雙子座1.5技術報告、雙子座技術頁面以及了解1.5 Flash的可用性和定價中關于1.5 Flash的信息。

顯著改進1.5 Pro

在過去的幾個月里,我們顯著改進了1.5 Pro,這是我們在廣泛任務上表現最佳的模型。

除了將其上下文窗口擴展到200萬個令牌之外,我們還通過數據和算法進步改進了它的代碼生成、邏輯推理和規劃、多輪對話,以及音頻和圖像理解。我們在每個任務的公共和內部基準上都看到了強大的改進。

1.5 Pro現在可以遵循越來越復雜和細微的指令,包括那些指定產品級行為涉及角色、格式和風格的指令。我們改進了對模型響應的控制,以適應特定用例,如打造聊天代理的個性和響應風格,或通過多個函數調用自動化工作流程。并且我們允許用戶通過設置系統指令來引導模型行為。

我們在Gemini API和Google AI Studio中添加了音頻理解,因此1.5 Pro現在可以對在Google AI Studio上傳的視頻進行圖像和音頻推理。我們正在將1.5 Pro集成到Google產品中,包括Gemini Advanced和Workspace應用。

在我們的更新后的雙子座1.5技術報告和雙子座技術頁面上關于1.5 Pro的信息。

Gemini Nano理解多模態輸入

Gemini Nano正在從僅文本輸入擴展到包括圖像。從Pixel開始,使用Gemini Nano與多模態的應用將能夠像人們一樣理解世界——不僅僅是通過文本,還通過視覺、聲音和口語。

在Android上關于Gemini 1.0 Nano的信息。

下一代開放模型

今天,我們還分享了一系列對Gemma的更新,這是我們基于創建雙子座模型相同的研究和技術構建的開放模型家族。

我們宣布Gemma 2,我們下一代開放模型,用于負責任的AI創新。Gemma 2擁有新的架構,專為突破性的性能和效率而設計,并將以新的尺寸提供。

Gemma家族還通過PaliGemma擴展,這是我們受到PaLI-3啟發的首個視覺語言模型。并且我們已經升級了我們的負責任生成式AI工具包,加入了LLM Comparator用于評估模型響應的質量。

在開發者博客上信息。

開發通用AI代理的進展

作為Google DeepMind使命的一部分,我們一直希望負責任地開發能夠造福人類的通用AI代理。這就是為什么今天,我們分享了構建未來AI助手愿景的進展,通過Project Astra(高級視覺和對話響應代理)。

要真正有用,代理需要像人們一樣理解和響應復雜和動態的世界,并吸收和記住它看到和聽到的內容,以理解上下文并采取行動。它還需要是主動的、可教的和個性化的,以便用戶可以自然地與它交談,沒有延遲或延遲。

雖然我們在開發能夠理解多模態信息的AI系統方面取得了令人難以置信的進展,但將響應時間降低到對話級別是一個困難的工程挑戰。在過去幾年中,我們一直在努力改進我們的模型如何感知、推理和對話,以使互動節奏和質量感覺更自然。

Project Astra的兩部分演示,我們對未來AI助手的愿景。每部分都是在單次拍攝中實時捕獲的。

在雙子座的基礎上,我們已經開發了原型代理,它們可以通過連續編碼視頻幀、將視頻和語音輸入結合成事件時間線,并緩存這些信息以供高效回憶,來更快地處理信息。

通過利用我們領先的語音模型,我們還增強了它們的聲音,賦予代理更廣泛的語調范圍。這些代理可以更好地理解它們被使用的上下文,并快速、流暢地回應。

有了這樣的技術,很容易想象一個未來,人們可以擁有一個專家級的AI助手,通過手機或眼鏡隨時待命。其中一些功能將在今年晚些時候來到Google產品,如Gemini應用和網頁體驗。

持續探索

到目前為止,我們的雙子座模型家族已經取得了令人難以置信的進展,我們總是力求進一步推進最前沿的藝術。通過投資于不懈的創新生產線,我們能夠探索前沿的新想法,同時也解鎖了雙子座新穎和令人興奮的用例的可能性。

了解更多關于雙子座及其功能的信息。


  • 原文
  • 博客 - 從零開始學AI
  • 公眾號 - 從零開始學AI

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/24334.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/24334.shtml
英文地址,請注明出處:http://en.pswp.cn/web/24334.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Diffusers代碼學習: IP-Adapter Inpainting

IP-Adapter還可以通過Inpainting自動管道和蒙圖方式生成目標圖片。 # 以下代碼為程序運行進行設置,使用Inpainting 的自動管道, import os os.environ["HF_ENDPOINT"] "https://hf-mirror.com"from diffusers import AutoPipelin…

【java】速度搭建一個springboot項目

使用軟件:IDEA,mysql 使用框架:springboot mybatis-plus druid 坑點 使用IDEA搭建一個springboot項目的時候,需要考慮一下IDEA版本支持的JDK版本以及maven版本。否則再構建項目,引入pom的時候就會報錯。 需要檢查…

04 uboot 編譯與調試

新手不需要詳細掌握 uboot,只需要知道它是一個什么東西即可,工作中也只是改一些參數而已。 1、uboot 是什么 Linux 系統要啟動就必須需要一個 bootloader 程序,也就說芯片上電以后先運行一段 bootloader 程序。這段 bootloader 程序會先初始化 DDR 等外設,然后將 Linux 內…

利用PowerQuery控制數據行數

PowerBI報表在開發的過程中,經常會遇到數據量非常龐大的情況,在這種情況下,本機連接數據源如果不進行特殊處理的話,那么刷新數據的時候可能會發生數據刷新時間過長、數據加載內存錯誤、開發過程中構建DAX卡頓等情況。 那么在實際開…

不確定性+電動汽車!含高比例新能源和多類型電動汽車的配電網能量管理程序代碼!

前言 能源供應的可持續性和清潔性是當今世界共同關注的議題,配電網與可再生能源發電相結合,通過多能互補和梯級利用,在不同時空取長補短,提高能源利用率,減少溫室氣體排放,是解決能源短缺和環境問題的有效…

遞歸及其使用

遞歸及其使用 1. 什么是遞歸?2. 遞歸解決什么問題?3. 遞歸的步驟4. 使用遞歸的注意事項5. 示例 1. 什么是遞歸? 遞歸是指在函數的定義中使用函數自身的過程。簡單來說,遞歸是通過將大問題分解為更小的子問題來解決問題的一種方法…

[職場] 關于薪酬需要知道的兩個知識點 #知識分享#知識分享

關于薪酬需要知道的兩個知識點 薪酬問題是面試過程中比較核心的問題,也是每次面試必問的。如果你進入到面試的后一階段,這類問題可以讓面試官或企業判斷求職者的要求是否符合企業的薪酬標準,并進一步判斷求職者對自身價值的認可程度。關于薪…

數據結構之快速排序算法(快排)【圖文詳解】

P. S.:以下代碼均在VS2019環境下測試,不代表所有編譯器均可通過。 P. S.:測試代碼均未展示頭文件stdio.h的聲明,使用時請自行添加。 博主主頁:LiUEEEEE ??????????????????? ?? …

【Java數據結構】詳解Stack與Queue(三)

🔒文章目錄: 1.????前言~🥳🎉🎉🎉 2. 隊列(Queue) 2.1隊列的概念 2.2隊列的方法 2.3隊列的使用 2.4循環隊列 循環隊列的介紹 循環隊列圖 如何區分循環隊列是滿還是空…

外掛知識庫的基本知識與內容

外掛知識庫 1.什么是rag? RAG,即LLM在回答問題或生成文本時,會先從大量文檔中檢索出相關的信息,然后基于這些信息生成回答或文本,從而提高預測質量。 2.外掛知識庫的實現思路 只用幾十萬量級的數據對大模型進行微調并不能很好…

第五十六周:文獻閱讀

目錄 摘要 Abstract 文獻閱讀:應用于地表水總磷濃度預測的可解釋CEEMDAN-FE-LSTM-Transformer混合模型 一、現有問題 二、提出方法 三、方法論 1、CEEMDAN(帶自適應噪聲的完全包絡經驗模式分解) 2、FE(模糊熵 &#xff09…

Vue3【十】07使用ref創建基本類型的響應式數據以及ref和reactive區別

Vue3【十】07使用ref創建基本類型的響應式數據以及ref和reactive區別 ref 也可以創建對象類型的響應式數據,不過要使用.value ref 處理對象數據的時候,底層數據還是reactive格式的 reactive 重新分配一個新對象,會失去響應式可以使用Object.a…

自注意力機學習

自注意力機制的核心概念 1. Query, Key 和 Value Query(查詢向量):可以看作是你當前在關注的輸入項。假設你正在閱讀一段文字,這就像你當前在讀的句子。 Key(鍵向量):表示其他所有輸入項的標識…

保姆級 | MySQL的安裝配置教程(非常詳細)

一、下載Mysql 官網步驟 MySQLhttps://www.mysql.com/進入官網首頁 點擊DOWNLOADS 點擊MySQL Community (GPL) Downloads 點擊 小頁面直接進入 MySQL :: Download MySQL Installerhttps://dev.mysql.com/downloads/installer/點擊“Download”下載最新版本,其他…

【吊打面試官系列】MySQL 中 InnoDB 支持的四種事務隔離級別名稱,以及逐級之間的區別?

大家好,我是鋒哥。今天分享關于 【MySQL 中 InnoDB 支持的四種事務隔離級別名稱,以及逐級之間的區別?】面試題,希望對大家有幫助; MySQL 中 InnoDB 支持的四種事務隔離級別名稱,以及逐級之間的區別&#xf…

碳素鋼化學成分分析 螺紋鋼材質鑒定 鋼材維氏硬度檢測

碳素鋼的品種主要有圓鋼、扁鋼、方鋼等。經冷、熱加工后鋼材的表面不得有裂縫、結疤、夾雜、折疊和發紋等缺陷。尺寸和允許公差必須符合相應品種國家標準的要求。 具體分類、按化學成分分類 : 碳素鋼按化學成分(即以含碳量)可分為低碳鋼、中…

機器學習筆記 - stable diffusion web-ui安裝教程

一、Stable Diffusion WEB UI 屌絲勁發作了,所以本地調試了Stable Diffusion之后,就去看了一下Stable Diffusion WEB UI,網絡上各種打包套件什么的好像很火。國內的也就這個層次了,老外搞創新,國內跟著屁股后面搞搞應用層,就叫大神了。 不扯閑篇了,我們這里從git源碼直接…

問題:11單位內部人員對行政機關作出的行政處分不服,可申請行政復議. #其他#微信

問題:11單位內部人員對行政機關作出的行政處分不服,可申請行政復議. 參考答案如圖所示

問題:脾梗塞時,下列情況最符合的是 #職場發展#知識分享#媒體

問題:脾梗塞時,下列情況最符合的是 A、脾腫大 B、脾區摩擦感 C、兩者均有 D、兩者均無 參考答案如圖所示

uniapp視頻組件層級太高,解決方法使用subNvue原生子體窗口

目錄 前言 先看一下uniapp官網的原話: subNvue的一些參數介紹 subNvues使用方法: 綁定id 顯示 subNvue 彈出層 subNvue.show() 參數信息 subNvue.hide() 參數信息 在使用subNvue 原生子體窗口 遇到的一些問題 前言 nvue 兼容性 以及使用方式 控…