Google Gemini 體驗

文章中代碼倉庫

gemini

谷歌推出的 AI 只能模型

  • Gemini官網
  • Gemini Chat
  • Gemini開發者文檔
  • Gemini SDK

所有模型

模型變體輸入輸出優化目標
Gemini 2.5 Pro gemini-2.5-pro音頻、圖片、視頻、文本和 PDF文本增強的思考和推理能力、多模態理解能力、高級編碼能力等
Gemini 2.5 Flash gemini-2.5-flash音頻、圖片、視頻和文本文本適應性思維,成本效益
Gemini 2.5 Flash-Lite 預覽版 gemini-2.5-flash-lite-preview-06-17文本、圖片、視頻、音頻文本最具成本效益且支持高吞吐量的模型
Gemini 2.5 Flash 原生音頻 gemini-2.5-flash-preview-native-audio-dialog & gemini-2.5-flash-exp-native-audio-thinking-dialog音頻、視頻和文本文本和音頻,交錯顯示高質量、自然的對話式音頻輸出,無論是否經過思考
Gemini 2.5 Flash 預覽版 TTS gemini-2.5-flash-preview-tts文本音頻低延遲、可控的單語音和多語音文字轉語音音頻生成
Gemini 2.5 Pro 預覽版 TTS gemini-2.5-pro-preview-tts文本音頻低延遲、可控的單語音和多語音文字轉語音音頻生成
Gemini 2.0 Flash gemini-2.0-flash音頻、圖片、視頻和文本文本新一代功能、速度和實時流式傳輸。
Gemini 2.0 Flash 預覽版圖片生成 gemini-2.0-flash-preview-image-generation音頻、圖片、視頻和文本文字、圖片對話式圖片生成和編輯
Gemini 2.0 Flash-Lite gemini-2.0-flash-lite音頻、圖片、視頻和文本文本成本效益和低延遲
Gemini 1.5 Flash gemini-1.5-flash音頻、圖片、視頻和文本文本在各種任務中提供快速而多樣的性能 已棄用
Gemini 1.5 Flash-8B gemini-1.5-flash-8b音頻、圖片、視頻和文本文本量大且智能程度較低的任務 已棄用
Gemini 1.5 Pro gemini-1.5-pro音頻、圖片、視頻和文本文本需要更高智能的復雜推理任務 已棄用
Gemini Embedding gemini-embedding-001文本文本嵌入衡量文本字符串的相關性
Imagen 4 imagen-4.0-generate-preview-06-06 imagen-4.0-ultra-generate-preview-06-06文本圖片我們最新的圖片生成模型
Imagen 3 imagen-3.0-generate-002文本圖片高質量圖片生成模型
Veo 3 預覽版 veo-3.0-generate-preview文本帶音頻的視頻生成包含音效、環境噪音和對話的高品質視頻
Veo 2 veo-2.0-generate-001文字、圖片視頻高質量視頻生成
Gemini 2.5 Flash Live gemini-live-2.5-flash-preview音頻、視頻和文本文字、音頻低延遲的雙向語音和視頻互動
Gemini 2.0 Flash Live gemini-2.0-flash-live-001音頻、視頻和文本文字、音頻低延遲的雙向語音和視頻互動

引入SDK

go get google.golang.org/genai

設置GEMINI API KEY 環境變量

export GEMINI_API_KEY="your-api-key"

示例

文本生成

  1. 單個文本輸入
  2. 思考功能
  3. 系統指令來引導 Gemini 模型的行為
  4. 借助 GenerateContentConfig 對象, 替換默認生成參數
  5. 多模態輸入,將文本與媒體文件組合使用
  6. 流式響應
  7. 多輪對話
  8. 流式響應多輪對話

圖片生成

  1. 文本生成圖片
  2. 圖片編輯
  3. 使用 Imagen 模型生成圖片 (需要付費)

生成視頻

  1. 使用 Veo 3 生成視頻 (要使用此模式,請確保您的帳戶具有活動的GCP計費)
  2. 根據圖片生成視頻 (需要付費)

結構化輸出

  1. 結構化輸出

文檔理解

  1. 傳遞內嵌 PDF 數據
  2. 使用 File API 上傳 PDF

圖片理解

  1. 傳遞內嵌圖片數據
  2. 使用 File API 上傳圖片

視頻理解

  1. YouTuBe

代碼執行

  1. 生成代碼, 并執行代碼
  2. 在對話中使用代碼執行
func main() {// 文本生成text.TexGen()text.TexGenThinking()text.TexGenCli()text.TexGenDefaultConfig()text.TexGenMultiModal()text.TexGenStream()text.TexMultipleRoundsOfDialogue()text.TexGenStreamMultipleRoundsOfDialogue()// 圖片生成photo.PhoGen()photo.PhoEdit()photo.ImaGen40GeneratePreview0606()// 生成視頻voe3.VeoGen()voe3.ImageGenVideo()// 結構化輸出format.FormatToJson()// 代碼執行coding.EnableCodingExec()coding.DialogCodingExec()// 文檔理解docs.InnerDoc()docs.UploadFileApi()// 圖片理解photo.PhoInnerRead()photo.PhoFileApi()// 視頻理解video.YouTuBe()
}

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/90127.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/90127.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/90127.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Trae安裝指定版本的插件

前情 Trae是屬于國產的跟 Cursor類似的AI編程IDE,我也是第一時間體驗Trae的,雖然相比Cursor弱了一些,但是也絕對勝任了,前端因為排隊問題我轉戰了Cursor,等到Trae出收費模式前,我已經辦了Cursor會員了&…

【技術追蹤】用于醫學圖像合成和分割的噪聲一致孿生擴散模型(CVPR-2025)

孿生擴散模型,生成息肉圖像用于提升分割性能! 論文:Noise-Consistent Siamese-Diffusion for Medical Image Synthesis and Segmentation 代碼:https://github.com/Qiukunpeng/Siamese-Diffusion 0、摘要 深度學習已徹底革新醫學影…

Crontab詳解

crontab是Unix/Linux系統中用于設置周期性任務的工具,通過編輯配置文件實現定時執行命令或腳本。以下是其語法規則和核心要點: 一、基本格式 * * * * * command - - - - - | | | | | | | | | ----…

中國1km逐月潛在蒸散發數據集 - matlab按shp批量裁剪

中國1km逐月潛在蒸散發數據集 - matlab按shp批量裁剪 1. 數據概述 2 利用掩膜文件對數據進行裁剪 3 完整代碼 4 結語 本篇繼續處理氣象數據,中國1km逐月潛在蒸散發數據集同前節介紹的中國1km降水數據集一樣,都可以從國家青藏高原科學數據中心獲得,數據具有同樣的空間分辨率(…

Node.js鏈接MySql

前言: 在現代 Web 開發和后端服務中,Node.js 因其高性能和異步特性被廣泛使用。MySQL 作為流行的關系型數據庫之一,提供了穩定高效的數據存儲和管理能力。將 Node.js 與 MySQL 結合,可以構建強大的數據驅動型應用。 一、環境準備…

Charles 的 Windows proxy 對爬取瑞數6 網站接口數據的作用分析

其實本文還是源于上個月的這篇文章 ??▼ 耗時兩天半,利用 DrissionPage繞過瑞數6,爬取某藥*局數據經歷~ 不同點是,當時爬取的是列表頁(已爬完),后面爬取的是詳情頁!懂的都懂,差別還…

PHP 測驗

PHP 測驗 引言 PHP 作為一種流行的開源服務器端腳本語言,被廣泛應用于網頁開發、服務器端編程等領域。為了幫助大家更好地理解和掌握 PHP,我們特此推出本 PHP 測驗。通過以下問題,您可以檢驗自己的 PHP 知識水平,同時也能了解自己在哪些方面需要加強。 測驗內容 問題一…

階段1--Linux中的文件服務器(FTP、NAS、SSH)

目錄 一、FTP Server 1.1.簡介 1.2.FTP基礎 1.2.1.控制端口 1.2.2.數據端口 1.3.FTP Server默認配置 1.3.1.安裝vsftp 1.3.2.準備分發的文件 1.3.3.啟動服務 1.3.4.關閉防火墻 1.4.FTP Client(默認僅能下載文件) 1.4.1.LinuxFTP客戶端程序1:l…

SpringBoot與Vue實戰:高效開發秘籍

Spring Boot 是什么? Spring Boot 簡介 Spring Boot 是基于 Spring 框架的快速開發工具,旨在簡化 Spring 應用的初始搭建和開發過程。它通過約定大于配置的原則,提供自動配置、內嵌服務器和依賴管理等功能,使開發者能夠快速構建獨立運行的、生產級別的應用。 核心特點 …

基于 fastapi 的 YOLO 批量目標檢測 API:支持單圖 / 文件夾自適應處理

項目背景 在計算機視覺任務中,我們經常需要對大量圖片進行目標檢測和標注。YOLO 系列模型憑借其高效性成為目標檢測的首選工具之一,但批量處理圖片時往往需要編寫繁瑣的腳本。本文將介紹一個基于 Flask 和 YOLOv11 的 API 服務,支持單張圖片…

周志華《機器學習導論》第13章 半監督學習

目錄 1. 未標記樣本 2. 生成式方法 高斯混合EM 3. 半監督SVM 存在未標記樣本的SVM變形 4. 圖半監督學習 對圖權值迭代矩陣計算 5. 基于分歧的方法 多視圖協同訓練 6. 半監督聚類 k-means的條件變形 6.1 Constrained k-means 利用“必連”與 “勿連”約束 6.2 Constra…

消息推送功能設計指南:精準觸達與用戶體驗的平衡之道

消息推送功能設計指南:精準觸達與用戶體驗的平衡之道消息推送是平臺與用戶保持連接的重要橋梁,既能及時傳遞重要資訊,又能喚醒沉睡用戶、提升活躍度。然而,推送功能若設計不當,可能變成 “信息騷擾”,導致用…

CanOpen--SDO 數據幀分析

CanOpen--SDO 數據幀分析1 介紹1.1 概述1.2 主站與從站2 數據幀詳細分析2.1 主站發送的請求幀 (Client → Server)2.2 從站響應的確認幀 (Server → Client)成功數據幀內容示例錯誤幀2.3 命令字2.4 小端格式:低字節在前3 其他示例60FF index 發送 數值 1000 數據幀分…

Day20-二叉樹基礎知識

二叉樹(Binary Tree)是一種每個節點最多有兩個子節點的樹形數據結構,這兩個子節點分別稱為左子節點和右子節點。二叉樹是計算機科學中最基礎、最常用的樹結構之一,廣泛應用于搜索、排序、表達式解析等領域! 核心特點 …

示波器探頭接口類型與PINTECH品致探頭選型指南

一、示波器探頭接口類型及技術特點1. BNC接口:通用型主流標準- 優勢:75%以上示波器標配接口,具備阻抗匹配靈活(50Ω/1MΩ)、插拔穩定、抗干擾性強等特點。 - 應用場景:適用于大多數示波器(如Le…

Spring之【Bean工廠后置處理器】

目錄 BeanFactoryPostProcessor BeanDefinitionRegistryPostProcessor 使用一下Bean工廠后置處理器 定義包掃描范圍 定義一個組件Bean 定義一個普通的類 自定義一個組件類實現Bean工廠后處理器 測試類 BeanFactoryPostProcessor 該接口是Spring提供的擴展點之一是一個…

【C++】第十八節—一文萬字詳解 | map和set的使用

嗨,我是云邊有個稻草人,與你分享C領域專業知識(*^▽^*) 《C》本篇文章所屬專欄—持續更新中—歡迎訂閱— 目錄 一、序列式容器和關聯式容器 二、set系列的使用 2.1 set和multiset參考?檔 2.2 set類的介紹 2.3 set的構造和迭代器 2.4 set的增刪查…

Java 大視界 -- Java 大數據在智能交通自動駕駛車輛與周邊環境信息融合與決策中的應用(357)

Java 大視界 -- Java 大數據在智能交通自動駕駛車輛與周邊環境信息融合與決策中的應用(357)引言:正文:一、Java 構建的環境信息融合架構1.1 多傳感器數據實時關聯1.2 動態障礙物軌跡預測二、Java 驅動的決策系統設計2.1 緊急決策與…

單細胞轉錄組學+空間轉錄組的整合及思路

一、概念 首先還是老規矩,處理一下概念問題,好將之后的問題進行分類和區分 單細胞轉錄組:指在單個細胞水平上對轉錄組(即細胞內所有轉錄出來的 RNA,主要是 mRNA)進行研究的學科或技術方向,核心…

用Python實現神經網絡(五)

這一節告訴你如何用TensorFlow實現全連接網絡。安裝 DeepChem這一節,你將使用DeepChem 機器學習工具鏈進行實驗在網上可以找到 DeepChem詳細安裝指導。Tox21 Dataset作為我們的建模案例研究,我們使用化學數據庫。毒理學家很感興趣于用機器學習來預測化學…