谷歌 I/O 2024大會全面硬鋼OpenAI;騰訊宣布旗下的混元文生圖大模型;阿里巴巴技術下的AI自動視頻剪輯工具

? 1: 谷歌 I/O 2024

谷歌 I/O 2024 發布了眾多新技術,包括 Gemini AI、大語言模型和通用 AI 智能體等,全面顛覆搜索體驗。

在這里插入圖片描述

谷歌 I/O 2024發布會帶來許多令人興奮的新功能和技術創新:

  1. Gemini 1.5 Pro:一個極其強大的語言模型,具備多模態支持和超長上下文(長達200萬token)。它可以處理視頻、音頻和大量文本,讓用戶能方便地進行各種復雜任務,如總結會議要點、處理電子郵件等。

  2. Project Astra:一個多功能的通用AI智能體,具備視覺識別和語音交互功能,不僅能識別并分析環境,還能執行各種任務,比如幫助用戶填寫退貨單、找城市服務等。

  3. 搜索重塑:在Gemini加持下,谷歌搜索發生了重大變化,可以提供個性化的AI總結和多步驟推理功能,讓用戶查詢信息更加高效。

  4. Veo:一個新的視頻生成模型,可以生成高質量、長達1分多鐘的1080p視頻,為創作者提供更多的創作空間。

  5. AI媒體工具:包括生成圖像的Imagen 3、音樂創作的Music AI Sandbox等,幫助用戶更好地進行跨媒體創作。

  6. Astra項目和AR眼鏡:結合AR和AI技術,為用戶提供更為自然和高效的交互體驗。

  7. Gemini App和Gemini Advanced:提供個性化的AI助理和專家服務,讓用戶能夠高效處理日常事務和專項需求。

  8. Ask Photos:一個新的功能,可以幫助用戶更快地找到和處理大量照片中的特定信息。

  9. TPU第六代Trillium:提供強大的硬件支持,大幅提升性能和效率,為AI的訓練和運行提供保障。

和昨天的OpenAI的發布會進行對比,你覺得如何?各有各的優勢,谷歌的優勢在于技術能力還很強,而且基本盤很穩,比如把AI加到搜索,手機等,這是OpenAI沒辦法做到的,
而OpenAI的技術和創新力可以算行內第一,可以很快的做出許多新穎的產品。這波你怎么看?

地址:https://io.google/2024/intl/zh/

? 2: Hunyuan-DiT

具備中英雙語理解和多輪對話能力的多分辨率擴散式文本生成圖像模型

在這里插入圖片描述

騰訊宣布旗下的混元文生圖大模型升級并對外開源Hunyuan-DiT,Hunyuan-DiT是一款多分辨率擴散Transformer 模型,專門用于中文和英文文本到圖像的生成。它可以從輸入的文本描述生成高質量的圖像,并能夠處理多輪對話的文生圖任務(即根據用戶的多個連續輸入生成圖像)。

國內互聯網BAT巨頭,就只有B沒有開源了,哦,B在國內可能是2家公司。

地址:https://github.com/Tencent/HunyuanDiT

? 3: FunClip

基于阿里語音庫的開源、精準、適用于本地部署的視頻剪輯工具。

在這里插入圖片描述

FunClip

FunClip 是一款開源、精準、方便的視頻剪輯工具。它主要通過語音識別技術來幫助用戶剪輯視頻,并且用戶可以輕松選擇視頻中的某些片段或說話人進行裁剪。FunClip集成了阿里巴巴通義實驗室的 FunASR Paraformer 系列模型,能夠準確地識別視頻中的語音內容,生成時間戳,使得視頻剪輯更加方便。

通過FunClip,用戶無需了解復雜的視頻編輯技術,即可實現精準、快捷的視頻剪輯,非常適合需要頻繁處理視頻內容的工作場景。

地址:https://github.com/alibaba-damo-academy/FunClip

? 4: LLaVA-NeXT

一個強大的多模態大語言模型,支持圖像和視頻任務的零樣本推理

在這里插入圖片描述

LLaVA-NeXT 是一種開源的大型多模態模型,旨在提供強大的圖像和視頻理解能力。對于希望在實際應用中利用大型多模態模型的開發者和研究人員來說,LLaVA-NeXT 是一個非常有吸引力的選擇。

地址:https://github.com/LLaVA-VL/LLaVA-NeXT

? 5: Devon

更高效地編程和管理代碼庫

在這里插入圖片描述

Devon是一個開源的編程助手,旨在幫助開發者更高效地編程和管理代碼庫。使用Devon可以在很多情況下幫助你,比如當你需要編寫代碼、探索代碼庫、編寫配置文件、編寫測試、修復BUG或者探索軟件架構的時候。Devon能夠編輯多個文件,從而在整個代碼庫中提供幫助。然而,它主要針對Python語言,對于非Python語言的支持則有限。

無論你是在尋找幫助編寫代碼、優化你的工作流程還是想要加入一個開源項目并為之貢獻力量,Devon都可能是一個值得嘗試的工具。

在這里插入圖片描述

地址:https://github.com/entropy-research/Devon



更多AI工具,參考國內AiBard123,Github-AiBard123

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:
http://www.pswp.cn/diannao/12664.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/12664.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/12664.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

文獻檢索神器分享:一鍵篩選頂刊論文,還能免費下載全文!

我是娜姐 迪娜學姐 ,一個SCI醫學期刊編輯,探索用AI工具提效論文寫作和發表。 信息爆炸的時代,文獻是根本讀不完。一個關鍵詞能搜出來幾萬篇,而且有些結論還是完全相反的,到底該讀哪些? 第一步的文獻篩選很重…

Java面試八股之float和double的區別

Java中float和double的區別 存儲空間與精度: double:占據64位(8字節)存儲空間,屬于雙精度浮點數。它可以提供較高的精度,通常能夠精確表示大約15到17位十進制數字,適合用于需要較高精度計算或…

匯凱金業:3個高效的黃金投資技巧

黃金投資中的高效技巧往往承載了許多投資前輩的智慧與經驗教訓,成為新手投資者寶貴的學習資料。歷史上積累的黃金投資經驗可以作為新投資者的學習榜樣。 3個高效的黃金投資技巧 一、穩健的中長期投資策略 在金屬投資領域雖然不乏短線交易高手,但新手投資…

Cocos Creator 2D Mask與Layout 使用詳解

Cocos Creator是一款強大的2D游戲開發引擎,提供了豐富的功能和工具,使開發者可以輕松創建出高質量的游戲。其中,2D Mask和Layout是Cocos Creator中常用的兩個組件,它們可以幫助開發者實現更加復雜和精美的游戲界面設計。本文將詳細…

《Fundamentals of Power Electronics》——阻抗和傳遞函數的圖解構造

通常,我們可以通過觀察畫出近似的波德圖,而不需要大量雜亂的代數和不可避免的相關代數錯誤。使用這種方法可以對電路的工作原理有很大的了解。在不同頻率下,哪些元件主導電路響應變得很清楚,因此合適的近似變得很明顯。可以直接得…

JVM運行時內存:程序計數器

文章目錄 1. 程序計數器的作用2. 程序計數器的基本特征3. 程序計數器的問題 運行時內存整體結構如下圖所示: 1. 程序計數器的作用 為了保證程序(在操作系統中理解為進程)能夠連續地執行下去,CPU必須具有某些手段來確定下一條指令的地址。而程序計數器正是起到這種作…

WSL數據遷移(遷移ext4.vhdx)

WSL的ubuntu默認安裝在C盤,數據文件位于:C:\Users\hzgdi\AppData\Local\Packages\CanonicalGroupLimited.Ubuntu22.04LTS_79rhkp1fndgsc\LocalState\ext4.vhdx, 使用一段時間后,尤其時使用大量的docker image 和容器后,占用空間較…

【JavaScript】尺寸和位置

DOM對象相關的尺寸和位置屬性 用于獲取和修改元素在頁面中的尺寸和位置。 只讀屬性: clientWidth和clientHeight:獲取元素可視區域的寬度和高度(padding content),不包括邊框和滾動條。 offsetWidth和offsetHeight…

C# WinForm —— 15 DateTimePicker 介紹

1. 簡介 2. 常用屬性 屬性解釋(Name)控件ID,在代碼里引用的時候會用到,一般以 dtp 開頭Format設置顯示時間的格式,包含Long: Short: Time: Custom:采用標準的時間格式 還是 自定義的格式CustomFormat自定…

如何搭建本地DNS服務器

一、搭建本地DNS服務器 1.初始化設置 systemctl disable --now firewalld.service #關閉防火墻,并開機不自啟 setenforce 0 #臨時關閉selinux防火墻 vim /etc/selinux/config …

1727jsp思想政治活動Myeclipse開發mysql數據庫web結構java編程計算機網頁項目

一、源碼特點 JSP 思想政治活動管理系統 是一套完善的web設計系統,對理解JSP java編程開發語言有幫助,系統具有完整的源代碼和數據庫,系統采用web模式,系統主要采用B/S模式開發。開發環境為TOMCAT7.0,Myeclipse8.5開發&#xff…

ArcGIS軟件損壞怎么修復?10.7分享

前言 我們經常ArcGIS用著用著就會出現一些莫名奇怪的情況,比如ArcGIS的工具箱都打,字體丟失等、dll文件缺失。嘗試了很多方法之后沒有效果的,我們可以對軟件做修復 那么修復改如果做呢? 不需要卸載軟件,直接安裝deskt…

C語言編程資源分享 包管理器 內存泄露 串口通迅 編譯器GCC 靜態分析 x86匯編 第三方依賴 媒體處理 內存調試 性能工具 模糊測試

C語言編程資源分享 C語言是一種通用的、過程式的計算機編程語言,支持結構化編程、詞匯變量作用域和遞歸,是靜態類型檢查的。下面是一個簡單的C語言程序示例,它展示了如何編寫一個輸出“Hello, World!”的程序: #include <stdio.h> int main() {printf("Hello…

智慧安防監控EasyCVR視頻匯聚管理平臺視頻播放花屏的原因分析及處理

智慧安防監控EasyCVR視頻管理平臺能在復雜的網絡環境中&#xff0c;將前端設備統一集中接入與匯聚管理。國標GB28181協議視頻監控/視頻匯聚EasyCVR平臺可以提供實時遠程視頻監控、視頻錄像、錄像回放與存儲、告警、語音對講、云臺控制、平臺級聯、磁盤陣列存儲、視頻集中存儲、…

哪個牌子的超聲波清洗機好?四大質量出眾超聲波清洗機匯眾

由于科技的進步&#xff0c;超聲波清洗機已經成為了家庭和專業場所不可或缺的高效清潔工具。它利用超聲波波動產生的微小氣泡來清潔物品表面及細縫中的污漬&#xff0c;實現深層次的清潔效果。特別是對于眼鏡這樣的精密物品&#xff0c;定期進行深度清潔不僅能夠確保視覺的清晰…

Golang 實現枚舉

在Go語言中&#xff0c;沒有內置的枚舉&#xff08;enum&#xff09;類型&#xff0c;但你可以使用幾種不同的方法來模擬枚舉的行為。以下是一些常見的方法&#xff1a; 常量&#xff08;Constants&#xff09;: 你可以使用Go的常量來模擬枚舉。常量是一組固定的值&#xff0c;…

nginx 正向代理

前言: 為了防止自己手殘點了不該點的網站, 導致惡意網站獲取我的個人信息, 或者網站在暗處偷偷獲取我的個人數據, 我需要去關注這些網站同時拉黑這些網站 目標: 將瀏覽器發起的所有請求都經過 nginx 服務器進行轉發, 然后 nginx 需要記錄這些網址以及請求所攜帶的參數信息 成果…

32、Flink 的 DataStream API 物理分區算子詳解

3.物理分區 Flink 提供以下方法讓用戶根據需要在數據轉換完成后對數據分區進行更細粒度的配置。 a&#xff09;自定義分區 DataStream → DataStream 使用自定義的 Partitioner 為每個元素選擇目標任務。 dataStream.partitionCustom(partitioner, "someKey"); …

網絡安全從業者“行話”

目錄 ?編輯 一、攻擊篇 1&#xff0e;攻擊工具 2&#xff0e;攻擊方法 3&#xff0e;攻擊者 二、防守篇 1&#xff0e;軟硬件 2&#xff0e;技術與服務 網絡安全學習資源分享: 特別聲明 一、攻擊篇 1&#xff0e;攻擊工具 肉雞 所謂“肉雞”是一種很形象的比喻&…

【MATLAB】Enigma機加密原理與自實現

文章目錄 什么是EnigmaEnigma機加密通信流程Enigma的物理構造Enigma的加密設置Enigma加密通信密碼重新設置Enigma加密消息拼接注意 Enigma的解密分解設置Enigma解密通信密碼重新設置Enigma解密消息 Enigma的弱點MATLAB自實現Enigma加密與解密Enigma_functionRotate_functiontes…