5月14日,微軟在官網宣布,OpenAI最新發布的多模態模型GPT-4o,可以在 Azure OpenAI 云服務中使用。
據悉,GPT-4o支持跨文本、視頻、音頻多模態推理,例如,通過GPT-4o打造一個AI助手,用于輔導孩子解答數學題或者進行實時翻譯。
微軟和OpenAI一樣出于安全考慮只開放了GPT-4o的文本和圖像分析功能。未來幾周內會陸續開放視頻、音頻解讀功能,使用范圍也會從美國擴大至更多的國家。
此外,微軟會在5月21—23日西雅圖舉辦的 “2024 Build” 全球開發者大會上,介紹更多與GPT-4o相關的創新內容。
申請試用地址:https://aka.ms/oai/access
微軟build大會活動介紹:https://build.microsoft.com/en-US/home
OpenAI發布的最新大模型GPT-4o再一次在全球范圍內引起熱議,其強大的多模態解讀、輸出能力非常驚艷,在場景化落地方面甚至比Sora更寬廣、實用。
例如,GPT-4o支持的最新ChatGPT可以通過語音、視頻模式,輔導孩子解答數學題。在整個過程可以實現1V1保姆式輔導,孩子做一步AI就會解答一下。
這樣做的好處有很多一方面可以擴展孩子的解題思維;另一方面,可以讓孩子深度了解這道題的原理與機制。目前多數AI助手都很難做到。
把GPT-4o當成學習機也沒問題,例如,學習西班牙語言,把一些蘋果、香蕉通過視頻讓GPT-4o看到,然后讓其用標準的西班牙語說出來。這不僅能學習到詞匯,就連口語都一起練了。
我們去面試的時經常會為形象發愁,我到底該穿西裝還是休閑服呢?應該如何搭配顏色,才能給人更好的第一印象呢?
現在有了GPT-4o就方便的多。可以告訴它你今天要面試的行業,然后再通過視頻讓它評價你的形象以及如何改進。就像鋼鐵俠的賈維斯一樣為你提供各種建議,當你的生活小秘書。
GPT-4o不僅在視頻、音頻表現出了強大性能,在圖片方面也實現了大幅度提升。例如,將現實照片直接轉換成漫畫風格的圖片。
讓GPT-4o創作一枚紀念幣:我想創作一個矢量圖形,上面描繪著OpenAI的標志,下面寫著GPT-4o。標志的寬度與文本大致相同。
邊框周圍的邊距是均勻的。標志和文本靠近放置,中間沒有間隔或線條。背景是黑色的,標志和文本填滿了正方形的畫布,同時加入兩張參考圖片。
GPT-4o很快就會根據你輸入的要求,輸出一張矢量的紀念幣設計創意圖。如果不滿意,可以在此基礎之上繼續修改直到滿足需求為止。
微軟表示,GPT-4o的推出將對各行業帶來變革性體驗和更多的業務嘗試,例如,將GPT-4o與客戶系統相結合,為用戶提供擬人化實時的服務,并通過強大的AI分析能力為決策者制定各種計劃提供數據支撐。
本文素材來源微軟官網,如有侵權請聯系刪除
END