解決生成式AI落地之困,亞馬遜云科技提供完整解決方案

生成式AI技術無疑是當前最大的時代想象力之一。

?資本、創業者、普通人都在涌入生成式AI里去一探究竟:“百模大戰”連夜打響,融資規模連創新高,各種消費類產品概念不斷涌現……根據Bloomberg Intelligence 的報告,2022年生成式AI 市場規模僅為400 億美元,預計到2032年這一數字將突破1.3 萬億美元,未來10 年的年均復合增速高達42%。

?然而,表面上看著熱鬧非凡,但生成式AI技術的普及和轉化真的有我們想象的那么高嗎?

?在經歷了爆發式增長之后,6月以來,生成式AI聊天產品訪問量幾乎都出現了不同程度的下降。最新用戶調查顯示,有80%-90%以上的受訪者表示未來六個月都完全不會使用ChatGPT、Bard等聊天工具。從消費端看,大家目前似乎更多地把生成式AI產品當成了一種追趕時尚潮流的玩具,而非持續使用的工具。

?而在企業端,這樣的現象就更為明顯。一旦人們切換到工作模式時,生成式AI工具便很少出現在大家的工作流程中,甚至還被很多大型公司等明令禁止或限制性使用。

?

?對于一個比較成熟技術的商業轉化來說,6個多月的時間并不算短。但目前,關于生成式AI的狂想焦點似乎仍然還停留在大模型和產品概念上,人們預期所想看到的繁榮生態和對經濟社會所產生的變革性影響還尚未到來。

?那么,究竟是什么桎梏著它的發展?

?生成式AI的落地之困:如何打破基礎模型和開發者之間的“墻”?

?所有人都不想錯過生成式AI浪潮。但當前生成式AI的超高進入門檻,把大部分玩家擋在了門外。

?過去這些年來,通過“深度學習+大算力”進行模型訓練是實現人工智能最主流的技術途徑。但大模型的商業化落地,必須得先回到成本核算上。

?首先,大模型對算力的需求極大,是一個巨型“吞金獸”。GPT-3.5模型的訓練一次的成本約在300萬到460萬美元之間,一些更大的語言模型訓練成本甚至高達1200 萬美元。自研大模型是一個“無底洞”,不具備雄厚資金實力的創業公司根本無法承擔。

?此外,通用模型并不能解決所有問題,能幫企業完成的事情非常有限。大模型的訓練都是基于互聯網上的公開數據完成,很多產品也相對孤立沒有形成一個連貫的、整體的工作流,不具備定制化能力。意味著開發人員需要結合私有數據做大量個性化調試,開發訓練門檻極高。

?而由于前期的巨額投入,就算大模型開始商業化之后,要實現盈利也往往需要長時間的積累。因此,要想生成式AI技術真正落地到各行各業中發揮效力,當前急需一種可負擔、高效率、低門檻的解決方案,讓更多人參與到入生成式AI的開發中來。

?那么,如何才能彌合從基礎模型到終端應用之間的鴻溝?目前來看,提供一站式AI專業托管服務的云平臺或許是當前的最佳解決路徑。

?云平臺擁有充足、靈活的算力資源,中小型企業不必自行購買和維護昂貴的硬件設備,即可滿足個性化的開發需求。用戶可以通過 API和SDK,便捷地調用云平臺上的第三方資源和大包服務,將他們的應用和服務與云平臺無縫銜接,最大化簡化開發流程。

?此外,云平臺還能夠幫助解決數據的隱私安全問題。過去幾個月來,包括蘋果、三星、臺積電、美國銀行等很多大型企業都相繼出臺相關政策明令禁止員工使用ChatGP,紛紛開始自研大模型。而對于那些不具備自研實力的中小型企業來說,選擇能夠提供包括數據加密、身份驗證、合規性工具等安全措施的云平臺則是一個很好的低成本選項。

?針對當前的生成式AI浪潮,云平臺是否已經具備大模型開發的相當能力,能夠提供生成式AI的全流程服務呢?

?在剛剛落幕的亞馬遜云科技紐約峰會上,我們看到了一份基于云的生成式AI完整解決方案。

?亞馬遜云科技,創建生成式AI普惠新范式

?此次,亞馬遜云科技延續了過去一貫的“務實”風格,瞄準當前生成式AI應用轉化所面臨的痛點問題,上新了一系列全新的功能和服務。從硬件到軟件,從開發端到應用端,試圖打造一個功能最全、能力最強的生成式AI服務平臺。

  • Amazon Bedrock服務:搭建生成式AI開發的“快速通道”

?針對開發層面基礎模型訓練成本昂貴、環境部署復雜的問題,今年4月,亞馬遜云科技首次宣布推出Amazon Bedrock服務,允許用戶通過可擴展、可靠且安全的亞馬遜云科技托管服務,用API來便捷地訪問來自不同供應商的基礎模型,并利用它們來構建生成式AI應用程序。

?當時,除了自家的Titan大模型之外,首發第三方合作商及基礎模型還包括AI21 Labs的Jurassic-2,Anthropic的Claude,以及Stability AI的Stable Diffusion。在這次的紐約峰會上,亞馬遜宣布再次增加前生成式AI領域的最大獨角獸之一的Cohere作為供應商,也新增了包括Anthropic最新的語言模型 Claude 2,和Stability AI最新版文生圖模型套件 Stable Diffusion XL 1.0等基礎模型。

?亞馬遜云科技認為,未來一定不會是一個模型統管一切,Amazon Bedrock通過不斷集成業界最領先的基礎模型,用戶將可以根據自身需求來便捷地調用最合適的模型。

?但基礎模型有了之后,還有一個棘手的問題沒有解決——如何使用這些模型進行個性化的應用開發?云平臺還要進一步解決私有數據學習、系統集成和調試以及任務自動執行的問題。

?舉一個我們在日常生活中經常會遇到的電商退換貨的例子。你在電商平臺買了雙鞋子不太滿意想要找客服換一個顏色,如果此時客服是ChatGPT等通用聊天機器人,他會怎么回答你?——“抱歉,我的訓練數據截止日期是2021年9月,沒有這雙鞋的相關信息。”

?要想讓大模型真正發揮作用,首先要做的就是提前把公司內部跟這雙鞋所有有關的信息都“喂”給模型,包括鞋的型號顏色、平臺的退換貨政策、庫存信息等等,模型才能準確地給出反饋。在給出信息的同時,還需要AI一邊聊天一邊能在后臺有序、安全地執行有關換貨的所有操作。

?在過去這對于開發者來說是一個龐大的工程,但現在,亞馬遜新推出了一項名為Amazon Bedrock Agents服務,讓這一切變得觸手可及。

?最新的Amazon Bedrock Agents服務能夠在基礎模型的基礎上,把對話的定義、模型外部信息獲取和解析、API調用、任務執行等打包成為一個全托管式的服務,從而能夠及時、有針對性的輸出結果。

?如此一來,開發者不必重巨資從頭開發自己的基礎模型,也不要花費大量的時間和人力去進行模型的個性化部署和調試,從而能讓開發者把更多的精力放在AI應用的構建和運營上,讓不具備雄厚資金和技術實力的中小型開發者都可以加入到生成式AI浪潮中來。

  • “向量數據+硬件算力”雙護航,鑄造應用開發的最強大腦+最強底座

?進行模型的定制開發,除了需要如Amazon Bedrock這樣的專業托管服務,也需要計算、存儲、安全等其他相關能力,來保證模型的持續可用、和迭代升級。

?毋庸置疑,數據是人工智能出現和發展的基底。生成式AI為了學習和理解人類語言的復雜性,需要大量的訓練數據,而這些訓練數據通常是以“向量”的形式存在,也就是把自然語言轉化為計算機可以理解和處理的數字。

?那么,什么是向量數據,為什么它對生成式AI的發展至關重要呢?

?假設你正在使用一個音樂推薦軟件,我們可以把每首歌分別按照節奏、歌詞、旋律等三個特征進行量化標記,比如第一首歌是(120,60,80),第二首歌是(100,80,70),當你告訴系統你喜歡第一首歌的節奏時,系統便會找到這首歌的節奏向量數據“120”,在數據庫中查找與這個向量相似的其他向量,接著再把有相似特征的歌曲推薦給你。

?當然,不止是三維,一個數據還可以被標注成更多緯度。在自然語言處理中,使用詞嵌入技術表示的“詞向量”通常是幾百維的,而在圖像處理中,使用像素值表示的圖像向量可能有數千到數百萬的維度。被“向量化”之后的數據將被存儲在向量數據庫之中,在高維空間中去高效地檢索和生成最相關或最相似的數據。

?然而,要將數據進行向量化處理和儲存并不是一件容易的事,往往要耗費大量的人力和時間。針對這一問題,亞馬遜云科技此次推出了適用于 Amazon OpenSearch Serverless 的向量引擎,該向量引擎能夠支持簡單的 API 調用,可用于存儲和查詢數十億個 Embeddings(將高維度的數據映射到低維度空間的過程)。亞馬遜云科技還表示,未來所有亞馬遜云科技的數據庫都將具有向量功能,在AI數據層面成為開發者的“最強大腦”。

?

?除了向量引擎的支持,在算力層面,亞馬遜云科技也一直致力于構建低成本、低延遲的云上基礎設施。

?亞馬遜云科技和英偉達合作已超過12年,為人工智能、機器學習、圖形、游戲和高性能計算等各種應用提供了大規模、低成本的 GPU 解決方案,在交付基于 GPU 的實例方面擁有無比豐富的經驗。此次,亞馬遜云科技展示了最新基于英偉達 H100 Tensor Core GPU 提供支持的P5實例,能夠實現更低的延遲和高效的橫向擴展性能。

?P5 實例將是第一個利用亞馬遜云科技第二代 Amazon Elastic Fabric Adapter(EFA)網絡技術的 GPU 實例。與上一代相比,P5實例的訓練時間最多可縮短6倍,從幾天縮短到幾小時,這一性能提升將幫助客戶降低高達40%的訓練成本。借助第二代 Amazon EFA,用戶能夠將其 P5 實例擴展到超過 2 萬個英偉達 H100 GPU,為包括初創公司、大企業在內的所有規模客戶提供所需的超級計算能力。

  • 降低生成式AI門檻,用產品最大化賦能用戶

?除了面向生成式AI開發的工具和平臺之外,在企業的日常運營之中需要一些能夠拿來即用的生成式AI產品,來幫助提升工作和管理效率。關于這一點,亞馬遜云科技也陸續推出了一些在工作場景中直接可以使用的產品,這些產品既覆蓋底層開發人員也關注到了企業中大量的非技術人員。

?比如在代碼開發領域,自從亞馬遜云科技在去年6月首次推出AI編程助手Amazon CodeWhisperer之后,現在該功能已經成為了很多開發者日常必備工具之一。

?Amazon CodeWhisperer基于幾十億行開源代碼訓練,可以根據代碼注釋和現有代碼實時生成代碼建議,另外還能進行安全漏洞掃描。目前支持包括 Python、Java 和 JavaScript 15 種編程語言和包括 VS Code、IntelliJ IDEA、JupyterLab 和 Amazon SageMaker Studio等集成開發環境。

?為了進一步提高開發效率,在紐約峰會上,亞馬遜云科技正式宣布 Amazon Glue Studio Notebooks 也能支持 Amazon CodeWhisperer。通過 Amazon Glue Studio Notebooks,開發人員可以用自然語言編寫特定任務,接著Amazon CodeWhisperer 可以直接在 Notebooks 中推薦一個或多個可完成此任務的代碼片段,供開發人員直接使用和編輯。

Amazon CodeWhisperer支持語言和環境,圖片來自亞馬遜云科技官網

?而對于非開發類工作場景,通過將 Amazon Bedrock的大語言模型能力與支持自然語言問答的 Amazon QuickSight Q 相結合,為用戶提供了基于生成式AI的商業智能新服務。

?比如你是一個財務分析師,你可以像跟ChatGPT聊天一樣用自然語言下達命令,在幾秒鐘內Amazon QuickSight Q就能完成搜索關鍵財務信息或創建公司財務可視化圖表的操作,同時還能幫你總結出趨勢特點并提出建議。

?類似拿來即用的產品還有幫助企業打破內部信息孤島、加快數據驅動決策的Amazon Entity Resolution,以及能夠幫助醫療軟件供應商便捷地構建基于生成式AI的臨床應用程序的Amazon HealthScribe等等,在各行各業擴大著生成式AI產品的使用場景。

?釋放AI時代的“云力量”

?生成式AI的發展需要云,更需要大量基于云的工具和服務。

?大模型之后,下一階段生成式AI技術一定會朝著多樣性和個性化方向發展,我們既可以看到比較通用的生產力工具,也會看到各種瞄準特定場景的AI產品。而在這個過程中,云平臺會起到越來越關鍵的作用。

?一方面,云平臺會大大降低AI應用開發的門檻。在平臺的算力和基礎模型支持下,開發者們基本無需關心硬件和基礎設施的問題,從而把更多的時間和精力放在業務和運營上。另一方面,云平臺能夠持續加快AI應用的開發和運營效率。用戶可以通過直接調用API的方式進行應用的開發和管理,并安全、便捷地在團隊或組織之間共享。

?在云平臺的助力之下,未來的生成式AI將不再只是一場巨頭才能玩的“燒錢游戲”,更多普通人也將可以坐上牌桌。

?作為云服務領域的行業領導者之一,亞馬遜云科技提供了200多種服務,涵蓋了計算、存儲、數據庫、網絡、開發者工具、安全、分析、物聯網、企業應用等廣泛領域,云基礎設施覆蓋全球。同時,亞馬遜云科技還是人工智能和機器學習領域的領先者,多年來持續提供和更新著一系列端到端的AI相關服務,讓開發者可以靈活、便捷、低成本的開發和部署生成式AI應用。

?此次,亞馬遜云科技發布生成式AI工具“全家桶”,其核心目的就是要進一步降低生成式AI開發的門檻,讓更多不懂大模型、不懂人工智能的普通人也能快速加入生成式AI的開發和應用之中。

?生成式AI的重要性不在于模型有多大能力有多強,更重要的還是如何能夠從基礎模型演變成各個領域中的具體應用,從而賦能整個經濟社會的發展。

?現在,亞馬遜云科技正在成為那個橋梁。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/37812.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/37812.shtml
英文地址,請注明出處:http://en.pswp.cn/news/37812.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

文件操作/IO

文件 文件是一種在硬盤上存儲數據的方式,操作系統幫我們把硬盤的一些細節都封裝起來了,程序員只需要了解文件相關的接口即可,相當于操作文件就是間接的操作硬盤了 硬盤用來存儲數據,和內存相比硬盤的存儲空間更大,訪問…

使用FTP文件傳輸協議的潛在風險

數據(事實,數字,價值)是當今業務運行的核心要素。但是,如果數據沒有得到有效的存儲和傳輸,它們就會成為阻礙業務發展的障礙。如果企業不能及時地把數據送到合適的地方,就會造成嚴重的經濟損失。…

【skynet】skynet 入門代碼

寫在前面 本文將從零開始,寫第一個 skynet 程序 HelloWorld 。通過 HelloWorld 可以熟悉 skynet 的運作方式,和了解其 api 。 文章目錄 寫在前面準備工作編寫代碼運行結果 準備工作 首先要有一個編譯好,而且工作正常的 skynet 。 編寫代碼…

【Linux】Shell腳本之流程控制語句 if判斷、for循環、while循環、case循環判斷 + 實戰詳解[?建議收藏!!?]

👨?🎓博主簡介 🏅云計算領域優質創作者 ??🏅華為云開發者社區專家博主 ??🏅阿里云開發者社區專家博主 💊交流社區:運維交流社區 歡迎大家的加入! 🐋 希望大家多多支…

.bit域名調研

.bit域名研究 問題: .bit域名和ENS域名的相同點?不同點?有什么關系? .bit的定義 .bit 是基于區塊鏈的,開源的,跨鏈去中心化賬戶系統.bit 提供了以 .bit 為后綴的全局唯一的命名體系,可用于加密…

安全第二次

一&#xff0c;iframe <iframe>標簽用于在網頁里面嵌入其他網頁。 1&#xff0c;sandbox屬性 如果嵌入的網頁是其他網站的頁面&#xff0c;因不了解對方會執行什么操作&#xff0c;因此就存在安全風險。為了限制<iframe>的風險&#xff0c;HTML 提供了sandb…

分布式應用:Zabbix監控MariaDB

目錄 一、理論 1.Zabbix監控MariaDB 二、實驗 1.Zabbix監控MariaDB 一、理論 1.Zabbix監控MariaDB &#xff08;1&#xff09;環境 zabbix服務端&#xff1a;192.168.204.214 zabbix客戶端&#xff1a;192.168.204.215 &#xff08;2&#xff09;MareaDB安裝 安裝 za…

做海外游戲推廣有哪些條件?

做海外游戲推廣需要充分準備和一系列條件的支持。以下是一些關鍵條件&#xff1a; 市場調研和策略制定&#xff1a;了解目標市場的文化、玩家偏好、競爭格局等是必要的。根據調研結果制定適合的推廣策略。 本地化&#xff1a;將游戲內容、界面、語言、貨幣等進行本地化&#…

使用ip2region獲取客戶端地區

目錄 從gitee拉取ip2region.xdb資源文件 寫測試類 注意要寫對資源路徑 本地測試結果 ?編輯 遠端測試結果 從gitee拉取ip2region.xdb資源文件 git clone https://gitee.com/lionsoul/ip2region.git 將xdb放入resources資源文件夾 引入依賴 <dependency><groupId&…

由淺入深C系列五:使用libcurl進行基于http get/post模式的C語言交互應用開發

使用libcurl進行基于http get/post模式的C語言交互應用開發 簡介環境準備在線資源示例代碼測試調用運行結果 簡介 大多數在linux下的開發者&#xff0c;都會用到curl這個命令行工具。對于進行restful api的測試等&#xff0c;非常方便。其實&#xff0c;這個工具還提供了一個C…

Python中單引號、雙引號和三引號的區別

① 單引號和雙引號主要用來表示字符串 # 單引號 astr = Python print(type(astr)) # <class str># 雙引號"" bstr = "Python" print(type(bstr)) # <class str> str1 = I\m a big fan of Python. print(str1) # Im a big fan of Python.s…

[HDLBits] Exams/m2014 q4d

Implement the following circuit: module top_module (input clk,input in, output out);always(posedge clk) beginout<out^in;end endmodule直接寫out^in就行

Vue 使用 vite 創建項目

vite 是新一代前端構建工具&#xff0c;和 webpack 類似。 vite 的啟動速度更快。在開發環境中&#xff0c;不需要打包就可以直接運行。 vite 的更新速度更快。當修改內容后&#xff0c;不需要刷新瀏覽器&#xff0c;頁面就會實時更新。 vite 完全是按需編譯。它只會編譯需要…

【考研數學】高等數學第三模塊——積分學 | Part II 定積分(反常積分及定積分應用)

文章目錄 前言三、廣義積分3.1 斂散性概念&#xff08;一&#xff09;積分區間為無限的廣義積分&#xff08;二&#xff09;積分區間有限但存在無窮間斷點 3.2 斂散性判別法 四、定積分應用寫在最后 前言 承接前文&#xff0c;梳理完定積分的定義及性質后&#xff0c;我們進入…

企業網盤 vs 傳統存儲設備:為何云存儲成為首選?

企業網盤的出現為企業提供了新的存儲方式&#xff0c;相較于傳統的存儲設備&#xff0c;為何越來越多的企業選擇了云存儲呢&#xff1f; 一、存儲成本 在企業數據存儲方面&#xff0c;成本是企業重要的考量因素。企業網盤是基于云存儲技術的存儲工具&#xff0c;因此它比傳統的…

基于DBN的偽測量配電網狀態估計,DBN的詳細原理

目錄 背影 DBN神經網絡的原理 DBN神經網絡的定義 受限玻爾茲曼機(RBM) DBN的偽測量配電網狀態估計 基本結構 主要參數 數據 MATALB代碼 結果圖 展望 背影 DBN是一種深度學習神經網絡,擁有提取特征,非監督學習的能力,是一種非常好的分類算法,本文將DBN算法偽測量配電網…

Netty:ByteBuf的資源釋放方法

說明 io.netty.buffer.ByteBuf實現了io.netty.util.ReferenceCounted接口&#xff0c;需要顯式釋放。當ByteBuf被實例化后&#xff0c;它的引用計數是1。 調用ByteBuf對象的release方法釋放&#xff1a; ByteBuf的release()方法使引用計數減少1。只有當執行以后引用計數減少…

OpenZFS 2.2 發布 RC3,支持 Linux 6.4

導讀之前的 OpenZFS 2.2 候選版本已致力于實現與 Linux 6.4 內核的兼容性&#xff0c;而在 2.2-rc3 中&#xff0c;Linux 6.4 支持的元跟蹤器已標記為已完成。 OpenZFS 2.2 發布了第 3 個 RC 版本。 之前的 OpenZFS 2.2 候選版本已致力于實現與 Linux 6.4 內核的兼容性&#x…

Vue3 引用第三方Swiper內容觸摸滑動簡單應用

去官網查看更多教程→&#xff1a;Swiper官網 → 點擊教程在vue中使用Swiper→ 在Vue中使用Swiper cd 到項目 安裝Swiper&#xff1a; cnpm install --save swiper 安裝指定版本 cnpm install --save swiper8.1.6 9.4.1 10.1.0…

SpringBoot-Hello World

SpringBootWeb快速入門 創建Springboot工程&#xff0c;并勾選web開發相關依賴定義HelloController類&#xff0c;添加方法hello&#xff0c;并添加相關注釋運行測試 創建新的SpringBoot項目 幾個注意的點&#xff1a; Name&#xff1a;基本上不用管&#xff0c;會根據下面的Ar…