通過 Amazon SageMaker JumpStart 部署 Llama 2 快速構建專屬 LLM 應用

888ece20dfe6f91795d00ac312634c93.gif

來自 Meta 的 Llama 2 基礎模型現已在 Amazon SageMaker JumpStart 中提供。我們可以通過使用 Amazon SageMaker JumpStart 快速部署 Llama 2 模型,并且結合開源 UI 工具 Gradio 打造專屬 LLM 應用。

Llama 2 簡介

Llama 2 是使用優化的 Transformer 架構的自回歸語言模型, ?旨在用于英文領域的商業和研究用途,其 context 長度是 Llama 1 代的兩倍。目前提供三種參數規格(7B、13B 和 70B)的基礎模型。

6fa5a202736677926f8150fa6f686788.jpeg

(來源:https://ai.meta.com/llama/)

使用 SageMaker JumpStart?

簡化大模型的部署

一站式開發平臺 Amazon SageMaker,是一個機器學習(ML)中心,提供預訓練模型、內置算法和預構建解決方案,能幫助您快速開始使用機器學習。在 SageMaker JumpStart 中提供了 6 個版本的 Llama-2 模型。

ac68e4afdcad81b59e04ce291af3f90f.jpeg

如果在您的 JumpStart 中沒有看到相關的模型,請確認您使用的區域是否已支持 Llama 2 (在 JumpStart 模型頁面查詢支持的區域)以及是否是最新版本的 Studio(可以通過關閉重啟來更新您的 SageMaker Studio 版本)。

下圖是在 SageMaker 中 Llama 2 的 6 個模型分別對應的 ID ,默認實例類型,以及每個模型支持的最大 token 數,通過 model_id 我們可以便捷地在 SageMaker Notebook 中啟動對應的模型。

5e94caeb56d268e90d14fdfe5e64cc7c.jpeg

方案概述

我們將在 SageMaker 上部署 Llama-2-7b-chat 模型, 并使 Gradio 構建前端頁面,打造一個輕量化的聊天助手。

1. 部署模型

在 SageMaker 中可以使用 JumpStart 或者 Notebook 來部署推理節點,這兩種方式我們都會展示。

1.1?SageMaker JumpStart 一鍵部署

在 SageMaker Studio 中您可以搜索到對應的模型, 點擊就可以進入對應的模型頁面。在這里我們使用了 Llama-2-7b-chat 的模型。

ea2b81e09223d75d6b435603e4cb95b5.jpeg

點擊 Deploy 即可以部署相關模型,部署時間大約 15 分鐘 – 20 分鐘左右,另外可以通過 Deployment Configuration 修改對應部署的實例類型。

1c0e615c7c26dd2b82a08b357616cc45.jpeg

在部署完成后,您可以看到對應的推理節點信息。

1.2?使用 SageMaker Notebook 部署

如何您使用了 JumpStart 部署則不需要通過 SageMaker Notebook 部署,直接跳到 2。

(1)設置模型 ID ,在這里我們選擇了 7b 規格的 chat 模型

d878c59a6bff315c1fdb957274edbc0d.jpeg

(2)部署指定的模型(meta-textgeneration-llama-2-7b-f)

397ff8d8f40e1ee0ffe48064276b11d6.jpeg

大約在 15 – 20 分鐘左右您可以部署完成,完成后在 Amazon Website Service 控制臺 SageMaker 頁面中的“終端節點”標簽下,可以看到目前已經被啟動的推理節點。

413559ae61e4ce5c346fafbc197ad397.jpeg

2. 設置模型的參數

b178337d15649dfe6e3f2782507b5129.jpeg

3. 啟動 Gradio 與部署完的模型進行交互

f772498ea33a29e16d18816933132b28.jpeg

在執行完以后 Gradio 提供了本地的 url 和在 Gradio 上托管的 url 供您使用。

a7c796e38612a20c4e85a3d3c426d4d5.jpeg

注意,您需要進行設置 custom_attributes=”accept_eula=true”才能成功調用推理端點。這樣做是確認接受 Llama 2 的用戶許可協議和使用政策。

完整的代碼可以參考鏈接:

https://github.com/tsaol/llama2-on-aws.git。

4. 測試

打開 Gradio 提供的鏈接,我們會看到一個聊天頁面,可以嘗試向 Llama 2 問些問題。

0702252ee9b929dc0ca49aceb3e12912.jpeg

5. 清理和刪除環境

7a576e2db8ba731724767bc3d897dc2b.jpeg

總結

本文介紹了如何使用 SageMaker JumpStart 以及 Notebook 部署 Llama 2 模型,結合 Gradio 輕松構建生成式 AI 應用。基于托管服務的特性讓您無需擔心底層基礎設施的搭建與運維,同時擁有良好的開源項目體驗。您還可以基于現有的方案進一步改造,打造專屬的大模型應用。

參考資料

https://aws.amazon.com/cn/about-aws/whats-new/2023/07/llama-2-foundation-models-meta-amazon-sagemaker-jumpstart/

https://dev.amazoncloud.cn/column/article/64bf831469c6a22f966a19f4

https://aws.amazon.com/cn/blogs/machine-learning/llama-2-foundation-models-from-meta-are-now-available-in-amazon-sagemaker-jumpstart/

https://arxiv.org/pdf/2307.09288.pdf

https://www.gradio.app/guides

https://ai.meta.com/llama/

本篇作者

8b984a7fcf0f26c761863edfc45790f8.jpeg

曹鎦

亞馬遜云科技解決方案架構師,負責企業信息化方案的咨詢和架構設計。超過 10 年的研發經驗,曾在大型國企和互聯網獨角獸任職,并主導百億級平臺的技術架構和數據架構的設計與落地。專注數智融合以及生成式 AI 方向,賦能企業創新成長。

4d31885605d645c6d60cb39eb6004024.gif

b2a5bccac3f93602333944b940126afe.gif

聽說,點完下面4個按鈕

就不會碰到bug了!

46172c2160ef4c346ad677c6c5d39ea9.gif

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/42455.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/42455.shtml
英文地址,請注明出處:http://en.pswp.cn/news/42455.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【JavaEE基礎學習打卡04】JDBC之MySQL數據庫安裝

目錄 前言一、JDBC與數據庫二、MySQL數據庫1.MySQL數據庫2.MySQL服務下載安裝3.MySQL服務啟動停止4.MySQL命令 三、MySQL客戶端安裝總結 前言 📜 本系列教程適用于JavaWeb初學者、愛好者,小白白。我們的天賦并不高,可貴在努力,堅持…

【 Cocos Creator 項目實戰】益智游戲《2048》(附帶完整源碼工程)

本文乃Siliphen原創,轉載請注明出處 目錄 游戲介紹 概述 游戲整體流程 游戲框架設計 主要流程控制類 本文項目的代碼組織結構 構建游戲世界 數字方塊 地圖 觸摸手勢識別 防觸摸抖動 判斷用戶輸入的方向 地圖 任意大小的地圖 初始化地圖大小 地圖繪制…

數據結構----結構--線性結構--棧,隊列

數據結構----結構–線性結構–棧,隊列 一.棧:Stack 1.棧的特點: ? 先進后出:FILO(對一組數據有倒敘要求時可以用棧) 2.棧的實現 順序存儲:數組實現: ? 缺點:空間…

無涯教程-Perl - sysread函數

描述 該函數等效于C /操作系統函數read(),因為它繞過了諸如print,read和seek之類的函數所采用的緩沖系統,它僅應與相應的syswrite和sysseek函數一起使用。 它從FILEHANDLE中讀取LENGTH個字節,并將輸出放入SCALAR中。如果指定了OFFSET,則將數據從OFFSET字節寫入SCALAR,從而有效…

IC流程中 DFT 學習筆記(2)

引言 DFT是ASIC芯片設計流程中不可或缺的環節。其主要目的是在芯片前端設計驗證完成后插入一些諸如寄存器鏈等可供測試的邏輯,算是IC后端設計的范疇,屬于結構測試而非功能測試。主要是在ASIC芯片流片完成后,通過這些已插入的邏輯&#xff0c…

手機照片誤刪怎么辦,電腦照片誤刪怎么辦怎么才能找回,EasyRecovery來幫您

手機照片誤刪怎么辦,電腦照片誤刪怎么辦怎么才能找回,EasyRecovery 2023來幫您!!! EasyRecovery 2023是一款操作安全、價格便宜、用戶自主操作的 數據恢復 方案,它支持從各種各樣的 存儲介質 恢復刪除 或者…

Vue3.X 創建簡單項目

一、環境安裝與檢查 首先,我們要確保我們安裝了構建vue框架的環境,不會安裝的請自行百度,有很多安裝教程。檢查環境 node -v # 如果沒有安裝nodejs請安裝,安裝教程自行百度 vue -V# 沒有安裝,請執行npm install -g v…

Cesium for unity 1.5.0使用注意事項

Cesium for Unity Quickstart – Cesium 1.Unity版本僅支持Unity2021.3.2f1以后版 2.僅支持 3D (URP)和3D (HDRP)渲染管線 3.如果Package Manager中不出現My Registries選項,請在 Edit > Project Settings...>Package Manager中重命名或刪除重新添加Packag…

深入淺出PHP封裝根據商品ID獲取淘寶商品詳情數據方法

要通過淘寶的API獲取商品詳情,您可以使用淘寶開放平臺提供的接口來實現。以下是一種使用PHP編程語言實現的示例,展示如何通過淘寶開放平臺API獲取商品詳情: 首先,確保您已注冊成為淘寶開放平臺的開發者,并創建一個應用…

【微服務實戰】01-工程結構概覽

文章目錄 工程結構概覽:定義應用分層及依賴關系1.應用分層2.定義Entity3.倉儲層3.1 工作單元:事務管理3.2 倉儲層 4.領域事件5.APIController最佳實踐 工程結構概覽:定義應用分層及依賴關系 1.應用分層 領域模型層基礎設施層 ? 倉儲應用層 ? Api、后臺任務Job共…

TCP服務器實現—多進程版,多線程版,線程池版

目錄 前言 1.存在的問題 2.多進程版 3.多線程版 4.線程池版 總結 前言 在上一篇文章中使用TCP協議實現了一個簡單的服務器,可以用來服務端和客戶端通信,但是之前的服務器存在一個問題,就是當有多個客戶端連接服務器的時候,服…

002-Spring boot 自動配置相關分析

目錄 自動配置 EnableAutoConfiguration開啟自動配置讀取配置提前過濾自動配置配置包 AutoConfigurationPackage 自動配置 EnableAutoConfiguration 開啟自動配置 在Spring 啟動類上的 SpringBootApplication 中有 EnableAutoConfiguration 讀取配置 Import(AutoConfigurat…

后端返回圖片,前端接收并顯示的解決方案

后端圖片數據返回 后端通過二進制流的形式,寫入response中 controller層 /*** 獲取簽到二維碼*/GetMapping("/sign-up-pict")public void signUpPict(Long id, Long semId, HttpServletResponse response) throws NoSuchAlgorithmException {signUpServ…

musl libc ldso 動態加載研究筆記:01

前言 musl 是一個輕量級的標準C庫,建立在系統調用之上,可以認為是【用戶態】的C 庫,與 glibc 或者 uClibc 屬于同一類。 基于 musl 的 gcc 工具鏈包括交叉編譯工具鏈,可以用于編譯 Linux 或者其他的操作系統,如當前 L…

深入解析 MyBatis 中的 <foreach> 標簽:優雅處理批量操作與動態 SQL

在當今的Java應用程序開發中&#xff0c;數據庫操作是一個不可或缺的部分。MyBatis作為一款頗受歡迎的持久層框架&#xff0c;為我們提供了一種優雅而高效的方式來管理數據庫操作。在MyBatis的眾多特性中&#xff0c;<foreach>標簽無疑是一個強大的工具&#xff0c;它使得…

構建可遠程訪問的企業內部論壇

文章目錄 前言1.cpolar、PHPStudy2.Discuz3.打開PHPStudy&#xff0c;安裝網頁論壇所需軟件4.進行網頁運行環境的構建5.運行Discuz網頁程序6.使用cpolar建立穿透內網的數據隧道&#xff0c;發布到公網7.對云端保留的空白數據隧道進行配置8.Discuz論壇搭建完畢 前言 企業在發展…

Python中import模塊導入的實現原理

歡迎關注博主 Mindtechnist 或加入【Linux C/C/Python社區】一起探討和分享Linux C/C/Python/Shell編程、機器人技術、機器學習、機器視覺、嵌入式AI相關領域的知識和技術。 Python中import模塊導入的實現原理 什么是模塊import搜索路徑import導入模塊的原理圖書推薦 專欄&…

京東門詳一碼多端探索與實踐 | 京東云技術團隊

本文主要講述京東門詳業務在支撐過程中遇到的困境&#xff0c;面對問題我們在效率提升、質量保障等方向的探索和實踐&#xff0c;在此將實踐過程中問題解決的思路和方案與大家一起分享&#xff0c;也希望能給大家帶來一些新的啟發 一、背景 1.1、京東門詳介紹 1.1.1、京東門…

VB+SQL上機考試系統設計與實現

摘 要 隨著計算機技術的迅猛發展,學校教學和管理的信息化發展也有長足的進步,這就要求各個環節都均衡發展,從軟硬件雙方面把學校建設成一流的信息管理、教育教學的平臺。本文設計開發的考試管理系統也是其中重要的一個方面。該系統本著減輕教師工作負擔、提高工作效率、優…

六、分組背包

六、分組背包 題記算法題目代碼 題記 一個旅行者有一個最多能裝V公斤的背包和有N件物品&#xff0c;它們的重量分別是W[1]&#xff0c;W[2]&#xff0c;…,W[n]&#xff0c;它們的價值分別為C[1],C[2],…,C[n]。這些物品被劃分為若干組&#xff0c;每組中的物品互相沖突&#…