【AWS入門】Amazon SageMaker簡介

【AWS入門】Amazon SageMaker簡介

[AWS Essentials] Brief Introduction to Amazon SageMaker

By Jackson@ML

機器學習(Machine Learning,簡稱ML) 是當代流行的計算機科學分支技術。通常,人們在本地部署搭建環境,以滿足機器學習的要求。
AWS是Amazon Web Service,即亞馬遜云科技,其提供給用戶超過200種云產品和服務。用戶無需搭建硬件環境,就可以實現科學計算、數據分析、項目開發和運維、大數據、無服務器應用開發、人工智能等一系列技術創新和迭代。

訪問AWS官網,可以看到Amazon SageMaker主頁面。

在這里插入圖片描述
圖1 Amazon SageMaker主頁面

AWS提供了機器學習的專有產品和服務,就是 Amazon SageMaker,利用業界先進的AI技術,在云平臺上應用和完成機器學習。

1. 什么是Amazon SageMaker?

Amazon SageMaker AI 是一項云托管服務,它對機器學習 (ML) 服務完全托管。借助 SageMaker AI,廣大用戶包括數據科學家、人工智能專家、軟件開發者,均可以快速、便捷地構建和訓練 ML 模型,并將其快速部署到生產環境中。

Amazon SageMaker AI為運行 ML 工作流提供了用戶界面體驗,使 SageMaker AI ML 工具可在多個集成開發環境 (IDE) 中使用。

有了 SageMaker AI,用戶就可以存儲和共享數據,而無需構建和管理自己的服務器。這樣,企業或用戶就有更多時間來協作構建和開發特定功能的 ML 工作流程,并且可以高效完成工作。

SageMaker AI提供受控的ML算法,可在分布式環境中針對超大數據量運算高效運行。SageMaker AI 內置支持自帶算法和框架,提供靈活的分布式訓練選項,可根據用戶需要的特定工作流程進行調整。用快捷的步驟,就能從 SageMaker AI 控制臺將模型部署到安全、可擴展的環境中。

2. Amazon SageMaker主要功能

1) Amazon SageMaker新版發布

2024 年 12 月 03 日,AWS亞馬遜云科技發布了新一代 Amazon SageMaker。

Amazon SageMaker 是數據、分析和人工智能的統一平臺。新一代 SageMaker 集合了 AWS 機器學習和分析功能,為分析和人工智能提供了集成體驗,可統一訪問您的所有數據。

2) Amazon SageMaker 包括以下功能:
  • Amazon SageMaker AI(前身為 Amazon SageMaker)- 利用完全托管的基礎架構、工具和工作流,構建、訓練和部署 ML 和基礎模型;
  • Amazon SageMaker Lakehouse - 跨 Amazon S3 數據湖、Amazon Redshift 和其它數據源統一數據訪問;
  • Amazon SageMaker 數據和 AI 治理 - 利用基于 Amazon DataZone 構建的 Amazon SageMaker Catalog 安全地發現、治理和協作數據和 AI;
  • SQL 分析結構化查詢語言(Structured Query Language)即SQL,是關系型數據庫必不可少的語言。 借助 Amazon Redshift 最具性價比的 SQL 引擎獲得洞察力;
  • Amazon SageMaker 數據處理 - 使用 Amazon Athena、Amazon EMR 和 AWS Glue 上的開源框架分析、準備和集成數據,以進行分析和人工智能;
  • Amazon SageMaker Unified Studio - 在單一開發環境中使用所有數據和工具進行構建,以進行分析和人工智能;
  • Amazon Bedrock - 構建和擴展生成式 AI 應用程序
  • 通過DeepL.com(免費版)翻譯

3. 安裝Amazon SageMaker

要使用 Amazon SageMaker AI 中的功能,首先必須有訪問 Amazon SageMaker AI 的權限。

通過設置 Amazon SageMaker AI 及其功能,有以下安裝選項:

  • 快速安裝: 使用默認設置,為個人用戶進行快捷安裝配置。
  • 自定義安裝: 面向企業機器學習 (ML) 管理員,這些高級配置對于那些為多用戶或組織設置 SageMaker AI 的 ML 管理員來說,顯示是個理想的選項。

4. 訪問AWS門戶和身份驗證

AWS通過網絡門戶,對所有AWS賬戶分配對應用程序的單點登錄訪問,通過AWS的 IAM 身份驗證和訪問。

關于具體如何登錄 AWS 訪問門戶、登錄提示以及如何退出 AWS 訪問門戶,作為 IAM Identity Center 用戶,可登錄 AWS 訪問門戶,詳細步驟請參閱《AWS 登錄指南》中的相關章節,進一步了解如何登錄 AWS 訪問門戶。

在這里插入圖片描述
圖2 在AWS登錄IAM控制臺

5. Amazon SageMaker AI域

Amazon SageMaker AI 使用域(domain)來組織用戶配置文件、應用程序及其相關資源。
Amazon SageMaker AI 域由以下部分組成:

  • 相關的亞馬遜彈性文件系統(亞馬遜 EFS)卷
  • 授權用戶列表
  • 各種安全、應用程序、策略和 Amazon 虛擬私有云 (Amazon VPC) 配置

每個域中都有私有應用程序和共享空間,如下圖所示:

在這里插入圖片描述
要訪問大多數 Amazon SageMaker AI 環境和資源,用戶必須使用 SageMaker AI 控制臺或 AWS CLI 完成 Amazon SageMaker AI 域入門流程。

有關如何根據訪問 SageMaker AI 的方式開始使用 SageMaker AI,以及必要時如何設置域的指南,請參閱 Amazon SageMaker AI 設置指南

6. Amazon SageMaker的優勢

1) 融通式合作開發工作室

Amazon SageMaker 融通式合作開發工作室提供集成式體驗,讓用戶可以使用適用于分析和人工智能的所有數據和工具。

通過發現數據,并使用熟悉的 AWS 工具(適用于模型開發、生成式人工智能、數據處理和 SQL 分析)將數據用于實處。

使用統一的筆記本電腦處理計算資源,使用內置的 SQL 編輯器發現和查詢不同的數據來源,大規模訓練和部署人工智能模型,快速構建自定義的生成式人工智能應用程序。創建并安全共享分析和人工智能構件,例如數據、模型和生成式人工智能應用程序,以更快地將數據產品推向市場。

2) 整套安全的人工智能開發功能

借助一整套設計安全的人工智能開發功能,推進 SageMaker 中的人工智能發展。在高性能且經濟高效的基礎設施上訓練、自定義和部署機器學習和基礎模型(Fundation Model, 即FM)

使用可滿足整個人工智能生命周期需求的專用工具,覆蓋高性能集成式開發環境(IDE)和分布式訓練到推理、人工智能運維、治理和可觀測性等領域。

使用尖端模型和專用數據,快速創建為業務量身定制的生成式人工智能應用程序。使用 Amazon Q Developer加快人工智能開發,幫助用戶更加容易、輕松地發現數據、構建和訓練機器學習模型、生成 SQL 查詢以及創建和運行數據管道任務,所有這些都可通過自然語言完成。

3) 統一數據,減少數據孤島

使用Amazon SageMaker數據湖倉,統一用戶在 Amazon Simple Storage Service(Amazon S3)數據湖Amazon Redshift 數據倉庫中的所有數據。

使用所有與 Apache Iceberg 兼容的工具和引擎,在分析數據的單個副本上靈活地訪問和查詢數據。

通過定義應用于湖倉中的分析和人工智能工具的精細權限來保護數據。通過零 ETL 集成,將運營數據庫和應用程序中的數據近實時地導入湖倉。

此外,通過跨第三方數據來源的聯合查詢功能訪問和查詢數據。

4) 端對端數據和人工智能治理

通過貫穿整個數據和人工智能生命周期的內置治理,確保企業安全。Amazon SageMaker 確保用戶能夠控制正確的用戶,用以出于正當理由訪問正確的數據、模型和開發構建。

通過 Amazon SageMaker Catalog 的精細訪問控制,使用單一權限模型一致地定義和強制執行訪問策略。使用數據分類、毒性檢測、防護機制和負責任的人工智能政策,以保護您的人工智能模型安全。

通過數據質量監控和自動化、敏感數據檢測以及數據和機器學習任務流水線,讓整個組織安心無憂。

在這里插入圖片描述

關于Amazon SageMaker應用及開發,還有很多。

  • 鳴謝:AWS亞馬遜云科技

AWS技術好文陸續推出,敬請關注、收藏和點贊👍。

您的認可,我的動力!😃

相關閱讀:

  1. 【AWS入門】Amazon Bedrock簡介
  2. 【AWS入門】Amazon Q Developer簡介
  3. 【AWS入門】AWS Lambda應用簡介
  4. 【AWS入門】Amazon Nova簡介
  5. 【AWS入門】Amazon S3簡介
  6. 【AWS入門】Amazon EC2簡介
  7. 【AWS入門】Amazon云計算簡介
  8. 【AWS入門】創建并使用AWS Builder ID
  9. 【AWS入門】AWS亞馬遜云科技賬戶注冊指南
  10. 2025最新版Python 3.13.3安裝使用指南

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/81382.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/81382.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/81382.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

解決 Go 構建依賴超時問題:使用 GOPROXY 提升 Docker 構建穩定性

目錄 解決 Go 構建依賴超時問題:使用 GOPROXY 提升 Docker 構建穩定性 ? 問題背景 ? 正確做法:多階段中在 Go 階段設置 GOPROXY ? 實際收獲 🧪 小技巧:驗證 GOPROXY 設置是否生效 ? 總結 解決 Go 構建依賴超時問題&#x…

【周輸入】510周閱讀推薦-3

前文 【周輸入】510周閱讀推薦-1-CSDN博客 【周輸入】510周閱讀推薦-2-CSDN博客 本次推薦 目錄 前文 本次推薦 算法技術 模型產品 算法技術 vLLM和DeepSpeed部署模型的優缺點_vllm deepspeed-CSDN博客 優點缺點總結vLLM 適用于推理 優化內存管理 高效并行化 功能單…

Kubernetes控制平面組件:Kubelet詳解(七):容器網絡接口 CNI

云原生學習路線導航頁(持續更新中) kubernetes學習系列快捷鏈接 Kubernetes架構原則和對象設計(一)Kubernetes架構原則和對象設計(二)Kubernetes架構原則和對象設計(三)Kubernetes控…

【推薦】新準則下對照會計報表172個會計科目解釋

序號 科目名稱 對應的會計報表項目 序號 科目名稱 對應的會計報表項目   一、資產類     二、負債類   1 1001 庫存現金 貨幣資金 103 2001 短期借款 短期借款 2 1002 銀行存款 貨幣資金 104 2101 交易性金融負債 易性金融負債 3 1012 其他貨幣資…

MongoDB的安裝及簡單使用

MongoDB 是一個開源的文檔型 NoSQL 數據庫??,由 MongoDB Inc. 開發,專為靈活性和可擴展性設計。 特點: ??1.文檔模型??:數據以 BSON(二進制 JSON)格式存儲,支持嵌套結構。 ??2.動態 S…

Gartner《如何將生成式人工智能(GenAI)集成到應用架構》學習心得

針對軟件架構師、技術專業人士如何更好的把 GenAI 如何融入解決方案,提升用戶體驗、生產力并帶來差異化成果的趨勢,Gartner發布了《Integrating GenAI Into Your Application Architecture》研究報告。 報告首先介紹了 GenAI 的發展背景,指出其已成為主流趨勢,大型語言模型…

IDEA - Windows IDEA 代碼塊展開與折疊(基礎折疊操作、高級折疊操作)

一、基礎折疊操作 折疊當前代碼塊:Ctrl - # 操作方式按下 【Ctrl】 鍵,再按下 【-】 鍵展開當前代碼塊:Ctrl # 操作方式按下 【Ctrl】 鍵,再按下 【】 鍵折疊所有代碼塊:Ctrl Shift - # 操作方式按下 【Ctrl】…

基于STM32F103與Marvell88W8686的WIFI無線監控視頻傳輸系統研發(論文)

基于STM32F103與Marvell88W8686的WIFI無線監控視頻傳輸系統研發 中文摘要 在當今社會信息化進程不斷加速的時代背景下,眾多領域對于監控系統的需求日益增長,像車內安全監控、電梯運行監控等場景都離不開監控系統的支持。過去,不少領域普遍采用…

Java基礎知識總結(超詳細整理)

一:概述 1.1Java類及類的成員 屬性、方法、構造器、代碼塊、內部類 (1)數組 java虛擬機內存劃分 各區域作用 內存解析 基本使用 兩個變量指向一個一維數組 沒有new就不會在堆里新開辟空間 (2)對象數組 (3&a…

StarRocks Community Monthly Newsletter (Apr)

版本動態 3.4.3 版本更新 核心功能升級 Routine Load和Stream Load新增Lambda表達式支持,支持復雜的列數據提取 增強JSON數據處理能力,支持將JSON Array/Object轉為ARRAY/MAP類型 優化information_schema.task_runs視圖查詢,新增LIMIT支持…

探索AI新領域:生成式人工智能認證(GAI認證)助力職場發展

在數字化時代的大潮中,人工智能(AI)技術以其強大的影響力和廣泛的應用前景,正逐步重塑我們的生活與工作方式。隨著生成式AI技術的崛起,掌握這一前沿技能已成為職場競爭中的關鍵優勢。那么,如何通過系統的學…

數據庫觸發器Trigger

在數據庫管理系統中,觸發器(Trigger)是一種特殊的存儲過程,它在特定的事件發生時自動執行。觸發器通常用于維護數據的完整性和一致性。通過事件觸發而被執行,不能直接調用。 觸發器的三要素 觸發事件 before/after&a…

如何利用 Java 爬蟲獲得某書筆記詳情:實戰指南

在知識分享和學習的領域,許多平臺提供了豐富的書籍筆記和學習資源。通過 Java 爬蟲技術,我們可以高效地獲取這些筆記的詳細信息,以便進行進一步的分析和整理。本文將詳細介紹如何利用 Java 爬蟲獲取某書筆記詳情,并提供完整的代碼…

主成分分析的應用之sklearn.decomposition模塊的PCA函數

主成分分析的應用之sklearn.decomposition模塊的PCA函數 一、模型建立整體步驟 二、數據 2297.86 589.62 474.74 164.19 290.91 626.21 295.20 199.03 2262.19 571.69 461.25 185.90 337.83 604.78 354.66 198.96 2303.29 589.99 516.21 236.55 403.92 730.05 438.41 225.80 …

【Redis】List 列表

文章目錄 初識列表常用命令lpushlpushxlrangerpushrpushxlpop & rpoplindexlinsertllen阻塞操作 —— blpop & brpop 內部編碼應用場景 初識列表 列表類型,用于存儲多個字符串。在操作和實現上,類似 C 的雙端隊列,支持隨機訪問(O(N)…

Android framework 中間件開發(三)

前兩篇我們講了中間件的開發和打包應用, Android framework 中間件開發(一) Android framework 中間件開發(二) 這邊我們來講一下在中間件中編寫JNI 1.新建C文件 找到frameworks\base\services\core\jni\路徑,新建一個cpp文件,文件名為com_android_server_DarkControlService.c…

深入了解linux系統—— 基礎IO(上)

文件 在之前學習C語言文件操作時,我們了解過什么是文件,這里簡單回顧一下: 文件存在磁盤中,文件有分為程序文件、數據文件;二進制文件和文本文件等。 詳細描述見文章:文件操作——C語言 文件在磁盤里&a…

Flink CDC—實時數據集成框架

Flink CDC 是一個基于流的數據集成工具,旨在為用戶提供一套功能更加全面的編程接口(API),它基于數據庫日志的 CDC(變更數據捕獲)技術實現了統一的增量和全量數據讀取。 該工具使得用戶能夠以 YAML 配置文件…

ES(ES2023/ES14)最新更新內容,及如何減少內耗

截至2023年10月,JavaScript(ECMAScript)的最新版本是 ES2023(ES14)。 ES2023 引入了許多新特性,如findLast、toSorted等,同時優化了性能。通過減少全局變量、避免內存泄漏、優化循環、減少DOM操作、使用Web Workers、懶加載、緩存、高效數據結構和代碼壓縮,可以顯著降低…

常見的 Python 環境配置問題及解決方案

1. Python 環境配置的常見問題 初學者在配置 Python 環境時,可能會遇到以下幾類問題: 1.1 不同版本的兼容性 Python 目前有兩個主要版本系列:Python 2.x 和 Python 3.x。Python 2.x 已于 2020 年 1 月 1 日停止維護,因此強烈建…