DeepSeek-R1 模型現已在亞馬遜云科技上提供

2025年3月10日更新—DeepSeek-R1現已作為完全托管的無服務器模型在Amazon Bedrock上提供。

2025年2月5日更新—DeepSeek-R1 Distill Llama 和 Qwen模型現已在Amazon Bedrock Marketplace和Amazon SageMaker JumpStart中提供。

在最近的Amazon re:Invent大會上,亞馬遜 CEO安迪·賈西分享了公司在開發近1000個生成式 AI 應用程序過程中獲得的重要經驗。基于這一大規模 AI 部署的實踐,賈西提出了三個關鍵觀察,這些觀察塑造了亞馬遜在企業 AI 實施方面的策略。

首先,隨著生成式 AI 應用程序的規模擴大,計算成本變得至關重要。人們對更高的性價比有著極大的需求。其次,構建一個真正出色的生成式 AI 應用程序其實非常困難。第三,當我們讓開發者自由選擇他們想要使用的工具時,模型的多樣性就顯現出來。這一點并不讓我們感到意外,因為我們一再吸取同樣的教訓:永遠不會有一個工具能夠統治整個 AI 領域。

正如安迪所強調的,亞馬遜提供的廣泛而深入的模型系列使客戶能夠選擇最適合其獨特需求的精準能力。通過密切關注客戶需求和技術發展,亞馬遜云科技定期擴展我們精選的模型庫,既包括成熟行業寵兒,也囊括前景廣闊的新興模型。這種高性能和差異化模型產品的持續擴展,幫助客戶保持在 AI 創新最前沿。

這讓我們將目光轉向中國的 AI 初創公司深度求索(DeepSeek)。深度求索于 2024 年 12 月發布了 DeepSeek-V3,隨后在 2025 年 1 月 20 日推出了DeepSeek-R1、擁有 6710 億參數的 DeepSeek-R1-Zero,以及參數范圍在15億至 700 億之間的DeepSeek-R1-Distill模型。2025年1月 27日,他們又增加了基于視覺的Janus-Pro-7B模型。這些模型均公開可用,據報道,其性價比比同類模型高出90%至95%。據深度求索表示,其模型因其推理能力而脫穎而出,這得益于通過強化學習等創新訓練方法實現的突破。

如今,您可以在AmazonBedrock和Amazon SageMaker AI中部署 DeepSeek-R1 模型。Amazon Bedrock最適合希望通過API快速集成預訓練基礎模型的團隊。Amazon SageMaker AI則非常適合希望進行高級定制、訓練和部署,并能夠訪問底層基礎設施的組織。此外,您還可以使用Amazon Trainium和AmazonInferentia,通過Amazon Elastic Compute Cloud(Amazon EC2或Amazon SageMaker AI經濟高效地部署DeepSeek-R1-Distill模型。

通過 亞馬遜云科技,您可以使用DeepSeek-R1模型以最小的基礎設施投資構建、試驗并負責任地擴展生成式 AI 項目,得益于其強大的成本效益。您還可以基于 亞馬遜云科技專為安全設計的服務,自信地推動生成式AI創新。我們強烈建議將DeepSeek-R1模型的部署與Amazon Bedrock Guardrails集成,為您的生成式AI應用程序增加一層保護,該功能可供Amazon Bedrock和Amazon SageMaker AI客戶共同使用。

現在,您可以通過以下幾種方式在 亞馬遜云科技 上部署DeepSeek-R1模型: ?
1. 通過Amazon Bedrock Marketplace獲取DeepSeek-R1模型, ?
2. 通過Amazon SageMaker JumpStart獲取DeepSeek-R1模型, ?
3. 通過Amazon Bedrock自定義模型導入功能獲取DeepSeek-R1-Distill模型, ?
4. 通過Amazon EC2 Trn1實例獲取DeepSeek-R1-Distill模型。 ?

讓我為您詳細介紹在 亞馬遜云科技上開始使用DeepSeek-R1模型的各種路徑。無論您是構建首個 AI 應用程序還是擴展現有解決方案,這些方法都可以根據團隊的技能和需求提供靈活的起點。

1. Amazon Bedrock Marketplace中的DeepSeek-R1模型
Amazon Bedrock Marketplace提供了超過 100 個流行、新興和專業的基礎模型(FMs),同時與當前行業領先的模型一起供選擇。您可以輕松地在單一目錄中發現模型,訂閱模型,然后在托管的端點上部署模型。 ?

要訪問Amazon Bedrock Marketplace中的DeepSeek-R1模型,請進入Amazon Bedrock控制臺,在“基礎模型”部分選擇“模型目錄”。您可以通過搜索或按模型提供商篩選快速找到DeepSeek模型。

?在查看模型詳細信息頁面(包括模型的功能和實施指南)后,您可以直接部署模型,只需提供端點名稱、選擇實例數量并選擇實例類型即可。

您還可以配置高級選項,以自定義DeepSeek-R1模型的安全性和基礎設施設置,包括VPC網絡、服務角色權限和加密設置。對于生產部署,您應審查這些設置,以確保其符合您組織的安全性和合規性要求。

通過Amazon Bedrock Guardrails,您可以獨立評估用戶輸入和模型輸出。您可以通過生成式AI應用程序中過濾不良和有害內容,根據自定義的策略集控制用戶與DeepSeek-R1之間的交互。Amazon Bedrock Marketplace中的DeepSeek-R1模型只能與Bedrock的ApplyGuardrail API結合使用,以評估用戶輸入和模型響應,適用于Amazon Bedrock之外的自定義和第三方基礎模型(FMs)。了解更多信息,請閱讀[使用 Amazon Bedrock Guardrails 實施模型無關的安全措施](https://Amazon.amazon.com/cn/blogs/machine-learning/implement-model-independent-safety-measures-with-amazon-bedrock-guardrails/)。

Amazon Bedrock Guardrails還可以與其他Bedrock工具集成,包括Amazon Bedrock Agents和 Amazon Bedrock Knowledge Bases,以構建更安全、更符合負責任AI政策的生成式AI應用程序。了解更多信息,請訪問[亞馬遜云科技負責任AI頁面](https://Amazon.amazon.com/cn/machine-learning/responsible-ai/)。

2025年2月1日更新 — 您可以使用Bedrock的Playground功能,了解模型對各種輸入的響應方式,并優化提示詞以獲取最佳結果。

在使用DeepSeek-R1模型與Bedrock的Playground或InvokeModel API時,請使用DeepSeek的聊天模板以獲得最佳效果。例如:

<|begin_of_sentence|><|User|>content for inference<|Assistant|>.

2. Amazon SageMaker JumpStart中的DeepSeek-R1模型??
Amazon SageMaker JumpStart是一個機器學習(ML)中心,提供基礎模型(FMs)、內置算法和預構建的ML 解決方案,只需點擊幾下即可部署。要在SageMaker JumpStart中部署DeepSeek-R1模型,您可以在SageMaker Unified Studio、SageMaker Studio或SageMaker AI控制臺中發現該模型,或通過SageMaker Python SDK以編程方式查找。

在Amazon SageMaker AI控制臺中,打開SageMaker Studio,選擇JumpStart,然后在“所有公共模型”頁面中搜索“DeepSeek-R1”。

?選擇模型后,點擊“部署”即可使用默認設置創建端點。當端點狀態變為“InService”(服務中)時,您可以通過向其端點發送請求來進行推理。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/75272.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/75272.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/75272.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

STP --- 生成樹協議

協議信息 配置 BPDU Protocol identifier&#xff1a;協議標識 Version&#xff1a;協議版本&#xff1a;STP 為 0&#xff0c;RSTP 為 2&#xff0c;MSTP 為 3 type&#xff1a; BPDU 類型 Flag&#xff1a; 標志位 Root ID&#xff1a; 根橋 ID&#xff0c;由兩字節的優…

Ansible playbook-ansible劇本

一.playbook介紹 便于功能的重復使用 本質上就是文本文件&#xff0c;一般都是以.yml結尾的文本文件。 1.遵循YAML語法 1.要求同級別代碼要有相同縮進&#xff0c;建議4個空格。【同級別代碼是同一邏輯的代碼】 在計算機看來空格和Tob鍵是兩個不同的字符。 2.一個鍵對應一…

python的基礎入門

初識Python 什么是Python Python是1門程序設計語言。在開發者眼里&#xff0c;語言可以分為3類&#xff1a; 自然語言&#xff1a;人能聽懂的語言&#xff0c;例如漢語&#xff0c;英語&#xff0c;法語等等。機器語言&#xff1a;機器能聽懂的語言&#xff0c;機器只能聽懂0…

MD編輯器中的段落縮進怎么操作

在 Markdown&#xff08;MD&#xff09;編輯器中&#xff0c;段落的縮進通常可以通過 HTML 空格符、Markdown 列表縮進、代碼塊縮進等方式 實現。以下是幾種常見的段落縮進方法&#xff1a; 1. 使用全角空格 ( ) 在一些 Markdown 編輯器&#xff08;如 Typora&#xff09;中&…

8.neo4j圖數據庫python操作

使用圖數據庫的原因 圖數據庫使用neo4j的原因&#xff1a;neo4j使用率高&#xff0c;模板好找&#xff0c;報錯能查。 紅樓夢人物關系圖地址 GraphNavigator neo4j學習手冊 https://www.w3cschool.cn/neo4j/neo4j_need_for_graph_databses.html CQL代表的是Cypher查詢語言…

[Lc6_記憶化搜索] 掃雷游戲 | 理解 遞歸vs記憶化搜索vs dp

目錄 ?1.掃雷游戲 題解 1.記憶化搜索 解法一&#xff1a;遞歸 解法二&#xff1a;記憶化搜索 解法三&#xff1a;動態規劃 ?1.掃雷游戲 (暴力模擬&#xff09; 鏈接&#xff1a;529. 掃雷游戲 讓我們一起來玩掃雷游戲&#xff01; 給你一個大小為 m x n 二維字符矩陣…

云原生周刊:Kubernetes v1.33 要來了

開源項目推薦 Tekton Tekton 是一個開源的 K8s 原生 CI/CD 系統&#xff0c;它為構建、測試和部署自動化工作流提供了強大而靈活的框架。Tekton 提供了一套標準化的 API 和自定義資源&#xff08;CRDs&#xff09;&#xff0c;使得開發者能夠在 K8s 集群中定義和管理 CI/CD 管…

服務新增節點、遷移筆記

文章目錄 基礎配置部分基礎配置-hosts基礎配置-jdk包準備基礎配置-jdk環境變量配置基礎配置-skywalking包 基礎配置-apollo配置。 # 文件夾及配置基礎配置-tomcat基礎配置-nginx基礎配置部分-磁盤掛載(這個也差點漏掉)。 防火墻部分防火墻部分-數據庫及腳本防火墻部分-redis防火…

第十一章:Python PIL庫-圖像處理

一、PIL庫簡介 PIL&#xff08;Python Imaging Library&#xff09;是一個功能強大的圖像處理庫&#xff0c;它提供了豐富的圖像處理功能&#xff0c;包括圖像的打開、處理和保存等操作。PIL支持多種圖像文件格式&#xff0c;如JPEG、PNG、BMP等&#xff0c;并且可以完成對圖像…

【編譯、鏈接與構建詳解】Makefile 與 CMakeLists 的作用

【編譯、鏈接與構建詳解】Makefile 與 CMakeLists 的作用 前言源代碼&#xff08;.c、.cpp&#xff09;編譯編譯的本質編輯的結果編譯器&#xff08;GCC、G、NVCC 等&#xff09; 目標文件&#xff08;.o&#xff09;什么是 .o 目標文件為什么單個 .o 目標文件不能直接執行&…

Ubuntu / Debian 創建快捷方式啟動提權

簡述 在 Linux 系統中&#xff0c;.desktop 文件是 桌面入口文件&#xff0c;用于在桌面環境&#xff08;如 GNOME、KDE&#xff09;中定義應用程序的啟動方式、圖標、名稱等信息。當你執行 touch idea.desktop 時&#xff0c;實際上創建了一個空的 .desktop 文件&#xff08;…

ISIS報文

IS-IS 報文 目錄 IS-IS 報文 一、報文類型與功能 二、報文結構解析 三、核心功能特性 四、典型應用場景 五、抓包數據分析 六、總結 IS-IS&#xff08;中間系統到中間系統&#xff09;協議報文是用于鏈路狀態路由協議中網絡設備間交換路由信息的關鍵載體&#xff0c;其設…

beikeshop多商戶跨境電商獨立站最新版v1.6.0版本源碼

一.介紹 beikeshop跨境電商獨立站最新版V1.6.0源碼 多商戶 多商家 多語言 多幣結算 本博主親測搭建代碼全開源質量相對來說很穩定的 二.服務器環境 系統&#xff1a;CentOS、 環境&#xff1a;PHP7.4 Nginx 1.21 MySQL 5.6 常見插件&#xff1a;fileinfo &#xff1b; re…

Redis批量操作詳解

一、原生批量命令&#xff08;MSET&#xff09; 適用場景&#xff1a;所有鍵的過期時間相同或無過期設置&#xff0c;且無需條件判斷。 方法&#xff1a; 將多個SET命令合并為MSET命令&#xff0c;但需要注意MSET的局限性&#xff08;無法設置過期時間&#xff0c;且所有鍵值對…

Spring Boot 集成實戰:AI 工具如何自動生成完整微服務模塊

在數字化轉型的浪潮中&#xff0c;開發效率和質量是企業競爭力的關鍵要素。飛算 JavaAI 作為一款創新的 AI 工具&#xff0c;能在 Spring Boot 開發中&#xff0c;自動生成完整微服務模塊&#xff0c;極大提升開發效率。下面&#xff0c;我們就詳細介紹如何借助飛算 JavaAI&…

算法 | 2024最新算法:斑翠鳥優化算法原理,公式,應用,算法改進研究綜述,matlab代碼

基于斑翠鳥優化算法的原理、應用及改進研究綜述 一、算法原理 斑翠鳥優化算法(Pied Kingfisher Optimizer, PKO)是2024年由Bouaouda等人提出的一種新型仿生智能優化算法,其靈感來源于斑翠鳥的捕食行為與共生關系。算法通過模擬斑翠鳥的棲息懸停、潛水捕魚及與其他生物的共生…

RabbitMQ高級特性--重試特性

目錄 1.重試配置 2.配置交換機&隊列 3.發送消息 4.消費消息 5. 運行程序觀察結果 6. 手動確認 注意&#xff1a; 在消息傳遞過程中, 可能會遇到各種問題, 如網絡故障, 服務不可用, 資源不足等, 這些問題可能導致消息處理失敗. 為了解決這些問題, RabbitMQ 提供了重試機制, …

Vue 組件通信 - 中央事件總線

Vue 漸進式JavaScript 框架 基于Vue2的學習筆記 - Vue組件通信 - 中央事件總線 目錄 中央事件總線 圖示 準備工作 設置頁面元素 創建組件 總結 中央事件總線 使用vue的監聽和觸發來實現中央事件總線方式。 on監聽 emit觸發&#xff0c;組件按鈕綁定點擊事件&#xff0c…

5.0 WPF的基礎介紹1-Grid,Stack,button

WPF: Window Presentation Foundation. WPF與WinForms的對比如下&#xff1a; 特性WinFormsWPF技術基礎基于傳統的GDI&#xff08;圖形設備接口&#xff09;基于DirectX&#xff0c;支持硬件加速的矢量渲染UI設計方式拖拽控件事件驅動代碼&#xff08;簡單但局限&#xff09;…

QT軟件設計可考慮回答

在Qt應用中是否引入抽象類需要根據具體場景權衡&#xff0c;以下是分層建議&#xff1a; 建議采用抽象類的3個典型場景&#xff1a; 傳感器系統抽象&#xff08;強推薦&#xff09; class AbstractSensor { public:virtual ~AbstractSensor() default;virtual QVector<L…