亞馬遜云科技全面托管DeepSeek-R1模型現已上線

文章目錄

      • 亞馬遜云科技全面托管DeepSeek-R1模型現已上線
      • 在Amazon Bedrock中開始使用DeepSeek-R1模型
      • DeepSeek-R1現已可用

亞馬遜云科技全面托管DeepSeek-R1模型現已上線

亞馬遜云科技提供眾多免費云產品,可以訪問:亞馬遜云科技

截至1月30日,DeepSeek-R1模型通過Amazon Bedrock Marketplace和Amazon Bedrock Custom Model Import在Amazon Bedrock中正式可用。此后,數千名客戶已在Amazon Bedrock中部署了這些模型。客戶們非常看重其強大的防護措施和全面的工具支持,以確保AI的安全部署。今天,我們通過擴展選項范圍,包括全新的無服務器解決方案,進一步簡化了在Amazon Bedrock中使用DeepSeek的流程。

完全托管的DeepSeek-R1模型現已在Amazon Bedrock中全面可用。亞馬遜網絡服務(亞馬遜云科技)是首家以完全托管形式提供DeepSeek-R1模型的云服務提供商(CSP)。可以在亞馬遜云科技上使用DeepSeek加速創新并交付切實的商業價值,而無需管理基礎設施的復雜性。通過Amazon Bedrock的完全托管服務,只需使用單個API即可為生成式AI應用程序提供DeepSeek-R1的功能支持,并享受其豐富的功能和工具帶來的優勢。

根據DeepSeek的說法,他們的模型在MIT許可下公開可用,具備強大的推理、編碼和自然語言理解能力。這些能力支持智能決策、軟件開發、數學問題解決、科學分析、數據洞察以及全面的知識管理系統。

與所有AI解決方案一樣,在生產環境中實施時需謹慎考慮數據隱私要求,檢查輸出中的偏差,并監控結果。在實施像DeepSeek-R1這樣的公開模型時,請考慮以下幾點:

數據安全 – 可以利用Amazon Bedrock的企業級安全、監控和成本控制功能,這些功能對于負責任地大規模部署AI至關重要,同時可以完全掌控數據。用戶的輸入和模型輸出不會與任何模型提供商共享。可以默認使用這些關鍵安全功能,包括靜態和傳輸中的數據加密、細粒度訪問控制、安全連接選項,并在與Amazon Bedrock中的DeepSeek-R1模型通信時下載各種合規性認證。

負責任的AI – 可以通過Amazon Bedrock Guardrails根據應用需求和負責任的AI政策實施定制的防護措施。這包括內容過濾、敏感信息過濾以及可定制的安全控制等關鍵功能,通過上下文 grounding 和自動化推理檢查防止幻覺(hallucination)。這意味著可以通過定義的政策集控制用戶與Bedrock中DeepSeek-R1模型的交互,過濾掉不受歡迎和有害的內容。

模型評估 – 可以通過Amazon Bedrock model evaluation tools在幾步之內評估和比較模型,以確定適合用例的最佳模型(包括DeepSeek-R1)。可以選擇使用預定義指標(如準確性、魯棒性和毒性)進行自動評估,或者選擇基于主觀或自定義指標(如相關性、風格和品牌聲音一致性)的人工評估流程。模型評估提供內置的精選數據集,也可以引入自己的數據集。

我們強烈推薦將Amazon Bedrock Guardrails和Amazon Bedrock model evaluation features與DeepSeek-R1模型集成,以為生成式AI應用程序提供強大的保護。欲了解更多信息,請訪問Protect your DeepSeek model deployments with Amazon Bedrock Guardrails和Evaluate the performance of Amazon Bedrock resources。

在Amazon Bedrock中開始使用DeepSeek-R1模型

如果是DeepSeek-R1模型的新用戶,請前往Amazon Bedrock console,在左側導航欄中選擇“Bedrock configurations”下的“Model access”。要訪問完全托管的DeepSeek-R1模型,請在DeepSeek中為DeepSeek-R1請求訪問權限。隨后,將在Amazon Bedrock中獲得對該模型的訪問權限。

  1. 訪問DeepSeek-R1模型

接下來,要在Amazon Bedrock中測試DeepSeek-R1模型,請在左側菜單欄中選擇“Playgrounds”下的“Chat/Text”。然后在左上角選擇“Select model”,選擇“DeepSeek”作為類別,“DeepSeek-R1”作為模型,然后點擊“Apply”。

  1. 選擇DeepSeek-R1模型

使用選定的DeepSeek-R1模型,我運行了以下提示示例:

一個家庭有5000美元用于明年度假的儲蓄。他們可以將錢存入年利率2%的儲蓄賬戶,或者存入年利率4%的定期存款,但在這之前無法動用資金。如果他們在一年中需要1000美元的緊急支出,他們應如何在兩種選擇之間分配資金,以最大化他們的度假基金?

這個提示需要復雜的思維鏈,并產生非常精確的推理結果。

  1. 在Chat Playground中測試DeepSeek-R1

要了解更多關于提示使用建議的信息,請參閱DeepSeek-R1 model prompt guide。

通過選擇“View API request”,還可以使用Amazon Command Line Interface (Amazon CLI)和Amazon SDK中的代碼示例訪問模型。可以使用“us.deepseek.r1-v1:0”作為模型ID。

以下是Amazon CLI命令示例:

aws bedrock-runtime invoke-model \--model-id us.deepseek.r1-v1:0 \--body "{\"prompt\": \"<|begin_of_sentence|><|User|>Type_Your_Prompt_Here<|Assistant|><think>\n\", \"max_tokens\": 512, \"temperature\": 0.5, \"top_p\": 0.9}" \--cli-binary-format raw-in-base64-out \--region us-west-2 \invoke-model-output.txt

該模型同時支持InvokeModel和Converse API。以下Python代碼示例展示了如何使用Amazon Bedrock Converse API向DeepSeek-R1模型發送文本消息以進行文本生成。欲了解更多信息,請訪問DeepSeek model inference parameters and responses。

import boto3
from botocore.exceptions import ClientError# 在想使用的亞馬遜云科技區域創建一個Bedrock Runtime客戶端。
client = boto3.client("bedrock-runtime", region_name="us-west-2")# 設置模型ID,例如DeepSeek-R1模型。
model_id = "us.deepseek.r1-v1:0"# 開始與用戶消息的對話。
user_message = "Type_Your_Prompt_Here"
conversation = [{"role": "user","content": [{"text": user_message}],}
]try:# 使用基本推理配置將消息發送到模型。response = client.converse(modelId=model_id,messages=conversation,inferenceConfig={"maxTokens": 512, "temperature": 0.5, "topP": 0.9},)# 提取并打印響應文本。response_text = response["output"]["message"]["content"][0]["text"]print(response_text)except (ClientError, Exception) as e:print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}")exit(1)

要為DeepSeek-R1模型啟用Amazon Bedrock Guardrails,在左側導航欄中選擇“Safeguards”下的“Guardrails”,通過配置所需數量的過濾器創建防護欄。例如,如果過濾“politics”這個詞,防護欄將識別提示中的這個詞并顯示被阻止的消息。

可以使用不同的輸入測試防護欄,以評估其性能。可以通過設置禁止主題、詞語過濾器、敏感信息過濾器和阻止消息來調整防護欄,直到滿足需求。

要了解更多關于Amazon Bedrock Guardrails的信息,請訪問Stop harmful content in models using Amazon Bedrock Guardrails或亞馬遜云科技機器學習博客頻道上關于Amazon Bedrock Guardrails的其他深入博客文章。

以下是展示如何利用Amazon Bedrock中完全托管的DeepSeek-R1模型的演示演練:

DeepSeek-R1現已可用

DeepSeek-R1現已在Amazon Bedrock中以完全托管形式提供,支持美國東部(弗吉尼亞北部)、美國東部(俄亥俄州)和美國西部(俄勒岡州)亞馬遜云科技區域,通過跨區域推理提供服務。請查看完整的區域列表以獲取未來更新。欲了解更多信息,請查看DeepSeek in Amazon Bedrock product page和Amazon Bedrock pricing page。

立即在Amazon Bedrock console中試用DeepSeek-R1模型,并通過Amazon re:Post for Amazon Bedrock或常用的亞馬遜云科技支持聯系方式發送反饋。

— Channy

2025年3月10日更新 — 修復了模型選擇和模型ID的截圖。

2025年3月13日更新 — 添加了DeepSeek-R1 model prompt guide和DeepSeek model inference parameters and responses的指南鏈接。

亞馬遜云科技的免費云產品,助您零成本開啟云計算之旅,探索無限可能!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/74397.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/74397.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/74397.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

IO模型種類

文章目錄 同步阻塞 I/O&#xff08;Blocking I/O&#xff0c;BIO&#xff09;同步非阻塞 I/O&#xff08;Non-blocking I/O&#xff0c;NIO&#xff09;I/O 多路復用&#xff08;I/O Multiplexing&#xff09;信號驅動 I/O&#xff08;Signal-driven I/O&#xff09;異步 I/O&a…

C語言入門教程100講(40)文件定位

文章目錄 1. 什么是文件定位?2. 文件指針3. 文件定位函數3.1 `fseek` 函數3.2 `ftell` 函數3.3 `rewind` 函數4. 示例代碼代碼解析:輸出結果:5. 常見問題問題 1:`fseek` 的 `offset` 參數可以為負數嗎?問題 2:如何判斷文件定位是否成功?問題 3:`rewind` 和 `fseek(file…

el-table折疊懶加載支持排序

el-table折疊懶加載支持排序 因為el-table懶加載的子節點是通過緩存實現的&#xff0c;如果想在展開的情況下直接刷新對應子節點數據&#xff0c;要操作el-table組件自身數據&#xff0c;否則不會更新 以排序功能為例 maps: new Map() //用于存儲子節點懶加載的數據// 加載子…

Off-Road-Freespace-Detection配置pytorch2.0.0

一、概述 在github上進行開源代碼搜索&#xff0c;發現了Off-Road-Freespace-Detection&#xff08;鏈接如下所示&#xff09;。這是對越野環境可通行區域的檢測&#xff0c;在經過測試之后&#xff0c;發現對自己有益。 GitHub - chaytonmin/Off-Road-Freespace-Detection: O…

ChatGPT降低論文AIGC重復率的提示詞合集(高效降重方法)

&#x1f4a1; 問題&#xff1a;寫完畢業論文后&#xff0c;查AIGC率過高&#xff0c;手動降重后仍然很高&#xff0c;該怎么辦&#xff1f; &#x1f4cc; 解決方案&#xff1a; 1?? 先查AIGC率&#xff08;找出AI生成的部分&#xff09; 2?? 用ChatGPT優化&#xff08;使…

【Spring 新特性全解析】

Spring 新特性全解析 引言 在當今 Java 企業級開發領域&#xff0c;Spring 框架無疑是中流砥柱般的存在。它以其強大的功能、高度的可擴展性和便捷的開發體驗&#xff0c;贏得了廣大開發者的青睞。隨著技術的不斷演進&#xff0c;Spring 也在持續更新迭代&#xff0c;帶來了一…

System.arraycopy 在音視頻處理中的應用

在音視頻開發領域&#xff0c;我們經常需要處理大量的數據&#xff0c;例如音頻 PCM 數據的傳輸、視頻幀的緩存等。在這些場景下&#xff0c;數據的復制與傳輸往往直接影響到應用的性能。Java 提供的 System.arraycopy 方法&#xff0c;在音視頻處理代碼中出現頻率非常高。本文…

fastapi+angular評論和回復

說明&#xff1a;fastapiangular評論和回復 效果圖: step1:sql show databases; DROP TABLE users; SHOW CREATE TABLE db_school.users; show tables; use db_school; SELECT * FROM db_school.jewelry_categories; CREATE DATABASE db_school; select *from users -- 用戶…

C++11QT復習 (三)

文章目錄 [toc]Day5-2 文件IO&#xff08;2025.03.24&#xff09;1. 緩沖區與刷新1.1 常見的緩沖刷新方式 2. 文件讀寫操作2.1 讀取文件2.2 寫入文件2.3 追加模式寫入2.3 完整代碼 3. 文件定位操作4. 字符串IO5. 配置文件解析示例6. 完整代碼7. 二進制文件操作總結 Day5-2 文件…

Redis Sentinel 詳解

Redis Sentinel 詳解 1. 什么是 Redis Sentinel&#xff1f;有什么用&#xff1f; Redis Sentinel&#xff08;哨兵&#xff09; 是 Redis 官方提供的高可用性解決方案&#xff0c;主要用于監控、通知和自動故障轉移。當 Redis 主節點&#xff08;master&#xff09;發生故障…

AI日報 - 2025年3月25日

&#x1f31f; 今日概覽&#xff08;60秒速覽&#xff09; ▎&#x1f916; AGI突破 | Nebula&#xff08;Google Gemini 2.0 Pro&#xff09;破解復雜數學謎題 編碼與推理能力再上新臺階 ▎&#x1f4bc; 商業動向 | Sesame AI開源10億參數語音模型CSM-1B 語音AI進入普惠時代 …

AI醫療革命:英偉達GTC 2025醫療健康與生命科學會議全分析

AI醫療革命:英偉達GTC 2025醫療健康與生命科學會議全分析 一、GTC 2025:AI 醫療的算力與生態雙突破 1.1 黃仁勛演講核心:從訓練到推理的代際跨越 在科技界矚目的英偉達 GTC 2025 大會上,英偉達 CEO 黃仁勛的主題演講成為全場焦點,為 AI 醫療領域帶來了極具變革性的消息。…

【機器學習/大模型/八股文 面經 (一)】

1. PPO算法中使用GAE的好處以及參數γ和λ的作用是什么? 參考答案: GAE(Generalized Advantage Estimation) 的優勢在于通過指數加權多步TD誤差,平衡優勢估計的偏差與方差,提升策略優化的穩定性。γ(折扣因子):控制未來獎勵的衰減程度,值越大表示更關注長期收益。λ…

03 Python 基礎:數據類型、運算符與流程控制解析

文章目錄 一、數據類型 內置的六大類數字類型整數類型 int浮點數 float布爾 bool字符串 str 變量命名 二、數字類型的相互轉換顯式類型的轉換整數&#xff0c;浮點數&#xff0c;復數 之間的顯式轉換 隱式類型的轉換 三、標識符算術運算符比較運算符邏輯運算符位運算符賦值運算…

視頻知識庫初步設想

將視頻字幕提取出來作為知識庫來源定位,下一步設想:把視頻上的圖片信息也精簡出來作為定位。 下面是測試例子: 入參: {"model":"deepseek-ai/DeepSeek-R1-Distill-Llama-8B","messages":[{"role":"system","cont…

數據庫原理13

1.關系模式設計不當引起的問題&#xff1a;數據冗余&#xff1b;更新異常&#xff1b;插入異常&#xff1b;刪除異常 2.外碼可以是單個屬性&#xff0c;也可以是屬性組 3.動態SQL是SQL標準提供的一種語句運行機制 4.若一個模式分解保持函數依賴&#xff0c;則該分解一定具有…

初級:異常處理面試題深度解析

一、引言 在Java開發中&#xff0c;異常處理是確保程序健壯性和穩定性的重要機制。面試官通過相關問題考察候選人對異常處理的理解和運用能力&#xff0c;以及在實際開發中處理異常的經驗。本文將深入剖析常見的異常處理面試題&#xff0c;結合實際開發場景&#xff0c;幫助讀…

Apache Spark - 用于大規模數據分析的統一引擎

Apache Spark - 用于大規模數據分析的統一引擎 下載運行示例和 Shell使用 Spark Connect 在 Anywhere 上運行 Spark 客戶端應用程序 在集群上啟動從這里去哪里使用 Spark Shell 進行交互式分析基本有關數據集作的更多信息緩存 自包含應用程序從這里去哪里 Apache Spark 是用于大…

餐飲管理系統的設計與實現(代碼+數據庫+LW)

摘 要 互聯網發展至今&#xff0c;無論是其理論還是技術都已經成熟&#xff0c;而且它廣泛參與在社會中的方方面面。它讓信息都可以通過網絡傳播&#xff0c;搭配信息管理工具可以很好地為人們提供服務。針對信息管理混亂&#xff0c;出錯率高&#xff0c;信息安全性差&#…

【C#】Winform調用NModbus實現Modbus TCP 主站通訊

一、前言 Modbus是一種串行通信協議&#xff0c;是工業領域全球最流行的協議之一。 1.1 環境 系統&#xff1a;Win11 工具&#xff1a;Visual Studio 2022 .Net 版本&#xff1a;.Net Framework4.6.0 依賴庫&#xff1a;NModbus 3.0.81 1.2 協議類型 Modbus RTU&#xff1a;一…