DataWorks智能體Agent發布!基于MCP實現數據開發與治理自動化運行

在傳統的數據開發工作中,企業用戶或者開發者常常需要進行繁瑣的配置、復雜的代碼撰寫、反復的性能調優和大量重復性的操作,才能實現數據開發、數據集成和數據治理等工作,效率十分低下。

近日,阿里云大數據開發治理平臺DataWorks基于MCP協議,正式發布DataWorks Agent,內置 DataWorks MCP Server V1.0,讓數據開發治理工作從Copilot輔助步入到AI Agent時代。

MCP(Model Context Protocol),模型上下文協議,就像AI領域的USB-C接口——正如USB-C為設備連接外設提供統一標準,MCP為大模型連接不同數據源和工具提供標準化方式。

使用DataWorks Agent,可以通過自然語言交互來自動化完成DataWorks上數據開發、數據治理的部分任務,例如數據集成、數據開發、任務運維等,包括支持通過自然語言指令自動化創建和啟動實時/離線數據同步任務;支持快速批量創建和修改數據開發節點;支持運行任務的智能分析等。

通過大模型的深度思考及規劃能力,Agent可以充分理解用戶的任務,對任務進行步驟分解并制定執行計劃,并調用MCP Server中的相關工具來自動化執行任務。DataWorks將持續豐富和迭代DataWorks MCP Server中的工具集,致力于為用戶提供更加智能和高效的數據開發治理產品體驗。

DataWorks MCP Server基本介紹

基本架構

DataWorks新版數據開發的個人開發環境,在阿里云原生的能力上搭建了用戶專屬的開發環境,環境中內置了VSCode客戶端,登錄DataWorks后可通過瀏覽器訪問,您可以選擇安裝MCP Client插件(如Cline),通過配置DataWorks開源的MCP Server,輸入指令即可完成DataWorks的數據開發運維等動作。

基本概念

  • DataWorks個人開發環境:DataWorks提供的云原生開發環境,一個用戶專屬可控的安全的操作系統。
  • alibabacloud-dataworks-mcp-server:DataWorks開源的MCP Server,實現了DataWorks OpenAPI的封裝。
  • DataWorks OpenAPI:DataWorks各模塊提供的開放API,支持用戶完成對DataWorks上資源的管理。

如上圖所示,個人開發環境本質上是用戶在DataWorks上創建出來的一臺服務器,除了可以實現DataWorks的數據開發、數據集成等任務,還能安裝開源生態的各種插件,比如:

  • 通過filesystem實現對文件的讀寫操作。
  • 通過git實現對Git工作空間的git操作。

不局限于此,您可以添加各種開源的mcp servers到個人開發環境。

如何配置DataWorks MCP Server

1、沒有個人開發環境

  • 安裝并啟動個人開發環境實例,鏡像選擇dataworks-mcp:py3.11-ubuntu22.04,參考地址:https://help.aliyun.com/zh/dataworks/user-guide/serveride/#a47aea58f20q0

安裝并啟動個人開發環境實例

2、已有個人開發環境升級

  • 打開terminal,執行以下腳本:
wget https://nodejs.org/dist/v20.19.0/node-v20.19.0-linux-x64.tar.xz
tar xf node-v20.19.0-linux-x64.tar.xz
mv /etc/dsw/node /etc/dsw/node14
mv node-v20.19.0-linux-x64 /etc/dsw/nodebash <(curl -s https://dataworks-notebook-${REGION}.oss-${REGION}.aliyuncs.com/public-datasets/aone-release/dwcode-server/scripts/update.sh)  0.2.169
  • 刷新頁面后,從VSCode的應用市場搜索Cline進行安裝

3、配置LLM APIKey,支持您配置使用不同的LLM模型(此處以阿里云百煉的API為例)

完成模型配置。

4、安裝MCP Server

通過界面打開DataWorks MCP Server的配置界面-Configure MCP Servers。

在配置界面填入如下配置,注意修改其中的REGION信息:

{"mcpServers": {"alibabacloud-dataworks-mcp-server": {"command": "npx","args": ["alibabacloud-dataworks-mcp-server"],"env": {"REGION": "cn-beijing","ALIBABA_CLOUD_CREDENTIALS_URI": "http://localhost:7002/api/v1/credentials/0","TOOL_CATEGORIES": "SERVER_IDE_DEFAULT"},"disabled": false,"autoApprove": [],"timeout": 60}}
}

看到如下加載成功的Tools可確認alibabacloud-dataworks-mcp-server已安裝成功:

在任務界面,您可以輸入“我有哪些工作空間?”開始測試

進階玩法:安裝其他MCP Servers進行探索

您可以參考mcp-servers安裝其他的MCP Servers到個人開發環境。參考地址:https://github.com/modelcontextprotocol/servers/

實操演示

DataWorks Agent支持安裝各類MCP Server,接下來我們演示如何使用DataWorks MCP Server和Hologres MCP Server來自動化完成數據集成實時數據同步任務開發和Hologres數據分析。

目前,使用DataWorks Data Studio最新版本即可體驗DataWorks Agent功能,歡迎體驗!

閱讀原文跳轉地址:https://help.aliyun.com/zh/dataworks/user-guide/dataworks-mcp-server-function-usage

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/77659.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/77659.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/77659.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

IDEA 中右側沒有顯示Maven

IDEA 中右側沒有顯示Maven 1. 檢查 Maven 項目是否正確加載 現象 ? 項目是 Maven 項目&#xff0c;但右側沒有 Maven 工具窗口。 ? 項目根目錄下有 pom.xml&#xff0c;但 IDEA 沒有識別為 Maven 項目。 解決方法 手動重新加載 Maven 項目&#xff1a; ? 在 IDEA 中&…

羅技K860鍵盤

羅技藍牙鍵盤的頂部功能鍵F1-F12的原本功能 單擊羅技鍵盤的功能鍵時&#xff0c;默認響應的是鍵盤上面顯示的快進、調節音量等功能。改變回F1~F12原本功能&#xff0c;同時按下 fn和esc組合鍵

什么是大型語言模型(LLM)?哪個大模型更好用?

什么是 LLM&#xff1f; ChatGPT 是一種大型語言模型 (LLM)&#xff0c;您可能對此并不陌生。它以非凡的能力而聞名&#xff0c;已證明能夠出色地完成各種任務&#xff0c;例如通過考試、生成產品內容、解決問題&#xff0c;甚至在最少的輸入提示下編寫程序。 他們的實力現已…

css畫右上角 角標三角形

.corner {position: absolute;top: -2rem;right: -2rem;width: 0;height: 0;border: 2rem solid red;border-bottom-color: transparent;border-top-color: transparent;border-left-color: transparent;transform: rotateZ(135deg); } 基本思路就是設置border&#xff0c;只設…

vue自定義顏色選擇器

vue自定義顏色選擇器 效果圖&#xff1a; step0: 默認寫法 調用系統自帶的顏色選擇器 <input type"color">step1:C:\Users\wangrusheng\PycharmProjects\untitled18\src\views\Home.vue <template><div class"container"><!-- 顏…

[Python] 企業內部應用接入釘釘登錄,端內免登錄+瀏覽器授權登錄

[Python] 為企業網站應用接入釘釘鑒權&#xff0c;實現釘釘客戶端內自動免登授權&#xff0c;瀏覽器中手動釘釘授權登錄兩種邏輯。 操作步驟 企業內部獲得 開發者權限&#xff0c;沒有的話先申請。 訪問 釘釘開放平臺-應用開發 創建一個 企業內部應用-釘釘應用。 打開應用…

[藍橋杯 2023 國 Python A] 整數變換

P10985 [藍橋杯 2023 國 Python A] 整數變換 題目背景 建議使用 PyPy3 提交本題。 題目描述 小藍有一個整數 n n n。每分鐘&#xff0c;小藍的數都會發生變化&#xff0c;變為上一分鐘的數 減去上一分鐘的數的各個數位和。 例如&#xff0c;如果小藍開始時的數為 23 23 …

【Linux】TCP_Wrappers+iptables實現堡壘機功能

規劃 顯示jumpserver的簡單功能&#xff0c;大致的網絡拓撲圖如下 功能規劃 & 拓撲結構 JumpServer&#xff08;堡壘機&#xff09;主要功能&#xff1a; 對訪問目標服務器進行統一入口控制&#xff08;例如 nginx、mysql、redis&#xff09;。使用 iptables 做 NAT 轉…

用HTML和CSS繪制佩奇:我不是佩奇

在這篇博客中&#xff0c;我將解析一個完全使用HTML和CSS繪制的佩奇(Pig)形象。這個項目展示了CSS的強大能力&#xff0c;僅用樣式就能創造出復雜的圖形&#xff0c;而不需要任何圖片或JavaScript。 項目概述 這個名為"我不是佩奇"的項目是一個純CSS繪制的卡通豬形象…

Spring 中 WebFlux 編寫一個簡單的 Controller

引言&#xff1a;響應式編程與 WebFlux 隨著應用程序需要處理大量并發請求的情況越來越多&#xff0c;傳統的 Servlet 編程模式可能無法滿足高效和低延遲的需求。為了應對這種情況&#xff0c;Spring 5 引入了 WebFlux&#xff0c;一個基于響應式編程的 Web 框架&#xff0c;旨…

React十案例下

代碼下載 登錄模塊 用戶登錄 頁面結構 新建 Login 組件&#xff0c;對應結構: export default function Login() {return (<div className{styles.root}><NavHeader className{styles.header}>賬號登錄</NavHeader><form className{styles.form}>&…

100道C#高頻經典面試題帶解析答案——全面C#知識點總結

100道C#高頻經典面試題帶解析答案 以下是100道C#高頻經典面試題及其詳細解析&#xff0c;涵蓋基礎語法、面向對象編程、集合、異步編程、LINQ等多個方面&#xff0c;旨在幫助初學者和有經驗的開發者全面準備C#相關面試。 &#x1f9d1; 博主簡介&#xff1a;CSDN博客專家、CSD…

機動車號牌管理系統設計與實現(代碼+數據庫+LW)

摘 要 在如今社會上&#xff0c;關于信息上面的處理&#xff0c;沒有任何一個企業或者個人會忽視&#xff0c;如何讓信息急速傳遞&#xff0c;并且歸檔儲存查詢&#xff0c;采用之前的紙張記錄模式已經不符合當前使用要求了。所以&#xff0c;對機動車號牌信息管理的提升&…

VMWare Workstation Pro17.6最新版虛擬機詳細安裝教程(附安裝包教程)

目錄 前言 一、VMWare虛擬機下載 二、VMWare虛擬機安裝 三、運行虛擬機 前言 VMware 是全球領先的虛擬化技術與云計算解決方案提供商&#xff0c;通過軟件模擬計算機硬件環境&#xff0c;允許用戶在一臺物理設備上運行多個獨立的虛擬操作系統或應用。其核心技術可提升硬件…

DeepSeek的神經元革命:穿透搜索引擎算法的下一代內容基建

DeepSeek的神經元革命&#xff1a;穿透搜索引擎算法的下一代內容基建 ——從語義網絡到價值共識的范式重構 一、搜索引擎的“內容饑渴癥”與AI的基建使命 2024年Q1數據顯示&#xff0c;百度索引網頁總數突破3500億&#xff0c;但用戶點擊集中在0.78%的高價值頁面。這種“數據…

docker安裝nginx,基礎命令,目錄結構,配置文件結構

Nginx簡介 Nginx是一款輕量級的Web服務器(動靜分離)/反向代理服務器及電子郵件&#xff08;IMAP/POP3&#xff09;代理服務器。其特點是占有內存少&#xff0c;并發能力強. &#x1f517;官網 docker安裝Nginx &#x1f433; 一、前提條件 ? 已安裝 Docker&#xff08;dock…

Python Lambda表達式詳解

Python Lambda表達式詳解 1. Lambda是什么&#xff1f; Lambda是Python中用于創建匿名函數&#xff08;沒有名字的函數&#xff09;的關鍵字&#xff0c;核心特點是簡潔。它適用于需要臨時定義簡單函數的場景&#xff0c;或直接作為參數傳遞給高階函數&#xff08;如map()、f…

基礎知識補充篇:什么是DAPP前端連接中的provider

專欄:區塊鏈入門到放棄查看目錄-CSDN博客文章瀏覽閱讀352次。為了方便查看將本專欄的所有內容列出目錄,按照順序查看即可。后續也會在此規劃一下后續內容,因此如果遇到不能點擊的,代表還沒有更新。聲明:文中所出觀點大多數源于筆者多年開發經驗所總結,如果你想要知道區塊…

P1115 最大子段和

P1115 最大子段和 - 洛谷 題目描述 給出一個長度為 n 的序列 a&#xff0c;選出其中連續且非空的一段使得這段和最大。 輸入格式 第一行是一個整數&#xff0c;表示序列的長度 n。 第二行有 n 個整數&#xff0c;第 i 個整數表示序列的第 i 個數字 a?。 輸出格式 輸出一…

用實體識別模型提取每一條事實性句子的關鍵詞(實體),并保存到 JSON 文件中

示例代碼&#xff1a; # Generate Keywords import torch import os from tqdm import tqdm import json import nltk import numpy as npfrom span_marker import SpanMarkerModelmodel SpanMarkerModel.from_pretrained("tomaarsen/span-marker-mbert-base-multinerd&…