華為云Flexus+DeepSeek征文|基于Dify構建抓取金融新聞并發送郵箱工作流

華為云Flexus+DeepSeek征文|基于Dify構建抓取金融新聞并發送郵箱工作流

  • 一、構建抓取金融新聞并發送郵箱工作流前言
  • 二、構建抓取金融新聞并發送郵箱工作流環境
    • 2.1 基于FlexusX實例的Dify平臺
    • 2.2 基于MaaS的模型API商用服務
  • 三、構建抓取金融新聞并發送郵箱工作流實戰
    • 3.1 配置Dify環境
    • 3.2 配置Dify工具
    • 3.3 創建抓取金融新聞并發送郵箱工作流
    • 3.4 使用抓取金融新聞并發送郵箱工作流
  • 四、總結

一、構建抓取金融新聞并發送郵箱工作流前言

在信息爆炸的金融領域,實時獲取精準資訊是投資者和從業者的核心需求。通過Dify工作流搭建自動化新聞抓取系統,可高效聚合The Daily UpsideEdward Jones等權威平臺的關鍵信息,結合大語言模型提煉核心要點,還可以翻譯為中文,最終通過郵件定時推送,實現從數據采集到智能分發的全鏈路閉環。

華為Flexus X云服務器MaaS平臺的核心優勢在于:Flexus X提供100+種CPU/內存柔性配比(如1:3、3:7),結合X-Turbo加速技術使MySQL/Redis等關鍵應用性能達業界6倍,顯著降低新聞處理延遲;MaaS平臺集成盤古大模型及30+預置模型,支持金融摘要一鍵生成與敏感內容攔截(攔截率90%+),并通過智能調度實現資源成本優化30%;雙平臺協同保障99.995%跨可用區高可用性,為工作流提供安全可靠的全鏈路支撐。

在這里插入圖片描述

二、構建抓取金融新聞并發送郵箱工作流環境

2.1 基于FlexusX實例的Dify平臺

華為云FlexusX實例提供高性價比的云服務器,按需選擇資源規格、支持自動擴展,減少資源閑置,優化成本投入,并且首創大模型QoS保障,智能全域調度,算力分配長穩態運行,一直加速一直快,用于搭建Dify-LLM應用開發平臺。

Dify是一個能力豐富的開源AI應用開發平臺,為大型語言模型(LLM)應用的開發而設計。它巧妙地結合了后端即服務(Backend as Service)和LLMOps的理念,提供了一套易用的界面和API,加速了開發者構建可擴展的生成式AI應用的過程。

參考:華為云Flexus+DeepSeek征文 | 基于FlexusX單機一鍵部署社區版Dify-LLM應用開發平臺教程

2.2 基于MaaS的模型API商用服務

MaaS預置服務的商用服務為企業用戶提供高性能、高可用的推理API服務,支持按Token用量計費的模式。該服務適用于需要商用級穩定性、更高調用頻次和專業支持的場景。

參考:華為云Flexus+DeepSeek征文 | 基于ModelArts Studio開通和使用DeepSeek-V3/R1商用服務教程

在這里插入圖片描述

三、構建抓取金融新聞并發送郵箱工作流實戰

3.1 配置Dify環境

輸入管理員的郵箱和密碼,登錄基于FlexusX部署好的Dify網站

在這里插入圖片描述

將MaaS平臺的模型服務接入Dify,這里我們選擇的是DeepSeek R1商用服務,需要記住調用說明中的接口信息和 API Key 管理中API Key,若沒有可以重新創建即可

在這里插入圖片描述

配置Dify模型供應商:設置 - 模型供應商 - 找到OpenAI-API-compatible供應商并單擊添加模型,在添加 OpenAI-API-compatible對話框,配置相關參數,然后單擊保存

在這里插入圖片描述

參數說明
模型類型選擇LLM
模型名稱填入模型名稱。
API Key填入創建的API Key。
API Endpoint URL填入獲取的MaaS服務的基礎API地址,需要去掉地址尾部的“/chat/completions”后填入

3.2 配置Dify工具

1. Firecrawl

Firecrawl 是一個強大的 API 集成,用于網絡爬蟲和數據抓取。它允許用戶提取 URL、抓取網站內容以及從網頁中檢索結構化數據。憑借其模塊化工具,Firecrawl 簡化了有效收集 Web 數據的過程。現在,您可以在應用程序工作流中使用它來自動提取和分析 Web 數據。

進入 Firecrawl API 密鑰 頁面,創建新的 API 密鑰,默認是有一個 API Key

在這里插入圖片描述

并確保您的賬戶余額充足,默認是有500額度的,測試發現可以運行500次爬蟲操作,還是很夠用的,似乎和爬取的數據量無關

在這里插入圖片描述

訪問 Plugin Marketplace,找到 Firecrawl 工具,然后安裝它

在這里插入圖片描述

授權 Firecrawl:導航到 Plugins > Firecrawl > To Authorize in Dify,然后輸入您的 API 密鑰以啟用該工具

在這里插入圖片描述

授權成功后,我們就可以將 Firecrawl 節點添加到 Chatflow 或 Workflow 管道用于網頁爬取和數據抓取了

在這里插入圖片描述

2. 163SMTP郵件發送

用于發送郵件的工具,使用 smtp.163.com 的電子郵件服務而不進行任何數據處理,可以使用多個電子郵件收件人。

開啟 SMTP 服務并獲取授權碼,登錄 網易郵箱,打開設置 - POP3/SMTP/IMAP,開啟 SMTP 服務,再授權密碼管理中新增授權密碼即可,注意只能查看一次,需要復制保存

在這里插入圖片描述

訪問 Plugin Marketplace,找到 163SMTP郵件發送 工具,然后安裝它

在這里插入圖片描述

使用此工具,需要輸入以下參數,郵箱用戶名、授權碼、收件人郵箱、主題和內容,稍后就會使用此工具發送爬取的金融新聞

在這里插入圖片描述

3.3 創建抓取金融新聞并發送郵箱工作流

在 Dify - 工作室,創建空白應用,選擇工作流,輸入應用名稱和圖標,點擊創建

在這里插入圖片描述

刪除其他默認節點,在開始節點后添加一個代碼執行節點,用于構建我們需要的時間格式:"tduDate": "tdu-june-23-2025",代碼參考如下

function main() {const date = new Date(new Date().toLocaleString("en-US", {timeZone: "Asia/Shanghai"}));date.setDate(date.getDate());// Ensuring the month and day are always two digitsconst day = String(date.getDate()).padStart(2, '0');const month = String(date.getMonth() + 1).padStart(2, '0'); // getMonth() returns 0-11, so add 1const year = date.getFullYear();const monthNames = ["january", "february", "march", "april", "may", "june", "july", "august", "september", "october", "november", "december"];const tduDate = `tdu-${monthNames[date.getMonth()]}-${day}-${year}`; // Updated lineconst mbDate = `${monthNames[date.getMonth()].toUpperCase().substring(0, 3)} ${date.getDate()}, ${date.getFullYear()}`;const ejDate = `${month}/${day}/${year}`; // Already updated in your codereturn {tduDate: tduDate,mbDate: mbDate,ejDate: ejDate};
}

在這里插入圖片描述

再添加2個并行的 Firecrawl 節點,選擇單頁面爬取即可,分別用于爬取 DAILYUPSIDE 網站 和 EDWARD JONES 網站

在這里插入圖片描述

DAILYUPSIDE 節點 中配置抓取的Url為:https://www.thedailyupside.com/newsletter/{{日期獲取.tduDate#}},這里就用上了代碼執行中構建的時間參數,再填入一些其他配置,如僅抓取這些標簽、要移除這些標簽

在這里插入圖片描述

EDWARD JONES 節點 中配置抓取的Url為:https://www.edwardjones.com/us-en/market-news-insights/stock-market-news/daily-market-recap,也填入一些要抓取和移除的標簽參數

在這里插入圖片描述

再接入LLM節點,分別解析2個爬蟲得到信息,模型都選用華為Maas通過的DeepSeek R1模型,上下文填入上一步 Firecrawl 的輸出變量

在這里插入圖片描述

DAILYUPSIDE REPORTER 系統提示詞參考:

<instructions>
根據提供的Markdown英文新聞,你的任務是列出新聞并逐一進行總結。英文行文按照如下格式來提供,其中[Title], [Content], [NewsType]為占位符:
[NewsType(auto, economics, indicators, inflation)]\n
# [Title]
[Content]
以及
## Extra Upside
- **[Title]:** [Content]對于每一條新聞,你需要使用以下模板創建中文總結:標題:xxx
內容:xxx
\n\n---\n\n
標題:xxx
內容:xxx標題與內容應該為中文。并且標題應具有吸引力,并涵蓋新聞中的三個要素:誰、何時、發生了什么。內容應是對新聞的概括性陳述。以下是需要遵循的步驟:1. 閱讀提供的Markdown英文新聞。
2. 剔除最后有“\*”的“新聞”,因為該“新聞”是廣告
2. 識別每條新聞中的關鍵要素:誰、何時、發生了什么。
3. 為每條新聞創建一個包含這些關鍵要素的吸引人的標題。
4. 撰寫一條概括性陳述,總結每條新聞的內容。
5. 對于內容中提到關鍵數據、成果、舉措或事件以及任何吸引眼的內容,通過markdown bold語法進行重點展示。請確保你的輸出不包含任何XML標簽。
</instructions>

EDWARD JONES REPORTER 系統提示詞參考:

<instructions>
根據提供的Markdown英文新聞,你的任務是列出新聞并逐一進行總結。英文行文按照如下格式來提供,其中[Title], [Content], [NewsType]為占位符:
**[Date(Thursday, 01/30/2025 a.m.)]**\n\n
**[Title] –** [Content] ...對于每一條新聞,你需要使用以下模板創建中文總結:標題:xxx
內容:xxx
\n\n---\n\n
標題:xxx
內容:xxx標題與內容應該為中文。并且標題應具有吸引力,并涵蓋新聞中的三個要素:誰、何時、發生了什么。內容應是對新聞的概括性陳述。以下是需要遵循的步驟:1. 請選擇日期為{{#1739247876689.ejDate#}}的新聞進行閱讀,不要閱讀日期為其他事件的新聞內容。
2. 閱讀提供的Markdown英文新聞。
3. 識別每條新聞中的關鍵要素:誰、何時、發生了什么。
4. 為每條新聞創建一個包含這些關鍵要素的吸引人的標題。
5. 撰寫一條概括性陳述,總結每條新聞的內容。
5. 對于內容中提到關鍵數據、成果、舉措或事件以及任何吸引眼的內容,通過markdown bold語法進行重點展示。請確保你的輸出不包含任何XML標簽。
</instructions>

在這里插入圖片描述

再將2個并行節點添加到代碼執行節點,用于拼接2個網站的新聞信息,輸入變量為2個LLM節點的輸出變量,執行的拼接代碼參考:


def main(daily_upside: str, edward_jones: str) -> dict:return {"result": daily_upside +"\n\n---\n\n"+ edward_jones,}

在這里插入圖片描述

再添加節點 - 工具 - 163SMTP郵件發送,輸入5個必要的參數,主題為:今日新聞+時間戳,內容則為輸出格式整理節點的輸出變量還有三個變量使用環境變量填入

環境變量是一種存儲敏感信息的方法,如 API 密鑰、數據庫密碼等。它們被存儲在工作流程中,而不是代碼中,以便在不同環境中共享。

在這里插入圖片描述

郵箱用戶名:username,收件人郵箱:receiver,授權碼:secret

在這里插入圖片描述

最后添加結束節點,標志工作流執行完畢,輸出發送163郵件通知節點的結果

在這里插入圖片描述

編排工作流后點擊右上角的運行,進行測試,查看整個流程可以看到先獲取當前日期,再進入2個并行的爬取新聞過程,再分別進行LLM總結爬取內容,最后格式整理并發送郵件

在這里插入圖片描述

整個流程50秒就完成了

在這里插入圖片描述

打開我們的收件郵箱查看到如下的內容,標題為 今日新聞06/23/2025,輸出的內容是 markdown 格式的,我們這里是沒有進行中文翻譯的,因為爬取的網站的英文,這里也就是英文了,可以在 LLM節點 中添加提示詞中文輸出

在這里插入圖片描述

測試完成就可以發布更新到探索頁面了,發布后選擇運行就可以獲得一個在線運行的工作流的網頁!

3.4 使用抓取金融新聞并發送郵箱工作流

在探索 - 抓取金融新聞并發送郵箱中開啟新對話

在這里插入圖片描述

運行一次Tab頁中點擊運行即可執行工作流

在這里插入圖片描述

為了區別測試的內容,我在LLM節點最后都加上了一個提示詞:最后將所有內容翻譯成中文輸出,查看接收到的郵件效果,格式還是有點問題的,需要根據爬取的不同新聞網站的樣式再優化

在這里插入圖片描述

四、總結

該工作流革新了傳統手動篩選模式,以動態日期生成、并行抓取和AI摘要技術大幅提升效率,降低信息過載風險。通過自動化整合與精準推送,用戶可快速掌握市場動態,為投資決策提供實時支持,同時推動金融信息處理向智能化、結構化躍遷。

通過本次Dify工作流實踐,深刻體會到其可視化編排與AI無縫集成的核心價值:僅需拖拽HTTP抓取、LLM摘要、郵件推送等節點,即可快速構建從金融新聞采集→智能精煉→定時分發的全自動化鏈路,將傳統手動處理耗時從幾小時壓縮至5分鐘。華為Flexus X云服務器提供精準彈性的CPU/內存配比,有效支撐多源數據并行抓取;MaaS平臺內置的盤古大模型則實現關鍵信息的高精度提純與敏感內容攔截。整體部署過程印證了低代碼開發+云原生算力在落地企業級自動化場景中的高效性與可靠性,真正實現數據流動自動化、信息獲取結構化、決策支持實時化的核心目標,化繁為簡,智能提效。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/912011.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/912011.shtml
英文地址,請注明出處:http://en.pswp.cn/news/912011.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

疲勞檢測與行為分析:工廠智能化實踐

視覺分析算法賦能工廠疲勞與安全管理 一、背景與需求 在制造業中&#xff0c;疲勞作業是導致安全事故和效率下降的核心因素之一。傳統人工巡檢存在覆蓋面不足、響應滯后等問題&#xff0c;而基于視覺分析的智能監控系統通過多算法協同&#xff0c;可實現全天候、高精度的疲勞…

醫院信息化建設的要點

隨著醫療技術的不斷發展和患者需求的日益多樣化&#xff0c;醫院信息化建設已經成為提高醫療質量和效率的必要手段。醫院信息化建設是指通過信息技術手段對醫院日常運營、管理和服務進行數字化、智能化和網絡化的改造&#xff0c;以提高醫療服務水平和管理效率。在實施醫院信息…

Sql Server常用命令整理篇:根據某個字段刪除重復數據

通過比較同一表中的兩行數據&#xff0c;刪除那些在Text_data或Title字段上有重復值的行&#xff0c;同時保留id較小的行&#xff1a; DELETE t1 FROM data_zq t1 JOIN data_zq t2 WHERE t1.id > t2.id AND (t1.Text_data t2.Text_data OR t1.Title t2.Title);注意事項 備…

Spring AI 入門到實戰:我如何用它讓系統具備“理解能力”

我向來對“整合大模型進 Java 應用”這件事持謹慎態度。在 GPT 火了之后&#xff0c;我們團隊最初是用 HTTP 手動調 OpenAI 接口&#xff0c;把它當成一個 JSON API 用。但隨著業務交互變復雜&#xff0c;我意識到&#xff1a;我們需要的是一個語義系統&#xff0c;而不是一個封…

C++鏈表的虛擬頭節點

C鏈表虛擬頭節點&#xff08;Dummy Head&#xff09; 虛擬頭節點是鏈表操作中極為實用的設計技巧&#xff0c;它通過在鏈表真實頭部前添加一個特殊節點&#xff0c;有效簡化邊界條件處理。 一、虛擬頭節點的本質與核心作用 1. 定義 虛擬頭節點是一個不存儲真實數據的特殊節…

使用vllm部署 Nanonets-OCR-s

使用vLLM部署Nanonets-OCR-s模型的完整指南 Nanonets-OCR-s作為基于Qwen2.5-VL-3B的多模態OCR模型,結合vLLM的高效推理引擎可顯著提升部署性能。 一、環境準備與依賴安裝 1. 安裝vLLM與多模態依賴 # 安裝vLLM(含CUDA加速) pip install vllm==0.3.21 # 建議使用穩定版本…

大數據在UI前端的應用深化研究:用戶行為模式的挖掘與分析

hello寶子們...我們是艾斯視覺擅長ui設計、前端開發、數字孿生、大數據、三維建模、三維動畫10年經驗!希望我的分享能幫助到您!如需幫助可以評論關注私信我們一起探討!致敬感謝感恩! 在數字化用戶體驗競爭白熱化的時代&#xff0c;用戶行為數據已成為產品迭代的核心資產。據 Ad…

解決“Belkin USB-C LAN”有一個自分配的IP地址,將無法接入互聯網。

MacBookPro使用belkin轉換器連接網線&#xff0c;網絡不能正常連通&#xff0c;已確定網線、交換機均正常&#xff0c;可以按照如下操作嘗試。我自己的情況是通過下面的方式成功解決。如有其他情況后續繼續補充。 1. 打開“設置”-“網絡”&#xff0c;點擊名字為“Belkin USB…

Python 爬蟲初學者教程

一、爬蟲基礎概念 什么是爬蟲&#xff1f; 爬蟲是模擬瀏覽器行為&#xff0c;自動獲取網頁數據的程序&#xff0c;常用于數據采集、信息監控等場景。 爬蟲的基本流程&#xff1a; 1. 發送請求獲取網頁內容 2. 解析內容提取數據 3. 存儲數據 二、環境準備 1. 安裝 Python&…

windows下 tomcat的安裝部署

Tomcat是一個免費的開放源代碼的Web 應用服務器&#xff0c;屬于輕量級應用服務器&#xff0c;在中小型系統和并發訪問用戶不是很多的場合下被普遍使用&#xff0c;是開發和調試JSP程序的首選。 本文將詳細介紹在Windows環境下搭建Tomcat服務器&#xff0c;來搭建小型應用。 要…

ASIO 避坑指南:高效、安全與穩健的異步網絡編程

ASIO 避坑指南&#xff1a;高效、安全與穩健的異步網絡編程 引言 ASIO是很強大的一個異步io庫&#xff0c;但服務器除了高效以外&#xff0c;穩定也是關鍵&#xff0c;這篇文章主要總結了ASIO使用遇到的典型問題和坑&#xff1a; 如何榨干io_context的性能&#xff0c;讓CPU…

鯨孿生中三維模型的常見問題~

鯨孿生是山海鯨中專門負責3D 場景搭建和渲染的組件&#xff0c;可以雙擊進入編輯&#xff0c;進入編輯之后組件欄也會跟著變化&#xff0c;可以插入更多的 3D 內部的組件。 搭建三維場景經常會使用到模型&#xff0c;包括人物模型、建筑物模型、汽車模型等&#xff0c;這些都可…

PyTorch中實現開立方

技術背景 在PyTorch中&#xff0c;沒有直接實現cbrt這一算子。這個算子是用于計算一個數的開立方&#xff0c;例如&#xff0c;最簡單的-8開立方就是-2。但這里有個問題是&#xff0c;在PyTorch中&#xff0c;因為沒有cbrt算子&#xff0c;如果直接用冪次計算去操作數字&#x…

關于如何在 Git 中切換到之前創建的分支的方法

文章目錄 關于如何在 Git 中切換到之前創建的分支的方法一、確保你在項目目錄中二、查看所有分支&#xff08;可選&#xff09;三、切換到目標分支四、如果分支僅在遠程存在五、驗證是否切換成功六、常見問題處理七、總結命令流程 PS:下次進入分支時&#xff0c;只需完成步驟1 …

基于深度學習的智能圖像語義分割系統:技術與實踐

前言 圖像語義分割是計算機視覺領域中的一個重要任務&#xff0c;其目標是將圖像中的每個像素分配到預定義的語義類別中。這一技術在自動駕駛、醫學影像分析、機器人視覺等多個領域有著廣泛的應用。近年來&#xff0c;深度學習技術&#xff0c;尤其是卷積神經網絡&#xff08;C…

歷史軌跡組件性能優化方案

針對歷史軌跡組件的性能優化&#xff0c;可從數據處理、渲染策略、內存管理和交互優化四個方面入手。以下是具體的優化方向和實現方案&#xff1a; 一、數據處理優化 1. 軌跡數據抽稀算法 原理&#xff1a;在不影響軌跡整體形狀的前提下&#xff0c;減少軌跡點數量實現方案&…

【論文閱讀36】- Graph Attention Network(2025)

這篇論文主要介紹了一種基于改進型圖注意力網絡&#xff08;Graph Attention Network, GAT&#xff09;的滑坡變形異質性監測方法。該方法通過融合多尺度時間嵌入和自適應圖學習&#xff0c;能夠同時捕捉監測點之間復雜的時空依賴關系&#xff0c;有效反映滑坡的局部與整體變形…

CSS基礎3

動畫-animation 動畫-animation與 transition過渡動畫的區別 transition過渡動畫&#xff1a;實現兩個狀態間的變化過程動畫animation&#xff1a;實現多個狀態間的變化過程&#xff0c;動畫過程可控&#xff08;重復播放、最終畫面、是否暫停&#xff09; 走馬燈-使用transiti…

Java 程序設計試題?

?考試時間&#xff1a;120 分鐘? ?總分&#xff1a;100 分? 一、選擇題&#xff08;每題 2 分&#xff0c;共 30 分&#xff09; 1.以下哪個不是 Java 的關鍵字&#xff1f; A. final B. sizeof C. static D. void 2.以下代碼輸出結果是&#xff1f; System.out.printl…

Elasticsearch(ES)與 OpenSearch(OS)

Elasticsearch&#xff08;ES&#xff09;與 OpenSearch&#xff08;OS&#xff09;本質上是同源分叉、獨立演進的技術&#xff0c;兩者關系可概括為“起源相同、目標分化”。以下是關鍵要點解析&#xff1a; &#x1f50d; 一、核心關系&#xff1a;分叉與獨立演進 起源相同 O…