在金融領域,研報作為決策參考的核心載體,其生成過程往往涉及海量數據采集、多維度分析及專業內容整合,傳統人工制作模式不僅耗時耗力,還難以滿足實時性與標準化需求。隨著人工智能技術的發展,“智能體賦能的金融多模態報告自動化生成”方案應運而生,通過整合大語言模型(LLM)、檢索增強生成(RAG)、MCP等技術,實現了研報從需求識別到最終交付的全流程自動化。
效果圖:
一、方案整體架構與核心目標
本文將基于完整技術架構,詳細拆解該方案的核心模塊、工作邏輯與實現細節。
1.1 核心目標
以“提高效率、標準化輸出”為核心,實現用戶輸入觸發→多源數據采集→多維度分析→研報自動化生成→下載交付的端到端閉環,支持金融研報的快速生成與重復利用(若當日已生成同公司研報,直接返回下載地址),同時兼顧內容的專業性(如財務比率分析、行業對比)與格式的規范性(HTML轉PDF、Markdown表格)。
1.2 整體技術棧
方案融合了數據采集、知識檢索、智能調度、內容生成等多類技術工具,核心組件如下:
技術類別 | 具體工具/模塊 | 核心作用 |
---|---|---|
數據來源 | 東方財富、Akshare、同花順、財經新聞網站、MCP服務 | 提供上市公司全維度數據(財務報表、股票信息、機構評級等) |
知識檢索 | RAG(檢索增強生成)、向量庫(Milvs)、CRUD工具 | 快速召回目標公司相關數據,支撐研報分析內容 |
智能調度 | 任務拆分LLM、任務調度模塊、子任務執行Agent | 拆解用戶需求為可執行子任務,調度資源完成任務執行 |
內容處理 | 內容潤色Agent、圖表工具、HTML模板填充、HTML轉PDF | 生成標準化研報內容,轉換為可下載的PDF格式 |
交互與接口 | 對話窗口、FastApi接口(/fin/gen_report、/fin/download_report) | 接收用戶輸入,返回研報結果與下載地址 |
二、全流程工作拆解:從用戶輸入到研報交付
整個研報自動化生成流程可分為意圖識別→任務拆分→任務調度→子任務執行→研報合成→格式轉換與交付六大核心環節,各環節環環相扣,形成完整工作流。
環節1:意圖識別——判斷需求并提取關鍵信息
用戶通過“對話窗口”輸入需求后,系統首先進行意圖識別,區分需求與研報的關聯性,同時提取生成研報必需的關鍵要素。
意圖識別這部分功能屬于后期規劃的內容,目前還處在第一期建設。
1.1 意圖分類與處理邏輯
- 無關研報需求:若用戶輸入為閑聊內容(如“今天天氣如何”),系統可直接閑聊互動,或回復“你的對話內容和生成研報無關!”。
- 相關研報需求:需進一步提取“上市公司名稱”或“股票代碼”,這是后續數據采集與研報生成的核心標識,處理規則如下:
- 若識別到“上市公司名稱”(如“寧德時代”):自動查詢對應的股票代碼(如“sh300750”)。
- 若直接識別到“股票代碼”(如“sh300750”):無需額外查詢,直接進入“任務拆分”環節。
1.2 研報重復生成判斷
為避免重復計算資源浪費,系統會校驗“當日是否已生成該公司研報”:
- 是:直接返回歷史研報的下載地址,無需執行后續流程。
- 否/用戶要求“重新生成”:觸發下游“任務拆分”環節,啟動全新研報生成工作流。
環節2:任務拆分——基于LLM拆解研報核心子任務
研報內容涵蓋財務、行業、戰略、風險等多維度分析,需通過LLM將“生成某公司研報”這一總需求,拆解為多個可獨立執行的子任務,確保分析維度全面、邏輯清晰。
2.1 核心子任務清單(含必選與可選)
LLM需至少拆解出以下子任務,覆蓋研報核心模塊:
- 采集并整理公司三大會計報表數據(資產負債表、利潤表、現金流量表);
- 分析公司主營業務、核心競爭力與行業地位(含市場份額、技術優勢、客戶群體等);
- 計算關鍵財務比率(如ROE、毛利率、現金流匹配度),并與行業同行對比;
- 選取可比公司進行橫向競爭分析(財務表現、市場定位、技術能力對比);
- 解讀公司發展戰略與未來規劃(市場擴張、研發投入、合作項目等);
- 總結潛在風險因素(市場風險、經營風險、政策風險),并給出風險提示。
環節3:任務調度——整合子任務并調用API接口
任務拆分完成后,“任務調度模塊”接收所有子任務作為輸入參數,調用后端核心API接口(/fin/gen_report),啟動研報生成流程。API接口是連接“任務調度”與“子任務執行”的關鍵樞紐,執行以下四步操作:
- 子任務合并:將LLM生成的“動態子任務”與系統“預制子任務”(如“公司基本信息整理”“股票價格趨勢分析”)合并,形成完整子任務列表;
- 子任務分發:輪詢取出每一個子任務,分配給下游“子任務執行Agent”;
- 執行狀態監聽:待所有子任務執行完成后,觸發下游“研報章節合成”環節;
- 異步返回結果:API接口接收到任務后,立即向調用方(任務調度模塊)返回結果,包含研報下載地址(子任務執行在后臺異步完成,不阻塞前端交互)。
3.1 API返回結果示例(JSON格式)
{"code": "000","msg": "研報生成完成:sh300750-寧德時代","data": "http://127.0.0.1:8001/fin/download_report?report_file_name=sh300750_寧德時代_02.md"
}
環節4:子任務執行——Agent驅動數據檢索與內容生成
“子任務執行Agent”是研報內容生產的核心執行者,基于RAG知識檢索與數據抓取工具,完成“數據獲取→數據校驗→內容潤色”的子任務閉環。
4.1 核心執行邏輯
- 子任務傳遞:Agent接收子任務名稱(如“計算寧德時代ROE并與行業對比”),傳遞給“知識檢索RAG工具”;
- 知識檢索與數據校驗:
- RAG工具通過“語義相似度檢索”和“關鍵字檢索”兩種方式查詢數據,每種方式最多返回3條記錄,共6條候選數據;
- 對6條數據進行精排(基于相關性、時效性),最終取前2條作為檢索結果;
- Agent判斷檢索結果是否足以完成子任務:若不足,調用“數據抓取工具”補充數據;若足夠,進入“內容潤色”環節。
4.2 數據抓取工具:多源數據采集與存儲
數據抓取工具從東方財富、Akshare、同花順等權威金融平臺獲取數據,覆蓋以下核心維度:
- 公司基礎數據:基本信息(成立時間、注冊資本)、股權結構、股票信息(股價、成交量);
- 財務數據:三大財務報表、季度/年度財務指標;
- 行業與機構數據:行業對比數據、機構評級數據、股價預測數據、經營分析數據。
抓取的數據存儲到Milvs向量數據庫,存儲規則如下:
- 核心存儲內容:原始數據、數據主題(如“寧德時代2023年利潤表”)、數據來源(如“Akshare”)、股票代碼、公司名稱;
- 元數據(metadata):將“數據主題、數據來源、股票代碼、公司名稱”存入元數據,便于后續RAG工具快速檢索。
4.3 內容潤色Agent:生成標準化子任務內容
內容潤色Agent基于“檢索數據+子任務標題”,生成符合研報規范的內容,核心規則如下:
- 表格數據:自動轉換為Markdown格式表格(如“寧德時代2023年關鍵財務比率表”);
- 圖表需求:調用“圖表工具”生成可視化圖表(如“寧德時代與同行毛利率對比圖”);
- 來源標注:所有表格數據、圖表數據必須標注數據來源(如“數據來源:東方財富2023年報”);
- 格式輸出:最終生成包含“子任務標題+潤色內容”的Markdown文件(如“子任務3:財務比率分析.md”)。
環節5:研報章節合成——整合子任務內容形成完整框架
所有子任務的Markdown文件生成后,需通過“研報章節合成”模塊整合為完整研報,核心依賴LLM實現“內容歸類與標題結構化”:
- LLM接收所有子任務Markdown文件,根據內容邏輯(如“基礎信息→財務分析→行業對比→戰略風險”),將子任務填充到研報的一二級章節中;
- 自動生成研報總標題(如“sh300750寧德時代2023年年度研報”)與目錄,確保章節邏輯連貫、層次清晰;
- 輸出帶有HTML標簽的完整研報內容(為后續HTML模板填充做準備)。
環節6:格式轉換與交付——HTML填充→PDF生成→下載
研報內容框架確定后,需完成格式轉換與存儲,最終通過“對話窗口”向用戶交付下載地址。
- HTML模板填充:將“帶有HTML標簽的研報內容”填充到預定義的HTML模板中(模板包含字體、排版、頁眉頁腳等樣式,確保研報格式統一);
- HTML轉PDF:調用工具將HTML格式研報轉換為PDF格式,存儲到服務器指定目錄;
- 下載地址返回:系統將PDF文件的下載地址(通過FastApi的/fin/download_report接口生成)返回至“對話窗口”,用戶點擊即可下載研報;
- 交互限制:對話窗口采用“單輪阻塞”機制——只有當前工作流完成并返回結果后,才能接收用戶下一次輸入,避免任務沖突。
三、關鍵技術亮點與應用價值
3.1 技術亮點
- 多模態數據融合:整合文本(新聞、財報)、表格(財務數據)、圖表(對比分析)等多模態內容,滿足金融研報的專業性表達需求;
- RAG+Agent協同:通過RAG實現精準數據檢索,Agent實現動態推理與任務執行,解決“數據不足→補充抓取”的自適應問題;
- 異步任務調度:API接口異步返回結果,避免前端等待,提升用戶交互體驗;
- 向量庫高效檢索:Milvs向量庫結合元數據檢索,確保數據召回的時效性與相關性,支撐研報快速生成。
3.2 應用價值
- 對金融機構:將研報生成周期從“數天”縮短至“分鐘級”,降低人工成本,同時通過標準化流程減少人為誤差;
- 對個人投資者:快速獲取專業、全面的公司研報,為投資決策提供實時參考;
- 對行業生態:可擴展至“行業研報”“宏觀經濟報告”等場景,成為金融AI化的核心基礎設施之一。
上一篇《開發金融分析Agent,讓AI寫研報,你敢用嗎?》
下一篇《AI賦能金融研報自動化生成:智能體系統架構與實現》
開源代碼庫