AI+金融,如何跨越大模型和場景鴻溝?

文|白 鴿

編|王一粟

當AI大模型已開始走向千行百業之時,備受看好的金融行業,卻似乎陷入了落地瓶頸。

打開手機銀行想查下貸款額度,對著屏幕說了半天,AI客服卻只回復 “請點擊首頁貸款按鈕”;

客戶經理想用大模型生成一份客戶資產配置方案,結果推薦的產品與客戶風險等級完全不符;

風控團隊測試的AI模型,在審批中小企業貸款時頻頻給出“幻覺答案”......

這些看似荒誕的場景,卻是當前AI落地金融行業時的真實困境。

當金融機構滿懷期待地將AI請進門,卻發現它既讀不懂復雜的信貸政策,算不清理財產品的費率結構,更搞不懂不同銀行的“行話體系”。

通用大模型的“聰明”,在嚴肅的金融場景里似乎失靈了,大模型與金融場景之間,也仿佛橫亙著一道看不見的鴻溝。

“企業和產業需要的不是實驗室的技術,而是真正能夠解決真實問題的可信生產力。”螞蟻數科CEO趙聞飆在2025WAIC智能體驅動產業變革論壇上如此說道。

也正因此,面向AI大模型在具體行業中的落地,想要真正釋放AI價值,關鍵就在于要從水平通用轉向垂直專用,只有深度理解行業的大模型,才能懂行話,做行活兒,創造真實的業務價值。

金融行業的AI落地,更是如此。

因此,構建專業的金融大模型是推進金融與AI深度融合的必然路徑,未來,金融大模型的應用深度將成為金融機構競爭力的關鍵要素。

大會上,螞蟻數科正式發布了一款專為金融領域打造的金融推理大模型Agentar-Fin-R1,其基于Qwen3研發的垂直行業大模型,包括32B和8B參數兩個版本,在FinEval1.0、FinanceIQ等權威金融大模型評測基準上表現出色,超越DeepSeek-R1等同尺寸開源通用大模型及金融大模型。

同時,螞蟻數科還推出基于百靈大模型的MOE架構模型,獲得更優推理速度。此外,還有非推理版本的14B和72B參數大模型,以滿足金融機構在多樣化場景下的部署需求。

“螞蟻數科主要專注于金融板塊,這也意味著把過去所積累的,對客戶、對場景以及對解決方案的了解,能更深入地提取并實現向垂直專用的轉變。”螞蟻數科CTO王維說道,“而一個好的垂直大模型,特別是具備強大推理能力的那種,才能成為智能體可控、可信賴并且易于優化的核心組件。”

螞蟻數科的金融推理大模型,還將通過Expertise、Efficiency、Evolution三大理念,實現金融大模型的深度專業能力和高效迭代,為金融AI應用構建起 “可靠、可控、可優化” 的智能中樞。

那么,為什么AI落地金融行業這么難?螞蟻數科又是怎么解決這些難題的?

金融不是“題海戰術”,得有專業的“課程表”

金融行業的特殊性在于,每個細分領域都有自己的 “知識密碼”:

銀行的對公業務要分析企業三表(資產負債表、利潤表、現金流量表),證券的投研需要理解K線形態與宏觀政策的關聯,保險的核保要掌握數百條健康告知細則等等。

而通用大模型的 “通識教育” ,在金融行業顯然是不夠用。

更為重要的一點在于,金融行業很多政策都是在實時變化的。

如去年LPR(貸款市場報價利率)調整后,有銀行的AI客服還在按舊利率計算還款額;新的資管新規出臺,模型推薦的理財產品突然成了“不合規產品”

因此,很多靜態的大模型,根本追不上金融行業的 “政策跑速”。

想要解決這些問題,懂行,且能“實時充電”的垂直大模型成為關鍵。

事實上,想要訓練行業大模型,就需要對行業知識進行系統化地學習,其關鍵在于一個科學、專業的任務數據體系作為“課程大綱”。

基于長期深耕金融業務的經驗,螞蟻數科給 AI 量身定制一套金融專業 “課程體系”。其梳理出覆蓋銀行、證券、保險、基金、信托的6大類66小類任務,從 “信用卡逾期風險預測” 到 “基金持倉調整建議”,每個任務都像一門專業課,讓模型逐個攻克。

“教材”已經有了,但更關鍵的則是 “教材” 的質量,畢竟,只有高質量的數據,才能“喂養”出高質量的AI大模型效果。

因此,螞蟻數科以該金融任務體系為框架,從千億級交易、風控和財富等場景中積累的真實原始數據出發、經過嚴格的質量評估、再經過專門設計的可信數據合成和CoT數據精標鏈路,構建了迄今已知最專業最全面的金融領域訓練數據集。

此外,通過加入原則類合成數據,確保大模型在所有任務中都遵循金融業的安全合規要求,以應對例如身份類、合規性、數據安全等問題,提升大模型的安全合規性。

這種 “金融思維鏈” 訓練,讓AI不僅能給出答案,更能說清 “為什么這么判斷”。

與此同時,在訓練層面,螞蟻數科也做了很多功課,如通過創新的加權訓練算法,提高大模型對復雜金融任務的學習效率與性能。在后續業務應用中,可顯著減少二次微調的數據需求與算力消耗,有效降低大模型在企業落地的門檻與成本等。

“本質上,任何一個軟件或大模型訓練,一定要對數據或者訓練的算法有更好的工程化能力。”王維說道,“所以我們也結合對數據訓練的實踐結果,對包括課程學習、差錯歸因分析、微調過程中算力和數據更好比例配方,如何進行調整權重等算法進行了改良。”

螞蟻數科的金融推理大模型Agentar-Fin-R1,將這種專業訓練發揮到極致,經過專業體系數據集訓練的金融大模型,能夠達到“出廠即專家”。

此外,螞蟻數科還給模型裝上了 “進化引擎”。

一方面通過RAG技術實時抓取最新政策文件、市場動態,就像給AI開通了“金融資訊VIP通道”;另一方面,模型會定期“體檢”,通過Finova評測基準自查能力缺口。比如發現對 “個人養老金賬戶稅收優惠” 理解不到位,就會自動生成相關訓練數據,完成針對性升級。

這種自主進化能力,讓某股份制銀行的智能投顧在新規落地當天就更新了產品推薦邏輯,避免了合規風險,“金融AI不能是‘一次性買賣’,得像金融專家一樣持續學習。”

因此,Agentar-Fin-R1能夠實現不斷更新迭代,吸收最新的金融政策、市場動態等關鍵信息,并通過配套評測工具進行針對性優化,讓模型能力在真實業務場景中不斷進化。

以保險行業為例,當新的保險法規出臺,對某些險種的理賠條件或費率計算方式做出調整時,Agentar-Fin-R1能迅速捕捉到這些變化,自動更新相關知識,并在后續處理保險業務時,按照新的規則進行準確操作,確保保險機構的業務始終符合法規要求 。

無疑,垂直行業大模型的能力問題已經解決,但最終還是要讓AI能夠真正嵌入業務流程。

從“能說話”到“會做事”,智能體架起最后一座橋

如果說金融推理大模型是金融AI落地的大腦,那么智能體就是給這個大腦裝上了手腳,成為AI大模型落地企業業務場景中最關鍵的形態。

“智能體的價值,不在于解決1000個淺層問題,而在于攻克行業深層痛點。”趙聞飆說,“智能體要圍繞場景出發,適應企業業務場景,才能在專業知識領域價值最大化。”

事實上,智能體的核心就是將模型大腦與自動化工具結合,完成從對話到執行的躍升,這也成為智能體在產業落地的關鍵。

今年4月,螞蟻數科發布智能體開發平臺Agentar,為金融機構提供一站式、全棧的智能體開發工具,基于該智能體平臺,螞蟻數科整把AI從“聊天機器人”變成“業務多面手”。

如螞蟻數科助力上海某銀行打造的AI手機銀行,創新“對話即服務”模式,用戶通過自然對話即可獲取各類金融服務,這種 “對話即服務” 的模式,讓老年客戶滿意度提升顯著,月活用戶同比增長25%。目前,螞蟻數科累計已服務100%的國有銀行和股份制銀行、超60%的地方性商業銀行、數百家金融機構。

而這背后就得益于螞蟻數科聯合上海銀行共同打造的AI客服智能體,“可以說重塑了服務的本質,通過AI實現了服務的宜人化。”趙聞飆說道。

無疑,智能體成為AI大模型從 “能說話” 到 “會做事”的關鍵橋梁。

這背后,是螞蟻數科智能體把大模型能力與金融業務系統無縫對接,就像給AI配備了“工具箱”,需要算收益時調用計算器,需要查征信時對接征信系統,需要寫報告時調用文檔生成工具。

當然,“智能體背后不僅是大模型的能力,更重要的是專業度,要把專業的數據激活,所以在像金融這一類行業中,我們能夠把螞蟻的經驗輸出出來,這將是非常有價值的事情,且能夠給行業帶來更多智能體標桿應用案例。”王維說道。

相比于其他行業,金融AI落地進展并不迅速,但實際上整個金融AI和金融智能體已經重塑了很多金融類的企業級流程,其也正從copilot的輔助角色,慢慢變成一個決策者角色。

“智能體其實是改寫了軟件的底層規則,基于其泛化能力和可以自主編程代碼能力,我們也相信智能體會越來越在企業級復雜場景中大放異彩。”王維說道。

不過,金融智能體這件事情只有進行時,沒有完成時,所以Everything還在繼續。

或許在不久的將來,當我們再用AI處理金融業務時,會忘記它是“人工智能”,只覺得它是一位懂業務、守規矩、會變通的“老金融人”——這大概就是AI落地金融的最高境界。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/91303.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/91303.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/91303.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深度解析:從零構建跨平臺對象樹管理系統(YongYong框架——QT對象樹機制的現代化替代方案)

一、技術背景與核心價值 1.1 QT對象樹的局限性 在Qt框架中,QObject通過對象樹機制實現了革命性的對象管理: #mermaid-svg-SvqKmpFjg76R02oL {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-Sv…

力扣46:全排列

力扣46:全排列題目思路代碼題目 給定一個不含重復數字的數組 nums ,返回其 所有可能的全排列 。你可以 按任意順序 返回答案。 思路 看到所有可能首先想到的就是回溯。 回溯的結束條件也很好寫,用數組的長度來判斷即可。這道題的難點主要是如何進行判…

mac環境配置rust

rustup 是一個命令行工具,用于管理 Rust 編譯器和相關工具鏈 sh 體驗AI代碼助手 代碼解讀復制代碼curl --proto ‘https’ --tlsv1.2 -sSf https://sh.rustup.rs | sh使得 Rust 的安裝在當前 shell 環境中生效 如果你使用的是 bash, zsh 或其他類似的 shell&#xf…

腳手架搭建React項目

腳手架搭建項目 1. 認識腳手架工具 1.1. 前端工程的復雜化 1.1.1. 如果只是開發幾個小的demo程序,那么永遠不要考慮一些復雜的問題: 比如目錄結構如何組織劃分;比如如何關鍵文件之間的相互依賴;比如管理第三方模塊的依賴&#xff…

Golang 調試技巧:在 Goland 中查看 Beego 控制器接收的前端字段參數

🐛 Golang 調試技巧:在 Goland 中查看 Beego 控制器接收的前端字段參數 在使用 Beego 開發 Web 項目時,我們常常會在控制器中通過 c.GetString()、c.GetInt() 等方法獲取前端頁面傳過來的字段值。而在調試過程中,如何在 Goland 中…

sqli-labs:Less-2關卡詳細解析

1. 思路🚀 本關的SQL語句為: $sql"SELECT * FROM users WHERE id$id LIMIT 0,1";注入類型:數值型提示:參數id無需考慮閉合問題,相對簡單 2. 手工注入步驟🎯 我的地址欄是:http://l…

TRAE 軟件使用攻略

摘要TRAE 是一款集成了人工智能技術的開發工具,旨在為開發者提供高效、智能的編程體驗。它包括三個主要組件:TRAE IDE、TRAE SOLO 和 TRAE 插件。無論是編程新手還是經驗豐富的開發者,都可以通過 TRAE 提高工作效率和代碼質量。標題一&#x…

將開發的軟件安裝到手機:環境配置、android studio設置、命令行操作

將開發的軟件安裝到手機環境配置android studio4.1.2安裝命令行操作環境配置 注意:所有的工具的版本都需要根據當下自己的軟件需要的。 Node:14.16.0 (如果安裝了npm,可以使用npm進行當前使用node版本的更改) &#x…

Jmeter 命令行壓測、HTML 報告、Jenkins 配置目錄

Jmeter 命令行壓測 & 生成 HTML 測試報告 通常 Jmeter 的 GUI 模式僅用于調試,在實際的壓測項目中,為了讓壓測機有更好的性能,多用 Jmeter 命令行來進行壓測。 官方:Jmeter 最佳實踐 同時,JMeter 也支持生成 HT…

記錄幾個SystemVerilog的語法——覆蓋率

1. 前言 通常說的覆蓋率有兩種類型:code coverage(代碼覆蓋率)和functional coverage(功能覆蓋率)。代碼覆蓋率是使用EDA工具自動從設計代碼里提取出來的,功能覆蓋率是用戶指定的,用于衡量測試設計意圖和功能進展。因此,功能覆蓋…

深度學習基礎—2

第一章、參數初始化 我們在構建網絡之后,網絡中的參數是需要初始化的。我們需要初始化的參數主要有權重和偏置,偏重一般初始化為 0 即可,而對權重的初始化則會更加重要,我們介紹在 PyTorch 中為神經網絡進行初始化的方法。 1.1 常…

PyTorch深度學習快速入門學習總結(三)

現有網絡模型的使用與調整 VGG — Torchvision 0.22 documentation VGG 模型是由牛津大學牛津大學(Oxford University)的 Visual Geometry Group 于 2014 年提出的卷積神經網絡模型,在 ImageNet 圖像分類挑戰賽中表現優異,以其簡…

是否需要買一個fpga開發板?

糾結要不要買個 FPGA 開發板?真心建議搞一塊,尤其是想在數字電路、嵌入式領域扎根的同學,這玩意兒可不是可有可無的擺設。入門級的選擇不少,全新的像 Cyclone IV、Artix 7 系列,幾百塊就能拿下,要是去二手平…

【模型細節】MHSA:多頭自注意力 (Multi-head Self Attention) 詳細解釋,使用 PyTorch代碼示例說明

MHSA:使用 PyTorch 實現的多頭自注意力 (Multi-head Self Attention) 代碼示例,包含詳細注釋說明:線性投影 通過三個線性層分別生成查詢(Q)、鍵(K)、值(V)矩陣: QWq?x,KWk?x,VWv?xQ W_qx, \quad K W_kx, \quad V W_vxQWq??x,KWk??x…

PGSQL運維優化:提升vacuum執行時間觀測能力

本文是 IvorySQL 2025 生態大會暨 PostgreSQL 高峰論壇上的演講內容,作者:NKYoung。 6 月底濟南召開的 HOW2025 IvorySQL 生態大會上,我在內核論壇分享了“提升 vacuum 時間觀測能力”的主題,提出了新增統計信息的方法&#xff0c…

神奇的數據跳變

目的 上周遇上了一個非常奇怪的問題,就是軟件的數據在跳變,本來數據應該是158吧,數據一會變成10,一會又變成158,數據在不斷地跳變,那是怎么回事?? 這個問題非常非常的神奇,讓人感覺太不可思議了。 這是這段時間,我遇上的最神奇的事了,沒有之一,最神奇的事,下面…

【跨國數倉遷移最佳實踐3】資源消耗減少50%!解析跨國數倉遷移至MaxCompute背后的性能優化技術

本系列文章將圍繞東南亞頭部科技集團的真實遷移歷程展開,逐步拆解 BigQuery 遷移至 MaxCompute 過程中的關鍵挑戰與技術創新。本篇為第3篇,解析跨國數倉遷移背后的性能優化技術。注:客戶背景為東南亞頭部科技集團,文中用 GoTerra …

【MySQL集群架構與實踐3】使用Dcoker實現讀寫分離

目錄 一. 在Docker中安裝ShardingSphere 二 實踐:讀寫分離 2.1 應用場景 2.2 架構圖 2.3 服務器規劃 2.4 啟動數據庫服務器 2.5. 配置讀寫分離 2.6 日志配置 2.7 重啟ShardingSphere 2.8 測試 2.9. 負載均衡 2.9.1. 隨機負載均衡算法示例 2.9.2. 輪詢負…

maven的阿里云鏡像地址

在 Maven 中配置阿里云鏡像可以加速依賴包的下載,尤其是國內環境下效果明顯。以下是阿里云 Maven 鏡像的配置方式: 配置步驟:找到 Maven 的配置文件 settings.xml 全局配置:位于 Maven 安裝目錄的 conf/settings.xml用戶級配置&am…