獨家 | 螞蟻金服TRaaS技術風險防控平臺解密

小螞蟻說:

在金融行業,風險防控能力的重要性不言而喻。而螞蟻金服可實現高達99.999%的異地多活容災,千億級資金秒級實時核對“賬、證、實”等能力也讓業界有目共睹。

今年位于杭州的螞蟻金服ATEC科技大會上,螞蟻金服正式推出技術風險防控平臺TRaaSTechnological Risk-defense as a Service)。經歷過無數考驗的?TRaaS 是把螞蟻金服整個分布式架構和相應的技術風險能力組合在一起的免疫系統,它將高可用和資金安全能力結合 AIOps,使系統實現故障自愈,具有免疫能力。

本文將為大家全面解讀螞蟻金服的技術風險防控平臺TRaaS。

與 IaaS、PaaS、SaaS 都同屬于“aaS”輩的 TRaaS 聽起來就給人一種高科技的感覺,這個在今年螞蟻金服ATEC 科技大會上一鳴驚人的名詞的中文釋義非常令人尋味,Technological Risk-defense as a Service,技術風控即服務。而按照 ATEC 大會主辦方螞蟻金服解釋,TRaaS 是螞蟻金服內部沉淀已久推出的“技術風險防控平臺”,它將高可用和資金安全能力結合 AIOps,使系統實現了主動發現風險和自我恢復的能力,進而形成了更智能化、精細化的技術風險防控體系。

而實際上,螞蟻金服醞釀 TRaaS 已經有幾年之久,在經過四年的精心打磨和無數次嚴酷考驗之后,螞蟻金服才在此次ATEC 大會上將之公布與眾,由此足見 TRaaS 對于螞蟻金服的重要性,因此,筆者覺得有必要對 TRaaS 進行一番深入的剖析和解讀。

?

1.TRaaS 的前世今生

“螞蟻有一個團隊,他們在背后默默守護著我們的系統,為保障業務連續性付出十二分的努力。他們就是螞蟻的技術風險團隊。大家知道,風險防控能力對于金融系統而言是第一位的,如何保障金融系統的高可用?如何保障金融業務的0資損?這就是技術風險團隊需要解決的兩大課題,隨著金融行業日新月異的發展,這兩大課題逐漸發展成為包含容量彈性管控、變更風險預測、資金風險識別與故障智能決策等在內的技術風險防控領域,最終成長為更智能化、精細化的技術風險中臺架構。當前我們已經在螞蟻金融云上開放了技術風險領域最為成熟,并在螞蟻內部得到廣泛應用的技術風險防控產品。我們將繼續在 AIOps 運維方向上探索,通過數據、算法、經驗沉淀支撐 7×24h 智能運維。因此,我們將技術風險這層能力持續地抽象出來,形成 TRaaS,輸出給數字化轉型的金融機構,在分布式架構改造升級的同時提高技術風險防控能力,真正做到讓不確定的事變成確定!”螞蟻金服如此講述了 TRaaS 的來龍去脈。

正如上所述,TRaaS 誕生于支付寶系統千錘百煉的實戰經驗之中,是在經歷了嚴酷的“雙十一”等多次考驗下一步一步逐漸成長起來的技術風險防控平臺。

2015 年,在支付寶經歷了慘痛的527事件以后,螞蟻金服痛定思痛,組建了技術風險 SRE 團隊,負責螞蟻金服整個金融系統的風險防控。在這一年,螞蟻完成了資金安全防控體系建設,并實現了異地多活的容災架構,還建立了容災演練機制。

2016 年,螞蟻金服成立高可用&資金安全架構組,這也是日后 TRaaS 為用戶提供高可用和資金安全兩大能力背后的強大技術支撐團隊。同年,螞蟻金服開始進行斷網突襲演練,構建自適應容災架構,這也為 TRaaS 具備的業務連續性和高可用性打下了堅實的基礎。同在這一年,支付寶資金業務核對由 T+H 提升到實時。

2017 年,支付寶系統實現了故障定位精細化,這為日后的故障自愈提供了前提條件,而灰度仿真的支持,則進一步提升了系統的健壯性。同年,螞蟻金服還引入了紅藍攻防,這為 TRaaS 注入了風險預測的能力。

2018 年,在故障定位精細化的基礎上,支付寶系統實現了故障自愈,容災仿真回歸為系統提供了出色的容災能力,而 AIOps,則將人工智能技術融合在了風險防控之中。

正是在這樣的基礎上,螞蟻金服在今年的云棲 ATEC 大會上正式推出了 TRaaS 技術風險防控平臺。

?

2.TRaaS 究竟強在哪里?

“TRaaS 這套架構,我們內部稱之為”免疫系統“,它就好像人類的免疫系統。就像人們生病時,免疫系統會幫助他們快速恢復健康一樣,我們把螞蟻金服整個分布式架構和相應的技術風險能力組合在一起,提供出來,這就是我們的免疫系統——TRaaS。通過 TRaaS,我們可以保證實現 99.999%的高可用性,這背后依靠的就是我們三地五中心的架構。另外,對于金融最關鍵的資金安全,TRaaS 可以做到實時化的內部帳、證、實的核對,速度達到秒級。此外,最關鍵的是 TRaaS 具有強大的”免疫能力“,可以使我們做到風險5分鐘發現,5 分鐘自愈。”螞蟻金服副 CTO、副總裁、首席架構師胡喜一針見血的指出了 TRaaS 系統的三大強點,即高可用、資金安全、免疫能力。

強點之一:高達 99.999%的高可用性

高可用對于金融系統的重要性不言而喻,而對于支付寶這樣最高可達每秒 25.6 萬筆交易處理能力,擁有幾億行代碼、幾萬臺服務器以及未來可能由百億行代碼、百萬臺服務器構成的龐大和動態變化的系統而言,如何能夠合理地架構與駕馭其復雜性,使其保持健壯、敏捷及高可用性對螞蟻金服而言是一個極大的挑戰。

為此,螞蟻金服通過自主研發的金融分布式架構 SOFAStack 以及金融分布式數據庫 OceanBase,為系統提供全方位的業務連續性和高可用保證。SOFAStack 將提供全棧式的金融分布式架構能力,配合金融分布式數據庫 OceanBase,能夠在保證風險安全的同時幫助業務需求敏捷迭代,同時滿足異地容災、低成本快速擴容的需求。

但對于金融系統的高可用來說,容災顯然更為關鍵,螞蟻金服在本次ATEC大會上重磅推出三地五中心架構,即在三座城市部署五個機房,一旦其中一個或兩個機房發生故障,支付寶的底層技術系統會將故障城市的流量全部切換到運行正常的機房,并且能做到數據保持一致且零丟失,三地五中心架構可實現低成本交易,無限可擴展,恢復點目標(RPO)接近 0,恢復時間目標(RTO)小于 30 秒。

同時,通過全鏈路壓測,即將足夠的流量壓力,例如類似“雙十一”的流量壓力,載入整個系統之中,來測試系統系統在極限容量下的可用性,并通過測試結果對系統進行不斷的調整和優化。

依靠這種三地五中心的異地多活容災架構以及全鏈路壓測的考驗,TRaaS 最終實現了高達 99.999%的高可用性,即極高可用性,也就是說系統年度停機時間將不超過 5 分鐘。

強點之二:千億級資金秒級實時核對

資金安全對于金融系統的重要性不言而喻,尤其對于支付寶這種每秒能夠處理百億、千億級資金的平臺來說,資金安全則更是生死攸關的大事了。資金安全的本質是要保證在整個業務交易的流水過程中,資金金額不能出現差錯。而這則要涉及到人、應用、數據三大對象以及故障應急、數據支撐、風險度量、灰度演練、風險識別五大能力。

?而這些方面能力的提升,只能是通過不斷的攻防演練來實現,因此,從 2016 年開始,螞蟻金服就開始進行斷網突襲演練,而到了 2017 年,螞蟻金服更是引入紅藍攻防,演練的頻率也從從一、兩個月一次逐漸過渡到現在的每天一次。

通過這樣的不斷演練,螞蟻金服的業務核對能力由最初的 T+1,逐步過渡 T+H,直到今天的實時業務核對,而整個資金安全防控體系也包含了變更管控、自動化回歸、流量仿真、資金安全監控、應急預案等更多的內容。

TRaaS 平臺負責人,螞蟻金服研究員陳亮(花名:俊義)回憶道,在整個資金防控體系的演進過程中,最初與很多銀行一樣,是靠人力做當前的金額跟全天總賬的對賬。之后通過自動的方式,將全量數據庫表導出后做計算來進行核對。后來業務量更大了以后,就引入了 T+H,核對時間也從天變到小時級,并在此過程中增加了異常管理。最后演進到實時業務核對時,又增加了熔斷決策、資金免疫以及智能監控等方面的功能,從而形成了 TRaaS 強大的千億級資金秒級核對能力。

強點三:5 分鐘發現,5 分鐘自愈的免疫能力

對于一個關鍵系統,尤其是金融系統來說,如果系統不主動出現問題,就幾乎不可能知道系統存在問題,因此,螞蟻金服對此的應對方法是每天不斷的給系統注入各種故障,而且這些故障覆蓋螞蟻金服的一千多個應用場景,這種注入故障的方法就好比軍事演習中的紅藍軍對抗,因此,稱為“紅藍攻防”。而在不斷的在對抗中,TRaaS 系統不斷的走向健壯,從而形成了自己所謂的“免疫能力”。

而通過引入AIOps,即智能運維,不僅能夠幫助TRaaS在發現、定位和自愈能力上更加智能,而且可以大幅降低運維人員的工作量。對此陳亮還舉了幾個例子,例如在高可用的監控領域,由于需要監控的點和數據非常多,這就會使數據的噪音增多。而這些噪音AI只要通過一定的訓練和模式識別就可以輕松過濾掉,而對人來說這卻非常困難。又比如在支付寶內部,僅僅監控點就有五六萬個之多,而每個點都可以配置出一條數據,如果再讓人把這些數據繪成可視化的圖表,這幾乎是不可能完成的任務,而AI則可以輕松做到。陳亮還介紹說,通過AI的方式識別監控數據之間的關聯,無論是對于資金監控、故障發現、精確定位,還是風險預測,快速止血以及自動決策都是事半功倍的。

?

3.TRaaS 的未來會怎么樣?

作為螞蟻金服成立四年來,最為重磅的發布,TRaaS、分布式金融核心套件以及大數據+人工智能平臺實際上是螞蟻金服在金融系統多年積累和沉淀的技術能力、服務能力的對外輸出,它代表了螞蟻金服 3.0 時代的開放思想,也標志著螞蟻金服在金融系統領域技術上的最高水平,實際上確立的是螞蟻金服在金融領域技術領先的地位,同時也是阿里巴巴董事會主席馬云所倡導的“五新”中的創新金融服務中的重要一環。TRaaS 之于支付寶、螞蟻金服、甚至整個阿里巴巴集團都非常重要,因此,我們有理由相信 TRaaS 將會成為螞蟻金服在核心金融系統領域的殺手锏,而擺在它面前的征途,將是星辰和大海!

轉載于:https://www.cnblogs.com/Ant-Techfin/p/9933729.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/278971.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/278971.shtml
英文地址,請注明出處:http://en.pswp.cn/news/278971.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

谷歌表格_如何使用宏自動執行Google表格

谷歌表格Google Sheets lets you automate repetitive tasks with macros, and you can then bind them to keyboard shortcuts to execute them quickly. They work using Google Apps Script to capture your actions for later use. Google表格可以讓您使用宏自動執行重復性…

阿里云彈性高性能計算E-HPC強勢來襲,全新打造一站式云超算

為什么80%的碼農都做不了架構師?>>> 摘要: 如今,高性能計算已在不知不覺中滲透到人類生活的方方面面。從材料科學到石油勘探、金融市場、應急管理、醫學和互聯網等領域,高性能計算無一不大顯身手,幫助快速…

linux導出硬件信息,Linux 上生成硬件信息與配置報告: Sysreport

當需要 Linux 主機詳細完整的描述給另一個人的時候,這個工具非常適合。用 root 用戶之行,但要注意最好不要抓取 currently installed packages 信息,這一步非常慢。(用 -norpm 參數)存儲廠商 EMC 也有個 EMCgrab 工具,工作原理類似…

深度優先搜索(DFS)----------------Tju_Oj_3517The longest athletic track

這個題主要考察對樹的操作,主要思想是DFS或者BFS,其次是找樹的直徑方法(既要運用兩次BFS/DFS),最后作為小白,還練習了vector的操作。 DFS框架偽碼: bool DSF(Node oneTreePoint ){ //傳入的結點和其他有效…

word中圖片超出頁邊距_如何在Word中更改頁邊距

word中圖片超出頁邊距Word documents open with one-inch margins by default. You can adjust the page margins by choosing one of Word’s predefined options, or you can specify the exact height and width of the margins yourself. Here’s how. 默認情況下&#xff…

Android 中文 API (16) —— AnalogClock

一、結構 public class AnalogClock extends View java.lang.Object android.view.View android.widget.AnalogClock 二、類概述 這是一個帶有時針和分針的模擬時鐘控件。 三、受保護的方法 protected void onAttachedToWindow () 視圖(AnalogClock)附在…

linux服務器探針軟件,服務器安裝ServerStatus監控探針教程

前言本文將介紹在服務器上安裝ServerStatus來監控多臺服務器的運行狀態的教程.ServerStatus-Toyo版是一個酷炫高逼格的云探針、云監控、服務器云監控、多服務器探針~,該云監控(云探針)ServerStatus-Toyo項目鏈接本文為Stille原創文章.經實踐,測試,整理發布.如需轉載…

iphone播客怎么上傳_如何在iPhone,iPad或Android上收聽播客

iphone播客怎么上傳Khamosh PathakKhamosh PathakDid someone recently recommend you listen to a podcast? If your response was, “What’s a podcast?” we’ve got the answer, and more! Here’s a crash course on podcasts and how you can listen to them on your …

NOIP2018 退役記

NOIP掛完,OI再見 AFO Day 0 早上的高鐵,1點多到廣州,2點多到酒店,下午就是頹頹頹,然后晚上隨便刷了一下板子,反正PJ也沒啥板子可以刷 就這樣浪費了一天,我到底在干嘛 Day 1 早上心態很好的繼續刷…

Linux決心書/李世超

Linux決心書大家好,我叫李世超,來自河北邯鄲。今年24,感覺之前的生活狀態不是自己想要的,每天渾渾噩噩。我覺得人要對自己定一個目標,我的目標就是月薪10K以上,所以我要努力在老男孩教育學習技術。珍惜這五…

linux下設備或資源忙,linux刪除文件目錄 目錄設備或資源忙怎么辦

linux刪除文件目錄 目錄設備或資源忙怎么辦來源:未知作者:老黑時間:09-09-21【打印】[rootrs swms]# rmdir zpggrmdir: ‘zpgg’: 設備或資源忙相關服務都已經停止掉了,有什么辦法強制刪除嗎?你可以在有windows的硬盤上…

Codeforces 1066 C(思維)

傳送門: 題面: C. Books Queries time limit per test 2 seconds memory limit per test 256 megabytes input standard input output standard output You have got a shelf and want to put some books on it. You are given qq queries of three type…

outlook默認簽名設置_如何將默認簽名添加到Outlook會議請求

outlook默認簽名設置An odd quirk in Outlook is the inability to add a default signature to meeting requests. Here’s a quick and simple way to set up a one-click solution that avoids cutting and pasting every time you create a meeting. Outlook中的一個奇怪問…

技嘉 linux設置u盤啟動項,技嘉主板bios設置u盤啟動教程

對于想要重裝系統的朋友來說,進bios一直是最大的難關,對于技嘉主板來說尤為復雜,下面小編就詳細給大家介紹一下技嘉主板bios設置u盤啟動的方法。方法一:使用u盤啟動快捷鍵直接進入u盤裝系統1、技嘉主板u盤啟動快捷鍵是F12&#xf…

uefi模式下win10安裝雙系統ubuntu18.04LTS

自己折騰了半天,血與淚啊(難得一個可愛的周末 wwww我一定要寫下來 跟這個博客幾乎一模一樣了 https://blog.csdn.net/xrinosvip/article/details/80428133 我的電腦型號:戴爾G3 默認uefi模式,按f2進入的bios界面是新版跟教程上的不…

outlook日歷不顯示_如何在Outlook Online中突出顯示不同的日歷

outlook日歷不顯示If you’ve ever displayed multiple calendars in one view in Outlook Online, you’ll know how useful it is but also how confusing it can get. Use colors and charms to know at a glance which appointment belongs to which calendar. 如果您曾經在…

WinRAR 5.40 4.20 3.93 的注冊碼 - rarreg.key

把下面的數據復制到“記事本”中,用文件名“rarreg.key”命名該文件,保存到WinRAR安裝文件夾即完成注冊。以下4個Key隨便選一個復制都可以。WinRAR 5.40 版Key,復制箭頭中間內容,上下無空格。(5.00版的Key 4.X和之前的3.X版本也能…

linux 下eclipse調試程序,文章2 Linux安裝Eclipse閱讀及調試程序

由于安裝Eclipse需要Java環境,還需要配置環境,非常復雜,建議安裝系統時,選擇上Eclipse開發工具但是安裝的Eclipse中沒有CDT。首先給Eclipse安裝一個CDT。1.安裝CDTEclipse菜單欄help----Install New Software.從Available Softwar…

Redis學習筆記~分布式的Pub/Sub模式

redis的客戶端有很多,這次用它的pub/sub發布與訂閱我選擇了StackExchange.Redis,發布與訂閱大家應該很清楚了,首先一個訂閱者,訂閱一個服務,服務執行一些處理程序(可能是寫個日志,插入個數據&am…

django自定義用戶表

django自帶了用戶表。 -- auto-generated definition create table auth_user (id int auto_incrementprimary key,password varchar(128) not null,last_login datetime(6) null,is_superuser tinyint(1) not null,username varchar(150) not null,fir…