對話阿里云云原生產品負責人李國強:推進可觀測產品與OpenTelemetry開源生態全面融合

5 月 22 日,在最新一期的飛天發布時刻上,阿里云宣布多款可觀測產品全面升級,其中一項是應用實時監控服務 ARMS 在業內率先推進了與 OpenTelemetry 開源生態的全面融合,極大豐富了可觀測的數據類型及規模,大幅增強了 ARMS 核心能力。

本次阿里云 ARMS 產品全面升級的背景是什么?為什么會產生圍繞 OpenTelemetry 進行產品演進的核心策略?在云原生、大模型等新型應用架構類型層出不窮的今天,又將如何為企業解決新的挑戰?飛天發布時刻在第一時間采訪了阿里云云原生應用平臺產品負責人李國強,讓我們跟隨這場訪談實錄,走進全新升級的阿里云可觀測產品。

阿里云本次重磅發布應用實時監控服務 ARMS 進行了全面的能力升級,為什么要做這樣的演進?這背后希望傳遞給大家什么樣的信息?

李國強: 這是一個非常好的問題,借此我也和大家分享一下 ARMS 產品演進的一些方向和策略。ARMS 是應用性能監控領域的產品,在整個應用架構隨著市場需求變化的不斷演進下,它自然地會隨之發生一些變化。

比如像前兩年云原生應用、以及這幾年大模型應用的出現,應用架構一直在演進。作為一個應用性能監控產品,同樣要不斷去迭代自己的功能,持續對新類型應用提供性能監控能力。幫助企業將應用架構性能與穩定性做好,這是為什么 ARMS 不斷的進行演進、支持新能力的原因。

在最新的發布的能力中,有兩大塊能力也是完全契合新的應用類型與架構變化的。

第一是整個端側應用的能力提升。 隨著移動互聯網走進千行百業,大家用手機端去做事情的場景會越來越多,頻次也會高一些,這時候端側的性能監控就變得越來越重要。因為很多時候用戶發現性能出了問題,作為一個廠商去診斷的時候,如果只看后端的監控性能,是不能夠找到這個問題的根因的。

通過 ARMS,我們對用戶體驗監控(RUM)能力進行提升,去幫助企業解決這方面問題,它有幾個重要的演進特征:

  • 第一個,就是對多端的支持。像 iOS、安卓、小程序,包括 React 等一些新的技術,使端側類型變得非常的多。那怎么能夠在一個產品里面支持所有客戶端類型,對于企業來講是非常關鍵的。
  • 第二個,就是現在用戶對體驗要求越來越高之后,對于企業來講,也需要能夠精細化的定位每個用戶的請求是不是出問題。所以在最新的能力中,我們支持了以會話 Session 為粒度的可觀測分析能力,使企業出現問題時能快速進行根因定位。
  • 第三個,就是在應用監控這塊,我們擁抱了 OpenTelemetry 這樣一個開源的標準,前面我們講到今天客戶端的類型非常豐富,各種各樣的數據的采集方式和數據的格式,我們借助開源的力量,實現真正的統一。當我們基于這種統一的采集方式、數據格式的時候,會更快的構建出一個可觀測體系,這對企業也是非常關鍵的。
  • 第四個,是如何對客戶端的性能進行深度分析診斷,這也是非常關鍵的。包括會話的分析、頁面的分析、資源的分析、異常分析等等,這些都是用戶快速去發現端側問題需要關注的地方。

另外是在應用監控即后端應用方面, 剛才講到了近幾年隨著微服務的興起、云原生應用、大模型應用的不斷出現,也催生了應用監控能力不斷的提升,包括近年來在開源體系的支撐之下,我們原有的自研探針也升級到了以 OpenTelemetry 作為基礎的探針模式。

這樣使得我們能夠更好的去借助整個開源社區的力量,在這之上還能再去做更強的自研能力的增強,使用戶一方面可以去擁抱開源這樣一個體系,另一方面還能得到我們一些產品上的加持。

第二個就是對多語言的能力支持。 因為今天企業的應用類型越來越復雜了,它有原有的、老的應用類型,也有新興的互聯網的、手機的、大模型的應用,必然會導致語言類型多。之前我們有一個調研,結論是大部分的后端應用都是以 Java 為主,但這兩年我們發現一個非常明顯的趨勢:互聯網公司開始越來越多地用 Go 語言,大語言模型越來越多地用 Python 這個語言。

所以在最新的能力里面,我們除了持續加強對 Java 語言的支持之外,還增加了對 Go 語言和 Python 語言的無侵入的支持能力,使得用戶再去構建云原生應用、大模型應用的時候也能夠以無侵入的方式獲得監控的能力。

第三個增強就是持續的剖析能力,Continuous profiling。 這也是今天去做一些精細化的問題診斷時需要的,它能夠在整個應用程序里形成一個切面,找到某一個問題出現時 CPU、內存等的一些特征,這對用戶診斷一些比較復雜的問題的時候也是非常關鍵的。

另外,剛才也講到近來大模型應用非常的火,其實從去年開始已經有非常多企業在用大模型構建應用了。大模型的應用架構其實和原有的應用架構也是不太一樣的,它里面有比較多的像對檢索增強的調用、對大模型本身的調用,這些調用在監控里是有特殊的數據格式和語義的。

在 ARMS 里面我們也最新推出了針對大模型應用的可觀測能力,對用戶是否為大模型調用的場景進行識別,并且給他一個專屬的展示界面,使用戶能夠看得非常清楚,看到大模型應用是不是做了 RAG 的檢索增強調用、它的響應時間、Token 量等等一系列的能力,幫助用戶在構建大模型應用的時候調試及上線后的一些問題診斷等。

這些方面其實都是今天 ARMS 在面對新型的應用架構、新型的應用類型的時候推出的一系列新的能力,幫助用戶持續構建好應用,同時還能不斷地加強用戶去精細化的診斷問題、發現問題的能力。

可觀測性是云原生應用的基礎。本次應用實時監控服務 ARMS 整體升級的一個主要的方向是圍繞 OpenTelemetry,它帶來什么重要的意義?

李國強: 這也是一個非常重要的產品策略的一個演進的方向。我們明顯看到近幾年一個趨勢,就是在可觀測這個領域,開源已經成為了一個事實標準,在主導這個領域的主要的發展,包括像 Prometheus、Grafana,以及今天我們講到 OpenTelemetry,這里的主要目標是能夠讓這個開源主導的技術發展得更加活躍,包括在用戶使用的時候它的推廣和普及性會更好。

那回到今天 ARMS 這個重要發布來看的話,這次全面擁抱 OpenTelemetry 生態的演進,有幾個重要點可以和大家分享。

首先,OpenTelemetry 最核心的使用領域是 Tracing,我們前面也講到了,在這個領域里需要做到對整個應用調用的鏈路進行跟蹤和數據的采集,這是非常多元的。OpenTelemetry 通過定義標準的采集端和數據格式,統一了各種各樣數據源的采集方式和獲取數據的格式,使用戶去構建一體化的可觀測體系和架構的時候,變得更加簡單了。這個標準化其實各個廠商有些時候是很難去實現的,只有通過開源、標準的這種方式才能去做到它。

其次,就是廣泛多語言支持,前面其實我也提到了,今天企業內部的語言使用越來越廣泛,OpenTelemetry 作為一個非常活躍的社區,其實對多語言的支持天然是非常好的,這也是開源社區常見的一種形態,所有人大家都來貢獻,那在多語言支持這件事情上肯定也比一個人做要快,所以廣泛的多語言支持也是我們去看重 OpenTelemetry 社區非常重要的方面。

第三個就是活躍的社區生態,除了我們剛才講的對多語言的支持,在可觀測里面還有一個多樣性,就是框架的多樣性。同樣的,這通過活躍的社區生態是也是更好、更容易支持的,社區往往在設計架構之初就會考慮到擴展性,因為它需要去更多的人貢獻,那這個擴展性也非常利于云廠商在開源能力之上去做一些增強。

基于 OpenTelemetry 這樣一個標準,ARMS 也在這之上做了非常多自研能力的增強,包括指標采集、采集率的調整等等,這樣一些能力使得用戶既能夠享受到開源社區的能力,不被廠商綁定,同時又能享受到云廠商在這上做的各種各樣能力的增強,這些原因是我們今天去選擇去擁抱開源以及去擁抱 OpenTelemetry 的最核心。包括我們希望去借助這種 OpenTelemetry 這樣一個能力能夠幫助用戶可以更加便捷快速地構建起整個可觀測的體系。

本次?ARMS 也帶來免費試用額度,登錄阿里云官網? “aliyun.com” ?搜索應用實時監控 ARMS,或者點擊此處,即可獲取免費試用資源。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/14238.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/14238.shtml
英文地址,請注明出處:http://en.pswp.cn/web/14238.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

帶你玩轉OpenHarmony AI:打造智能語音子系統

簡介 AI時代,智者當先,判斷一個終端設備是否智能,語音能力是必不可缺的。智能家居、智慧廚房、智能汽車等等,一切衣食住行都在往智能方向發展,那我們該如何在OpenAtom OpenHarmony(簡稱“OpenHarmony”&am…

使用Java Stream API的map方法將包含Long類型ID的流轉換為String數組

在這個例子中,idList是一個包含Long類型ID的列表。我們使用stream()方法創建一個流,然后應用map(String::valueOf)方法將Long類型的ID轉換為String類型。最后,我們使用toArray(String[]::new)方法將流中的元素收集到一個新的String[]數組中。…

【spark001】SparkSQL內置函數手冊總結(更新中)

1.熟悉、梳理、總結下SparkSQL相關知識體系。 2.日常研發過程中使用較少,隨著時間的推移,很快就忘得一干二凈,所以梳理總結下,以備日常使用參考 3.歡迎批評指正,跪謝一鍵三連! 文章目錄 1.函數清單 1.函數清…

未來十年,IT行業的無限可能!

未來十年,IT行業的無限可能! 😄生命不息,寫作不止 🔥 繼續踏上學習之路,學之分享筆記 👊 總有一天我也能像各位大佬一樣 🏆 博客首頁 怒放吧德德 To記錄領地 🌝分享學…

Netty-時間輪

Netty-時間輪 歸檔 GitHub: Netty-時間輪 參考 Netty-時間輪 說明 其實 Netty 框架并沒有使用,其可做學習算法原理的參考 單元測試 public class HashedWheelTimerTest2 {public static void main(String[] args) {System.out.println("---------> &qu…

多聯機分戶計費控制系統

中央空調多聯機分戶計費控制系統,針對國內常見幾種品牌的多聯機空調系統實行,遠程控制與計費管理。系統采用MQTT網絡協議,以訂閱/發布模式實行設備感知,實現對室外機、室內機的狀態監測、實時故障報警、累計分攤費用的實時數據傳導…

AI - 各類AI針對Excel分析對比

一個水果銷量表,Excel包含多個年份sheet,需要提取某個品種的水果每年的銷量,看看幾個AI的分析結果吧 1、文心一言3.5(不支持Excel) 不支持上傳Excel文件 2、 通義千問2.5(完成★) 順利完成…

C++-函數

函數(Function):是一個提前封裝好的、可重復使用的、完成特定功能的獨立代碼單元。 特點:提前封裝、可重復使用的、完成特定功能 將針對特定功能的、有重復使用需求的代碼,提前封裝到函數內, 在需要的時候…

Linux(openEuler22.03) 定時備份任務 解決方案

目錄 定時備份與清理服務環境需求概述步驟詳解1. 配置 rsyncd 服務在 backup 服務器上配置 rsyncd 2. 在 nfs01 和 web01 上配置備份腳本腳本:backup_configs.sh配置定時任務 3. 在 backup 服務器上配置同步和清理腳本腳本:cleanup_backups.sh配置定時任…

游戲陪玩/在線租號/任務系統網站源碼

源碼介紹 游戲陪玩系統/在線租號系統/小姐姐陪玩任務系統/網游主播任務威客平臺源碼/絕地吃雞LOL在線下單/帶手機端/聲優線上游戲任務系統網站源碼 界面美觀,功能齊全,已對接支付,安裝教程放源碼壓縮包里了! 界面截圖 源碼下載 https://download.csdn.net/download/huayula…

【計算機網絡原理】淺談應用層協議的自定義和傳輸層UDP協議的總結

?????? write in front ??????? ?????????大家好,我是xiaoxie.希望你看完之后,有不足之處請多多諒解,讓我們一起共同進步????? . ?? ?xiaoxie?????????—CSDN博客 本文由xiaoxie????????? 原創 CSDN 如…

如何在cPanel面板中開啟雙因素身份驗證

本周有一個客戶,購買Hostease的主機, 客戶購買的是Linux虛擬主機,帶cPanel面板的。詢問我們的在線客服,如何加強他的cPanel的安全性。cPanel的雙因素身份驗證功能可以幫助幫客戶加固安全性。 雙因素身份驗證(2FA)是一種增強安全性…

【虛擬機軟件】 VMware Workstation Pro 17 新建 Linux 虛擬機教程(CentOS 7 版本)

文章目錄 下載安裝 VMware Workstation Pro 17 軟件下載 Linux 的 ISO 映像文件Linux版本選擇 新建虛擬機準備配置新建安裝 后續設置文章導航 我是一名立志把細節說清楚的博主,歡迎【關注】🎉 ~ 原創不易, 如果有幫助 ,記得【點贊…

slam14講(第8講、前端里程計)LK光流、直接法

直接法的引出 因為第7講大部分都是講特征點法,通過提取orb特征點和點的描述子,來構建兩幀圖像之間的特征點對應關系。這種方法會有缺點: 關鍵點和描述子提取計算耗時,如果相機的頻率高,則slam算法大部分耗時被占。特…

com.alibaba.fastjson.JSONObject循環給同一對象賦值會出現“$ref“:“$[0]“現象問題

1、問題描述 有些場景下,我們會選擇用JSONObject代替Map來處理業務邏輯,但是使用JSONObject時有一個需要注意的地方:在處理JSONObject對象時,引用的com.alibaba.fastjson.JSONObject,在一個集合中,循環給這…

【MySQL精通之路】InnoDB(10)-行格式

目錄 1.表數據結構 1.1 聚集索引數據結構 1.2 輔助索引數據結構 2.行格式 2.1 REDUNDANT行格式 2.2 REDUNDANT存儲特性 2.3 COMPACT行格式 2.4 COMPACT存儲特性 2.5 DYNAMIC行格式 2.6 DYNAMIC存儲特性 2.7 COMPRESSED行格式 2.8 COMPRESSED存儲特性 3.定義表格的…

數組-區間合并

一、題目描述 二、題目思路 這里提供滿足基本要求的解題思路: 1.先對列表內按照start大小升序排序,這里創建Comparator接口的實現類,重寫compare方法。 2.遍歷intervals,設置laststart、lastend兩個變量與當前區間相比較&#…

Ansible實戰YAML語言完成apache的部署,配置,啟動全過程

🏡作者主頁:點擊! 🏝?Ansible專欄:點擊! ??創作時間:2024年5月24日15點59分 目錄 💯趣站推薦💯 🎊前言 ??YAML語言回顧 🎆1.編寫YAML文…

centos 安裝nginx 并配置https ssl

進入你要安裝的目錄 一般是/usr/local/ wget https://nginx.org/download/nginx-1.24.0.tar.gz解壓安裝包:使用以下命令解壓下載的Nginx安裝包: tar -zxvf nginx-1.24.0.tar.gz在編譯和安裝Nginx之前,確保您的系統上已安裝了必要的編譯工具和…

flume channel和interceptor簡介及官方用例

一、Flume Channels channel是在代理上暫存事件的存儲庫。Source 添加事件,Sink 將其刪除。 1、Memory Channel 事件存儲在具有可配置最大大小的內存中隊列中。它非常適合需要更高吞吐量的流,但在agent發生故障時會丟失暫存數據 Property Name Defau…