AmzTrends x TiDB Serverless:通過云原生改造實現全局成本降低 80%

本文介紹了廈門笛卡爾數據(AmzTrends)在面臨數據存儲挑戰時,選擇將其數據分析服務遷移到 TiDB Serverless 的思路和實踐。通過全托管的數據庫服務,AmzTrends 實現了全局成本降低 80% 的效果,同時也充分展示了 TiDB Serverless 在簡化架構、提升性能和降低成本方面的優勢。未來,AmzTrends 計劃繼續利用 TiDB Serverless 的優勢,擴展業務并提升競爭力。

廈門笛卡爾數據是一家專注于跨境電商數據分析的 SaaS 公司,AmzTrends 為亞馬遜賣家提供品牌分析(ABA)、商機探測以及廣告數據的可視化分析。目前,AmzTrends 主要以 SAAS 和 Chrome、紫鳥瀏覽器的插件形式為客戶提供數據服務,以訂閱模式為美國、日本、中國數萬計的跨境電商賣家提高數據服務,幫助賣家在選品、運營、廣告等運營環節提供專業的數據分析決策價值 。

業務挑戰

AmzTrends 的數據主要以大單表的形式進行存儲,最大的表數據量超過 22 億,字段較多且某些字段很長的大寬表,單表中存在結構化與非結構化的數據結構,因此需要建立大量的索引,占用大量存儲空間,而且過期數據還需要定期清理,經常使用 BATCH 進行批量操作,一旦遇到異常無法無法事務的一致性,因此數據維護壓力巨大。

技術痛點

在業務初期,AmzTrends 選擇了在百度云上自建 TiDB 集群,資源按月付費。集群規模包含 1 個 TiDB 節點、1 個 PD 節點(此種部署方式會損害 PD 的高可用性,為了節約成本的部署方式,是官方不推薦的高風險方案)、3 個 TiKV 節點,技術人員通過將亞馬遜下載的原始 CSV 格式的數據批量寫入到 TiDB 中進行數據分析。此外還單獨配置了 3 臺服務器部署 Spark,進行全量復雜的數據計算分析。但 Spark SQL 與關系型數據庫不同,需要專人運維,復雜的業務架構造成了資源冗余,使得運維成本較高。

由于集群配置不夠加上專業運維團隊的缺失,棄用了 Spark,大量復雜且數據計算量巨大的任務由 Spark 轉到 TiDB 直接運行,集群越來越不穩定,數據安全面臨嚴重挑戰。在這種情況下,AmzTrends 不得不尋找對技術要求更低且更安全的運維解決方案。在接觸到 TiDB Serverless 后,AmzTrends 認為由于都是 TiDB 產品體系,全托管的一棧式數據庫服務 TiDB Serverless 不僅可以充分發揮 TiDB 數據庫原有的特性和優勢,還可以幫助公司簡化架構,提升系統的整體性能和健壯性。所以,AmzTrends 決定將整體應用從百度云部署方案遷入 TIDB Serverless,不僅風險更低且兼容性和性能都能得到有效保證,另外通過數據容量與請求量的成本預估,AmzTrends 發現遷移后成本能比現有的云服務器部署更低,因此有了這樣一次充滿挑戰的數據遷移過程。

為什么選擇 TiDB Serverless?

TiDB Serverless 是一種全托管的、自動化的數據庫服務(DBaaS),能夠快速部署集群,并按實際使用資源量計費。結合自身業務架構特性,AmzTrends 在考慮 TiDB Serverless 時重點關注以下特性:

?輕松擴展基礎設施,按實際使用量付費?:商家只有在工作日時間才會使用 AmzTrends 的數據分析服務,而傳統的云模式需要為預估的最大流量付費,容易造成閑時資源浪費。TiDB Serverless 可以秒級搭建起數據庫環境,用戶只需為實際的數據處理和存儲付費,這讓 AmzTrends 開發團隊能夠更專注于創新和發展。

?輕松上手,無需手動分片?:以前, AmzTrends 的 20 億數據需要定期進行清理或者分片,應用 TiDB Serverless 可以幫助用戶擺脫數據分片等數據庫繁瑣的操作任務,相當于只維護一張大表即可,既可以滿足更長時間維度的查詢需求,又無需反復對數據進行整理操作。

?自動伸縮,成本效益顯著?:無論是存儲、事務處理還是分析工作負載,AmzTrends 都能在幾秒內根據應用需求自動伸縮,避免造成資源冗余浪費,既靈活又經濟。

?全面托管,無感運維?:為 AmzTrends 提供最優化的 TiDB 部署方案,免去了服務器配置維護的煩惱。以前一旦出現故障就需要人工進行緊急處理,使用全托管的 TiDB Serverless 后運維人員可以安心入眠。

?熟悉的 SQL 接口,靈活應對業務增長?:TiDB Serverless 保持了開發者熟悉的 MySQL SQL 語言,AmzTrends 無需進行額外的學習即可高效地投入開發工作,同時 TiDB Serverless 具有一個高度靈活擴展的分布式架構,可以隨需彈性擴縮容,應對業務的快速增長。

解決方案

決定遷移后,AmzTrends 采用 TiDB Serverless 替代了云上自建的 TiDB 集群,將數據全量遷移到 TiDB Serverless 中,簡化了架構,大大緩解了運維壓力,降低總體 IT 成本。

遷移后,AmzTrends 在 PingCAP 官方服務的幫助下也進行了架構簡化、優化建表、索引優化,提高了整體數據處理效率,并使 AmzTrends 業務架構演進至云原生模式:

○ 索引優化:通過發現和刪除冗余數據索引,節省了 50% 的數據庫成本;

○ SQL 查詢性能提升:優化索引后,不僅提高了查詢速度,也顯著減少了成本;

○ 架構簡化:自建配置中心和服務注冊要求的最小三臺云服務器轉變為單臺云服務器,降低了成本和復雜性;

○ 業務緩存建立:在了解業務的基礎上建立了業務緩存,進一步降低了實際查詢量,節約成本。

項目收益

全托管一棧式數據庫服務庫服務

TiDB Serverless 提供全托管的服務模式,充分發揮了 TiDB 數據庫的原有特點和優勢,簡化了 Amztrends 的整體架構,提升了性能和系統健壯性,同時降低了總體成本。

數據架構成本節省 50%

通過云原生改造,Amztrends 在數據架構方面節省了 50% 的成本。( Serverless 采用全分離架構,Amztrends 只需為使用付費,無需浪費閑置資源)

整體服務資源節約 30%

簡化架構后,Amztrends 前端服務資源實現了 30% 的資源節約。

全局成本降低 80%

綜合上述優化,Amztrends 實現了整體成本降低 80%。

總結

TiDB Serverless 作為全托管一站式的數據庫服務,從根本上解決了 Startup 公司基礎架構門檻高的難題,即使缺少專業運維人員,也可以擁有簡化、健壯的數據基礎架構,獲得了更高的系統穩定性和可用性。同時,Serverless 的 “Pay as you go”模式提供了更靈活、更優化的資源利用率,AmzTrends 從百度云遷移至 AWS 之后,總體 IT 成本實現了大幅下降。在此基礎上,這種靈活的資源使用模式也可以讓 AmzTrends 探索更靈活、更具性價比的商業方案,為商業模式提供更多可能性。

AmzTrends PM Steve 表示:“遷移到 TiDB Serverless 后我們不會再去擔心數據庫的問題,完全放心交給 TiDB Serverless 就好了。用最簡單的話來講,沒有問題就是最好的結果。”

未來

未來,Amztrend 計劃繼續利用 TiDB Serverless 的優勢,進一步擴展其業務并探索更多的數據分析和優化機會。公司還計劃通過持續的技術改進和優化,維持并提升其在市場上的競爭力。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/717170.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/717170.shtml
英文地址,請注明出處:http://en.pswp.cn/news/717170.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

redis一些概念知識

一、redis是什么 Redis是一種非關系型數據庫(NoSQL),它主要以鍵值對存儲數據。與傳統的關系型數據庫相比,Redis更注重內存操作和高性能,常被用作緩存系統或分布式存儲系統。 以簡單的比喻來解釋Redis,可以…

kafka進階(二)

文章目錄 前言一、Ack機制二、ISR集合總結 前言 本篇主要介紹kafka 的 Ack機制 和 ISR集合 一、Ack機制 Kafka提供了三種不同的應答機制(ACK): acks0:這是最不可靠的模式。在這種模式下,生產者不會等待來自服務器的…

三、軟考-系統架構設計師筆記-計算機系統基礎知識

計算機系統概述 計算機系統是指用于數據管理的計算機硬件、軟件及網絡組成的系統。 它是按人的要求接收和存儲信息,自動進行數據處理和計算,并輸出結果信息的機器系統。 馮諾依曼體系計算機結構: 1、計算機硬件組成 馮諾依曼計算機結構將…

正向代理的反爬蟲與防DDoS攻擊:保護網站免受惡意行為

目錄 前言 一、正向代理的原理 二、正向代理的反爬蟲功能 1. IP地址隱藏 2. 請求多樣化 三、正向代理的防DDoS攻擊功能 1. 均衡負載 2. IP過濾 結論 前言 在當前互聯網環境下,網站常常受到各種惡意行為的侵襲,其中包括爬蟲和DDoS攻擊。這些行為…

#WEB前端(DIV、SPAN)

1.實驗&#xff1a;DIV、SPAN 2.IDE&#xff1a;VSCODE 3.記錄&#xff1a; 類? 4.代碼&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdev…

《中國計算機學會通訊》2022年第10期讀書筆記

試看&#xff1a;https://dl.ccf.org.cn/reading.html?_ack1&id6177027364096000 為計算機科學技術的大變局立言 重要的不是找答案&#xff0c;而是提出別人沒有想到或者還不重視的科學問題和技術方向。 幾乎沒有人愿意去去急需研發人才的中小企業。 CCCF應當關心作為…

數據庫系統架構與DBMS功能探微:現代信息時代數據管理的關鍵

?? 歡迎大家來訪Srlua的博文&#xff08;づ&#xffe3;3&#xffe3;&#xff09;づ╭?&#xff5e;?? &#x1f31f;&#x1f31f; 歡迎各位親愛的讀者&#xff0c;感謝你們抽出寶貴的時間來閱讀我的文章。 我是Srlua&#xff0c;在這里我會分享我的知識和經驗。&#x…

現代化數據架構升級:毫末智行自動駕駛如何應對年增20PB的數據規模挑戰?-OceanBase案例

毫末智行是一家致力于自動駕駛的人工智能技術公司&#xff0c;其前身是長城汽車智能駕駛前瞻分部&#xff0c;以零事故、零擁堵、自由出行和高效物流為目標&#xff0c;助力合作伙伴重塑和全面升級整個社會的出行及物流方式。 在自動駕駛領域中&#xff0c;是什么原因讓毫末智行…

Linux——基本指令

系列文章目錄 文章目錄 系列文章目錄一、Linux基本常識二、Linux基本指令2.1 mkdir指令&#xff08;重要&#xff09;2.2 rmdir指令2.3 rm指令&#xff08;重要&#xff09;2.4 touch指令2.5 ls指令2.6 pwd指令2.7 cd指令2.7.1 Linux中的目錄結構2.7.2 絕對路徑和相對路徑2.7.3…

對程序、進程、線程、并發、并行、高并發概念的講解

一、概述 程序、進程、線程、并發、并行和高并發是計算機科學領域中非常重要的概念。 了解進程、線程、并發和并行的概念&#xff0c;可以更好地利用計算機的多核處理器和并行計算能力&#xff0c;提高計算機性能。 了解進程和線程為操作系統中的資源管理提供了基礎&#xff…

【風格遷移】對比度保持連貫性損失 CCPL:解決圖像局部失真、視頻幀間的連貫性和閃爍

對比度保持連貫性損失 CCPL&#xff1a;解決圖像局部失真、視頻幀間的連貫性和閃爍 提出背景解法&#xff1a;對比度保持連貫性損失&#xff08;CCPL&#xff09; 局部一致性假設 對比學習機制 鄰域調節策略 互信息最大化對比學習&#xff1a;在無需標簽的情況下有效學習區分…

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的教室人員檢測與計數(Python+PySide6界面+訓練代碼)

摘要&#xff1a;開發教室人員檢測與計數系統對于優化教學資源和提升教學效率具有重要意義。本篇博客詳細介紹了如何利用深度學習構建此系統&#xff0c;并提供了完整的實現代碼。該系統基于強大的YOLOv8算法&#xff0c;并對比了YOLOv7、YOLOv6、YOLOv5的性能&#xff0c;展示…

藍橋杯第2章:基礎算法_3

1.聰明的小羊肖恩 - 藍橋云課 (lanqiao.cn) #include <bits/stdc.h> using namespace std; typedef long long LL; const int mod100000007; const int N200010; int n,L,R; int a[N]; LL calc(int v){//計算數組a中兩個數之和小于等于v的數對數量int l1,rn;LL ans0;whi…

[vue error] TypeError: AutoImportis not a function

問題詳情 問題描述: element plus按需導入后&#xff0c;啟動項目報錯&#xff1a; 問題解決 將unplugin-auto-import 回退到0.16.1 npm install unplugin-auto-import0.16.1 安裝完后再次運行就好了

差分題練習(區間更新)

一、差分的特點和原理 對于一個數組a[]&#xff0c;差分數組diff[]的定義是: 對差分數組做前綴和可以還原為原數組: 利用差分數組可以實現快速的區間修改&#xff0c;下面是將區間[l, r]都加上x的方法: diff[l] x; diff[r 1] - x;在修改完成后&#xff0c;需要做前綴和恢復…

PYTHON 自動化辦公:壓縮圖片(PIL)

1、介紹 在辦公還是學習過程中&#xff0c;難免會遇到上傳照片的問題。然而照片的大小限制一直都是個問題&#xff0c;例如照片限制在200Kb之內&#xff0c;雖然有很多圖像壓縮技術可以實現&#xff0c;但從圖像處理的專業來說&#xff0c;可以利用代碼實現 這里使用的庫函數是…

云計算之道:學習方法、實踐經驗與行業展望

一、云計算的理論 云計算是一種基于網絡的計算模型&#xff0c;通過將計算資源、存儲資源和服務等提供給用戶&#xff0c;實現按需獲取、靈活部署和按照使用量付費等特點。云計算的基本原理包括以下幾個方面&#xff1a; 虛擬化技術&#xff1a;云計算基于虛擬化技術&#xff…

Vue2-(jeecgBoot) img大圖預覽

img 圖片展示&#xff0c;大圖預覽失效解決&#xff0c;代碼中使用的預覽組件為&#xff1a;vue-photo-preview 使用場景&#xff1a;詳情頁面-model.images循環展示&#xff0c;點擊查看大圖&#xff0c;不能點擊。 解決方案&#xff1a; 在詳情數據請求完畢加 this.$previ…

觀成科技:加密C2框架Covenant流量分析

工具介紹 Covenant是一個基于.NET的開源C2服務器&#xff0c;可以通過HTTP/HTTPS 控制Covenant agent&#xff0c;從而實現對目標的遠程控制。Covenant agent在與C2通信時&#xff0c;使用base64/AES加密載荷的HTTP隧道構建加密通道。亦可選擇使用SSL/TLS標準加密協議&#xf…

Java網絡通信TCP

目錄 TCP兩個核心類 服務端 1.用ServerSocker類創建對象并且手動指定端口號 2.accept阻塞連接服務端與客戶端 3.給客戶端提供處理業務方法 4.處理業務 整體代碼 客戶端 1.創建Socket對象&#xff0c;并連接服務端的ip與端口號 2.獲取Socket流對象&#xff0c;寫入數據…