立馬耀:通過阿里云 Serverless Spark 和 Milvus 構建高效向量檢索系統,驅動個性化推薦業務

作者:廈門立馬耀網絡科技有限公司大數據開發工程師 陳宏毅

背景介紹

行業

  • 蟬選是蟬媽媽出品的達人選品服務平臺。蟬選秉持“陪伴達人賺到錢”的品牌使命,致力于洞悉達人變現需求和痛點,提供達人選高傭、穩變現、速響應的選品服務。

業務特征

  • 個性化推薦:利用大數據和人工智能算法,根據用戶的興趣和行為提供定制化的產品推薦。

  • 數據驅動:通過分析用戶和市場趨勢,優化推薦策略,提升用戶滿意度。

  • 精準營銷:幫助商家通過精準的用戶畫像進行有效的產品推廣。

  • 高效搜索:提供強大的搜索功能,幫助用戶快速找到所需產品。

產品原有架構痛點

依賴傳統搜索方案的向量檢索進行相似商品推薦的痛點

  • 性能瓶頸:在處理高維向量時,性能可能不如專用的向量數據庫。

  • 存儲效率:高維向量的存儲效率較低,占用較多磁盤空間。

  • 復雜性:需要額外配置和插件才能支持向量檢索。

  • 更新成本:頻繁更新向量數據可能導致索引重建,影響性能。

  • 資源消耗:內存和計算資源消耗較大,尤其在大規模數據集上。

Spark集群原架構的痛點

  • 集群穩定性:需要自行監控和維護集群,可能面臨穩定性問題。

  • 性能優化:缺乏類似Fusion的加速技術,可能導致任務執行速度較慢。

  • 運維負擔:需要手動管理集群,包括配置、監控和故障排除。

  • 資源利用率:資源分配不夠靈活,可能導致資源浪費。

  • 費用問題:即使在空閑時也可能產生費用,導致成本增加。

  • 復雜性:需要配置和管理底層基礎設施,增加了復雜性。

為了應對新的業務挑戰,蟬媽媽選擇與阿里云合作,利用其 Serverless Spark & Milvus,構建了符合業務場景和分析師習慣的工程解決方案。

為什么選擇阿里云 Serverless Spark&Milvus

完善的周邊服務:提供全面的監控和告警功能,能夠實時跟蹤任務狀態和性能,及時發現并解決問題。

托管彈性伸縮功能:自動根據工作負載調整資源,減少手動干預。

集群穩定性:由云服務商管理,提供高穩定性和可靠性。

彈性資源管理:按需分配資源,避免資源浪費。

按需計費:僅為實際使用的資源付費,降低成本。

快速啟動:無需預配置資源,能夠快速啟動和運行任務。

自動擴展:根據工作負載自動調整資源,提升靈活性。

性能優化:Serverless Spark通過技術如Fusion加速任務執行,提高效率,降低成本;Milvus支持并保證超大規模向量檢索的性能。

技術方案設計

架構圖

業務場景介紹

在Serverless Spark中,通過周期性的離線任務,從StarRocks數據庫中提取商品數據。這些數據包含商品的基本信息,如商品ID、名稱、描述等。接著,使用Serverless Spark的計算能力,調用機器學習模型服務,將商品標題轉換為向量表示。生成的向量數據與其他商品信息結合后,批量寫入阿里云Milvus向量數據庫。Milvus負責高效存儲和管理這些向量數據,并支持快速相似性搜索。通過構建數據接口,Milvus中的數據可以對外提供查詢服務,用戶可以通過該接口輸入一個商品或其特征,系統將返回相似商品的列表。這種架構支持大規模、低延遲的相似商品檢索,適用于推薦系統、個性化營銷等應用場景。

關鍵服務組件

Serverless Spark

EMR Serverless Spark 是一款面向 Data+AI 的高性能 Lakehouse 產品。它為企業提供了一站式的數據平臺服務,包括任務開發、調試、調度和運維等,極大地簡化了數據處理和模型訓練的全流程。同時,它100%兼容開源 Spark 生態,能夠無縫集成到客戶現有的數據平臺。使用 EMR Serverless Spark,企業可以更專注于數據處理分析和模型訓練調優,提高工作效率。

向量檢索服務 Milvus 版

阿里云向量檢索服務Milvus版是一款云原生、全托管的向量檢索引擎,100%兼容開源Milvus,支持自建Milvus集群無縫遷移上云。具備易?性、可?性、安全性、低成本與?態優勢,能提供超大規模向量數據的相似性檢索服務,廣泛應用于多模態檢索、RAG、大模型AI等場景。

遷移后的收益

Serverless Spark

  • 性能:離線任務耗時減少40%,核心報表更早產出。

  • 穩定性:任務穩定性顯著提高,失敗率降低 80%。

  • 運維靈活性:根據業務需求自動調整擴充計算資源。

  • 性價比:真正的按量付費,不使用時沒有資源消耗;提供多種資源包選擇,進一步降低成本。

Milvus

  • 降本:與傳統搜索方案相比,阿里云Milvus 實現向量檢索的成本降低了 75%。

  • 提效:作為專業級向量數據庫,在處理高維向量時,檢索性能顯著提升。

  • 業務支持:Milvus 能支持更大規模的數據讀取和寫入,覆蓋了商品范圍更廣,查詢響應速度更快。

后續期待

希望 Serverless Spark 能夠全面兼容 Spark Launcher 這一便捷方式提交任務,支持任務無縫遷移至全托管環境。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/78549.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/78549.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/78549.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Android顯示學習筆記本

根據博客 Android-View 繪制原理(01)-JAVA層分析_android view draw原理分析-CSDN博客 提出了我的疑問 Canvas RenderNode updateDisplayListDirty 這些東西的關系 您的理解在基本方向上是對的,但讓我詳細解釋一下 Android 中 updateDisplayListDirty、指令集合、…

JavaWeb學習打卡-Day4-會話技術、JWT、Filter、Interceptor

會話技術 會話:用戶打開瀏覽器,訪問web服務器的資源,會話建立,直到有一方斷開連接,會話結束。在一次會話中可以包含多次請求和響應。會話跟蹤:一種維護瀏覽器狀態的方法,服務器需要識別多次請求…

讓數據優雅落地:用 serde::Deserialize 玩轉結構體實體

前言 想象一下,服務器突然飛來一堆 JSON 數據,就像一群無頭蒼蠅沖進辦公室,嗡嗡作響,橫沖直撞。此刻,你的任務,就是把這群“迷路數據”安置進正確的格子里,分門別類,秩序井然,不混不亂,不漏一只。 好在 Rust 早就為我們備好瑞士軍刀:serde::Deserialize。它不僅刀…

Virtio 技術解析 | 框架、設備實現與實踐指南

本文為 “Virtio” 相關文章合輯。 略作重排,如有內容異常,請看原文。 Virtio 簡介(一)—— 框架分析 posted 2021-04-21 10:14 Edver 1. 概述 在傳統設備模擬中,虛擬機內部設備驅動完全不知自身處于虛擬化環境&a…

云計算賦能質檢LIMS的價值 質檢LIMS系統在云計算企業的創新應用

在云計算技術高速發展的背景下,實驗室信息化管理正經歷深刻變革。質檢LIMS(實驗室信息管理系統)作為實驗室數字化轉型的核心工具,通過與云計算深度融合,為企業提供了高彈性、高安全性的解決方案。本文將探討質檢LIMS在…

【win11 安裝WSL2 詳解一遍過!!】

共有五個步驟,按部就班的做,保準成功! 1. 打開開發者模式 設置->系統->開發者模式 2. 打開linux的win子系統 找到控制面板-程序和功能-啟用或關閉Windows功能,選中“適用于Linux的Windows子系統”,“虛擬機…

Godot開發2D冒險游戲——第三節:游戲地圖繪制

一、初步構建游戲地圖 在游戲場景當中添加一個新的子節點:TileMapLayer 這一層稱為瓦片地圖層 根據提示,下一步顯然是添加資源 為TileMapLayer節點添加一個TileSet 將地板添加進來,然后選擇自動分割圖集 自定義時要確保大小合適 讓Godot自…

Django創建的應用目錄詳細解釋以及如何操作數據庫自動創建表

創建好Django項目后 如果要創建 python manage.py startapp 模塊名模塊 使用 我創建一個system模塊后是 注意:urls是我自己建的文件 1.migrations目錄 存放數據庫的遷移文件,當models.py中模型定義發生變化時,通過遷移操作能同步數據庫結構變化 __init__ 使該目錄…

將輸入幀上下文打包到下一個幀的預測模型中用于視頻生成

Paper Title: Packing Input Frame Context in Next-Frame Prediction Models for Video Generation 論文發布于2025年4月17日 Abstract部分 在這篇論文中,FramePack是一種新提出的網絡結構,旨在解決視頻生成中的兩個主要問題:遺忘和漂移。 具體來說,遺忘指的是在生成視…

STM32 串口USART

目錄 常見的通信方式 串行通信和并行通信 全雙工,半雙工和單工通信 同步通信和異步通信 通信速率 常見的通信協議 串口基礎知識 電平特性 串口傳輸協議 STM32F103的USART資源 端口引腳 數據寄存器單元 發送接收控制單元 實現串口發送 printf…

Taro on Harmony :助力業務高效開發純血鴻蒙應用

背景 純血鴻蒙逐漸成為全球第三大操作系統,業界也掀起了適配鴻蒙原生的浪潮,用戶遷移趨勢明顯,京東作為國民應用,為鴻蒙用戶提供完整的購物體驗至關重要。   去年 9 月,京東 AP…

gem5-gpu教程05 內存建模

memory-modeling|Details on how memory is modeled in gem5-gpu gem5-gpu’s Memory Simulation gem5-gpu在很大程度上避開了GPGPU-Sim的單獨功能模擬,而是使用了gem5的執行中執行模型。因此,當執行存儲/加載時,內存會被更新/讀取。沒有單獨的功能路徑。(順便說一句,這…

【python】lambda用法(結合例子理解)

目錄 lambda 是什么? 為什么叫 lambda? 語法 舉例 1. 最簡單的 lambda:單個數字處理 2. 用 lambda 排序一組字符串(按照長度排序) 3. 在列表里找出絕對值最小的數字 4. 給 map() 用 lambda 5. 組合使用:篩選出偶數 lambda 和 def 的對比 lambda 適合用在什么地…

【ROS2】機器人操作系統安裝到Ubuntu22.04簡介(手動)

主要參考: https://book.guyuehome.com/ROS2/1.系統架構/1.3_ROS2安裝方法/ 官方文檔:https://docs.ros.org/en/humble/Installation.html 虛擬機與ubuntu系統安裝 略,見參考文檔 ubutun換國內源,略 1. 設置本地語言 確保您有…

C 調用 C++:extern “C” 接口詳解與實踐 C/C++混合編譯

C 調用 C:extern “C” 接口詳解與實踐 核心問題在于 C 編譯器會對函數名進行“修飾”(Name Mangling)以支持函數重載等特性,而 C 編譯器則不會。此外,C 語言本身沒有類、對象等概念。為了解決這個問題,我…

汽車制造行業如何在數字化轉型中抓住機遇?

近年來,隨著新一輪科技革命和產業變革的深入推進,汽車制造行業正迎來一場前所未有的數字化轉型浪潮。無論是傳統車企還是新勢力品牌,都在積極探索如何通過數字化技術提升競爭力、開拓新市場。那么,在這場變革中,汽車制…

k8s學習記錄(五):Pod親和性詳解

一、前言 上一篇文章初步探討了 Kubernetes 的節點親和性,了解到它在 Pod 調度上比傳統方式更靈活高效。今天我們繼續討論親和性同時Kubernetes 的調度機制。 二、Pod親和性 上一篇文章中我們介紹了節點親和性,今天我們講解一下Pod親和性。首先我們先看…

HarmonyOS:Navigation實現導航之頁面設置和路由操作

導讀 設置標題欄模式設置菜單欄設置工具欄路由操作頁面跳轉頁面返回頁面替換頁面刪除移動頁面參數獲取路由攔截 子頁面頁面顯示類型頁面生命周期頁面監聽和查詢 頁面轉場關閉轉場自定義轉場共享元素轉場 跨包動態路由系統路由表自定義路由表 示例代碼 Navigation組件適用于模塊…

雪花算法

目錄 一、什么是雪花算法 二、使用雪花算法 ?三、使用UUID 使用自增主鍵是數據庫中常用的唯一標識,今天嘗試使用mybatisplus來實現三種方式的主鍵ID 使用起來也很簡單 用注解指定一下使用那種方式的主鍵 一、什么是雪花算法 一種特殊的算法可以計算得到一個唯…

HarmonyOs @hadss/hmrouter路由接入

參考文檔:官方文檔 在根目錄oh-package.json5配置 {"dependencies": {"hadss/hmrouter": "^1.0.0-rc.11"} }加入路由編譯插件 hvigor/hvigor-config.json文件 {"dependencies": {"hadss/hmrouter-plugin": &…