向量數據庫該如何選擇?Milvus 、ES、OpenSearch 快速對比:向量搜索能力與智能檢索引擎的應用前景

?

1.milvus VS ES

Milvus 的亮點

  • 功能性:Milvus 不僅支持基本的向量相似性搜索,還支持稀疏向量、批量向量、過濾搜索和混合搜索功能等高級功能。

  • 靈活性:Milvus 支持多種部署模式和多個 SDK,所有這些都在一個強大的集成生態系統中實現。

  • 性能:Milvus 采用HNSW和DiskANN 等優化索引算法以及先進的GPU 加速,可確保高吞吐量和低延遲的實時處理。

  • 可擴展性:其定制的分布式架構可輕松擴展,從小型數據集到超過 100 億向量的 Collections 都能輕松應對。
    在這里插入圖片描述

1.1常規對比

  • milvus-vs-elastic:https://zilliz.com.cn/comparison/milvus-vs-elastic
  • milvus網址:https://milvus.io/
    在這里插入圖片描述
    在這里插入圖片描述
    在這里插入圖片描述

1.2 性能對比

VectorDBBench —— 向量數據庫性能測試工具

在這里插入圖片描述

  • miluvs路線圖

Milvus幾乎坐穩了向量搜索領域的頭把交椅,最近兩年加強了向量搜索本身的功能(支持多向量字段的混合搜索、優化了GPU加速),惡補了關鍵字搜索功能(支持BM25算法),還免費提供主流的重排序算法,相比而言,Elasticsearch對于向量搜索領域的探索,還是比較擠牙膏,連基本的RRF算法,也要收費。

在這里插入圖片描述
在這里插入圖片描述

在這里插入圖片描述

milvus 客戶案例

2.1 唯品會性能提升10倍

案例:https://zilliz.com.cn/customers/%E5%94%AF%E5%93%81%E4%BC%9A

用戶痛點:使用 Elasticsearch 導致高延時和高運維成本,ES檢索百萬商品并召回 TopK 結果的平均延時在 300 ms 左右,milvus30ms,相差10倍

在這里插入圖片描述

2.2 點石科技轉型 AI 智能服務商

https://zilliz.com.cn/customers/%E7%82%B9%E7%9F%B3%E7%A7%91%E6%8A%80

在這里插入圖片描述

2.3 更多案例

https://zilliz.com.cn/customers

https://milvus.io/zh/use-cases

在這里插入圖片描述

3.成本問題

Zilliz 定價

在這里插入圖片描述
在這里插入圖片描述

在這里插入圖片描述

4. OpenSearch-阿里

基于阿里巴巴自主研發的大規模分布式搜索引擎搭建的一站式智能搜索業務開發平臺,目前為包括淘寶、天貓在內的阿里集團核心業務提供搜索服務支持。通過內置各行業的查詢語義理解、機器學習排序算法等能力,以及充分開放的文本向量檢索引擎能力,助力開發者快速搭建智能搜索服務。

智能開放搜索 OpenSearch
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
更多內容參考官方文檔:https://help.aliyun.com/zh/open-search/high-performance-searchedition/product-overview/?spm=a2c4g.11186623.0.i1

5.embedding維度建議

短文本(如100字左右):- 對于短文本,通常推薦使用較低維度的向量,例如512維或768維

中等長度文本(如500字到2000字):- 中等長度的文本可以使用768維或1024維的向量。這些維度能夠較好地平衡信息的豐富性和計算效率。

  • jina-1024維度
    [圖片]

在這里插入圖片描述

長文本(如超過2000字):- 對于較長的文本,建議使用更高維度的向量,例如1024維或更高?。[目前文本長度在8192]

在這里插入圖片描述

在這里插入圖片描述

?在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/907171.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/907171.shtml
英文地址,請注明出處:http://en.pswp.cn/news/907171.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

SQL進階之旅 Day 4:子查詢與臨時表優化

文章標題 【SQL進階之旅 Day 4】子查詢與臨時表優化 文章內容 開篇:SQL進階之旅的第4天 在“SQL進階之旅”系列中,第4天的主題是子查詢與臨時表優化。這是SQL開發中不可或缺的一部分,尤其在處理復雜查詢時,合理使用子查詢和臨…

Python學習(2) ----- Python的類型

在 Python 中,一切皆對象,每個對象都有類型。下面是 Python 中的常見內置類型分類和示例: 🟡 1. 數字類型(Numeric Types) 類型說明示例int整數5, -42float浮點數3.14, -0.5complex復數1 2j a 10 …

跨協議協同智造新實踐:DeviceNet-EtherCAT網關驅動汽車焊接裝配效能躍遷

在汽車制造領域,機器人協作對于提升生產效率與產品質量至關重要。焊接、裝配等關鍵環節,需要機器人與各類設備緊密配合。JH-DVN-ECT疆鴻智能的devicenet從站轉ethercat主站協議網關,成為實現這一高效協作的得力助手,尤其是在連接歐…

nginx之proxy_buffering的作用

Nginx 的緩沖機制是為了讓后端能更快釋放資源,而不是卡在慢客戶端上,從而提升整體性能和并發能力。 現實中客戶端和后端服務器之間的傳輸速率可能差異很大。Nginx 的緩沖機制正是為了解決這個不匹配問題。 假設沒有緩沖(即 proxy_buffering…

數據庫相關問題

1.保留字 1.1錯誤案例(2025/5/27) 報錯: java.sql.SQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near condition, sell…

GO 語言進階之 進程 OS與 編碼,數據格式轉換

更多個人筆記見: github個人筆記倉庫 gitee 個人筆記倉庫 個人學習,學習過程中還會不斷補充~ (后續會更新在github上) 文章目錄 進程信息OS操作基本例子 編碼相關HASH 哈希Base64 encoding 基礎64編碼 數據格式轉換和處…

如何用Spring Cache實現對Redis的抽象

我們在進行Java項目開發時候,經常會用到Redis緩存例如數據庫里的一些信息、手機驗證碼之類的,正常寫法就會像去連mysql一樣,這種硬編碼的方式肯定是非常不合適的。 Autowireprivate UserMapper userMapper;Autowireprivate StringCommand str…

CMake指令:file()

目錄 1.簡介 2.常用子命令(COMMAND) 2.1.COPY - 復制文件或目錄 2.2.RENAME - 重命名文件或目錄 2.3.REMOVE - 刪除文件或目錄 2.4.MAKE_DIRECTORY - 創建目錄 2.5.READ - 讀取文件內容 2.6.WRITE - 寫入文件內容 2.7.GLOB - 按模式匹配文件 2…

使用VuePress開發日志

結合官方教程,補充一些細節。 快速上手 | VuePress中文文檔 | VuePress中文網 VuePress使用步驟 創建并進入一個新目錄 mkdir vuepress-starter && cd vuepress-starter使用你喜歡的包管理器進行初始化 yarn init # npm init將 VuePress 安裝為本地依賴 …

隨手記錄7

2025年5月26日~2025年6月01日 周一:沒做 周二:芹菜炒雞蛋香腸 周三: 周四: 周五: 周六: 周日:

【無標題】使用JEasyOpc開發OPCDA采集中間件

使用JEasyOpc開發OPCDA采集中間件 1.JEasyOpc下載2.修改JEasyOpc源碼及打包安裝3.Pom 引入jeasy2.3.2.jar4.maven pom 配置打包5.cmd執行(手動指定 main主程序入口)6.EXE4J打包jar包,生成exe可執行文件 1.JEasyOpc下載 jeasyopc源碼下載&…

5 WPF中的Page頁面的使用

以下是一個簡單的WPF示例,演示如何在三個Page之間進行導航切換,使用Frame控件作為導航容器,并包含基本的導航按鈕(前進/后退/主頁) Page類更簡單,比Window更精簡。 代碼見下文以及資源文件: htt…

基于51單片機的音樂盒點陣屏proteus仿真

地址: https://pan.baidu.com/s/1hYzg2icjHV8jWJdltJkKxw 提取碼:1234 仿真圖: 芯片/模塊的特點: AT89C52/AT89C51簡介: AT89C51 是一款常用的 8 位單片機,由 Atmel 公司(現已被 Microchip 收…

圖論:floyed算法

Floyd 算法是一種用于尋找加權圖中所有頂點對之間最短路徑的經典算法,它能夠處理負權邊,但不能處理負權環。即如果邊權有負數,切負權邊與其他邊構成了環就不能用該算法。該算法的時間復雜度為 \(O(V^3)\),其中 V 是圖中頂點的數量…

STM32之看門狗(IWDG)

一、看門狗外設的原理與應用 背景說明 隨著單片機的發展,單片機在家用電器、工業自動化、生產過程控制、智能儀器儀表等領域的應用越來越廣泛。然而處于同一電力系統中的各種電氣設備通過電或磁的聯系彼此緊密相連,相互影響,由于運行方式的…

#RabbitMQ# 消息隊列進階

目錄 消息可靠性 一 生產者的可靠性 1 生產者的重連 2 生產者的確認 (1 Confirm* (2 Return 二 MQ的可靠性 1 數據持久化 2 Lazy Queue* 三 消費者的可靠性 1 消費者確認機制 2 消費失敗處理 3 業務冪等性 四 延遲消息 消息可靠性 在消息隊列中,可靠性…

《計算機組成原理》第 10 章 - 控制單元的設計

目錄 10.1 組合邏輯設計 10.1.1 組合邏輯控制單元框圖 10.1.2 微操作的節拍安排 10.1.3 組合邏輯設計步驟 10.2 微程序設計 10.2.1 微程序設計思想的產生 10.2.2 微程序控制單元框圖及工作原理 10.2.3 微指令的編碼方式 1. 直接編碼(水平型) 2.…

AstroNex空間任務智能控制研究與訓練數據集

數據集概述 AstroNex空間任務智能控制研究與訓練數據集是朗迪鋒科技基于Multiverse平臺精心打造的首個全面覆蓋航天器智能控制全周期的綜合數據集產品。該數據集匯集了軌道動力學、姿態控制、機器視覺、環境感知等多維度數據,為航天器智能算法研發提供豐富的訓練與…

??3D 幾何建模工具庫?Open CASCADE(OCCT)簡單介紹。

??Open CASCADE(OCCT)?? 的新手,我會用最簡單的方式幫你理解它是什么、能做什么,以及如何快速上手。 ??1. OCCT 是什么??? ??一句話定義??:OCCT 是一個開源的 ??3D 幾何建模工具庫??&…

[7-1] ADC模數轉換器 江協科技學習筆記(14個知識點)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 DMA(Direct Memory Access,直接內存訪問)是一種硬件特性,它允許某些硬件子系統直接訪問系統的內存,而無需CPU的介入。這樣,CPU就可以處理其他任務,從而提高系…