?
1.milvus VS ES
Milvus 的亮點
-
功能性:Milvus 不僅支持基本的向量相似性搜索,還支持稀疏向量、批量向量、過濾搜索和混合搜索功能等高級功能。
-
靈活性:Milvus 支持多種部署模式和多個 SDK,所有這些都在一個強大的集成生態系統中實現。
-
性能:Milvus 采用HNSW和DiskANN 等優化索引算法以及先進的GPU 加速,可確保高吞吐量和低延遲的實時處理。
-
可擴展性:其定制的分布式架構可輕松擴展,從小型數據集到超過 100 億向量的 Collections 都能輕松應對。
1.1常規對比
- milvus-vs-elastic:https://zilliz.com.cn/comparison/milvus-vs-elastic
- milvus網址:https://milvus.io/
1.2 性能對比
VectorDBBench —— 向量數據庫性能測試工具
- miluvs路線圖
Milvus幾乎坐穩了向量搜索領域的頭把交椅,最近兩年加強了向量搜索本身的功能(支持多向量字段的混合搜索、優化了GPU加速),惡補了關鍵字搜索功能(支持BM25算法),還免費提供主流的重排序算法,相比而言,Elasticsearch對于向量搜索領域的探索,還是比較擠牙膏,連基本的RRF算法,也要收費。
milvus 客戶案例
2.1 唯品會性能提升10倍
案例:https://zilliz.com.cn/customers/%E5%94%AF%E5%93%81%E4%BC%9A
用戶痛點:使用 Elasticsearch 導致高延時和高運維成本,ES檢索百萬商品并召回 TopK 結果的平均延時在 300 ms 左右,milvus30ms,相差10倍
2.2 點石科技轉型 AI 智能服務商
https://zilliz.com.cn/customers/%E7%82%B9%E7%9F%B3%E7%A7%91%E6%8A%80
2.3 更多案例
https://zilliz.com.cn/customers
https://milvus.io/zh/use-cases
3.成本問題
Zilliz 定價
4. OpenSearch-阿里
基于阿里巴巴自主研發的大規模分布式搜索引擎搭建的一站式智能搜索業務開發平臺,目前為包括淘寶、天貓在內的阿里集團核心業務提供搜索服務支持。通過內置各行業的查詢語義理解、機器學習排序算法等能力,以及充分開放的文本向量檢索引擎能力,助力開發者快速搭建智能搜索服務。
智能開放搜索 OpenSearch
更多內容參考官方文檔:https://help.aliyun.com/zh/open-search/high-performance-searchedition/product-overview/?spm=a2c4g.11186623.0.i1
5.embedding維度建議
短文本(如100字左右):- 對于短文本,通常推薦使用較低維度的向量,例如512維或768維
中等長度文本(如500字到2000字):- 中等長度的文本可以使用768維或1024維的向量。這些維度能夠較好地平衡信息的豐富性和計算效率。
- jina-1024維度
長文本(如超過2000字):- 對于較長的文本,建議使用更高維度的向量,例如1024維或更高?。[目前文本長度在8192]
?