3.milvus索引-HNSW

索引作用

加速大型數據集上的查詢。

向量字段,僅只能創建一個索引。

milvus支持的向量索引類型大部分使用 近似最近鄰搜索算法。ANNS該算法的核心不局限于返回最準確的結果,而是僅搜索目標的鄰居。ANNS通過在可接受的范圍內犧牲準確性提高檢索效率

比方,有一百條數據,其中有90條數據是滿足條件的,使用ANNS可能只會返回89條數據。如果想準確返回90條數據,就需要采用暴力搜索。

milvus索引分類

內存索引,因為是在內存中所以加載速度更快。

磁盤索引

根據實現方式分類,ANNS向量索引可以分為4類:

1.基于樹的索引,比如mysql中的索引是基于B+樹。

2.基于圖的索引

3.基于哈希的索引

4.基于量化的索引

根據數據類型,支持兩種類型的索引:

  • floating-point embeddings 浮點類型,常用的索引

SCANN、IVF_FLAT、IVF_PQ、IVF_SQ8、FLAT、HNSW(效率比較高的索引算法)、ANNOY、AUTOINDEX、DISKANN

  • binary embeddings

BIN_FLAT、BIN_IVF_FLAT

注意:刪掉索引前,需要現將Collection從內存中release卸載釋放掉。

使用attu圖形化工具,創建一個HNSW類型的索引

使用代碼創建一個HNSW類型的索引

from pymilvus import (connections,Collection,
)collection_name = "first_milvus"
host = "192.168.171.130"
port = 19530
username = ""
password = ""connections.connect("default", host=host, port=port, user=username, password=password)
coll = Collection(collection_name, consistency_level="Bounded", shards_num=1)from pymilvus import Collectioncollection = Collection('first_milvus')
index_params = {"index_type": "HNSW","metric_type": "L2","params": {"M": 16,"efConstruction": 60}
}
collection.create_index(field_name="embeddings",index_params=index_params,index_name="idx_em"
)
print("done")

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/73110.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/73110.shtml
英文地址,請注明出處:http://en.pswp.cn/web/73110.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python(學習二)

列表:[] 列表是可以容納不同類型的數據的 列表取: 列表切片:一次去獲取多個元素 第三個參數,設置跨度值: 列表倒序輸出 列表增: 列表后面添加元素: 切片:實現添加元素 任意位置…

【中文翻譯】第1章-The Algorithmic Foundations of Differential Privacy

為方便閱讀,故將《The Algorithmic Foundations of Differential Privacy》翻譯項目內容搬運至此; 教材原文地址:https://www.cis.upenn.edu/~aaroth/Papers/privacybook.pdf 中文翻譯版 Github 項目地址1:https://github.com/gu…

UI-TARS與Midscene.js自動化探索

結合 Midscene.js 和 UI-TARS 大模型 實現 UI 頁面自動化的可實施方案,涵蓋環境配置、核心流程、代碼示例及優化建議: 一、環境配置與工具集成 安裝 Midscene.js 方式一:通過 Chrome 插件快速安裝(適用于瀏覽器自動化場景&#x…

Web開發-JS應用NodeJS原型鏈污染文件系統Express模塊數據庫通訊

知識點: 1、安全開發-NodeJS-開發環境&功能實現 2、安全開發-NodeJS-安全漏洞&案例分析 3、安全開發-NodeJS-特有漏洞 node.js就是專門運行javascript的一個應用程序,區別于以往用瀏覽器解析原生js代碼,node.js本身就可以解析執行js代…

Spring AOP 核心概念與實踐指南

第一章:AOP 核心概念與基礎應用 1.1 AOP 核心思想 ?面向切面編程:通過橫向抽取機制解決代碼重復問題(如日志、事務、安全等)?核心優勢:不修改源代碼增強功能,提高代碼復用性和可維護性 1.2 基礎環境搭…

Flutter使用自簽證書打包ipa

在 Flutter 中使用自簽證書打包 IPA 文件,可以通過以下步驟完成: 1. 準備自簽證書 方式一 生成自簽證書: 打開 鑰匙串訪問 應用。選擇 證書助理 > 創建證書。按照提示填寫證書信息,選擇證書類型為 代碼簽名,并保存…

基于STM32的機器人控制系統設計方案

一、系統概述 該機器人控制系統以STM32微控制器為核心,旨在實現對機器人的運動控制、傳感器數據采集與處理、任務調度以及人機交互等功能。適用于多種類型的移動機器人,如輪式機器人、履帶式機器人等,可應用于室內導航、環境監測、物流搬運等場景。 二、硬件設計 STM32微控…

【leetcode hot 100 51】N皇后

解法一:(基于集合的回溯)我們從第一行開始尋找,找每一行皇后應該放在第幾列。每次找到都用Set記錄已經用過的列和對角,其中從左到右向下的對角(行-列相同),右到左向下的對角&#xf…

藍橋刷題note9(分發餅干,最長回文子串)

1.分發餅干 假設你是一位很棒的家長,想要給你的孩子們一些小餅干。但是,每個孩子最多只能給一塊餅干。 對每個孩子 i,都有一個胃口值 g[i],這是能讓孩子們滿足胃口的餅干的最小尺寸;并且每塊餅干 j,都有…

面試常問系列(一)-神經網絡參數初始化

一、背景 說到參數初始化,先提一下大家常見的兩個概念梯度消失和梯度爆炸。 (一)、梯度消失:深層網絡的“靜默殺手” 定義: 在反向傳播過程中,梯度值隨著網絡層數增加呈指數級衰減,最終趨近…

Manacher 馬拉車算法

Manacher 馬拉車算法 5. 最長回文子串 - 力扣(LeetCode) 馬拉車算法是目前解決尋找字符串中最長的回文子串時間復雜度最低的算法(線性O(n)). 中心擴散法 初始化一個長度與字符串 s 相等的 臂長數組 arr 和 最長臂長 max 與 最…

(學習總結29)Linux 進程概念和進程狀態

Linux 進程概念 馮諾依曼體系結構軟件運行與存儲分級數據流動的理論過程 操作系統操作系統(Operator System) 概念操作系統的功能與作用系統調用和庫函數概念 進程概念描述進程 - PCBtask_struct查看進程通過系統調用獲取進程標示符 PID通過系統調用 fork 函數創建進程簡單使用…

MySQL密碼修改的全部方式一篇詳解

本文將詳細介紹多種修改MySQL密碼的方式。 本文目錄 一、alter user 語句操作步驟 二、set password操作步驟 三、直接修改 mysql.user表操作步驟 一、alter user 語句 當你以 root 用戶或者擁有足夠權限的用戶登錄 MySQL 時,可以使用 ALTER USER 語句來修改密碼。…

Wi-Fi NAN 架構(Wi-Fi Aware Specification v4.0,第2章:2.3~2.6)

1. NAN 數據通信架構 1.1 單播支持 要在兩個NAN設備之間啟動單播數據通信,服務需發起一個NAN數據路徑(NDP,NAN Data Path)請求。這對NAN設備之間會建立一個NAN設備鏈路(NDL,NAN Device Link)&…

Lineageos 22.1(Android 15)實現負一屏

一、前言 方案是參考的這位大佬的,大家可以去付費訂閱支持一波。我大概理一下Android15的修改。 大佬的方案代碼 二、Android15適配調整 1.bp調整,加入aidl引入,這樣make之后就可以索引代碼了 filegroup {name: "launcher-src"…

Java 大視界 -- Java 大數據在智能醫療遠程會診與專家協作中的技術支持(146)

💖親愛的朋友們,熱烈歡迎來到 青云交的博客!能與諸位在此相逢,我倍感榮幸。在這飛速更迭的時代,我們都渴望一方心靈凈土,而 我的博客 正是這樣溫暖的所在。這里為你呈上趣味與實用兼具的知識,也…

Sqlite3數據庫

工具庫的使用&#xff1a;程序編寫時#include <庫名.h>即可調用庫中的函數 編譯時鏈接工具庫&#xff1b; 注意&#xff1a;數據庫中不區分字母大小寫&#xff1b; SQLite 中的事務是數據庫操作中非常重要的一個概念&#xff0c;它用于確保數據庫操作的完整性和一致性。…

虛擬路由與單頁應用(SPA):詳解

在單頁應用&#xff08;SPA&#xff0c;Single Page Application&#xff09;中&#xff0c;虛擬路由&#xff08;也稱為前端路由&#xff09;是一種關鍵的技術&#xff0c;用于管理頁面導航和狀態變化&#xff0c;而無需重新加載整個頁面。為了幫助你更好地理解這一概念&#…

練習:運動計劃

需求&#xff1a;鍵盤錄入星期數&#xff0c;顯示今天的減肥活動。 周一&#xff1a;跑步&#xff1b; 周二&#xff1a;游泳&#xff1b; 周三&#xff1a;慢走&#xff1b; 周四&#xff1a;騎動感單車&#xff1b; 周五&#xff1a;拳擊&#xff1b; 周六&#xff1a;…

通過webrtc+canvas+css實現簡單的電腦濾鏡拍照效果

這里我們用的是webrtc中的MediaDevices.getUserMedia()的瀏覽器api進行的效果實現&#xff0c;MediaDevices.getUserMedia() 會提示用戶給予使用媒體輸入的許可&#xff0c;媒體輸入會產生一個MediaStream&#xff0c;里面包含了請求的媒體類型的軌道。此流可以包含一個視頻軌道…