sift是檢查ann近鄰召回率的標準數據集,ann可以選擇faiss,milvus等庫或者方法;sift數據分為query和base,以及label(groundtruth)數據。本文采用sift-1M進行解讀,且看如下:
1、sift-1m數據集
官方鏈接地址:Evaluation of Approximate nearest neighbors: large datasets
2、讀取上圖文件格式數據
2.1解壓數據集
tar -zxvf sift.tar.gz
x sift/
x sift/sift_base.fvecs
x sift/sift_groundtruth.ivecs
x sift/sift_learn.fvecs: truncated gzip input
tar: Error exit delayed from previous errors.
這是啥問題?我懷疑是下載失敗,刪除重新下載。再下載時發現已經解壓了,這是啥error,,誤人子弟啊。