Azure AI Search 探索總結

Azure AI Search 原名 Azure Cognitive Service,是Azure中用來給AI項目構建知識庫的組件。

知識庫本質和數據庫很像,但是內部的存儲結構和檢索算法不一樣。

比如并不是知識庫的每一列都可以用來過濾、檢索或group by,而是要根據實際情況配置。

Azure AI Search幾個基本概念介紹:

  1. Index就是類似數據庫的一張表,里面可以存放被檢索的信息集合。
  2. Indexer索引生成器,從數據源讀取并生成Index的生成器。
  3. 數據源,可以是Blob,Database
  4. Skillset,這個很有意思叫技能包,默認的索引生成器功能很簡單,對于復雜文檔,比如有大量圖片的文檔,視頻或音頻,在生成index時要動用到一些獨特的技能包即Skillset

在Azure Portal里AI Search提供了Index的在線查詢,使用的是它自己定義的一套JSON查詢語法,這里給到幾個經典查詢介紹:

// 查詢某個可以facet的字段,有哪些distinct值
{"search": "*",          // 或空字符串"top": 0,               // 不返回具體文檔"facets": ["category"]  // 你想看 distinct 值的字段
}//限制返回字段content的上下文
{"search": "機器學習","highlight": "content-40",   // 40=返回前/后各 40 個字符"select": "title,url"        // 不返回整段 content
}//根據某個字段過濾,類似SQL中的where
{"filter": "category eq 'Electronics'","select": "id,name,price"
}

最后補充兩點:

1. Azure AI Search Free-tier 只支持16MB以下的文檔。

2. Azure Portal里的操作方式:??不支持自定義index結構,復雜場景還是要寫代碼導入。

3. Storage Blob里配置文件的元屬性,AI Search也能自動讀到。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/95823.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/95823.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/95823.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

高效解決 pip install 報錯 SSLError: EOF occurred in violation of protocol

高效解決 pip install 報錯 SSLError: EOF occurred in violation of protocol 標簽: Python, pip, SSLError, Clash, 網絡代理, 問題解決 一、問題描述 在Python開發中,pip 是我們最親密的伙伴。然而,當你身處需要科學上網的環境&#xff0c…

CSS 核心知識點全解析:從基礎到實戰應用

大家好!今天這篇文章將系統總結 CSS 的核心知識點,從最基礎的樣式引入到復雜的選擇器應用,再到盒子模型、文本處理等實戰技巧,全程結合代碼示例,讓你輕松掌握 CSS 的精髓。一、CSS 是什么?為什么需要它&…

ClickHouse的學習與了解

什么是ClickHouse? ClickHouse是一個用于聯機分析(OLAP)的列式數據庫管理系統(DBMS)。 在傳統的行式數據庫系統中,數據按如下順序存儲:RowWatchIDJavaEnableTitleGoodEventEventTime#0893543506621Investor Relations12016/5/18 5:19#1903295…

安卓11 12系統修改定制化_____修改系統 解鎖system分區 去除data加密 自由刪減系統應用

在定制化系統中。修改系統分區 解鎖system。讓用戶可以自由刪減應用。這個在定制化服務中比較常見。對于此項修改服務。需要我們了解基礎的分區常識以及常用的幾種基礎修改步驟。 通過博文了解?????? 1??????-----修改rom 解鎖 system 分區有什么意義 2????…

JetPack系列教程(八):PDF庫——讓Android應用也能優雅“翻頁”

JetPack系列教程(八):PDF庫——讓Android應用也能優雅“翻頁” 在Android開發的世界里,加載PDF文件一直是個讓人又愛又恨的“小妖精”。愛它,因為PDF是文檔界的“萬能鑰匙”;恨它,因為原生Andr…

Three.js三大組件:場景(Scene)、相機(Camera)、渲染器(Renderer)

上一篇中我們學習了第一個Three.js場景"Hello World"。這一篇就來學習three.js的核心組件。 此圖來源(Three.js中文網) three.js的核心由三大組件構成:場景(Scene)、相機(Camera)和渲染器(Renderer)。下面我將詳細介紹這三大件的作…

AI幻覺終結之后:GPT-5開啟的“可靠性”新賽道與開發者生存指南

摘要: Sam Altman關于GPT-5將基本終結幻覺的宣告,不僅僅是一次技術升級,它標志著一個“萬物皆可AI,但萬事皆需驗證”的混亂時代的結束。本文將從一個全新的戰略視角出發,探討當“可靠性”取代“創造性”成為AI競賽的核…

ubuntu遠程桌面很卡怎么解決?

服務端方案 完成XRDP的性能優化配置: 1. 首先檢查當前的xrdp.ini文件 grep -n "tcp_send_buffer_bytes" /etc/xrdp/xrdp.ini2. 編輯xrdp.ini文件,修改TCP發送緩沖區大小 sudo sed -i s/#tcp_send_buffer_bytes32768/tcp_send_buffer_bytes4194…

[Linux] Linux系統負載監控 Linux服務管理

目錄 Linux系統負載監控 系統負載介紹 查看系統負載 負載解讀 top 命令 Linux服務管理 systemd 介紹 系統啟動管理進程 基本概念 systemd 架構 unit 類型 查看 unit 列表信息 查看單個 unit 信息 控制系統服務 systemctl 命令 unit 配置文件 例:開發…

vector 手動實現 及遇到的各種細節問題

之前對vector的一些功能使用了一下 接下來手動實現一下vector vector的實現和string還是有不小區別的 有很多地方都有細節的問題不同于string的成員變量一個指針一個size一個capacity的成員變量 vector里面存的是三個迭代器iterator 這的迭代器其實就是模版T的指針 這樣就…

OpenStack Neutron中的L2 Agent與L3 Agent:新手友好指南

引言:云網絡的幕后英雄 在當今的云計算世界中,OpenStack作為開源云平臺的佼佼者,為成千上萬的企業提供了靈活、可擴展的基礎設施服務。而在OpenStack的眾多組件中,Neutron(網絡服務)扮演著至關重要的角色—…

【自用】JavaSE--特殊文件Properties與XML、日志技術

特殊文件概述使用特殊文件可以存儲多個有關系的數據,作為系統的配置信息屬性文件類似于鍵值對,一一對應存儲數據(比如用戶名與密碼)XML文件存儲多個用戶的多個屬性更適合,適合存儲更復雜的數據Properties注:這個屬性文件的后綴即使…

中本聰思想與Web3的困境:從理論到現實的跨越

一、中本聰思想的核心精髓中本聰通過比特幣白皮書提出的核心思想,可歸納為三大支柱:去中心化貨幣體系目標:擺脫中央機構控制,避免通貨膨脹和政治干預(如2008年金融危機暴露的中心化風險)。實現路徑&#xf…

Centos 用戶管理

一.創建用戶 在 root賬戶 或 sudo 權限下 1. 創建用戶 useradd xiaoyangzi2.為該用戶設置密碼或修改密碼 passwd xiaoyangzi3. 將用戶加入wheel用戶組 在 CentOS 中,屬于 wheel 組的用戶默認可以使用 sudo 權限。 查看所屬用戶組: groups xiaoyangzi將 xiaoyangzi 加…

C++枚舉算法習題

1. 3的倍數枚舉(基礎)題目:在之間有10和50多少個數是3的倍數?列舉這些數。 解析:枚舉10到50之間的數,判斷是否能被3整除。優化:計算第一個≥10的3的倍數(1234)&#xff0…

【SpringBoot系列-01】Spring Boot 啟動原理深度解析

【SpringBoot系列-01】Spring Boot 啟動原理深度解析 大家好!今天咱們來好好聊聊Spring Boot的啟動原理。估計不少人跟我一樣,剛開始用Spring Boot的時候覺得這玩意兒真神奇,一個main方法跑起來就啥都有了。但時間長了總會好奇:這…

windows環境下使用vscode以及相關插件搭建c/c++的編譯,調試環境

windows下使用vscode搭建c/c的編譯、運行、調試環境,需要注意的是生成的是xxx.exe可執行文件。另外使用的編譯器是mingw,也就是windows環境下的GNU。 我參考的網址是:https://zhuanlan.zhihu.com/p/1936443912806962622 文章分為2種環境搭建…

標準瓦片層級0~20,在EPSG:4326坐標系下,每個像素點代表的度數

在 EPSG:4326(WGS84經緯度坐標系) 下,瓦片層級(Zoom Level)的分辨率以 度/像素 為單位,其計算遵循 TMS Global Geodetic 規范(單位:度)。以下是 標準層級 0 至 20 的分辨…

Unity高級剔除技術全解析

目錄 ?編輯層級剔除(Layer Culling)原理詳解 代碼示例 業務應用場景 距離剔除(Distance Culling)技術細節 進階實現 開放世界優化技巧 視口裁剪(Viewport Culling)多攝像機協作方案 高級應用場景 …

[Linux] Linux文件系統基本管理

目錄 識別文件系統和設備 Linux 中設備 Linux 文件系統 查看設備和文件系統 lsblk命令 df命令 du命令 案例:查看根文件系統中哪個文件占用了最大空間 環境準備 查找過程 掛載和卸載文件系統 環境準備 掛載文件系統 卸載文件系統 卸載失敗處理 lsof …