使用阿里云百煉embeddings+langchain+Milvus實現簡單RAG

注意測試時，替換其中的key、文檔等

import os
from langchain_community.embeddings import DashScopeEmbeddings
from langchain_community.vectorstores import Milvus
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import TextLoader# 2. 初始化阿里云百煉 Embedding-v2 模型,默認1536維度，不可更改
embeddings = DashScopeEmbeddings(model="text-embedding-v2",  # 使用百煉的embedding v2模型dashscope_api_key=os.getenv("OPENAI_API_KEY")
)# 3. 加載和分割文本
loader = TextLoader("idea快捷鍵.md",encoding='utf-8')  # 替換為你的文本文件路徑
documents = loader.load()text_splitter = RecursiveCharacterTextSplitter(chunk_size=200,  # 每個chunk的字符數chunk_overlap=50  # chunk之間的重疊字符數
)
docs = text_splitter.split_documents(documents)# 4. 連接到 Milvus 并存儲向量
vector_db = Milvus.from_documents(documents=docs,embedding=embeddings,connection_args={"host": "192.168.80.152",  # Milvus服務器地址"port": "19530"       # Milvus端口},collection_name="example_collection",  # 集合名稱drop_old=True  # 如果集合已存在則刪除重建
)# 5. 使用示例 - 相似性搜索
query = "查看指定的類結構圖"
similar_docs = vector_db.similarity_search(query, k=3)  # 搜索最相似的3個文檔print("相似文檔搜索結果:")
for i, doc in enumerate(similar_docs):print(f"\n結果 {i+1}:")print(doc.page_content)print(f"元數據: {doc.metadata}")

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/83819.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/83819.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/83819.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！