SurfSense開源程序是NotebookLM / Perplexity / Glean的開源替代品,連接到外部來源,如搜索引擎

?一、軟件介紹

文末提供程序和源碼下載

? ? ?雖然 NotebookLM 和 Perplexity 等工具令人印象深刻,并且對于對任何主題/查詢進行研究都非常有效,但 SurfSense 通過與你的個人知識庫集成來提升這種能力。它是一個高度可定制的 AI 研究代理,連接到外部資源,例如搜索引擎(Tavily、LinkUp)、Slack、Linear、Notion、YouTube、GitHub 等。

二、主要特點

1. Latest?1. 最新

💡?Idea:?💡 想法:

Have your own highly customizable private NotebookLM and Perplexity integrated with external sources.
擁有您自己的高度可定制的私有 NotebookLM 和 Perplexity 與外部源集成。

📁?Multiple File Format Uploading Support
📁 支持多種文件格式上傳

Save content from your own personal files?(Documents, images and supports?27 file extensions)?to your own personal knowledge base .
將您自己的個人文件(文檔、圖像和支持 27 個文件擴展名)中的內容保存到您自己的個人知識庫中。

🔍?Powerful Search?🔍 強大的搜索功能

Quickly research or find anything in your saved content .
快速研究或查找您保存的內容中的任何內容。

💬?Chat with your Saved Content
💬 與您保存的內容聊天

Interact in Natural Language and get cited answers.
在 Natural Language 中互動并獲得引用的答案。

📄?Cited Answers?📄 引用的答案

Get Cited answers just like Perplexity.
獲取 Perfasciity 的 Cited 答案。

🔔?Privacy & Local LLM Support
🔔 隱私和本地LLM支持

Works Flawlessly with Ollama local LLMs.
與 Ollama local LLMs完美配合。

🏠?Self Hostable?🏠 自托管

Open source and easy to deploy locally.
開源且易于本地部署。

📊?Advanced RAG Techniques
📊 高級 RAG 技術
  • Supports 150+ LLM's?支持 150+ LLM個
  • Supports 6000+ Embedding Models.
    支持 6000+ 嵌入模型。
  • Supports all major Rerankers (Pinecode, Cohere, Flashrank etc)
    支持所有主要的 Reranker(Pinecode、Cohere、Flashrank 等)
  • Uses Hierarchical Indices (2 tiered RAG setup).
    使用 Hierarchical Indices (2 層 RAG 設置)。
  • Utilizes Hybrid Search (Semantic + Full Text Search combined with Reciprocal Rank Fusion).
    利用混合搜索(語義 + 全文搜索與倒數秩融合相結合)。
  • RAG as a Service API Backend.
    RAG 即服務 API 后端。
???External Sources?i? 外部源
  • Search Engines (Tavily, LinkUp)
    搜索引擎 (Tavily, LinkUp)
  • Slack?松弛
  • Linear?線性
  • Notion?概念
  • Youtube Videos?Youtube 視頻
  • GitHub?GitHub的

Cross Browser Extension
🔖 跨瀏覽器擴展

  • The SurfSense extension can be used to save any webpage you like.
    SurfSense 擴展程序可用于保存您喜歡的任何網頁。
  • Its main usecase is to save any webpages protected beyond authentication.
    它的主要用例是保存任何在身份驗證之外受保護的網頁。

Tech Stack?技術棧

BackEnd?后端

  • FastAPI: Modern, fast web framework for building APIs with Python
    FastAPI:用于使用 Python 構建 API 的現代、快速的 Web 框架

  • PostgreSQL with pgvector: Database with vector search capabilities for similarity searches
    帶有 pgvector 的 PostgreSQL:具有用于相似性搜索的向量搜索功能的數據庫

  • SQLAlchemy: SQL toolkit and ORM (Object-Relational Mapping) for database interactions
    SQLAlchemy:用于數據庫交互的 SQL 工具包和 ORM(對象關系映射)

  • Alembic: A database migrations tool for SQLAlchemy.
    Alembic:用于 SQLAlchemy 的數據庫遷移工具。

  • FastAPI Users: Authentication and user management with JWT and OAuth support
    FastAPI 用戶:使用 JWT 和 OAuth 支持進行身份驗證和用戶管理

  • LangGraph: Framework for developing AI-agents.
    LangGraph:開發 AI 代理的框架。

  • LangChain: Framework for developing AI-powered applications.
    LangChain:用于開發 AI 驅動的應用程序的框架。

  • LLM Integration: Integration with LLM models through LiteLLM
    LLM集成:通過 LiteLLM 與LLM模型集成

  • Rerankers: Advanced result ranking for improved search relevance
    Rerankers:用于提高搜索相關性的高級結果排名

  • Hybrid Search: Combines vector similarity and full-text search for optimal results using Reciprocal Rank Fusion (RRF)
    混合搜索:使用倒數秩融合 (RRF) 將向量相似性和全文搜索相結合,以獲得最佳結果

  • Vector Embeddings: Document and text embeddings for semantic search
    向量嵌入:用于語義搜索的文檔和文本嵌入

  • pgvector: PostgreSQL extension for efficient vector similarity operations
    pgvector:用于高效向量相似性作的 PostgreSQL 擴展

  • Chonkie: Advanced document chunking and embedding library
    Chonkie:高級文檔分塊和嵌入庫

  • Uses?AutoEmbeddings?for flexible embedding model selection
    用于?AutoEmbeddings?靈活的嵌入模型選擇

  • LateChunker?for optimized document chunking based on embedding model's max sequence length
    LateChunker?用于基于嵌入模型的最大序列長度優化文檔分塊


FrontEnd?前端

  • Next.js 15.2.3: React framework featuring App Router, server components, automatic code-splitting, and optimized rendering.
    Next.js 15.2.3:React 框架,具有 App Router、服務器組件、自動代碼拆分和優化渲染。

  • React 19.0.0: JavaScript library for building user interfaces.
    React 19.0.0:用于構建用戶界面的 JavaScript 庫。

  • TypeScript: Static type-checking for JavaScript, enhancing code quality and developer experience.
    TypeScript:JavaScript 的靜態類型檢查,可增強代碼質量和開發人員體驗。

  • Vercel AI SDK Kit UI Stream Protocol: To create scalable chat UI.
    Vercel AI SDK 套件 UI 流協議:創建可擴展的聊天 UI。

  • Tailwind CSS 4.x: Utility-first CSS framework for building custom UI designs.
    Tailwind CSS 4.x:用于構建自定義 UI 設計的實用優先 CSS 框架。

  • Shadcn: Headless components library.
    Shadcn:Headless 組件庫。

  • Lucide React: Icon set implemented as React components.
    Lucide React:作為 React 組件實現的圖標集。

  • Framer Motion: Animation library for React.
    Framer Motion:React 的動畫庫。

  • Sonner: Toast notification library.
    Sonner:Toast 通知庫。

  • Geist: Font family from Vercel.
    Geist:來自 Vercel 的字體系列。

  • React Hook Form: Form state management and validation.
    React Hook Form:表單狀態管理和驗證。

  • Zod: TypeScript-first schema validation with static type inference.
    Zod:使用靜態類型推理進行 TypeScript 優先模式驗證。

  • @hookform/resolvers: Resolvers for using validation libraries with React Hook Form.
    @hookform/resolvers: 用于將驗證庫與 React Hook Form 一起使用的解析器。

  • @tanstack/react-table: Headless UI for building powerful tables & datagrids.
    @tanstack/react-table:用于構建強大表格和數據網格的無頭用戶界面。

Extension?外延

Manifest v3 on Plasmo
Plasmo 上的 Manifest v3

三、軟件下載

夸克網盤分享

本文信息來源于GitHub作者地址:GitHub - MODSetter/SurfSense: Open Source Alternative to NotebookLM / Perplexity / Glean, connected to external sources such as search engines (Tavily, Linkup), Slack, Linear, Notion, YouTube, GitHub and more.

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/904581.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/904581.shtml
英文地址,請注明出處:http://en.pswp.cn/news/904581.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于OpenTelemetry的分布式鏈路追蹤Trace?實現(PHP篇)

目錄 引言一、OpenTelemetry是一套可觀測性標準協議二、分布式追蹤(?Trace?)是OpenTelemetry的核心功能之一三、OpenTelemetry的架構原理四、OpenTelemetry的分布式追蹤(?Trace?)實踐1、準備PHP環境2、下載SDK3、編寫實例代碼…

探索智能體的記憶:類型、策略和應用

AI Agent 中的記憶:類型、策略和應用 記憶實現是使智能體能夠保持上下文、從過去的交互中學習并做出明智決策的關鍵組成部分。與人類記憶非常相似,智能體記憶允許 AI 系統隨時間存儲、檢索和利用信息,從而為用戶創造更連貫和個性化的體驗。 …

leetcode 2395. Find Subarrays With Equal Sum

題目描述 代碼&#xff1a; class Solution { public:bool findSubarrays(vector<int>& nums) {int len nums.size();if(len <2)return false;unordered_set<int> table;int sum 0;for(int i 1;i < len;i){sum nums[i-1]nums[i];if(table.contains(…

Kubernetes(k8s)學習筆記(七)--KubeSphere 最小化安裝

前情提要 可視化操作面板對于開發、運維絕對是提升工作效率的一大利器&#xff0c;因此很有必要搭建一套可視化操作來管理Kubernetes。 可視化面板有多種&#xff1a; 1.Kubernetes官方提供的默認面板&#xff1a;dashboard&#xff0c;用處不大&#xff0c;放棄&#xff1b…

MCP連接Agent:AI時代的TCP/IP

介紹 2023年&#xff0c;生成式AI爆發。2024年&#xff0c;智能體&#xff08;Agent&#xff09;接棒成為AI新焦點。2025年&#xff0c;智能體似乎已經要開始爆發了。目前的智能體更像一個“單機App”&#xff1a;彼此不了解、無法通信&#xff0c;更不能協作。類似互聯網早期…

交換機工作原理(MAC地址表、VLAN)

目錄 一、交換機的基本工作原理 數據幀的轉發 MAC地址表的作用 交換機的轉發方式 二、VLAN&#xff08;虛擬局域網&#xff09; VLAN的定義 VLAN的作用 VLAN的實現方式 VLAN的幀標記 VLAN的通信 三、交換機與VLAN的結合 四、交換機與VLAN的實際應用場景 交換機是局…

eFish-SBC-RK3576工控板外部RTC測試操作指南

備注&#xff1a; 1&#xff09;測試時一定要接電池&#xff0c;否則外部RTC斷電后無法工作導致測試失敗&#xff1b; 2&#xff09;如果連接了網絡&#xff0c;系統會自動同步NTP時鐘&#xff0c;所以需要關閉自動同步時鐘。 關閉自動同步NTP時鐘方法&#xff1a; 先查看是…

淘寶按圖搜索商品(拍立淘)Java 爬蟲實戰指南

在電商領域&#xff0c;按圖搜索商品功能為用戶提供了更直觀、便捷的購物體驗。淘寶的拍立淘功能更是憑借其強大的圖像識別技術&#xff0c;成為許多開發者和商家關注的焦點。本文將詳細介紹如何利用 Java 爬蟲技術實現淘寶按圖搜索商品功能&#xff0c;包括注冊賬號、上傳圖片…

【Redis】List類型

文章目錄 List的特點介紹lpush&#xff0c;lpushx&#xff0c;rpush&#xff0c;rpushx命令lrange命令lpop和rpoplindex命令linsert命令llen命令lrem 命令ltrim命令lset命令阻塞版本的命令blpop和brpop 命令小結list的內部編碼List的應用場景 List的特點介紹 列表相當于一個數…

QT:qt5調用打開exe程序并獲取調用按鈕控件實例2025.5.7

為實現在 VS2015 的 Qt 開發環境下打開外部 exe&#xff0c;列出其界面按鈕控件的序號與文本名&#xff0c;然后點擊包含特定文本的按鈕控件。以下是更新后的代碼&#xff1a; #include <QCoreApplication> #include <QProcess> #include <QDebug> #include…

基于Jenkins的DevOps工程實踐之Jenkins共享庫

文章目錄 前言Jenkins共享庫結構1、共享庫演示2、知識點補充3、實踐使用共享庫格式化輸出日志4、groovy基礎語法4.1、 什么是 Groovy&#xff1f;4.2、groovy特點4.3、運行方法4.4、標識符4.5、基本數據類型4.5.1、string類型4.5.2、list類型 4.6、函數使用4.7、正則表達式 5、…

【Qt4】Qt4中實現PDF預覽

方案一&#xff1a; 在Qt4中預覽PDF文件&#xff0c;你可以使用多種方法&#xff0c;但最常見和簡單的方法之一是使用第三方庫。Qt本身并沒有內置直接支持PDF預覽的功能&#xff0c;但你可以通過集成如Poppler、MuPDF等庫來實現這一功能。下面我將展示如何使用Poppler庫在Qt4中…

php artisan resetPass 執行密碼重置失敗的原因?php artisan resetPass是什么 如何使用?-優雅草卓伊凡

php artisan resetPass 執行密碼重置失敗的原因&#xff1f;php artisan resetPass是什么 如何使用&#xff1f;-優雅草卓伊凡 可能的原因 命令不存在&#xff1a;如果你沒有正確定義這個命令&#xff0c;Laravel 會報錯而不是提示”重置密碼失敗”用戶不存在&#xff1a;’a…

ai說什么是注解,并以angular ts為例

在編程中&#xff0c;注解&#xff08;Annotation&#xff09; 是一種特殊的語法結構&#xff0c;用于為代碼添加元數據&#xff08;metadata&#xff09;&#xff0c;從而在不修改代碼邏輯的情況下&#xff0c;提供額外的信息或指示編譯器、框架、工具如何處理這些代碼。注解通…

【MySQL】-- 聯合查詢

文章目錄 1. 簡介1.1 為什么要使用聯合查詢1.2 多表聯合查詢時MySQL內部是如何進行計算的 2. 內連接2.1 語法2.2 示例 3. 外連接3.1 語法3.2 示例 4. 自連接4.1 應用場景4.2 示例4.3 表連接練習 5. 子查詢5.1 語法5.2 單行子查詢5.3 多行子查詢5.4 多列子查詢5.5 在from 子句中…

【多線程】六、基于阻塞隊列的生產者消費者模型

文章目錄 Ⅰ. 生產者消費者模型的概念Ⅱ. 生產者消費者模型的優點Ⅲ. 基于阻塞隊列的生產者消費者模型MakefileBlock_queue.hpptask.hpptest.cpp Ⅳ. 如何理解提高了效率??? Ⅰ. 生產者消費者模型的概念 ? 生產者消費者模型是一種常見的并發模式&#xff0c;用于解決生產者…

【Vue】全局事件總線 TodoList 事件總線

目錄 一、 實現所有組件看到x事件 二、 實現$on $off 以及 $emit 總結不易~ 本章節對我有很大的收獲&#xff0c; 希望對你也是&#xff01;&#xff01;&#xff01; 本節素材已上傳至Gitee&#xff1a;yihaohhh/我愛Vue - Gitee.com 全局事件總線圖&#xff1a; 本節素材…

Python編程virtualenv庫的簡介和使用方法

Python編程virtualenv庫的簡介和使用方法 virtualenv和conda的區別是什么

MySQL的行級鎖鎖的到底是什么?

大家好&#xff0c;我是鋒哥。今天分享關于【MySQL的行級鎖鎖的到底是什么?】面試題。希望對大家有幫助&#xff1b; MySQL的行級鎖鎖的到底是什么? 1000道 互聯網大廠Java工程師 精選面試題-Java資源分享網 MySQL的行級鎖是數據庫管理系統&#xff08;DBMS&#xff09;的一…

【C++游戲引擎開發】第33篇:物理引擎(Bullet)—射線檢測

一、射線檢測核心理論體系 1.1 射線檢測的數學基礎 1.1.1 參數化射線方程 射線在三維空間中的數學表達采用參數方程: r ( t ) = o + t d ^ ( t ∈ [