Deep research深度研究:ChatGPT/ Gemini/ Perplexity/ Grok哪家最強?(實測對比分析)

目前推出深度研究和深度檢索的AI大模型有四家:
OpenAI和Gemini 的deep research,以及Perplexity 和Grok的deep search,都能生成帶參考文獻引用的主題報告。

致力于“幾分鐘之內生成一份完整的主題調研報告,解決人力幾小時甚至幾天的工作量。大大提升研究效率。” ? ? ? ? ??

本文娜姐會針對一個文獻綜述主題,來測試對比一下這四家的實際生成效果。 ? ? ? ? ??

首先,這幾款工具技術參數和價格對比如下:? ??

圖片

2 各家效果測試對比: ? ? ? ? ??

下面娜姐以一篇綜述主題“炎癥相關脂肪因子與癡呆的研究進展”為例,詳細對比一下各家的輸出效果: ? ? ? ? ??

我要求按照如下框架內容展開,并包含一個總結性表格:

1 炎癥相關脂肪因子的具體分類;2 脂肪因子在神經炎癥中的作用機制;3 脂肪因子與不同類型癡呆的關系;4 臨床研究和動物實驗的最新進展;5 潛在的治療靶點及干預策略? ? ? ? ? ??

2.1 Perplexity:

為防止用中文對話,Perplexity查找的都是中文信息源,我強調要查找英文文獻,并用中文撰寫綜述,Perplexity聽懂了: ? ? ? ? ??

圖片

但是,對于不同脂肪因子與癡呆癥的作用機制,并沒有深入討論,只列舉了相關性:

圖片

? ??

最后聽話照做輸出了總結性表格,只是內容總結的不夠全面:

圖片

總結一下:

Perplexity deep search的優點是生成帶參考文獻引文的報告。內容的準確度還可以(對比剛上線時候功能似乎有改進),但是不夠全面,對于研究型主題來說,深度也不夠。好在它末尾的“關聯問題”很有啟發性,你可以繼續深挖,補全信息,比如繼續讓它深度思考機制問題:?? ?

圖片

? ? ? ? ???

2.2 Grok3 deep search:

雖然我強調了檢索英文文獻,但是最后用中文輸出報告,但是Grok還是檢索的中文信息源:? ??

圖片

? ? ? ? ???

然后換成用英文提問,要求中文回復,這下可以了。

Grok的深度搜索檢索了20篇學術文獻,并匯總結果用中文呈現給我。對比Perplexity的文獻大多來自Pubmed、Semantic Scholar,Grok的文獻來源更學術和多樣化:包括ScienceDirect、Wiley、Oxford Academic等學術出版機構。 ? ? ? ? ??

但是它的參考文獻沒有在報告中引用,不好確認相關性:

圖片

? ??

Grok表格總結和Perplexity總結的主要脂肪因子種類一樣,但其他類目不同。Perlexity比Grok的總結更符合學術論文風格:

圖片

? ? ? ? ???

2.3 Gemini deep research:? ? ? ? ???

Gemini和OpenAI的深度研究都是智能體驅動的,Gemini的底層模型是1.5 pro,在輸出報告之前,都會先出一個內容框架,和你對齊需求,最終生成一份帶參考文獻來源的3000多字綜述報告。?

圖片

??? ??

圖片

脂肪因子和癡呆的作用機制探討,Gemini比Perplexity和Grok深入一點,但是對于學術論文的文獻綜述,還太淺了:

圖片

表格總結方面,Gemini總結的是所有炎癥相關脂肪因子,而不是和癡呆相關的,對主題的理解有偏差:? ? ? ? ? ? ???

圖片

? ? ? ? ???

2.4 OpenAI deep research:

用時7分鐘,調研了35篇文獻后,deep research給我輸出了一份2萬多字的完整綜述:? ??

圖片

? ???

圖片

圖片

毫無疑問,這份報告的質量是最高的,不是因為字數最多,而是它的報告足夠有深度、準確性高、文獻是最新的。? ? ??

表格總結,OpenAI deep research是最全面準確和最有深度的,并且全部帶有引文鏈接:? ? ? ? ? ? ???

圖片

? ??

圖片

相比之下,Perplexity和Grok deep search脂肪因子總結不夠全面,且分析較淺;Gemini Deep Research總結更全面,但是準確度有待核實,有一些不相關的脂肪因子總結進來。且表格其他項目沒有OpenAI總結深入。 ? ? ? ? ??

總結一下:

Perplexity和Grok的深度搜索工具重在搜索和匯總信息,兩者結果呈現相當。Groq搜索來源更廣泛,但是文中不帶引文,不好核實來源;Perplexity會在文中和文末同時附帶參考文獻。 ? ? ? ? ??

Gemini和OpenAI的深度研究相比,Gemini雖然背靠谷歌搜索,但是由于底層大模型1.5 pro不夠給力,充其量只能算deep search的升級版,因為一份深度的研究報告除了對信息的檢索,還包括對信息的判斷、分析和匯總。? ? ? ? ? ? ???

OpenAI deep research勝在其底層模型o3,專門針對深度研究的使用場景,采用 “端到端的強化訓練”方法,獲得了很好的效果。 ? ?

3 OpenAI deep research特點分析? ? ??

該智能體從用戶的問題出發,直接學習每一步該怎么辦:例如應該搜索什么關鍵詞、點擊哪個鏈接、在頁面中尋找哪些信息、何時結束搜索開始撰寫報告等等。整個決策鏈條都是通過強化學習一體化學得的。 ? ? ? ? ??

不需要人為告訴它該搜索什么關鍵詞、點擊哪個鏈接、在頁面中尋找哪些信息、什么時候結束搜索開始撰寫報告等等 。? ??

圖片

? ???(OpenAI deep research自主創建關鍵詞,檢索、分析、匯總信息的過程)? ? ??

正因為o3模型在信息判斷和分析綜合能力的提升,它特別適合學術類文獻綜述任務。 ? ? ? ? ??

當然,正如娜姐之前那篇關于OpenAI deep research文章的總結,它也不是沒有缺點的:?

OpenAI deep research全面開放:如何更好的用它進行文獻綜述?(深度使用經驗分享)

? ? ? ? ??? ??

1 完成一個任務要多次嘗試,速度慢,deep research完成一份報告要5-30分鐘;且需要較高的算力支持(所以收費貴,plus用戶每月才10次)。?

2 在文獻來源方面,存在單篇文獻過度引用和引用不全面的問題。在闡述某一個觀點時,找到契合觀點的文獻可能一整段都會只引用1-2篇文獻。所以,deep research出的報告一般都是20-30篇參考文獻。即使你要求更多,也不會超出50篇。 ? ? ? ? ??

你看它的智能體運行過程,會發現,它在找到某一個觀點的支撐文獻之后,就會進入下一個任務,并不會就這個關鍵詞繼續全面檢索文獻。 ? ? ? ??

但是,不同于Gemini的一次性深度研究報告,OpenAI的deep research可以在同一個對話框繼續對話,你可以針對報告中的某一個主題繼續拓展,還能添加附件資料讓它學習。 ? ? ? ? ??

圖片

? ??

圖片

4 學員群提問關于deep research的問題匯總: ? ? ? ? ??

4.1 怎么樣算是調用了deep research,我的是不是被降智了?

Deep research的回復分為兩步,第一步對齊需求,第二步開始研究。進度條開啟就是成功調用deep research,就會算一次(plus每月10次額度),最后生成的報告一定是帶參考文獻引用的。 ? ? ? ? ??

如果沒有分兩步進行,直接在第一次就回答了你的問題,且沒有進度條展示和參考文獻。那就是被降智了。概率問題,無解。 ? ? ? ? ??

4.2 該如何選擇運行deep research的大模型??? ? ? ? ??? ??

現在ChatGPT也有五六款模型可以選擇了,用哪一個模型進行深度研究效果最好呢?

deep research的回答分為兩步:第一步是根據你的提問和你對其需求,這一步可以自由選擇模型,默認是4o,還可以選擇其他推理模型o1;第二步是啟動深度分析,這一步是調用專門訓練用于深度研究的o3來完成的,選其他的也沒用。 ??

4.3 報告怎么下載?

不同于Gemini的deep research,可以直接生成谷歌文檔,以附件形式下載。OpenAI的深度研究報告不能以附件形式下載,只能在報告末尾左下角點“復制”按鈕,復制到word文檔查看。

圖片

? ? ? ? ???

并且,參考文獻都是附在文中,鏈接有時候還不能跳轉。好在,有標題信息,都能溯源。? ? ? ? ? ? ???

好了,以上就是近期四款主流的AI大模型ChatGPT/ Gemini/ Perplexity/ Grok的深度搜索和深度研究功能對比。我們可以根據場景和自己的需求選擇不同的深度研究工具,提升科研效率。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/73224.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/73224.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/73224.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Android SharedPreference 詳解

前提:基于 Android API 30 1. 認識 SharedPreference SharedPreference 是 Android 提供的輕量級的,線程安全的數據存儲機制,使用 key-value 鍵值對的方式將數據存儲在 xml 文件中,存儲路徑為 /data/data/yourPackageName/share…

自動化測試腳本語言選擇

測試人員在選擇自動化測試腳本語言時面臨多種選項。Python、Java、C#、JavaScript 和 Ruby 都是常見選擇,但哪種語言最適合?本文將詳細分析這些語言的特點、適用場景和優劣勢,結合行業趨勢和社會現象,為測試人員提供全面指導。 選…

【Java項目】基于JSP的KTV點歌系統

【Java項目】基于JSP的KTV點歌系統 技術簡介:采用JSP技術、B/S結構、MYSQL數據庫等實現。 系統簡介:KTV點歌系統的主要使用者分為管理員和用戶,實現功能包括管理員:個人中心、用戶管理、歌曲庫管理、歌曲類型管理、點歌信息管理&a…

element-plus文檔解析之Layout布局(el-row,el-col)

前言 這是element-plus提供的響應式布局組件。可以非常方便的實現響應式布局以及快速按比例分塊。 例如實現下面的效果: 第一行:寬度占100% 第二行:寬度1:1 第三行:1:1:1 第四行:1…

【Java】——數據類型和變量

個人主頁:User_芊芊君子 🎉歡迎大家點贊👍評論📝收藏?文章 文章目錄: 1.Java中的注釋1.1.基本規則1.2.注釋規范 2.標識符3.關鍵字4.字面常量5.數據類型6.變量6.1變量的概念6.2語法6.3整型變量6.3.1整型變量6.3.2長整…

串口數據記錄儀DIY,體積小,全開源

作用 產品到客戶現場出現異常情況,這個時候就需要一個日志記錄儀、黑匣子,可以記錄產品的工作情況,當出現異常時,可以搜集到上下文的數據,從而判斷問題原因。 之前從網上買過,但是出現過丟數據的情況耽誤…

JVM中是如何定位一個對象的

在 Java 中,對象定位指的是如何通過引用(Reference)在堆內存中找到對象實例及其元數據(如類型信息)。JVM 主要通過 直接指針訪問 和 句柄訪問 兩種方式實現,各有其優缺點和應用場景: 一、直接指…

Mac 如何在idea集成SVN

在windows系統上面有我們最為熟悉的小烏龜TortoiseSVN,在mac系統上面則沒有什么好用的svn的工具,而且大部分都付費,需要各種渠道找PJ版,費事費力,作為程序員,大部分人應該都會安裝開發工具,本文…

批量測試IP和域名聯通性

最近需要測試IP和域名的聯通性,因數量很多,單個ping占用時間較長。考慮使用Python和Bat解決。考慮到依托的環境,Bat可以在Windows直接運行。所以直接Bat處理。 方法1 echo off for /f %%i in (E:\封禁IP\ipall.txt) do (ping %%i -n 1 &…

LabVIEW變頻器諧波分析系統

隨著工業自動化的發展,變頻器在電力、機械等領域的應用日益廣泛,但諧波問題直接影響系統效率與穩定性。傳統諧波檢測設備(如Norma5000)精度雖高,但價格昂貴且操作復雜,難以適應現場快速檢測需求。本項目基于…

Unity Shader學習總結

1.幀緩沖區和顏色緩沖區區別 用于存儲每幀每個像素顏色信息的緩沖區 幀緩沖區包括:顏色緩沖區 深度緩沖區 模板緩沖區 自定義緩沖區 2.ImageEffectShader是什么 后處理用的shader模版 3.computerShader 獨立于渲染管線之外,在顯卡上運行,大量…

OpenPLC WebServer啟動

簡述 OpenPLC OpenPLC 可運行在嵌入式系統和普通計算機上,其基本原理是在硬件上安裝類似 Linux 的操作系統,并在該環境下運行 OpenPLC 應用程序,從而讓用戶開發、調試和運行工業自動化控制邏輯。它目前只支持部分 ARM 架構的嵌入式系統&…

【基礎知識】回頭看Maven基礎

版本日期修訂人描述V1.02025/3/7nick huang創建文檔 背景 項目過程中,對于Maven的pom.xml文件,很多時候,我通過各種參考、仿寫,最終做出想要的效果。 但實際心里有些迷糊,不清楚具體哪個基礎的配置所實現的效果。 今…

ROS實踐(四)機器人SLAM建圖(gmapping)

目錄 一、SLAM技術 二、常用工具和傳感器 三、相關功能包 1. gmapping建圖功能包 2. map_server 四、SLAM 建圖實驗 1. 配置gmapping(launch文件) 2. 啟動機器人仿真(含機器人以及傳感器) 3. 運行gmapping節點 4. 啟動rviz可視化工具 5. 保存地圖文件 一、SLAM技…

二進制安裝指定版本的MariaDBv10.11.6

一、官網下載mariadb安裝包 Download MariaDB Server - MariaDB.org 找到對應的版本 下載安裝包后上傳到服務器這里不再贅述。 二、安裝二進制包 1、解壓安裝包 2、查看安裝包內的安裝提示文檔根據提示文檔進行安裝 # 解壓安裝包 tar xf mariadb-10.11.6-linux-systemd-x8…

【抽獎項目】|第二篇

前言: 高并發的活動預熱肯定不可以在數據庫操作,需要redis,特別是這種秒殺活動更是需要注意,所以可以在高并發的前夕先進行活動預熱。 思路: 1、 通過定時任務調度每分鐘查詢數據庫也沒有需要預熱的活動 2、采用分布式…

異或和之和 第十四屆藍橋杯大賽軟件賽省賽C/C++ 大學 A 組

異或和之和 題目來源 第十四屆藍橋杯大賽軟件賽省賽C/C++ 大學 A 組 原題鏈接 藍橋杯 異或和之和 https://www.lanqiao.cn/problems/3507/learning/ 問題描述 問題分析 要點1:異或運算 概念 異或(Exclusive OR,簡稱 XOR)是一種數學運算符,常用于邏輯運算與計算機…

從零到一:如何系統化封裝并發布 React 組件庫到 npm

1. 項目初始化 1.1 創建項目 首先,創建一個新的項目目錄并初始化 package.json 文件。 mkdir my-component-library cd my-component-library npm init -y1.2 安裝依賴 安裝開發所需的依賴項,如構建工具、測試框架等。 npm install --save-dev webp…

現代互聯網網絡安全與操作系統安全防御概要

現階段國與國之間不用對方路由器,其實是有道理的,路由器破了,內網非常好攻擊,內網共享開放端口也非常多,更容易攻擊。還有些內存系統與pe系統自帶瀏覽器都沒有javascript腳本功能,也是有道理的,…

2025-03-12 學習記錄--C/C++-PTA 習題8-4 報數

合抱之木,生于毫末;九層之臺,起于累土;千里之行,始于足下。💪🏻 一、題目描述 ?? 習題8-4 報數 報數游戲是這樣的:有n個人圍成一圈,按順序從1到n編好號。從第一個人開…