白楊SEO:做AI搜索優化的DeepSeek、豆包、Kimi、百度文心一言、騰訊元寶、通義、智譜、天工等AI生成內容信息采集主要來自哪?占比是多少?

大家好,我是白楊SEO,專注SEO十年以上,全網SEO流量實戰派,AI搜索優化研究者。

在開始寫之前,先說個抱歉。

上周在上海客戶以及線下聚會AI搜索優化分享說各大AI模型的聯網搜索是關閉的,最開始上來確實是的。但這幾天我去看,有些聯網搜索默認是開啟了,所以說下抱歉,如圖。

白楊SEO的關注朋友,也可以去打開看看是不是這樣?可以給我留言。

有些朋友可能會說,DeepSeek、豆包、Kimi、百度文心一言、騰訊元寶、通義、智譜、天工等AI大模型默認開不開啟聯網搜索有什么差別呢?

白楊SEO想說,這個差別大著呢。

我們做AI搜索優化,或者說叫GEO,如果不是聯網搜索的情況下,我們很難快速優化進AI大模型結果里。因為AI大模型訓練間隔比較久,而且費用也不便宜,要想了解實時性的東西,所以他們只要有,都加上了聯網搜索功能。

而對于AI大模型的用戶而言,他不可能在提問之前,先去打開聯網搜索之類(只有少部分專業的人會去這么做)。

就像我們說做百度、抖音或微信搜一搜關鍵詞搜索排名一樣,用戶默認會看全部排名,很少去點具體某個垂直下面結果一樣,如圖:

哈哈哈,看上圖,才發現,微信搜一搜直接也把【AI搜索】放在TAG上了,你們看下有沒有?

好,我們繼續。

正因為大模型如果從原來不是默認開啟聯網搜索到現在默認開啟,那么我們做AISEO即AI搜索優化,不管是做品牌曝光還是引流量還是營銷,都有機會了是不是?當然,比如像通義現在還是默認沒開啟哈~

為什么今天想到分享要說下DeepSeek、豆包、Kimi、百度文心一言、騰訊元寶、通義、智譜、天工等AI生成內容信息采集主要來自哪這個事呢?

一是因為之前我在另外公號分享過《豆包、kimi、deepseek、百度文心一言、騰訊元寶等大模型它們生成內容的引用來源是哪?》這篇后很多人說感興趣。

二是因為這次去上海做AI搜索優化(GEO)線下培訓分享時,有分享了主流的DeepSeek、豆包、Kimi、百度文心一言的內容信息采集來源占比圖,當然這只是某個行業的個例,其它可以再測。如圖,

我在想不管是做AI搜索優化這行的轉行的SEO或者其它行業同行,又或者是想做AI搜索優化的企業,他們是不是都想知道呢,這樣更好做好AI搜索優化(GEO)。

所以,除了DeepSeek、豆包、Kimi、百度文心一言,我還加了騰訊元寶,通義(原通義千問,改名縮短了,PC和APP一致),智譜(智譜清言簡稱),天工(AI搜索引擎工具)等AI生成內容的。

好,我們就一個一個來說一下。

1、DeepSeek AI生成內容信息采集主要來源及占比參考

DeepSeek AI生成內容信息采集主要來源,按照DeepSeek自己的說法是開源數據(MIT協議允許自由使用)、強化學習生成數據、少量標注數據。

你可能沒懂,簡單說就是互聯網上的內容以及它自己再生成的,以及非常少的標注的。但我們能優化的是開源數據。這個主要來源,來自白楊SEO朋友公司客戶案例統計如圖(他們的業務介紹PPT)

從上圖看到主要來源是媒體,這個媒體主要指四大門戶以及各種地方網站那種新聞媒體哈。占比第二的UGC平臺比如知乎等也很大。第三則是搜索詞官網或垂直網站。至于電商這個說一下,因為是行業不同,有些沒有這個哈。

所以我們得出結論,要做好DeepSeek的AI搜索優化,主要做好媒體、UGC為主就可以了,當然官網也要發。具體怎么布局SEO搜索關鍵詞之類,看我公眾號歷史文章有寫哈,后續也會慢慢分享出來,不在本文討論。

2、豆包 AI生成內容信息采集主要來源及占比參考

如圖,豆包主要信息采集來源是字節系自己產品(抖音短視頻,抖音百科,頭條等),另外就是新聞媒體上發的,第三則是官網及其它。占比如圖,這里不再詳說了。這個也是某個行業哈,其它你可以搜索自己試試。

3、Kimi AI生成內容信息采集主要來源及占比參考

如圖,KIMI有意思,70%的內容來源UGC,尤其你看那個知乎占比很大啊,哈哈哈。

為什么呢,你像kimi這類AI大模型平臺,跟deepseek一樣,他們是沒有像百度、騰訊,抖音有自己內容生態源哈。話說回來,知乎也是一個知識寶庫呢,哈哈哈。

雖然知乎也有自己的AI大模型【知乎直答】如圖,但它的影響力,就如知乎在當下互聯網的現狀一樣,有心無力的,可能比某度還尷尬,唉。

4、百度AI搜索、文心一言 AI生成內容信息采集主要來源及占比參考

百度AI搜索、文心一言,其實這是兩個渠道。文心一言是百度AI大模型產品,有網頁版,也有APP,APP叫文小言。而百度AI搜索是百度搜索里面AI搜索。雖然跟文心一言模型一致,同時還結合了deepseek的哈,如圖。

所以參考百度文心一言的,其實是一樣的。主要內容及來源占比如圖,參考

所以如果我們要做百度AI搜索或文心一言,主要做百度產品,比如百家號,百科,以及像新媒發軟文,以及垂直官網等就可以了。

5、騰訊元寶 AI生成內容信息采集主要來源及占比參考

騰訊元寶AI生成內容信息采集主要來源就是微信生態內容,如公眾號文章,視頻號內容等,再加上其它新聞媒體,網站內容等,如圖。

如果說占比的話,公眾號文章占比應該要到50%左右哈。

如果想知道在元寶或微信搜一搜里這個詞流量大概有多少,可以看微信指數或騰訊廣告里數據,相關看這兩篇:

白楊SEO:想做微信搜一搜精準流量,你真正看懂微信指數了嗎?

白楊SEO:工具推薦第十七期—搜一搜關鍵詞搜索流量查詢工具騰訊廣告

6、通義(通義千問)、夸克AI生成內容信息采集主要來源及占比參考

如圖,通義AI生成內容信息采集主要來源是各大新聞媒體平臺(包含自媒體)比如網易號,騰訊企鵝號,搜狐網,新浪財經等,這類占比60%以上,其它就是官網之類。

當然,如果你搜索不同的詞,比如電商類的之類,會來自一些垂直網站,比如站長之家,什么值得買等。當然,大多數還是阿里生態內數據,最近主要在增加這塊,比如夸克搜索等。

當然,夸克那個AI跟通義邏輯一樣,大家也要重點關注哦,它可能是國內目前AI搜索領域訪問量TOP哦,如圖。

7、智譜清言 AI生成內容信息采集主要來源及占比參考

智譜數據來源開源模型(如ChatGLM)、合作企業數據(如金融、政務領域)。占比推測:開源數據占40%,合作數據占50%等。如圖,

除了合作的以外,另外就是一些第三方自媒體平臺。因為智譜在國內AI大模型C端用戶認知里不大,所以很多企業沒有關注,正常。比如拿你來說,你手機里有下這個APP嗎?

8、天工AI AI生成內容信息采集主要來源及占比參考

這個天工AI也是一樣,白楊SEO里很多粉絲朋友可能第一次聽說它吧?哈哈哈。它默認是聯網的哈,如圖。

話說它這整個智能體,沒有積分還用不了,當然新用戶還會送,這樣它這個和之前爆火的manus有點像,不再是純聊天大模型,更像是可以做任務的智能體了,你簡單理解就是比大模型還進一步了。

當然這個渠道,以及智能體這種,我們后面再先。如果感興趣看我之前寫過《白楊SEO:一文告訴你智能體Agent是什么、有哪些、用在哪里、哪個好用及搭建流程【收藏】》參考。

今天這篇又快三千字了,希望看完對你做AI搜索優化或者GEO優化有一定幫助。如果你覺得這個分享有價值,請繼續關注我,或者分享需要朋友,謝謝。

作者介紹:

白楊SEO,專注SEO研究十年+,全網SEO流量實戰派,ai搜索優化研究者。前某公司市場總監,現自由職業,企業顧問。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/82703.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/82703.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/82703.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

QML與C++交互2

在QML與C的交互中,主要有兩種方式:在C中調用QML的方法和在QML中調用C的方法。以下是具體的實現方法。 在C中調用QML的方法 首先,我們需要在QML文件中定義一個函數,然后在C代碼中調用它。 示例 //QML main.qml文件 import QtQu…

OpenGL Chan視頻學習-8 How I Deal with Shaders in OpenGL

bilibili視頻鏈接: 【最好的OpenGL教程之一】https://www.bilibili.com/video/BV1MJ411u7Bc?p5&vd_source44b77bde056381262ee55e448b9b1973 函數網站: docs.gl 說明: 1.之后就不再整理具體函數了,網站直接翻譯會更直觀也…

動態防御新紀元:AI如何重構DDoS攻防成本格局

1. 傳統高防IP的靜態瓶頸與成本困境 傳統高防IP依賴預定義規則庫,面對SYN Flood、CC攻擊等威脅時,常因規則更新滯后導致誤封合法流量。例如,某電商平臺曾因靜態閾值過濾誤封20%的訂單接口流量,直接影響營收。以下代碼模擬傳統方案…

如何實現高性能超低延遲的RTSP或RTMP播放器

隨著直播行業的快速發展,RTSP和RTMP協議成為了廣泛使用的流媒體傳輸協議,尤其是在實時視頻直播領域,如何構建一個高性能超低延遲的直播播放器,已經成為了決定直播平臺成功與否的關鍵因素之一。作為音視頻直播SDK技術老兵&#xff…

UE5 編輯器工具藍圖

文章目錄 簡述使用方法樣例自動生成Actor,并根據模型的包圍盒設置Actor的大小批量修改場景中Actor的屬性,設置Actor的名字,設置Actor到指定的文件夾 簡述 使用編輯器工具好處是可以在非運行時可以對資源或場景做一些操作,例如自動…

解鎖5月游戲新體驗 高速電腦配置推薦

很多玩家用戶會發現一個規律,618大促前很多商家會提前解鎖各種福利,5月選購各種電腦配件有時候會更劃算!并且,STEAM在5月還有幾個年度主題促銷,“生物收集游戲節”、“僵尸大戰吸血鬼游戲節”等等,配件大促…

干貨|VR全景是什么?

VR全景技術解析:概念、特點與用途 VR全景,全稱為虛擬現實全景技術(Virtual Reality Panorama Technology),是基于虛擬現實(Virtual Reality,VR)技術的創新展示方式。VR全景技術利用專業的拍攝設…

Nacos適配GaussDB超詳細部署流程,通過二進制包、以及 Docker 打通用鏡像包部署保姆級教程

1部署openGauss 官方文檔下載 https://support.huaweicloud.com/download_gaussdb/index.html 社區地址 安裝包下載 本文主要是以部署輕量級為主要教程,系統為openEuler,ip: 192.168.1.15 1.1系統環境準備 操作系統選擇 系統AARCH64X86-64openEuler√√CentOS7√Docker…

MySQL 表內容的增刪查改 -- CRUD操作,聚合函數,group by 子句

目錄 1. Create 1.1 語法 1.2 單行數據 全列插入 1.3 多行數據 指定列插入 1.4 插入數據否則更新數據 1.5 替換 2. Retrieve 2.1 SELECT 列 2.1.1 全列查詢 2.1.2 指定列查詢 2.1.3 查詢字段為表達式 2.1.4 為查詢結果指定別名 2.1.5 結構去重 2.2 WHERE 條件 …

LabVIEW累加器標簽通道

主要展示了 Accumulator Tag 通道的使用,通過三個并行運行的循環模擬不同數值的多個隨機序列,分別以不同頻率向累加器寫入數值,右側循環每秒讀取累加器值,同時可切換查看每秒內每次事件的平均值,用于演示多線程數據交互…

【iOS】源碼閱讀(五)——類類的結構分析

文章目錄 前言類的分析類的本質objc_class 、objc_object和NSObjectobjc_object:所有對象的基類型objc_class:類的底層結構NSObject:面向用戶的根類 小結 指針內存偏移普通指針----值拷貝對象----指針拷貝或引用拷貝用數組指針引出----內存偏…

Baklib構建企業CMS高效協作與安全管控體系

企業CMS高效協作體系構建 基于智能工作流引擎的設計邏輯,現代企業內容管理系統通過預設多節點審核路徑與自動化任務分配機制,有效串聯市場、技術、法務等跨部門協作鏈路。系統支持多人同時編輯與版本追溯功能,結合細粒度權限管控模塊&#x…

Linux環境變量與地址空間

哈嘍,各位Linux初學者們!今天咱們來聊聊Linux中那兩個看起來很高大上但實際上跟我們日常使用息息相關的概念:環境變量和地址空間。別被這些術語嚇到,我會用最接地氣的方式給你解釋清楚! 一、環境變量:Linu…

Oracle SHARED POOL的SUB POOL技術

從Oracle 9i開始,SHARED POOL可以分為多個SUB POOL,其數量受以下幾個因素影響: ?系統CPU的數量。默認情況下,在Oracle中每4個CPU分配一個SUB POOL,最多不能超過7個。 ?共享池的大小。SUB POOL的最小容量隨著Oracle版…

Collection集合遍歷的三種方法

1.foreach循環遍歷 格式&#xff1a;for&#xff08;元素的數據類型 變量名&#xff1a;數組或集合&#xff09;{ } 2.使用迭代器遍歷 方法名稱&#xff1a;Iterator<E> iterator&#xff08;&#xff09; 說明&#xff1a;返回集合中的迭代器對象&#xff0c;該迭代…

頭歌之動手學人工智能-Pytorch 之autograd

目錄 第1關&#xff1a;Variable 任務描述 編程要求 測試說明 沒有偉大的愿望&#xff0c;就沒有偉大的天才。——巴爾扎克開始你的任務吧&#xff0c;祝你成功&#xff01; 第2關&#xff1a;Variable 屬性 任務描述 編程要求 測試說明 真正的科學家應當是個幻想家&a…

篇章二 數據結構——前置知識(二)

目錄 1. 包裝類 1.1 包裝類的概念 1.2 基本數據類型和對應的包裝類 1.3 裝箱和拆箱 1.4 自動裝箱和自動拆箱 1.5 練習 —— 面試題 2. 泛型 2.1 如果沒有泛型——會出現什么情況&#xff1f; 2.2 語法 2.3 裸類型 1.沒有寫<> 但是沒有報錯為什么&#xff1f; …

Git典型使用場景相關命令

Git典型使用場景相關命令 1 建立本地倉庫與遠程倉庫的聯系2 作為開發者參與項目的常用命令2-1 一般步驟2-2 **合并與同步主分支改動**2-3 **查看日志和差異**2-4 **提交后想修改或撤銷**2-5 分支管理2-6 清除未被追蹤的文件&#xff08;謹慎使用&#xff09; 3 作為遠程倉庫管理…

redis緩存-更新策略-三大緩存問題

緩存&#xff1a;數據交換的緩沖區&#xff0c;存儲的數據的臨時地方&#xff0c;讀寫性能較高。 步驟&#xff1a; 先從redis里面查詢 緩存命中&#xff1a;直接返回結果緩存未命中 從數據庫里面查詢 沒有數據&#xff1a;返回null有數據&#xff1a;存到redis里面&#xff…

[TriCore] 01.QEMU 虛擬化 TriCore 架構中的寄存器 指令

目錄 1.寄存器宏 - FIELD() 2.寄存器操作 - FIELD_SETTER() & FIELD_GETTER() 3.指令輔助方法 - HELPER() 3.1.輔助宏 3.2.指令示例 3.3.函數調用 4.PSW 寄存器讀寫 - psw_read() & psw_write() 1.寄存器宏 - FIELD() FIELD() 宏定義寄存器 MASK // include/hw…