大家好,我是白楊SEO,專注SEO十年以上,全網SEO流量實戰派,AI搜索優化研究者。
在開始寫之前,先說個抱歉。
上周在上海客戶以及線下聚會AI搜索優化分享說各大AI模型的聯網搜索是關閉的,最開始上來確實是的。但這幾天我去看,有些聯網搜索默認是開啟了,所以說下抱歉,如圖。
白楊SEO的關注朋友,也可以去打開看看是不是這樣?可以給我留言。
有些朋友可能會說,DeepSeek、豆包、Kimi、百度文心一言、騰訊元寶、通義、智譜、天工等AI大模型默認開不開啟聯網搜索有什么差別呢?
白楊SEO想說,這個差別大著呢。
我們做AI搜索優化,或者說叫GEO,如果不是聯網搜索的情況下,我們很難快速優化進AI大模型結果里。因為AI大模型訓練間隔比較久,而且費用也不便宜,要想了解實時性的東西,所以他們只要有,都加上了聯網搜索功能。
而對于AI大模型的用戶而言,他不可能在提問之前,先去打開聯網搜索之類(只有少部分專業的人會去這么做)。
就像我們說做百度、抖音或微信搜一搜關鍵詞搜索排名一樣,用戶默認會看全部排名,很少去點具體某個垂直下面結果一樣,如圖:
哈哈哈,看上圖,才發現,微信搜一搜直接也把【AI搜索】放在TAG上了,你們看下有沒有?
好,我們繼續。
正因為大模型如果從原來不是默認開啟聯網搜索到現在默認開啟,那么我們做AISEO即AI搜索優化,不管是做品牌曝光還是引流量還是營銷,都有機會了是不是?當然,比如像通義現在還是默認沒開啟哈~
為什么今天想到分享要說下DeepSeek、豆包、Kimi、百度文心一言、騰訊元寶、通義、智譜、天工等AI生成內容信息采集主要來自哪這個事呢?
一是因為之前我在另外公號分享過《豆包、kimi、deepseek、百度文心一言、騰訊元寶等大模型它們生成內容的引用來源是哪?》這篇后很多人說感興趣。
二是因為這次去上海做AI搜索優化(GEO)線下培訓分享時,有分享了主流的DeepSeek、豆包、Kimi、百度文心一言的內容信息采集來源占比圖,當然這只是某個行業的個例,其它可以再測。如圖,
我在想不管是做AI搜索優化這行的轉行的SEO或者其它行業同行,又或者是想做AI搜索優化的企業,他們是不是都想知道呢,這樣更好做好AI搜索優化(GEO)。
所以,除了DeepSeek、豆包、Kimi、百度文心一言,我還加了騰訊元寶,通義(原通義千問,改名縮短了,PC和APP一致),智譜(智譜清言簡稱),天工(AI搜索引擎工具)等AI生成內容的。
好,我們就一個一個來說一下。
1、DeepSeek AI生成內容信息采集主要來源及占比參考
DeepSeek AI生成內容信息采集主要來源,按照DeepSeek自己的說法是開源數據(MIT協議允許自由使用)、強化學習生成數據、少量標注數據。
你可能沒懂,簡單說就是互聯網上的內容以及它自己再生成的,以及非常少的標注的。但我們能優化的是開源數據。這個主要來源,來自白楊SEO朋友公司客戶案例統計如圖(他們的業務介紹PPT)
從上圖看到主要來源是媒體,這個媒體主要指四大門戶以及各種地方網站那種新聞媒體哈。占比第二的UGC平臺比如知乎等也很大。第三則是搜索詞官網或垂直網站。至于電商這個說一下,因為是行業不同,有些沒有這個哈。
所以我們得出結論,要做好DeepSeek的AI搜索優化,主要做好媒體、UGC為主就可以了,當然官網也要發。具體怎么布局SEO搜索關鍵詞之類,看我公眾號歷史文章有寫哈,后續也會慢慢分享出來,不在本文討論。
2、豆包 AI生成內容信息采集主要來源及占比參考
如圖,豆包主要信息采集來源是字節系自己產品(抖音短視頻,抖音百科,頭條等),另外就是新聞媒體上發的,第三則是官網及其它。占比如圖,這里不再詳說了。這個也是某個行業哈,其它你可以搜索自己試試。
3、Kimi AI生成內容信息采集主要來源及占比參考
如圖,KIMI有意思,70%的內容來源UGC,尤其你看那個知乎占比很大啊,哈哈哈。
為什么呢,你像kimi這類AI大模型平臺,跟deepseek一樣,他們是沒有像百度、騰訊,抖音有自己內容生態源哈。話說回來,知乎也是一個知識寶庫呢,哈哈哈。
雖然知乎也有自己的AI大模型【知乎直答】如圖,但它的影響力,就如知乎在當下互聯網的現狀一樣,有心無力的,可能比某度還尷尬,唉。
4、百度AI搜索、文心一言 AI生成內容信息采集主要來源及占比參考
百度AI搜索、文心一言,其實這是兩個渠道。文心一言是百度AI大模型產品,有網頁版,也有APP,APP叫文小言。而百度AI搜索是百度搜索里面AI搜索。雖然跟文心一言模型一致,同時還結合了deepseek的哈,如圖。
所以參考百度文心一言的,其實是一樣的。主要內容及來源占比如圖,參考
所以如果我們要做百度AI搜索或文心一言,主要做百度產品,比如百家號,百科,以及像新媒發軟文,以及垂直官網等就可以了。
5、騰訊元寶 AI生成內容信息采集主要來源及占比參考
騰訊元寶AI生成內容信息采集主要來源就是微信生態內容,如公眾號文章,視頻號內容等,再加上其它新聞媒體,網站內容等,如圖。
如果說占比的話,公眾號文章占比應該要到50%左右哈。
如果想知道在元寶或微信搜一搜里這個詞流量大概有多少,可以看微信指數或騰訊廣告里數據,相關看這兩篇:
白楊SEO:想做微信搜一搜精準流量,你真正看懂微信指數了嗎?
白楊SEO:工具推薦第十七期—搜一搜關鍵詞搜索流量查詢工具騰訊廣告
6、通義(通義千問)、夸克AI生成內容信息采集主要來源及占比參考
如圖,通義AI生成內容信息采集主要來源是各大新聞媒體平臺(包含自媒體)比如網易號,騰訊企鵝號,搜狐網,新浪財經等,這類占比60%以上,其它就是官網之類。
當然,如果你搜索不同的詞,比如電商類的之類,會來自一些垂直網站,比如站長之家,什么值得買等。當然,大多數還是阿里生態內數據,最近主要在增加這塊,比如夸克搜索等。
當然,夸克那個AI跟通義邏輯一樣,大家也要重點關注哦,它可能是國內目前AI搜索領域訪問量TOP哦,如圖。
7、智譜清言 AI生成內容信息采集主要來源及占比參考
智譜數據來源開源模型(如ChatGLM)、合作企業數據(如金融、政務領域)。占比推測:開源數據占40%,合作數據占50%等。如圖,
除了合作的以外,另外就是一些第三方自媒體平臺。因為智譜在國內AI大模型C端用戶認知里不大,所以很多企業沒有關注,正常。比如拿你來說,你手機里有下這個APP嗎?
8、天工AI AI生成內容信息采集主要來源及占比參考
這個天工AI也是一樣,白楊SEO里很多粉絲朋友可能第一次聽說它吧?哈哈哈。它默認是聯網的哈,如圖。
話說它這整個智能體,沒有積分還用不了,當然新用戶還會送,這樣它這個和之前爆火的manus有點像,不再是純聊天大模型,更像是可以做任務的智能體了,你簡單理解就是比大模型還進一步了。
當然這個渠道,以及智能體這種,我們后面再先。如果感興趣看我之前寫過《白楊SEO:一文告訴你智能體Agent是什么、有哪些、用在哪里、哪個好用及搭建流程【收藏】》參考。
今天這篇又快三千字了,希望看完對你做AI搜索優化或者GEO優化有一定幫助。如果你覺得這個分享有價值,請繼續關注我,或者分享需要朋友,謝謝。
作者介紹:
白楊SEO,專注SEO研究十年+,全網SEO流量實戰派,ai搜索優化研究者。前某公司市場總監,現自由職業,企業顧問。