【谷歌 SEO】排查頁面未索引問題：原因與解決方案

你在谷歌網站SEO優化時是否遇到以下情況？

為什么，即使我已經正確地編寫了站點地圖并將其鏈接到客戶的網站，并且我已經檢查了所有內容，但我是否在某些文章（不是所有文章）上遇到索引問題，即使在向 Google 和 Google Search Console 重復請求之后也是如此。

接下來我們跟著這個疑問來進行分析出現這種情況是什么情況導致以及我們如何來做優化。

它肯定沒有索引嗎？

首先要檢查的是頁面是否真的沒有被索引，或者只是排名不好。

可能是該頁面顯示未編入索引，因為您找不到您認為的相關關鍵字的頁面。但是，這并不意味著它沒有索引。

出于這個問題的目的，我將就如何處理這兩種情況提供建議。

可能是什么問題？

頁面可能未被 Google 編入索引或未在 Google 上排名靠前的原因有很多。讓我們討論一下主要的。

技術問題

由于技術原因，包括錯誤和有意識的決定，可能會阻止 Googlebot 訪問您的網頁并將其編入索引。

機器人被阻止在 robots.txt 中

谷歌需要能夠訪問頁面的內容，才能理解該頁面的價值，并最終將其作為相關查詢的搜索結果呈現。

如果谷歌爬蟲（Googlebot）通過 robots.txt 文件被阻止訪問這些頁面，這可能就是它未對這些頁面進行索引的原因。

從技術上講，它仍然可以索引無法訪問的頁面，但無法確定頁面的內容，因此必須依賴外部信號（如反向鏈接）來判斷其相關性。

如果無法爬取頁面，即使通過站點地圖知道該頁面存在，它仍會降低該頁面排名的可能性。

頁面無法呈現

以類似的方式，如果機器人可以爬網頁面但無法呈現內容，它可能會選擇不為它編制索引。它肯定不太可能對頁面進行很好的排名，因為它無法讀取頁面的內容。

頁面有無索引標簽

一個明顯但經常被忽視的問題是 noindex 標簽已應用于頁面。這實際上會指示 Googlebot 不要將頁面編入索引。

這是一項指令，即 Googlebot 致力于頒布的指令。

服務器級機器人阻止

您的服務器級別可能存在問題，導致 Googlebot 無法抓取您的網頁。

很可能在您的服務器或 CDN 級別設置了規則，導致 Googlebot 無法再次抓取您的網站并發現這些新網頁。

當不精通 SEO 的團隊負責網站的技術維護時，這可能是一個非常普遍的問題。

非 200 服務器響應代碼

您添加到站點地圖的頁面很可能會返回一個服務器狀態代碼，這會讓 Googlebot 感到困惑。

例如，如果某個網頁返回 4XX 代碼，盡管您能夠看到該網頁上的內容，但 Googlebot 可能會確定該網頁不是實時網頁，因此不會將其編入索引。

加載緩慢頁面

可能是您的網頁加載速度非常慢。因此，對其質量的感知可能會降低。

也可能是它們加載時間太長，以至于機器人不得不優先考慮它們抓取的頁面，以至于您的新頁面無法被抓取。

頁面質量

網站本身的內容也存在問題，可能會阻止頁面被索引。

低內部鏈接表明低價值頁面

Google 確定某個頁面是否值得排名靠前的方法之一是通過指向該頁面的內部鏈接。您網站上頁面之間的鏈接既可以表示所鏈接到的頁面的內容，也可以表示該頁面是否是您網站的重要組成部分。內部鏈接很少的頁面可能看起來不夠有價值，無法排名靠前。

頁面不會增加價值

頁面未被 Google 索引的主要原因之一是它被認為質量不夠高。

谷歌不會盡可能抓取和索引每個頁面。谷歌將優先考慮獨特、引人入勝的內容。

如果您的頁面很薄，或者沒有真正為互聯網增加價值，那么它們可能不會被索引，即使它們在技術上可以被索引。

它們是重復的或接近重復的

同樣，如果 Google 認為您的頁面與現有頁面完全相同或非常接近重復版本，它很可能不會為您的新頁面編制索引。

即使您已通過將網頁包含在 XML 站點地圖中并使用自引用規范標簽來表明該網頁是唯一的，Google 仍會自行評估某個網頁是否值得編入索引。

手動操作

您的網頁也可能因受到人工干預而未被谷歌收錄。

例如，如果您試圖讓谷歌索引的頁面被其視為“內容薄弱的聯盟頁面”，您可能無法為這些頁面獲得排名，因為它們可能受到了人工處罰。

人工干預相對罕見，通常會影響整個網站的更廣泛區域，但建議您查看搜索控制臺的“人工干預報告”以排除這一可能性。

確定問題

了解問題的原因只是成功的一半。讓我們看看如何縮小問題范圍，然后如何解決它。

檢查 Bing 網站管理員工具

我的第一個建議是檢查您的頁面是否在 Bing 中編入索引。

您可能在 SEO 策略中不太關注 Bing，但這是一種快速確定這是否是以 Google 為中心的問題，例如手動作或排名不佳，而不是您網站上阻止頁面被索引的內容。

轉到 Bing 網站管理員工具并在其 URL 檢查工具中輸入頁面。從這里，您將看到 Bing 是否正在為頁面編入索引。如果是，那么您就知道這只會影響 Google。

查看 Google Search Console 的“頁面”報告

接下來，轉到 Google Search Console。檢查頁面，看看它是否真的被標記為未編入索引。如果它沒有被索引，谷歌應該解釋原因。

例如，頁面可能是：

被“Noindex”排除

如果 Google 在網頁上檢測到 noindex 標記，則不會將其編入索引。在網址檢查工具結果下，它會告訴您“網頁未編入索引：被’noindex’標簽排除”

如果您的網頁得到此結果，下一步就是移除 noindex 標記，然后重新提交要由 Googlebot 抓取的網頁。

Discovered – Currently Not Indexed

檢查工具可能會告訴您“page is not indexed: Currently not indexed”。

如果是這種情況，您肯定知道這是一個索引問題，而不是排名不佳的問題，它導致您的頁面沒有出現在 Google 搜索中。

谷歌解釋說，顯示為“Discovered – Currently Not Indexed”的 URL 是：

“The page was found by Google, but not crawled yet. Typically, Google wanted to crawl the URL but this was expected to overload the site; therefore Google rescheduled the crawl. This is why the last crawl date is empty on the report.”

如果您看到此狀態，則 Google 很可能已經查看了您網站上的其他頁面，并認為它們不值得添加到索引中，因此，它不會花費資源抓取它所知道的這些其他頁面，因為它希望它們的質量很低。

要解決此問題，您需要表明網頁的質量以及與 Googlebot 的相關性。是時候批判性地審視您的網站并確定 Google 是否認為您的頁面質量低的原因了。

Crawled – Currently Not Indexed

如果您檢查的網頁返回“Crawled – Currently Not Indexed”狀態，則表示 Google 知道該網頁，已抓取該網頁，但認為將其添加到索引中沒有價值。

如果您收到此狀態代碼，您最好尋找提高頁面質量的方法。

重復，Google 選擇的規范與用戶不同

您可能會看到已檢查的網頁的提醒，告知您此網頁是“重復，Google 選擇的規范與用戶不同”。

這意味著它會將 URL 視為現有頁面的緊密重復項，并且它選擇要在 SERP 中顯示的另一個頁面而不是被檢查的頁面，盡管您已經正確設置了規范標簽。

鼓勵 Google 在 SERP 中顯示這兩個頁面的方法是確保它們是唯一的，有足夠的內容，以便對讀者有用。

從本質上講，您需要給 Google 一個將這兩個頁面都編入索引的理由。

解決問題

盡管您的頁面可能由于一種或多種原因而未被索引，但修復方法都非常相似。

網站可能存在技術問題，例如錯誤的規范標簽或robots.txt塊，導致無法正確抓取和索引頁面。

或者，頁面的質量存在問題，這導致 Google 認為它沒有足夠的價值來編入索引。

首先查看潛在的技術原因。這些將幫助您快速確定這是否是您或您的開發人員可以更改的“快速”修復程序。

一旦排除了技術問題，您很可能正在關注質量問題。

根據您現在認為導致頁面未出現在 SERP 中的原因，可能是頁面本身存在質量問題，或者您網站的大部分存在質量問題。

如果是前者，請考慮 E-E-A-T、頁面在互聯網范圍內的獨特性，以及如何表示頁面的重要性，例如通過相關的反向鏈接。

如果是后者，您可能希望運行內容審核，以幫助您縮小提高整個網站質量的整體感知的方法。

總結

需要進行一些調查來確定您的頁面是否真的沒有被索引，或者 Google 是否只是選擇不對您認為相關的查詢進行高排名。

一旦確定了這一點，您就可以開始了解影響您的頁面的是技術問題還是質量問題。

這是一個令人沮喪的問題，但修復是非常合乎邏輯的，調查應該有望揭示更多改進網站抓取和索引的方法。