網站的SEO以及它和站長工具的之間秘密

博客遷移沒有注意 URL 地址的變化,導致百度和 google 這兩只爬蟲引擎短時間內找不到路。近段時間研究了下國內最大搜索引擎百度和國際最大搜索引擎google的站長工具,說下感受。

  • 百度的站長工具地址:http://zhanzhang.baidu.com/dashboard/index
  • google 的站長工具地址:?https://www.google.com/webmasters/tools/home

最近墻的比較厲害,google 不一定能訪問進去(我平時用的?GreenVPN,還挺不錯的,速度快,支持的國家也多)。

站長工具的作用是為了輔助開發者,針對自己的網站做出更加合理的網頁布局和代碼優化,以便讓 spider 更好地理解網頁,從而將最準確的信息送達到用戶的熒屏上。它對搜索引擎和開發者是雙贏的。

Web 發展極快,由于客戶端廠商紛紜加之開發者沒把重點放在 web 標準上,直到 2014 年的 10 月底才有了統一的標準。用戶輸入關鍵詞,搜索引擎要在 0.1s 內將網絡上的資源匯聚起來,這個過程中計算的開銷、數據整合的開銷是極大的,如果我們開發的網頁不能讓 spider 準確理解,最后的結果就是,寫的東西很難出現在用戶面前。

搜索引擎對網頁的理解

摸索兩個站長工具,感觸最深的是結構化數據(Structured Data),結構化數據不是把文章段落分清楚、標題寫清楚,實際上你文章段落分的再清晰,爬蟲機器也不知道你在表達什么,所以數據結構化是給爬蟲看而不是給人看的。HTML 標簽的數量很有限,有限的幾個標簽沒辦法表達網頁上每一個元素的含義,比如一個小的圖標、一個廣告位、一個蒙層等,于是網頁上出現了很多 class 名、id 名來標記一個元素。這些內容的統一讓爬蟲理解的略微透徹了一些,比如:

.banner: 一張banner廣告位
.sidebar: 側邊導航欄
.nav: 主導航
.icon: 頁面小圖標
.post: 一篇文章
.post-title: 文章標題

在一個需要表達的塊上加上?itemscope?屬性和一個?itemtype?屬性,itemtype 是有固定值的,具體可以參閱?schema.org?的說明。然后在塊內添加詳細的說明,使用?itemprop?標注。整個操作十分簡單,略微麻煩的是需要對照 schema 的官方網站填寫規定的?itemprop字段。然而搜索引擎聚合的網頁太多,當這些五花八門的 class 出來之后,它又開始迷茫了,難以較好的聚合分類。所以出現一個叫做 Schema 的東西,它用來表示一個結構化數據結構,可以看下面一個 schema 示例:

<div itemscope itemtype="http://schema.org/Person">   <span itemprop="name">李靖</span>   <img src="http://barretlee.com/avatar.png" itemprop="image" />    <span itemprop="jobTitle">攻城師</span>   <div itemprop="address" itemscope itemtype="http://schema.org/PostalAddress">     <span itemprop="streetAddress">文一西路969號</span>     <span itemprop="addressLocality">浙江杭州</span><span itemprop="postalCode">310000</span>   </div>   <span itemprop="telephone">(0571) 123-4567</span>   <a href="mailto:barret.china@gmail.com" itemprop="email">barret.china@gmail.com</a>李靖的主頁:  <a href="http://barretlee.com" itemprop="url">barretlee.com</a>    
</div>

結構化數據,通常也可以稱之為元數據,這些數據附著在網頁文本信息內,厘清了頁面上每個部件的功能、屬性和意義。當機器進入網頁的時候,能夠像人一樣,一眼瞄出要表達的內容。關于 schema ,以前翻譯過一篇文章?SEO:讓搜索引擎對你的網站更有親和力。

SEO和站長工具的之間秘密

除非搜索引擎能夠猜到你要搜索的具體的 URL 地址,一般地,它都會從自己的數據索引庫中扒拉數據。對于權重高、更新頻率高、原創內容多的網站,搜索引擎會十分勤快的爬最新內容。那么,如何讓搜索引擎知道網站上有多少網頁便成了一件重要的事情。

我們經常會聽到一個叫做”網站地圖”的東西。有些網站會在自己的站點中添加一個頁面,這個頁面包括了整站的重要入口,那么這個頁面就是該頁面的網站地圖。這些地圖是給人看的,如果只想給爬蟲引擎看,可以將所有的鏈接按照一定的格式放到?sitemap.xml?文件中,然后把這個文件放到網站的根目錄下,如?http://www.barretlee.com/sitemap.xml。

而最重要的還是?robots.txt?這個文件,它是所有引擎約定俗成的一個文件,比如我的網站中用到的?http://www.barretlee.com/robots.txt?,其內容為:

Sitemap: http://www.barretlee.com/sitemap.xml
User-agent: *
Allow: /

SEO上,站長工具主要分為兩個方面,一個是對網頁的抓取,一個是對網頁的分析。它告訴搜索引擎,網站地址的位置、允許蜘蛛爬取的內容等,它是一個協議。最近,貌似還多了一個humans.txt,也是一個比較有意思的文件,可以在這里了解它:http://www.humanstxt.org.cn/,它可以描述一些站點和團隊的故事。

網頁的抓取在百度站長工具中體現的比較多,而網頁的分析,諸如數據標注、結構化數據等,百度做的還比較搓,目前還在內測階段,需要發送郵件才能申請權限。看到百度站長工具頁面上的幾個數據標注示意圖,揣測應該比 google 弱一百倍,所以我還是重點說說 google 的吧。

網頁的抓取

這塊上,兩個站長工具都是強調讓開發者把網站地圖顯式的暴露給搜索引擎,提供了各種分析網站地圖準確性合理性的工具,搜索引擎如果發現你的網站上一個地址時有時無,就會覺得你不可信有點飄渺。所以一旦網頁因為改造或遷移導致頁面鏈接丟失,可以在站長工具中填寫這些死鏈。

不要貪婪的讓搜索引擎不停的爬取你的網站,如果它多次過來發現內容是一樣的,它也會很傷心的離開。而如果它發現每次過來爬你的內容都能找到很有意思的、從來沒發現過的東西,它會對你越來越感興趣,甚至日久天長它會給你定型、定位,然后權重會越來越高。在站長工具上都是可以設置的。

網頁的分析

google 的數據化標記做的實在是太贊了!輸入網址,它會打開你的網頁,設置你要標記的類型,比如文章。選中頁面上的元素然后標記。比如選中文章的標題,選中之后有一個菜單,在菜單上選擇 title,選中作者名字,然后菜單上選擇 author,一個頁面標記完了之后,他會分析整站的所有頁面,如果結構相似,也會自動標記其他頁面。

整個標記完成之后,google 就知道你整個網站的信息架構了,下次要做的就是對這些信息內容做匹配和分類。所以我們可以看到,個人博客在 google 中的搜索是極其靠前的,因為頁面的信息結構簡單,即便你不去標記,它爬取多次之后也能自己理解。

對比百度和 google ,兩者如同屌絲和高富帥。不過高富帥總是要越墻才能看到,所以我平時使用的依然是百度分析。百度分析和百度站長工具還是不一樣的。百度對網頁流量的分析和搜索詞匯的分析還是挺精準,也很有參考價值。

小結

本文對 SEO 相關的東西做了一個簡要的概述,同時也概括了搜索引擎做的一些工作,知識量有限,難以面面俱到,如有錯誤還請斧正。




本文轉自Barret Lee博客園博客,原文鏈接:http://www.cnblogs.com/hustskyking/p/webmaster-in-baidu-and-google.html,如需轉載請自行聯系原作者

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/454459.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/454459.shtml
英文地址,請注明出處:http://en.pswp.cn/news/454459.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

html 縮略圖點擊預覽,[每天進步一點點~] uni-app 點擊圖片實現預覽圖片列表

點擊圖片&#xff0c;實現預覽圖片功能&#xff0c;并且可循環預覽圖片列表&#xff01;image.png一、多張圖片預覽html代碼js代碼data(){return {photos:[{ src: 圖片路徑1},{ src: 圖片路徑2},{ src: 圖片路徑3},……]}},methods: {// 預覽圖片previewImage(index) {let phot…

git ssh拉取代碼_阿里云搭建git服務器

一.搭建步驟&#xff0c;分為兩步搭建中心倉庫自動同步代碼到站點目錄二.詳細步驟如下1.先檢查一下服務器上有沒有安裝gitgit --version如果出現版本號&#xff0c;說明服務器已經安裝git&#xff0c;如圖所示&#xff1a;2.如果沒有版本信息&#xff0c;則先安裝git&#xff1…

Django REST framework 序列化

創建一個序列化類 使用序列化有四種方式 使用json模塊&#xff0c;完全手寫使用django自帶的序列化模塊 1&#xff0c;# from django.core import serializers 2&#xff0c;# dataserializers.serialize(“json”,book_list)使用REST framework 帶的序列化方法&#xff0c…

基于SIMD的AVS整數反變換算法設計與優化

基于SIMD 的AVS 整數反變換算法設計與優化王玲娟&#xff0c;張剛**作者簡介&#xff1a;王玲娟&#xff0c;&#xff08;1987-&#xff09;&#xff0c;女&#xff0c;在讀碩士&#xff0c;主要研究方向&#xff1a;視頻解碼算法通信聯系人&#xff1a;張剛&#xff0c;&#…

Word -- 列表重新編號

Word -- 列表重新編號office一言&#xff1a;我小心翼翼地灌溉&#xff0c;一日復一日地期待&#xff0c;那么費力&#xff0c;植成參天的喬木&#xff0c;豈愿見你終有一日從容赴死&#xff1f;問題 word 文檔早就想解決的一個問題&#xff0c;這次遇到了就上網找解決掉了&…

非持久連接和持久連接

非持久連接和持久連接 HTTP既可以使用非持久連接(nonpersistent connection)&#xff0c;也可以使用持久連接(persistent connection)。HTTP/1.0使用非持久連接&#xff0c;HTTP/1.1默認使用持久連接。 非持久連接 讓我們查看一下非持久連接情況下從服務器到客戶傳送一個Web頁面…

計算機開機鍵鼠無法識別,我得電腦一開機就檢測不到鍵盤和鼠標

2005-10-18 16:06:131、開機后當出現dos界面時&#xff0c;按一下pause鍵(這個鍵在四個方向鍵的上邊&#xff0c;仔細找就能找到)&#xff0c;如果計算機啟動停止&#xff0c;說明你的鍵盤起作用&#xff0c;主板在開機時就已經檢測到了鼠標鍵盤。啟動后不能使用鼠標鍵盤&#…

vs2003 局部友元訪問私有不可訪問_C++ 類:重載運算符與友元

18.類中重載運算符與友元上次節中學習了如何在類中重新定義賦值()運算符&#xff0c;實際上在一個自定義類中除了賦值()運算符外&#xff0c;類的對象是不可以直接使用運算符的&#xff0c;比如你在main函數中寫這樣的代碼會報錯&#xff1a;如果想解決這些報錯問題&#xff0c…

oracle sqlldr (一) 最基本語法

-- Create table create table DEPT2 (DEPTNO NUMBER(2) not null,DNAME VARCHAR2(14),LOC VARCHAR2(1000) ); alter table DEPT2add constraint DEPT_PK primary key (DEPTNO);------demo.ctl LOAD DATA INFILE * --數據在控制文件中 INTO TABLE DEPT2 INSERT ---默認加…

Django REST framework 視圖

上一部分代碼在序列化部分 類繼承順序 ############### mixins.py ################ # 類中調用的方法均在 GenericAPIView 類中實現&#xff0c;所以下列類需要結合 GenericAPIView 使用 class ListModelMixin(object) # 查看繼承類def list(self, reque…

AVS軟件解碼器的優化

AVS軟件解碼器的優化 董斌 , 姜昱明 (西安 電子科技大學計算機學院,陜西 西安,710071)) 摘 要: 主要研究了AVS標準的視頻壓縮部分,指出了影響解碼速度的瓶頸并提出了一種優化方案.使用從程序結構入手結合使用SIMD指令集的方案來優化AVS軟件解碼器.實驗結果表明優化方案可行并且…

IOS7.1.1真的像網上流傳的那么好?沒有任何問題么??

IOS7.1.1推送更新之后到處看到網上說711好的~~ 那么IOS7.1.1真的像網上現在流傳的那么好么&#xff1f; 其實不然&#xff0c;IOS7.1.1目前眾多網友反映說升級ios7.1.1之后APPstore連接不上了&#xff0c;提示無法連接到APPstore。 這個問題也不難解決~還是之前的老辦法~ 那么今…

三校生計算機對口本科有哪些學校,寶山三校生五月對口高考報名

多次復習生活不可能像你想象得那么好&#xff0c;但也不會像你想象得那么糟。我覺得人的脆弱和堅強都超乎自己的想象。多種方式結合起來復習單一的復習方法&#xff0c;易產生消極情緒和疲勞&#xff0c;如果采用交談復習法、討論復習法、自我檢查復習法多樣化的復習方法&#…

localhost 已拒絕連接_【Python】MongoDB數據庫的連接和操作

安裝Python 要連接 MongoDB 需要 MongoDB 驅動。pip安裝&#xff1a;python3 -m pip3 install pymongo創建數據庫import pymongo myclient pymongo.MongoClient("mongodb://localhost:27017/")mydb myclient["loaderman"]注意: 在 MongoDB 中&#xff0c…

checkbox已設置為checked--true-但不勾選問題解決方法(只第一次勾選有效)

一、出現的問題及解決方法&#xff1a; 今天在寫一個table相關插件的時候無意中發現了這樣一個問題&#xff0c;記得以前在寫這種控制checkbox選中與非選中的代碼時并沒有這種bug&#xff0c;當時也是用的checked屬性&#xff0c;而現在卻行不通了。 于是乎做了以下測試&#x…

Python 錯誤和異常小結[轉]

原文鏈接 http://blog.csdn.net/sinchb/article/details/8392827 事先說明哦&#xff0c;這不是一篇關于Python異常的全面介紹的文章&#xff0c;這只是在學習Python異常后的一篇筆記式的記錄和小結性質的文章。什么&#xff1f;你還不知道什么是異常&#xff0c;額... 1.Py…

Django REST framework 認證、權限和頻率組件

認證與權限頻率組件 身份驗證是將傳入請求與一組標識憑據&#xff08;例如請求來自的用戶或其簽名的令牌&#xff09;相關聯的機制。然后 權限 和 限制 組件決定是否拒絕這個請求。 簡單來說就是&#xff1a; 認證確定了你是誰權限確定你能不能訪問某個接口限制確定你訪問某…

高速率AVS整數變換的匯編實現與優化

1 引言 AVS標準Ⅲ采用的8x8整數變換在獲得較H&#xff0e;264更高的壓縮率和主觀圖像質量的同時&#xff0c;增加了算法的實現復雜性和時間開銷。本文重點研究AVS編解碼器的整數變換模塊&#xff0c;針對不同的算法實現模式&#xff0c;在原有Visual C6&#xff0e;0整數變換模…

計算機與廣播電視論文,淺談廣播電視中計算機技術的作用論文.pdf

1、計算機技術在廣播電視的媒體內容中有重要應用在以往的廣播電視中&#xff0c; 媒體內容主要分為音頻和視頻兩種信號&#xff0c; 在傳輸的過程中使用的是模擬信號&#xff0c; 但模擬信號受到的外界干擾因素較為明顯&#xff0c; 因此廣播電視傳播的媒體內容受到影響&#x…

opencv安裝教程python3.7_Mac下安裝使用Python-OpenCV,解決opencv3安裝完成無法使用的問題 - pytorch中文網...

OpenCV是一個跨平臺計算機視覺庫&#xff0c;可以運行在Linux、Windows、Android和Mac OS操作系統上。提供了Python、Ruby、MATLAB等語言的接口&#xff0c;實現了圖像處理和計算機視覺方面的很多通用算法。 Mac安裝OpenCV 在我們的深度學習的過程中&#xff0c;對于圖像&#…