教你創建Google網站地圖Sitemap.xml(轉)

http://teachmyself.blog.163.com/blog/static/18881422920119895248288/

??? Sitemap.xml是 google搞出來的,也就是網站地圖,不過這個網站地圖是用xml寫的,而且要按google的標準來寫,并且要將寫出來的這個文件 sitemap.xml上傳到自己的服務器空間中去。目前,Google, Yahoo, MSN都已經聲明支持這種格式,Baidu還沒有聲明支持,但估計走這一步也是大勢所趨。這將是向眾多搜索引擎提供你網站信息的一種很好的方法。

   提交sitemap一是有利于搜索抓取一些正常抓取過程中無法抓取的網址,比如動態網頁,包含大量AJAX的網頁或者flash的頁面。二是為搜索蜘蛛 指明“工作方向”。Sitemap就是你網站上頁面的列表,googlebot就按照這個去一個個的抓取收錄頁面,顯然比它自己去找會效率高,而且要全。 Google網站上有完整的關于sitemap.xml的詳細說明:

  http://www.google.com/support/webmasters/bin/answer.py?answer=40318&hl=zh_CN

  但很多站長看后仍然不會操作,下面這個教程就是手把手教會你創建Sitemap.xml。

1.?????????Sitemap.XML?的格式

完整格式如下:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" ><url><loc>http://www.yrtrip.com/default.asp</loc><lastmod>2008-07-17</lastmod><changefreq>daily</changefreq><priority>1.0</priority></url><url><loc> http://www.yrtrip.com/search2.asp?id=32003044&amp;sq=1</loc><lastmod>2008-07-17</lastmod><changefreq>weekly</changefreq><priority>0.9</priority></url>……
</urlset>

?

下面,對以上標簽分別加以解釋

??? a)???????<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

這兩行就相當于網頁文件中的<html>標簽一樣的作用。不必管這兩行什么意思,照抄即可。

切記:一個字符也不能錯,即使多一個空格,google網站采集時也會報錯。另外,千萬別忘了在文件的末尾加上</urlset>標簽。

  b) url:每個標簽包含一個網頁地址,是以下標簽的父標簽。

  c) http://www.yrtrip.com/default.asp

  這里是頁面鏈接地址,也就是你希望蜘蛛訪問的地址。

   切記:在地址中出現的某些特殊字符需要使用轉義字符,否則,google也會報錯。最典型的就是 & 號,經常在動態網址中出現,在提交地址中必須寫成 & 如:提交http://www.yrtrip.com/search2.asp?id=32003044&sq=1,google管理員工具就會 報錯,而改為 http://www.yrtrip.com/search2.asp?id=32003044&sq=1提交后就沒有問題了。我看到網上有人說 sitemap.xml只能提交一個參數的網頁的說法,其實多半是因為沒有使用轉義字符而導致出錯的。其他的轉義字符就不一一列出了,大家可以在網上查。

  d) lastmod:頁面最后修改時間

   這個很重要。Google的機器人會在索引此鏈接前先和上次索引記錄的最后更新時間進行 比較,如果時間一樣就會跳過不再索引。所以如果你的鏈接內容基于上次Google索引時的內容有所改變,應該更新該時間,讓Google下次索引時會重新 對該鏈接內容進行分析和提取關鍵字。這里必須用ISO 8601中指定的時間格式進行描述,格式化的時間格式如下:

  •   年:YYYY(2008)
  •   年和月:YYYY-MM(2008-06)
  •   年月日:YYYY-MM-DD(2008-06-04)
  •   年月日小時分鐘:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37+08:00)
  •   年月日小時分鐘秒:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37:30+08:00)

  這里需注意的是TZD,TZD指定就是本地時間區域標記,像中國就是+08:00了

  切記:其他格式可能引起出錯,比如將2008-08-08 寫成2008-8-8就會出問題。

  e) changefreq:頁面內容更新頻率。

  這里可以用來描述的單詞共這幾個:"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。

  f) priority:相對于其他頁面的優先權

  定于0.0 - 1.0之間 。

  切記:建議將各類網頁根據重要性給出不同的數值,以方便蜘蛛的采集,不要耍小聰明全部寫1.0,google管理工具會報錯的。

  2. Sitemap.xml制作方式

  制作方式無非兩種,自動方式和手動方式。

  自動方式一般使用生成工具自動生成,只需輸入自己的網址,就可以得到完整的xml文件。這種方式一般適用于靜態網站,在此不再贅述。但需要提醒的是,網上的工具良莠不齊,生成的文件經常有錯誤,不一定能通過google的校驗,使用者需認真辨別。

  手工方式則是由站長手工填寫或寫程序完成均可,代碼很簡單,大家可以到網上查找。

  3. 提交

  Sitemap.xml制作完成后,就需要將xml文件提交到相關搜索引擎。

  Google提交網址:http://www.google.com/webmasters/sitemaps/?hl=zh-CN

  Yahoo提交網址:http://sitemap.cn.yahoo.com/

  提交后,一般在幾個小時之內,系統就開始下載處理了。

  4. Sitemap.xml的校驗

  至于你的網站地圖是否符合標準,最方便的手段就是使用google的管理員工具了。

   在他下載你的sitemap.xml后幾天內,這個工具就會將詳細的分析結果反饋回來,包括:sitemap.xml中包含了多少地址,google已 將多少地址加入索引,sitemap.xml中出現了哪些錯誤,甚至蜘蛛采集過程中遇到的各種問題,比如哪些網頁有404,500錯誤都會詳細的羅列出 來,非常方便。

  如果你提交的xml文件一切無誤,那么接下來,你就是等著讓它的搜索蜘蛛來爬了,sitemap的文件告知了文件更新的頻率,這樣搜索蜘蛛來得更勤快,頁面被收錄當然也就更快。

  5分半鐘:Google網站地圖 Sitemap.xml

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/280810.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/280810.shtml
英文地址,請注明出處:http://en.pswp.cn/news/280810.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Oracle存儲過程語法

創建基本的存儲過程 1 CREATE OR REPLACE PROCEDURE MyProName IS 2 BEGIN 3 NULL; 4 END; 行1:CREATE OR REPLACE PROCEDURE 是一個SQL語句通知Oracle數據庫去創建一個叫做skeleton存儲過程, 如果存在就覆蓋它; 行2:IS關鍵詞表明后面將跟隨一個PL/SQL體。 行3:BEGIN關鍵詞表…

WPF-16 圖形處理

我們這節主要介紹WPF常用畫圖標簽&#xff0c;由于WPF圖形處理設計大量篇幅 ,我們在這里拋磚引玉&#xff0c;具體更多的學習資料鏈接https://github.com/microsoft/WPF-Samples/tree/master/Graphics 該鏈接中微軟提供了大量的學習Demo&#xff0c;WPF圖形處理最大的區別在于…

powershell 文件/文件夾操作

新建文件夾 New-Item -ItemType Directory -Force -Path $TargetPath復制文件夾到另外文件夾 Copy-Item <源文件夾> <新文件夾> -recurse -force 復制文件&#xff08;與修改文件名&#xff09; // 達到復制文件到新文件夾&#xff0c;及修改文件名效果 copy-…

純CSS制作各種各樣的網頁圖標(三角形、暫停按鈕、下載箭頭、加號等)

三角形 <div class"box"></div> <style>.box{ width: 0;height: 0;border-top: 50px solid transparent;border-bottom: 50px solid transparent;border-left: 50px solid transparent;border-right: 50px solid red; } </style> 平行四邊形…

您的MyFitnessPal帳戶幾乎肯定已被黑客入侵,請立即更改密碼

If you’re one of the millions of the 150 million MyFitnessPal users, bad news: hackers have your email address, your user name, and your hashed password. 如果您是1.5億MyFitnessPal用戶中的數百萬用戶之一&#xff0c;那么這是個壞消息&#xff1a;黑客擁有您的電…

Oracle Grid 11.2.0.4 安裝是出現INS-30510: Insufficient number of ASM disks selected.

最新文章&#xff1a;Virsons Blog 錯誤的原因是由于磁盤數和冗余層級不匹配&#xff1a; 如果創建用來存放OCR和VOTEDISK的ASM磁盤組&#xff0c;那么External、Normal、High三種冗余級別對應的Failgroup個數是1、3、5。也就是說&#xff0c;創建這三種冗余級別的磁盤組至少分…

動態編譯庫 Natasha 5.0 版本發布

動態編譯庫 Natasha 5.0 于十月份發布&#xff0c;此次大版本更新帶來了強大的兼容性支持&#xff0c;目前 Natasha 已支持 .NET Standard 2.0 及 .NET Core 3.1 以上版本&#xff08;包括 .NET Framework&#xff09;了。引入項目NuGet\Install-Package DotNetCore.Natasha.CS…

著名軟件公司的java筆試算法題!(含參考答案)

原題如下&#xff1a;用1、2、2、3、4、5這六個數字&#xff0c;用java寫一個main函數&#xff0c;打印出所有不同的排列&#xff0c;如&#xff1a;512234、412345等&#xff0c;要求&#xff1a;"4"不能在第三位&#xff0c;"3"與"5"不能相連.…

django08: 視圖與路由(舊筆記)

視圖&#xff08;Views&#xff09; https://www.cnblogs.com/liwenzhou/articles/8305104.html 1.CBV和FBV 2.?????上傳文件示例 路由 https://www.cnblogs.com/liwenzhou/p/8271147.html 1.url正則表達 2.分組命名匹配&#xff08;參數&#xff09; 3.反向解析 …

【BZOJ1042】硬幣購物(動態規劃,容斥原理)

【BZOJ1042】硬幣購物&#xff08;動態規劃&#xff0c;容斥原理&#xff09; 題面 BZOJ Description 硬幣購物一共有4種硬幣。面值分別為c1,c2,c3,c4。某人去商店買東西&#xff0c;去了tot次。每次帶di枚ci硬幣&#xff0c;買s i的價值的東西。請問每次有多少種付款方法。 In…

ios 啟用 證書_如何在iOS 10中啟用就寢提醒,輕柔的喚醒和睡眠跟蹤

ios 啟用 證書If you have trouble regularly getting a full night’s sleep, the new Bedtime feature in iOS 10 might just help. Set a wake up time and how many hours of sleep you need, and iOS offers bedtime reminders, more gentle alarms, and basic sleep trac…

struts OGNL表達式

OGNLContext對象有兩部分構成 一部分是ROOT&#xff1a;可以放置任何對象作為ROOT 另外一部分Context&#xff1a;必須是Map形式&#xff08;鍵值對&#xff09; OGNL表達式操作 package cn.future.a_ognl;import java.util.HashMap; import java.util.Map;import ognl.Ognl; i…

纖程(FIBER)

Indy 10 還包含對纖程的支持。纖程是什么&#xff1f;簡單來說&#xff0c;它也是 一個“線程”&#xff0c;但是它是由代碼控制的&#xff0c;而不是由操作系統控制的。實際上&#xff0c;可以認為線程 是一個高級纖程。纖程和 Unix 用戶線程(Unix user threads)很相似。 線程…

制作一個用戶頭像選擇器仿 WeGame

制作一個用戶頭像選擇器仿 WeGameCropAvatar作者&#xff1a;WPFDevelopersOrg - 驚鏵原文鏈接&#xff1a;https://github.com/WPFDevelopersOrg/WPFDevelopers框架使用.NET40&#xff1b;Visual Studio 2019;制作一個用戶頭像選擇Canvas為父控件所實現&#xff0c;展示圖片使…

PS2019進階筆記(二)

云端網校筆記&#xff08;PS2015&#xff09; 一、圖層混合模式 圖層面板上的左上角&#xff0c;默認正常 混合下面圖層&#xff0c;下面正片&#xff08;如模特&#xff09;。 最常用是&#xff1a;不透明度 溶解&#xff1a;需調節透明度 變暗組&#xff1a; 亮區域去除…

Html5里frameSet不在使用的替代方法,使用ifram

原來得使用方式&#xff1a; <frameset rows"100,*" frameborder"0"><frame name"header" src"header.aspx"></frame><frameset cols"15%, *"><frame name"menu" src"left.aspx&…

網曝南方電網搞末位淘汰和裁員,給各下屬單位強制規定辭退率和降崗降級率!...

電網作為壟斷性國企&#xff0c;在人們心中一向是好單位的代名詞&#xff0c;但最近卻有網友曝光南方電網搞末位淘汰和裁員&#xff0c;給各單位下了辭退率和降崗降級率&#xff0c;每個單位都要開除一部分人&#xff0c;或者把一部分人崗級降下來。有南方電網員工馬上跑出來辟…

二維數組中的查找

2019獨角獸企業重金招聘Python工程師標準>>> 題目 在一個二維數組中&#xff0c;每一行中的數都按照從左到右、從上到下的遞增順序排列。要求輸入一個整數&#xff0c;判斷數組中是否存在該整數 實現代碼 function find($matrix, $rows, $columns, $key) {//TODO 參…

C# JObject轉換JSON文件相關處理

一、JObject.Parse 1.把整個json文件字符串轉化成JObject格式。 JObject jsonData JObject.Parse(jsonString); 2.逐級轉換成JObject 最低級是"Device": "Windowsr"&#xff0c;字典。 jsonData JObject.Parse(jsonData[jsonName][jsonIndex].ToStr…

通過修改然后commit的方式創建自己的鏡像

創建自己的鏡像&#xff1a;通過現有的鏡像來創建自己的鏡像。1、首先拉取一個鏡像到本地$ sudo docker imagesREPOSITORY TAG IMAGE ID CREATED SIZEubuntu 12.04 5b117edd0b76 11 months…