當(dāng)前位置 : 首頁>軟件學(xué)院>程序開發(fā)>網(wǎng)頁設(shè)計(jì)>正文

網(wǎng)站優(yōu)化教程:對robots.txt的優(yōu)化

http://www.yibo1263.com　2010/5/7 7:18:21 　來源:東北IT網(wǎng) 　編輯:葉子

首先，我來介紹一下什么是robots.txt：robots.txt是搜索引擎中訪問網(wǎng)站的時(shí)候要查看的第一個(gè)文件。Robots.txt文件告訴蜘蛛程序在服務(wù)器上什么文件是可以被查看的。當(dāng)一個(gè)搜索蜘蛛訪問一個(gè)站點(diǎn)時(shí)，它會首先檢查該站點(diǎn)根目錄下是否存在robots.txt，如果存在，搜索機(jī)器人就會按照該文件中的內(nèi)容來確定訪問的范圍；如果該文件不存在，所有的搜索蜘蛛將能夠訪問網(wǎng)站上所有沒有被口令保護(hù)的頁面。最后，robots.txt必須放置在一個(gè)站點(diǎn)的根目錄下。

大家可以參考一下谷歌、百度和騰訊的robots寫法：

http://www.google.com/robots.txt

http://www.baidu.com/robots.txt

http://www.qq.com/robots.txt

大家了解完robots.txt后，那么我們可以用robots.txt來做什么？

1、用robots.txt屏蔽相似度高的頁面或沒內(nèi)容的頁面。

我們知道，搜索引擎收錄網(wǎng)頁后，會對網(wǎng)頁進(jìn)行“審核”，而當(dāng)兩個(gè)網(wǎng)頁的相似度很高時(shí)，那么搜索引擎就會刪除掉其中一個(gè)，并且會降低一點(diǎn)你網(wǎng)站的得分。

假設(shè)以下這兩個(gè)鏈接，內(nèi)容其實(shí)差不多，那么第一個(gè)鏈接就應(yīng)該屏蔽掉。

/XXX?123

/123.html

像第一個(gè)的鏈接這樣的鏈接非常多，那么我們要怎么屏蔽呢?其實(shí)只要屏蔽/XXX?就可以屏蔽所有的鏈接了。

代碼如下：

Disallow： /XXX?

同理，一些沒有內(nèi)容的頁面我們也可以利用相同的辦法將其屏蔽掉。

2、用robots.txt屏蔽多余的鏈接，一般保留靜態(tài)的鏈接（既HTML、htm、shtml等）。

由于網(wǎng)站中經(jīng)常會出現(xiàn)多個(gè)鏈接指向同一個(gè)頁面的情況，而這樣會讓搜索引擎對網(wǎng)站的友好度降低。為了避免這一個(gè)情況，我們就可以通過robots.txt把非主要的鏈接去掉。

比如以下兩個(gè)鏈接指向同樣的頁面：

/OOO?123

/123.html

那么我們就應(yīng)該去掉第一個(gè)垃圾，代碼如下：

Disallow： /OOO?123

3、用robots.txt屏蔽死鏈

死鏈就是曾經(jīng)存在的網(wǎng)頁，因?yàn)楦陌婊蚱渌蚨バв煤缶妥兂伤梨湥簿褪钦f看似一個(gè)正常的網(wǎng)頁鏈接，但點(diǎn)擊后不能打開相對應(yīng)的網(wǎng)頁頁面。

比如，原來在目錄為/seo下的所有鏈接，因?yàn)槟夸浀刂返母淖�，現(xiàn)在都變成死鏈接了，那么我們可以用robots.txt把他屏蔽掉，代碼如下：

Disallow： /seo/

4、告訴搜索引擎你的sitemap.xml地址

利用robots.txt可以告訴搜索引擎你sitemap.xml文件的地址，而不需要在網(wǎng)站上添加sitemap.xml的鏈接。具體代碼如下：

Sitemap：你的sitemap地址

以上就是robots.txt的基本用法，一個(gè)好的網(wǎng)站必定會有一個(gè)好的robots.txt，因?yàn)閞obots.txt是搜索引擎了解你網(wǎng)站的一個(gè)途徑。另外在這里我推薦一下一個(gè)比較適合wordpress用戶使用的robots.txt寫法：

User-agent： *

Disallow： /wp-

Disallow： /feed/

Disallow： /comments/feed

Disallow： /trackback/

Sitemap： http://rainjer.com/sitemap.xml

最后，如果你覺得上面所說的還不能滿足你的需要，那么你可以在谷歌或百度官方提供的robots.txt使用指南學(xué)習(xí)：

百度：http://www.baidu.com/search/robots.html

谷歌：http://www.google.com/support/forum/p/webmasters/thread?tid=4dbbe5f3cd2f6a13&hl=zh-CN

【收藏】【打印】【進(jìn)入論壇】

相關(guān)文章：

·網(wǎng)站優(yōu)化往往會陷入一些誤區(qū)

·網(wǎng)站優(yōu)化方案：網(wǎng)站欄目頁設(shè)計(jì)

·網(wǎng)站優(yōu)化:百度收錄網(wǎng)站的快照日期

·優(yōu)化:讓網(wǎng)站訪問速度更快的方法

·網(wǎng)站優(yōu)化技術(shù):針對DNS進(jìn)行優(yōu)化

·網(wǎng)站優(yōu)化:注意搜索引擎更新時(shí)間

·英文網(wǎng)站優(yōu)化的基本要素

·網(wǎng)站整體優(yōu)化之?dāng)?shù)據(jù)庫優(yōu)化

·網(wǎng)站優(yōu)化:關(guān)鍵詞放在網(wǎng)頁什么地方

·網(wǎng)站優(yōu)化中關(guān)于關(guān)鍵詞設(shè)置的問題

·網(wǎng)站優(yōu)化技術(shù)的三十條經(jīng)驗(yàn)總結(jié)

亚洲AV无码乱码在线观看不卡|最新大伊香蕉精品视频在线|亚洲不卡av一区二区|国产美女无遮挡免费