亚洲AV无码乱码在线观看不卡|最新大伊香蕉精品视频在线|亚洲不卡av一区二区|国产美女无遮挡免费

登錄論壇 | 注冊會員 設(shè)為首頁 | 收藏本站
當(dāng)前位置 : 首頁>軟件學(xué)院>網(wǎng)絡(luò)技術(shù)>網(wǎng)絡(luò)技巧>正文
 
搜索引擎收錄頁面流程原理和方式

http://www.yibo1263.com 2009/11/15 11:39:13  來源:東北IT網(wǎng)  編輯:葉子
 
  本文并非空洞文章,里面一些關(guān)于搜索引擎的原理還是值得一看的,至少可以大致了解搜索引擎的工作方式,當(dāng)然是否有用還看個人偏好。

  搜索引擎收錄頁面實際上就是在互聯(lián)網(wǎng)上進(jìn)行數(shù)據(jù)采集,這是搜索引擎最基礎(chǔ)的工作,而搜索引擎的內(nèi)容都來自后臺的龐大的URL列表,通過這些URL,不斷的收錄,儲存及維護(hù),而學(xué)習(xí)搜索引擎收錄的流程,收錄原理及收錄方式,有效的提高搜索引擎對網(wǎng)站的收錄的數(shù)量!

  1. 頁面收錄流程,

  在互聯(lián)網(wǎng)中,URL是每個頁面的入口地址,”蜘蛛程序”通過這些URL列表抓取到頁面的,“蜘蛛”不斷的從這些頁面中獲取URL資源及存儲頁面,并加入URL列表,如此不斷的循環(huán),搜索引擎就可以從互聯(lián)網(wǎng)中獲取到足夠的頁面。

  URL是頁面的入口,則域名則是網(wǎng)站的入口,搜索引擎就是通過域名進(jìn)入網(wǎng)站,挖掘URL資源,換而言之搜索引擎在互聯(lián)網(wǎng)中抓取頁面的首要任務(wù)就是要有龐大的域名列表,在不斷的通過域名,進(jìn)入網(wǎng)站抓取網(wǎng)站中的頁面,

  而對于咱們而言,想搜索引擎收錄,首要條件就是加入搜索引擎的域名列表,常見加入搜索引擎的域名列表的有以下兩種方式

  利用搜索引擎提供的網(wǎng)站登錄入口,向搜索引擎提交網(wǎng)站域名,例如百度的:http://www.baidu.com/search/url_submit.html,可在此提交自己的網(wǎng)站域名,不過用此方法搜索引擎只會定期進(jìn)行抓取并更新,這種做法比較被動,從域名提交網(wǎng)站被收錄花費的時間也比較長

  通過與有質(zhì)量的“外鏈”,使搜索引擎在抓取“別人”的網(wǎng)站頁面時發(fā)現(xiàn)我們的網(wǎng)站,從而實現(xiàn)對網(wǎng)站的收錄,這種方法主動權(quán)在我們手上,(只要我們有足夠多的“外鏈”)且收錄速度比第一種方法快,根據(jù)外部鏈接的數(shù)量、質(zhì)量相關(guān)性,一般2-7天就會被搜索引擎收錄

  2.頁面收錄原理

  通過學(xué)習(xí)“頁面收錄流程”可以掌握加快網(wǎng)站被收錄的方法,接著來學(xué)習(xí)頁面收錄原理,從而提高搜索引擎收錄的數(shù)量!

  如果把一個網(wǎng)站頁面組成的頁面看做是一個有向圖,從指定的頁面出發(fā),沿著頁面中的鏈接,按照某種特定的策略對網(wǎng)站中的頁面進(jìn)行遍歷。不停地從URL 列表中移出已經(jīng)訪問的URL,并存儲原始頁面,同時提取原始頁面中的URL的信息:再將URL分為域名及內(nèi)部URL兩大類,同時判斷URL是否被訪問過, 將未訪問過的URL加入URL列表中。遞歸地掃描URL列表,直至耗盡所有URL資源為止。經(jīng)過這些工作,搜索引擎就可以建立龐大的域名列表、頁面URL 列表并儲存足夠多的原始頁面。

  3.頁面收錄方式,

  知道了 “頁面收錄流程”和“頁面收錄原理” 然而在搜索引擎中要獲取相對重要頁面,就涉及到了搜索引擎的頁面收錄方式,

  頁面收錄方式是指搜索引擎抓取頁面時所使用的策略,目的是為了能在互聯(lián)網(wǎng)中篩選出相對重要的信息,頁面收錄的方式的制定取決于搜索引擎對網(wǎng)絡(luò)結(jié)構(gòu)的 理解。如果使用相同的抓取策略,搜索引擎在同樣的時間內(nèi)可以在某一網(wǎng)站中抓取到更多的頁面資源,則會在該網(wǎng)站停留更長的時間,收錄的頁面數(shù)自然也就多了。 因此,加深對搜索引擎頁面收錄方式的認(rèn)識,有利于為網(wǎng)站建立友好的結(jié)構(gòu),提高被收錄的數(shù)量。

  搜索引擎搜收錄頁面的方式主要要有“廣度優(yōu)先”、“深度優(yōu)先“及”用戶提交“(用戶提交暫時不講)三種,認(rèn)識這三種頁面收錄方式及各自的優(yōu)缺點!

  廣度優(yōu)先

  如果把整個網(wǎng)站看做一棵樹,首頁就是根,每個頁面就是葉子。廣度優(yōu)先是一種橫向的頁面抓取方式,先從樹的較淺層開始抓取頁面,直接抓完同層次的所有 頁面后才進(jìn)入下一層。因此,在對網(wǎng)站進(jìn)行優(yōu)化時,我們應(yīng)該把網(wǎng)站相對重要的信息展示在層次比較淺的頁面上(例如:在首頁推薦一些熱門的內(nèi)容)。反過來,通 過廣度優(yōu)先的抓取方式,搜索引擎就可以首先抓取到網(wǎng)站中相對重要的頁面。

  首先,”蜘蛛“從網(wǎng)站的首頁出發(fā),抓取首頁上所有連接指向的頁面,形成頁面集合A,并分析出A中所有頁面中的鏈接:在跟蹤這些鏈接抓取下一層的頁面,形成頁面集合B:就這樣遞歸地從淺層頁面中解析出鏈接,再從深層頁面,直至滿足某個設(shè)定的條件才停止抓取進(jìn)程

本新聞共2頁,當(dāng)前在第1頁  1  2  

收藏】【打印】【進(jìn)入論壇
  相關(guān)文章:

·百度稱主流搜索引擎都在搞競價排名
·中國搜索引擎用戶忠誠排行:谷歌搜搜有道居
·搜索引擎侵權(quán)案:中搜在線被罰10萬元
·網(wǎng)站被搜索引擎K掉的十二條原因 
·把網(wǎng)站提交到微軟Bing搜索引擎
·認(rèn)識搜索引擎收錄過程加速收錄進(jìn)程 
·SEO搜索引擎優(yōu)化反向鏈接四大原則
·搜索引擎優(yōu)化作弊常見的10種方法
·分析Google和百度搜索引擎習(xí)慣問題 
·搜索引擎優(yōu)化(SEO)關(guān)鍵詞具體操作
·搜索引擎優(yōu)化中常用的九個欺騙技術(shù)

 
 
 
最新文章

搶先蘋果,消息稱英特爾芯片采用臺積電
三星揭曉業(yè)內(nèi)首款單條 512GB DDR5 內(nèi)存
vivo 高端新機(jī)爆料:120Hz 曲面屏 + 天
vivo Y21 在印度正式上市:Helio P35 芯
微星推出 GeForce RTX 3080 Sea Hawk X
消息稱三星 Galaxy Tab S8 系列平板將放
機(jī)械革命推出 F6 輕薄本:16 英寸全面屏
英特爾 12 代 Alder Lake CPU 600 系列
雷軍:向小米手機(jī) 1 首批用戶每人贈送價
小米李明談用戶被踢出 MIUI 測試版:大

推薦文章
1
2
3
4
5
6
7
8
9
10
叛逆嫩模性感寫真
宮如敏不雅照瘋傳 看張馨予韓一菲獸獸誰
不懼孔子搶位 阿凡達(dá)游戲影音配置推薦
2015第十七屆“東北安博會”火爆招商
第十六屆東北國際公共安全防范產(chǎn)品博覽
2016年第五屆中國國際商業(yè)信息化博覽會
2016年第五屆中國國際POS機(jī)及相關(guān)設(shè)備展
互聯(lián)網(wǎng)電視熟了嗎 2013最火電視深解析
桑達(dá)獲邀出席2015中國(廣州)國際POS機(jī)
寶獲利報名參加“2015年度中國POS機(jī)行業(yè)
八卦圖解 More>>
叛逆嫩模性感寫真 宮如敏不雅照瘋傳 看張馨予韓一菲
周偉童魔鬼身材日本性感寫真圖  聯(lián)想V360筆記本模特寫真