日韩天天综合网_野战两个奶头被亲到高潮_亚洲日韩欧美精品综合_av女人天堂污污污_视频一区**字幕无弹窗_国产亚洲欧美小视频_国内性爱精品在线免费视频_国产一级电影在线播放_日韩欧美内地福利_亚洲一二三不卡片区

Google搜索引擎原理_SEO優(yōu)化教程

編輯Tag賺U幣
教程Tag:暫無Tag,歡迎添加,賺取U幣!

推薦:網(wǎng)站的SEO并非一定需要靜態(tài)化
在國內(nèi),很多SEO專家給客戶網(wǎng)站的第一診斷結(jié)果就是要頁面靜態(tài)化。這倒不是因?yàn)閯?dòng)態(tài)頁面就做不了SEO,而是相對(duì)靜態(tài)頁面而言,動(dòng)態(tài)頁面的SEO更加難做,受SEO專家

這篇文章中,我們介紹了google,它是一個(gè)大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文本中應(yīng)用廣泛。Google的設(shè)計(jì)能夠高效地抓網(wǎng)頁并建立索引,它的查詢結(jié)果比其它現(xiàn)有系統(tǒng)都高明。這個(gè)原型的全文和超連接的數(shù)據(jù)庫至少包含24′000′000個(gè)網(wǎng)頁。我們可以從http://google.stanford.edu/ 下載。

設(shè)計(jì)搜索引擎是一項(xiàng)富有挑戰(zhàn)性的工作。搜索引擎為上億個(gè)網(wǎng)頁建立索引,其中包含大量迥然不同的詞匯。而且天天要回答成千上萬個(gè)查詢。在網(wǎng)絡(luò)中,盡管大型搜索引擎非常重要,但是學(xué)術(shù)界卻很少研究它。此外由于技術(shù)的快速發(fā)展和網(wǎng)頁的大量增加,現(xiàn)在建立一個(gè)搜索引擎和三年前完全不同。

本文具體介紹了我們的大型搜索引擎,據(jù)我們所知,在公開發(fā)表的論文中,這是第一篇描述地如此具體。除了把傳統(tǒng)數(shù)據(jù)搜索技術(shù)應(yīng)用到如此大量級(jí)網(wǎng)頁中所碰到的問題,還有許多新的技術(shù)挑戰(zhàn),包括應(yīng)用超文本中的附加信息改進(jìn)搜索結(jié)果。

本文將解決這個(gè)問題,描述如何運(yùn)用超文本中的附加信息,建立一個(gè)大型實(shí)用系統(tǒng)。任何人都可以在網(wǎng)上隨意發(fā)布信息,如何有效地處理這些無組織的超文本集合,也是本文要關(guān)注的問題。

要害詞 World Wide Web,搜索引擎,信息檢索,PageRank, Google

1 緒論

Web給信息檢索帶來了新的挑戰(zhàn)。Web上的信息量快速增長,同時(shí)不斷有毫無經(jīng)驗(yàn)的新用戶來體驗(yàn)Web這門藝術(shù)。人們喜歡用超級(jí)鏈接來網(wǎng)上沖浪,通常都以象Yahoo這樣重要的網(wǎng)頁或搜索引擎開始。大家認(rèn)為List(目錄)有效地包含了大家感愛好的主題,但是它具有主觀性,建立和維護(hù)的代價(jià)高,升級(jí)慢,不能包括所有深?yuàn)W的主題�;谝υ~的自動(dòng)搜索引擎通常返回太多的低質(zhì)量的匹配。使問題更遭的是,一些廣告為了贏得人們的關(guān)注想方設(shè)法誤導(dǎo)自動(dòng)搜索引擎。我們建立了一個(gè)大型搜索引擎解決了現(xiàn)有系統(tǒng)中的很多問題。應(yīng)用超文本結(jié)構(gòu),大大提高了查詢質(zhì)量。我們的系統(tǒng)命名為google,取名自googol的通俗拼法,即10的100次方,這和我們的目標(biāo)建立一個(gè)大型搜索引擎不謀而合。

1.1網(wǎng)絡(luò)搜索引擎—升級(jí)換代(scaling up):

1994-2000 搜索引擎技術(shù)不得不快速升級(jí)(scale dramatically)跟上成倍增長的web數(shù)量。
1994年,第一個(gè)Web搜索引擎,World Wide Web Worm(WWWW)可以檢索到110,000個(gè)網(wǎng)頁和Web的文件。
到1994年11月,頂級(jí)的搜索引擎聲稱可以檢索到2‘000′000(WebCrawler)至100‘000′000個(gè)網(wǎng)絡(luò)文件(來自 Search Engine Watch)。
可以預(yù)見到2000年,可檢索到的網(wǎng)頁將超過1‘000′000‘000。同時(shí),搜索引擎的訪問量也會(huì)以驚人的速度增長。
在1997年的三四月份,World Wide Web Worm 平均天天收到1500個(gè)查詢。
在1997年11月,Altavista 聲稱它天天要處理大約20′000′000個(gè)查詢。隨著網(wǎng)絡(luò)用戶的增長.
到2000年,自動(dòng)搜索引擎天天將處理上億個(gè)查詢。我們系統(tǒng)的設(shè)計(jì)目標(biāo)要解決許多問題,包括質(zhì)量和可升級(jí)性,引入升級(jí)搜索引擎技術(shù)(scaling search engine technology),把它升級(jí)到如此大量的數(shù)據(jù)上。

1.2 Google:

跟上Web的步伐(Scaling with the Web)建立一個(gè)能夠和當(dāng)今web規(guī)模相適應(yīng)的搜索引擎會(huì)面臨許多挑戰(zhàn)。抓網(wǎng)頁技術(shù)必須足夠快,才能跟上網(wǎng)頁變化的速度(keep them up to date)。存儲(chǔ)索引和文檔的空間必須足夠大。索引系統(tǒng)必須能夠有效地處理上千億的數(shù)據(jù)。處理查詢必須快,達(dá)到每秒能處理成百上千個(gè)查詢(hundreds to thousands per second.)。隨著Web的不斷增長,這些任務(wù)變得越來越艱巨。然而硬件的執(zhí)行效率和成本也在快速增長,可以部分抵消這些困難。還有幾個(gè)值得注重的因素,如磁盤的尋道時(shí)間(disk seek time),操作系統(tǒng)的效率(operating system robustness)。在設(shè)計(jì)Google的過程中,我們既考慮了Web的增長速度,又考慮了技術(shù)的更新。Google的設(shè)計(jì)能夠很好的升級(jí)處理海量數(shù)據(jù)集。它能夠有效地利用存儲(chǔ)空間來存儲(chǔ)索引。優(yōu)化的數(shù)據(jù)結(jié)構(gòu)能夠快速有效地存取(參考4.2節(jié))。進(jìn)一步,我們希望,相對(duì)于所抓取的文本文件和HTML網(wǎng)頁的數(shù)量而言,存儲(chǔ)和建立索引的代價(jià)盡可能的�。▍⒖几戒汢)。對(duì)于象Google這樣的集中式系統(tǒng),采取這些措施得到了令人滿足的系統(tǒng)可升級(jí)性(scaling properties)。

分享:與搜索引擎交朋友
大多數(shù)的新電子商務(wù)公司一定遲早會(huì)發(fā)現(xiàn):創(chuàng)造一個(gè)網(wǎng)站并不意味著客戶一定會(huì)參觀它。而這一發(fā)現(xiàn)過程可能是很痛苦的。雖然有數(shù)以百萬計(jì)的潛在客戶在線,但是,旨

共2頁上一頁12下一頁
來源:模板無憂//所屬分類:SEO優(yōu)化教程/更新時(shí)間:2007-08-19
相關(guān)SEO優(yōu)化教程