一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看

提高網(wǎng)站在Google中的排名二)

  • 相關(guān)推薦

提高網(wǎng)站在Google中的排名(二)

提高網(wǎng)站在Google中的排名(二) 
 
 
  
如何突出關(guān)鍵詞:面向主題(Theme)的關(guān)鍵詞匹配
 Theme Engine正在逐步超過(guò)PR,成為結果排序中更主要的因素,可以比較一下以下現象: 
為什么查“新聞”,“汽車(chē)”之類(lèi)的文字,各種門(mén)戶(hù)網(wǎng)站的首頁(yè)不在第一位?要知道他們的頁(yè)面中都有相應頻道的鏈接文字的 
一篇新聞頁(yè)面中,搜索引擎如何不通過(guò)模板匹配,自動(dòng)將新聞的主體和頁(yè)面中的頁(yè)頭,欄目導航條,頁(yè)尾等部分的內容區分開(kāi)的? 
其實(shí)以上問(wèn)題都可以歸結為網(wǎng)頁(yè)內容摘要的提取策略和關(guān)鍵詞在其中的命中:
首先將能夠描述一個(gè)頁(yè)面內容的分成以下幾種類(lèi)型:

鏈入文字描述:inbound link text
http://www.searchenginedictionary.com/terms-inbound-link.shtml

HTML頁(yè)面標題:title 好標題一般會(huì )將頁(yè)面中最重要的關(guān)鍵詞放在最前面,比如:ABC-10型吸塵器 - XX家電城 
HTML內容主體:content text 
鏈出文字:outbound link text

如果按照以下規則:
一個(gè)頁(yè)面中關(guān)鍵詞命中權重:鏈入文字 > HTML標題文字 > HTML頁(yè)面主體內容 >> 出鏈文字,以上現象就比較好解釋了。
鏈入文字是頁(yè)面上看不見(jiàn)的,但鏈入文字對被鏈接頁(yè)面有巨大的作用:在現代搜索引擎在關(guān)鍵詞匹配的過(guò)程中,匹配的過(guò)程不只看當前頁(yè)面的內容摘要:很大程度上,不只看這個(gè)網(wǎng)頁(yè)自己說(shuō)自己有什么內容,還要看別人如何鏈接時(shí),如何描述你的網(wǎng)站別人怎么稱(chēng)呼你,比你自己說(shuō)自己更重要。。
比如查:“世界衛生組織”,返回結果中有http://www.who.int/ 而這個(gè)頁(yè)面中是沒(méi)有中文的,之所以能匹配上,是因為很多鏈接它的中文網(wǎng)站使用了:<a >世界衛生組織</a>,所以,這個(gè)頁(yè)面中不存在的中文關(guān)鍵詞也成為了頁(yè)面摘要的一部分。這樣一想,就可以知道鏈出鏈接的文字其實(shí)是為被鏈接的子頻道首頁(yè)或者內容詳情頁(yè)服務(wù)的。對自身頁(yè)面的關(guān)鍵詞密度只有負面的影響,這也是Google建議一個(gè)頁(yè)面中鏈接不要超過(guò)100個(gè)的原因:他根本不索引100個(gè)鏈接以后的內容。按照以上規則,搜索引擎將一篇新聞詳情頁(yè)中的新聞內容提取出來(lái)就是把頁(yè)面上所有帶HTTP鏈接的文字都去掉,就是新聞的內容部分了,更精確一些可以通過(guò)取最長(cháng)文本段落等策略實(shí)現;而很多網(wǎng)站首頁(yè)或頻道首頁(yè)中幾乎全部都是鏈接,經(jīng)過(guò)搜索引擎分析的結果就是:什么內容也沒(méi)有,能夠被命中的關(guān)鍵詞僅僅是別人鏈接你用的“網(wǎng)站首頁(yè)”和頻道標題Title中的站點(diǎn)名稱(chēng)等的幾個(gè)關(guān)鍵詞,而頁(yè)面中其他的文字則遠遠不如相應子頻道和具體內容頁(yè)面的匹配度高,而搜索引擎能夠通過(guò)以上規則,讓用戶(hù)更快的直接定位到有具體內容的內容詳情頁(yè)面。因此希望通過(guò)一個(gè)首頁(yè),盡可能多的命中所有希望推廣的關(guān)鍵詞是不可能的。讓網(wǎng)頁(yè)盡可能多的進(jìn)入搜索引擎的索引,然后把握好整個(gè)網(wǎng)站的主題風(fēng)格是非常重要的,讓網(wǎng)站的主題關(guān)鍵詞能夠比較均勻的按照金字塔模式分布到網(wǎng)站中可以參考:網(wǎng)站的主題金字塔設計          網(wǎng)站名稱(chēng)(用戶(hù)通過(guò)1-2個(gè)抽象關(guān)鍵詞)
         /       \
    子頻道1   子頻道2 (用戶(hù)通過(guò)2-3個(gè)關(guān)鍵詞命中)
   /    \      /    \
產(chǎn)品1  產(chǎn)品2 文章1 文章2 (用戶(hù)通過(guò)3-4個(gè)關(guān)鍵詞命中:這種用戶(hù)最有價(jià)值)


不要空著(zhù)標題:空著(zhù)<title></title>無(wú)異于浪費了最有價(jià)值的一塊陣地;
傳統的頁(yè)面中,HTML頁(yè)面中會(huì )有類(lèi)似以下的隱含信息,用于說(shuō)明當前網(wǎng)頁(yè)的主要內容關(guān)鍵字:
<header>
    <meta name="keyword" content="mp3 download music...">
</header>
后來(lái)由于這種人工添加關(guān)鍵詞的方式被濫用,大量網(wǎng)頁(yè)中為了提高被搜索引擎命中的概率,經(jīng)常添加一些和實(shí)際網(wǎng)頁(yè)內容無(wú)關(guān)的熱門(mén)關(guān)鍵比如:“music mp3 download”等,所以新一代的搜索引擎已經(jīng)不再關(guān)心頁(yè)面頭文件中的人工meta keyword聲明,而頁(yè)面標題在搜索引擎的關(guān)鍵詞的命中命中過(guò)程中往往有著(zhù)更高的比重,如果一個(gè)關(guān)鍵詞在標題中命中會(huì )比在頁(yè)面中命中有更高的得分,從而在相應的搜索結果排名中更靠前。 

 
標題長(cháng)度和內容:不要過(guò)長(cháng),一般在40個(gè)字符以?xún),并充分突出關(guān)鍵詞的比重;
如果更長(cháng)的標題搜索引擎一般會(huì )忽略掉,所以要盡可能將主要關(guān)鍵詞放在標題靠前的位置。省略掉不必要的形容詞吧,畢竟用戶(hù)主要通過(guò)名詞來(lái)找到需要的內容。標題內容:盡量用一些別人可以通過(guò)關(guān)鍵詞找到的字眼(也別太過(guò)頭,如果標題中的字眼超過(guò)1半內容中都沒(méi)有,有可能被搜索引擎排除出索引),因此基于web日志中來(lái)自其他搜索引擎的關(guān)鍵詞查詢(xún)統計非常必要。 
如果網(wǎng)頁(yè)很多的話(huà),盡量使用不同的網(wǎng)頁(yè)標題,爭取讓自己網(wǎng)站的內容更多的進(jìn)入搜索引擎索引范圍;
因為搜索引擎會(huì )根據頁(yè)面內容的相似度把一些內容當成重復頁(yè)面排除出索引范圍;
http://www.chedong.com/phpMan.php是我的網(wǎng)站上的一個(gè)小應用:一個(gè)web界面的unix命令手冊(man page),在以前的設計中所有動(dòng)態(tài)頁(yè)面使用的都是同樣的標題:"phpMan: man page /perldoc /info page web interface" ,Google索引了大約3000多個(gè)頁(yè)面,后來(lái)我將頁(yè)面標題改成了"phpMan:  [命令名]"這樣的格式,比如:"phpMan: ls",這樣大部分動(dòng)態(tài)頁(yè)面的標題就都不一樣了,一個(gè)月后Google從這個(gè)頁(yè)面入口索引了大約6000個(gè)頁(yè)面。因此,如果網(wǎng)站中很多網(wǎng)頁(yè)都使用相同的標題,比如:“新聞頻道”,“論壇”,這些頁(yè)面中很大一部分就會(huì )被排重機制忽略掉。 
除了<title></title>外,還可以用<h1></h1>標題行突出內容主題,加強標題的效果;
在我的網(wǎng)站設計中:我會(huì )把用<h1>[標題]</h1>這樣的模板把標題突出顯示,而不是通過(guò)改變字體的方式突出標題。 
其他網(wǎng)站設計提示
靜態(tài)鏈接:Blog網(wǎng)站另外一個(gè)優(yōu)勢在于其網(wǎng)頁(yè)是靜態(tài)鏈接:動(dòng)態(tài)網(wǎng)頁(yè)占到整個(gè)互聯(lián)網(wǎng)內容的90%以上。各個(gè)搜索引擎其實(shí)能夠表現的都只不過(guò)是互聯(lián)網(wǎng)的冰山一角(3-5%),不同的只是誰(shuí)讓優(yōu)質(zhì)網(wǎng)頁(yè)排名靠前的策略更優(yōu)秀而已:大部分搜索引擎都認為靜態(tài)鏈接的網(wǎng)頁(yè)是優(yōu)質(zhì)網(wǎng)頁(yè),Google在優(yōu)先抓取索引的網(wǎng)頁(yè)中70%以上是不帶參數鏈接的靜態(tài)網(wǎng)頁(yè)。而且即使同樣的內容,靜態(tài)網(wǎng)頁(yè)也會(huì )比動(dòng)態(tài)網(wǎng)頁(yè)權重高:很容易理解:query?a=1&b=2這樣的鏈接由于參數順序顛倒的query?b=2&a=1完全相同。盡量使用靜態(tài)網(wǎng)頁(yè):目前能夠動(dòng)態(tài)網(wǎng)頁(yè)進(jìn)行全面的索引還比較難,而即使是Google也更不會(huì )索引所有的內容,因此很少會(huì )對參數超過(guò)2個(gè)的動(dòng)態(tài)網(wǎng)頁(yè)進(jìn)行進(jìn)一步的抓取和分析。以下是一個(gè)phpBB論壇頁(yè)面返回的HTTP頭信息: 
HTTP/1.1 200 OK Date: Wed, 28 Jan 2004 12:58:54 GMT Server: Apache/1.3.29 (Unix) mod_gzip/1.3.26.1a PHP/4.3.4 X-Powered-By: PHP/4.3.4 Set-Cookie: phpBB_data=a%3A0%3A%7B%7D; expires=Thu, 27-Jan-2005 12:58:54 GMT; path=/; Set-Cookie: phpBB_sid=09f67a83ee108ecbf11e35bb6f36fcec; path=/; Content-Encoding: gzip Cache-Control: private, pre-check=0, post-check=0, max-age=0 Expires: 0 Pragma: no-cache Connection: close Content-Type: text/html 

為了避免隱私問(wèn)題:Googlebot可以通過(guò)對頁(yè)面http header中的session id和session cookie進(jìn)行一些甄別,這樣很多需要認證信息的論壇內容就無(wú)法進(jìn)入索引了。
總體上說(shuō)Google喜歡新的,靜態(tài)的內容。因此無(wú)論從效率上講還是方便搜索引擎收錄:使用內容發(fā)布系統將網(wǎng)站內容發(fā)布成靜態(tài)網(wǎng)頁(yè)都是非常必要的,從某種程度上說(shuō)google friendly = anonymous cache friendly。
比如http://www.chedong.com/phpMan.php/man/intro/3
http://www.chedong.com/phpMan.php?mode=man&;parameter=intro§ion=3這樣的鏈接更容易進(jìn)入搜索引擎的索引。而且在URL中的命中也能突出關(guān)鍵詞。 
能夠進(jìn)入Google索引的頁(yè)面數量越多越好。用類(lèi)似以下的腳本可以統計自己的網(wǎng)站被搜索引擎索引的情況。 

#!/bin/sh YESTERDAY=`date -d yesterday +%Y%m%d` # for FreeBSD: YESTERDAY=`date -v-1d +%Y%m%d` LOG_FILE='/home/apache/logs/access_log' grep -i Googlebot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.googlebot.txt grep -i baiduspider $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.baiduspider.txt grep -i msnbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.msnbot.txt grep -i inktomi $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.inktomi.txt grep -i openbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort |uniq -c | sort -rn > spider/$YESTERDAY.openbot.txt 

網(wǎng)站目錄結構要扁平,因為每深一級目錄,PAGERANK降低1-2個(gè)檔次。假設首頁(yè)是3,其子可能目錄就是1了,更深可能就無(wú)法列入評級范圍了。

表現和內容的分離:“綠色”網(wǎng)頁(yè)
網(wǎng)頁(yè)中的javascript和css盡可能和網(wǎng)頁(yè)分離,一方面提高代碼重用度(也方便頁(yè)面緩存),另外一方面,由于有效內容占網(wǎng)頁(yè)長(cháng)度的百分比高,也能提高相關(guān)關(guān)鍵詞在頁(yè)面中的比重也增加了?傊,應該鼓勵遵循w3c的規范,使用更規范的XHTML和XML作為顯示格式便于內容更長(cháng)時(shí)間的保存。 
讓所有的頁(yè)面都有能夠快速入口:站點(diǎn)地圖,方便網(wǎng)頁(yè)爬蟲(chóng)(spider)快速遍歷網(wǎng)站所有需要發(fā)布的內容。如果首頁(yè)就是用Flash或圖片進(jìn)入的話(huà),無(wú)異于將搜索引擎拒之門(mén)外,除了UI設計的用戶(hù)友好外,spider friendly也是非常重要的。 
保持網(wǎng)站自身的健康:經(jīng)常利用壞鏈檢查工具檢查網(wǎng)站中是否有死鏈。 
保持網(wǎng)頁(yè)內容/鏈接的穩定性和持久性:在搜索引擎索引中網(wǎng)頁(yè)存在的歷史也是一個(gè)比較重要的因素,而且歷史比較久的網(wǎng)頁(yè)被鏈接的幾率越高。為了保證自己網(wǎng)頁(yè)能夠被比較持久的被其他網(wǎng)站的頁(yè)面引用,如果自己網(wǎng)頁(yè)中有鏈接更新時(shí),最好能保留舊的頁(yè)面并做好鏈接轉向,以保持內容的連續性。要知道,把一個(gè)網(wǎng)站和內容在搜索引擎中的排名“培養”的很高是一件非常不容易的事情,誰(shuí)都不希望好不容易自己的內容被別人找到了,點(diǎn)擊卻是“404 頁(yè)面不存在”吧,因此站點(diǎn)管理員對自身站點(diǎn)error.log的分析也是非常必要的。 
文件類(lèi)型因素:Google有對PDF, Word(Power Point, Excel), PS文檔的索引能力,由于這種文檔的內容比一般的HTML經(jīng)過(guò)了更多的整理,學(xué)術(shù)價(jià)值一般比較高,所以這些類(lèi)型的文檔天生就比一般的HTML類(lèi)型的文檔 PageRank要高。因此,對于比較重要的文檔:技術(shù)白皮書(shū),FAQ,安裝文檔等建議使用PDF PS等高級格式存取,這樣在搜索結果中也能獲得比較靠前的位置。 
常常能發(fā)現門(mén)戶(hù)站點(diǎn)的一條新聞往往比其他站點(diǎn)的首頁(yè)排名還要靠前。因此一個(gè)站點(diǎn)總體PageRank提高了以后,往往自身一些并不重要的內容也會(huì )被同那些高PageRank的內容一起帶入被搜索引擎優(yōu)先查詢(xún)的列表中。這樣經(jīng)常造成很多大的開(kāi)發(fā)站點(diǎn)的郵件列表歸檔往往比其他站點(diǎn)的首頁(yè)PageRank還要高。

【提高網(wǎng)站在Google中的排名二)】相關(guān)文章:

淺析Google Earth在旅游景點(diǎn)展示中的應用11-20

直放站在UMTS網(wǎng)絡(luò )規劃中的建模03-07

移動(dòng)智能網(wǎng)中的呼叫前轉02-25

試論如何發(fā)揮模擬電站在課程改革中的作用03-28

Openprocess在熱網(wǎng)監控系統中的應用01-11

高中美術(shù)課程中課堂效率的提高03-03

探析Openprocess在熱網(wǎng)監控系統中的應用01-07

談Openprocess在熱網(wǎng)監控系統中的應用01-14

雙向CATV網(wǎng)中控制信令的傳送01-07

國際貿易中商務(wù)英語(yǔ)談判素質(zhì)的提高03-19

一级日韩免费大片,亚洲一区二区三区高清,性欧美乱妇高清come,久久婷婷国产麻豆91天堂,亚洲av无码a片在线观看