明輝手游網(wǎng)中心:是一個免費(fèi)提供流行視頻軟件教程、在線學(xué)習(xí)分享的學(xué)習(xí)平臺!

Search Engine Friendly的URL設(shè)計(jì)

[摘要]Search Engine Friendly的URL設(shè)計(jì)版權(quán)聲明:可以任意轉(zhuǎn)載,轉(zhuǎn)載時(shí)請務(wù)必以超鏈接形式標(biāo)明文章原始出處和作者信息及本聲明http://www.chedong.com/tech/google_url.html關(guān)鍵詞:"url rewrite" mod_rewri...

Search Engine Friendly的URL設(shè)計(jì)版權(quán)聲明:可以任意轉(zhuǎn)載,轉(zhuǎn)載時(shí)請務(wù)必以超鏈接形式標(biāo)明文章原始出處和作者信息及本聲明
http://www.chedong.com/tech/google_url.html關(guān)鍵詞:"url rewrite" mod_rewrite isapirewrite path_info "search engine friendly"
內(nèi)容摘要:
此外隨著互聯(lián)網(wǎng)上的內(nèi)容以驚人速度的增長也越來越突出了搜索引擎的重要性,如果網(wǎng)站想更好地被搜索引擎收錄,網(wǎng)站設(shè)計(jì)除了面向用戶友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的設(shè)計(jì)也是非常重要的。進(jìn)入搜索引擎的頁面內(nèi)容越多,則被用戶用不同的關(guān)鍵詞找到的幾率越大。在Google的算法調(diào)查一文中提到一個站點(diǎn)被Google索引頁面的數(shù)量其實(shí)對PageRank也是有一定影響的。由于Google 突出的是整個網(wǎng)絡(luò)中相對靜態(tài)的部分(動態(tài)網(wǎng)頁索引量比較。, 鏈接地址相對固定的靜態(tài)網(wǎng)頁比較適合被Google索引(怪不得很多大網(wǎng)站的郵件列表歸檔和按月歸檔的文檔很容被搜的到),因此很多關(guān)于面向搜索引擎 URL設(shè)計(jì)優(yōu)化(URI Pretty)的文章中提到了很多利用一定機(jī)制將動態(tài)網(wǎng)頁參數(shù)變成像靜態(tài)網(wǎng)頁的形式:
比如可以將:
http://www.chedong.com/phpMan.php?mode=man&parameter=ls
變成:
http://www.chedong.com/phpMan.php/man/ls
實(shí)現(xiàn)方式主要有2種:
基于url rewrite 基于path_info 把URI地址用作參數(shù)傳遞:URL REWRITE
最簡單的是基于各種WEB服務(wù)器中的URL重寫轉(zhuǎn)向(Rewrite)模塊的URL轉(zhuǎn)換:
這樣幾乎可以不修改程序的實(shí)現(xiàn)將 news.asp?id=234 這樣的鏈接映射成 news/234.html,從外面看上去和靜態(tài)鏈接一樣。Apache服務(wù)器上有一個模塊(非缺省):mod_rewrite:URL REWRITE功能之強(qiáng)大足夠?qū)懮弦槐緯?br>當(dāng)我需要將將news.asp?id=234的映射成news/234.html時(shí),只需設(shè)置:
RewriteRule /news/(\d+)\.html /news\.asp\?id=$1 [N,I]
這樣就把 /news/234.html 這樣的請求映射成了 /news.asp?id=234
當(dāng)有對/news/234.html的請求時(shí):web服務(wù)器會把實(shí)際請求轉(zhuǎn)發(fā)給/news.asp?id=234
而在IIS也有相應(yīng)的REWRITE模塊:比如ISAPI REWRITE和IIS REWRITE,語法都是基于正則表達(dá)式,因此配置幾乎和apache的mod_rewrite是相同的:比對于某一個簡單應(yīng)用可以是:
RewriteRule /news/(\d+)\.html /news/news\.php\?id=$1 [N,I]
這樣就把 http://www.chedong.com/news/234.html 映射到了 http://www.chedong.com/news/news.php?id=234

一個更通用的能夠?qū)⑺械膭討B(tài)頁面進(jìn)行參數(shù)映射的表達(dá)式是:
把 http://www.myhost.com/foo.php?a=A&b=B&c=C
表現(xiàn)成 http://www.myhost.com/foo.php/a/A/b/B/c/C。
RewriteRule (.*?\.php)(\?[^/]*)?/([^/]*)/([^/]*)(.+?)? $1(?2$2&:\?)$3=$4?5$5: [N,I]
通過URL REWRITE還有一個好處就是隱藏后臺實(shí)現(xiàn),這在后臺應(yīng)用平臺的遷移時(shí)非常有用:當(dāng)從asp遷移到j(luò)ava平臺時(shí),對于前臺用戶來說,更本感受不到后臺應(yīng)用的變化。比如我們需要將應(yīng)用從news.asp?id=234遷移成news.php?query=234時(shí),前臺的表現(xiàn)可以一直保持為 news/234.html。從實(shí)現(xiàn)應(yīng)用和前臺表現(xiàn)的分離:保持了URL的穩(wěn)定性,而使用mod_rewrite甚至可以把請求轉(zhuǎn)發(fā)到其他后臺服務(wù)器上。
基于PATH_INFO的URL美化Url美化的另外一個方式就是基于PATH_INFO:
PATH_INFO是一個CGI 1.1的標(biāo)準(zhǔn),經(jīng)常發(fā)現(xiàn)很多跟在CGI后面的"/value_1/value_2"就是PATH_INFO參數(shù):
比如http://www.chedong.com/phpMan.php/man/ls,中:$PATH_INFO = "/man/ls"
PATH_INFO是CGI標(biāo)準(zhǔn),因此PHP Servlet等都有的支持。比如Servlet中就有request.getPathInfo()方法。
注意:/myapp/servlet/Hello/foo的 getPathInfo()返回的是/foo,而/myapp/dir/hello.jsp/foo的getPathInfo()將返回的 /hello.jsp,從這里你也可以知道jsp其實(shí)就是一個Servlet的PATH_INFO參數(shù)。ASP不支持PATH_INFO,

PHP中基于PATH_INFO的參數(shù)解析的例子如下:
//注意:參數(shù)按"/"分割,第一個參數(shù)是空的:從/param1/param2中解析出$param1 $param2這2個參數(shù)
if ( isset($_SERVER["PATH_INFO"]) ) {
    list($nothing, $param1, $param2) = explode('/', $_SERVER["PATH_INFO"]);
}

如何隱蔽應(yīng)用:例如 .php,的擴(kuò)展名:
在APACHE中這樣配置:
<FilesMatch "^app_name$">
    ForceType application/x-httpd-php
</FilesMatch>

如何更像靜態(tài)頁面:app_name/my/app.html
解析的PATH_INFO參數(shù)的時(shí)候,把最后一個參數(shù)的最后5個字符“.html”截?cái)嗉纯伞?br>注意:APACHE2中缺省是不允許PATH_INFO的,需要設(shè)置AcceptPathInfo on

特別是針對使用虛擬主機(jī)用戶,無權(quán)安裝和配置mod_rewrite的時(shí)候,PATH_INFO往往就成了唯一的選擇。

OK,這樣以后看見類似于http://www.example.com/article/234這樣的網(wǎng)頁你就知道可能是 article/show.php?id=234這個php程序生成的動態(tài)網(wǎng)頁,很多站點(diǎn)表面看上去可能有很多靜態(tài)目錄,其實(shí)很有可能都是使用1,2個程序?qū)崿F(xiàn)的內(nèi)容發(fā)布。比如很多WIKIWIKI系統(tǒng)都使用了這個機(jī)制:整個系統(tǒng)就一個簡單的wiki程序,而看上去的目錄其實(shí)都是這個應(yīng)用拿后面的地址作為參數(shù)的查詢結(jié)果。

利用基于MOD_REWRITE/PATH_INFO + CACHE服務(wù)器的解決方案對原有的動態(tài)發(fā)布系統(tǒng)進(jìn)行改造,也可以大大降低舊有系統(tǒng)升級到新的內(nèi)容管理系統(tǒng)的成本。并且方便了搜索引擎收錄入索引。 附:如何在IIS上利用PHP支持PATH_INFOPHP的ISAPI模式安裝備忘:只試成 php-4.2.3-Win32

解包目錄
========
php-4.2.3-Win32.zip c:\php

PHP.INI初始化文件
=================
復(fù)制:c:\php\php.ini-dist 到 c:\winnt\php.ini

配置文件關(guān)聯(lián)
============
按照install.txt中的說明配置文件關(guān)聯(lián)

運(yùn)行庫文件
==========
復(fù)制 c:\php\php4ts.dll 到 c:\winnt\system32\php4ts.dll

這樣運(yùn)行后:會發(fā)現(xiàn)php把PATH_INFO映射到了物理路徑上
Warning: Unknown(C:\CheDong\Downloads\ariadne\www\test.php\path): failed to create stream: No such file or directory in Unknown on line 0

Warning: Unknown(): Failed opening 'C:\CheDong\Downloads\ariadne\www\test.php\path' for inclusion (include_path='.;c:\php4\pear') in Unknown on line 0

安裝ariadne的PATCH
==================
停止IIS服務(wù)
net stop iisadmin
ftp://ftp.muze.nl/pub/ariadne/win/iis/php-4.2.3/php4isapi.dll
覆蓋原有的c:\php\sapi\php4isapi.dll

注:
ariadne是一個基于PATH_INFO的內(nèi)容發(fā)布系統(tǒng),
PHP 4.3.2 RC2中CGI模式的PATH_INFO已經(jīng)修正,照常安裝即可。
參考資料:
URL Rewrite文檔:
http://www.isapirewrite.com/docs/
http://httpd.apache.org/docs/mod/mod_rewrite.html
http://httpd.apache.org/docs-2.0/mod/mod_rewrite.html
搜索引擎友好的URL設(shè)計(jì)
http://www.sitepoint.com/article/485
說不定這個URL原來就是articel.php?id=485
一個基于PATH_INFO的開源內(nèi)容管理系統(tǒng)
http://typo3.com/
Google沒有索引什么?
http://www.microdocs-news.info/newsGoogle/2003/05/10.html
Google的PageRank說明:
http://pr.efactory.de/