亚洲中文无码视幕,国产精品乱人无码AV在线A ,精品国产福利在线观看

1PS提示：因?yàn)閳D層已鎖定，無(wú)法編輯圖層的處理方法
2Adobe Illustrator CS5 序列號(hào)大全
3picacg蘋(píng)果版怎么找不到|picacg ios版是不是下架了介紹
4ACDsee注冊(cè)碼免費(fèi)分享（含ACDsee18、ACDsee10等版本）
5蘋(píng)果iphone自動(dòng)時(shí)間不準(zhǔn)確的多種校正方法
6眼萌app怎么色弱測(cè)試眼萌app色弱測(cè)試圖文說(shuō)明教程
7百度安全衛(wèi)士好用么_百度安全衛(wèi)士技巧說(shuō)明
8PDF瀏覽器能看3D文件嗎？PDF瀏覽器看3D文件圖文詳細(xì)教程
9Potato(馬鈴薯聊天)怎么注冊(cè)不了|Potato不能注冊(cè)處理方法介紹
10Potato(土豆聊天)怎么換頭像|Potato app更改頭像方法介紹
11ipad版office如何激活? office365激活的圖文說(shuō)明教程
12最新的Adobe Illustrator CS4序列號(hào)大全

1css3里如何顯示圓形圖片
2支付寶怎么交學(xué)費(fèi)，支付寶教育繳費(fèi)圖文說(shuō)明教程
3京東微笑面單是什么，京東微笑快遞單有什么用
4高鐵兒童票網(wǎng)上怎么買，網(wǎng)上買高鐵兒童票具體流程
5GG廣告申請(qǐng)
6提高谷歌聯(lián)盟Adsense收入4種方法
7百度減少收錄是什么原因？
8百度降權(quán)并不可怕
9穩(wěn)定網(wǎng)站排名的隱秘：百度優(yōu)先級(jí)算法
10新手誤區(qū)：揭露seo反鏈工具的真實(shí)面目
11淺談增加網(wǎng)站外部鏈接的方法
12被降權(quán)問(wèn)題淺談百度頁(yè)面權(quán)重

文章發(fā)布全站軟件文章熱門(mén)搜索：暴風(fēng)影音無(wú)效安裝私人珍藏存儲(chǔ)位置緩存文件資訊首頁(yè)騰訊視頻愛(ài)奇藝暴風(fēng)影音酷狗音樂(lè) 酷我音樂(lè)影音大全軟件下載軟件教程電腦系統(tǒng)下載聊天工具辦公軟件殺毒教程系統(tǒng)工具圖形圖像電腦學(xué)習(xí)應(yīng)用軟件網(wǎng)絡(luò)軟件蘋(píng)果應(yīng)用注冊(cè)碼網(wǎng)站教程技術(shù)開(kāi)發(fā)安卓教程其它教程您當(dāng)前所在位置：網(wǎng)視手游站 -> 網(wǎng)站教程 -> 搜索引擎核心技術(shù)(PHP編程思路) --[1]
搜索引擎核心技術(shù)(PHP編程思路) --[1] 發(fā)表時(shí)間：2024-06-04 來(lái)源：明輝站整理相關(guān)軟件相關(guān)文章人氣： [摘要]談到網(wǎng)頁(yè)搜索引擎時(shí)，大多數(shù)人都會(huì)想到雅虎。的確，雅虎開(kāi)創(chuàng)了一個(gè)互聯(lián)網(wǎng)絡(luò)的搜索時(shí)代。然而，雅虎目前用于搜索網(wǎng)頁(yè)的技術(shù)卻并非該公司原先自己開(kāi)發(fā)的。2000年8月，雅虎采用了Google（www.google.com）這家由斯坦福大學(xué)學(xué)生創(chuàng)建的風(fēng)險(xiǎn)公司的技術(shù)。理由非常簡(jiǎn)單，Google的搜索引擎比雅虎先... 談到網(wǎng)頁(yè)搜索引擎時(shí)，大多數(shù)人都會(huì)想到雅虎。的確，雅虎開(kāi)創(chuàng)了一個(gè)互聯(lián)網(wǎng)絡(luò)的搜索時(shí)代。然而，雅虎目前用于搜索網(wǎng)頁(yè)的技術(shù)卻并非該公司原先自己開(kāi)發(fā)的。2000年8月，雅虎采用了Google（www.google.com）這家由斯坦福大學(xué)學(xué)生創(chuàng)建的風(fēng)險(xiǎn)公司的技術(shù)。理由非常簡(jiǎn)單，Google的搜索引擎比雅虎先前使用的技術(shù)能更快、更準(zhǔn)確搜索到所需要的信息。　　讓我們自己來(lái)設(shè)計(jì)、開(kāi)發(fā)一個(gè)強(qiáng)勁、高效的搜索引擎和數(shù)據(jù)庫(kù)恐怕短時(shí)間內(nèi)在技術(shù)、資金等方面是不可能的，不過(guò)，既然雅虎都在使用別人的技術(shù)，那么我們是不是也可以使用別人現(xiàn)成的搜索引擎網(wǎng)站呢？剖析編程思路　　我們可以這樣設(shè)想：模擬一個(gè)查詢，向某個(gè)搜索引擎網(wǎng)站發(fā)出相應(yīng)格式的搜索命令，然后傳回搜索結(jié)果，對(duì)結(jié)果的HTML代碼進(jìn)行分析，剝離多余的字符和代碼，最后按所需要的格式顯示在我們自己的網(wǎng)站頁(yè)面里。　　這樣，問(wèn)題的關(guān)鍵就在于，我們要選定一個(gè)搜索信息準(zhǔn)確（這樣我們的搜索才會(huì)更有意義�。�、速度快（因?yàn)槲覀兎治鏊阉鹘Y(jié)果并顯示需要額外的時(shí)間），搜索結(jié)果簡(jiǎn)潔（便于進(jìn)行HTML源代碼分析和剝離）的搜索網(wǎng)站，由于新一代搜索引擎Google的各種優(yōu)良特性，這里我們選擇它為例，來(lái)看看用PHP怎樣實(shí)現(xiàn)后臺(tái)對(duì)Google(www.google.com)搜索、前臺(tái)個(gè)性化顯示這一過(guò)程。　　我們先來(lái)看看Google的查詢命令的構(gòu)成。進(jìn)入www.google.com網(wǎng)站，在查詢欄中輸入“abcd”，點(diǎn)擊查詢按鈕，我們可以發(fā)現(xiàn)瀏覽器的地址欄變成："http://www.google.com/search?q=abcd&btnG=Google%CB%D1%CB%F7&hl=zh-CN&lr="，可見(jiàn)，Google是通過(guò)表單的get方式來(lái)傳遞查詢參數(shù)并遞交查詢命令的。我們可以使用PHP中的file()函數(shù)來(lái)模擬這個(gè)查詢過(guò)程。了解File（）函數(shù) 　　語(yǔ)法: array file(string filename); 　　返回值為數(shù)組，將文件全部讀入數(shù)組變量中。這里的文件可以是本地的，也可以是遠(yuǎn)程的，遠(yuǎn)程文件必須指明所使用的協(xié)議。例如： result=file(“http://www.google.com/search?q=a ... mp;hl=zh-CN&lr=”)，該語(yǔ)句將模擬我們?cè)贕oogle上查詢單詞“abcd”的過(guò)程，并將搜索結(jié)果以每行為元素，傳回到數(shù)組變量 result中。因?yàn)檫@里讀取的文件是遠(yuǎn)程的，所以協(xié)議名“http://”不能缺少。　　如果要讓用戶輸入搜索字符進(jìn)行任意搜索，我們可以做一個(gè)輸入文本框和提交按鈕，并將上文中的被搜索字符“abcd”用變量替換： <?php echo '<form>'; //沒(méi)有參數(shù)的form，默認(rèn)提交方式為get，提交到本身 echo '<input type="text" name="keywords">'; //構(gòu)造一個(gè)文本輸入框 echo '<input type="submit" value="查詢">'; //構(gòu)造一個(gè)提交查詢按鈕 echo '</form>'; if (isset( keywords)) //提交后PHP會(huì)生成變量 kwywords,即要求下面的程序在提交后運(yùn)行 { urlencode( keywords); //對(duì)用戶輸入內(nèi)容進(jìn)行URL編碼 result=file("http://www.google.com/search?q=". keywords."&btnG=Google%CB%D1%CB%F7&hl=zh-CN&lr="); //對(duì)查詢語(yǔ)句進(jìn)行變量替換,將查詢結(jié)果保存在數(shù)組變量 result中 result_string=join(" ", result); //將數(shù)組$result合并成字符串，各數(shù)組元素之間用空格粘和 ... //進(jìn)一步處理 } ?> 　　上面的這段程序已經(jīng)能按用戶輸入內(nèi)容進(jìn)行查詢，并將返回的結(jié)果合成一個(gè)字符串變量$result_string。請(qǐng)注意要使用urlencode()函數(shù)將用戶輸入內(nèi)容進(jìn)行URL編碼，才可以正常地對(duì)輸入的漢字、空格以及其他特殊字符進(jìn)行查詢，這樣做也是盡可能逼真地模擬Google的查詢命令，保證搜索結(jié)果的正確性。對(duì)Google的分析　　為了便于理解，現(xiàn)在假設(shè)我們所真正需要的東西是：搜索結(jié)果的標(biāo)題。網(wǎng)址和簡(jiǎn)介等，這是一個(gè)簡(jiǎn)潔而典型的需求。這樣，我們所要做的便是：去除Google搜索結(jié)果的臺(tái)頭和腳注，包括一個(gè)Google的標(biāo)志、再次搜索的輸入框和搜索結(jié)果說(shuō)明等，并且在剩余的搜索結(jié)果各項(xiàng)條目中剝離原來(lái)的HTML格式標(biāo)記，替換成我們想要的格式。　　要做到這一點(diǎn)，我們必須仔細(xì)地分析Google搜索結(jié)果的HTML源碼，找到其中的規(guī)律。不難發(fā)現(xiàn)，在Google的搜索結(jié)果的正文總是包含在源碼的第一個(gè)<p>標(biāo)記和倒數(shù)第二個(gè)<p>標(biāo)記之間，并且倒數(shù)第二個(gè)<p>標(biāo)記后緊跟table字符，而且這個(gè)組合“<p><table”在源碼中也僅有一次，利用這個(gè)特點(diǎn)，我們可以這樣去除Google的臺(tái)頭和腳注。　　以下所有程序均依次接續(xù)在上文程序的“進(jìn)一步處理”處。　　result_string = strstr( result_string, "<p>"); //取 result_string從第一個(gè)<p>開(kāi)始后的字符串，以去除Google臺(tái)頭 position= strpos( result_string,"<p>table符號(hào)的位置 result_string= substr( result_string,0, position);//截取第一個(gè)<p>table符號(hào)之前的字符串,以去除腳注應(yīng)用與實(shí)現(xiàn) 　　OK，現(xiàn)在我們已經(jīng)得到有用的HTML源碼主干了，剩下的問(wèn)題是如何自主地顯示這些內(nèi)容。我們?cè)俜治鲆幌逻@些搜索結(jié)果條目，發(fā)現(xiàn)每個(gè)條目之間也是很有規(guī)律的用分隔，也就是各成一個(gè)段落，按這個(gè)特點(diǎn)我們用explode()函數(shù)把每個(gè)條目切開(kāi)：　　語(yǔ)法：explode(string separator, string string); 　　返回一個(gè)數(shù)組，按separator切開(kāi)后的各個(gè)小字串被保存在數(shù)組中。　　于是： result_array=explode("<p>", result_string); //用字串"<p>"把結(jié)果切開(kāi) 　　我們就得到一個(gè)數(shù)組 result_array，其中每個(gè)元素都是一個(gè)搜索結(jié)果條目。我們所要做的僅僅是研究每個(gè)條目及其HTML顯示格式代碼，然后按要求替換就行了。下面用循環(huán)來(lái)處理 result_array中的每個(gè)條目。 for( i=0; i { ... //處理每個(gè)條目 } 　　對(duì)于每個(gè)條目，我們也很容易找到一些特點(diǎn)：每個(gè)條目都由標(biāo)題、摘要、簡(jiǎn)介、類別、網(wǎng)址等組成，每個(gè)部分都換行，即包含<br>標(biāo)記，于是再次分割：（以下處理程序放在上文的循環(huán)中） every_item=explode("<br>", result_array[ i]); 　　這樣我們得到一個(gè)數(shù)組 every_item，其中 every_item[0]就是標(biāo)題， every_item[1]和 every_item[2]兩行為摘要， every_item[3]和 every_item[4]等等的頭部如果包含“<font size=-1 color=#6f6f6f >簡(jiǎn)介:</font>”、“< font size=-1 color=#6f6f6f>類別:< /font>”字符，則是簡(jiǎn)介或類別（因?yàn)橛械慕Y(jié)果條目沒(méi)有該項(xiàng)），如果頭部包含“< font color=green>”則肯定就是網(wǎng)址啦，這種對(duì)比判斷我們常使用正則表達(dá)式（略），如果要替換也很方便，比如包含標(biāo)題的$every_item[0]，其本身是有鏈接的，我們希望修改這個(gè)鏈接屬性，讓它在新窗口打開(kāi)鏈接： echo eregi_replace(' { ... //處理每個(gè)條目中除去第一項(xiàng)（第一項(xiàng)為標(biāo)題，已經(jīng)顯示）的每一項(xiàng) ... //更多格式修改 } 　　這樣就修改了鏈接屬性，其余很多顯示格式的修改、剝離、替換都能用正則替換eregi_replace()來(lái)完成。　　至此我們已經(jīng)得到了每個(gè)搜索條目的每一項(xiàng)，并能任意修改每項(xiàng)的格式，甚至可以給他套上漂亮的表格。然而一個(gè)好的程序應(yīng)該能適應(yīng)各種運(yùn)行環(huán)境的，這里也不例外，我們其實(shí)還只是討論了搜索結(jié)果的HTML剝離的一種框架方法，真正要做得完美，還要考慮很多內(nèi)容，比如要顯示一共搜索出多少結(jié)果，分成多少頁(yè)等等，甚至還可以刨除與Google相關(guān)的那些“類別”、“簡(jiǎn)介”等代碼，讓客戶根本看不到原始網(wǎng)站。不過(guò)這些內(nèi)容和要求我們都能通過(guò)分析HTML進(jìn)行剝離得到�，F(xiàn)在大家完全能自己動(dòng)手，做個(gè)極富個(gè)性化的搜索引擎啦。標(biāo)簽：搜索引擎核心技術(shù)(PHP編程思路) --[1] 上一篇：使用ASP完成事務(wù)處理的方法下一篇：Access2000數(shù)據(jù)庫(kù)80萬(wàn)記錄通用迅速分頁(yè)類	推薦資訊總?cè)藲獍?/span> 1PS提示：因?yàn)閳D層已鎖定，無(wú)法編輯圖層的處理方法 2Adobe Illustrator CS5 序列號(hào)大全 3picacg蘋(píng)果版怎么找不到\|picacg ios版是不是下架了介紹 4ACDsee注冊(cè)碼免費(fèi)分享（含ACDsee18、ACDsee10等版本） 5蘋(píng)果iphone自動(dòng)時(shí)間不準(zhǔn)確的多種校正方法 6眼萌app怎么色弱測(cè)試眼萌app色弱測(cè)試圖文說(shuō)明教程 7百度安全衛(wèi)士好用么_百度安全衛(wèi)士技巧說(shuō)明 8PDF瀏覽器能看3D文件嗎？PDF瀏覽器看3D文件圖文詳細(xì)教程 9Potato(馬鈴薯聊天)怎么注冊(cè)不了\|Potato不能注冊(cè)處理方法介紹 10Potato(土豆聊天)怎么換頭像\|Potato app更改頭像方法介紹 11ipad版office如何激活? office365激活的圖文說(shuō)明教程 12最新的Adobe Illustrator CS4序列號(hào)大全 1css3里如何顯示圓形圖片 2支付寶怎么交學(xué)費(fèi)，支付寶教育繳費(fèi)圖文說(shuō)明教程 3京東微笑面單是什么，京東微笑快遞單有什么用 4高鐵兒童票網(wǎng)上怎么買，網(wǎng)上買高鐵兒童票具體流程 5GG廣告申請(qǐng) 6提高谷歌聯(lián)盟Adsense收入4種方法 7百度減少收錄是什么原因？ 8百度降權(quán)并不可怕 9穩(wěn)定網(wǎng)站排名的隱秘：百度優(yōu)先級(jí)算法 10新手誤區(qū)：揭露seo反鏈工具的真實(shí)面目 11淺談增加網(wǎng)站外部鏈接的方法 12被降權(quán)問(wèn)題淺談百度頁(yè)面權(quán)重最新教程本月人氣 1使用ASP完成事務(wù)處理的方法 2PHP 腳本：隨心所欲的代碼逐漸流行 3容易設(shè)置IIS設(shè)置PHP調(diào)試環(huán)境 4ASP中取得圖片寬度與高度的類（無(wú)組件） 5用Asp取得Dll加密新聞內(nèi)容 6使用函數(shù)遞歸完成基于php與MySQL的動(dòng)態(tài)樹(shù)型菜單 7ASP調(diào)用WEBSERVICE文檔 8IIS6架設(shè)網(wǎng)站經(jīng)常見(jiàn)問(wèn)題及癥狀舉例答疑 9PHP程序員一般都忽略了的幾點(diǎn)精華 10用PHP完成XML備份Mysql數(shù)據(jù)庫(kù) 11php中檢查email完整性 12使用Session記錄頁(yè)面地址與完成頁(yè)面返回技巧 1將指定的asp文件內(nèi)容生成HTML文件 2使用Session記錄頁(yè)面地址與完成頁(yè)面返回技巧 3php中檢查email完整性 4用PHP完成XML備份Mysql數(shù)據(jù)庫(kù) 5PHP程序員一般都忽略了的幾點(diǎn)精華 6IIS6架設(shè)網(wǎng)站經(jīng)常見(jiàn)問(wèn)題及癥狀舉例答疑 7ASP調(diào)用WEBSERVICE文檔 8使用函數(shù)遞歸完成基于php與MySQL的動(dòng)態(tài)樹(shù)型菜單 9用Asp取得Dll加密新聞內(nèi)容 10ASP中取得圖片寬度與高度的類（無(wú)組件） 11容易設(shè)置IIS設(shè)置PHP調(diào)試環(huán)境 12PHP 腳本：隨心所欲的代碼逐漸流行
相關(guān)文章使用ASP完成事務(wù)處理的方法 PHP 腳本：隨心所欲的代碼逐漸流行容易設(shè)置IIS設(shè)置PHP調(diào)試環(huán)境 ASP中取得圖片寬度與高度的類（無(wú)組件）用Asp取得Dll加密新聞內(nèi)容使用函數(shù)遞歸完成基于php與MySQL的動(dòng)態(tài)樹(shù)型菜單 ASP調(diào)用WEBSERVICE文檔 IIS6架設(shè)網(wǎng)站經(jīng)常見(jiàn)問(wèn)題及癥狀舉例答疑 PHP程序員一般都忽略了的幾點(diǎn)精華用PHP完成XML備份Mysql數(shù)據(jù)庫(kù) php中檢查email完整性使用Session記錄頁(yè)面地址與完成頁(yè)面返回技巧

搜索引擎核心技術(shù)(PHP編程思路) --[1]

推薦資訊 總?cè)藲獍?/span>

最新教程 本月人氣

相關(guān)文章

推薦資訊總?cè)藲獍?/span>

最新教程本月人氣