搜索引擎研究范文
時(shí)間:2023-04-02 18:55:54
導(dǎo)語(yǔ):如何才能寫(xiě)好一篇搜索引擎研究,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
1.“確解用戶(hù)之意,切返用戶(hù)之需?!?/p>
2.“門(mén)戶(hù)網(wǎng)站都想著是怎樣省錢(qián),而不是怎樣花錢(qián)來(lái)買(mǎi)技術(shù)?!?/p>
3.“搜索引擎不是人人都能做的領(lǐng)域,進(jìn)入的門(mén)檻比較高。”
4.“只是優(yōu)秀還不夠,最好的方式是將一件事情做到極致?!?google十大真理)
5.“做搜索引擎需要專(zhuān)注”“對(duì)于一項(xiàng)排到第四的業(yè)務(wù),門(mén)戶(hù)很難做到專(zhuān)注?!?/p>
6.“用戶(hù)無(wú)法描述道他要找什么,除非讓他看到想找的東西?!?/p>
7.“所謂楔形,其實(shí)就是個(gè)倒三角,倒三角的尖端部分代表搜索技術(shù),中部是基于技術(shù)的產(chǎn)品應(yīng)用平臺(tái),最上端是對(duì)整個(gè)搜索引擎用戶(hù)人群文化的認(rèn)識(shí)和理解,以及現(xiàn)代公司競(jìng)爭(zhēng)最關(guān)鍵也最捉摸不定的所謂品牌?!薄靶ㄐ巍碧N(yùn)涵的另一個(gè)意義是:楔子要打到墻里,尖端是否銳利很重要,但楔子的破壞性有多強(qiáng),究竟能在墻面擠壓出多大的空間,其中端、后端的沉穩(wěn)與厚重才是關(guān)鍵。
搜索引擎的技術(shù)和理念都是需要時(shí)間和經(jīng)驗(yàn)的積累的,更是需要長(zhǎng)期不斷的完善進(jìn)步的,絕對(duì)不要認(rèn)為可以一蹴而就,要達(dá)到一個(gè)相對(duì)成熟領(lǐng)先的搜索引擎從開(kāi)始到領(lǐng)先的周期一般需要是四年。著急不得。原因是因?yàn)樗阉饕嫣珡?fù)雜,而且“用戶(hù)無(wú)法描述他要找什么,除非讓他看到想找的東西?!币磺卸夹枰?,嘗試,問(wèn)題需要一個(gè)一個(gè)解決,用戶(hù)的需要得一點(diǎn)點(diǎn)的挖掘。搜索引擎是一個(gè)產(chǎn)品,給用戶(hù)提供服務(wù)的產(chǎn)品,需要長(zhǎng)期的不斷的改進(jìn)升級(jí)調(diào)整才能持續(xù)不斷的提用戶(hù)體驗(yàn),需要滿(mǎn)足用戶(hù)不斷增長(zhǎng)并且變化的需求、需要不斷適應(yīng)網(wǎng)絡(luò)的變化。這是因?yàn)榫W(wǎng)絡(luò)環(huán)境是不斷變化的、網(wǎng)民的需求也是不斷變化的。千萬(wàn)不要把搜索當(dāng)成項(xiàng)目來(lái)做,做完了撂那讓用戶(hù)去用那你肯定沒(méi)戲。在搜索引擎領(lǐng)域是講體驗(yàn)的、新的引擎如果用戶(hù)體驗(yàn)一旦整體上有領(lǐng)先一年以上的差距并且持續(xù)2年,那前期的領(lǐng)先者的優(yōu)勢(shì)就蕩然無(wú)存,因?yàn)樗阉饕娴挠脩?hù)轉(zhuǎn)移成本相對(duì)而言是比較低的而且口碑是最佳的傳播方式。如果一個(gè)搜索引擎不能持續(xù)不斷的技術(shù)創(chuàng)新理念創(chuàng)新,那對(duì)于這個(gè)搜索引擎來(lái)說(shuō)就等于死亡。我們一般形容搜索引擎的領(lǐng)先是以時(shí)間計(jì)算的。比如:中搜離百度整體差距×年,百度離google的整體差距×年,……只要你能在用戶(hù)體驗(yàn)上保持一年的領(lǐng)先優(yōu)勢(shì)持續(xù)2年,不需要炒作,一切紛至沓來(lái)。在用戶(hù)體驗(yàn)面前,任何的炒作都顯得很渺小。作垂直搜索引擎,麻雀雖小,但是五臟俱全。無(wú)論理念文化、產(chǎn)品管理、應(yīng)用、技術(shù)都和搜索引擎的楔形理論沒(méi)有什么區(qū)別。所以要做好一垂直搜索必須解決這幾個(gè)方面。
楔形的尖:垂直搜索技術(shù)。
垂直搜索技術(shù)主要分為兩個(gè)層次:模板級(jí)和網(wǎng)頁(yè)庫(kù)級(jí)。模板級(jí)是針對(duì)網(wǎng)頁(yè)進(jìn)行模板設(shè)定或者自動(dòng)生成模板的方式抽取數(shù)據(jù),對(duì)網(wǎng)頁(yè)的采集也是針對(duì)性的采集,適合規(guī)模比較小、信息源少且穩(wěn)定的需求,優(yōu)點(diǎn)是快速實(shí)施、成本低、靈活性強(qiáng),缺點(diǎn)是后期維護(hù)成本高,信息源和信息量小。網(wǎng)頁(yè)庫(kù)級(jí)就是在信息源數(shù)量上、數(shù)據(jù)容量上檢索容量上、穩(wěn)定性可靠性上都是網(wǎng)頁(yè)庫(kù)搜索引擎級(jí)別的要求,和模板方式最大的區(qū)別是對(duì)具體網(wǎng)頁(yè)不依賴(lài),可針對(duì)任意正常的網(wǎng)頁(yè)進(jìn)信息采集信息抽取……。這就導(dǎo)致這種方式數(shù)據(jù)容量上和模板方式有質(zhì)的區(qū)別,但是其靈活性差、成本高。當(dāng)然模板方式和網(wǎng)頁(yè)庫(kù)級(jí)的方式不是對(duì)立的,這兩者對(duì)于垂直搜索引擎來(lái)說(shuō)是相互補(bǔ)充的,因?yàn)榧夹g(shù)只是手段,目的是切反用戶(hù)之需。本文談及的技術(shù)主要是指網(wǎng)頁(yè)庫(kù)級(jí)別垂直搜索引擎技術(shù)。搜索引擎的確是一項(xiàng)對(duì)技術(shù)要求比較高的應(yīng)用,幾年前相關(guān)的人才也比較少。現(xiàn)在搜索技術(shù)人才多了,相關(guān)的技術(shù)和技術(shù)的應(yīng)用得相對(duì)以前而言更加成熟,但是競(jìng)爭(zhēng)也更加激烈了。
垂直搜索大致需要以下技術(shù):
1.信息采集技術(shù)
2.網(wǎng)頁(yè)信息抽取技術(shù)
3.信息的處理技術(shù),包括:重復(fù)識(shí)別、重復(fù)識(shí)別、聚類(lèi)、比較、分析、語(yǔ)料分析等
4.語(yǔ)意相關(guān)性分析
5.分詞
6.索引
信息采集技術(shù),垂直搜索引擎spider和網(wǎng)頁(yè)庫(kù)的spider相比應(yīng)該是更加專(zhuān)業(yè),可定制化。可定向性的采集和垂直搜索范圍相關(guān)的網(wǎng)頁(yè)忽略不相關(guān)的網(wǎng)頁(yè)和不必要的網(wǎng)頁(yè),選擇內(nèi)容相關(guān)的以及適合做進(jìn)一步處理的網(wǎng)頁(yè)深度優(yōu)先采集、對(duì)頁(yè)面有選擇的調(diào)整更新頻率……,采集可通過(guò)人工設(shè)定網(wǎng)址和網(wǎng)頁(yè)分析url方式共同進(jìn)行。垂直搜索對(duì)信息的更新有著特別的要求,根據(jù)這些特點(diǎn)可以從以下幾點(diǎn)考慮1.信息源的穩(wěn)定性(不能讓信息源網(wǎng)站感覺(jué)到spider的壓力)2.抓取的成本問(wèn)題3.對(duì)用戶(hù)體驗(yàn)改善程度。根據(jù)以上幾點(diǎn)制定一種比較好的策略,要做到恰到好處。策略上可以評(píng)估網(wǎng)站/網(wǎng)頁(yè)更新的系數(shù)、網(wǎng)站/網(wǎng)頁(yè)的重要系數(shù)、用戶(hù)點(diǎn)擊系數(shù)(或曝光系數(shù))、網(wǎng)站穩(wěn)定系數(shù)……,根據(jù)這些系數(shù)來(lái)確定對(duì)這些網(wǎng)站/網(wǎng)頁(yè)更新的頻率。再由于新信息和更新了的信息list頁(yè)面前面或者首頁(yè),所以對(duì)網(wǎng)頁(yè)進(jìn)行很好的分級(jí)可以以低成本很好的解決更新問(wèn)題,系數(shù)比較低的網(wǎng)頁(yè)一月update一次,稍微高點(diǎn)的一周update一次、中等的幾天到一天一次、高的幾小時(shí)到幾分鐘一次。類(lèi)似搜索引擎的大庫(kù)、周庫(kù)、日庫(kù),小時(shí)庫(kù)……基于視覺(jué)網(wǎng)頁(yè)塊分析技術(shù),模擬IE瀏覽器的顯示方式,對(duì)網(wǎng)頁(yè)進(jìn)行解析。根據(jù)人類(lèi)視覺(jué)原理,把網(wǎng)頁(yè)解析處理的結(jié)果,進(jìn)行分塊,再根據(jù)需要,對(duì)這些塊進(jìn)行處理,如:采集定向、介紹抽取和一些必要的內(nèi)容的抽取正文抽取……結(jié)構(gòu)化信息抽取技術(shù),將網(wǎng)頁(yè)中的非結(jié)構(gòu)化數(shù)據(jù)按照一定的需求抽取成結(jié)構(gòu)化數(shù)據(jù)。有兩種方式,簡(jiǎn)單的就是模板方式,另外就是對(duì)網(wǎng)頁(yè)不依賴(lài)web結(jié)構(gòu)化信息抽取方式,這兩種方式可以互取長(zhǎng)處,以最簡(jiǎn)單最有效的辦法滿(mǎn)足需求。垂直搜索引擎和通用搜索引擎最大的區(qū)別就是對(duì)網(wǎng)頁(yè)信息結(jié)構(gòu)化抽取后再結(jié)構(gòu)化數(shù)據(jù)進(jìn)行深度的處理,提供專(zhuān)業(yè)的搜索服務(wù)。所以web結(jié)構(gòu)化信息抽取的技術(shù)水平是決定垂直搜索引擎質(zhì)量的重要技術(shù)指標(biāo)。其實(shí)web結(jié)構(gòu)化信息抽取在百度、google早已經(jīng)廣泛應(yīng)用了,如:MP3、圖片搜索、google的本地搜索就是從網(wǎng)頁(yè)庫(kù)抽取出企業(yè)信息,添加到其地圖搜索中的,google通過(guò)這種技術(shù)正在顛覆做內(nèi)容的方式。同樣的技術(shù)應(yīng)用還在qihoo、sogou購(gòu)物、shopping等各種應(yīng)用中體現(xiàn)。簡(jiǎn)單的語(yǔ)法分析,簡(jiǎn)單的語(yǔ)法分析在搜索引擎中非常重要,可以通過(guò)簡(jiǎn)單的語(yǔ)法分析來(lái)改善數(shù)據(jù)的質(zhì)量,低成本的獲得某類(lèi)信息,改善排序,尋找需要的內(nèi)容……信息處理技術(shù),信息處理包括的范圍比較廣,主要包括去重、聚類(lèi)、分析……,這根據(jù)需要相關(guān)的技術(shù)就非常多。
數(shù)據(jù)挖掘,找出您的信息的關(guān)聯(lián)性對(duì)于垂直搜索來(lái)說(shuō)非常重要,有效,可以在這些相關(guān)性上為用戶(hù)提供更細(xì)致的服務(wù)。
分詞技術(shù),面向搜索的分詞技術(shù),建立和您的行業(yè)相關(guān)的詞庫(kù)。注意這是面向搜索的分詞,不是面向識(shí)別和準(zhǔn)確的分詞。就這個(gè)工作安排十幾個(gè)人不停的維護(hù)也不會(huì)嫌多。索引技術(shù),索引技術(shù)對(duì)于垂直搜索非常關(guān)鍵,一個(gè)網(wǎng)頁(yè)庫(kù)級(jí)的搜索引擎必須要支持分布索引、分層建庫(kù)、分布檢索、靈活的更新、靈活的權(quán)值調(diào)整、靈活的索引和靈活的升級(jí)擴(kuò)展、高可靠性穩(wěn)定性冗余性。還需要支持各種技術(shù)的擴(kuò)展,如偏移量計(jì)算等。其它技術(shù),略。
垂直搜索引擎的技術(shù)評(píng)估應(yīng)從以下幾點(diǎn)來(lái)判斷
1.全面性
2.更新性
3.準(zhǔn)確性
4.功能性
鍥形的中和尾:產(chǎn)品應(yīng)用平臺(tái)和對(duì)搜索引擎文化理念的理解
對(duì)于任何一個(gè)產(chǎn)品來(lái)說(shuō),產(chǎn)品的模式是最重要的,技術(shù)只是手段、工具、途徑。用戶(hù)不會(huì)關(guān)心你的技術(shù)是如何實(shí)現(xiàn)的、更不會(huì)關(guān)心你的技術(shù)水平是什么樣的,只要用戶(hù)感覺(jué):這就是我需要的東西,很好用,而且是最好用的。那么你的產(chǎn)品就OK了??紤]一個(gè)產(chǎn)品的模式需要考慮的東西很多,如:用戶(hù)需要什么?需求有多大?能不能完整的實(shí)現(xiàn)用戶(hù)的需求?需要什么資源?怎么做到?競(jìng)爭(zhēng)分析?差異化?根據(jù)自身情況能做到什么程度?怎么樣保持領(lǐng)先優(yōu)勢(shì)?能否收到錢(qián)?怎么樣收錢(qián)?怎么樣推廣?需要多少時(shí)間?如何保證在時(shí)間窗口期內(nèi)有效完成進(jìn)度?如何分步分期優(yōu)先完成用戶(hù)最需要的需求?如何建立有效的反饋機(jī)制讓我可以了解用戶(hù)的需求變化和挖掘用戶(hù)自己也無(wú)法表達(dá)的需求?如何進(jìn)一步改善?分期需要多大的投入?如何降低整體成本和前期成本?如何分期投入?投資回報(bào)比?周期?……
1.確解用戶(hù)之意
任何應(yīng)用最難的就是了解用戶(hù)的需求,甚至是用戶(hù)自己都不知道的需求。
建立完善的、快速的用戶(hù)意見(jiàn)反饋機(jī)制和用戶(hù)需求調(diào)查機(jī)制,所有人都應(yīng)傾聽(tīng)用戶(hù)的牢騷、建議。不斷的分析、修改。
2.切返用戶(hù)之需
滿(mǎn)足用戶(hù)的需求,一切紛至沓來(lái)。不需要炒作,請(qǐng)把您的資源多多花費(fèi)在為用戶(hù)提供良好的體驗(yàn)上來(lái)。
3.不要干擾用戶(hù)的意圖,培養(yǎng)用戶(hù)的使用習(xí)慣和技巧
有一個(gè)故事是這樣的:還在yahoo使用google的搜索的時(shí)候,華爾街的幾個(gè)分析師來(lái)評(píng)估這兩個(gè)搜索哪個(gè)好用,去掉logo。結(jié)果一致評(píng)價(jià)yahoo的檢索效果好。因?yàn)閥ahoo是使用的google檢索結(jié)果,并且對(duì)熱點(diǎn)關(guān)鍵詞進(jìn)行了人工調(diào)整。但是一轉(zhuǎn)身這些分析師回到自己的電腦邊查詢(xún)東西,不約而同的打開(kāi)了google。
4.細(xì)節(jié)決定成敗
信息不是越多越好,在海量的信息時(shí)代,如果不能妥善的整理信息,那就等于沒(méi)有信息。每個(gè)頁(yè)面的每個(gè)字,每個(gè)像素、圖片的放置都值得花費(fèi)時(shí)間去琢磨。把用戶(hù)最需要的放在最顯眼的位置,次需要的放置到更多頁(yè)面,不需要的扔掉。
5.將一件事情做到極致
不僅僅要關(guān)注80%的用戶(hù)的80%的需求,20%的用戶(hù)的20%的需求是您成敗關(guān)鍵所在。
6.專(zhuān)注
這么多需要你解決的問(wèn)題,你還能干其它事情?對(duì)于一個(gè)排在第四的業(yè)務(wù)你是沒(méi)有機(jī)會(huì)的。所以垂直搜索引擎的成功肯定不是具備良好資源的行業(yè)門(mén)戶(hù)、也不會(huì)是大搜索的公司,必然是專(zhuān)注于某一行業(yè)的搜索引擎公司。因?yàn)橹挥袑?zhuān)注,才能將一件事情做到極致。
7.創(chuàng)新
失敗不要緊,但是如果搜索引擎公司沒(méi)有創(chuàng)新,那這個(gè)搜索引擎公司必然面向的就是死亡。
8.需要完全掌握主要技術(shù)。
一個(gè)核心業(yè)務(wù)不可能通過(guò)外包手段來(lái)解決技術(shù)問(wèn)題。雖然找個(gè)大公司外包技術(shù)看起來(lái)很美麗,很快速,甚至成本比較低。但是這是在毀滅你的將來(lái)。因?yàn)檫@是產(chǎn)品,不是項(xiàng)目。產(chǎn)品是需要不斷完善調(diào)整的,用戶(hù)的需求也是變化的需要挖掘的,互聯(lián)網(wǎng)也是變化的,你外包技術(shù)絕對(duì)不可能做到靈活、及時(shí)滿(mǎn)足各種變化。在和競(jìng)爭(zhēng)對(duì)手競(jìng)爭(zhēng)的時(shí)候您如何保持您的領(lǐng)先優(yōu)勢(shì)?(前文說(shuō)了,如果被對(duì)手保持領(lǐng)先一段時(shí)間,那么你之前的領(lǐng)先優(yōu)勢(shì)就蕩然無(wú)存)。這里還沒(méi)有考慮競(jìng)爭(zhēng)問(wèn)題,購(gòu)買(mǎi)其它搜索引擎公司的技術(shù),對(duì)方會(huì)不會(huì)把真正的技術(shù)毫不保留的賣(mài)給你。再說(shuō),賣(mài)你你你能搞懂嗎?技術(shù)再困難也要自行解決。否則你注定失敗。最好的辦法就是購(gòu)買(mǎi)核心技術(shù)縮短研發(fā)周期、成本、風(fēng)險(xiǎn),再在這個(gè)核心技術(shù)進(jìn)行自主研發(fā)。這是垂直搜索的技術(shù)門(mén)檻,看似不高,其實(shí)很高。
對(duì)于技術(shù)問(wèn)題可以迂回解決,用最簡(jiǎn)單的技術(shù)滿(mǎn)足用戶(hù)最迫切的需求。用戶(hù)是不會(huì)關(guān)心技術(shù)實(shí)現(xiàn)的。模板方式可以是網(wǎng)頁(yè)結(jié)構(gòu)化信息抽取技術(shù)的補(bǔ)充。對(duì)于可行的應(yīng)用早期采用模板技術(shù)也是不錯(cuò)的選擇。比如chinabbs就做的很好,用戶(hù)的主要需求是要瀏覽到好的帖子,所以加強(qiáng)內(nèi)容的建設(shè),找高水平的編輯做推薦,而且在界面和易用性上也很不錯(cuò)。領(lǐng)先qihoo。技術(shù)方面他們初期采用的應(yīng)該是模板自動(dòng)生成方式采集論壇信息,比qihoo技術(shù)水平差,但是這目前不是用戶(hù)需求的關(guān)鍵,而且qihoo技術(shù)水平層次雖然高但是如果不成熟,體現(xiàn)給用戶(hù)的東西未必就強(qiáng)。Chinabbs接下來(lái)再解決技術(shù)難點(diǎn),在技術(shù)上有提升,那么他就能持續(xù)保持領(lǐng)先優(yōu)勢(shì)了。(但是話(huà)又說(shuō)回來(lái),招聘好的編輯很容易,技術(shù)要提升一個(gè)層次并且成熟很難,而且很耗費(fèi)時(shí)間,當(dāng)然用戶(hù)習(xí)慣和知名度也是需要很長(zhǎng)時(shí)間培養(yǎng)的)
9.用最簡(jiǎn)單的技術(shù)實(shí)現(xiàn)用戶(hù)最迫切的需要
技術(shù)重要,但是技術(shù)的使用得當(dāng)更重要,技術(shù)是為用戶(hù)體驗(yàn)服務(wù)的。只要能滿(mǎn)足用戶(hù)需要,什么技術(shù)都可以,簡(jiǎn)單不代表不行,用最簡(jiǎn)單的技術(shù)實(shí)現(xiàn)用戶(hù)最迫切的需要。百度的整體技術(shù)我認(rèn)為離google中文至少有1年以上差距,很多方面差距更大,但是百度的效果比google好,原因就是將簡(jiǎn)單的技術(shù)用于實(shí)現(xiàn)用戶(hù)迫切的需求。舉個(gè)我身邊的例子來(lái)描述簡(jiǎn)單的技術(shù)實(shí)現(xiàn)需求:我把我們的基于視覺(jué)的網(wǎng)頁(yè)塊分析的正文抽取技術(shù)演示給一好友看,好友看后說(shuō):我們也實(shí)現(xiàn)了。我大驚,他們不是做搜索的,居然也實(shí)現(xiàn)了!他告訴我他們實(shí)現(xiàn)的方法后,我再次吃驚,深感簡(jiǎn)單的技術(shù)也可以很好的解決問(wèn)題,雖然不完全解決,但是能滿(mǎn)足自己的需求就好。他們的解決方法是:對(duì)網(wǎng)頁(yè)的html進(jìn)行分析,將整段文字中沒(méi)有html代碼的文字提取出來(lái),這就是正文。(驚嘆??!如此簡(jiǎn)單?。∽ⅲ核麄兊男畔⒃炊际沁@樣的格式)
10.根據(jù)中國(guó)本土互聯(lián)網(wǎng)特點(diǎn),強(qiáng)力的antispam,對(duì)信息進(jìn)行清洗。
11.很多人誤解垂直搜索就是把相關(guān)的行業(yè)網(wǎng)頁(yè)做一個(gè)采集,進(jìn)行正文抽取,實(shí)現(xiàn)搜索,完成信息冊(cè)查詢(xún)。其實(shí)并非如此。如果這樣無(wú)法和網(wǎng)頁(yè)搜索競(jìng)爭(zhēng),網(wǎng)頁(yè)搜索很容易就可以將網(wǎng)頁(yè)庫(kù)按行業(yè)分類(lèi)、按地區(qū)分類(lèi)。
篇2
隨著互聯(lián)網(wǎng)技術(shù)和互聯(lián)網(wǎng)應(yīng)用系統(tǒng)的快速發(fā)展,各個(gè)領(lǐng)域的互聯(lián)網(wǎng)應(yīng)用系統(tǒng)都已經(jīng)積累了海量的Web數(shù)據(jù),包括產(chǎn)品數(shù)據(jù)、用戶(hù)數(shù)據(jù)、評(píng)價(jià)數(shù)據(jù)、關(guān)聯(lián)數(shù)據(jù)、狀態(tài)數(shù)據(jù)等等。這些數(shù)據(jù)不僅內(nèi)容極其豐富,而且很大程度上都開(kāi)放給互聯(lián)網(wǎng)用戶(hù),可以免費(fèi)的訪問(wèn)、下載和處理。這就為進(jìn)一步集成和開(kāi)發(fā)這些Web數(shù)據(jù)的潛在價(jià)值,建立增值應(yīng)用提供了重要基礎(chǔ)。聚類(lèi)搜索是近年來(lái)發(fā)展最為迅速的互聯(lián)網(wǎng)數(shù)據(jù)集成和增值技術(shù)。聚類(lèi)搜索是在垂直搜索基礎(chǔ)上發(fā)展起來(lái)的新型搜索技術(shù)。垂直搜索是主要針對(duì)行業(yè)的專(zhuān)業(yè)搜索,側(cè)重于某一行業(yè)領(lǐng)域,其目的是使用戶(hù)能夠更加方便地找出所需的專(zhuān)業(yè)信息。而聚類(lèi)搜索是為了進(jìn)一步提高搜索的精度使其符合用戶(hù)的搜索習(xí)慣和興趣,在搜索引擎的搜索結(jié)果中進(jìn)行聚類(lèi),把搜索出來(lái)的信息進(jìn)行分類(lèi)處理,將使信息資源更加清晰明了。
目前國(guó)內(nèi)對(duì)聚類(lèi)搜索引擎的綜述主要見(jiàn)于文獻(xiàn)[1]和文獻(xiàn)[2],雖然這兩篇文章對(duì)聚類(lèi)搜索引擎進(jìn)行了很好的綜述和分析,對(duì)聚類(lèi)搜索引擎的形成和發(fā)展過(guò)程進(jìn)行了說(shuō)明,并對(duì)主流聚類(lèi)搜索系統(tǒng)進(jìn)行了測(cè)評(píng)和分析,但是對(duì)于聚類(lèi)系統(tǒng)的功能分析還不夠詳盡,對(duì)于聚類(lèi)搜索引擎未來(lái)的發(fā)展沒(méi)有給出明確的定位。
本文首先給出了典型聚類(lèi)搜索引擎系統(tǒng)的基本工作流程,對(duì)聚類(lèi)搜索引擎的發(fā)展歷史和現(xiàn)狀進(jìn)行了概括式綜述,然后從聚類(lèi)對(duì)象、聚類(lèi)功能和聚類(lèi)算法三個(gè)角度對(duì)聚類(lèi)搜索引擎進(jìn)行研究,并全面分析了若干著名聚類(lèi)搜索引擎。
本文結(jié)構(gòu):第1節(jié)介紹聚類(lèi)搜索引擎的發(fā)展現(xiàn)狀;第2節(jié)對(duì)聚類(lèi)搜索引擎的功能進(jìn)行分析;第3節(jié)對(duì)典型聚類(lèi)搜索引擎進(jìn)行綜述;第4節(jié)描述聚類(lèi)搜索引擎的發(fā)展趨勢(shì);第5節(jié)總結(jié)全文。
1聚類(lèi)搜索引擎的研究現(xiàn)狀
1.1聚類(lèi)搜索引擎概念和工作過(guò)程
所謂聚類(lèi)搜索引擎,就是運(yùn)用聚類(lèi)技術(shù)對(duì)搜索結(jié)果進(jìn)行自動(dòng)聚類(lèi)分析的搜索工具。其特點(diǎn)是去重性強(qiáng)、分類(lèi)性強(qiáng)、匯集性強(qiáng),即可以及時(shí)去除重復(fù)信息,對(duì)搜索的結(jié)果進(jìn)行分門(mén)別類(lèi),并可以匯集各大知名搜索引擎的信息資源。目前,典型的聚類(lèi)搜索引擎的基本工作步驟為:①依據(jù)用戶(hù)查詢(xún)的關(guān)鍵字,從一個(gè)或多個(gè)搜索引擎獲取搜索結(jié)果;②對(duì)搜索結(jié)果進(jìn)行預(yù)處理,過(guò)濾掉重復(fù)、無(wú)效信息;③將文檔中關(guān)鍵短語(yǔ)作為特征提取出來(lái)生成聚類(lèi)標(biāo)簽;④將文檔分配到生成的聚類(lèi)標(biāo)簽下;⑤將聚類(lèi)后的搜索結(jié)果進(jìn)行排序并顯示給用戶(hù)。
1.2國(guó)內(nèi)外聚類(lèi)搜索引擎的發(fā)展現(xiàn)狀
搜索引擎的發(fā)展階段總共經(jīng)歷了三個(gè)階段[3],其中第1代搜索引擎主要是基于人工分類(lèi)的通用搜索;第2代主要依靠機(jī)器進(jìn)行自動(dòng)爬取和分析,利用鏈接分析技術(shù)實(shí)現(xiàn)更為準(zhǔn)確的搜索,如Google、百度等;第3代搜索引擎更加體現(xiàn)了智能化、互動(dòng)式和人性化。功能包括自動(dòng)聚類(lèi)、去重、用戶(hù)習(xí)慣記憶等方面,是未來(lái)搜索引擎主要的發(fā)展方向。
近幾年,國(guó)際上對(duì)聚類(lèi)搜索引擎系統(tǒng)的研究日漸火熱,已經(jīng)出現(xiàn)了一些知名的聚類(lèi)搜索系統(tǒng)。其中,Scatter/Gather系統(tǒng)[4]是第一個(gè)在搜索引擎上使用聚類(lèi)方法的系統(tǒng);Vivisimo[5]是一種商業(yè)化聚類(lèi)搜索引擎,符合用戶(hù)使用習(xí)慣,搜索效率高?;贘ava的開(kāi)源Carrot2聚類(lèi)搜索引擎[5]可自動(dòng)的把搜索結(jié)果歸類(lèi)到相應(yīng)的語(yǔ)義類(lèi)別中,它的一個(gè)亮點(diǎn)是速度和易用性的提高。中文搜索領(lǐng)域,早期比較有實(shí)力的聚類(lèi)搜索引擎有Bbmao,Bbmao搜索系統(tǒng)推出了去重功能,為網(wǎng)民解決了大量閱讀重復(fù)信息的煩惱。Bbmao的聚類(lèi)功能,能夠提高查找信息的效率,它還具有云集各大搜索引擎結(jié)果的功能,同時(shí)完成海量信息的分門(mén)別類(lèi)。近期出現(xiàn)的baigoogleledu綜合了谷歌、百度兩大搜索引擎。其基本出發(fā)點(diǎn)是兩大搜索引擎的搜索結(jié)果的很大的差異性。這類(lèi)系統(tǒng)對(duì)搜索結(jié)果進(jìn)行聚類(lèi)分析,在一定程度上緩解了廣告泛濫的局面,使用戶(hù)更便捷地找到需要的信息。
有關(guān)國(guó)內(nèi)外聚類(lèi)搜索引擎的相關(guān)技術(shù),主要有聚類(lèi)分析、聚類(lèi)算法、中文信息處理等技術(shù)。Anton等人[7]致力于把分類(lèi)體系引入評(píng)估體系來(lái)評(píng)價(jià)聚類(lèi)效果質(zhì)量的研究。Sudipto Guha等研究人員[8]應(yīng)用概念關(guān)聯(lián)代替?zhèn)鹘y(tǒng)的計(jì)算歐式距離,來(lái)衡量數(shù)據(jù)之間的相似度,從而確定聚類(lèi),達(dá)到了很好的效果。
國(guó)內(nèi)一些學(xué)術(shù)組織和團(tuán)體很早就開(kāi)始對(duì)自動(dòng)文本分類(lèi)、聚類(lèi)領(lǐng)域等相關(guān)內(nèi)容進(jìn)行研究,從“天網(wǎng)”和“網(wǎng)絡(luò)指南針”開(kāi)始北京大學(xué)和清華大學(xué)就開(kāi)始致力于網(wǎng)頁(yè)的聚類(lèi)技術(shù)研究。此外,北京科技大學(xué)的麻雪云提出了一種基于關(guān)鍵名詞短語(yǔ)聚類(lèi)的中文搜索結(jié)果聚類(lèi)方法[9],利用百度、谷歌、雅虎三大搜索引擎來(lái)獲取互聯(lián)網(wǎng)信息,對(duì)搜索結(jié)果進(jìn)行聚類(lèi)分析。國(guó)防科技大學(xué)的肖坤對(duì)STC算法和Lingo算法進(jìn)行了比較,并對(duì)STC算法進(jìn)行了改進(jìn),設(shè)計(jì)實(shí)現(xiàn)了一個(gè)面向校園網(wǎng)聚類(lèi)搜索引擎系統(tǒng)[10]。
2聚類(lèi)搜索引擎的功能分析
2.1聚類(lèi)對(duì)象分析
現(xiàn)有聚類(lèi)搜索引擎的聚類(lèi)對(duì)象主要包括三類(lèi)數(shù)據(jù):商業(yè)數(shù)據(jù)、評(píng)價(jià)數(shù)據(jù)、社交數(shù)據(jù)。
商品數(shù)據(jù)主要包括對(duì)服裝、電器、化妝品等數(shù)據(jù)信息進(jìn)行分類(lèi)整理,例如用戶(hù)在淘寶網(wǎng)輸入“牙膏”關(guān)鍵字,在網(wǎng)頁(yè)上立馬顯示出“功能”、“品牌”、“產(chǎn)地”等分類(lèi)信息,并按照銷(xiāo)量、價(jià)格、信用進(jìn)行了排序,對(duì)商品的聚類(lèi)分析清晰明確。評(píng)價(jià)數(shù)據(jù)主要包括論壇對(duì)相關(guān)主題的討論信息,博客的交流信息,商業(yè)網(wǎng)站對(duì)商品的滿(mǎn)意度評(píng)價(jià)信息等。大連海事大學(xué)的魯明羽、姚曉娜等人提出一種基于模糊聚類(lèi)的網(wǎng)絡(luò)論壇熱點(diǎn)話(huà)題挖掘算法,通過(guò)分析帖子和用戶(hù)間的影響力傳遞,來(lái)判斷是否為焦點(diǎn)人物和熱門(mén)話(huà)題[11]。社交數(shù)據(jù)主要包括社交網(wǎng)絡(luò)注冊(cè)用戶(hù)個(gè)人資料信息、用戶(hù)關(guān)注度信息、用戶(hù)之間交互信息等社交數(shù)據(jù)資源。社交數(shù)據(jù)隱含了大量可以用于聚類(lèi)的關(guān)聯(lián)信息,對(duì)實(shí)現(xiàn)智能和個(gè)性化聚類(lèi)搜索具有重要意義。此外,聚類(lèi)對(duì)象按數(shù)據(jù)類(lèi)型還可以劃分為文本數(shù)據(jù)、多媒體數(shù)據(jù)等。
2.2聚類(lèi)功能分析
聚類(lèi)搜索引擎的聚類(lèi)功能主要有智能聚類(lèi)、去重、多媒體、覆蓋性等能力。
智能聚類(lèi):聚類(lèi)搜索引擎大多具有這項(xiàng)功能。目前做得最好的如Vivisimo系統(tǒng),它最大的特色是會(huì)對(duì)搜索結(jié)果自動(dòng)分類(lèi),采用專(zhuān)門(mén)開(kāi)發(fā)的啟發(fā)式算法來(lái)集合或聚類(lèi)原文文獻(xiàn)。
去重:去重可以取掉大部分的廣告網(wǎng)頁(yè)并節(jié)省掉用戶(hù)的選擇時(shí)間,是十分實(shí)用的一項(xiàng)聚類(lèi)功能。國(guó)內(nèi)的比比貓的去重功能非常出色,在用戶(hù)獲得多個(gè)搜索引擎的搜索結(jié)果后,比比貓可以自動(dòng)為用戶(hù)獲取最有搜索結(jié)果并取掉重復(fù)的信息。
多媒體:除了文本聚類(lèi),聚類(lèi)搜索引擎還關(guān)注視頻、音頻等多媒體信息進(jìn)行聚類(lèi)的功能,商業(yè)化、集成化、多媒體化的氣息更加濃厚。搜狗音樂(lè)推出了新版的聚類(lèi)頁(yè)面,可視化強(qiáng),用戶(hù)輸入音樂(lè)名稱(chēng),將獲得全新的聚類(lèi)結(jié)果,該結(jié)果首先按照音頻特征聚類(lèi),再按照文本信息聚類(lèi),保證搜索界面顯示的音樂(lè)相關(guān)度最高。
覆蓋性:聚類(lèi)搜索引擎一般基于一些大型通用搜索引擎的數(shù)據(jù)資源,這樣能夠保證搜索的結(jié)果覆蓋全面,可聚類(lèi)的對(duì)象內(nèi)容豐富。
2.3聚類(lèi)算法分析
聚類(lèi)搜索引擎的聚類(lèi)算法主要有層次聚類(lèi)、樹(shù)狀聚類(lèi)、網(wǎng)狀聚類(lèi)、圓形聚類(lèi)。其中Carrot2、Clusty(clusty.com)、iBoogie( iBoogie.com)等系統(tǒng)使用層次聚類(lèi)的方法,按照來(lái)源及站點(diǎn)進(jìn)行聚類(lèi)。PinkySeach[12]和Mnemomap(mnemomap.org)系統(tǒng)是使用樹(shù)狀結(jié)構(gòu)的聚類(lèi)算法,將聚類(lèi)的結(jié)果以列表的形式展示出來(lái)。UJIKO系統(tǒng)(ujiko.com)是使用圓形結(jié)構(gòu)的聚類(lèi)算法,它將搜索結(jié)果聚類(lèi)后按照主題自動(dòng)分類(lèi)成圖形界面顯示出來(lái)。Quintura系統(tǒng)(quintura.com)是使用網(wǎng)狀結(jié)構(gòu)的聚類(lèi)算法,是通過(guò)標(biāo)簽云的形式將在語(yǔ)義上相關(guān)的詞聚類(lèi),構(gòu)成網(wǎng)狀鏈接。
3典型聚類(lèi)搜索引擎
3.1 Vivisimo系統(tǒng)
Vivisimo系統(tǒng)[5]的基本步驟包括:首先系統(tǒng)自動(dòng)地、并行地向多個(gè)大型搜索引擎提交查詢(xún)請(qǐng)求,然后匯集每個(gè)查詢(xún)返回的結(jié)果,對(duì)查詢(xún)的結(jié)果進(jìn)行聚類(lèi)分析,經(jīng)過(guò)去重、合并、分類(lèi)等步驟后,通過(guò)輸出處理顯示給用戶(hù)。Vivisimo的聚類(lèi)對(duì)象是從多個(gè)搜索引擎返回的搜索結(jié)果,主要是文本信息。Vivisimo的聚類(lèi)功能主要是文本的聚類(lèi),通過(guò)對(duì)文本內(nèi)容進(jìn)行搜索和歸類(lèi)分析,vivisimo的軟件可以使用戶(hù)從沒(méi)有預(yù)先標(biāo)記或分類(lèi)的資源中整合、分類(lèi)內(nèi)容。Vivisimo采用啟發(fā)式算法,借鑒了人工智能的理念,對(duì)檢索的結(jié)果進(jìn)行聚類(lèi),可以把文本信息自動(dòng)地分成等級(jí)排序的類(lèi)目,它的每一步都是自動(dòng)化的,不需要人工干預(yù)。
目前Vivisimo的商業(yè)應(yīng)用十分廣泛,它對(duì)信息的分類(lèi)很體貼,具有人性化。其細(xì)致的檢索結(jié)果顯示方式使它成為了業(yè)界的精品,連續(xù)多年成為“最佳元搜索引擎”。但是,Vivisimo于沒(méi)有自身的數(shù)據(jù)資源庫(kù),依附于其他大型搜索引擎,獨(dú)立性較差,檢索功能有待加強(qiáng)。
3.2 Carrot2系統(tǒng)
Carrot2是基于Java開(kāi)發(fā)的開(kāi)源聚類(lèi)搜索系統(tǒng)[6],主要用于對(duì)搜索結(jié)果進(jìn)行聚類(lèi)。與Vivisimo相似,首先也是用戶(hù)輸入關(guān)鍵字在Bing、baidu、google等知名搜索引擎進(jìn)行搜索,然后對(duì)返回的搜索結(jié)果進(jìn)行聚類(lèi),并通過(guò)樹(shù)形的分類(lèi)圖進(jìn)行顯示出來(lái)。Carrot2的聚類(lèi)對(duì)象主要是各大搜索引擎返回的搜索結(jié)果,其通過(guò)文檔聚類(lèi)平臺(tái)workbench,對(duì)搜索的數(shù)據(jù)進(jìn)行聚類(lèi)分析,并通過(guò)文檔聚類(lèi)服務(wù)器DCS,將聚類(lèi)結(jié)果作為REST服務(wù)呈現(xiàn)。最后,Carrot2以WebApp方式將聚類(lèi)結(jié)果作為網(wǎng)絡(luò)應(yīng)用呈現(xiàn)給終端用戶(hù)。Carrot2采用的聚類(lèi)算法主要是Lingo(基于奇異值分解的索引結(jié)果聚類(lèi))算法和STC(Suffix Tree Clustering)后綴樹(shù)聚類(lèi)算法。
目前Carrot2支持的聚類(lèi)算法較多,代碼開(kāi)源可以進(jìn)行版本的更新和改進(jìn)。該系統(tǒng)應(yīng)用廣泛、可移植性較好。但是Carrot2中文分詞效果不好,可視化效果不佳。
4聚類(lèi)搜索引擎發(fā)展趨勢(shì)
文獻(xiàn)[1]通過(guò)對(duì)大量搜索引擎的評(píng)測(cè),發(fā)現(xiàn)獨(dú)立性差、專(zhuān)用算法欠缺、搜索速度慢等一系列問(wèn)題,但該文主要對(duì)搜索結(jié)果的聚類(lèi)方法進(jìn)行了評(píng)測(cè),對(duì)聚類(lèi)搜索引擎的趨勢(shì)的分析也主要側(cè)重于聚類(lèi)方法。本文認(rèn)為聚類(lèi)搜索引擎未來(lái)將向數(shù)據(jù)海量化,鏈接社交化,聚類(lèi)綜合化三個(gè)方向發(fā)展。
4.1數(shù)據(jù)海量化
現(xiàn)階段的聚類(lèi)搜索由于數(shù)據(jù)集較為單一,聚類(lèi)算法過(guò)于老舊,造成呈現(xiàn)給用戶(hù)的檢索結(jié)果數(shù)量少,內(nèi)容貧乏,這樣必然影響聚類(lèi)搜索的發(fā)展壯大。所以未來(lái)聚類(lèi)搜索必然要向數(shù)據(jù)海量化發(fā)展。近期,美國(guó)互聯(lián)網(wǎng)公司“耶寶”日前推出一種更具人性化的搜索引擎,有別于當(dāng)今主流搜索引擎網(wǎng)站提供的單維搜索,并非一般的羅列搜索結(jié)果,而是通過(guò)對(duì)搜索的詞條和海量的網(wǎng)頁(yè)的內(nèi)容進(jìn)行分析,自動(dòng)對(duì)搜索結(jié)果進(jìn)行聚類(lèi)和分類(lèi),為用戶(hù)提供豐富而直觀的結(jié)果。
4.2鏈接社交化
在搜索引擎中引入社交元素,由于目前Web社交網(wǎng)絡(luò)形成了一個(gè)巨大的Deep Web(針對(duì)網(wǎng)絡(luò)爬蟲(chóng)而言),而這個(gè)數(shù)據(jù)量對(duì)搜索引擎來(lái)說(shuō)是非常大而且有用的,搜索引擎作為用戶(hù)獲取信息的主要渠道,勢(shì)必需要這些用戶(hù)活躍度和新鮮度很高的數(shù)據(jù)資源。由于社交數(shù)據(jù)中蘊(yùn)含著大量數(shù)據(jù)之間的潛在鏈接,因此基于社交數(shù)據(jù)進(jìn)行聚類(lèi)搜索可望更好滿(mǎn)足用戶(hù)的個(gè)性化需求。
4.3聚類(lèi)綜合化
聚類(lèi)的多元化、跨領(lǐng)域、綜合化將是新型聚類(lèi)搜索的重要特點(diǎn)。局限于單個(gè)應(yīng)用領(lǐng)域的聚類(lèi)搜索已經(jīng)難以適應(yīng)需要,跨領(lǐng)域聚類(lèi)將是未來(lái)聚類(lèi)搜索面臨的主要挑戰(zhàn)。
5結(jié)束語(yǔ)
隨著Web2.0的蓬勃發(fā)展,網(wǎng)頁(yè)數(shù)量成級(jí)數(shù)增長(zhǎng),為了使互聯(lián)網(wǎng)用戶(hù)更加方便、快捷的得到需要的信息,聚類(lèi)搜索代表著一種重要搜索引擎的發(fā)展方向。隨著聚類(lèi)搜索引擎的算法和數(shù)據(jù)源的逐步完善,聚類(lèi)搜索引擎技術(shù)將得到迅猛發(fā)展和更為廣泛的應(yīng)用。(來(lái)源:電腦知識(shí)與技術(shù) 編選:)
參考文獻(xiàn):
[1]蘇建華,張燦,聚類(lèi)搜索引擎研究[J].新世紀(jì)圖書(shū)館,2009(6):72-75.
[2]蒼宏宇,譚宗穎,聚類(lèi)搜索引擎發(fā)展現(xiàn)狀研究[J],圖書(shū)情報(bào)工作,2009,53(2):125-127.
[3]沈賀丹,潘亞楠,關(guān)于搜索引擎的研究綜述[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006.16(4):147-152.
[4] Banos R,Gil C,Reca J,et,al.Implementation of scatters search for multi-objective optimization:A comparative study.Computational Optimization and Applications,2009,42(3):421-441.
[5] Koshman Sherry,Spink Amanda,Jansen Bernard.Web Seaching on the Vivisimo Search Engine[J].Journal of the American Society for Information Science and Technology,2006,57(14):1875-1887.
[6] Carrot2 Framework.Carrot2:Design of a Flexible and Efficient Web Information Retrieval Framework[C].Third International Atlantic Web Intelligence Conference(AWIC2005),Lodz,Poland,2005:439-444.
[7] Anton V Leouski,W Bruce Crift.An Evalution of Techniques for Clustering Seach Results[J].Computer Science Depart-ment,1996:1-19.
[8] Stdipto Guha,Rajeev Rastogi,Kyuseok Shim.ROCK:A Robust Clustering Algorithm for Categorical Attributes[J/OL].[2008-08-12].
[9]麻雪云,基于聚類(lèi)的元搜索引擎設(shè)計(jì)和實(shí)現(xiàn)[D].北京:北京信息科技大學(xué),2008.
[10]肖坤,面向用戶(hù)興趣的校園網(wǎng)聚類(lèi)搜索引擎的研究與實(shí)現(xiàn)[D].長(zhǎng)沙:國(guó)防科技大學(xué),2010.
篇3
關(guān)鍵詞:比較購(gòu)物;電子商務(wù);比較購(gòu)物搜索引擎
中圖分類(lèi)號(hào):F49
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1672-3198(2010)19-0330-02
1 引言
隨著Internet的不斷發(fā)展,電子商務(wù)這一全新概念急速興起,傳統(tǒng)直效營(yíng)銷(xiāo)的許多渠道已被網(wǎng)上購(gòu)物所取代。然而,為了獲得最實(shí)惠的商品,網(wǎng)上購(gòu)物消費(fèi)者必定會(huì)登陸不同的網(wǎng)上購(gòu)物網(wǎng)站,對(duì)同一商品進(jìn)行比較,這種行為會(huì)消耗客戶(hù)太多的時(shí)間,“比較購(gòu)物”為解決這一問(wèn)題打下了堅(jiān)實(shí)的基礎(chǔ)。所謂比較購(gòu)物是指為網(wǎng)上購(gòu)物消費(fèi)者提供多個(gè)購(gòu)物網(wǎng)站中同一商品的比較信息,包括商品價(jià)格、支付方式、配送方式、商家信譽(yù)度等的比較資料。目前比較購(gòu)物可以使網(wǎng)上購(gòu)物消費(fèi)者足不出戶(hù)即可“貨比三家”,使消費(fèi)者在短暫的時(shí)間內(nèi)獲得所需商品的詳細(xì)信息,從而做出購(gòu)買(mǎi)決策,當(dāng)然,由于電子商務(wù)的整體環(huán)境需進(jìn)一步完善,比較購(gòu)物也存在著一定的風(fēng)險(xiǎn)。本文從比較購(gòu)物搜索引擎的概念著手,對(duì)目前比較流行的幾個(gè)比較購(gòu)物搜索引擎進(jìn)行比較,以此為基礎(chǔ)構(gòu)建了比較購(gòu)物搜索引擎的模型,并以大拿網(wǎng)(省略)為實(shí)例,證明這個(gè)模型是可行的。
2 目前常用比較購(gòu)物搜索引擎的比較
2.1 比較購(gòu)物搜索引擎的概念
隨著加入比較購(gòu)物網(wǎng)站的服務(wù)商數(shù)量和商品數(shù)量的迅速增加,比較購(gòu)物網(wǎng)站已經(jīng)與搜索引擎具有類(lèi)似的特征,即作為用戶(hù)查詢(xún)商品信息的工具,為制定購(gòu)買(mǎi)決策提供支持,購(gòu)物搜索引擎可以理解為搜索引擎的一種細(xì)分,即在網(wǎng)上購(gòu)物領(lǐng)域的專(zhuān)業(yè)搜索引擎。購(gòu)物搜索引擎是從比較購(gòu)物網(wǎng)站發(fā)展起來(lái)的,比較購(gòu)物最初的設(shè)想,是為消費(fèi)者提供從多種在線零售網(wǎng)站中進(jìn)行商品價(jià)格、網(wǎng)站信譽(yù)、購(gòu)物方便性等方面的比較資料,隨著比較購(gòu)物網(wǎng)站的發(fā)展,其作用不僅表現(xiàn)在為在線消費(fèi)者提供方便,也為在線銷(xiāo)售上推廣產(chǎn)品提供了機(jī)會(huì),實(shí)際上也就等類(lèi)似于一個(gè)搜索引擎的作用了,并且處于網(wǎng)上購(gòu)物的需要,從比較購(gòu)物網(wǎng)站獲得的搜索結(jié)果比通用搜索引擎獲得的信息更加集中,信息也更全面(如有些比較購(gòu)物網(wǎng)站除了產(chǎn)品價(jià)值信息之外,還包含了包含對(duì)在線銷(xiāo)售商的評(píng)價(jià)等),于是比較購(gòu)物網(wǎng)站也就逐漸演變?yōu)橘?gòu)物搜索引擎。因此一些網(wǎng)站開(kāi)始逐漸放棄“比較購(gòu)物”一詞,而改稱(chēng)為“比較購(gòu)物搜索引擎”。
比較購(gòu)物搜索引擎以滿(mǎn)足消費(fèi)者的實(shí)際需求為出發(fā)點(diǎn),幫助消費(fèi)者從無(wú)數(shù)的在線銷(xiāo)售網(wǎng)站中找到自己所需要的商品與服務(wù)。比較購(gòu)物搜索引擎將從網(wǎng)上商店抽取的商品信息存儲(chǔ)到數(shù)據(jù)庫(kù)中,當(dāng)消費(fèi)者查看商品信息時(shí),系統(tǒng)將根據(jù)用戶(hù)的請(qǐng)求從數(shù)據(jù)庫(kù)中提取數(shù)據(jù),顯示給消費(fèi)者。
比較購(gòu)物搜索引擎區(qū)別于一般網(wǎng)頁(yè)搜索引擎的功能在于,除了搜索商品、了解商品說(shuō)明等基本信息外,還可以進(jìn)行商品價(jià)格比較,并對(duì)商品和在線商家進(jìn)行評(píng)級(jí),這些評(píng)比結(jié)果對(duì)于消費(fèi)者購(gòu)買(mǎi)決策有一定的影響,尤其對(duì)于知名度不是很高的在線商家,通過(guò)比較購(gòu)物搜索引擎,不僅增加了被用戶(hù)發(fā)現(xiàn)的機(jī)會(huì),若在評(píng)比上有較好的排名,也有助于增加消費(fèi)者的信任。因此,當(dāng)消費(fèi)者進(jìn)入比較購(gòu)物網(wǎng)站進(jìn)行商品信息檢索時(shí),就可以獲得比較豐富的信息,使消費(fèi)者可以做出對(duì)自己最好的決定。
2.2 比較購(gòu)物搜索引擎的比較
全國(guó)的B2C網(wǎng)上商店已經(jīng)達(dá)到10萬(wàn)家,網(wǎng)上商品數(shù)超過(guò)6000萬(wàn)件,要找到消費(fèi)者滿(mǎn)意的商品相當(dāng)困難。比較購(gòu)物成為目前最受歡迎的網(wǎng)上購(gòu)物方式,比較購(gòu)物的優(yōu)勢(shì)和好處是用戶(hù)可以對(duì)同一件商品的不同商家、不同報(bào)價(jià)進(jìn)行同時(shí)對(duì)比和選擇,更重要的是用戶(hù)可以直接比較用戶(hù)對(duì)不同商家同一產(chǎn)品的評(píng)論,對(duì)商家提供的配送服務(wù)、支付方式、售后服務(wù)、打折優(yōu)惠信息進(jìn)行透明比較,一目了然。通過(guò)比較購(gòu)物,用戶(hù)只需在一個(gè)站點(diǎn)即可真正做到貨比多家,買(mǎi)東西不吃虧。
目前中國(guó)出現(xiàn)的比較購(gòu)物網(wǎng)站正在逐步的完善中,每個(gè)比較購(gòu)物網(wǎng)站都有自己的特色,我們將通過(guò)表1對(duì)5家比較有代表性的比較購(gòu)物網(wǎng)站進(jìn)行分析:
更新速度時(shí)時(shí)更新每天更新每天更新每天更新每天更新
盈利模式競(jìng)價(jià)排行、廣告收入、與商家利潤(rùn)分成廣告收入、與商家利潤(rùn)分成廣告收入、商品銷(xiāo)售分成、商家為點(diǎn)擊付費(fèi)與商家利潤(rùn)分成、廣告收入競(jìng)價(jià)排名廣告、與商家利潤(rùn)分成、第三方購(gòu)物
經(jīng)營(yíng)范圍通信、數(shù)碼、辦公用品綜合性綜合性計(jì)算機(jī)、通信、數(shù)碼產(chǎn)品綜合性
目前我國(guó)比較購(gòu)物網(wǎng)站都能夠比較準(zhǔn)確、及時(shí)地提品基本信息,各比較購(gòu)物網(wǎng)站也有自己的特色,如:“搜易得”和“中商網(wǎng)”為顧客提供了先行賠付的服務(wù),消除了購(gòu)物者的后顧之憂(yōu);2006年,“搜易得”推出全新“點(diǎn)擊付費(fèi)模式”,可以更加直觀地更加合理地反映出商戶(hù)的收益/付出比;“中商網(wǎng)”重視本地化購(gòu)物,創(chuàng)新地提出了第三方購(gòu)物的理念。
3 比較購(gòu)物搜索引擎的模型
隨著中國(guó)互聯(lián)網(wǎng)和電子商務(wù)的發(fā)展,越來(lái)越多的B2C、C2C模式的電子商務(wù)網(wǎng)站如雨后春筍般涌現(xiàn)出來(lái),為廣大用戶(hù)提供了購(gòu)物的新途徑,并直接促成了“中國(guó)互聯(lián)網(wǎng)的第二個(gè)春天”。然而,網(wǎng)上商店由于其功能的單一性,消費(fèi)者必將花費(fèi)更多的時(shí)間和精力對(duì)多個(gè)網(wǎng)上商店的商品價(jià)格、商家信譽(yù)、支付方式、配送方式等信息進(jìn)行多次比較才能獲得自己所喜歡的商品。筆者提出的比較購(gòu)物引擎的模型(如圖1所示)使這種情況得到了一定的改善,比較購(gòu)物網(wǎng)站依托先進(jìn)的搜索技術(shù),整合眾多電子商務(wù)網(wǎng)站的資源,將其數(shù)據(jù)庫(kù)融合為一個(gè)數(shù)據(jù)庫(kù),為廣大用戶(hù)提供卓越的購(gòu)物導(dǎo)購(gòu)服務(wù)。
圖1 比較購(gòu)物搜索引擎模型
整個(gè)比較購(gòu)物的過(guò)程大致步驟如下:進(jìn)入比較購(gòu)物網(wǎng)站,填寫(xiě)相關(guān)信息(用戶(hù)名稱(chēng)、登錄密碼、郵箱等)進(jìn)行注冊(cè),注冊(cè)成功后再登錄網(wǎng)站,在搜素欄中輸入自己所要購(gòu)買(mǎi)的商品名稱(chēng)后將出現(xiàn)不同的報(bào)價(jià)范圍,消費(fèi)者根據(jù)自身?xiàng)l件比較、選擇適合自己的報(bào)價(jià)范圍,網(wǎng)站數(shù)據(jù)庫(kù)根據(jù)消費(fèi)者的選擇來(lái)提供相關(guān)信息,消費(fèi)者再通過(guò)比較不同商家的報(bào)價(jià)、商家信譽(yù)、配送方式等信息來(lái)選擇購(gòu)物網(wǎng)站進(jìn)行購(gòu)買(mǎi)。
4 實(shí)例研究
比較購(gòu)物搜索引擎的興起有效地解決了供應(yīng)方和需求方的脫節(jié)問(wèn)題,使消費(fèi)者的網(wǎng)上購(gòu)物更加方便、快捷。本文將通過(guò)比較購(gòu)物網(wǎng)站――大拿網(wǎng)來(lái)具體描述比較購(gòu)物搜索引擎的優(yōu)勢(shì)。大拿網(wǎng)(省略)是由北京賽寶時(shí)代信息技術(shù)有限公司(Beijing Cyber Times Information Technology co.,Ltd)開(kāi)發(fā)的比較購(gòu)物網(wǎng)站。大拿網(wǎng)以建立全球最大的中文比較購(gòu)物網(wǎng)站為目標(biāo),在“互惠互利”的前提下,竭力發(fā)展與廣大B2C電子商務(wù)網(wǎng)站的合作關(guān)系,為消費(fèi)者提供了價(jià)格比較、綜合搜索、信譽(yù)評(píng)級(jí)三項(xiàng)服務(wù)。下面以購(gòu)買(mǎi)“索尼T90”為例簡(jiǎn)要敘述比較購(gòu)物流程:進(jìn)入大拿網(wǎng)(省略)首頁(yè),選擇免費(fèi)注冊(cè)進(jìn)入注冊(cè)界面
填寫(xiě)相關(guān)信息提交,登錄大拿網(wǎng),在搜索欄中輸入要購(gòu)買(mǎi)的商品名稱(chēng)“索尼T90”,可以得到不同的報(bào)價(jià)范圍(如圖2所示),消費(fèi)者根據(jù)自身需求選擇合適的報(bào)價(jià)范圍后,點(diǎn)擊“查看詳情”進(jìn)入如圖3所示界面,可以查看所選報(bào)價(jià)范圍內(nèi)出售該商品的商家的信用評(píng)級(jí)、商品的價(jià)格、商品的購(gòu)買(mǎi)信息等,大拿網(wǎng)還啟用糾錯(cuò)系統(tǒng)來(lái)不斷完善比較購(gòu)物體系,消費(fèi)者根據(jù)多方面的比較后選擇合適的電子商務(wù)網(wǎng)站就可以購(gòu)得令消費(fèi)者滿(mǎn)意的商品。
5 結(jié)論
通過(guò)本文的比較分析可以知道,比較購(gòu)物搜索引擎逐漸被人們所認(rèn)識(shí)、了解并廣泛使用是可以理解的。比較購(gòu)物網(wǎng)站的出現(xiàn),使消費(fèi)者面對(duì)眾多的網(wǎng)上商店不再感到眼花繚亂而無(wú)所適從;比較購(gòu)物網(wǎng)站的出現(xiàn),可以使消費(fèi)者在最短的時(shí)間內(nèi),在浩如煙海的信息海洋中挑選出自己想要的商品,而且上手簡(jiǎn)單方便。當(dāng)然,由于電子商務(wù)整體環(huán)境還有待進(jìn)一步的完善,比較購(gòu)物搜索引擎自身也存在一定的局限性,但是,比較購(gòu)物搜索引擎為消費(fèi)者方便、快捷地購(gòu)物提出了希望。
參考文獻(xiàn)
篇4
【關(guān)鍵詞】搜索引擎;商標(biāo)侵權(quán);關(guān)鍵詞;責(zé)任認(rèn)定
一、搜索引擎商標(biāo)侵權(quán)概述
1.搜索引擎商標(biāo)侵權(quán)的界定
搜索引擎商標(biāo)侵權(quán)是指將他人的部分或者全部商標(biāo)設(shè)置為自己的Meta標(biāo)簽,或者通過(guò)競(jìng)價(jià)排名購(gòu)買(mǎi)他人的商標(biāo)作為自己的關(guān)鍵詞從而引起互聯(lián)網(wǎng)用戶(hù)的混淆,并由此牟取不正當(dāng)利益的行為。根據(jù)互聯(lián)網(wǎng)調(diào)查數(shù)據(jù)表明,在互聯(lián)網(wǎng)的熱門(mén)服務(wù)中,搜索引擎以64.5%的使用率位居第三。由于網(wǎng)頁(yè)的廣告和銷(xiāo)售收入與網(wǎng)頁(yè)的訪問(wèn)量成正比,因此網(wǎng)頁(yè)經(jīng)營(yíng)者們?yōu)榱颂岣呔W(wǎng)頁(yè)的點(diǎn)擊率、增加收入,往往都會(huì)利用搜索引擎技術(shù)吸引客戶(hù),由此引發(fā)的搜索引擎商標(biāo)侵權(quán)糾紛也就越來(lái)越多。研究搜索引擎商標(biāo)侵權(quán)問(wèn)題不僅可以更好地保護(hù)商標(biāo)權(quán)人的利益,保護(hù)相關(guān)商標(biāo)的商譽(yù),打擊侵害商標(biāo)權(quán)的違法行為,還可以?xún)艋ヂ?lián)網(wǎng)的競(jìng)爭(zhēng)環(huán)境,促進(jìn)互聯(lián)網(wǎng)更快更好地發(fā)展。
2.搜索引擎商標(biāo)侵權(quán)類(lèi)型分析
第一種,Meta標(biāo)簽引起的商標(biāo)侵權(quán)。Meta標(biāo)簽可以用來(lái)描述網(wǎng)頁(yè)的基本情況,還可以對(duì)關(guān)鍵詞及網(wǎng)頁(yè)等級(jí)進(jìn)行設(shè)定,在網(wǎng)頁(yè)設(shè)計(jì)中會(huì)將Meta標(biāo)簽嵌入網(wǎng)頁(yè)源代碼中。當(dāng)互聯(lián)網(wǎng)用戶(hù)使用搜索引擎查找某一信息時(shí),搜索引擎可以根據(jù)Meta標(biāo)簽快速的找到相關(guān)的信息網(wǎng)站。[1]一些網(wǎng)頁(yè)設(shè)計(jì)者為了提高自己網(wǎng)頁(yè)的點(diǎn)擊率或者其他牟利的原因,利用一般的互聯(lián)網(wǎng)用戶(hù)看不到Meta標(biāo)簽這一特點(diǎn),將他人的商標(biāo)設(shè)置為自己的Meta標(biāo)簽,互聯(lián)網(wǎng)用戶(hù)使用搜索引擎查找該商標(biāo)時(shí),網(wǎng)頁(yè)就會(huì)轉(zhuǎn)到將Meta標(biāo)簽設(shè)置為該商標(biāo)的網(wǎng)站,這便引起了商標(biāo)侵權(quán)糾紛。
第二種,關(guān)鍵詞檢索引起的商標(biāo)侵權(quán)。將Meta標(biāo)簽設(shè)置為他人商標(biāo)存在不會(huì)被搜索引擎搜索到的風(fēng)險(xiǎn)并且容易被技術(shù)檢測(cè)出來(lái)引起商標(biāo)侵權(quán)糾紛,于是一種更為隱蔽的網(wǎng)絡(luò)推廣手段出現(xiàn)了,即為關(guān)鍵詞檢索。關(guān)鍵詞檢索的原理是公司向搜索引擎網(wǎng)站購(gòu)買(mǎi)與公司產(chǎn)品或者服務(wù)相關(guān)的關(guān)鍵詞,當(dāng)用戶(hù)搜索該關(guān)鍵詞時(shí),該公司的網(wǎng)站頁(yè)面就會(huì)出現(xiàn)在搜索結(jié)果頁(yè)面中較為突出的位置。而一些公司為了推廣自己公司的產(chǎn)品或者服務(wù)向搜索引擎網(wǎng)站購(gòu)買(mǎi)他人公司的關(guān)鍵詞,當(dāng)用戶(hù)搜索該關(guān)鍵詞時(shí),很容易因?yàn)檎`認(rèn)就進(jìn)入了購(gòu)買(mǎi)該關(guān)鍵詞的公司網(wǎng)站,這就是關(guān)鍵詞廣告引起的商標(biāo)侵權(quán)類(lèi)型。[2]
第三種,搭載廣告引起的商標(biāo)侵權(quán)。搭載廣告引起的商標(biāo)侵權(quán)是指某公司并未購(gòu)買(mǎi)某關(guān)鍵詞,但是當(dāng)用戶(hù)搜索某一關(guān)鍵詞時(shí),該公司通過(guò)搭載廣告的形式仍然出現(xiàn)在搜索結(jié)果的頁(yè)面上。典型的廣告搭載的例子就是“淘寶”和“易趣”這兩個(gè)購(gòu)物網(wǎng)站,互聯(lián)網(wǎng)用戶(hù)使用谷歌搜索“淘寶”時(shí),搜索結(jié)果中會(huì)出現(xiàn)“想淘寶,上易趣”這個(gè)廣告鏈接,而點(diǎn)擊該鏈接就會(huì)進(jìn)入易趣網(wǎng)站。其實(shí)搭載廣告也是利用了關(guān)鍵詞來(lái)進(jìn)行商標(biāo)侵權(quán)的,某些搜索引擎商利用搜索結(jié)果,將一些關(guān)鍵詞提供給該關(guān)鍵詞購(gòu)買(mǎi)者的競(jìng)爭(zhēng)對(duì)手作為搭載廣告從而從中獲利。
二、搜索引擎引起的商標(biāo)侵權(quán)的認(rèn)定
傳統(tǒng)的商標(biāo)侵權(quán)的認(rèn)定可以適用《侵權(quán)責(zé)任法》上關(guān)于侵權(quán)行為的規(guī)定,那么搜索引擎引起的商標(biāo)侵權(quán)應(yīng)該如何認(rèn)定呢?筆者認(rèn)為搜索引擎引起的商標(biāo)侵權(quán)是傳統(tǒng)商標(biāo)侵權(quán)在網(wǎng)絡(luò)中的延伸,其同樣可以適用《侵權(quán)責(zé)任法》,即從過(guò)錯(cuò),違法行為,損害事實(shí)以及因果關(guān)系這四個(gè)方面來(lái)認(rèn)定搜索引擎引起的商標(biāo)侵權(quán)。[3]
1.過(guò)錯(cuò)
對(duì)于主觀過(guò)錯(cuò)的認(rèn)定同樣要從搜索引擎服務(wù)提供商和作為鏈接的第三方網(wǎng)站這兩個(gè)方面去分析。對(duì)于搜索引擎服務(wù)提供商,應(yīng)適用過(guò)錯(cuò)推定原則。即如果其在提供競(jìng)價(jià)排名服務(wù)時(shí)沒(méi)有盡到審查義務(wù)或者已知侵權(quán)情況發(fā)生而沒(méi)有及時(shí)采取相應(yīng)的補(bǔ)救措施就應(yīng)當(dāng)認(rèn)定為其主觀有過(guò)錯(cuò)。對(duì)于作為鏈接的第三方網(wǎng)站,如果其有將他人的部分或者全部商標(biāo)設(shè)置為自己的Meta標(biāo)簽或者購(gòu)買(mǎi)他人已注冊(cè)的商標(biāo)作為自己的關(guān)鍵詞這種行為就應(yīng)當(dāng)認(rèn)定為其主觀有過(guò)錯(cuò),除非網(wǎng)站經(jīng)營(yíng)者能夠證明自己沒(méi)有過(guò)錯(cuò)。適用過(guò)錯(cuò)推定原則一方面避免了受害方在網(wǎng)絡(luò)環(huán)境下舉證困難的不利因素,另一方面保證了網(wǎng)絡(luò)交易的順暢發(fā)展。[4]
2.違法行為
搜索引擎商標(biāo)侵權(quán)主體不僅包括搜索引擎服務(wù)提供商,還包括作為鏈接的第三方網(wǎng)站。因此從這兩個(gè)主體分別分析其行為有無(wú)違法性。首先看搜索引擎服務(wù)提供商違法行為的表現(xiàn)形式。搜索引擎服務(wù)提供商并不是商標(biāo)的直接侵權(quán)者,他對(duì)商標(biāo)侵權(quán)的責(zé)任在于在提供競(jìng)價(jià)排名服務(wù)時(shí)他對(duì)第三方網(wǎng)站提供的關(guān)鍵詞沒(méi)有盡到審查義務(wù),致使商標(biāo)專(zhuān)用權(quán)人受到了損害或者是商標(biāo)專(zhuān)用權(quán)人已經(jīng)告知其這種侵權(quán)行為,而搜索引擎服務(wù)提供商沒(méi)有積極的采取補(bǔ)救措施。再來(lái)分析作為鏈接的第三方網(wǎng)站行為的違法性,如果他在自己的網(wǎng)頁(yè)代碼中將他人的 部分或者全部商標(biāo)設(shè)為Meta標(biāo)簽,這種行為無(wú)疑是具有違法性的。如果該第三方網(wǎng)站只是參與了競(jìng)價(jià)排名服務(wù),那么這種行為是否具有違法性還要看其購(gòu)買(mǎi)的關(guān)鍵詞是否是已注冊(cè)的商標(biāo)以及其是否具有不正當(dāng)經(jīng)競(jìng)爭(zhēng)的目的等。
3.損害事實(shí)
損害事實(shí),既包括對(duì)公共財(cái)產(chǎn)的損害,也包括對(duì)私人財(cái)產(chǎn)的損害,同時(shí)還包括對(duì)非財(cái)產(chǎn)性權(quán)利的損害,只要對(duì)他人人身或財(cái)產(chǎn)利益造成了受損的事實(shí),均構(gòu)成損害事實(shí)。[3]商標(biāo)是一種無(wú)形資產(chǎn),一個(gè)有著良好商譽(yù)的商標(biāo)能給商標(biāo)權(quán)人帶來(lái)巨大的商業(yè)利益,商標(biāo)的損害后果相較于其他損害事實(shí)來(lái)說(shuō)是特殊的。結(jié)合《商標(biāo)法》的立法宗旨,我們要認(rèn)定搜索引擎引起的商標(biāo)侵權(quán)的損害事實(shí),其包括以下幾個(gè)方面:
(1)是否侵害了商標(biāo)專(zhuān)用權(quán)人的商業(yè)利益,是否使商標(biāo)所享有的信譽(yù)降低以及是否侵害了生產(chǎn)經(jīng)營(yíng)者的利益;
(2)是否侵害了消費(fèi)者的利益;
(3)是否破壞了網(wǎng)絡(luò)交易秩序等。[5]
4.因果關(guān)系
侵權(quán)行為中的因果關(guān)系是指違法行為與損害結(jié)果之間的客觀聯(lián)系,即特定的損害事實(shí)是否是行為人的行為必然引起的結(jié)果。只有當(dāng)二者間存在因果關(guān)系時(shí),行為人才應(yīng)承擔(dān)相應(yīng)的民事責(zé)任。因此,因果關(guān)系是侵權(quán)行為構(gòu)成要件的必備環(huán)節(jié)。因果關(guān)系也可以分為直接的因果關(guān)系和間接的因果關(guān)系。作為鏈接的第三方網(wǎng)站將他人的部分或者全部商標(biāo)設(shè)置為自己的Meta標(biāo)簽或者參與競(jìng)價(jià)排名服務(wù)購(gòu)買(mǎi)他人的商標(biāo)作為自己的關(guān)鍵詞,這種侵害他人商標(biāo)專(zhuān)用權(quán)的行為與損害事實(shí)有著直接的聯(lián)系。而提供競(jìng)價(jià)排名服務(wù)的搜索引擎商幫助第三方網(wǎng)站侵害商標(biāo)權(quán)人的利益,這種行為和損害事實(shí)有著間接地聯(lián)系。
三、完善搜索引擎商標(biāo)侵權(quán)責(zé)任的具體建議
1.明確搜索引擎商標(biāo)侵權(quán)的責(zé)任承擔(dān)主體
(1)搜索引擎服務(wù)商的審查和補(bǔ)救義務(wù)
要減少搜索引擎商標(biāo)侵權(quán)的糾紛,搜索引擎服務(wù)商需要盡到一定的審查義務(wù),同時(shí)在侵權(quán)情況發(fā)生后商標(biāo)專(zhuān)用權(quán)人提出異議時(shí)也應(yīng)當(dāng)及時(shí)進(jìn)行補(bǔ)救。首先,搜索引擎服務(wù)商應(yīng)當(dāng)對(duì)第三方網(wǎng)站申請(qǐng)購(gòu)買(mǎi)的關(guān)鍵詞進(jìn)行審查,隨著現(xiàn)在網(wǎng)絡(luò)技術(shù)的發(fā)展,程序人才輩出,搜索引擎服務(wù)商應(yīng)當(dāng)設(shè)計(jì)一套程序。這套程序中應(yīng)當(dāng)包含所有已注冊(cè)的商標(biāo),區(qū)分為馳名商標(biāo)和普通的注冊(cè)商標(biāo)。對(duì)于馳名商標(biāo),與其有關(guān)的關(guān)鍵詞一律屬于商標(biāo)權(quán)人,不得賣(mài)給其他任何第三方網(wǎng)站。而對(duì)于普通的注冊(cè)商標(biāo),如果購(gòu)買(mǎi)人能夠提供合理的說(shuō)明,則可以進(jìn)行關(guān)鍵詞購(gòu)買(mǎi)。其次,搜索引擎服務(wù)商應(yīng)當(dāng)對(duì)購(gòu)買(mǎi)關(guān)鍵詞的第三方網(wǎng)站進(jìn)行審查。如果作為鏈接的第三方網(wǎng)站將關(guān)鍵詞作為自己的商標(biāo),使消費(fèi)者產(chǎn)生了混淆,那么應(yīng)當(dāng)及時(shí)刪除,否則將會(huì)侵害商標(biāo)權(quán)人的利益。最后,一旦侵害情況發(fā)生,且商標(biāo)權(quán)人已經(jīng)及時(shí)將此情況告知搜索引擎服務(wù)商,搜索引擎服務(wù)商應(yīng)當(dāng)立即對(duì)鏈接的第三方網(wǎng)站進(jìn)行刪除或者屏蔽,否則就應(yīng)當(dāng)共同承擔(dān)侵權(quán)責(zé)任。
(2)作為鏈接的第三方網(wǎng)站的責(zé)任
作為鏈接的第三方網(wǎng)站在合理使用關(guān)鍵詞的情況下不構(gòu)成商標(biāo)侵權(quán),但是我國(guó)對(duì)于合理使用并沒(méi)有作出一個(gè)明確的界定,而搜索引擎中商標(biāo)侵權(quán)的認(rèn)定又比較的復(fù)雜,可以從以下兩個(gè)方面對(duì)第三方網(wǎng)站是否屬于商標(biāo)侵權(quán)責(zé)任承擔(dān)主體進(jìn)行認(rèn)定。
(1)作為鏈接的第三方網(wǎng)站主觀上有沒(méi)有惡意,有沒(méi)有使用他人商標(biāo)增加點(diǎn)擊率的不良意圖,會(huì)不會(huì)使互聯(lián)網(wǎng)用戶(hù)對(duì)第三方網(wǎng)站的商標(biāo)和使用的關(guān)鍵詞商標(biāo)產(chǎn)生誤認(rèn)。由于這種善惡意都是主觀狀態(tài),所以我們應(yīng)該從以下幾個(gè)方面去考察,第三方網(wǎng)站購(gòu)買(mǎi)關(guān)鍵詞是在該商標(biāo)成為知名商標(biāo)前還是之后;第三方網(wǎng)站是否必須使用該關(guān)鍵詞來(lái)描述自己的網(wǎng)站;第三方網(wǎng)站使用該關(guān)鍵詞是否使消費(fèi)者產(chǎn)生了混淆,有沒(méi)有對(duì)這種混淆采取避免措施等。
(2)作為鏈接的第三方網(wǎng)站使用該關(guān)鍵詞只是為了描述自己的網(wǎng)站,而并非出于搭便車(chē)的心理。一些關(guān)鍵詞雖然被作為商標(biāo),但是它并沒(méi)有失去其本身的含義,第三方網(wǎng)站購(gòu)買(mǎi)該關(guān)鍵詞只是為了說(shuō)明自己的服務(wù)或者產(chǎn)品,并沒(méi)有將其作為商標(biāo)使用使消費(fèi)者產(chǎn)生混淆或者在自己的網(wǎng)頁(yè)中采取了避免混淆的措施,在這種情況下作為鏈接的第三方網(wǎng)站就不需要承擔(dān)侵權(quán)責(zé)任。
2.明確搜索引擎商標(biāo)侵權(quán)的責(zé)任形式
從一些案件的判決結(jié)果可以看出,在搜索引擎商標(biāo)侵權(quán)中是以共同侵權(quán)責(zé)任制度來(lái)解決搜索引擎服務(wù)商這一間接侵權(quán)行為。根據(jù)《中華人民共和國(guó)侵權(quán)責(zé)任法》第八條第二款及《民法通則》第130條的規(guī)定,認(rèn)定搜索引擎服務(wù)商與作為鏈接的第三方網(wǎng)站對(duì)商標(biāo)權(quán)人承擔(dān)連帶責(zé)任。在司法實(shí)踐中,用共同侵權(quán)來(lái)解決搜索引擎商標(biāo)侵權(quán)案件有一定的弊端。如果搜索引擎服務(wù)商與作為鏈接的第三方網(wǎng)站承擔(dān)連帶責(zé)任,由于我們很容易找到搜索引擎服務(wù)商,而作為鏈接的第三方網(wǎng)站經(jīng)營(yíng)者我們很難找到,所以商標(biāo)權(quán)人往往會(huì)選擇實(shí)施了間接侵權(quán)行為的搜索引擎服務(wù)商,這無(wú)疑是不公平的。在網(wǎng)絡(luò)技術(shù)發(fā)達(dá)的今天,如果使搜索引擎服務(wù)商與作為鏈接的第三方網(wǎng)站承擔(dān)連帶責(zé)任,那么搜索引擎服務(wù)商的注意義務(wù)將大大提高,這不僅僅會(huì)造成不公平,更不利于互聯(lián)網(wǎng)的發(fā)展?;谝陨侠碛桑瑧?yīng)當(dāng)是搜索引擎服務(wù)商和作為鏈接的第三方網(wǎng)站分別承擔(dān)相應(yīng)的民事責(zé)任,搜索引擎服務(wù)商承擔(dān)其間接侵權(quán)的責(zé)任而第三方網(wǎng)站承擔(dān)其直接侵權(quán)的責(zé)任。這樣有主有次,一方面搜索引擎服務(wù)商因?yàn)闀?huì)承擔(dān)相應(yīng)的間接侵權(quán)責(zé)任而盡到自己的審查義務(wù),另一方面作為鏈接的第三方網(wǎng)站也會(huì)為自己的侵權(quán)行為買(mǎi)單,既體現(xiàn)公平,也能夠加強(qiáng)商標(biāo)的保護(hù),促進(jìn)互聯(lián)網(wǎng)的發(fā)展。
3.搜索引擎商標(biāo)侵權(quán)責(zé)任的承擔(dān)
根據(jù)我國(guó)《侵權(quán)責(zé)任法》的相關(guān)規(guī)定,考慮到搜索引擎商標(biāo)侵權(quán)主要是侵害了商標(biāo)權(quán)人所擁有商標(biāo)的商譽(yù),所以搜索引擎商承擔(dān)侵權(quán)責(zé)任的方式主要有停止侵害、賠禮道歉、消除影響及賠償損失等四種方式。其中我國(guó)現(xiàn)行計(jì)算商標(biāo)侵權(quán)的損害賠償主要依據(jù)是權(quán)利人的損失、侵權(quán)人的獲利以及法定的賠償數(shù)額。搜索引擎引起的商標(biāo)侵權(quán)也依然適用這三個(gè)標(biāo)準(zhǔn),即作為鏈接的第三方網(wǎng)站的獲利、商標(biāo)權(quán)人的損失以及法定的賠償數(shù)額。作為鏈接的第三方網(wǎng)站的獲利可以根據(jù)其在侵權(quán)行為持續(xù)期間所獲的全部銷(xiāo)售收入減去成本之后,都作為侵權(quán)人的獲利,而這里第三方網(wǎng)站的獲利是由于消費(fèi)者對(duì)其產(chǎn)品產(chǎn)生混淆得來(lái)的。[6]而商標(biāo)權(quán)人的損失則是由于第三方網(wǎng)站的侵權(quán)使得商標(biāo)權(quán)人的產(chǎn)品銷(xiāo)售量減少?gòu)亩a(chǎn)生的損失,這一部分損失應(yīng)當(dāng)由商標(biāo)權(quán)人來(lái)舉證。法定賠償是指在人民法院無(wú)法查清受害人實(shí)際損失和侵權(quán)人營(yíng)利數(shù)額時(shí),人民法院按法律規(guī)定的賠償數(shù)額確定的賠償數(shù)額。[7]
參考文獻(xiàn)
[1]張乃根,符望.全球電子商務(wù)的知識(shí)產(chǎn)權(quán)法[M].上海:上海交通大學(xué)出版社,2004:222.
[2]焦文銘.搜索引擎侵權(quán)的法律分析[J].江蘇警官學(xué)院學(xué)報(bào),2007(2):2-3.
[3]孫艷花.商標(biāo)侵權(quán)認(rèn)定研究[J].商業(yè)文化,2011(7):9-10.
[4]鄧富國(guó),曹新明.網(wǎng)上搜索引擎商標(biāo)侵權(quán)探析[J].人民司法,2002(4):5-6.
基金項(xiàng)目:本文系2011年度遼寧省大連市科技計(jì)劃項(xiàng)目“大連市知識(shí)產(chǎn)權(quán)保護(hù)能力建設(shè)的法律對(duì)策研究”(項(xiàng)目編號(hào):2011D12ZC137);遼寧省社會(huì)科學(xué)規(guī)劃基金項(xiàng)目重點(diǎn)項(xiàng)目(遼寧文化產(chǎn)業(yè)發(fā)展法律問(wèn)題研究(項(xiàng)目編號(hào):L12AFX001)支持。
作者簡(jiǎn)介:
篇5
關(guān)鍵詞:搜索引擎 查準(zhǔn)率 查全率
中圖分類(lèi)號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2012)12(c)-0022-01
搜索引擎在國(guó)外發(fā)展的較早,比較著名的有:Google,Yahoo,Excit,Lycos等。其中根據(jù)ComScore公司近兩年的統(tǒng)計(jì),全球近75%的網(wǎng)民使用過(guò)谷歌搜索引擎或其提供的各種衍生服務(wù)。而我國(guó)主要從1997年開(kāi)始發(fā)展面向中文信息檢索的中文搜索引擎。到現(xiàn)在,國(guó)內(nèi)搜索行業(yè)已被百度所統(tǒng)領(lǐng)。
雖然搜索引擎的出現(xiàn)確實(shí)為人們?cè)诰W(wǎng)上查找信息提供了強(qiáng)有力的手段和有效的工具,但是目前,屬于某個(gè)領(lǐng)域的各種中文搜索引擎的數(shù)量越來(lái)越多,從而使搜索引擎產(chǎn)生了一定的局限性。并且在信息維護(hù)、網(wǎng)絡(luò)站點(diǎn)負(fù)載,管理及服務(wù)等方面暴露了一些問(wèn)題與不足。
1 搜索效率
搜索引擎的兩個(gè)主要指標(biāo)是查準(zhǔn)率(precision)和查全率(recall)。查準(zhǔn)率從一個(gè)方面描述了搜索引擎系統(tǒng)的查詢(xún)開(kāi)銷(xiāo)。如果某次查詢(xún)的查準(zhǔn)率是85%,則15%的文獻(xiàn)是不相關(guān)文獻(xiàn),但用戶(hù)瀏覽其中的內(nèi)容以確定它們是否包含所需信息。對(duì)于實(shí)際系統(tǒng),索引速度和檢索速度也是重要指標(biāo)。事實(shí)上,在測(cè)試中,絕大多數(shù)系統(tǒng)的平均查準(zhǔn)率都在0.1~0.5之間,最好的測(cè)試結(jié)果平均查準(zhǔn)率也不到0.6。根據(jù)直觀估計(jì)當(dāng)前Internet上的著名搜索引擎,如yahoo,google等,它們的平均查準(zhǔn)率小于0.2。這說(shuō)明搜索引擎系統(tǒng)的性能還有很大的提高空間,但提高系統(tǒng)性能是非常困難的。
2 站點(diǎn)和網(wǎng)絡(luò)負(fù)載
這也是目前網(wǎng)絡(luò)搜索引擎存在的最大問(wèn)題。網(wǎng)絡(luò)搜索機(jī)器人快速地讀取文檔,必然會(huì)導(dǎo)致了大量的網(wǎng)絡(luò)流量和站點(diǎn)負(fù)載,傳輸大量的數(shù)據(jù)時(shí),某些站點(diǎn)很有可能會(huì)因?yàn)闄C(jī)器人要讀取文檔而一直處于繁忙狀態(tài)。機(jī)器人所造成的負(fù)載很大程度上是由于機(jī)器人為了對(duì)相應(yīng)數(shù)據(jù)建立索引,需要讀取整個(gè)文檔造成的。另外,當(dāng)機(jī)器人沿鏈接作深度優(yōu)先搜索時(shí),WEB服務(wù)器的負(fù)載往往也很重。
3 搜索引擎間的數(shù)據(jù)重復(fù)
常用的搜索引擎很少能夠與其它的搜索引擎共享它們的數(shù)據(jù)。其結(jié)果就是多個(gè)搜索引擎檢索相同的資源和文檔,多個(gè)機(jī)器人搜索訪問(wèn)同樣的WEB站點(diǎn),無(wú)疑帶來(lái)了不必要的網(wǎng)絡(luò)和服務(wù)器負(fù)載。當(dāng)用戶(hù)使用多個(gè)搜索引擎尋找信息時(shí),也給用戶(hù)造成不必要的麻煩。
4 鏈接和數(shù)據(jù)的易變性
這是搜索引擎所面臨的一個(gè)重要問(wèn)題。對(duì)搜索引擎的影響是,索引數(shù)據(jù)庫(kù)存儲(chǔ)的文檔和鏈接信息很有可能已經(jīng)改變了位置或己經(jīng)被刪除。當(dāng)用戶(hù)查詢(xún)某些信息時(shí),搜索引擎給出文檔和鏈接的列表,而當(dāng)用戶(hù)試圖沿著鏈接到遠(yuǎn)程站點(diǎn)訪問(wèn)這些信息時(shí),他們也許會(huì)收到這樣的出錯(cuò)信息,“沒(méi)有找到服務(wù)器”。
5 缺乏統(tǒng)一的規(guī)劃、協(xié)調(diào)與合作
目前國(guó)內(nèi)搜索行業(yè)百度已是一方霸主。然而,搜狗也在推出搜索引擎開(kāi)放平臺(tái),中搜更是強(qiáng)力打造自己的第三代搜索引擎,包括一淘網(wǎng)、網(wǎng)易有道等垂直搜索也漸成“氣候”。搜索是互聯(lián)網(wǎng)產(chǎn)品中的高科技產(chǎn)品,企業(yè)間的競(jìng)爭(zhēng)不應(yīng)局限于與同業(yè)者的橫向競(jìng)爭(zhēng),更應(yīng)該在自身的技術(shù)深度上勤加耕耘。同時(shí)相互協(xié)作,取長(zhǎng)補(bǔ)短,為用戶(hù)提供更好的搜索產(chǎn)品和體驗(yàn)。
6 網(wǎng)絡(luò)知識(shí)產(chǎn)權(quán)立法落后
我國(guó)對(duì)網(wǎng)絡(luò)中的侵權(quán)行為,沒(méi)有成型的法律進(jìn)行規(guī)定。目前大多采用《著作權(quán)法》的相關(guān)規(guī)定來(lái)解決,但是在網(wǎng)絡(luò)環(huán)境下,知識(shí)產(chǎn)權(quán)的客體得到了拓展,網(wǎng)絡(luò)知識(shí)產(chǎn)權(quán)侵權(quán)的類(lèi)型也呈現(xiàn)多樣化。因此傳統(tǒng)的著作權(quán)法有著其局限性,為適應(yīng)網(wǎng)絡(luò)知識(shí)產(chǎn)權(quán)保護(hù)范圍擴(kuò)大化的要求,必須揭示和分析存在的問(wèn)題并加強(qiáng)和完善保護(hù)措施,以保證權(quán)利人的權(quán)益得到切實(shí)的保護(hù)。
針對(duì)中文搜索引擎存在的種種問(wèn)題,結(jié)合國(guó)外搜索引擎發(fā)展過(guò)程中的經(jīng)驗(yàn),筆者認(rèn)為中文搜索引擎可采取以下對(duì)策。
(1)建立垂直化、專(zhuān)業(yè)化搜索引擎。
垂直搜索引擎是相對(duì)通用搜索引擎的信息量大、查詢(xún)不準(zhǔn)確、深度不夠等提出來(lái)的新的搜索引擎服務(wù)模式。
它是針對(duì)性的為某一特定領(lǐng)域、某一特定人群或某一特定需求提供的有一定價(jià)值的信息和相關(guān)服務(wù)??梢院?jiǎn)單的說(shuō)成是搜索引擎領(lǐng)域的行業(yè)化分工。市場(chǎng)需求多元化決定了搜索引擎的服務(wù)模式必將出現(xiàn)細(xì)分,針對(duì)不同行業(yè)提供更加精確的行業(yè)服務(wù)模式。通用搜索引擎的發(fā)展為垂直搜索引擎的出現(xiàn)提供了良好的市場(chǎng)空間,勢(shì)必將出現(xiàn)垂直搜索引擎在互聯(lián)網(wǎng)中占據(jù)部分市場(chǎng)的趨勢(shì),也是搜索引擎行業(yè)細(xì)分化的必然趨勢(shì)。
(2)建立搜索引擎協(xié)調(diào)機(jī)制,制定網(wǎng)站的有關(guān)標(biāo)準(zhǔn)。
隨著中文搜索引擎的日益增多,各類(lèi)搜索引擎開(kāi)發(fā)與資源建設(shè)的重復(fù)現(xiàn)象也越來(lái)越嚴(yán)重。因此,建立統(tǒng)一的機(jī)構(gòu),協(xié)調(diào)各搜索引擎網(wǎng)站之間的開(kāi)發(fā)設(shè)計(jì)與資源建設(shè)也就提上了日程。
(3)發(fā)展中文搜索引擎的個(gè)性化信息服務(wù)。
個(gè)性化搜索是以用戶(hù)為中心的搜索技術(shù),它獲取以多種形式表達(dá)的用戶(hù)需求,并綜合利用這些用戶(hù)信息,提高搜索引擎滿(mǎn)足用戶(hù)需求的能力。個(gè)性化服務(wù)通過(guò)收集和分析用戶(hù)信息來(lái)學(xué)習(xí)用戶(hù)的興趣和行為,從而實(shí)現(xiàn)主動(dòng)推薦的目的。
目前的技術(shù)發(fā)展過(guò)程中,搜索引擎逐漸更加注重對(duì)于用戶(hù)群體的個(gè)性化使用習(xí)慣的培養(yǎng),百度推出的“個(gè)性化首頁(yè)”產(chǎn)品就為用戶(hù)提供登錄后推薦信息和應(yīng)用的極大便利,以此鼓勵(lì)用戶(hù)提供個(gè)性化信息,提升搜索效果并增加用戶(hù)黏性。隨著搜索引擎在網(wǎng)絡(luò)應(yīng)用環(huán)境中的更深層次參與,這類(lèi)個(gè)性化產(chǎn)品的數(shù)量和應(yīng)用規(guī)模也有繼續(xù)擴(kuò)大的趨勢(shì),而個(gè)性化搜索技術(shù)的發(fā)展也呈現(xiàn)出更加積極的前景。
(4)多媒體搜索技術(shù)。
隨著多媒體信息處理技術(shù)在近年來(lái)的發(fā)展,搜索引擎的部分多媒體搜索產(chǎn)品開(kāi)始越來(lái)越多的依靠媒體內(nèi)容提升搜索服務(wù)水平。2011年,谷歌、百度和搜狗搜索都提供了以圖片作為查詢(xún)需求表示的“以圖搜圖”的圖片搜索功能,滿(mǎn)足用戶(hù)對(duì)于圖片獲取的信息訴求。
(5)健全有關(guān)的網(wǎng)絡(luò)法規(guī)。
法律法規(guī)不健全會(huì)為搜索引擎的發(fā)展帶來(lái)一定的阻礙。所以,我們要制定并健全現(xiàn)有的法律法規(guī)。
隨著互聯(lián)網(wǎng)的飛速發(fā)展,各類(lèi)中文信息資源的日益豐富,賦予了中文搜索引擎無(wú)限的生機(jī),同時(shí)也給中文搜索引擎的發(fā)展帶來(lái)了嚴(yán)峻挑戰(zhàn)。各類(lèi)中文搜索引擎只有切實(shí)研究用戶(hù)信息需求的特點(diǎn),不斷完善和發(fā)展搜索技術(shù),走適合自己發(fā)展的商業(yè)化道路,才能在眾多的搜索引擎中獲得屬于自己的發(fā)展空間,才能在激烈的競(jìng)爭(zhēng)過(guò)程中立于不敗之地。
參考文獻(xiàn)
[1] 劉奕群.中文搜索引擎發(fā)展研究報(bào)告[R].中國(guó)人工智能學(xué)會(huì)通訊,2012(5).
篇6
關(guān)鍵詞:元搜索;相似度;去重;排序
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A DoI: 10.3969/j.issn.1003-6970.2012.06.016
Meta Search Engine Results to Weight and Sorting of
【Abstract】Go heavy and sorting are two key issues to improve the quality of the results of the meta-search engine, the article analyz
es the cosine similarity, three kinds of text similarity based on tf-IDf weight algorithm, using the UrL, title, and calculation of summary similarity toweight; Board sort stars sort, the polling method, location, sort, and the concept of feasible search results, a comprehensive sorting algorithm. the experimental results show that the integrated sorting algorithm accuracy, recall rate of better than other algorithms.
【Key words】Meta-search; Similarity; to heavy; Sort
元搜索引擎是指通過(guò)集成多個(gè)獨(dú)立的搜索引擎,將用戶(hù)的檢索請(qǐng)求轉(zhuǎn)換處理后提交給它們,并將每個(gè)獨(dú)立搜索引擎返回的結(jié)果統(tǒng)一進(jìn)行去重,并重新排序后反饋給用戶(hù)[1][2]。由于元搜索的數(shù)據(jù)來(lái)源是獨(dú)立搜索引擎,返回的結(jié)果中通常會(huì)有重復(fù)數(shù)據(jù),同一條結(jié)果在不同搜索引擎中返回結(jié)果的位置也不一樣,因此,如何去除重復(fù)數(shù)據(jù),同時(shí)將質(zhì)量好的結(jié)果排序靠前是元搜索要解決的兩個(gè)關(guān)鍵問(wèn)題。
元搜索的結(jié)果來(lái)自用多個(gè)獨(dú)立的成員搜索引擎,雖然不同的成員搜索引擎的覆蓋范圍不一樣,但返回的結(jié)果中會(huì)出現(xiàn)重復(fù)數(shù)據(jù),降低了檢索結(jié)果的質(zhì)量[3]。因此,在將結(jié)果返回給用戶(hù)前,需要將重復(fù)內(nèi)容去除。重復(fù)內(nèi)容通常會(huì)有如下兩種情況:一種是內(nèi)容完全一樣,另一種是內(nèi)容相似,如同一個(gè)內(nèi)容主題,在不同的網(wǎng)站用了稍微有區(qū)別的表示。
第一種重復(fù)只需要判斷URL或網(wǎng)頁(yè)標(biāo)題即可識(shí)別,第二種內(nèi)容重復(fù)則需要計(jì)算返回結(jié)果中的標(biāo)題、摘要的相似度,達(dá)到某一相似度即可判斷為重復(fù)。因此,在結(jié)果去重時(shí)首先判斷兩網(wǎng)頁(yè)的URL和標(biāo)題是否相同,若是,則認(rèn)為重復(fù);否則,提取兩網(wǎng)頁(yè)的摘要并進(jìn)行相似度計(jì)算,判斷兩網(wǎng)頁(yè)是否為重復(fù)網(wǎng)
文本相似度的計(jì)算方法通常采用文本挖掘中的余弦相似度來(lái)衡量,基本思想是將待檢測(cè)的文本表示為一個(gè)特征向量,通過(guò)計(jì)算向量的夾角余弦值來(lái)判斷。余弦值接近于1,說(shuō)明相似度較高。特征向量通常用字或者詞出現(xiàn)的次數(shù)來(lái)表示,如:令Di為待檢測(cè)文檔,其特征向量表示為:
Di=D((ti1,wi1),(ti2.wi2),…,(tin.win))
其中tij表文檔i的第j個(gè)特征詞,wij表示該特征詞的頻次。文檔Di和Dk之間的相似度利用公式(2)計(jì)算:
TF-IDF算法是通過(guò)統(tǒng)計(jì)文檔詞頻來(lái)計(jì)算詞權(quán)重[4],基本思想是:一個(gè)詞在特定文檔中出現(xiàn)的次數(shù)越高,說(shuō)明它在區(qū)分該文檔內(nèi)容屬性方面的能力越強(qiáng)(TF),一個(gè)詞語(yǔ)在文檔中出現(xiàn)的范圍越廣,說(shuō)明它區(qū)分文檔內(nèi)容的屬性越低(IDF)。其計(jì)算公式為:
wij=tfij×idfj=tfij×log(
其中tfij指詞語(yǔ)tj在文檔di中出現(xiàn)的次數(shù);idfj指出現(xiàn)詞語(yǔ)tj的文檔的倒數(shù)。N表示文檔總數(shù),nj指出現(xiàn)詞語(yǔ)tj的文檔數(shù)。wij表示了詞語(yǔ)tj在文檔的權(quán)重,使用該值來(lái)表示文檔特征向量。
元搜索的結(jié)果排序是指對(duì)其調(diào)用的所有成員搜索引擎返回結(jié)果重新進(jìn)行排序處理。目前元搜索引擎采用的排序算法多種多樣,有的是對(duì)成員搜索引擎返回的結(jié)果信息進(jìn)行綜合,根據(jù)各個(gè)成員搜索引擎的排序信息,來(lái)重新進(jìn)行排序;有的則先將成員搜索引擎的結(jié)果收集起來(lái),再重新選擇某種排序方法對(duì)這些結(jié)果進(jìn)行處理;有的是給不同成員搜索引擎的檢索結(jié)果分配一定的分值,對(duì)其進(jìn)行融合處理,之后按序顯示給用戶(hù)[5]。常見(jiàn)的算法有如下幾種:
Board排序類(lèi)似于選舉,根據(jù)票數(shù)多少進(jìn)行排序。在元搜索中,對(duì)于某個(gè)查詢(xún),它被幾個(gè)成員搜索引擎檢索到,則該結(jié)果記錄就得幾票,最后統(tǒng)計(jì)各個(gè)結(jié)果記錄的票數(shù),按照票數(shù)多少排序。為了更好地利用原來(lái)成員搜索引擎的排序信息,對(duì)每個(gè)成員搜索引擎的結(jié)果按照從前到后的順序分配一定的權(quán)值,統(tǒng)計(jì)結(jié)果時(shí)乘以相應(yīng)的權(quán)值,可細(xì)化每個(gè)結(jié)果所得票數(shù)。
星星排序是首先統(tǒng)計(jì)某個(gè)搜索結(jié)果記錄在多少個(gè)成員搜索引擎的前面幾條信息中出現(xiàn),以此作為相關(guān)度評(píng)價(jià)指標(biāo)。對(duì)于某個(gè)查詢(xún)結(jié)果,若在一個(gè)成員搜索引擎的前幾條中出現(xiàn),就得到一個(gè)“星”,得到的“星”越多,則該記錄就越重要。最后比較每個(gè)結(jié)果所得的“星”的個(gè)數(shù),并以此排序。
輪詢(xún)法( round-robin)首先把成員搜索引擎根據(jù)其性能按照一定次序排列好,然后按照這些次序?qū)⒚總€(gè)查詢(xún)結(jié)果中的第一項(xiàng)依次列出,再把每個(gè)查詢(xún)結(jié)果中的第二項(xiàng)依次列出,依此類(lèi)推。一個(gè)結(jié)果出現(xiàn)在多個(gè)搜索引擎中的以第一次出現(xiàn)該結(jié)果的為基準(zhǔn),后面出現(xiàn)的不再參加排序。中途出現(xiàn)某搜索引擎的結(jié)果已經(jīng)取完時(shí),則跳轉(zhuǎn)到下一個(gè)搜索引擎。
篇7
[關(guān)鍵詞]搜索引擎優(yōu)化;關(guān)鍵詞廣告;SEO
[DOI]10.13939/ki.zgsc.2016.32.159
1 引 言
互聯(lián)網(wǎng)的迅速發(fā)展,帶動(dòng)了互聯(lián)網(wǎng)信息的膨脹,其商業(yè)價(jià)值也被人們所發(fā)掘。更多的行業(yè)將信息投放到網(wǎng)絡(luò)當(dāng)中,希望通過(guò)搜索引擎廣告或其他類(lèi)型廣告被發(fā)現(xiàn),以低成本帶來(lái)可觀的收益。這其中的搜索引擎優(yōu)化則是目前來(lái)看最為主流和有效的廣告推廣形式,大部分企業(yè)都青睞這一方式。
我國(guó)搜索引擎行業(yè)已經(jīng)比較成熟。搜索引擎關(guān)鍵詞搜索成為企業(yè)主要關(guān)注的領(lǐng)域。為了能夠給企業(yè)帶來(lái)更好的推廣效益,需要及時(shí)更新搜索引擎營(yíng)銷(xiāo),來(lái)適應(yīng)當(dāng)前的網(wǎng)絡(luò)環(huán)境,滿(mǎn)足客戶(hù)的需求。這就需要時(shí)刻對(duì)行業(yè)情況以及搜索引擎的抓取方式進(jìn)行分析,為商家?guī)?lái)更多的商機(jī)。
2 關(guān)鍵詞提取相關(guān)文獻(xiàn)述評(píng)
2.1 關(guān)鍵詞提取方法
目前,市場(chǎng)上主流的關(guān)鍵詞提取方法主要包括:?jiǎn)l(fā)式原則提取文本當(dāng)中的關(guān)鍵詞,借助于無(wú)監(jiān)管學(xué)習(xí)方式來(lái)提取關(guān)鍵詞,以自動(dòng)標(biāo)示文獻(xiàn)主題為基礎(chǔ)的提取方式,以詞語(yǔ)網(wǎng)絡(luò)為基礎(chǔ)的關(guān)鍵詞提取方式等。
2.2 存在的問(wèn)題
雖然關(guān)鍵詞提取方式眾多,不過(guò)都存在著或大或小的缺陷,比如: 一般的提取方式是為文本產(chǎn)生可以表示其主旨的關(guān)鍵詞,但是搜索競(jìng)價(jià)廣告關(guān)鍵詞優(yōu)化的目標(biāo)卻沒(méi)有這么簡(jiǎn)單,任何可能會(huì)引導(dǎo)用戶(hù)進(jìn)入企業(yè)網(wǎng)址的詞匯都應(yīng)納入候選目標(biāo)當(dāng)中。還有,關(guān)鍵詞產(chǎn)生范疇存在差別。一般的提取方式均提取特定文本當(dāng)中的關(guān)鍵詞,但是搜索競(jìng)價(jià)廣告關(guān)鍵詞優(yōu)化方式產(chǎn)生的關(guān)鍵詞僅有極少數(shù)顯現(xiàn)在推廣信息當(dāng)中,剩余的均依據(jù)計(jì)算方式的設(shè)置在別的材料當(dāng)中體現(xiàn)。
為了能夠解決方法存在的一些問(wèn)題,本文以搜索廣告的特征為基礎(chǔ)推出一種提取方式來(lái)產(chǎn)生種子關(guān)鍵詞。
3 種子關(guān)鍵詞生成
3.1 問(wèn)題分析
搜索廣告種子關(guān)鍵詞提取要獲取的結(jié)果是一批和主旨存在關(guān)聯(lián)的關(guān)鍵詞,這類(lèi)詞語(yǔ)當(dāng)中輸入方,參加到之后的環(huán)節(jié)當(dāng)中。
3.2 模型簡(jiǎn)介
這種方式是以序列模式發(fā)掘?yàn)榛A(chǔ)的。序列模式發(fā)掘?qū)儆谒俣容^快的一類(lèi)方式。文章選用的是以這一方式為基礎(chǔ)的迭代法來(lái)發(fā)掘語(yǔ)言模式及提取關(guān)鍵詞。這一以模式發(fā)掘?yàn)榛A(chǔ)的關(guān)鍵詞提取模型的操作流程簡(jiǎn)單地介紹如下:其一是選出一批備選的關(guān)鍵詞當(dāng)作種子并且運(yùn)用序列模式發(fā)掘的計(jì)算方式以選出的關(guān)鍵詞為基礎(chǔ)來(lái)選擇關(guān)鍵詞的模式,其二為運(yùn)用語(yǔ)言模式提取關(guān)鍵詞。此次迭代獲得的關(guān)鍵詞將會(huì)當(dāng)作下一輪迭代首個(gè)步驟的輸入來(lái)發(fā)掘接下來(lái)的語(yǔ)言模式。這一迭代流程重復(fù)操作直至不再產(chǎn)生全新的語(yǔ)言模式。
文章將廣告文本處置成數(shù)個(gè)語(yǔ)句的集合,關(guān)鍵詞是可以表現(xiàn)語(yǔ)句主旨的單詞。語(yǔ)言模式是和關(guān)鍵詞緊密相聯(lián)的詞序。比如:在例句“店鋪出售鮮花”當(dāng)中,“鮮花”便是關(guān)鍵詞,詞序“店鋪出售”便是語(yǔ)言模式。
3.3 語(yǔ)言模式挖掘
3.3.1 初始關(guān)鍵詞選擇
這種算法第一步便是要選取一批最初的關(guān)鍵詞用作發(fā)掘最初的語(yǔ)言模式。文章指出,ODP 的目錄名能夠被選定成最初的關(guān)鍵詞集合??墒沁@種目錄名無(wú)法涉及全部的關(guān)鍵詞,因而這一算法必須持續(xù)地迭代,從而發(fā)掘出全新的關(guān)鍵詞。
3.3.2 語(yǔ)料預(yù)處理
在展開(kāi)語(yǔ)言模式發(fā)掘以前,最初的語(yǔ)料庫(kù)必須展開(kāi)預(yù)先處置,文章將預(yù)先處置的全部程序表述為:
(1)運(yùn)用文本預(yù)先處置的方式對(duì)其展開(kāi)預(yù)先處置,這類(lèi)的活動(dòng)包含中文分詞處置、詞句分離、量詞消除等。
(2)利用來(lái)更換關(guān)鍵詞表格當(dāng)中的詞語(yǔ)。比如,若關(guān)鍵詞表格當(dāng)中包括“鮮花” 一詞,則語(yǔ)句“買(mǎi)鮮花贈(zèng)人”將會(huì)被修正成“買(mǎi)贈(zèng)人”。展開(kāi)這類(lèi)更換的誘因在于經(jīng)過(guò)這種更換能夠提取更為豐富的關(guān)鍵詞。若運(yùn)用上面的模式和語(yǔ)句“買(mǎi)手機(jī)贈(zèng)人”展開(kāi)配置,則“手機(jī)”將會(huì)被當(dāng)作關(guān)鍵詞而提出。
3.3.3 序列模式挖掘算法
文章將語(yǔ)句視為詞語(yǔ)的集合,因?yàn)椴捎眯蛄心J桨l(fā)掘的方式來(lái)提取語(yǔ)言模式。
文章把全部的序列按照元組來(lái)劃分并且存進(jìn)數(shù)據(jù)庫(kù),元組呈現(xiàn)成< sid,s>,在這當(dāng)中 sid 是序列的標(biāo)記,s 是屬于該元組內(nèi)的某個(gè)詞語(yǔ)集序列。若序列α屬于s的子集,那么便說(shuō)s 包含α。文章把序列α的支撐度界定成數(shù)據(jù)庫(kù)S當(dāng)中包含α的元組的數(shù)量,其具體可闡釋為:
Support(α)=|{ |(∈S)∧(α∈s)}|
若Support(α)超過(guò)了設(shè)置的閾值,便將α當(dāng)作模式。
序列模式發(fā)掘方式的目的是尋找相應(yīng)數(shù)據(jù)庫(kù)當(dāng)中全部的模式。在文章的語(yǔ)言發(fā)掘方式當(dāng)中序列屬于文本預(yù)先處置流程當(dāng)中的分段,序列中的要素便是分段中的詞語(yǔ)。
3.3.4 模式匹配
語(yǔ)言模式發(fā)掘方式產(chǎn)生的語(yǔ)言模式將用作配置語(yǔ)料庫(kù)從而產(chǎn)生全新的關(guān)鍵詞。若某個(gè)詞語(yǔ)或是短句在發(fā)掘的語(yǔ)言模式當(dāng)中有所表現(xiàn)而且處在的位置,則這一詞語(yǔ)將會(huì)被選定成關(guān)鍵詞。比如:語(yǔ)言模式: “喜愛(ài)”。若語(yǔ)料庫(kù)當(dāng)中的某個(gè)語(yǔ)句為“年輕的姑娘都非常喜愛(ài)玫瑰花”,便選取“玫瑰花”當(dāng)作關(guān)鍵詞。文章借助于模式配置來(lái)提取文檔當(dāng)中的關(guān)鍵詞。
4 結(jié) 論
搜索競(jìng)價(jià)廣告關(guān)鍵詞優(yōu)化力爭(zhēng)為在搜索引擎中投送推廣信息的人群供應(yīng)最佳的關(guān)鍵詞選取規(guī)劃,從而幫助其獲取更高限度的經(jīng)濟(jì)利益,并且促使其脫離繁雜的人工操作階段,有力地給予他們科學(xué)引導(dǎo)。因而,對(duì)其的探究具有極大的運(yùn)用價(jià)值。
本文給出了一種廣告關(guān)鍵詞抽取算法用于抽取廣告中的關(guān)鍵詞。該算法首先利用序列模式挖掘算法抽取語(yǔ)料庫(kù)中的語(yǔ)言模式,然后利用抽取得到的語(yǔ)言模式庫(kù)對(duì)廣告進(jìn)行關(guān)鍵詞抽取。這種算法克服了傳統(tǒng)的基于統(tǒng)計(jì)信息的關(guān)鍵詞抽取算法在廣告關(guān)鍵詞抽取領(lǐng)域中的不足,其抽取結(jié)果的準(zhǔn)確率和查全率都有很大提升。
參考文獻(xiàn):
[1]丁銀芳.基于Web日志挖掘的個(gè)性化推薦原型系統(tǒng)研究與實(shí)現(xiàn)[D].南京:南京農(nóng)業(yè)大學(xué),2009.
[2]張建娥.基于TFIDF和詞語(yǔ)關(guān)聯(lián)度的中文關(guān)鍵詞提取方法[J].業(yè)務(wù)研究,2012(10).
篇8
關(guān)鍵詞:網(wǎng)絡(luò)營(yíng)銷(xiāo) 關(guān)鍵詞廣告 關(guān)鍵詞分析
1.搜索引擎關(guān)鍵詞廣告定義
關(guān)鍵詞廣告【1】是一種文字鏈接型網(wǎng)絡(luò)廣告,通過(guò)對(duì)文字進(jìn)行超級(jí)鏈接,讓感興趣的網(wǎng)民點(diǎn)擊進(jìn)入公司網(wǎng)站、網(wǎng)頁(yè)或公司其它相關(guān)網(wǎng)頁(yè),實(shí)現(xiàn)廣告目的。搜索引擎關(guān)鍵詞廣告已經(jīng)成為諸多企業(yè)進(jìn)行搜索引擎營(yíng)銷(xiāo)時(shí)首要選擇的方法。
2.關(guān)鍵詞廣告的特點(diǎn)和形式
對(duì)于廣告主來(lái)說(shuō),挑選有效關(guān)鍵詞并將廣告信息提交審核通過(guò)后,其廣告信息就可以隨時(shí)被展現(xiàn)在搜索結(jié)果中,通過(guò)改變關(guān)鍵詞的單次點(diǎn)擊價(jià)格就可以預(yù)估出廣告出現(xiàn)的大置,若廣告主需要改變廣告信息內(nèi)容,可以隨時(shí)對(duì)標(biāo)題、創(chuàng)意、連接地址進(jìn)行改動(dòng),通過(guò)改動(dòng)連接地址可以引導(dǎo)網(wǎng)絡(luò)用戶(hù)到達(dá)廣告主想要其到達(dá)的任意一個(gè)網(wǎng)頁(yè)。同時(shí),廣告主可以利用搜索引擎服務(wù)商提供的效果監(jiān)測(cè)工具對(duì)關(guān)鍵詞廣告的各項(xiàng)數(shù)據(jù)進(jìn)行實(shí)時(shí)跟蹤和監(jiān)控??偟脕?lái)說(shuō),關(guān)鍵詞廣告的特點(diǎn)可以總結(jié)為廣告投放具有隨時(shí)性及可控性、廣告信息及出現(xiàn)位置調(diào)整便捷、關(guān)鍵詞廣告具有強(qiáng)精準(zhǔn)性和靈活性、廣告效果具有實(shí)時(shí)可控性。
3.關(guān)鍵詞選擇的常用方法
目前企業(yè)在進(jìn)行搜素引擎關(guān)鍵詞廣告營(yíng)銷(xiāo)過(guò)程中普遍采用的是“關(guān)鍵詞選擇的常用方法”,這種方法有其便捷性,即使是剛剛接觸搜索引擎營(yíng)銷(xiāo)的新人也可以使用,但是它有很大的弊端。相比之下,層級(jí)遞進(jìn)式關(guān)鍵詞選擇法則可以很好的幫助企業(yè)及營(yíng)銷(xiāo)人員從企業(yè)營(yíng)銷(xiāo)的多個(gè)維度出發(fā)來(lái)滿(mǎn)足網(wǎng)絡(luò)用戶(hù)的搜索需求,從而達(dá)到提升企業(yè)投資回報(bào)率的目的。
利用關(guān)鍵詞工具進(jìn)行關(guān)鍵詞選擇的方法存在很大的弊端,如果沒(méi)有一個(gè)明確的目標(biāo),那么選擇關(guān)鍵詞的過(guò)程將是一個(gè)盲目的過(guò)程,對(duì)于企業(yè)及網(wǎng)絡(luò)營(yíng)銷(xiāo)人員來(lái)說(shuō)其只能作為關(guān)鍵詞選擇過(guò)程中的輔助方法使用。
4.關(guān)鍵詞選擇的創(chuàng)新方法層級(jí)遞進(jìn)式選擇法
(1)關(guān)鍵詞的初選
以整形美容行業(yè)關(guān)鍵詞選擇為例,說(shuō)明初選的方法。整形美容行業(yè)關(guān)鍵詞主要可以分為四個(gè)類(lèi)別:即品牌詞、行業(yè)詞、短語(yǔ)詞和長(zhǎng)尾詞。
品牌詞中包含的是含有企業(yè)牌品的關(guān)鍵詞。
行業(yè)詞是在短語(yǔ)詞的基礎(chǔ)上添加修飾或限定詞進(jìn)行拓展后得到的短語(yǔ)詞稍長(zhǎng)的關(guān)鍵詞,形容限定詞主要分為以下幾種類(lèi)別:技術(shù)方法、效果、手術(shù)、治療、價(jià)格、醫(yī)院、專(zhuān)家、地域等。
短語(yǔ)詞主要按照以下幾個(gè)類(lèi)別來(lái)進(jìn)行細(xì)分:項(xiàng)目詞、部位詞、項(xiàng)目+部位詞以及三種類(lèi)型的關(guān)鍵詞組合后的新詞。
長(zhǎng)尾關(guān)鍵詞包括以下幾類(lèi)詞:癥狀+解決詞、病因詞、(短語(yǔ)詞、行業(yè)詞)加效果詞、比較詞、加形容詞后的長(zhǎng)度比較長(zhǎng)的關(guān)鍵詞。
(2)以?xún)?yōu)先級(jí)為基礎(chǔ)的關(guān)鍵詞過(guò)濾
企業(yè)在進(jìn)行搜索引擎關(guān)鍵詞營(yíng)銷(xiāo)時(shí),不能盲目選擇網(wǎng)絡(luò)用戶(hù)查詢(xún)信息過(guò)程中使用數(shù)量多的關(guān)鍵詞,而是要選擇與自身網(wǎng)站內(nèi)容最相關(guān)、價(jià)值最高的關(guān)鍵詞。按照關(guān)鍵詞價(jià)值的不同,將關(guān)鍵詞劃分為三個(gè)等級(jí):低級(jí)詞、中級(jí)詞和高級(jí)詞。高級(jí)詞:指得是那些與網(wǎng)站自身內(nèi)容非常相關(guān)但是網(wǎng)絡(luò)用戶(hù)通過(guò)搜索引擎搜索較少,但是點(diǎn)擊率高的關(guān)鍵詞;中級(jí)詞:指的是那些與網(wǎng)站內(nèi)容比較相關(guān),網(wǎng)絡(luò)用戶(hù)搜索量較多,點(diǎn)擊率比高級(jí)詞低的詞;低級(jí)詞:指的是那些與網(wǎng)站自身內(nèi)容相關(guān),網(wǎng)絡(luò)用戶(hù)通過(guò)搜索引擎搜索量高,點(diǎn)擊率比中級(jí)詞低的關(guān)鍵詞。
(3)以滿(mǎn)足用戶(hù)搜索需求的關(guān)鍵詞過(guò)濾
網(wǎng)絡(luò)用戶(hù)從出現(xiàn)整形需求到真正進(jìn)入目標(biāo)網(wǎng)站的過(guò)程可以分為以下六個(gè)行為階段:即病因癥狀了解階段、尋求非手術(shù)治療階段、手術(shù)治療信息了解階段、比較對(duì)比階段、尋求手術(shù)治療階段、再次尋求手術(shù)治療階段。
在這六個(gè)階段中,尋求非手術(shù)治療階段主要是網(wǎng)絡(luò)用戶(hù)想通過(guò)非手術(shù)方法獲得治療,處于這個(gè)階段的網(wǎng)絡(luò)用戶(hù)并沒(méi)有考慮通過(guò)手術(shù)方法進(jìn)行治療,所以企業(yè)在進(jìn)行關(guān)鍵詞選擇時(shí)可將這個(gè)階段的詞完全過(guò)濾掉;
再次尋求手術(shù)治療階段主要是受術(shù)者尋求手術(shù)治療失敗后需要進(jìn)行手術(shù)修復(fù)的階段,這個(gè)階段網(wǎng)絡(luò)用戶(hù)會(huì)非常謹(jǐn)慎,一般會(huì)選擇更加權(quán)威的醫(yī)院接受治療。對(duì)于權(quán)威性高的醫(yī)院需要對(duì)此階段加大投入:
病因癥狀了解階段的網(wǎng)絡(luò)用戶(hù)主要是通過(guò)搜索引擎查詢(xún)特定癥狀或者病因找到企業(yè)網(wǎng)站,并閱讀網(wǎng)站上已經(jīng)準(zhǔn)備好的內(nèi)容來(lái)為他們答疑解惑,在這之后引導(dǎo)其發(fā)現(xiàn)自己所需服務(wù)。這個(gè)階段選擇的關(guān)鍵詞例詞見(jiàn)下表:
當(dāng)網(wǎng)絡(luò)用戶(hù)開(kāi)始查詢(xún)具體的手術(shù)項(xiàng)目、方法、治療方法、效果、副作用/后遺癥、治療費(fèi)用時(shí),就進(jìn)入了手術(shù)治療信息了解階段。這個(gè)階段選擇的關(guān)鍵詞例詞見(jiàn)下表:
在比較對(duì)比階段,網(wǎng)絡(luò)用戶(hù)在對(duì)病因癥狀、治療方法、手術(shù)項(xiàng)目進(jìn)行了解的基礎(chǔ)上進(jìn)行醫(yī)院和專(zhuān)家的對(duì)比選擇;具體關(guān)鍵詞例詞見(jiàn)下表:
當(dāng)網(wǎng)絡(luò)用戶(hù)帥選出了自己信賴(lài)的醫(yī)院及專(zhuān)家后,便會(huì)直接進(jìn)入網(wǎng)站通過(guò)網(wǎng)站進(jìn)行在線咨詢(xún),這時(shí)就到了尋求手術(shù)治療階段。
(4)以企業(yè)營(yíng)銷(xiāo)目標(biāo)進(jìn)行關(guān)鍵詞過(guò)濾
以提升品牌知名度為標(biāo)準(zhǔn)的關(guān)鍵詞選擇過(guò)濾出來(lái)的關(guān)鍵詞主要是包含企業(yè)名稱(chēng)或者可以體現(xiàn)出企業(yè)產(chǎn)品或者服務(wù)優(yōu)勢(shì)的關(guān)鍵詞,通過(guò)篩選,最終確定的關(guān)鍵詞種類(lèi)有“品牌詞”、“行業(yè)詞”中的‘效果詞’以及“長(zhǎng)尾詞”中的‘比較詞’。
以網(wǎng)站轉(zhuǎn)化為標(biāo)準(zhǔn)的關(guān)鍵詞選擇過(guò)濾出來(lái)的關(guān)鍵詞主要集中在“行業(yè)詞” “品牌詞”和“短語(yǔ)詞”。由于行業(yè)詞和品牌詞中的關(guān)鍵詞含有企業(yè)品牌和網(wǎng)絡(luò)用戶(hù)搜索5個(gè)階段的關(guān)鍵詞,其能夠帶來(lái)更高的轉(zhuǎn)換率,故而將這三類(lèi)關(guān)鍵詞設(shè)置為重點(diǎn)關(guān)鍵詞。對(duì)于“長(zhǎng)尾詞”中的效果詞、比較詞,其可以體現(xiàn)出醫(yī)療企業(yè)的權(quán)威性和優(yōu)勢(shì)“激光脫毛效果好”、“武漢脫毛醫(yī)院哪家好”等能夠很好體現(xiàn)三甲醫(yī)院權(quán)威的關(guān)鍵詞也可以帶來(lái)較高轉(zhuǎn)化率,這兩類(lèi)關(guān)鍵詞歸類(lèi)至次重點(diǎn)關(guān)鍵詞?!伴L(zhǎng)尾詞”中的“癥狀+解決”詞和“病因詞”,由于其不能明確判斷網(wǎng)絡(luò)用戶(hù)需求,其轉(zhuǎn)化率就會(huì)相應(yīng)偏低,故將其歸類(lèi)至非重點(diǎn)關(guān)鍵詞,在進(jìn)行關(guān)鍵詞廣告投放過(guò)程中可以選擇這類(lèi)關(guān)鍵詞,也可以將其剃除。
醫(yī)療企業(yè)在使用層級(jí)遞進(jìn)式關(guān)鍵詞選詞法進(jìn)行關(guān)鍵詞選擇時(shí),需要研究網(wǎng)絡(luò)用戶(hù)的搜索行為,并結(jié)合企業(yè)自身情況,合理使用關(guān)鍵詞過(guò)濾組合,只有這樣才能選擇到有利于醫(yī)療企業(yè)搜索引擎營(yíng)銷(xiāo)的關(guān)鍵詞組合。
5.總結(jié)
企業(yè)搜索引擎關(guān)鍵詞營(yíng)銷(xiāo)活動(dòng)開(kāi)始前,關(guān)鍵詞的選擇一般都是不完美的,對(duì)于想要通過(guò)搜索引擎進(jìn)行關(guān)鍵詞廣告投放來(lái)開(kāi)展網(wǎng)絡(luò)業(yè)務(wù)的企業(yè)來(lái)說(shuō),需要對(duì)關(guān)鍵詞營(yíng)銷(xiāo)的效果進(jìn)行跟蹤測(cè)試,不斷地對(duì)測(cè)試結(jié)果加以分析,根據(jù)分析結(jié)果有目的性的增加或者減少關(guān)鍵詞,以期讓企業(yè)的搜索引擎關(guān)鍵詞營(yíng)銷(xiāo)效果達(dá)到最佳。
企業(yè)在利用搜索引擎進(jìn)行關(guān)鍵詞營(yíng)銷(xiāo)時(shí),需要明白關(guān)鍵詞是需要根據(jù)營(yíng)銷(xiāo)效果及目的進(jìn)行不斷調(diào)整的,當(dāng)碰到網(wǎng)企業(yè)營(yíng)銷(xiāo)目標(biāo)發(fā)生變化、競(jìng)爭(zhēng)對(duì)手品牌提升或者企業(yè)產(chǎn)品、服務(wù)進(jìn)入不同時(shí)期等情況時(shí),企業(yè)需要根據(jù)情況進(jìn)行關(guān)鍵詞的再選擇,否則,已選擇的關(guān)鍵詞或跟蹤而選定的有效關(guān)鍵詞,就會(huì)出現(xiàn)轉(zhuǎn)化率降低的情況,進(jìn)而影響企業(yè)進(jìn)行搜索引擎關(guān)鍵詞營(yíng)銷(xiāo)的效果。
參考文獻(xiàn):
篇9
關(guān)鍵詞:網(wǎng)絡(luò) 搜索引擎 發(fā)展 使用技巧
中圖分類(lèi)號(hào):G520文獻(xiàn)標(biāo)識(shí)碼: A
1 搜索引擎技術(shù)發(fā)展史
從搜索引擎所采取的技術(shù)來(lái)說(shuō),可以將搜索引擎技術(shù)的發(fā)展劃分為4個(gè)時(shí)代。
1.1 分類(lèi)目錄的時(shí)代
這個(gè)時(shí)代也可以稱(chēng)為“導(dǎo)航時(shí)代”,Yahoo和國(guó)內(nèi)hao123是這個(gè)時(shí)代的代表。通過(guò)人工收集整理,把屬于各個(gè)類(lèi)別的高質(zhì)量網(wǎng)站或者網(wǎng)頁(yè)分門(mén)別類(lèi)羅列,用戶(hù)可以根據(jù)分組目錄來(lái)查找高質(zhì)量的網(wǎng)站。這種方式是純?nèi)斯さ姆绞?,并未采取什么高深的技術(shù)手段。
采取分類(lèi)目錄的方式,一般被收錄的網(wǎng)站質(zhì)量都較高,但是這種方式可擴(kuò)展性不強(qiáng),絕大部分網(wǎng)站不能被收錄。
1.2 文本檢索的時(shí)代
文本檢索的一代采用經(jīng)典的信息檢索模型,比如布爾模型、向量空間模型或者概率模型,來(lái)計(jì)算用戶(hù)查詢(xún)關(guān)鍵詞和網(wǎng)頁(yè)文本內(nèi)容的相關(guān)程度。網(wǎng)頁(yè)之間有豐富的鏈接關(guān)系,而這一代搜索引擎并未使用這些信息。早期的很多搜索引擎比如Alta Vista、Excite等大都采取這種模式。
相比分類(lèi)目錄,這種方式可以收錄大部分網(wǎng)頁(yè),并能夠按照網(wǎng)頁(yè)內(nèi)容和用戶(hù)查詢(xún)的匹配程度進(jìn)行排序。但是總體而言,搜索結(jié)果質(zhì)量不是很好。
1.3 鏈接分析的時(shí)代
這一代的搜索引擎充分利用了網(wǎng)頁(yè)之間的鏈接關(guān)系,并深入挖掘和利用了網(wǎng)頁(yè)鏈接所代表的含義。通常而言,網(wǎng)頁(yè)鏈接代表了一種推薦關(guān)系,所以通過(guò)鏈接分析可以在海量?jī)?nèi)容中找出重要的網(wǎng)頁(yè)。這種重要性本質(zhì)上是對(duì)網(wǎng)頁(yè)流行程度的一種衡量,因?yàn)楸煌扑]次數(shù)多的網(wǎng)頁(yè)其實(shí)代表了具有流行性。搜索引擎通過(guò)結(jié)合網(wǎng)頁(yè)流行性和內(nèi)容相似性來(lái)改善搜索質(zhì)量。
Google率先提出并使用PageRank鏈接分析技術(shù),并大獲成功,這同時(shí)引進(jìn)了學(xué)術(shù)界和其他商業(yè)搜索引擎的關(guān)注。后來(lái)學(xué)術(shù)界陸續(xù)提出了很多改進(jìn)的鏈接分析算法。目前幾乎所有的商業(yè)搜索引擎都采取了鏈接分析技術(shù)。
采用鏈接分析能夠有效改善搜索結(jié)果質(zhì)量,但是這種搜索引擎并未考慮用戶(hù)的個(gè)性化要求,所以只要輸入的查詢(xún)請(qǐng)求相同,所有用戶(hù)都會(huì)獲得相同的搜索結(jié)果。另外,很多網(wǎng)站擁有者為了獲得更高的搜索排名,針對(duì)鏈接分析算法提出了不少鏈接作弊方案,這樣導(dǎo)致搜索結(jié)果質(zhì)量變差。
1.4 用戶(hù)中心的時(shí)代
目前的搜索引擎大都可以歸入這個(gè)時(shí)代,即以理解用戶(hù)需求為核心。不同用戶(hù)即使輸入同一個(gè)查詢(xún)關(guān)鍵詞,但其目的也有可能不一樣。比如同樣輸入“蘋(píng)果”作為查詢(xún)?cè)~,一個(gè)追捧不iPhone的時(shí)尚青年和一個(gè)果農(nóng)的目的會(huì)有相當(dāng)大的差距。即使是同一個(gè)用戶(hù),輸入相同的查詢(xún)?cè)~,也會(huì)因?yàn)樗诘臅r(shí)間和場(chǎng)合不同,需求有所變化。而目前搜索引擎大都致力于解決如下問(wèn)題:如何能夠理解用戶(hù)發(fā)出的某個(gè)很短小的查詢(xún)?cè)~背后包含的真正需求,所以這一代的搜索引擎稱(chēng)之為以用戶(hù)為中心的一代。
為了能夠獲取用戶(hù)的真實(shí)需求,目前搜索引擎大都做了很多技術(shù)方面的嘗試。比如利用用戶(hù)發(fā)送查詢(xún)時(shí)的時(shí)間和地理位置信息,利用用戶(hù)過(guò)去發(fā)出的查詢(xún)?cè)~及相應(yīng)的點(diǎn)擊記錄等歷史信息等技術(shù)手段,來(lái)試圖理解用戶(hù)此時(shí)此地的真正需求。
2 網(wǎng)絡(luò)搜索引擎的發(fā)展趨勢(shì)
2.1 個(gè)性化搜索
互聯(lián)網(wǎng)的發(fā)展已經(jīng)進(jìn)入了新的階段,即以用戶(hù)為中心的階段。如何通用用戶(hù)的網(wǎng)上行為建立用戶(hù)的個(gè)人模型,并基于此提供精準(zhǔn)的個(gè)性化服務(wù)成為各種研究的重點(diǎn)。搜索引擎也不例外,個(gè)性化搜索即是為了解決這個(gè)問(wèn)題而提出的技術(shù)領(lǐng)域。
對(duì)于搜索引擎用戶(hù)來(lái)說(shuō),由于其個(gè)人興趣不同,即使是同一個(gè)查詢(xún)?cè)~,也可能其搜索意圖迥異。如用用戶(hù)發(fā)出查詢(xún)“Ajax”,如果這個(gè)用戶(hù)是計(jì)算機(jī)工程人員,那么很有可能希望查找的是技術(shù)資料;而如果這個(gè)用戶(hù)是個(gè)球迷,那么很可能希望查找的是了阿賈克斯球隊(duì)的信息。所以即使是相同的查詢(xún)?cè)~,如何為不同的用戶(hù)提供個(gè)性化的搜索結(jié)果,成為衡量搜索引擎搜索質(zhì)量非常重要的標(biāo)準(zhǔn)。
2.2 社會(huì)化搜索
隨著Facebook的逐日流行,社交網(wǎng)絡(luò)平臺(tái)和相關(guān)應(yīng)用占據(jù)了互聯(lián)網(wǎng)的主流。社交網(wǎng)絡(luò)平臺(tái)強(qiáng)調(diào)用戶(hù)之間的聯(lián)系和交互,這對(duì)傳統(tǒng)的搜索技術(shù)提出了新的挑戰(zhàn)。傳統(tǒng)搜索技術(shù)強(qiáng)調(diào)搜索結(jié)果和用戶(hù)需求的相關(guān)性,社會(huì)化搜索除了相關(guān)性外,還額外增加了一個(gè)維度,即搜索結(jié)果的可信賴(lài)性。對(duì)于某個(gè)查詢(xún),相關(guān)的搜索結(jié)果可能成千上萬(wàn),但是如果是處于用戶(hù)社交網(wǎng)絡(luò)內(nèi)其他用戶(hù)的信息、點(diǎn)評(píng)的評(píng)論或者驗(yàn)證過(guò)的信息則更可依賴(lài),這是與用戶(hù)的心理密切相關(guān)的。社會(huì)化搜索即結(jié)合了這種相關(guān)性和可依賴(lài)性,為用戶(hù)提供更準(zhǔn)確、更值得信任的搜過(guò)結(jié)果。
社會(huì)化搜索的本質(zhì)是信息過(guò)濾與推薦,即對(duì)用戶(hù)的疑問(wèn),社會(huì)化搜索系統(tǒng)推薦合適的人來(lái)回答用戶(hù)疑問(wèn),或者通過(guò)社交關(guān)系過(guò)濾掉不可依賴(lài)內(nèi)容,推薦可依賴(lài)內(nèi)容。根據(jù)其他用戶(hù)和提問(wèn)者的關(guān)系,社會(huì)化搜索系統(tǒng)重點(diǎn)關(guān)注4類(lèi)關(guān)系:直接有社交聯(lián)系的成員,比如熟人或者朋友;有相同興趣的成員;用戶(hù)所加入網(wǎng)絡(luò)社區(qū)的成員;領(lǐng)域?qū)<?。直接具有社交?lián)系的成員對(duì)搜索者具有直接影響力,比如購(gòu)物搜索時(shí)對(duì)產(chǎn)品品牌的評(píng)價(jià);有相同興趣的成員則形成了有效的信息過(guò)濾者或者推薦者;搜索者所在社區(qū)的成員從本質(zhì)講也是有相同興趣的成員,對(duì)于搜索者的問(wèn)題能夠開(kāi)有效的信息過(guò)濾和推薦;而領(lǐng)域?qū)<覄t對(duì)問(wèn)題的解答具有權(quán)威性。通過(guò)結(jié)合或者分別使用以上4類(lèi)社區(qū)成員的信息,社會(huì)化搜索系統(tǒng)可以給搜索者提供合適的回答者或者值得依賴(lài)的信息。
2.3 實(shí)時(shí)搜索
隨著Twittet、微博等微信息的個(gè)人媒體平臺(tái)逐步興起,對(duì)搜索引擎的實(shí)時(shí)性要求日益提高。微博平臺(tái)和傳統(tǒng)的信息平臺(tái)比如網(wǎng)頁(yè)、博客、新聞等相比,有其特殊性。其中一個(gè)突出的特點(diǎn)是時(shí)效性強(qiáng),越來(lái)越多突發(fā)事件的首次出現(xiàn)的微博平臺(tái)上,比如某地地震或者社會(huì)事件,這是有其必然性的。
實(shí)時(shí)搜索與傳統(tǒng)的網(wǎng)頁(yè)搜索有很大差異。實(shí)時(shí)搜索的核心強(qiáng)調(diào)“快”,即用戶(hù)的信息能夠第一時(shí)間被搜索引擎發(fā)現(xiàn)、索引并搜索到。傳統(tǒng)搜索引擎在實(shí)現(xiàn)機(jī)制上很難達(dá)到這一點(diǎn),所以實(shí)時(shí)搜索在搜索引擎的爬蟲(chóng)、索引系統(tǒng)和搜索結(jié)果排序方面都有自己獨(dú)有的特點(diǎn)。在索引構(gòu)建方面,實(shí)時(shí)搜索要求第一時(shí)間對(duì)新的內(nèi)容進(jìn)行索引,即用戶(hù)則信息可搜。這對(duì)傳統(tǒng)的索引機(jī)制提出了挑戰(zhàn),要求索引系統(tǒng)支持在建立索引的過(guò)程中,也能夠提供搜索服務(wù)。
在搜索結(jié)果排序方面,實(shí)時(shí)搜索也有其特點(diǎn),除了內(nèi)容相關(guān)性要求外,時(shí)間因素是搜索排序中首要的考慮因素,很多實(shí)時(shí)搜索系統(tǒng)默認(rèn)按時(shí)間順序排序,即最新的信息排在前列。對(duì)于一個(gè)完善的實(shí)時(shí)搜索排序算法來(lái)說(shuō),一般重點(diǎn)考慮以下4方面的因子:
(1)內(nèi)容相關(guān)性:信息是否與用戶(hù)查詢(xún)主題相關(guān)。
(2)時(shí)效性:時(shí)間越近的信息,其搜索排名應(yīng)該越靠前。
(3)信息重要性:越重要或者越流行的信息排名應(yīng)該越靠前,作為重要性或者流行性的判斷指標(biāo)有很多,比如信息來(lái)源是否可靠(微博中信息者的重要性)、被轉(zhuǎn)發(fā)次數(shù)多少、被評(píng)論次數(shù)多少等都可以作為判斷指標(biāo)。
(4)社交性:一般來(lái)說(shuō),微博平臺(tái)同時(shí)也是一個(gè)社交平臺(tái),微博用戶(hù)的關(guān)注人和被關(guān)注人體現(xiàn)了這種社交性。排序時(shí),應(yīng)該將搜索結(jié)果的社交性體現(xiàn)出來(lái),即用戶(hù)關(guān)注人的信息排名應(yīng)該靠前。
2.4 移動(dòng)搜索
隨著智能的快速發(fā)展,基于手機(jī)等移動(dòng)設(shè)備的搜索日益流行。移動(dòng)設(shè)備對(duì)搜索應(yīng)用的需求與PC等不同,主要源于其與PC相比資源的有限性,比如手機(jī)的屏幕較小,可顯示區(qū)域不多;手機(jī)存儲(chǔ)和計(jì)算資源能力較弱;手機(jī)設(shè)備打開(kāi)網(wǎng)頁(yè)的速度較慢;手機(jī)輸入較為煩瑣等。所以針對(duì)移動(dòng)設(shè)備的搜索需要根據(jù)手機(jī)等移動(dòng)設(shè)備自身的特點(diǎn),開(kāi)發(fā)適合其資源和設(shè)備的搜索應(yīng)用。
使用手機(jī)搜索與PC搜索一樣,由3個(gè)步驟組成:用戶(hù)輸入查詢(xún),搜索引擎提供搜索結(jié)果信息,用戶(hù)點(diǎn)擊打開(kāi)感興趣的頁(yè)面??紤]到移動(dòng)設(shè)備的資源有限,在這3個(gè)步驟都要考慮如何增加用戶(hù)的體驗(yàn)。對(duì)于用戶(hù)輸入查詢(xún)這一環(huán)節(jié)來(lái)說(shuō),因?yàn)檩斎腚y度比桌面設(shè)備大,不夠便捷,包括移動(dòng)設(shè)備中的中文輸入法由于資源所限,智能性不足,所以對(duì)于移動(dòng)搜索來(lái)說(shuō),如何讓用戶(hù)輸入更便捷是最主要的問(wèn)題。由于移動(dòng)設(shè)備屏幕較小,如何在這么上的展示面積早讓用戶(hù)更快、更直接地找到答案至關(guān)重要。所以,移動(dòng)設(shè)備搜索對(duì)搜索的精度及搜索結(jié)果的展示方式要求更高。如果用戶(hù)在搜索結(jié)果的摘要區(qū)域無(wú)法獲得答案,就必須點(diǎn)擊網(wǎng)頁(yè),查看頁(yè)面內(nèi)容,以搜索引擎目前的搜索精度來(lái)看,這步多多少少是難免的。既然如此,目標(biāo)網(wǎng)頁(yè)往往內(nèi)容很多,包含導(dǎo)航欄、廣告欄、大量圖片等既消耗帶寬資源,又與用戶(hù)搜索內(nèi)容無(wú)關(guān)的信息,所以在這上步驟,移動(dòng)搜索的問(wèn)題就轉(zhuǎn)化成了如何提供給用戶(hù)頁(yè)面中最重要、最相關(guān)的部分。搜索系統(tǒng)可以為用戶(hù)提供加工過(guò)的目標(biāo)頁(yè)面,通過(guò)分析目標(biāo)網(wǎng)頁(yè)的結(jié)構(gòu),自動(dòng)提取重要內(nèi)容,只將這部分內(nèi)容展示給用戶(hù),有效增加用戶(hù)體驗(yàn)。
3 網(wǎng)絡(luò)搜索引擎的使用技巧
21世紀(jì)是信息社會(huì),由于Internet的廣泛應(yīng)用和發(fā)展,世界范圍內(nèi)的信息交流、信息資源共享成為現(xiàn)實(shí),網(wǎng)絡(luò)已成為人們進(jìn)行交流、獲取信息的重要途徑。但因特網(wǎng)上的信息內(nèi)容龐雜,缺乏統(tǒng)一的組織和管理,使用者只有掌握一定的搜索技巧,才能準(zhǔn)確、及時(shí)、有效地獲取自己所需的信息,實(shí)現(xiàn)網(wǎng)絡(luò)信息存在價(jià)值,提高信息資源使用效率。
3.1 選擇合適的搜索引擎
不同的搜索引擎特點(diǎn)不同,優(yōu)勢(shì)不一,信息覆蓋范圍也有所差異,合理的方式應(yīng)該是依據(jù)檢索目的和具體要求選擇不同的搜索引擎。如果需要查找綜合性、概括性的主題概念,或是對(duì)檢索準(zhǔn)確度要求較高的課題,可以使用目錄式搜索引擎。如果需要檢索特定的信息,或是較為專(zhuān)、深、具體或類(lèi)屬不明確的課題,應(yīng)該用關(guān)鍵詞索引式搜索引擎。
3.2 適當(dāng)使用垂直搜索引擎
一個(gè)搜索引擎很難收集所有主題的網(wǎng)絡(luò)信息,很難將各主題都做得精確而又專(zhuān)業(yè)。垂直搜索引擎是相對(duì)通用搜索引擎的信息量大、查詢(xún)不準(zhǔn)確、深度不夠等提出來(lái)的新的搜索引擎服務(wù)模式,通過(guò)針對(duì)某一特定領(lǐng)域、某一特定人群或某一特定需求提供的有一定價(jià)值的信息和相關(guān)服務(wù)。其特點(diǎn)就是“專(zhuān)、精、深”,且具有行業(yè)色彩,相比較通用搜索引擎的海量信息無(wú)序化,垂直搜索引擎則顯得更加專(zhuān)注、具體和深入。比如股票、天氣、新聞等類(lèi)的搜索引擎,具有很高的針對(duì)性,用戶(hù)對(duì)查詢(xún)結(jié)果的滿(mǎn)意度較高。
3.3 使用元搜索引擎
采用不同的搜索引擎,檢索效果的不同,在一個(gè)搜索引擎上找不到的信息卻可能在另一個(gè)搜索引擎上找到,每個(gè)單一搜索引擎的搜索范圍只能達(dá)到整個(gè)www資源的30―50%,查準(zhǔn)率不到50%。所以,用戶(hù)常常要切換多個(gè)搜索引擎進(jìn)行檢索,并要了解多個(gè)搜索引擎,這給用戶(hù)帶來(lái)了不便。元搜索引擎通過(guò)一個(gè)統(tǒng)一用戶(hù)界面幫助用戶(hù)在多個(gè)搜索引擎中選擇和利用一個(gè)或多個(gè)合適的搜索引擎來(lái)實(shí)現(xiàn)檢索操作,并將檢索結(jié)果集中統(tǒng)一處理,以統(tǒng)一的格式提供給用戶(hù),是對(duì)分布于網(wǎng)絡(luò)的多種檢索工具的全局控制機(jī)制,查全率和查準(zhǔn)率都比較高。
3.4 提煉準(zhǔn)確的搜索關(guān)鍵詞
使用搜索引擎進(jìn)行信息搜索,最重要的是關(guān)鍵詞的選擇,關(guān)鍵詞選擇得準(zhǔn)確與否直接影響到檢索效果的好壞。因此,用戶(hù)提供的關(guān)鍵詞必須能準(zhǔn)確表達(dá)自己的檢索意圖。盡量不要選擇常用詞匯進(jìn)行搜索,盡量不要使用自然語(yǔ)言,盡量使用多個(gè)頁(yè)不是一個(gè)關(guān)鍵詞。
3.5 使用限制指令
限制指令把檢索限制在某些指定的字段內(nèi),限制了檢索詞在數(shù)據(jù)庫(kù)中出現(xiàn)的位置,以提高檢索效果。如:使用site命令指定在某個(gè)特定的網(wǎng)站內(nèi)查找相關(guān)信息,使用inurl命令指定僅在網(wǎng)頁(yè)的url搜索,使用intitle命令指定僅在網(wǎng)頁(yè)的title中搜索,使用filetype命令指定搜索文件的特定類(lèi)型,等等。
3.6 盡量使用“高級(jí)搜索”
大多數(shù)搜索引擎都提供高級(jí)搜索功能,其選項(xiàng)在默認(rèn)值、靈活性、定位精確性等方面都優(yōu)于普通搜索功能。利用“高級(jí)搜索”中的選項(xiàng)限制可以有效且更加方便地控制檢索結(jié)果的范圍,可以省去用戶(hù)自行設(shè)定檢索式的麻煩。搜索引擎提供的范圍限制類(lèi)型大體有分類(lèi)范圍、地域范圍、時(shí)間范圍、網(wǎng)站類(lèi)型范圍,以及其他特殊范圍。一些搜索引擎提供了許多特殊范圍的限定,如域名后綴(com、gov、org等)、文件類(lèi)型(文本、圖形、聲音等)。
結(jié)束語(yǔ):隨著科學(xué)的進(jìn)步與技術(shù)的發(fā)展,Internet上信息數(shù)量也越來(lái)越龐大,而且含有大量的多媒體信息,如何充分利用這一巨量的信息資源,是用戶(hù)所渴望和追求的,而通過(guò)搜索引擎來(lái)查詢(xún)是查找信息最方便、快捷的途徑。但是搜索引擎數(shù)量眾多、各有所長(zhǎng),使用者應(yīng)充分利用各個(gè)搜索引擎的優(yōu)勢(shì)與特點(diǎn),靈活運(yùn)用并加以綜合利用,以最快捷的方式獲得最佳搜索結(jié)果。
參考文獻(xiàn):
[1] 馬志杰 我國(guó)搜索引擎評(píng)價(jià)研究的現(xiàn)狀、問(wèn)題及對(duì)策 圖書(shū)館學(xué)研究 2013(04)
篇10
關(guān)鍵詞:搜索引擎優(yōu)化;電子商務(wù)網(wǎng)站排名;研究策略
中圖分類(lèi)號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)26-7404-02
Research on the Search Engine Optimization Srtategy of E-commerce website
WANG Pu, TAO Jian-wen
(Computer Application Research Institute of Zhejiang Business Technology Institute,Ningbo 315012,China)
Abstract: Search engine optimization is very important for E-commerce to promote its role.Based on analysis the factors of impacting the website search engine rank,the SEO strategy of website engine ranking is proposed.
Key words: search engine optimization; E-commerce website rank; strategy
近年來(lái)迅猛發(fā)展的電子商務(wù),讓無(wú)數(shù)企業(yè)從中獲得了巨大的商機(jī),在這個(gè)電子商務(wù)大潮中,搜索引擎優(yōu)化(SEO)無(wú)疑成為了開(kāi)路先鋒。搜索引擎優(yōu)化就是這樣一個(gè)角色,它可以把網(wǎng)上的客戶(hù)帶到商家的身邊,讓商家從無(wú)數(shù)的
競(jìng)爭(zhēng)者中脫穎而出。所以說(shuō)搜索引擎優(yōu)化在電子商務(wù)發(fā)展中起著重要的作用。
1 搜索引擎優(yōu)化
搜尋引擎優(yōu)化(Search Engine Optimization,簡(jiǎn)稱(chēng)SEO)是一種利用搜索引擎的搜索規(guī)則來(lái)提高目的網(wǎng)站在有關(guān)搜索引擎內(nèi)的提名的方式。由于不少研究發(fā)現(xiàn),搜索引擎的用戶(hù)往往只會(huì)留意搜索結(jié)果最開(kāi)首的幾項(xiàng)條目,所以不少網(wǎng)站都希望透過(guò)各種形式來(lái)影響搜索引擎的排序。所謂“針對(duì)搜尋引擎做優(yōu)化的處理”,是指為了要讓網(wǎng)站更容易被搜尋引擎接受。搜尋引擎會(huì)將網(wǎng)站彼此間的內(nèi)容做一些相關(guān)性的資料對(duì)比,然后再由瀏覽器將這些內(nèi)容以最快速且接近最完整的方式,呈現(xiàn)給搜索者。
2 影響電子商務(wù)網(wǎng)站搜索引擎排名的主要因素
影響網(wǎng)站搜索引擎排名的因素很多,主要有網(wǎng)站設(shè)計(jì)的優(yōu)化、關(guān)鍵詞和文本優(yōu)化、單個(gè)網(wǎng)頁(yè)的優(yōu)化、網(wǎng)站外部連接的優(yōu)化。本文主要針對(duì)影響電子商務(wù)網(wǎng)站搜索引擎排名的主要因素進(jìn)行闡述。
2.1 購(gòu)物車(chē)系統(tǒng)商品信息的提取
電子商務(wù)網(wǎng)站最重要的一個(gè)功能就是在線購(gòu)物,商家當(dāng)然希望搜索引擎盡可能多的搜索到相應(yīng)的商品信息。然而現(xiàn)在大多數(shù)的購(gòu)物車(chē)系統(tǒng)都是在數(shù)據(jù)庫(kù)中存儲(chǔ)商品信息,而在訪客點(diǎn)擊產(chǎn)品鏈接的時(shí)候,網(wǎng)站系統(tǒng)將信息從數(shù)據(jù)庫(kù)中讀出來(lái)呈現(xiàn)在網(wǎng)頁(yè)上。這個(gè)做法不僅方便而且便于管理,也方便訪客來(lái)進(jìn)行在線搜索商品。但是它有一個(gè)致命的缺點(diǎn):像google這樣的搜索引擎是很難抓取到這樣的商品信息,這就像搜索引擎抓取不到存儲(chǔ)在數(shù)據(jù)庫(kù)里面的網(wǎng)頁(yè)內(nèi)容一樣。
2.2 關(guān)鍵詞的選擇
在做電子商務(wù)網(wǎng)站推廣中,關(guān)鍵詞是搜索引擎優(yōu)化的核心。我們知道,適當(dāng)?shù)年P(guān)鍵詞,能給商家?guī)?lái)更多的潛在用戶(hù)。遺憾的是,許多站點(diǎn)在設(shè)計(jì)之初或者根本沒(méi)有考慮關(guān)鍵詞策略,或者雖認(rèn)識(shí)到關(guān)鍵詞的重要性,但選取關(guān)鍵詞時(shí),完全是站在站點(diǎn)和設(shè)計(jì)人員的角度選擇的。這兩種做法都是不可取的,相反,我們應(yīng)該站在用戶(hù)的角度來(lái)選取關(guān)鍵詞,因?yàn)檎军c(diǎn)最終是供用戶(hù)訪問(wèn)的,而不是讓站點(diǎn)的設(shè)計(jì)人員訪問(wèn)的。
2.3 網(wǎng)頁(yè)標(biāo)題的優(yōu)化
電子商務(wù)網(wǎng)站的每一個(gè)網(wǎng)頁(yè)都應(yīng)該有一個(gè)能準(zhǔn)確描述該網(wǎng)頁(yè)內(nèi)容(通常是商品信息內(nèi)容)的獨(dú)立的標(biāo)題,正如每個(gè)網(wǎng)頁(yè)都應(yīng)該有一個(gè)惟一的URL一樣,這是一個(gè)網(wǎng)頁(yè)區(qū)別于其他網(wǎng)頁(yè)的基本屬性之一。然而根據(jù)新競(jìng)爭(zhēng)力網(wǎng)絡(luò)營(yíng)銷(xiāo)管理顧問(wèn)針對(duì)103個(gè)企業(yè)網(wǎng)站調(diào)查發(fā)現(xiàn),只有14.5%的網(wǎng)站為每個(gè)內(nèi)容頁(yè)面設(shè)計(jì)相應(yīng)的標(biāo)題(含并不專(zhuān)業(yè)的網(wǎng)頁(yè)標(biāo)題),其他超過(guò)85%的企業(yè)網(wǎng)站中所有的網(wǎng)頁(yè)都共用一個(gè)網(wǎng)頁(yè)標(biāo)題,通常為企業(yè)名稱(chēng)或者企業(yè)名稱(chēng)縮寫(xiě),其中有些網(wǎng)站甚至沒(méi)有合理的網(wǎng)頁(yè)標(biāo)題。
3 電子商務(wù)網(wǎng)站搜索引擎優(yōu)化(SEO)策略
如何使電子商務(wù)網(wǎng)站能夠在google搜索引擎上排名靠前,根據(jù)筆者對(duì)搜索引擎優(yōu)化的研究,針對(duì)電子商務(wù)網(wǎng)站的特點(diǎn),總結(jié)出以下基本策略。
3.1 動(dòng)態(tài)網(wǎng)頁(yè)靜態(tài)化
我們需要購(gòu)物車(chē)系統(tǒng)制作出的產(chǎn)品網(wǎng)頁(yè)能夠適應(yīng)搜索引擎,即這些網(wǎng)頁(yè)必須是靜態(tài)的,而不是包含數(shù)據(jù)庫(kù)變量和問(wèn)號(hào)的網(wǎng)頁(yè)名稱(chēng)。如下面的所示網(wǎng)頁(yè)是很少能被搜索引擎收錄的:/mn/detailApp/48810956?ref=GT&patid=gau&ud=470956&pdid=b24。而同樣內(nèi)容的網(wǎng)頁(yè)如下面所示的靜態(tài)網(wǎng)址,就有很大機(jī)會(huì)被搜索引擎收錄:/mn/detailApp/adr/model/titaniasd.asp。所以在設(shè)計(jì)電子商務(wù)站時(shí),要選擇一個(gè)能夠生成靜態(tài)網(wǎng)頁(yè)的購(gòu)物車(chē)系統(tǒng)。美國(guó)尚奇公司的zWebCommurce購(gòu)物車(chē)系統(tǒng)不僅能生成靜態(tài)網(wǎng)頁(yè),而且能在各個(gè)網(wǎng)頁(yè)加入seo的網(wǎng)頁(yè)標(biāo)簽,方便對(duì)網(wǎng)頁(yè)進(jìn)行搜索引擎優(yōu)化,使網(wǎng)頁(yè)更有機(jī)會(huì)攀升在搜索結(jié)果的前列。
3.2 確定關(guān)鍵詞的常用免費(fèi)工具
3.2.1 Google Suggest
/webhp?complete=1,在這個(gè)工具上,輸入一個(gè)搜索關(guān)鍵詞后,Google立刻給出一系列相關(guān)的詞語(yǔ),并且展示有多少網(wǎng)頁(yè)使用了這個(gè)搜索關(guān)鍵詞。這個(gè)工具可以幫助商家擴(kuò)大關(guān)鍵詞的選擇范圍。
3.2.2 Google 關(guān)鍵詞工具
/select/KeywordToolExternal這個(gè)工具是給那些想進(jìn)行Goolge競(jìng)價(jià)廣告的客戶(hù)使用的。但我們從這些用于廣告的關(guān)鍵詞中,也能夠發(fā)現(xiàn)人們?cè)谄綍r(shí)搜索中可能使用到哪些關(guān)鍵詞。
3.3 網(wǎng)頁(yè)標(biāo)題優(yōu)化
3.3.1 關(guān)鍵詞的采用和突出
為了讓搜索引擎讀懂網(wǎng)頁(yè)標(biāo)題中所表示的意義,應(yīng)該將網(wǎng)頁(yè)標(biāo)題放置在標(biāo)簽對(duì)中。最重要的關(guān)鍵詞應(yīng)該放置在最前列。例如“北京賓館”、“便宜舒適”和“交通方便”三個(gè)關(guān)鍵詞作為標(biāo)題,“北京賓館”放在最前面,而將第二關(guān)鍵詞放在其次,最多不要使用三個(gè)以上的關(guān)鍵詞。
3.3.2 控制標(biāo)題長(zhǎng)度和關(guān)鍵詞頻率
標(biāo)題的長(zhǎng)度應(yīng)該是言簡(jiǎn)意賅的,英文標(biāo)簽控制在40-60個(gè)字母之間,而中文最好在19個(gè)字以?xún)?nèi)。搜索引擎是不看超過(guò)一定限度的標(biāo)題的。關(guān)鍵詞的使用應(yīng)該注意合理地分配到各個(gè)網(wǎng)頁(yè)中。在某頁(yè)使用的關(guān)鍵詞,在其他頁(yè)就要考慮是否還是那么重要。盡量避免同一關(guān)鍵詞反復(fù)出現(xiàn)在多個(gè)網(wǎng)頁(yè)的標(biāo)題中而使搜索引擎感到困惑。
4 結(jié)論
綜上所述,對(duì)于從事電子商務(wù)的企業(yè)來(lái)說(shuō),搜索引擎優(yōu)化是一種讓客戶(hù)自己找到商家的省錢(qián)、省力的營(yíng)銷(xiāo)模式。但隨著網(wǎng)絡(luò)技術(shù)的不斷創(chuàng)新,電子商務(wù)網(wǎng)站也需要做出適合自身特點(diǎn)的搜索引擎優(yōu)化策略,去適應(yīng)新技術(shù)的發(fā)展。
參考文獻(xiàn):
[1] 歐朝暉.解密SEO-搜索引擎優(yōu)化與網(wǎng)站成功策略[M].北京:電子工業(yè)出版社,2007:97-98.
相關(guān)文章
2搜索引擎商標(biāo)侵權(quán)法律問(wèn)題分析
3智能搜索引擎在商業(yè)銀行大數(shù)據(jù)中的應(yīng)用