電子商務(wù)挖掘技術(shù)運(yùn)用
時(shí)間:2022-06-27 08:31:22
導(dǎo)語(yǔ):電子商務(wù)挖掘技術(shù)運(yùn)用一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
目前隨著電子商務(wù)經(jīng)濟(jì)環(huán)境的逐漸發(fā)展完善,企業(yè)從傳統(tǒng)意義上的區(qū)域內(nèi)銷售,到跨地域限制的全球銷售,從原料選購(gòu)、產(chǎn)品宣傳、銷售、貨款結(jié)算及售后服務(wù)一系列環(huán)節(jié)都在網(wǎng)絡(luò)上進(jìn)行。這樣,網(wǎng)站是電子商務(wù)中最為重要的介質(zhì)。網(wǎng)站對(duì)用戶的吸引程度直接決定了企業(yè)發(fā)展。為了使企業(yè)不斷壯大,不斷提升企業(yè)競(jìng)爭(zhēng)力,企業(yè)決策者開(kāi)始搭建獨(dú)具創(chuàng)新的,更具個(gè)性化的,更能吸引客戶的一流的信息化網(wǎng)站,其中個(gè)性化特征是各企業(yè)追捧的方式之一。如何從眾多數(shù)據(jù)中抽取出個(gè)性化的數(shù)據(jù),就運(yùn)行到了數(shù)據(jù)挖掘技術(shù)。本文將對(duì)數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用做重點(diǎn)介紹。
1數(shù)據(jù)挖掘概念
數(shù)據(jù)挖掘(DataMining)是一種信息轉(zhuǎn)化的過(guò)程,將各種無(wú)律的、非完整的、雜亂無(wú)章的、隨機(jī)的信息中經(jīng)過(guò)各種方式轉(zhuǎn)化成我們需要的、有用的信息。Web數(shù)據(jù)挖掘(WebDataMining)是將數(shù)據(jù)挖掘技術(shù)應(yīng)用到Web網(wǎng)頁(yè)中。即從Web各種活動(dòng)信息中分析提取出有用的隱藏信息,在一定程度上利用數(shù)據(jù)挖掘技術(shù)提取出有用的知識(shí)來(lái)幫助企業(yè)和用戶更好地從網(wǎng)站中得到各自所需要的信息。
2Web數(shù)據(jù)挖掘的分類
Web數(shù)據(jù)挖掘大概可以分為三大類:Web頁(yè)面信息挖掘(WebContentMining)、Web用戶記錄挖掘(WebUsageMining)、Web結(jié)構(gòu)挖掘(WebStructureMining)。Web頁(yè)面信息挖掘是指從頁(yè)面的內(nèi)容中或者網(wǎng)頁(yè)描述中收集有用信息進(jìn)行挖掘,根據(jù)類型不同,可以分為文本挖掘、圖片挖掘和視頻挖掘等。Web用戶記錄挖掘是當(dāng)用戶訪問(wèn)頁(yè)面時(shí),記錄用戶訪問(wèn)頁(yè)面的信息,根據(jù)用戶在頁(yè)面的停留時(shí)間,訪問(wèn)的產(chǎn)品等等進(jìn)行信息挖掘,運(yùn)用一些數(shù)學(xué)方法建立用戶興趣和關(guān)注模型,不斷的跟蹤用戶完善模型,預(yù)計(jì)猜測(cè)用戶行為,從而可以對(duì)用戶進(jìn)行分類,為不同用戶量身制作自身最感興趣的產(chǎn)品信息,從而對(duì)不同用戶動(dòng)態(tài)更新個(gè)性化產(chǎn)品展示和相關(guān)廣告,取得利益最大化。Web結(jié)構(gòu)挖掘是指從Web網(wǎng)頁(yè)之間的關(guān)聯(lián)性進(jìn)行挖掘,如分析一個(gè)網(wǎng)頁(yè)鏈接和被鏈接數(shù)量來(lái)建立Web自身鏈接的結(jié)構(gòu)模式。將相似產(chǎn)品網(wǎng)頁(yè)歸類,將關(guān)聯(lián)產(chǎn)品進(jìn)行整合。使得用戶非常容易的找到相關(guān)產(chǎn)品,類似產(chǎn)品的信息。
3電子商務(wù)中Web數(shù)據(jù)挖掘的步驟
數(shù)據(jù)挖掘的步驟:確定數(shù)據(jù)挖掘的對(duì)象,確定電子商務(wù)網(wǎng)站應(yīng)用主題,確定網(wǎng)站業(yè)務(wù)對(duì)象;其次收集數(shù)據(jù)源,數(shù)據(jù)的真實(shí)性、全面性直接影響到后續(xù)工作。數(shù)據(jù)源主要有服務(wù)器端/客戶端數(shù)據(jù)、中間數(shù)據(jù)等;收集完數(shù)據(jù)后,需要對(duì)其進(jìn)行預(yù)處理,一般包括用戶識(shí)別、格式化等階段,刪除無(wú)用無(wú)關(guān)的信息,以提高挖掘效率;之后運(yùn)用機(jī)器學(xué)習(xí)及其數(shù)學(xué)統(tǒng)計(jì)方法對(duì)這些數(shù)據(jù)進(jìn)行挖掘和分析,找到相同想去的用戶群,對(duì)用戶群構(gòu)建興趣模型。最后用已知的數(shù)據(jù)對(duì)興趣模型進(jìn)行反復(fù)測(cè)試和不斷分析,再次應(yīng)用興趣模型得到最終挖掘的信息。具體步驟如圖1所示。下面對(duì)幾個(gè)重要步驟進(jìn)行更詳盡的分析。
3.1電子商務(wù)中Web數(shù)據(jù)挖掘的數(shù)據(jù)源選定
在電子商務(wù)中,Web數(shù)據(jù)源的選定的準(zhǔn)確性、全面性直接關(guān)系到整個(gè)數(shù)據(jù)挖掘流程,所謂重中之重。這些數(shù)據(jù)都有量大類多的特點(diǎn),歸納一下主要有以下幾種數(shù)據(jù),如圖2所示。①日志數(shù)據(jù)。當(dāng)用戶訪問(wèn)網(wǎng)頁(yè)時(shí),Web網(wǎng)頁(yè)會(huì)記錄一些日志文件,這些文件通常以文本形式存儲(chǔ)在服務(wù)器上,比如cookies日志文件、錯(cuò)誤日志文件等。②用戶喜好信息。指的是用戶經(jīng)常訪問(wèn)的一些產(chǎn)品信息,用戶感興趣的產(chǎn)品等等。③搜索查詢數(shù)據(jù)。這類數(shù)據(jù)是電子商務(wù)網(wǎng)站中比較常見(jiàn)的而且很典型的數(shù)據(jù)。當(dāng)用戶用Web網(wǎng)頁(yè)中的搜索引擎搜索需要的產(chǎn)品信息或廣告信息時(shí),Web網(wǎng)頁(yè)需要記錄必要的搜索信息,保存到服務(wù)器上,這些數(shù)據(jù)對(duì)之后數(shù)據(jù)挖掘建模有重要作用。④在線瀏覽,用戶購(gòu)買信息。產(chǎn)品瀏覽量信息,用戶購(gòu)買信息等等。⑤產(chǎn)品信息。各個(gè)產(chǎn)品的屬性信息。⑥客戶端的客戶信息數(shù)據(jù)。即用戶注冊(cè)登錄時(shí),存儲(chǔ)到數(shù)據(jù)庫(kù)中的姓名,職業(yè),email等等信息。在Web的數(shù)據(jù)挖掘中,用戶注冊(cè)的ID等信息需要和一些搜索查詢數(shù)據(jù)信息結(jié)合起來(lái)使用,用來(lái)提高數(shù)據(jù)挖掘的精準(zhǔn)度,使得能夠更進(jìn)一步地了解具體客戶的具體需求。
3.2Web數(shù)據(jù)挖掘如何建立數(shù)據(jù)模型
一般情況下,運(yùn)用Web數(shù)據(jù)挖掘可以在站點(diǎn)上挖掘出來(lái)的興趣模型有以下幾種:①分析頻繁路徑。可以根據(jù)一個(gè)Web站點(diǎn)中最頻繁的網(wǎng)頁(yè)路徑得到重要的網(wǎng)頁(yè),從而根據(jù)這一信息對(duì)網(wǎng)頁(yè)結(jié)構(gòu)進(jìn)行改進(jìn)。②序列模式分析。序列模式分析即在有序的時(shí)間戳事務(wù)集中,尋找那些“一些事務(wù)跟隨另一些事務(wù)”的序列事務(wù)模式。如購(gòu)買自行車的客戶中,有70%的客戶會(huì)在一個(gè)月之內(nèi)購(gòu)買打氣筒。③聚類分析。聚類分析可以對(duì)Web網(wǎng)站中的用戶進(jìn)行分類,找到具有相似需求的客戶??梢詫?duì)這類客戶進(jìn)行針對(duì)性的區(qū)別服務(wù)。如發(fā)送特定產(chǎn)品的銷售郵件及其推薦產(chǎn)品。對(duì)電子商務(wù)來(lái)說(shuō),將客戶分類可以對(duì)市場(chǎng)細(xì)分理論提供更加有力的理論數(shù)據(jù)支持。④關(guān)聯(lián)規(guī)則??梢哉业接脩糍?gòu)買產(chǎn)品的相關(guān)性。如筆記本需要有好多配件,有耳機(jī),麥克,電源,電池,鼠標(biāo),鍵盤膜等等其他構(gòu)件。利用這些相關(guān)性,可以更好的設(shè)計(jì)具體產(chǎn)品頁(yè)面的關(guān)聯(lián)產(chǎn)品信息,實(shí)施有效的市場(chǎng)策略,增加交叉產(chǎn)品的銷售額,能夠讓用戶快速找到所需要的產(chǎn)品信息。⑤異常檢測(cè)。異常檢測(cè)的前提是假設(shè)入侵者行為有別于正常用戶的行為。根據(jù)這一前提,建立用戶正?;顒?dòng)的活動(dòng)檔案,將當(dāng)前用戶的活動(dòng)行為與活動(dòng)檔案相比較,當(dāng)發(fā)現(xiàn)有別于統(tǒng)計(jì)規(guī)律時(shí),認(rèn)為該行為可能是“入侵”行為。
4結(jié)論
隨著電子商務(wù)的發(fā)展,電子商務(wù)領(lǐng)域正在迅速地?cái)U(kuò)大。由于電子商務(wù)的跨地域性,信息快速獲取性等等特點(diǎn),各大企業(yè)競(jìng)相開(kāi)展電子商務(wù)模式。運(yùn)用Web數(shù)據(jù)挖掘技術(shù),可以對(duì)電子商務(wù)中的各種繁雜的無(wú)頭緒的信息進(jìn)行整合、刪選、歸并及其分析處理,從而更好地反饋到網(wǎng)站供用戶訪問(wèn)。數(shù)據(jù)挖掘技術(shù)把這些高深復(fù)雜的數(shù)學(xué)統(tǒng)計(jì)方法、人工智能等技術(shù)封裝起來(lái),使人們不用自己掌握這些技術(shù)也能完成同樣的功能,將更多的時(shí)間和精力放在自己所要解決的問(wèn)題上,使得企業(yè)利益快速達(dá)到最大化。