電信客戶流失數(shù)據(jù)挖掘論文

時(shí)間:2022-06-24 09:51:05

導(dǎo)語:電信客戶流失數(shù)據(jù)挖掘論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

電信客戶流失數(shù)據(jù)挖掘論文

1數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘(DataMining)是一種決策支持的過程,是從看似雜亂無章的海量數(shù)據(jù)中,利用人工智能、模式識別、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫、統(tǒng)計(jì)學(xué)等技術(shù)高效的分析企業(yè)龐大的數(shù)據(jù)庫,從中找出有價(jià)值的事件,進(jìn)行合理的歸納性推理,挖掘出潛在的模式,幫助決策者做出正確的決策。

2客戶流失的概述

2.1客戶流失的理解

流失的客戶分為主動流失和被動流失。主動流失是因?yàn)榭蛻糇陨淼脑驅(qū)е碌牧魇В绺鱾€(gè)運(yùn)營商之間的競爭,客戶的搬遷、學(xué)生畢業(yè)等因素。被動流失是指客戶由于欠費(fèi)時(shí)間較長或者與運(yùn)營商簽訂的合同到期后不再續(xù)約等因素,從而運(yùn)營商終止向客戶提供服務(wù)的行為。對于銅川聯(lián)通公司,把用戶狀態(tài)為“鎖定期”、“強(qiáng)拆銷號”、“退網(wǎng)停機(jī)”、“預(yù)登錄停機(jī)”、“欠費(fèi)服務(wù)暫?!钡榷x為流失的客戶或即將流失的客戶。數(shù)據(jù)挖掘的目標(biāo)是通過挖掘出來的結(jié)果降低客戶流失率,分析各項(xiàng)因素對客戶流失的影響,用最小的成本最大程度的挽留客戶。

2.2電信客戶流失分析的特點(diǎn)

(1)電信客戶的數(shù)據(jù)量大、實(shí)時(shí)性強(qiáng)、邏輯復(fù)雜,使用歷史數(shù)據(jù)來進(jìn)行數(shù)據(jù)挖掘,結(jié)果往往會存在較大的偏差。(2)數(shù)據(jù)預(yù)處理工作需要收集大量雜亂無章的原始數(shù)據(jù)來進(jìn)行處理,工作量非常大,通常需要花費(fèi)一個(gè)項(xiàng)目大多數(shù)的時(shí)間。(3)國內(nèi)電信企業(yè)的客戶流失率大約在1%~3%左右,不適合直接采用某種模型,而需要增加流失客戶的比例,但這樣就會存在抽樣過度的風(fēng)險(xiǎn)。(4)需要考慮到多方面的平衡:首先,預(yù)測的準(zhǔn)確性,并兼顧可理解性;其次,營銷成本的收益問題和客戶挽留的價(jià)值。

3電信企業(yè)客戶流失分析的數(shù)據(jù)挖掘過程

3.1數(shù)據(jù)挖掘的模型選擇

在實(shí)踐應(yīng)用中,神經(jīng)網(wǎng)絡(luò)算法和決策樹算法在客戶流失預(yù)測的問題上都具有較高的精確度和準(zhǔn)確性。

3.1.1決策樹算法

決策樹的優(yōu)點(diǎn):能夠形成容易理解的規(guī)則并且能很好的進(jìn)行歸納分類;缺點(diǎn):預(yù)處理較多,對于數(shù)據(jù)信息不能充分利用,在數(shù)據(jù)類別較多的情況下,錯誤率也高。

3.1.2神經(jīng)網(wǎng)絡(luò)算法

神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn):在自適應(yīng)、自組織、自學(xué)習(xí)等能力較強(qiáng),抗干擾能力和互補(bǔ)性也較強(qiáng)。缺點(diǎn):解釋性差。決策樹算法和神經(jīng)網(wǎng)絡(luò)算法各有特點(diǎn),但對于解決客戶流失的問題而言,決策樹算法更容易被人們理解和接受,但在預(yù)測結(jié)果的準(zhǔn)確性和精確度較差,而神經(jīng)網(wǎng)絡(luò)算法可以彌補(bǔ)這一缺點(diǎn),提高預(yù)測模型的準(zhǔn)確度。因此,在實(shí)踐當(dāng)中,如果將兩種算法結(jié)合起來應(yīng)用,那么會對預(yù)測客戶流失的實(shí)際效果方面起到更大的作用。

3.2數(shù)據(jù)準(zhǔn)備

數(shù)據(jù)挖掘項(xiàng)目中,數(shù)據(jù)準(zhǔn)備階段及其重要,在整個(gè)挖掘壞境中也工作量最大。本次研究中,采取的是陜西銅川聯(lián)通公司2013年11月的數(shù)據(jù),數(shù)據(jù)量龐大,主要來自計(jì)費(fèi)系統(tǒng),其中包括客戶基本信息、消費(fèi)行為特征、通話行為特征,欠費(fèi)等。

4結(jié)束語

要在龐大的數(shù)據(jù)中找出有流失傾向和流失的客戶幾乎是不可能的事,在使用SPSS/Clementine進(jìn)行數(shù)據(jù)挖掘建模后,客戶挖掘的準(zhǔn)確率達(dá)到98%,為電信企業(yè)做出決策起到很大的作用,從而可以制定相應(yīng)措施挽留一些有價(jià)值的客戶。數(shù)據(jù)挖掘技術(shù)在電信行業(yè)的廣泛應(yīng)用將會使更多的電信企業(yè)從源頭上緩解客戶流失所帶來的損失,能在很大程度上避免許多損失,在激烈的市場競爭中立于不敗之地。

作者:楊逸凡 趙夏 單位:蘭州財(cái)經(jīng)大學(xué)