電力營(yíng)銷系統(tǒng)數(shù)據(jù)分析論文
時(shí)間:2022-03-27 03:50:58
導(dǎo)語(yǔ):電力營(yíng)銷系統(tǒng)數(shù)據(jù)分析論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1HANA數(shù)據(jù)分析平臺(tái)采用的核心技術(shù)
HANA數(shù)據(jù)分析平臺(tái)在軟件方面,通過(guò)內(nèi)存技術(shù),應(yīng)用程序能直接處理電力企業(yè)數(shù)據(jù)庫(kù)中的各種數(shù)據(jù),并直接在主內(nèi)存中處理。主要技術(shù)包括行+列的存儲(chǔ)、壓縮、數(shù)據(jù)分區(qū)、增量數(shù)據(jù)更新等。平臺(tái)采用的軟件包括數(shù)據(jù)抽取工具、內(nèi)存數(shù)據(jù)庫(kù)(含數(shù)據(jù)庫(kù)服務(wù)器、建模工具Studio、客戶端工具)、報(bào)表展現(xiàn)層BusinessObjectsBI組件。在硬件方面,通過(guò)預(yù)配置的軟硬件結(jié)合體,提供高性能的數(shù)據(jù)讀寫(xiě)操作,并在內(nèi)存數(shù)據(jù)庫(kù)里采用列式存儲(chǔ)從而將更多的數(shù)據(jù)存入(列式存儲(chǔ)方式更適合數(shù)據(jù)壓縮)。
2HANA數(shù)據(jù)分析平臺(tái)實(shí)施過(guò)程
數(shù)據(jù)分析平臺(tái)建設(shè)應(yīng)遵循最大限度的考慮應(yīng)用實(shí)用性、縮短實(shí)現(xiàn)周期、降低技術(shù)風(fēng)險(xiǎn)等因素。
2.1需求分析
需求分析是要對(duì)用戶的訴求或需求進(jìn)行深入了解,并在需求的基礎(chǔ)上對(duì)整個(gè)平臺(tái)進(jìn)行一致約定。因此以重要性、分析的復(fù)雜性、數(shù)據(jù)量大小、以及快速見(jiàn)效為原則,需求分析需要明確下面的內(nèi)容。
1)選擇需要分析的主題,結(jié)合當(dāng)前電力營(yíng)銷業(yè)務(wù)在計(jì)量、業(yè)擴(kuò)、抄表、電費(fèi)核算、電費(fèi)繳納、賬務(wù)等工作職能的劃分,也要考慮分析的主題具有針對(duì)性的業(yè)務(wù)場(chǎng)景,這些場(chǎng)景往往跨越多個(gè)職能。
2)分析并描述各個(gè)主題的業(yè)務(wù)背景,包括使用的用戶角色,使用的業(yè)務(wù)場(chǎng)景。以電費(fèi)出賬異常為例:電費(fèi)出賬異常主要是由于用戶檔案錯(cuò)誤、抄表錯(cuò)誤所引發(fā)的,涉及到業(yè)擴(kuò)、抄表、電費(fèi)核算等多個(gè)職能部門。以電費(fèi)出賬異常作為分析的主題,其業(yè)務(wù)場(chǎng)景主要用于電費(fèi)發(fā)行后,對(duì)引發(fā)電費(fèi)異常的用戶檔案數(shù)據(jù)、計(jì)量信息、抄表信息進(jìn)行檢查并按職能需求進(jìn)行分別展示。
3)分析各個(gè)主題間的關(guān)系,在這個(gè)平臺(tái)上用戶的所有活動(dòng)信息,如用戶請(qǐng)求的數(shù)量,用戶對(duì)這些數(shù)據(jù)的訪問(wèn)頻率、時(shí)間、數(shù)據(jù)細(xì)節(jié)層次、請(qǐng)求多大的數(shù)據(jù)量等之間的關(guān)聯(lián)。
4)分析主題所涉及的表的目錄、表的內(nèi)容、表的容量、每個(gè)表的平均行大小、表的記錄數(shù)、表的增長(zhǎng)情況等。
2.2平臺(tái)規(guī)劃
HANA數(shù)據(jù)分析平臺(tái)應(yīng)用架構(gòu)一般采用四層:數(shù)據(jù)源層、數(shù)據(jù)抽取及復(fù)制層、HANA數(shù)據(jù)集市層以及報(bào)表展示層。
1)數(shù)據(jù)源層:作為平臺(tái)的分析對(duì)象,提供報(bào)表分析所需的數(shù)據(jù),數(shù)據(jù)源層可同時(shí)支持各種類型的數(shù)據(jù)庫(kù),數(shù)據(jù)源層為營(yíng)銷系統(tǒng)(管理庫(kù)),生產(chǎn)庫(kù)到管理庫(kù)之間采用SharePlex復(fù)制工具實(shí)現(xiàn)數(shù)據(jù)同步,以避免數(shù)據(jù)抽取對(duì)生產(chǎn)系統(tǒng)的影響。
2)數(shù)據(jù)抽取和復(fù)制層:數(shù)據(jù)抽取和復(fù)制層負(fù)責(zé)將數(shù)據(jù)源層中源系統(tǒng)的數(shù)據(jù)抽取和復(fù)制到HANA分析數(shù)據(jù)庫(kù)中,主要構(gòu)成是數(shù)據(jù)抽取和復(fù)制工具,可以分別采用實(shí)時(shí)同步服務(wù)(SLT)以及非實(shí)時(shí)同步的數(shù)據(jù)服務(wù)(DataService)兩種不同的復(fù)制工具來(lái)滿足不同特征的源數(shù)據(jù)要求。在確定采用哪種工具前,需要對(duì)每個(gè)數(shù)據(jù)源的大小、變更時(shí)間、變更頻繁度、增量大小等信息做詳細(xì)了解,對(duì)不同數(shù)據(jù)源表選擇合適的復(fù)制工具。
3)數(shù)據(jù)集市層:數(shù)據(jù)集市層是整體系統(tǒng)架構(gòu)的核心,負(fù)責(zé)分析數(shù)據(jù)的儲(chǔ)存、報(bào)表模型的建立以及數(shù)據(jù)計(jì)算。該層包含分析數(shù)據(jù)庫(kù)以及虛擬模型架構(gòu)兩個(gè)主要組成,所有需分析展示的數(shù)據(jù)在數(shù)據(jù)集市層通過(guò)集市層進(jìn)行儲(chǔ)存、壓縮、建立邏輯模型并計(jì)算,通過(guò)該平臺(tái)特有的內(nèi)存計(jì)算技術(shù)可以使這個(gè)過(guò)程的效率大幅提升。
4)報(bào)表展示層:報(bào)表展示層負(fù)責(zé)將HANA數(shù)據(jù)庫(kù)中的數(shù)據(jù)運(yùn)算結(jié)果按照?qǐng)?bào)表需求進(jìn)行展示,采用SAPBusinessObjectBI4.0以及EXCEL作為展示工具。
2.3平臺(tái)實(shí)現(xiàn)
2.3.1模型設(shè)計(jì)
依據(jù)報(bào)表的需求分析、功能需求、性能需求、模型擴(kuò)展性、模型的靈活性、實(shí)現(xiàn)成本進(jìn)行平衡,在達(dá)到性能要求的前提下,設(shè)計(jì)出可以重用的模型,HANA平臺(tái)不同于傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)需要物理化模型設(shè)計(jì),HANA采用了邏輯視圖模型設(shè)計(jì)的概念,邏輯視圖從表面看體現(xiàn)的是傳統(tǒng)的星型、雪花型模型設(shè)計(jì),但這些模型中的數(shù)據(jù)并不是物理存放的。HANA提供了屬性視圖、分析視圖、計(jì)算視圖三種模型設(shè)計(jì),屬性視圖實(shí)現(xiàn)對(duì)維度的設(shè)計(jì),分析視圖則實(shí)現(xiàn)傳統(tǒng)的星型模型設(shè)計(jì),計(jì)算視圖實(shí)現(xiàn)更復(fù)雜的雪花型模型設(shè)計(jì)。模型設(shè)計(jì)時(shí)是先將需求階段所確定的分析主題作為分析對(duì)象,梳理每個(gè)主題展示所需的事實(shí)表數(shù)據(jù)內(nèi)容和數(shù)據(jù)粒度、分析維度、分析的數(shù)據(jù)指標(biāo)。例如:一個(gè)以分析電費(fèi)構(gòu)成為主題的業(yè)務(wù)場(chǎng)景,該主題分析當(dāng)期電費(fèi)的構(gòu)成情況,并同期比較各個(gè)電費(fèi)構(gòu)成的變動(dòng)情況,那它的指標(biāo)可以為目錄電度電費(fèi)、峰谷品跌、豐枯品跌、基本電費(fèi)、力調(diào)費(fèi)、代征費(fèi)、電度電費(fèi)、結(jié)算電費(fèi)等指標(biāo)。分析的維度可包含:時(shí)間維度、用戶維度、組織維度、用電服務(wù)維度、抄表維度、計(jì)收維度等。并在此時(shí)完成對(duì)事實(shí)表和維度表的邏輯數(shù)據(jù)模型設(shè)計(jì)。
2.3.2表樣及功能設(shè)計(jì)
報(bào)表的樣式和功能應(yīng)當(dāng)考慮用戶對(duì)數(shù)據(jù)進(jìn)行分析的使用習(xí)慣,借鑒數(shù)據(jù)倉(cāng)庫(kù)中的多維數(shù)據(jù)可視化方法,通過(guò)對(duì)報(bào)表的上鉆、下鉆、切片等展示功能技術(shù)的利用,實(shí)現(xiàn)對(duì)匯總性數(shù)據(jù)、明細(xì)類數(shù)據(jù)、核心數(shù)據(jù)的快速查看和分析。以上述的分析電費(fèi)構(gòu)成主題為例,其展示需求決定表樣的設(shè)計(jì)采用圖型混合表格的方式,功能上采用按照組織維度進(jìn)行上鉆、下鉆功能可查看不同供電區(qū)域的電費(fèi)構(gòu)成情況和各個(gè)指標(biāo)的排名情況,前端展示采用了BOWebintelligence嵌入DashBoard圖表設(shè)計(jì)實(shí)現(xiàn)。
2.3.3數(shù)據(jù)抽取及復(fù)制設(shè)計(jì)
為確保數(shù)據(jù)質(zhì)量,應(yīng)當(dāng)進(jìn)行數(shù)據(jù)抽取和復(fù)制的規(guī)劃設(shè)計(jì)。首先,根據(jù)模型設(shè)計(jì)中指標(biāo)、維度信息分別列舉出其相應(yīng)的數(shù)據(jù)來(lái)源,即營(yíng)銷系統(tǒng)的物理表和字段,指標(biāo)來(lái)源于營(yíng)銷系統(tǒng)的交易數(shù)據(jù),而維度來(lái)源于營(yíng)銷系統(tǒng)的主數(shù)據(jù)。其次,根據(jù)邏輯數(shù)據(jù)模型和數(shù)據(jù)來(lái)源確定營(yíng)銷數(shù)據(jù)庫(kù)到HANA數(shù)據(jù)庫(kù)的ETL規(guī)劃,根據(jù)數(shù)據(jù)的質(zhì)量規(guī)則(包括:數(shù)據(jù)清除、空值處理、數(shù)據(jù)替換、規(guī)范化數(shù)據(jù)格式等),確認(rèn)營(yíng)銷系統(tǒng)源數(shù)據(jù)到HANA目標(biāo)數(shù)據(jù)庫(kù)數(shù)據(jù)的轉(zhuǎn)換規(guī)則,同時(shí)依據(jù)數(shù)據(jù)大小、數(shù)據(jù)變更時(shí)間、數(shù)據(jù)變更頻繁度、數(shù)據(jù)增量大小要求確定采用的實(shí)時(shí)工具SLT還是定時(shí)抽數(shù)工具BODataService,例如:收費(fèi)賬務(wù)相關(guān)的交易數(shù)據(jù)存在記錄基數(shù)大、變更頻率很高等特征,采用實(shí)時(shí)復(fù)制增量數(shù)據(jù)更合適,而賬務(wù)的月結(jié)數(shù)據(jù)僅在每月初產(chǎn)生且數(shù)據(jù)量非常巨大,因此采用定時(shí)批量復(fù)制更合適。
2.3.4模型及報(bào)表開(kāi)發(fā)
模型及報(bào)表開(kāi)發(fā)共分為數(shù)據(jù)裝載、HANA建模、定義語(yǔ)義層(IDT)、報(bào)表開(kāi)發(fā)、數(shù)據(jù)校驗(yàn)五個(gè)步驟,這五個(gè)步驟相互交疊與重復(fù),直至到達(dá)最優(yōu)化設(shè)計(jì)。其中數(shù)據(jù)裝載的方式利用了SLT的實(shí)時(shí)同步技術(shù),SLT同步技術(shù)其核心是基于數(shù)據(jù)庫(kù)的觸發(fā)器模式實(shí)現(xiàn)對(duì)源數(shù)據(jù)的增量復(fù)制,最大限度的避免了對(duì)源系統(tǒng)表結(jié)構(gòu)的改變,同時(shí)采用的多任務(wù)復(fù)制機(jī)制使得實(shí)時(shí)復(fù)制的效率可保持在5~10秒內(nèi)的數(shù)據(jù)延遲,裝載后的HANA數(shù)據(jù)的大小比較源數(shù)據(jù)庫(kù)數(shù)據(jù)大小可壓縮30%~70%的容量。
3發(fā)展前景
不斷的完善HANA數(shù)據(jù)分析平臺(tái)的分析主題,不僅是基于電力營(yíng)銷系統(tǒng),還可以基于用電采集系統(tǒng)等構(gòu)建起電力企業(yè)的大數(shù)據(jù)分析平臺(tái)。利用HANA內(nèi)置的PAL(預(yù)測(cè)分析庫(kù))對(duì)海量電量數(shù)據(jù)、客戶服務(wù)數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)高級(jí)分析,建立其有效的事前預(yù)測(cè)、事中控制、事后改善的企業(yè)快速輔助決策模式。營(yíng)銷業(yè)務(wù)可以在客戶服務(wù)中對(duì)受理業(yè)務(wù)的情況信息、執(zhí)行過(guò)程、執(zhí)行結(jié)果進(jìn)行深入分析、對(duì)客戶需求進(jìn)行快速響應(yīng),改進(jìn)服務(wù)質(zhì)量、提升電網(wǎng)服務(wù)建設(shè)。更可以利用海量電能量數(shù)據(jù)對(duì)偷竊電稽核、客戶用電行為、能效管理等進(jìn)行過(guò)分析和應(yīng)用,助力營(yíng)銷輔助決策與分析能力的快速提升。
4結(jié)論
基于電力營(yíng)銷系統(tǒng)中業(yè)務(wù)數(shù)據(jù)所建立的HANA數(shù)據(jù)分析平臺(tái),從分析效率來(lái)看均有實(shí)質(zhì)性的提高。經(jīng)實(shí)踐證明,與營(yíng)銷系統(tǒng)報(bào)表在同等條件下對(duì)比,其分析效率可提高百倍以上。在大宗數(shù)據(jù)的分析上,HANA平臺(tái)更是體現(xiàn)了其快速見(jiàn)效、性能優(yōu)異、分析功能操作簡(jiǎn)潔和靈活、快速適應(yīng)業(yè)務(wù)變化的能力。
作者:劉宏剛吳丹單位:重慶市電力公司信息通信分公司重慶智網(wǎng)科技有限公司