數(shù)據(jù)挖掘技術(shù)提高民營(yíng)經(jīng)濟(jì)質(zhì)量研究

時(shí)間:2022-08-10 10:30:14

導(dǎo)語:數(shù)據(jù)挖掘技術(shù)提高民營(yíng)經(jīng)濟(jì)質(zhì)量研究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘技術(shù)提高民營(yíng)經(jīng)濟(jì)質(zhì)量研究

隨著大數(shù)據(jù)概念的出現(xiàn),數(shù)據(jù)的價(jià)值越來越受重視。數(shù)據(jù)挖掘就是從大量的數(shù)據(jù)中挖掘出有用的信息,所以數(shù)據(jù)自身的質(zhì)量對(duì)挖掘出來的信息有重要的決定作用。統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量是政府統(tǒng)計(jì)工作的生命線,關(guān)系著政府統(tǒng)計(jì)部門的形象和公信力。隨著經(jīng)濟(jì)的發(fā)展,政府經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)被使用的頻率越來越高,人們也越來越關(guān)注統(tǒng)計(jì)數(shù)據(jù)自身的質(zhì)量問題。然而,我國(guó)的一些官方統(tǒng)計(jì)數(shù)據(jù)常常受到諸多媒體和社會(huì)公眾的質(zhì)疑,認(rèn)為數(shù)據(jù)中水分太高,失真現(xiàn)象很嚴(yán)重。事實(shí)上,我國(guó)政府統(tǒng)計(jì)部門在提高我國(guó)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量方面已經(jīng)做了很多努力,由于其面對(duì)的統(tǒng)計(jì)對(duì)象廣泛且復(fù)雜,導(dǎo)致數(shù)據(jù)質(zhì)量提高的難度不斷增大。要提高政府統(tǒng)計(jì)數(shù)據(jù)質(zhì)量?jī)H僅依靠目前已有的方法和技術(shù)是不夠的,必須要引進(jìn)新的技術(shù)手段,所以本文嘗試將數(shù)據(jù)挖掘技術(shù)引入到提高民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量研究中,以期能夠改善政府統(tǒng)計(jì)數(shù)據(jù)不能滿足使用者需求的現(xiàn)狀。

一、民營(yíng)經(jīng)濟(jì)和統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的內(nèi)涵

(一)民營(yíng)經(jīng)濟(jì)的內(nèi)涵

關(guān)于民營(yíng)經(jīng)濟(jì)的定義,尚未形成一致的觀點(diǎn)。一種較為認(rèn)可的定義是,民營(yíng)經(jīng)濟(jì)是指除了國(guó)有及國(guó)有控股、集體經(jīng)濟(jì)、外商和港澳臺(tái)商獨(dú)資及其控股的經(jīng)濟(jì)組織,其主要成分是私營(yíng)企業(yè)、個(gè)體工商戶和農(nóng)民專業(yè)合作社。其中,私營(yíng)企業(yè)和個(gè)體工商戶在民營(yíng)經(jīng)濟(jì)中占據(jù)了絕大部分。在當(dāng)前有關(guān)民營(yíng)經(jīng)濟(jì)的統(tǒng)計(jì)資料和研究文獻(xiàn)中,基本上也是按照如上的構(gòu)成成分加以統(tǒng)計(jì)和分析研究的。

(二)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的內(nèi)涵

關(guān)于統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的涵義,不同統(tǒng)計(jì)機(jī)構(gòu)和學(xué)者對(duì)此有不同的定義。例如,加拿大統(tǒng)計(jì)局確定了衡量數(shù)據(jù)質(zhì)量的6個(gè)方面標(biāo)準(zhǔn):即實(shí)用性、準(zhǔn)確性、及時(shí)性、可取得性、銜接性、可解釋性;英國(guó)統(tǒng)計(jì)局提出的數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn)是準(zhǔn)確性、及時(shí)性、有效性和客觀性。廈門大學(xué)博導(dǎo)曾五一教授在他的研究中認(rèn)為,統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量并不限于通常人們理解的準(zhǔn)確性,它的完整內(nèi)涵應(yīng)當(dāng)包括:準(zhǔn)確性、適用性、時(shí)效性、可比性與可獲得性等五個(gè)方面的要求。本文就借用曾教授的觀點(diǎn),依照這五個(gè)標(biāo)準(zhǔn)來提高統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量。

二、民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的現(xiàn)狀

政府對(duì)外公布的民營(yíng)經(jīng)濟(jì)相關(guān)數(shù)據(jù)頗多,比如民營(yíng)經(jīng)濟(jì)增加值、民營(yíng)經(jīng)濟(jì)的營(yíng)業(yè)收入、民營(yíng)經(jīng)濟(jì)規(guī)模以上企業(yè)數(shù)、民營(yíng)經(jīng)濟(jì)對(duì)GDP的貢獻(xiàn)率等。民營(yíng)經(jīng)濟(jì)數(shù)據(jù)的質(zhì)量高低對(duì)以其為依據(jù)所做的有關(guān)決策和結(jié)論的科學(xué)性有重大影響,所以提高民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量具有重要意義。從總體上看,目前的統(tǒng)計(jì)數(shù)據(jù)可以反映我國(guó)經(jīng)濟(jì)發(fā)展的大體趨勢(shì)。由于民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)的對(duì)象復(fù)雜多變且分布廣泛,使得民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量還存在諸多問題,不能滿足使用者的需求。

(一)民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)失真的現(xiàn)象很嚴(yán)重

統(tǒng)計(jì)數(shù)據(jù)失真的現(xiàn)象早已被社會(huì)公眾所熟知,例如東北多個(gè)GDP造假縣域經(jīng)濟(jì)規(guī)模超香港,地方GDP“增速高于全國(guó)、總量大于全國(guó)”等。統(tǒng)計(jì)數(shù)據(jù)失真主要是由統(tǒng)計(jì)制度不夠完善造成的。通過對(duì)福建省某市統(tǒng)計(jì)局的走訪,了解到目前民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)沒有專門的部門負(fù)責(zé),而是將民營(yíng)經(jīng)濟(jì)中的不同行業(yè)分給不同的部門負(fù)責(zé)統(tǒng)計(jì),在統(tǒng)計(jì)人員中也分出了調(diào)查隊(duì)和統(tǒng)計(jì)組兩個(gè)隊(duì)伍,數(shù)據(jù)的收集主要是由各級(jí)政府層層上報(bào)。有的政府上報(bào)的數(shù)據(jù)完全是虛假數(shù)據(jù),這樣的統(tǒng)計(jì)制度難免會(huì)出現(xiàn)數(shù)據(jù)失真的現(xiàn)象。統(tǒng)計(jì)數(shù)據(jù)虛假是最常見的統(tǒng)計(jì)數(shù)據(jù)質(zhì)量問題,也是危害最為嚴(yán)重的統(tǒng)計(jì)數(shù)據(jù)質(zhì)量問題。這些統(tǒng)計(jì)數(shù)據(jù)完全是虛構(gòu)杜撰的,根本就沒有事實(shí)依據(jù)。

(二)民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)指標(biāo)不統(tǒng)一造成各地統(tǒng)計(jì)數(shù)據(jù)難以銜接

目前,從國(guó)家層面看,全國(guó)沒有統(tǒng)一的民營(yíng)經(jīng)濟(jì)定義,也沒有統(tǒng)一的民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)口徑和統(tǒng)計(jì)指標(biāo),也沒有明確一個(gè)部門牽頭負(fù)責(zé)民營(yíng)經(jīng)濟(jì)工作。各省對(duì)民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)工作沒有參照的標(biāo)準(zhǔn),只能自成一體。各級(jí)政府部門都是根據(jù)自身的統(tǒng)計(jì)需要來制定各自的統(tǒng)計(jì)指標(biāo)和統(tǒng)計(jì)口徑,這使得不同省份的民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)不具有可比性,相互間難以銜接。以山東省為例,工商聯(lián)、工商局、中小企業(yè)局三個(gè)部門都在抓民營(yíng)經(jīng)濟(jì),而市一級(jí)多數(shù)由中小企業(yè)主管部門負(fù)責(zé)。從統(tǒng)計(jì)口徑上看,省工商局所統(tǒng)計(jì)的民營(yíng)經(jīng)濟(jì)指標(biāo)實(shí)際上只是個(gè)體工商戶和私營(yíng)企業(yè),省中小企業(yè)局執(zhí)行的是以前鄉(xiāng)鎮(zhèn)企業(yè)的指標(biāo)體系,基本不用民營(yíng)經(jīng)濟(jì)這個(gè)概念,但到了市一級(jí),中小企業(yè)、民營(yíng)經(jīng)濟(jì)用的都是這個(gè)數(shù)據(jù),而概念和標(biāo)準(zhǔn)都十分清楚的中小企業(yè)從上到下都沒有專門的統(tǒng)計(jì)。概念界定不清、統(tǒng)計(jì)口徑不統(tǒng)一、統(tǒng)計(jì)體系不健全,給基層工作帶來很大不便。對(duì)此,山東省宏觀經(jīng)濟(jì)研究院經(jīng)濟(jì)研究所所長(zhǎng)高福一認(rèn)為,面對(duì)大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)體系不完備,會(huì)對(duì)政府的科學(xué)決策造成一定影響。

(三)民營(yíng)經(jīng)濟(jì)配合統(tǒng)計(jì)工作的積極性不高,申報(bào)的數(shù)據(jù)較隨意

民營(yíng)經(jīng)濟(jì)的統(tǒng)計(jì)工作,僅僅依靠統(tǒng)計(jì)部門及其他政府部門遠(yuǎn)遠(yuǎn)不夠,需要各民營(yíng)經(jīng)濟(jì)實(shí)體的積極配合。從當(dāng)前情況來看,由于缺乏相應(yīng)的法律約束,民營(yíng)經(jīng)濟(jì)實(shí)體在這種“純義務(wù)”的統(tǒng)計(jì)工作上,很少采取主動(dòng)配合的態(tài)度,對(duì)統(tǒng)計(jì)部門需要的統(tǒng)計(jì)資料也是敷衍了事,甚至有時(shí)要統(tǒng)計(jì)人員再三催促,才隨意地報(bào)上一組數(shù)據(jù)應(yīng)付。這種不準(zhǔn)確的數(shù)據(jù)嚴(yán)重影響統(tǒng)計(jì)報(bào)表的準(zhǔn)確性,不利于我國(guó)民營(yíng)經(jīng)濟(jì)的統(tǒng)計(jì)工作。同時(shí),民營(yíng)經(jīng)濟(jì)體對(duì)于涉及企業(yè)銷售總額與營(yíng)業(yè)利潤(rùn)等企業(yè)的敏感性數(shù)據(jù),抵觸心理嚴(yán)重,這主要是其“怕征稅、怕露富、怕泄密”的心理造成的,如此一來,在對(duì)待民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)工作的態(tài)度上,民營(yíng)經(jīng)濟(jì)體本身就不愿意參與,也不會(huì)主動(dòng)配合,大大降低了民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)工作的效率。由此可見,缺乏相應(yīng)的法律約束,使民營(yíng)經(jīng)濟(jì)提供的數(shù)據(jù)與報(bào)表資料隨意性很大,給我國(guó)民營(yíng)經(jīng)濟(jì)的統(tǒng)計(jì)工作帶來非常大的困擾,這也是我國(guó)民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量不高的重要原因。

三、數(shù)據(jù)挖掘技術(shù)在提高民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量中的應(yīng)用

數(shù)據(jù)挖掘的正式研究開始于1989年舉行的第十一屆國(guó)際聯(lián)合人工智能學(xué)術(shù)會(huì)議,從數(shù)據(jù)庫中發(fā)現(xiàn)知識(shí)(KDD)一詞首次在該會(huì)議中被提出。數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用的,在國(guó)外很多領(lǐng)域,如金融、生物、電信、保險(xiǎn)、交通、零售等領(lǐng)域,數(shù)據(jù)挖掘的應(yīng)用都起到了明顯的效果。世界上研究數(shù)據(jù)挖掘的組織、機(jī)構(gòu)和大學(xué)有很多,比如卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)和麻省理工學(xué)院等。與國(guó)外相比,國(guó)內(nèi)對(duì)數(shù)據(jù)挖掘的研究稍晚,沒有形成整體力量,直到1993年國(guó)家自然科學(xué)基金才首次支持該領(lǐng)域的研究項(xiàng)目,到上世紀(jì)90年代中后期,初步形成了知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘的基本框架。此后一批研究學(xué)術(shù)論文逐漸發(fā)表,但是基本上還是以學(xué)術(shù)研究為主,實(shí)際應(yīng)用上處于起步階段。在大數(shù)據(jù)時(shí)代,利用數(shù)據(jù)挖掘提升競(jìng)爭(zhēng)力已成為各行各業(yè)都在追逐和挑戰(zhàn)的目標(biāo),數(shù)據(jù)挖掘被認(rèn)為是大數(shù)據(jù)中最關(guān)鍵和最有價(jià)值的工作。目前有研究者提出將數(shù)據(jù)挖掘技術(shù)應(yīng)用于統(tǒng)計(jì)中,為相應(yīng)的部門提供服務(wù)。比如,將數(shù)據(jù)挖掘應(yīng)用在政府統(tǒng)計(jì)、人口普查、經(jīng)濟(jì)普查中。民營(yíng)經(jīng)濟(jì)作為我國(guó)的一大經(jīng)濟(jì)支柱,其中包含了大量復(fù)雜的信息,數(shù)據(jù)質(zhì)量高低不容忽視。因此,有必要對(duì)數(shù)據(jù)挖掘技術(shù)在民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量控制方面進(jìn)行研究。

(一)微觀層面

我國(guó)民營(yíng)經(jīng)濟(jì)包含的對(duì)象復(fù)雜多樣,各單位的規(guī)模大小不一,其分布又十分廣泛。面對(duì)如此龐大的群體,民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)工作的難度可想而知。我國(guó)沒有統(tǒng)一的民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì),都是各省各部門根據(jù)自身的需要進(jìn)行相關(guān)統(tǒng)計(jì)。據(jù)某統(tǒng)計(jì)局工作人員介紹,在收集民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)時(shí),按照企業(yè)規(guī)模的大小分為兩種渠道,規(guī)模以上的企業(yè)通過網(wǎng)絡(luò)直報(bào)提交數(shù)據(jù),規(guī)模以下的通過調(diào)查隊(duì)或者當(dāng)?shù)鼗鶎诱峤幌嚓P(guān)數(shù)據(jù)。在收集數(shù)據(jù)時(shí),根據(jù)行業(yè)不同又分工為不同科室負(fù)責(zé),比如有的科室負(fù)責(zé)鋼鐵行業(yè),有點(diǎn)科室負(fù)責(zé)文化產(chǎn)業(yè)行業(yè)等,這樣容易導(dǎo)致重復(fù)統(tǒng)計(jì)或者遺漏統(tǒng)計(jì)。目前我國(guó)對(duì)于民營(yíng)經(jīng)濟(jì)申報(bào)的統(tǒng)計(jì)數(shù)據(jù)沒有任何法律約束,導(dǎo)致上報(bào)的數(shù)據(jù)很隨意,常常與實(shí)際值偏離巨大。在初始環(huán)節(jié)嚴(yán)把數(shù)據(jù)的質(zhì)量,對(duì)后期的數(shù)據(jù)加工具有重要的意義。1.孤立點(diǎn)的識(shí)別。孤立點(diǎn)指的是在數(shù)據(jù)集合中與大多數(shù)數(shù)據(jù)的特征不一致的數(shù)據(jù)。孤立點(diǎn)挖掘可以描述為,給定一個(gè)n個(gè)數(shù)據(jù)點(diǎn)或?qū)ο蟮募希约邦A(yù)期的孤立點(diǎn)的數(shù)目k,發(fā)現(xiàn)與剩余的數(shù)據(jù)相比是顯著不一致的頭k個(gè)對(duì)象就是孤立點(diǎn)。目前挖掘孤立點(diǎn)的算法主要包括七類:基于統(tǒng)計(jì)的方法、基于距離的方法、基于密度的方法、基于偏離的方法、基于聚類的方法、基于粗糙集的方法和基于人工神經(jīng)網(wǎng)絡(luò)的方法。在民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)采集過程中,由于采集的對(duì)象龐大,政府統(tǒng)計(jì)工作人員無法做到對(duì)每次收集的數(shù)據(jù)一一核實(shí),只能對(duì)采集的數(shù)據(jù)進(jìn)行一次篩選,將其中可能存在顯著差異的數(shù)據(jù)找出來,然后對(duì)這些數(shù)據(jù)進(jìn)行核實(shí),剔除一些無效的數(shù)據(jù),以保證原始數(shù)據(jù)的真實(shí)性。對(duì)于民營(yíng)經(jīng)濟(jì)各個(gè)單位上報(bào)的統(tǒng)計(jì)數(shù)據(jù),無論是故意的還是無意的都會(huì)出現(xiàn)一些孤立點(diǎn),這些孤立點(diǎn)的存在無疑會(huì)影響數(shù)據(jù)的質(zhì)量。我們可以通過基于聚類的方法來找到這些孤立點(diǎn),首先將民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)集利用已經(jīng)成熟的模型進(jìn)行聚類分析,使數(shù)據(jù)集形成簇,而那些不在簇中的數(shù)據(jù)即被視為異常點(diǎn),然后對(duì)這些異常點(diǎn)進(jìn)行一一核實(shí),這樣工作量就大大縮小了。2.缺失數(shù)據(jù)的替代。缺失數(shù)據(jù)是指數(shù)據(jù)集中某些記錄的屬性值丟失或空缺,一般缺失的屬性值代表了缺失的信息。民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)指標(biāo)體系涵蓋的內(nèi)容廣泛,而民營(yíng)企業(yè)大部分規(guī)模較小,數(shù)據(jù)記錄的制度不健全,面對(duì)政府部門收集數(shù)據(jù)的任務(wù),有時(shí)是提交空白數(shù)據(jù),有時(shí)是隨便填報(bào)個(gè)數(shù)據(jù)敷衍了事。統(tǒng)計(jì)部門收集到的空白數(shù)據(jù),最簡(jiǎn)單的辦法是直接去掉,這樣勢(shì)必會(huì)影響到最終統(tǒng)計(jì)結(jié)果的真實(shí)性。為了提高數(shù)據(jù)的質(zhì)量,必須要對(duì)這些缺失值找到一個(gè)合理的替代值。缺失數(shù)據(jù)的替代方法有單值替代、類均值替代和回歸替代,這些方法都可以解決缺失數(shù)據(jù)的替代問題。單值替代是使用一個(gè)常量代替所有的缺失值,常量的選擇由應(yīng)用的目的而定,可選擇平均值、最大值、最小值等統(tǒng)計(jì)指標(biāo)。類均值替代是用缺失數(shù)據(jù)記錄所在類別的屬性平均值代替缺失數(shù)據(jù)。回歸替代是應(yīng)用回歸分析技術(shù),對(duì)包含有缺失屬性值的屬性和相關(guān)的其他屬性建立預(yù)測(cè)模型,并用相應(yīng)的預(yù)測(cè)值代替缺失屬性值。3.虛假數(shù)據(jù)的修正。在民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)中,會(huì)收集很多不可避免的虛假數(shù)據(jù)。造成統(tǒng)計(jì)數(shù)據(jù)虛假的因素多種多樣,如一些經(jīng)濟(jì)主體受經(jīng)濟(jì)利益驅(qū)使,捏造虛假數(shù)據(jù),在財(cái)務(wù)報(bào)表上大做文章。比如,一些效益好的企業(yè)為了偷稅漏稅故意少報(bào)利潤(rùn)和銷售收入,而一些效益不好的企業(yè)少報(bào)虧損或者高賬面盈利,以騙取銀行貸款并樹立企業(yè)形象。還有一些企業(yè)長(zhǎng)期搞多本賬,報(bào)給財(cái)稅部門的是“苦賬”,報(bào)給銀行獲得貸款的是“喜賬”,報(bào)給上級(jí)主管部門的是應(yīng)付賬,留給自己的才是真實(shí)賬。虛假數(shù)據(jù)俗稱為含水分的數(shù)據(jù),如果這些數(shù)據(jù)水分不大,可以不去理會(huì),因?yàn)榻y(tǒng)計(jì)數(shù)據(jù)是反映一個(gè)大體概況和趨勢(shì)的,不需要毫厘不差。如果這些數(shù)據(jù)水分較大,匯總在一起的高水分的數(shù)據(jù)容易放大或者縮小實(shí)際經(jīng)濟(jì)狀況,這時(shí)就必須在初始數(shù)據(jù)采集時(shí)嚴(yán)控?cái)?shù)據(jù)中的水分。這些數(shù)據(jù)一般不會(huì)像孤立點(diǎn)那樣容易被發(fā)現(xiàn),具有一定的隱蔽性,必須要借助于數(shù)據(jù)挖掘方法才能識(shí)別其中的水分,比如數(shù)據(jù)挖掘中的聚類分析。聚類分析是將一個(gè)數(shù)據(jù)集劃分為若干聚類,并使得同一個(gè)聚類內(nèi)的數(shù)據(jù)對(duì)象具有較高的相似度,而不同聚類中的數(shù)據(jù)對(duì)象的相似度盡可能低。在民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)庫中將具有相似屬性的企業(yè)歸為同一個(gè)聚類,對(duì)于同一個(gè)聚類中某個(gè)企業(yè)的某項(xiàng)屬性明顯存在巨大差異,則可以判斷此屬性數(shù)據(jù)可能存在嚴(yán)重虛假,然后再進(jìn)一步調(diào)查核實(shí)和修正。

(二)宏觀層面

大部分地方統(tǒng)計(jì)部門在處理和分析統(tǒng)計(jì)數(shù)據(jù)時(shí)還處于手工操作或半手工操作,計(jì)算機(jī)的使用僅限于做一些簡(jiǎn)單的匯總和指標(biāo)計(jì)算,統(tǒng)計(jì)分析也主要是事后分析,沒能利用發(fā)達(dá)的計(jì)算機(jī)技術(shù)通過信息共享等方式進(jìn)行事前分析和預(yù)測(cè)。1.關(guān)聯(lián)規(guī)則的應(yīng)用。關(guān)聯(lián)規(guī)則是近幾年研究較多的數(shù)據(jù)挖掘方法,具有高度的靈活性和重要性,應(yīng)用也是最為廣泛的。關(guān)聯(lián)規(guī)則挖掘的主要對(duì)象是事務(wù)數(shù)據(jù)庫,在事務(wù)數(shù)據(jù)庫中,事務(wù)1中出現(xiàn)了屬性項(xiàng)甲,事務(wù)2中出現(xiàn)了屬性項(xiàng)乙,事務(wù)3中則同時(shí)出現(xiàn)屬性甲和乙。那么屬性甲和乙在事務(wù)中的出現(xiàn)互相之間是否有規(guī)律可循就是關(guān)聯(lián)規(guī)則要挖掘的隱含信息,以查找容易被忽略或與人們熟知相背離的事件。經(jīng)濟(jì)統(tǒng)計(jì)中運(yùn)用關(guān)聯(lián)規(guī)則能夠挖掘出匯總數(shù)據(jù)中聯(lián)系密切的行業(yè),這些關(guān)系密切的行業(yè)有已知的,也有未知的。尤其在民營(yíng)經(jīng)濟(jì)的統(tǒng)計(jì)數(shù)據(jù)中,有些內(nèi)部信息匯報(bào)人不愿如實(shí)填寫數(shù)據(jù),導(dǎo)致匯總后的數(shù)據(jù)與實(shí)際數(shù)據(jù)相差甚遠(yuǎn),此時(shí)可以通過已經(jīng)建立的規(guī)則關(guān)系來識(shí)別和修正一些水分較大的數(shù)據(jù)。在實(shí)際運(yùn)用當(dāng)中,很多屬性之間所存在的關(guān)系為人們所知曉,被稱為平凡規(guī)則,如提升工業(yè)總產(chǎn)值能夠帶來生產(chǎn)總值的增加。通過平凡規(guī)則,我們能夠?qū)?shù)據(jù)質(zhì)量的高低進(jìn)行判斷,以此達(dá)到消除虛假數(shù)據(jù)的目的。2.決策樹的應(yīng)用。決策樹是一種用于分類、聚類和預(yù)測(cè)的建模方法,在民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)中可以用決策樹進(jìn)行分類和預(yù)測(cè)分析。我國(guó)民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)沒有統(tǒng)一的口徑,很多數(shù)據(jù)是通過統(tǒng)計(jì)人員根據(jù)收集部分?jǐn)?shù)據(jù)推斷出來的,所以需要一種有效可行的預(yù)測(cè)方法。決策樹算法十分直觀,這一過程的關(guān)鍵是有效構(gòu)建決策樹,主要分為建樹和剪枝階段。通過決策樹對(duì)數(shù)據(jù)分類主要由兩個(gè)步驟組成:其一,決策樹模型的構(gòu)建,即通過訓(xùn)練集實(shí)現(xiàn)一顆決策樹的構(gòu)建及精化;其二,將輸入的數(shù)據(jù)通過決策樹進(jìn)行分類處理。當(dāng)將數(shù)據(jù)輸入決策樹時(shí),會(huì)由根節(jié)點(diǎn)對(duì)屬性值依次進(jìn)行測(cè)試并記錄,然后到達(dá)葉子節(jié)點(diǎn),來實(shí)現(xiàn)尋找記錄所在類。從整體來看,決策樹算法屬于遞歸過程,一直進(jìn)行到滿足終止條件為止。分割停止要滿足兩個(gè)條件:其一為某一個(gè)節(jié)點(diǎn)上數(shù)據(jù)都同屬一類;其二是能夠進(jìn)行數(shù)據(jù)分割的點(diǎn)已經(jīng)耗盡。這一過程主要用于解決數(shù)據(jù)挖掘的預(yù)測(cè)及分類方面問題。

四、提高民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的對(duì)策

民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)是一項(xiàng)綜合的統(tǒng)計(jì)工作,涵蓋了民營(yíng)經(jīng)濟(jì)的各行各業(yè),必須著眼于整個(gè)統(tǒng)計(jì)工作,從政府和企業(yè)相結(jié)合的角度建立一套行之有效的機(jī)制,來切實(shí)規(guī)范企業(yè)的行為,夯實(shí)企業(yè)的統(tǒng)計(jì)基礎(chǔ),并調(diào)整部門間的信息共享。

(一)政府應(yīng)做的工作

1.加大統(tǒng)計(jì)執(zhí)法檢查力度,做好統(tǒng)計(jì)基礎(chǔ)工作。對(duì)民營(yíng)企業(yè)中存在的虛報(bào)、瞞報(bào)、拒報(bào)等統(tǒng)計(jì)違法行為,要鼓勵(lì)執(zhí)法人員勇于執(zhí)法、善于執(zhí)法,在保護(hù)民營(yíng)企業(yè)遵紀(jì)守法正常發(fā)展的同時(shí)加大對(duì)一些典型的統(tǒng)計(jì)違法案件的曝光力度,以案說法,擴(kuò)大教育面,促進(jìn)這些企業(yè)的統(tǒng)計(jì)工作正常開展。同時(shí),各級(jí)統(tǒng)計(jì)部門要重視對(duì)民營(yíng)企業(yè)特別是新建的民營(yíng)企業(yè)統(tǒng)計(jì)基礎(chǔ)工作的指導(dǎo)工作,要組織力量搞好培訓(xùn)工作,督促企業(yè)依法建立健全原始記錄和統(tǒng)計(jì)臺(tái)賬,夯實(shí)基礎(chǔ)工作,嚴(yán)把統(tǒng)計(jì)數(shù)字質(zhì)量關(guān),要優(yōu)選專兼職統(tǒng)計(jì)工作人員,切實(shí)做到業(yè)務(wù)精、責(zé)任心強(qiáng),保證統(tǒng)計(jì)數(shù)字上報(bào)的及時(shí)性和準(zhǔn)確性。2.將數(shù)據(jù)挖掘技術(shù)嵌入到網(wǎng)上直報(bào)系統(tǒng),增強(qiáng)統(tǒng)計(jì)數(shù)據(jù)的自動(dòng)化處理能力。在信息技術(shù)飛速發(fā)展的今天,先進(jìn)的信息技術(shù)已經(jīng)成為進(jìn)行統(tǒng)計(jì)工作必不可少的工具,利用數(shù)據(jù)挖掘技術(shù)輔助網(wǎng)上直報(bào)系統(tǒng),從而使得原始數(shù)據(jù)采集、儲(chǔ)存加工以及信息傳遞實(shí)現(xiàn)了現(xiàn)代化,這不僅提高了統(tǒng)計(jì)數(shù)據(jù)傳遞的及時(shí)性,而且也提高了統(tǒng)計(jì)數(shù)據(jù)的準(zhǔn)確性。同時(shí)伴隨著信息技術(shù)的發(fā)展,調(diào)查技術(shù)也在不斷地改善,一些新的調(diào)查方法將會(huì)逐步代替舊的調(diào)查方法,例如計(jì)算機(jī)輔助調(diào)查、計(jì)算機(jī)輸入數(shù)據(jù)搜集系統(tǒng)等等。與此同時(shí),還要不斷推進(jìn)統(tǒng)計(jì)信息自動(dòng)化建設(shè),提高各級(jí)統(tǒng)計(jì)部門的配機(jī)率和數(shù)據(jù)信息的處理能力,集中力量做好統(tǒng)計(jì)數(shù)據(jù)處理的軟件開發(fā)和綜合數(shù)據(jù)庫建設(shè),進(jìn)而提高統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量。

(二)民營(yíng)企業(yè)應(yīng)做的工作

1.民營(yíng)企業(yè)的領(lǐng)導(dǎo)層要重視配合政府統(tǒng)計(jì)部門的工作。要搞好統(tǒng)計(jì)工作必須得到企業(yè)領(lǐng)導(dǎo)的支持和其他職能部門的通力配合。統(tǒng)計(jì)工作涉及企業(yè)的供產(chǎn)銷和人財(cái)物各個(gè)方面,對(duì)一個(gè)企業(yè)的生產(chǎn)經(jīng)營(yíng)活動(dòng)起到監(jiān)督、檢查和指導(dǎo)作用,因此沒有領(lǐng)導(dǎo)的重視和支持,沒有企業(yè)中各個(gè)部門的積極配合,就無法保障統(tǒng)計(jì)數(shù)據(jù)的準(zhǔn)確,資料來源渠道的暢通。2.民營(yíng)企業(yè)自身要加強(qiáng)規(guī)范化統(tǒng)計(jì)基礎(chǔ)工作。企業(yè)必須要有健全的原始記錄、統(tǒng)計(jì)臺(tái)賬及財(cái)務(wù)報(bào)表,且能同時(shí)滿足相關(guān)部門的需要,財(cái)務(wù)報(bào)表能滿足統(tǒng)計(jì)需要的不再布置統(tǒng)計(jì)報(bào)表,并且根據(jù)會(huì)計(jì)決算的實(shí)際期效,統(tǒng)一上報(bào)時(shí)間。以減輕企業(yè)的勞動(dòng)負(fù)擔(dān),增強(qiáng)企業(yè)積極配合統(tǒng)計(jì)的意愿,這樣也避免了在財(cái)務(wù)決算之前“瞎估亂報(bào)”的現(xiàn)象。根據(jù)企業(yè)的實(shí)際情況,可以將會(huì)計(jì)、統(tǒng)計(jì)合并為一個(gè)綜合部門,共同承擔(dān)會(huì)計(jì)、統(tǒng)計(jì)任務(wù),解決基層企業(yè)力量配置及勞務(wù)成本的問題。但無論人員如何配置,必須保證提供準(zhǔn)確可靠的原始數(shù)據(jù),做到不遲報(bào)、不漏報(bào),確保源頭數(shù)據(jù)的真實(shí)性,以提高民營(yíng)經(jīng)濟(jì)統(tǒng)計(jì)的數(shù)據(jù)質(zhì)量。

作者:柯芳 單位:福建師范大學(xué)協(xié)和學(xué)院

參考文獻(xiàn)

[1]曾五一.國(guó)家統(tǒng)計(jì)數(shù)據(jù)質(zhì)量研究的基本問題[J].商業(yè)經(jīng)濟(jì)與管理,2010,(12).

[2]高敏雪.從外部監(jiān)督入手解決統(tǒng)計(jì)數(shù)據(jù)質(zhì)量問題的努力[J].統(tǒng)計(jì)研究,2009,(8).

[3]羅建梅.提高中國(guó)政府統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的幾點(diǎn)思考[J].經(jīng)濟(jì)研究導(dǎo)刊,2009,(19).

[4]金勇進(jìn),陶然.中國(guó)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量理論研究與實(shí)踐歷程[J].統(tǒng)計(jì)研究,2010,(1).