數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)
時間:2022-10-08 05:53:16
導(dǎo)語:數(shù)據(jù)挖掘技術(shù)深化數(shù)據(jù)采集應(yīng)用系統(tǒng)一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:大數(shù)據(jù)使現(xiàn)代化信息技術(shù)實現(xiàn)了高速發(fā)展,利用現(xiàn)代化信息技術(shù)建立狀態(tài)數(shù)據(jù)采集系統(tǒng)進行院校評估,是院校管理的發(fā)展方向。數(shù)據(jù)采集系統(tǒng)不應(yīng)只注重平臺服務(wù)而忽視了功能的挖掘與發(fā)揮。數(shù)據(jù)挖掘技術(shù)對高職狀態(tài)數(shù)據(jù)采集的應(yīng)用系統(tǒng)建設(shè)方法應(yīng)注重關(guān)聯(lián)規(guī)則方法和聚類分析方法的構(gòu)建與使用。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);狀態(tài)數(shù)據(jù);數(shù)據(jù)采集;應(yīng)用系統(tǒng)
數(shù)據(jù)采集應(yīng)用系統(tǒng)又被稱之為高職院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng),該數(shù)據(jù)采集應(yīng)用系統(tǒng)在2008年得到教育部門批準(zhǔn)并公布實施,這使數(shù)據(jù)采集應(yīng)用系統(tǒng)成為高職院校進行方案評估的重要組成部分,并越來越受到各個高職院校的關(guān)注與重視。不過,由于數(shù)據(jù)采集應(yīng)用系統(tǒng)出現(xiàn)的時間較短,各個高職院校還沒有真正認(rèn)識到數(shù)據(jù)采集應(yīng)用系統(tǒng)的作用,對數(shù)據(jù)采集應(yīng)用系統(tǒng)的框架體系與邏輯關(guān)系的理解仍舊需要一段時間,對應(yīng)用系統(tǒng)中相關(guān)聯(lián)的數(shù)據(jù)進行聚合,使其成為一種能夠幫助學(xué)院進行教學(xué)決策與管理的價值信息,更需要探索一種新的數(shù)據(jù)分析方法,再加上高職院校只注重系統(tǒng)的服務(wù)評估功能而忽視了其他功能的挖掘與應(yīng)用,這就造成許多高職院校只是在填報時才會用到該系統(tǒng),而在填報過后便成為了擺設(shè),這使數(shù)據(jù)采集應(yīng)用系統(tǒng)的作用未得到真正發(fā)揮,利用率較低。為此,針對以上問題,通過數(shù)據(jù)挖掘技術(shù)對高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)進行深化分析。
1數(shù)據(jù)挖掘技術(shù)
大數(shù)據(jù)具有增長速度快、海量、多樣、真實、價值密度低五大特點,從數(shù)據(jù)本身進行分析,所謂數(shù)據(jù)挖掘技術(shù)便是通過算法搜索,從海量的大數(shù)據(jù)中對價值密度低的價值數(shù)據(jù)進行挖掘與收集的過程。數(shù)據(jù)挖掘技術(shù)和計算機科學(xué)有著緊密的聯(lián)系,通過數(shù)據(jù)的統(tǒng)計、處理、機器學(xué)習(xí)、模式識別、情報檢索等諸多手段來達(dá)成價值數(shù)據(jù)挖掘目的。這些手段能使企業(yè)決策者根據(jù)價值數(shù)據(jù)來對策略進行調(diào)整,以此降低風(fēng)險,并做出正確決策。數(shù)據(jù)挖掘由三個階段構(gòu)成:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果表達(dá)。
2數(shù)據(jù)挖掘技術(shù)在高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的深化基礎(chǔ)
高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)屬于一種數(shù)據(jù)倉庫,該系統(tǒng)每進行一次數(shù)據(jù)采集便會采集到超過50萬條的數(shù)據(jù),通過將狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)與互聯(lián)網(wǎng)技術(shù)進行結(jié)合,還能使數(shù)據(jù)采集應(yīng)用系統(tǒng)一次性采集到的數(shù)據(jù)量更多。以知識管理理論對數(shù)據(jù)進行分析,數(shù)據(jù)自身是不會提供太多價值信息的,因此,需要將這些采集到的數(shù)據(jù)進行轉(zhuǎn)化,使其成為有效信息,并利用科學(xué)的數(shù)據(jù)分析方法,通過關(guān)聯(lián)、聚類、聚合等方法來對這些海量的數(shù)據(jù)進行分析?,F(xiàn)如今,數(shù)據(jù)分析在各行各業(yè)中發(fā)揮越來越重要的作用,數(shù)據(jù)挖掘技術(shù)的相關(guān)理論與方法也使數(shù)據(jù)采集應(yīng)用系統(tǒng)具備極高的應(yīng)用價值與意義??梢哉f,數(shù)據(jù)挖掘技術(shù)作為一種新型信息處理技術(shù),能對大量數(shù)據(jù)中人們所不知道而又潛在的有用信候進行提取,屬于一種更深層次化的數(shù)據(jù)分析方式,其與傳統(tǒng)分析方法的最大不同是傳統(tǒng)分析方法具備非常明顯的指向性特征,而其目的是通過結(jié)果來對預(yù)設(shè)命題的正確性進行驗證,或是通過對預(yù)設(shè)模型的機理進行量化分析。而數(shù)據(jù)挖掘技術(shù)則是在沒有任何比較明確的假設(shè)情況下對信息進行挖掘,找出信息的關(guān)聯(lián)性,并獲得那些難以通過直覺,甚至?xí)`背直覺的相關(guān)信息,這樣挖掘出的信息極有可能出人意料而又富有價值,可以說,數(shù)據(jù)挖掘技術(shù)是傳統(tǒng)分析方法不斷變革后的結(jié)晶。
事實上,經(jīng)過教育界諸多專家對數(shù)據(jù)采集應(yīng)用系統(tǒng)的不斷完善,在數(shù)據(jù)采集應(yīng)用系統(tǒng)頒布應(yīng)用的三年里,系統(tǒng)結(jié)構(gòu)與信息的采集量都發(fā)生了極大改變,以版本來說,最初的數(shù)據(jù)采集應(yīng)用系統(tǒng)是08c版的,之后經(jīng)過不斷的改進已經(jīng)成為現(xiàn)今的10a001版,原有采集字段僅為594字段,現(xiàn)如今已經(jīng)增長到了750個字段,采集字段的大幅增加,也使數(shù)據(jù)采集應(yīng)用系統(tǒng)的信息容量得到了大幅度擴充,其數(shù)據(jù)倉庫特征也越來越明顯,尤為重要的是數(shù)據(jù)間的關(guān)聯(lián)度不斷增加,使其成為數(shù)據(jù)挖掘技術(shù)的深化基礎(chǔ),從客觀上來說,通過數(shù)據(jù)挖掘技術(shù)的應(yīng)用來進行數(shù)據(jù)分析,能為數(shù)據(jù)采集應(yīng)用系統(tǒng)創(chuàng)造更加有利便捷的條件。
3數(shù)據(jù)挖掘技術(shù)深化高職狀態(tài)數(shù)據(jù)采集的應(yīng)用系統(tǒng)分析
數(shù)據(jù)挖掘技術(shù)在高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的應(yīng)用方法主要有關(guān)聯(lián)、分類、聚類、估計、細(xì)分或預(yù)測等,數(shù)據(jù)挖掘技術(shù)的自身理論與思維方式給數(shù)據(jù)采集應(yīng)用系統(tǒng)帶來了廣闊的發(fā)展空間。在這些應(yīng)用方法中,以聚類分析方法和關(guān)聯(lián)規(guī)則分析方法最為易于理解和實施,以下便對這種主要方法在高職狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的深化應(yīng)用進行探討。
3.1關(guān)聯(lián)規(guī)則分析
在關(guān)聯(lián)規(guī)則方法中,數(shù)據(jù)是以孤立、單獨的形式分散存在的,這也使單獨的數(shù)據(jù)不能形成信息,不過將這些單獨、分散而又相互關(guān)聯(lián)的信息數(shù)據(jù)收集起來,則能多角度、全方位地對某一對象進行高效的價值辨別。而對于剛開始接觸數(shù)據(jù)采集應(yīng)用系統(tǒng)的用戶來說,在數(shù)據(jù)采集應(yīng)用系統(tǒng)使用過程中,應(yīng)以海量信息數(shù)據(jù)作為依據(jù)來對高職院校在人才培養(yǎng)過程中的各個方面進行判斷與價值辨別,這就造成系統(tǒng)用戶往往感覺無從下手,只會對各個表格中的數(shù)據(jù)進行割裂而孤立地分析,更加難以找出數(shù)據(jù)之間的關(guān)聯(lián)性與內(nèi)在規(guī)律,同樣難以對這些相互關(guān)聯(lián)的數(shù)據(jù)進行聚合,這使高職院校難以將人才培養(yǎng)工作過程中的關(guān)鍵要素進行全面呈現(xiàn),以此幫助管理人員進行工作決策。而通過關(guān)聯(lián)規(guī)則挖掘方法的應(yīng)用,則由數(shù)據(jù)采集應(yīng)用系統(tǒng)提供數(shù)據(jù),并對人才培養(yǎng)工作的所有關(guān)鍵要素進行分析,通過挖掘與之相關(guān)的所有數(shù)據(jù),能更加清晰地呈現(xiàn)數(shù)據(jù)與指標(biāo)間的相關(guān)關(guān)系及關(guān)聯(lián)規(guī)則。例如,在對高職院校的“兼職教師隊伍”建設(shè)現(xiàn)狀進行分析時,利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析方法,能將兼職教師的人數(shù)和整個高職院校的教師總數(shù)量進行對比,能清楚地知道兼職教師在整個高職院校的教師隊伍中占據(jù)的比例,再將兼職教師數(shù)量和高職院校所設(shè)置的專業(yè)數(shù)量進行對比,還可清楚地知道各個專業(yè)所安排的平均兼職教師數(shù)量等等。這些與之對比的數(shù)據(jù)均分散在整個系統(tǒng)中,但它們都和兼職教師隊伍有著很強的內(nèi)在關(guān)聯(lián),通過對這些與之關(guān)聯(lián)的數(shù)據(jù)進行采集,能非常直觀地對某個方面的具體工作情況進行真實反映。通過將這些數(shù)據(jù)進行聚合,還能非常直觀地反映高職院校對專業(yè)教師隊伍建設(shè)的重視程度及總體規(guī)則,并將其與預(yù)期的高職院校教師隊伍規(guī)劃進行比較,能清楚地知道當(dāng)前教師隊伍建設(shè)能否滿足學(xué)校師資建設(shè)的發(fā)展需要,具體的實施情況如何等問題。
3.2聚類分析
在聚類分析中,對于不同的數(shù)據(jù),通過關(guān)聯(lián)規(guī)則分析,能獲得大量的價值信息。而對于同一類的數(shù)據(jù),則將這些數(shù)據(jù)利用聚類分析思路進行相應(yīng)整合,這樣能使信息的呈現(xiàn)更加豐富,并能對某項工作的進程及各個部門間的差異進行真實可靠的反映。例如,在對高職院校的師生比情況進行分析時,利用聚類分析將歷年的院校招生情況及教師人數(shù)情況進行對比,能非常直觀地對院校在歷年中的師生比情況進行衡量,當(dāng)發(fā)現(xiàn)每一年的學(xué)生數(shù)量都有所增長,而教師數(shù)量增長不大時,則可以通過師生比來衡量院校的教師增長數(shù)量難以滿足學(xué)院的教學(xué)要求,應(yīng)加強師資隊伍建設(shè)。
3.3聚合分析
對于不同系數(shù)中的同類數(shù)據(jù)來說,可以通過聚合分析的方法來對系部間的差距進行直觀衡量與觀察,僅僅對同一系部中的數(shù)據(jù)進行分析,是難以獲得較多有價值信息的,而通過聚合分析方法將不同系部中的同類數(shù)據(jù)進行聚合,則能使數(shù)據(jù)信息變得更加豐富,進而可以非常直觀地了解到不同系部在相同工作之間的差距,從而使院校管理人員能根據(jù)這種差距來對工作差距較大的系部進行加強。
4結(jié)語
綜上所述,數(shù)據(jù)挖掘技術(shù)在高職院校狀態(tài)數(shù)據(jù)采集應(yīng)用系統(tǒng)中的應(yīng)用案例比比皆是,這也證明了數(shù)據(jù)挖掘技術(shù)能使院校狀態(tài)數(shù)據(jù)采集系統(tǒng)的作用得到更進一步的發(fā)揮,使數(shù)據(jù)采集應(yīng)用系統(tǒng)能對各類數(shù)據(jù)進行有效挖掘與轉(zhuǎn)化,并將其應(yīng)用到高職院校的管理與教學(xué)工作中,提高了高職院校的管理服務(wù)水平,為高職院校管理人員提供大量的有效信息??梢哉f,數(shù)據(jù)挖掘技術(shù)在很大程度上促進了高職院校狀態(tài)數(shù)據(jù)采集系統(tǒng)的深化應(yīng)用。
參考文獻:
[1]張曉蕾.基于Android平臺的人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集管理系統(tǒng)的設(shè)計與實現(xiàn)[D].成都:電子科技大學(xué)碩士論文,2014.
[2]蘇世文,王國慶.高職院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集平臺的柔性UML模型設(shè)計[J].江蘇經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院學(xué)報,2013(2).
[3]伍丹.高職院校信息化管理系統(tǒng)建設(shè)與應(yīng)用的思考——以網(wǎng)絡(luò)版《高等職業(yè)院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集平臺》為例[J].中國信息技術(shù)教育,2010(2).
作者:畢誠 單位:安徽國際商務(wù)職業(yè)學(xué)院