數(shù)據(jù)挖掘在計(jì)算機(jī)取證中應(yīng)用與設(shè)計(jì)
時(shí)間:2022-10-18 09:16:57
導(dǎo)語:數(shù)據(jù)挖掘在計(jì)算機(jī)取證中應(yīng)用與設(shè)計(jì)一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:計(jì)算機(jī)和網(wǎng)絡(luò)犯罪犯罪手法新穎,而現(xiàn)代犯罪技術(shù)擁有高技術(shù)性、即時(shí)性、證據(jù)的易毀滅性及犯罪地點(diǎn)的去中心化等特點(diǎn),偵查人員通過傳統(tǒng)的設(shè)備和工具很難采集計(jì)算機(jī)犯罪證據(jù)。犯罪證據(jù)的獲取不僅需要嚴(yán)謹(jǐn)?shù)挠?jì)算機(jī)辨識(shí)技術(shù),更需要高效快速的推理分析系統(tǒng)。因此,以知識(shí)推理和本體理論作為研究理論技術(shù)基礎(chǔ),采用數(shù)據(jù)挖掘技術(shù)設(shè)計(jì)實(shí)現(xiàn)了一種計(jì)算機(jī)犯罪證據(jù)挖掘系統(tǒng),以輔助公安機(jī)關(guān)搜集計(jì)算機(jī)犯罪證據(jù)搜集,有效打擊計(jì)算機(jī)犯罪。
關(guān)鍵詞:計(jì)算機(jī)犯罪;證據(jù);數(shù)據(jù)挖掘;知識(shí)組織和推理
1計(jì)算機(jī)犯罪及其證據(jù)分類
計(jì)算機(jī)犯罪從以往的竊取實(shí)體的計(jì)算機(jī)轉(zhuǎn)變?yōu)橐跃W(wǎng)絡(luò)為犯罪標(biāo)的、犯罪場(chǎng)所和犯罪工具的犯罪行為。計(jì)算機(jī)犯罪可分為三大類型:第一種,計(jì)算機(jī)網(wǎng)絡(luò)作為“犯罪工具”的犯罪行為;第二種,以計(jì)算機(jī)網(wǎng)絡(luò)作為“犯罪客體”的犯罪行為;第三種,以計(jì)算機(jī)網(wǎng)絡(luò)作為“犯罪場(chǎng)所”的犯罪行為。
2數(shù)據(jù)挖掘技術(shù)之?dāng)?shù)據(jù)挖掘的流程
在人工智能領(lǐng)域,數(shù)據(jù)挖掘又稱為數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)。隨著人類對(duì)計(jì)算機(jī)的依賴程度越來越高,無論在決策的制定上,或是在資料的處理上,都需要借助數(shù)據(jù)挖掘來分析資料,找出其中有價(jià)值的信息,以供各種決策進(jìn)行參考。
3知識(shí)組織理論
3.1知識(shí)組織的概念
知識(shí)是人們?cè)诟脑炜陀^世界的實(shí)踐中積累起來的認(rèn)識(shí)和經(jīng)驗(yàn)。認(rèn)識(shí)包括對(duì)事物現(xiàn)象、本質(zhì)、屬性、狀態(tài)、關(guān)系、聯(lián)系和運(yùn)動(dòng)等的認(rèn)識(shí)。Feigenbaum認(rèn)為知識(shí)、信息和數(shù)據(jù)之間存在密切的邏輯關(guān)系。數(shù)據(jù)是事物、概念或指令的一種形式化的表示形式,適合于人工或自然方式進(jìn)行通信、解釋或處理。信息是根據(jù)表示數(shù)據(jù)所用的約定,賦予數(shù)據(jù)的意義。信息是數(shù)據(jù)所表達(dá)的客觀事實(shí)。數(shù)據(jù)是信息的載體,與具體的介質(zhì)和編碼方法有關(guān)。知識(shí)是經(jīng)過加工的信息。
3.2知識(shí)組織方法
知識(shí)組織即把人類知識(shí)形式化成為機(jī)器能處理的數(shù)據(jù)結(jié)構(gòu),是一組對(duì)知識(shí)的描述和約定。人工智能研究者們?cè)谠缙陔A段,重點(diǎn)研究具有因果關(guān)系的知識(shí),因此早期的專家系統(tǒng),都是基于產(chǎn)生式的知識(shí)庫系統(tǒng),例如DENDRAL、MYCIN及PROSPECTOR等分別把化學(xué)、醫(yī)藥和探礦等領(lǐng)域知識(shí)整理成一條條規(guī)則,放入知識(shí)庫中,然后經(jīng)過推理尋求答案。以產(chǎn)生式規(guī)則作為知識(shí)表示技術(shù)運(yùn)用以來,產(chǎn)生了框架、語義網(wǎng)絡(luò)等多種表示方法。知識(shí)的表示方法有產(chǎn)生式規(guī)則、謂詞邏輯、語義網(wǎng)絡(luò)及框架等。
3.3本體及其相關(guān)技術(shù)概述
主要用于描述解釋并預(yù)測(cè)知識(shí)的一些元特性。本體需要繼承或體現(xiàn)特定領(lǐng)域的某些觀點(diǎn),通常表現(xiàn)為一個(gè)概念集(例如,實(shí)體、屬性或過程)、概念的定義及概念的間的關(guān)系。本體可以定義通用領(lǐng)域的本體知識(shí),如時(shí)間、空間等,也可以定義特殊領(lǐng)域的本體知識(shí),如偏好、人群或種類。在計(jì)算機(jī)研究中,本體論的研究與知識(shí)工程領(lǐng)域在本質(zhì)上有著十分密切的聯(lián)系。特別是語義Web的應(yīng)用,語義Web要實(shí)現(xiàn)更多的自動(dòng)化服務(wù),離不開本體的形式化表示。
3.4計(jì)算機(jī)犯罪證據(jù)的特點(diǎn)及其挖掘和推理
3.4.1計(jì)算機(jī)證據(jù)的特點(diǎn)
網(wǎng)絡(luò)犯罪是近年來隨著因特網(wǎng)發(fā)展所興起的新興犯罪形式,最主要的特性是計(jì)算機(jī)系統(tǒng)與通信網(wǎng)絡(luò)結(jié)合所構(gòu)成的犯罪。一般而言,網(wǎng)絡(luò)犯罪具有下列特征:(1)智能型犯罪;(2)隱匿性;(3)犯罪證據(jù)難以采集;(4)犯罪區(qū)域廣泛、網(wǎng)絡(luò)無國(guó)界,衍生管轄權(quán)問題;(5)被害者不易察覺,具有高犯罪特征;(6)犯罪成本及障礙低。
3.4.2計(jì)算機(jī)證據(jù)的發(fā)現(xiàn)和推理
數(shù)據(jù)挖掘應(yīng)用于計(jì)算機(jī)犯罪證據(jù),就是將犯罪嫌疑人應(yīng)用過的計(jì)算機(jī)中的隱藏的文本、音視頻、網(wǎng)絡(luò)登錄和瀏覽及病毒和木馬程序信息挖掘出來,作為犯罪證據(jù)。數(shù)據(jù)挖掘的工具是利利用資料來建立一些仿真世界的模型,利用這些模型來描述資料中的形式及關(guān)系,且在數(shù)據(jù)挖掘中可以建立模型。
4計(jì)算機(jī)犯罪分析與本體構(gòu)建
4.1計(jì)算機(jī)犯罪模式
由于網(wǎng)絡(luò)犯罪尚屬新興犯罪型態(tài),各種入侵或攻擊手法隨著技術(shù)的進(jìn)步及網(wǎng)絡(luò)的散播而日新月異。因此,從計(jì)算機(jī)犯罪的動(dòng)機(jī)、標(biāo)的及目標(biāo)等三方面研究并分析計(jì)算機(jī)犯罪模式,通過計(jì)算機(jī)犯罪動(dòng)機(jī)的產(chǎn)生、標(biāo)的的選擇及目標(biāo)的決定,再輔以目前發(fā)生的計(jì)算機(jī)犯罪案例分析與傳統(tǒng)犯罪模式方析,結(jié)合計(jì)算機(jī)犯罪者可能出現(xiàn)的入侵或攻擊的手法及方式,由上而下依時(shí)序來架構(gòu)完整的計(jì)算機(jī)犯罪模式。
4.2計(jì)算機(jī)犯罪的動(dòng)機(jī)
計(jì)算機(jī)犯罪屬于犯罪形式的一種,與傳統(tǒng)犯罪的差異是實(shí)行犯罪的方法及所造成結(jié)果,傳統(tǒng)犯罪與計(jì)算機(jī)犯罪的動(dòng)機(jī)是相同的。在犯罪動(dòng)機(jī)所作的案例抽樣調(diào)查中將犯罪動(dòng)機(jī)可分為圖利、好玩和報(bào)復(fù)等動(dòng)機(jī)。
4.3計(jì)算機(jī)犯罪的標(biāo)的
一般而言,按照計(jì)算機(jī)在犯罪中所扮演的角色,可將計(jì)算機(jī)犯罪分為以下三類:第一,以計(jì)算機(jī)及鏈接在計(jì)算機(jī)上的計(jì)算機(jī)系統(tǒng)作為犯罪工具;第二,以計(jì)算機(jī)空間作為犯罪場(chǎng)所;第三,以計(jì)算機(jī)及鏈接在計(jì)算機(jī)上的計(jì)算機(jī)作為犯罪的攻擊目標(biāo)。
4.4計(jì)算機(jī)犯罪的目標(biāo)
計(jì)算機(jī)社會(huì)是現(xiàn)實(shí)社會(huì)的對(duì)映,同樣計(jì)算機(jī)犯罪者會(huì)針對(duì)犯罪目標(biāo)實(shí)施犯罪行為,將計(jì)算機(jī)犯罪者的目標(biāo)區(qū)分為組織形式與實(shí)體形式,詳述如下。組織形式:根據(jù)計(jì)算機(jī)域名注冊(cè)類別,并做少部分的修改,將組織形式分為政府、軍事、學(xué)術(shù)、商業(yè)、團(tuán)體機(jī)構(gòu)(包含計(jì)算機(jī)事業(yè)機(jī)構(gòu)及法人機(jī)構(gòu))及個(gè)人等,而不同的組織形式能提供的計(jì)算機(jī)犯罪的標(biāo)的亦不盡相同。實(shí)體形式:所謂實(shí)體形式系指計(jì)算機(jī)上的主機(jī)種類,一個(gè)組織形式會(huì)存在一種以上的主機(jī)種類。
4.5計(jì)算機(jī)犯罪手法及方式分類
計(jì)算機(jī)犯罪雖然手法及方式繁多,但與傳統(tǒng)犯罪一樣必然會(huì)留下蛛絲馬跡。由目前已發(fā)生的案例及相關(guān)研究探討(如腳印拓取方法)將網(wǎng)絡(luò)犯罪入侵、攻擊手法或方式整理歸類為病毒、木馬程序、計(jì)算機(jī)窺探、密碼破解、聯(lián)機(jī)劫持、網(wǎng)頁入侵、緩沖區(qū)溢出、系統(tǒng)安全漏洞、阻斷服務(wù)及其他等十種類型。
4.6計(jì)算機(jī)犯罪證據(jù)獲取模式
計(jì)算機(jī)犯罪入侵、攻擊手法及方式日新月異,而犯罪偵查卻仍以偵辦傳統(tǒng)犯罪形式為主。整合計(jì)算機(jī)犯罪模式、犯罪偵查程序及計(jì)算機(jī)犯罪案例,建立計(jì)算機(jī)犯罪偵查模式架構(gòu),拉近計(jì)算機(jī)犯罪與犯罪證據(jù)取證難的鴻溝,建立計(jì)算機(jī)犯罪偵查的縱向偵查鏈接,以解決目前計(jì)算機(jī)犯罪與犯罪偵查尚無法整合的窘境。
4.7構(gòu)建計(jì)算機(jī)犯罪證據(jù)本體
知識(shí)的表示方法很多,而框架式知識(shí)表示方法與規(guī)則式知識(shí)表示法,是專家系統(tǒng)中被實(shí)際應(yīng)用的兩種知識(shí)表示法??蚣鼙硎痉ㄊ抢梅诸惙ǖ脑瓌t,將知識(shí)進(jìn)行分門別類而形成的一種層次化的知識(shí)表示方法。以框架為表達(dá)的基本結(jié)構(gòu)體,在每一框架中,可分別代表一項(xiàng)目標(biāo)或事物的說明,讓使用者能簡(jiǎn)易的敘述某一專業(yè)化環(huán)境中的相關(guān)知識(shí)或事物,從而達(dá)到建立知識(shí)庫的目的。在框架表示法中,需要特別強(qiáng)調(diào)目標(biāo)-屬性-附值三者之間的關(guān)系。通常,有關(guān)某一應(yīng)用領(lǐng)域的知識(shí)層,可以看成是由主題及對(duì)此主題的說明兩部分組成。對(duì)主題的描述命名為一槽(SLOT),而由此又可衍生出另一個(gè)槽的發(fā)展,代表從某一主題引導(dǎo)出另一個(gè)次主題的產(chǎn)生。根據(jù)本體論方法和計(jì)算機(jī)犯罪案例,構(gòu)建涵蓋計(jì)算機(jī)犯罪動(dòng)機(jī)、犯罪標(biāo)的、犯罪目標(biāo)、犯罪方式、犯罪手法及犯罪類型的知識(shí)本體數(shù)據(jù)庫,建立計(jì)算機(jī)犯罪的“犯罪動(dòng)機(jī)”“犯罪標(biāo)的”“組織目標(biāo)”“實(shí)體目標(biāo)”“手法方式”及“犯罪類型”屬性連接和決策樹推理機(jī)制,以適應(yīng)K-means算法進(jìn)行計(jì)算機(jī)犯罪證據(jù)挖掘和推理。通過上述本體規(guī)則描述,采用OWL構(gòu)建一個(gè)計(jì)算機(jī)犯罪動(dòng)機(jī)、犯罪標(biāo)的、組織目標(biāo)、實(shí)體目標(biāo)、手法方式和犯罪類型的描述和交換元數(shù)據(jù)的框架,用交換元數(shù)據(jù)節(jié)點(diǎn)表示各種事物、概念、屬性及知識(shí)實(shí)體,用有向邊表示各種語義聯(lián)系,指明其所鏈接的節(jié)點(diǎn)間的某種關(guān)系。例如,因?yàn)椤皶r(shí)間”和“事件”存在著“動(dòng)機(jī)”的聯(lián)系,所以可以用RDF模型來表示“時(shí)間”和“事件”存在著“動(dòng)機(jī)”的語義聯(lián)系。
4.8計(jì)算機(jī)犯罪證據(jù)挖掘算法
計(jì)算機(jī)犯罪劃分為犯罪動(dòng)機(jī)、犯罪標(biāo)的、組織目標(biāo)、實(shí)體目標(biāo)、手法方式和犯罪類型形式多樣,采用傳統(tǒng)的數(shù)據(jù)挖掘算法在聚類的過程中孤立點(diǎn)的存在會(huì)造成聚類結(jié)果的不準(zhǔn)確,而初始聚類中心隨機(jī)性選擇會(huì)加大算法陷入局部最優(yōu)解的可能和使得迭代次數(shù)增多。因此,重點(diǎn)在于孤立點(diǎn)地檢測(cè)和初始聚類中心的確定兩個(gè)方面加以改進(jìn)。
5計(jì)算機(jī)犯罪證據(jù)挖掘系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
計(jì)算機(jī)網(wǎng)絡(luò)犯罪模式雖然手法和種類眾多,但仍有蛛絲馬跡可循。在證據(jù)偵查方面,亦如同傳統(tǒng)犯罪經(jīng)驗(yàn)需要經(jīng)驗(yàn)和知識(shí)傳承。因此,將網(wǎng)絡(luò)犯罪模式進(jìn)行分類整合,輔以目前實(shí)務(wù)案例和相關(guān)資源,采用現(xiàn)代人工智能技術(shù),開發(fā)一種計(jì)算機(jī)證據(jù)挖掘系統(tǒng),輔助司法與公安機(jī)關(guān)計(jì)算機(jī)犯罪取證工作。
6結(jié)語
知識(shí)組織根據(jù)知識(shí)本身的特點(diǎn)和知識(shí)間內(nèi)在的聯(lián)系來分析知識(shí)內(nèi)容,有利于語義推理,便于用戶更快的獲取、利用知識(shí)。本體作為一種知識(shí)表示方式,能通過一定的語義聯(lián)系與相關(guān)的知識(shí)組織進(jìn)行鏈接,實(shí)現(xiàn)知識(shí)的組織、查詢及用戶挖掘。目前,已經(jīng)有一些搜索引擎或挖掘系統(tǒng)利用查詢擴(kuò)展來幫助使用者進(jìn)行查詢,但對(duì)于特定專業(yè)領(lǐng)域的效益還是不夠。為解決此類問題,采用protégé、OWL及Jena工具,建立一種基于本體的計(jì)算機(jī)犯罪證據(jù)組織與挖掘系統(tǒng)。
參考文獻(xiàn)
[1]秦霞,丁欣.我國(guó)計(jì)算機(jī)犯罪的原因與防治[J].職工法律天地,2017(4):130-131.
[2]米佳,劉浩陽.計(jì)算機(jī)取證技術(shù)[M].北京:群眾出版社,2007.
作者:王周娟 黃文明 單位:桂林電子科技大學(xué)
熱門標(biāo)簽
數(shù)據(jù)分析論文 數(shù)據(jù)挖掘論文 數(shù)據(jù)管理論文 數(shù)據(jù)安全論文 數(shù)據(jù)庫論文 數(shù)據(jù)誤差 數(shù)據(jù)統(tǒng)計(jì) 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)采集 數(shù)據(jù)分析 心理培訓(xùn) 人文科學(xué)概論