神經(jīng)網(wǎng)絡(luò)的基本概念范文
時(shí)間:2024-04-01 18:17:41
導(dǎo)語(yǔ):如何才能寫(xiě)好一篇神經(jīng)網(wǎng)絡(luò)的基本概念,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞: Hopfield神經(jīng)網(wǎng)絡(luò); 二值矩陣; OSTU算法;識(shí)別率
中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)21-4925-04
1 原理概述
1.1 Hopfield網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
Hopfield最早提出的網(wǎng)絡(luò)是二值神經(jīng)網(wǎng)絡(luò),神經(jīng)元的輸出只取1和-1,所以也稱(chēng)離散神經(jīng)網(wǎng)絡(luò)(DHNN,Discrete Hopfield Neural Network)。在離散Hopfield網(wǎng)絡(luò)中,所采用的神經(jīng)元是二值神經(jīng)元,因此,所輸出的離散值1和-1分別表示神經(jīng)元處于激活和抑制狀態(tài)。
5 結(jié)束語(yǔ)
本文在前人研究成果的基礎(chǔ)上改進(jìn)了對(duì)字符進(jìn)行識(shí)別的算法,通過(guò)對(duì)大量隨機(jī)圖的仿真計(jì)算,最終的實(shí)驗(yàn)結(jié)果表明,離散型Hopfield神經(jīng)元網(wǎng)絡(luò)能有效地進(jìn)行字符識(shí)別,并且識(shí)別速度快,自適應(yīng)性能好,分辨率較高。通過(guò)實(shí)驗(yàn)驗(yàn)證,本算法達(dá)到了一定的識(shí)別率,能在實(shí)際生活中得到應(yīng)用,但也存在一些缺點(diǎn)和不足,如對(duì)訓(xùn)練樣本和識(shí)別樣本有一定的限制(盡管是為了方便訓(xùn)練和識(shí)別),且神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)方法在理論上還不是很完善,因此,還有待提取出新的方法,進(jìn)一步提高識(shí)別率,識(shí)別系統(tǒng)的性能關(guān)鍵與瓶頸仍然在于字符識(shí)別的核心算法性能上,最終目標(biāo)是研究零誤識(shí)率和低拒識(shí)率的高速識(shí)別算法。當(dāng)然,我們也可以把此神經(jīng)網(wǎng)絡(luò)的原理運(yùn)用在其他的領(lǐng)域,以檢驗(yàn)其算法的有效性。
參考文獻(xiàn):
[1] Matlab中文論壇.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京航空航天大學(xué)出版社,2009.
[2] 許錄平.數(shù)字圖像處理[M].科學(xué)出版社,2007.[3] 張良均,曹晶,蔣世忠.神經(jīng)網(wǎng)絡(luò)實(shí)用教程[M].機(jī)械工業(yè)出版社,2008.[4] 張宏林.數(shù)字圖像模式識(shí)別技術(shù)及工程實(shí)踐[M].人民郵電出版社,2004.[5] 鄧麗華,崔志強(qiáng),張靜.基于人工神經(jīng)網(wǎng)絡(luò)的手寫(xiě)體數(shù)字識(shí)別[J].三峽大學(xué)學(xué)報(bào),2005(6):255-256.
篇2
【關(guān)鍵詞】BP神經(jīng)網(wǎng)絡(luò) 高職 學(xué)生 體質(zhì) 綜合評(píng)價(jià) 應(yīng)用
【中圖分類(lèi)號(hào)】 G 【文獻(xiàn)標(biāo)識(shí)碼】A
【文章編號(hào)】0450-9889(2014)02C-0156-03
體質(zhì),是指在遺傳性和獲得性的基礎(chǔ)上表現(xiàn)出來(lái)的人體形態(tài)結(jié)構(gòu)、生理功能和心理因素的綜合的、相對(duì)穩(wěn)定的特征。對(duì)學(xué)生體質(zhì)進(jìn)行綜合評(píng)價(jià),是一項(xiàng)復(fù)雜的工作。建立健全學(xué)生的體質(zhì)評(píng)價(jià)體系,科學(xué)地評(píng)價(jià)學(xué)生的體質(zhì)狀況,引導(dǎo)學(xué)生進(jìn)行有針對(duì)性的體育鍛煉,對(duì)提高學(xué)生的身體素質(zhì)將起到十分重要的作用。當(dāng)前,數(shù)據(jù)挖掘技術(shù)在各領(lǐng)域的應(yīng)用研究已取得很大的進(jìn)展,而在學(xué)生身體素質(zhì)方面的應(yīng)用卻很少。基于此,本文探討B(tài)P神經(jīng)網(wǎng)絡(luò)在高職學(xué)生體質(zhì)綜合評(píng)價(jià)中的應(yīng)用。
一、影響學(xué)生體質(zhì)的指標(biāo)分析
體質(zhì)綜合評(píng)價(jià)是體育界研究健康問(wèn)題的一個(gè)領(lǐng)域,它由人體的骨骼形態(tài)、身體機(jī)能、身體的綜合素質(zhì)和人體所具備的運(yùn)動(dòng)能力等一系列綜合因素組成。這些綜合因素又可以通過(guò)若干個(gè)相互聯(lián)系、相互制約的數(shù)據(jù)指標(biāo)體系來(lái)反映。學(xué)生的體質(zhì),除先天因素外,后天合理、系統(tǒng)、科學(xué)的運(yùn)動(dòng)訓(xùn)練是必不可少的。對(duì)學(xué)生體質(zhì)進(jìn)行監(jiān)測(cè),指標(biāo)的選取是一個(gè)很重要的因素。本文根據(jù)現(xiàn)試行的《大學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》,采用身體形態(tài)、身體機(jī)能和運(yùn)動(dòng)能力3個(gè)方面對(duì)學(xué)生的體質(zhì)健康進(jìn)行綜合評(píng)價(jià)。其中,身體形態(tài)用克托萊指數(shù)(體重/身高×1000)表示,該指標(biāo)能有效地反映人體形態(tài)發(fā)育水平和勻稱(chēng)程度。身體機(jī)能采用肺活量―體重指數(shù)和臺(tái)階試驗(yàn)指數(shù)。肺活量―體重指數(shù)指標(biāo)反映每千克體重肺活量的大小,即每1kg體重的肺活量的相對(duì)值來(lái)反映肺活量與體重的相關(guān)程度,從而能比較客觀地對(duì)不同年齡、性別的個(gè)體與群體進(jìn)行定量比較分析。臺(tái)階試驗(yàn)指標(biāo)則通過(guò)有節(jié)律的登臺(tái)階運(yùn)動(dòng)持續(xù)時(shí)間(s)與恢復(fù)期測(cè)定的脈搏次數(shù)相應(yīng)的比值來(lái)評(píng)價(jià)人體心血管功能,該指標(biāo)反映學(xué)生的心血管系統(tǒng)功能,并間接推斷機(jī)體的耐力。本文采用的是中國(guó)改良臺(tái)階試驗(yàn),這兩個(gè)指標(biāo)都是越趨于極值表示其身體機(jī)能越好。運(yùn)動(dòng)能力用立定跳遠(yuǎn)、50米跑和引體向上表示。立定跳遠(yuǎn)能體現(xiàn)人體在運(yùn)動(dòng)中的靈敏度,50米短跑表現(xiàn)人體在運(yùn)動(dòng)中的速度,引體向上能體現(xiàn)人體的靜力性力量。各要素之間密切相關(guān),互相制約,又互相影響,是不可分割的整體。通過(guò)以上分析,可得本文所用學(xué)生體質(zhì)健康評(píng)價(jià)指標(biāo)體系,詳見(jiàn)表1。
表1 高職學(xué)生體質(zhì)健康評(píng)價(jià)指標(biāo)體系
項(xiàng)目 評(píng)價(jià)指標(biāo)
身體形態(tài) 克托萊指數(shù)
身體機(jī)能 肺活量―體重指數(shù)
臺(tái)階試驗(yàn)
運(yùn)動(dòng)能力 立定跳遠(yuǎn)
50米跑
引體向上
二、BP神經(jīng)網(wǎng)絡(luò)的基本概念
BP神經(jīng)網(wǎng)絡(luò)是一種對(duì)可微分非線性函數(shù)進(jìn)行權(quán)值訓(xùn)練的多層前饋網(wǎng)絡(luò),其基本結(jié)構(gòu)如圖1所示。
輸入層 隱藏層 輸出層
圖1 BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)
從圖1可以看到,BP神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)是一個(gè)前向的多層網(wǎng)絡(luò),該網(wǎng)絡(luò)由輸入層、輸出層以及一層或多層的隱藏層組成。BP網(wǎng)絡(luò)的輸出yk可以用公式描述為:
(1)
其中,Xj為輸入信號(hào),Wkj為網(wǎng)絡(luò)的權(quán)值,θk為網(wǎng)絡(luò)的閾值,為 網(wǎng)絡(luò)的激活函數(shù),k,j∈[1,n]。
在BP網(wǎng)絡(luò)中,同層的各神經(jīng)元之間互不連接,相鄰層的神經(jīng)元?jiǎng)t通過(guò)權(quán)值連接。BP網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程由兩部分組成:一是信息的正向傳播;二是信息的誤差反向傳播。在信息的正向傳播過(guò)程中,輸入的信息Xj經(jīng)隱含層單元逐層處理,最終由輸出層輸出。在這個(gè)信息的傳播過(guò)程中,每一層神經(jīng)元只對(duì)緊連接它的下一層神經(jīng)元的狀態(tài)產(chǎn)生影響。如果網(wǎng)絡(luò)的輸出yk與實(shí)際期望的輸出產(chǎn)生的誤差E達(dá)不到預(yù)先設(shè)定的要求,此時(shí),BP網(wǎng)絡(luò)轉(zhuǎn)入信息反向傳播階段。算法將誤差信號(hào)沿原來(lái)的連接通路反傳回來(lái),并修正各層連接權(quán)值和閾值,直到網(wǎng)絡(luò)的輸出達(dá)到預(yù)期目標(biāo)。
三、BP神經(jīng)網(wǎng)絡(luò)在高職學(xué)生體質(zhì)綜合評(píng)價(jià)中的具體應(yīng)用
(一)數(shù)據(jù)的采集。這里以某高校為例,由于男生、女生個(gè)體之間的差異,為了簡(jiǎn)化問(wèn)題,本文選取2006~2008年大一的男生共8500人按表1所列指標(biāo)進(jìn)行各項(xiàng)測(cè)試。在測(cè)試過(guò)程中,遵循先靜止后運(yùn)動(dòng)的測(cè)試原則,在測(cè)試時(shí)各項(xiàng)目之間留有一定的間隔,從而使學(xué)生的體力與機(jī)能得到完全恢復(fù),以保證學(xué)生能以最佳狀態(tài)參加測(cè)試。測(cè)試完成后,組織10個(gè)一線的、長(zhǎng)期從事學(xué)生體質(zhì)評(píng)測(cè)的體育教師對(duì)測(cè)試所得數(shù)據(jù)進(jìn)行評(píng)測(cè),所用評(píng)語(yǔ)為優(yōu)、良、中、差4個(gè)等級(jí)。為了便于BP神經(jīng)網(wǎng)絡(luò)的處理,將4個(gè)評(píng)價(jià)等級(jí)轉(zhuǎn)換為相應(yīng)的二進(jìn)制數(shù)值,如表2所示。收集到的原始測(cè)試數(shù)據(jù)如表3所示。
表2 評(píng)語(yǔ)等級(jí)對(duì)應(yīng)的分值標(biāo)準(zhǔn)
評(píng)語(yǔ)等級(jí) 對(duì)應(yīng)的分值
優(yōu) 1000
良 0100
中 0010
差 0001
表3 高職學(xué)生體質(zhì)測(cè)試原始數(shù)據(jù)(部分)
序號(hào) 克托萊指數(shù)(kg/cm×1000) 肺活量―體重指數(shù)(ml/kg) 臺(tái)階試驗(yàn) 立定跳遠(yuǎn) 50米跑(秒) 引體向上 綜合評(píng)價(jià)
1 352 90 78 2.45 7”3 16 良
2 318 73 65 2.39 7”7 13 差
3 372 81 83 2.61 7”1 13 優(yōu)
4 349 61 81 2.52 7”2 8 中
5 356 87 89 2.63 6”7 11 優(yōu)
6 323 73 73 2.39 7”6 12 中
7 367 79 85 2.61 7”2 11 良
8 373 75 82 2.46 6”9 15 優(yōu)
9 326 83 69 2.39 7”7 11 中
(二)網(wǎng)絡(luò)的訓(xùn)練過(guò)程。BP神經(jīng)網(wǎng)絡(luò)處理的是[0,1]范圍內(nèi)的數(shù)值,但是從表3學(xué)生體質(zhì)測(cè)試的原始數(shù)據(jù)中可以看出,各評(píng)測(cè)指標(biāo)所得數(shù)據(jù)差別較大,且屬性的取值多是大于1。因此,必須將這些數(shù)據(jù)轉(zhuǎn)化為[0,1]之間的數(shù)據(jù)。所用歸一化公式為:
(2)
其中,X是所收集的一組數(shù)據(jù),MIX(X)和MIN(X)分別是這組數(shù)據(jù)的最大值和最小值,是映射后的數(shù)據(jù)。經(jīng)過(guò)歸一化后的數(shù)據(jù)如表4所示。
表4 高職學(xué)生體質(zhì)測(cè)試歸一化數(shù)據(jù)(部分)
序號(hào) 克托萊指數(shù)(kg/cm×1000) 肺活量―體重指數(shù)(ml/kg) 臺(tái)階試驗(yàn) 立定跳遠(yuǎn) 50米跑(秒) 引體向上 綜合評(píng)價(jià)
1 0.6182 1 0.5417 0.25 0.6 1 良
2 0 0.4138 0 0 1 0.625 差
3 0.9818 0.6897 0.75 0.9167 0.4 0.625 優(yōu)
4 0.5636 0 0.6667 0.5417 0.5 0 中
5 0.6909 0.8966 1 1 0 0.375 優(yōu)
6 0.0909 0.4138 0.3333 0 0.9 0.5 中
7 0.8909 0.6207 0.8333 0.9167 0.5 0.375 良
8 1 0.4826 0.7083 0.2917 0.2 0.875 優(yōu)
9 0.1455 0.7586 0.1667 0 1 0.375 中
取2006、2007年的學(xué)生數(shù)據(jù)共6500筆作為訓(xùn)練網(wǎng)絡(luò)用,余下的數(shù)據(jù)作為測(cè)試數(shù)據(jù)。
關(guān)于隱含層節(jié)點(diǎn)數(shù)的選擇是一個(gè)十分復(fù)雜的問(wèn)題,隱層神經(jīng)元數(shù)目的選擇對(duì)BP神經(jīng)網(wǎng)絡(luò)的性能影響較大。如果網(wǎng)絡(luò)隱層神經(jīng)元數(shù)量過(guò)少,則網(wǎng)絡(luò)所能獲取的用以解決問(wèn)題的信息太少;如果隱層神經(jīng)元數(shù)量過(guò)多,增加了網(wǎng)絡(luò)的訓(xùn)練時(shí)間,甚至還會(huì)出現(xiàn)網(wǎng)絡(luò)過(guò)度匹配現(xiàn)象。實(shí)踐證明,隱層神經(jīng)元個(gè)數(shù)n2和輸入層個(gè)數(shù)n1之間有以下近似關(guān)系:
n2+2n1+1 (3)
因此,本文采用三層BP網(wǎng)絡(luò)來(lái)進(jìn)行建模。
從表4的數(shù)據(jù)可知,本例的BP網(wǎng)絡(luò)有6個(gè)輸入層,1個(gè)輸出層。根據(jù)公式(3)可求出BP網(wǎng)絡(luò)的隱層神經(jīng)元個(gè)數(shù)為13。雖然有公式(3)作為指導(dǎo),但BP網(wǎng)絡(luò)隱層的神經(jīng)元個(gè)數(shù)并非一成不變。在BP網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,需要對(duì)同一樣本集采用不同隱層節(jié)點(diǎn)數(shù)的網(wǎng)絡(luò)進(jìn)行訓(xùn)練,直到網(wǎng)絡(luò)輸出穩(wěn)定為止。最后,根據(jù)BP網(wǎng)絡(luò)的測(cè)試結(jié)果,把網(wǎng)絡(luò)輸出誤差最小的隱層節(jié)點(diǎn)數(shù)確定為該BP網(wǎng)絡(luò)的最佳隱節(jié)點(diǎn)數(shù)。經(jīng)過(guò)對(duì)同一樣本集的多次測(cè)試,本例的BP網(wǎng)絡(luò)最終確定的隱層節(jié)點(diǎn)數(shù)為11。實(shí)驗(yàn)采用的軟件環(huán)境為matlab7,采用S型正切函數(shù)tan sig作為本實(shí)驗(yàn)的網(wǎng)絡(luò)中間層傳遞函數(shù)。由于實(shí)驗(yàn)中數(shù)據(jù)的輸出模式為0~1,因此采用S型的對(duì)數(shù)函數(shù)log sig作為輸出層的傳遞函數(shù)。其余訓(xùn)練參數(shù)的設(shè)定如表5所示。
表5 訓(xùn)練參數(shù)
訓(xùn)練次數(shù) 訓(xùn)練目標(biāo) 學(xué)習(xí)速率
1000 0.01 0.1
經(jīng)過(guò)242次訓(xùn)練后,網(wǎng)絡(luò)的性能就達(dá)到了要求,如圖2所示。
圖2 訓(xùn)練結(jié)果
接下來(lái)需要對(duì)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行測(cè)試。隨機(jī)抽取3筆2009級(jí)大一學(xué)生的測(cè)試數(shù)據(jù)進(jìn)行測(cè)試,結(jié)果如表6所示。
表6 抽樣數(shù)據(jù)測(cè)試結(jié)果
序號(hào) BP神經(jīng)網(wǎng)絡(luò)測(cè)試結(jié)果 實(shí)際情況
1 0.0327 0.9796 0.0125 0.0001 良
2 0.0000 0.0001 0.9611 0.0321 中
3 0.9840 0.0000 0.0150 0.0001 優(yōu)
(三)結(jié)果分析。從表6的結(jié)果來(lái)看,抽樣數(shù)據(jù)的測(cè)試結(jié)果和實(shí)際值相互吻合。把該網(wǎng)絡(luò)模型用于2009級(jí)大一男生的體質(zhì)健康綜合評(píng)測(cè)中,有效率為96.3%,完全能滿足應(yīng)用要求。
綜上所述,目前《學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》實(shí)施工作的重點(diǎn)在數(shù)量,難點(diǎn)在質(zhì)量。本文采用BP神經(jīng)網(wǎng)絡(luò)對(duì)高職學(xué)生的體質(zhì)進(jìn)行綜合評(píng)價(jià)是一次新的嘗試,有利于更科學(xué)地對(duì)(下轉(zhuǎn)第163頁(yè))(上接第157頁(yè))學(xué)生的體質(zhì)進(jìn)行綜合評(píng)價(jià),從而更好地把握學(xué)生的健康狀況,為學(xué)生今后的學(xué)習(xí)和工作打下良好的基礎(chǔ)。該模型的應(yīng)用對(duì)于縱向研究大學(xué)生的體質(zhì)發(fā)展態(tài)勢(shì)和體質(zhì)等級(jí)的方法更具有現(xiàn)實(shí)意義。
【參考文獻(xiàn)】
[1]陳明達(dá),于道中.實(shí)用體質(zhì)學(xué)[M].北京:北京醫(yī)科大學(xué)、中國(guó)協(xié)和醫(yī)科大學(xué)聯(lián)合出版社,1993
[2]王童,徐明欣,李瑞年.大學(xué)生體質(zhì)等級(jí)綜合評(píng)定判別分類(lèi)的方法[J].天津體育學(xué)院學(xué)報(bào),2005(2)
[3]孫文爽.體質(zhì)的綜合評(píng)價(jià)方法[J].楚雄師專(zhuān)學(xué)報(bào),2001(3)
[4]S Horikawa.On fuzzy modelling using fuzzy nerual networks with BP algorithm.IEEE Trans[J].nerual Networks, 1992(2)
[5]包健,趙建勇,周華英.基于BP網(wǎng)絡(luò)曲線擬合方法的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2005(7)
[6]韋萌.BP神經(jīng)網(wǎng)絡(luò)在高校教學(xué)實(shí)驗(yàn)室綜合評(píng)價(jià)中的應(yīng)用[J].柳州職業(yè)技術(shù)學(xué)院學(xué)報(bào),2010(1)
[7]王秀春,智會(huì)強(qiáng),毛一之,等.多宗量導(dǎo)熱反問(wèn)題求解的神經(jīng)網(wǎng)絡(luò)法[J].航空動(dòng)力學(xué)報(bào),2004(4)
[8]張志立,程磊,何敏.基于人工神經(jīng)網(wǎng)絡(luò)的煤與瓦斯突出檢測(cè)[J].礦業(yè)安全與環(huán)保,2005(6)
[9]French M.N. etal.Rainfall forecasting in space and time using a neural networks[J].J.of hydrol,1992(7)
【基金項(xiàng)目】2012年度廣西高等教育教學(xué)改革工程項(xiàng)目(2012JGA322)
篇3
關(guān)鍵詞:函數(shù)依賴(lài);屬性依賴(lài);屬性空間;高維映射;復(fù)合型神經(jīng)網(wǎng)絡(luò)
中圖分類(lèi)號(hào): TP138
文獻(xiàn)標(biāo)志碼:A
Attribute dependency theory and its application on neural network
FANG Liang-da1, YU Yong-quan1,2
(
1. Faculty of Computer, Guangdong University of Technology, Guangzhou Guangdong 510090, China;
2. Department of Computer Science, Guangdong Baiyun University, Guangzhou Guangdong 510450, China
)
Abstract:
Neural network optimization methods are generally confined to learning algorithms and input attributes. Due to the higher dimensional mapping which neural network fits contains complex intrinsic attribute dependencies. And the traditional optimization methods have not conducted the analytical study to it. The article puts forward the attribute dependency theory based on functional dependency theory and elaborates the definition of the attribute dependency theory and infers its theorem. Combining with the RBF neural network, it proposes a new neural network optimization method based attribute dependency theory (ADO-RBF).
Neural network optimization methods are generally confined to learning algorithms and input attributes. Due to the high-dimensional mapping that neural network fits contains complex intrinsic attribute dependencies, the traditional optimization methods have not conducted the analytical study on it. The article put forward the attribute dependency theory based on functional dependency theory, elaborated the definition of the attribute dependency theory, and proved related theorem. Combining the Radius Basis Function (RBF) neural network, a new neural network optimization method based on attribute dependency theory (ADO-RBF) was proposed.
Key words:
functional dependency; attribute dependency; attribute space; high-dimensional mapping; composite neural network
0 引言
由于神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)能力,使得神經(jīng)網(wǎng)絡(luò)在低維空間的映射逼近能力較強(qiáng),并且逐步地代替數(shù)學(xué)公式來(lái)擬合低維空間上的函數(shù)。但是,隨著社會(huì)的發(fā)展需要,高維空間上的映射擬合已經(jīng)成為了人工智能的重要研究方向之一,并且在這方面已經(jīng)取得許多研究成果。例如,文獻(xiàn)[1-3]基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的參數(shù)的學(xué)習(xí)公式的思想,分別提出了結(jié)構(gòu)簡(jiǎn)單的分式線性神經(jīng)網(wǎng)絡(luò)、SEFNN學(xué)習(xí)算法和多目標(biāo)微粒群學(xué)習(xí)算法,為神經(jīng)網(wǎng)絡(luò)的精確性和復(fù)雜性的尋優(yōu)問(wèn)題提供了一種新的解決方法。文獻(xiàn)[4] 提出了基于Hebb規(guī)則的分布式神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。文獻(xiàn)[5-9]基于神經(jīng)網(wǎng)絡(luò)集成方法,提出了各種改善多個(gè)神經(jīng)網(wǎng)絡(luò)集成結(jié)構(gòu)的方法,提高神經(jīng)網(wǎng)絡(luò)的泛化能力與仿真精度。文獻(xiàn)[10]基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的內(nèi)部神經(jīng)元,提出了一種分式過(guò)程神經(jīng)元網(wǎng)絡(luò),該模型是基于有理式函數(shù)具有的對(duì)復(fù)雜過(guò)程信號(hào)的逼近性質(zhì)和過(guò)程神經(jīng)元網(wǎng)絡(luò)對(duì)時(shí)變信息的非線性變換機(jī)制構(gòu)建的,其基本信息處理單元由兩個(gè)過(guò)程神經(jīng)元成對(duì)偶組成,邏輯上構(gòu)成一個(gè)分式過(guò)程神經(jīng)元,是人工神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)和信息處理機(jī)制上的一種擴(kuò)展。文獻(xiàn)[11]中提出一種基于主成分分析和神經(jīng)網(wǎng)絡(luò)的高維映射擬合方法,利用主成分分析法提取樣本中的輸入維度主成分,實(shí)現(xiàn)樣本的輸入維度的最優(yōu)壓縮,有效減少輸入層神經(jīng)元個(gè)數(shù),提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度和擬合精度。文獻(xiàn)[12]提出了一種基于人工免疫原理的徑向基網(wǎng)絡(luò)函數(shù)映射模型,使用新的克隆選擇算法和免疫抑制策略,通過(guò)中間層可行解的抽取算法EAHLFS,能在聚類(lèi)數(shù)目未知的情況下,生成徑向基網(wǎng)絡(luò)的中間層,與傳統(tǒng)的基于聚類(lèi)算法的徑向基神經(jīng)網(wǎng)絡(luò)函數(shù)映射模型比較,AIP-RBF具有更快的收斂速度和更高的求解精度。文獻(xiàn)[13]提出了高維多輸入分層神經(jīng)網(wǎng)絡(luò),將一部分輸入節(jié)點(diǎn)移至其某些隱層,減少連接權(quán)值,能夠在同樣的時(shí)間內(nèi)達(dá)到比原神經(jīng)網(wǎng)絡(luò)更好的學(xué)習(xí)效果。
但是,上述文獻(xiàn)僅僅從學(xué)習(xí)算法、集成網(wǎng)絡(luò)方面對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),并沒(méi)有考慮從樣本數(shù)據(jù)中的各類(lèi)屬性對(duì)內(nèi)部網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化。本文結(jié)合樣本中各類(lèi)屬性之間的關(guān)系,通過(guò)對(duì)函數(shù)依賴(lài)?yán)碚摰姆治雠c研究,提出了屬性依賴(lài)?yán)碚?并在此理論基礎(chǔ)上,提出一種新的神經(jīng)網(wǎng)絡(luò)優(yōu)化方法ADO-RBF。
1 屬性依賴(lài)的基本理論
1.1 映射及其屬性的基本概念
定義1 設(shè)X(xi∈X)和Y(yj∈Y)是兩組屬性的集合,如果存在某種對(duì)應(yīng)法則f,對(duì)于X中的任何一個(gè)元素,在Y中都有唯一的元素和它對(duì)應(yīng),這樣的對(duì)應(yīng)f叫作從集合X到集合Y的映射,記作Y=f(X)[14]。當(dāng)X,Y都屬于高維屬性集合時(shí), f稱(chēng)為從集合X到集合Y的高維映射。
其中xi為該映射的外輸入屬性,yj為外輸出屬性。為了方便表示,設(shè)Xi={xi},Yj={yj},稱(chēng)為單元屬性集。
由于在高維映射中存在各種子映射。例如定義1中的Y=f(X)包含了Yj=fj(X)(YjY,fj∈f)。所以存在子映射,使得輸出屬性yj作為該映射的輸入屬性。
1.2 屬性依賴(lài)的基本概念
在數(shù)據(jù)庫(kù)領(lǐng)域中,E.F.Codd給出了函數(shù)依賴(lài)的定義[15],但是他只定義了屬性之間是否存在依賴(lài)關(guān)系,卻沒(méi)有定義兩者之間的依賴(lài)關(guān)系程度。本文在此基礎(chǔ)上,給出高維空間中數(shù)據(jù)之間的依賴(lài)關(guān)系程度的定義。
定義2 設(shè)S為樣本空間的屬性集合,X和Y是S中的任意子集,存在某種映射f,使得Y=f(X)成立,則稱(chēng)Y屬性依賴(lài)于X,或者X屬性決定Y (記作XY)。
定義3 當(dāng)XY且YX,則稱(chēng)XY是非平凡的屬性依賴(lài)。
定義4 當(dāng)XY且YX,則稱(chēng)XY是平凡的屬性依賴(lài)。
注意:若不特別聲明,則討論的XY是非平凡的屬性依賴(lài)。
定義5 屬性空間(Ω,F,μ)是一個(gè)總測(cè)度為1的測(cè)度空間,即μ(Ω)=1。
其中Ω是一個(gè)非空屬性集合,稱(chēng)作屬性空間。
F是屬性空間Ω的冪集的一個(gè)非空子集,F的集合元素也是一個(gè)屬性集合,并且滿足以下條件:
1) Ω∈F;
2) 若Xn∈F,n=1,2,…,則∪∞n=1Xn∈F
μ稱(chēng)為屬性測(cè)度,是一個(gè)從屬性集合F到[0,1]的函數(shù),μ:F[0,1]。每個(gè)屬性集都被此函數(shù)賦予一個(gè)0~1的數(shù)值,且μΩ(Ω)=1。
┑4期 攪即锏:屬性依賴(lài)?yán)碚摷捌湓谏窠?jīng)網(wǎng)絡(luò)中的應(yīng)用
┆撲慊應(yīng)用 ┑30卷
定義6 如果XY,且存在直接映射f,使得Y=f(X)成立,則稱(chēng)Y直接屬性依賴(lài)于X(記作XDY),并且稱(chēng)d(X,Y)為XDY的直接屬性依賴(lài)度,其取值范圍為[0,1]。
其中,當(dāng)d(X,Y)=0時(shí),X\DY;當(dāng)d(X,Y)=1時(shí),稱(chēng)Y完全直接屬性依賴(lài)于X(記作XFDY);當(dāng)0
在屬性依賴(lài)中,存在最小直接依賴(lài)集Z,使得ZFDY。即對(duì)于Z的任意非空真子集Zi(即ZiZ,Zi≠),都使得ZiPDY成立。其中(Z,X,μ)為屬性空間,而d(X,Y)=μZ(X)。
直接屬性依賴(lài)度函數(shù)滿足下列條件。
1)非負(fù)性。對(duì)于任意兩個(gè)屬性集合X和Y,有d(X,Y)≥0。
2)規(guī)范性。如果Y完全直接屬性依賴(lài)X,則d(X,Y)=1。
3)左側(cè)可加性。設(shè)X1,X2,…,Xn是兩兩互無(wú)交集的屬性集合,即i,j≤n,i≠j,Xi∩Xj=,則有:
d(∪ni=1Xi,Y)=∑ni=1d(Xi,Y)(1)
4)右側(cè)可乘性。設(shè)Y1,Y2,…,Yn是兩兩互無(wú)交集的屬性集合,即i,j≤n,i≠j,Yi∩Yj=,則有:
d(X,∪ni=1Yi)=∏ni=1d(X,Yi)(2)
由直接屬性依賴(lài)的定義,可以推出直接屬性依賴(lài)的一些重要定理。
定理1 當(dāng)Y≠潦,d(,Y)=0。
證明 令Xn=(n=1,2,…),則∪ni=1Xi=,且i,j∈N,i≠j,Xi∩Xj=,由左側(cè)可列可加性(1)可得:
d(,Y)=d(∪ni=1Xi,Y)=∑ni=1d(Xi,Y)=∑ni=1d(,Y)
由于d(X,Y)≥0,故由上式可知當(dāng)Y≠潦,d(,Y)=0。
定理2 d(X,)=1。
證明 令Yn=(n=1,2,…),則∪ni=1Yi=,且i,j∈N,i≠j,Yi∩Yj=,由右側(cè)可列可加性(2)得:
d(X,)=d(X,∪ni=1Yi)=∏ni=1d(X,Yi)=∏ni=1d(X,)
由于d(X,Y)≤1,故由上式可知d(X,)=1。
從定理1、2可以看出:當(dāng)左側(cè)屬性集合為空時(shí),左側(cè)屬性無(wú)法直接決定右側(cè)屬性;當(dāng)右側(cè)屬性集合為空時(shí),任意左側(cè)屬性集合(包括空屬性集)都可以直接決定右側(cè)屬性。
定理3 設(shè)X,Y,Z是屬性集合,若XY,則有:
d(Y-X,Z)=d(Y,Z)-d(X,Z)(3)
d(X,Z)≤d(Y,Z)(4)
證明 由XY可得Y=X∪(Y-X),且X∩(Y-X)=,再由條件3)可得:
d(Y-Z,Z)=d(Y,Z)-d(X,Z)
式(3)得證。
又由定義5,可得d(Y-X,Z)≥0,因此:
d(X,Z)≤d(Y,Z)
式(4)得證。
證畢。
定理4 設(shè)X,Y,Z是屬性集合,若YZ,則有:
d(X,Z-Y)=d(X,Z)d(X,Y)(5)
d(X,Y)≥d(X,Z)(6)
證明 由XY可得Y=X∪(Y-X),且X∩(Y-X)=,再由條件4)可得:
d(X,Z-Y)=d(X,Z)d(X,Y)
式(5)得證。
又由定義5,可知0≤d(Y-X,Z)≤1,所以:
d(X,Y)≥d(X,Z)
式(6)得證。
證畢。
定理5 d(X∪Y,Z)=d(X,Z)+d(Y,Z)-d(X∩Y,Z),當(dāng)X∪Y=潦,d(X∪Y,Z)=d(X,Z)+d(Y,Z)。
證明 因X∪Y=X∪(Y-X∩Y),且X∩(Y-X∩Y)=,X∩YY,故由條件3)與定理3得:
d(X∪Y,Z)=d(X,Z)+d(Y-X∩Y,Z)=d(X,Z)+
d(Y,Z)-d(X∩Y,Z)
證畢。
定理6 d(X,Y∪Z)=d(X,Y)•d(X,Z)d(X,Y∩Z),
當(dāng)Y∪Z=潦,d(X,Y∪Z)=d(X,Y)•d(X,Z)。
證明 因Y∪Z=Y∪(Z-Y∩Z),且Y∩(Z-Y∩Z)=,Y∩ZZ,故由條件4)與定理4得:
d(X,Y∪Z)=d(X,Y)•d(X,Z-Y∩Z)=
d(X,Y)•d(X,Z)d(X,Y∩Z)
定義7 當(dāng)XDY,YDZ,且Y∩X=,Y∩Z=,則稱(chēng)Z的Y一階傳遞屬性依賴(lài)于X(記作XT(1)YZ),并且稱(chēng)tY(X,Z)為XT(1)YZ的Y一階傳遞屬性依賴(lài)度,其取值范圍為[0,1]。
其中:
t(1)Y(X,Z)=d(X,Y)•d(Y,Z)(7)
定理8 當(dāng)Y∪T=潦,t(1)Y∪T(X,Z)=d(X,Y)•d(X,T)•[d(Y,Z)+d(T,Z)]。
證明 由式(3)可得,t(1)Y∪T(X,Z)=d(X,Y∪T)•d(Y∪T,Z);
再由定理1和2,得出t(1)Y∪T(X,Z)=d(X,Y)•d(X,T)•[d(Y,Z)+d(T,Z)]。
證畢。
定理9 當(dāng)Y∪T=潦,t(1)Y∪T(X,Z)≤t(1)Y(X,Z)+t(1)T(X,Z)。
證明 由定理8和定義6可得:
t(1)Y∪T(X,Z)=d(X,Y)•d(X,T)•[d(Y,Z)+d(T,Z)]t(1)Y(X,Z)=d(X,Y)•d(Y,Z)
由于d(X,Y),d(X,T),d(Y,Z),d(T,Z)≤1
所以t(1)Y∪T(X,Z)≤t(1)Y(X,Z)+t(1)T(X,Z)
證畢。
定義8 對(duì)于所有Y=∪ni=1Yi,如果存在XDYi,YiDZ,Yi(Yi∩X=,Yi∩Z=),則稱(chēng)Z一階傳遞屬性依賴(lài)于X,并且稱(chēng)t(1)┆sum(X,Z)(簡(jiǎn)寫(xiě)為t(1)(X,Z))為XT(1)Z的一階傳遞屬性依賴(lài)度,其取值范圍為[0,1],其公式如下:
t(1)(X,Z)=d(X,∪ni=1Yi)•d(∪ni=1Yi,Z)(8)
當(dāng)t(X,Z)=0時(shí),X\TZ;當(dāng)t(X,Z)=1時(shí),稱(chēng)Z完全一階傳遞屬性依賴(lài)于X(記作XFT(1)Z);當(dāng)t
定義9 對(duì)于Y(Yi,YjY,Yi∩Yj=,Yi∩X=,Yi∩Z=),如果存在某一種排列p1,p2,…,pn(pi,pj∈{1,2,…,n},pi≠pj),使得XDYp1,Yp2DYp3,…,Ypn-1DYpn,YpnDZ,則稱(chēng)Z n階傳遞屬性依賴(lài)于X,并且稱(chēng)t(n)┆sum(X,Z)(簡(jiǎn)寫(xiě)為t(n)(X,Z))為XTZ的n階傳遞屬性依賴(lài)度,其取值范圍為[0,1],其公式如下:
t(n)(X,Z)=∑nk=1[∏nj=1d(X,Yj)•∏ni=1,i≠j,i≠kd(Yi,Yi+1)•
d(Yk,Z)]當(dāng)t(X,Z)=0時(shí),X\T(n)Z;當(dāng)t(X,Z)=1時(shí),稱(chēng)Z完全n階傳遞屬性依賴(lài)于X(記作XFT(n)Z);當(dāng)t
顯然,XDY等價(jià)于Y 0階傳遞屬性依賴(lài)于X,其d(X,Y)為XT(0)Z的0階傳遞依賴(lài)度。
1.3 復(fù)雜高維映射及屬性依賴(lài)
從客觀世界分析所得,一般的高維映射不僅僅是簡(jiǎn)單的多維輸入對(duì)應(yīng)多維輸出的關(guān)系,而更多的是映射中的屬性之間也存在依賴(lài)關(guān)系。其情況分別如下(以下例子假設(shè)基本初等函數(shù)與一次的四則運(yùn)算[17]為直接映射關(guān)系)。
1)高維映射中存在各種子直接映射。例如定義1中的B=f(A)包含了Bj=fj(A)(BjB,fj∈f)。而所有的外輸入屬性ai都直接決定于bj,即∑id(Ai,Bj)=1。例如(a,b)(c,d)=(a-b,a+b)。
2)高維映射中外輸入屬性?xún)H傳遞決定外輸出屬性。即存在AiA,BjB,使得n≥1,d(Ai,Bj)=0,t(n)(Ai,Bj)≥0。例如(a,b)=(a,sin a)(c,d)=(b2,a2)。上述例子中,{a}DD{c},即{a}T(1){c}。
3)高維映射中外輸入屬性既不直接決定又不傳遞決定外輸出屬性。即存在AiA,BjB,使得n≥0,t(n)(Ai,Bj)=0。例如(a,b)(c,d)=(sin a,cos a),顯然,\{c,d}。
4)高維映射中的某個(gè)外輸出屬性決定某個(gè)外輸出屬性。即存在Bi,BjB,Bi≠Bj,使得d(Bi,Bj)≥0。例如(a,b)(c,d)=(a+b,sin c)。上述例子中,{a}D{c}D9ll17pr,即{a}T(1)rbxjtpb。
從上述情況分析可知:情況1)是最簡(jiǎn)單的多維輸入對(duì)應(yīng)多維輸出的關(guān)系;情況2)表明了存在輸出屬性不直接依賴(lài)于某些輸入屬性的映射關(guān)系;情況3)闡述了某些輸入屬性與輸出屬性并不存在映射關(guān)系;情況4)說(shuō)明了輸出屬性之間存在直接依賴(lài)映射關(guān)系。由于一般情況下,擬合高維映射采用的方法都是黑盒系統(tǒng)(例如神經(jīng)網(wǎng)絡(luò)、模糊系統(tǒng)等),但是當(dāng)高維映射存在情況2),3),4)等的非簡(jiǎn)單直接依賴(lài)關(guān)系時(shí),黑盒系統(tǒng)無(wú)法精確地?cái)M合出該高維映射。因此,需結(jié)合屬性依賴(lài)原理,分析高維映射中內(nèi)在的屬性依賴(lài)關(guān)系,然后再采用復(fù)合型神經(jīng)網(wǎng)絡(luò)對(duì)高維映射進(jìn)行擬合。
1.4 高維映射的屬性類(lèi)型分析
由1.3節(jié)可知,當(dāng)擬合具有直接依賴(lài)性質(zhì)的高維映射時(shí),神經(jīng)網(wǎng)絡(luò)才具有較好的精確度。因此,本節(jié)以高維映射中的屬性依賴(lài)關(guān)系為基礎(chǔ),分析各個(gè)屬性的類(lèi)型。
定義10 設(shè)A(ai∈A)和B(bj∈B)是兩組屬性的集合,如果存在直接屬性依賴(lài),使得{ci}DD,(DA∪B,ci∈A∪B,ciD),則稱(chēng)ci為該高維映射中的直接輸入屬性。
定義11 設(shè)A(ai∈A)和B(bj∈B)是兩組屬性的集合,如果存在直接屬性依賴(lài),使得CD{dj},(CA∪B,di∈A∪B,diC),則稱(chēng)ci為該高維映射中的直接輸出屬性。
定義12 設(shè)A(ai∈A)和B(bj∈B)是兩組屬性的集合,如果直接屬性依賴(lài),使得CD{ei}DD(C,DA∪B,ei∈A∪B,eiC∪D),則稱(chēng)ei為該高維映射中的轉(zhuǎn)換屬性。
由圖1可知,外輸入屬性、外輸出屬性、直接輸入屬性、直接輸出屬性和轉(zhuǎn)換屬性5者之間的關(guān)系。
圖片
圖1 各類(lèi)型屬性之間的關(guān)系
1.5 屬性依賴(lài)與函數(shù)依賴(lài)的關(guān)系與區(qū)別
由定義5~8可知,屬性依賴(lài)?yán)碚撘肓藢傩灾苯右蕾?lài)度與傳遞依賴(lài)度兩個(gè)概念。盡管函數(shù)依賴(lài)?yán)碚撝胁淮嬖谝蕾?lài)度的定義。實(shí)際上可以看出,兩者的依賴(lài)度函數(shù)可分別定義為(X,Y)[0,1];(X,Y){0,1}。例如,存在二元關(guān)系{UserNo,UserName},一般可以通過(guò)用戶(hù)編號(hào),準(zhǔn)確地知道該用戶(hù)的姓名。但是由于用戶(hù)姓名會(huì)出現(xiàn)重名的情況,如果僅僅知道用戶(hù)姓名,則不能夠精確獲取該用戶(hù)的編號(hào)信息。由函數(shù)依賴(lài)?yán)碚摽傻?UserNoUserName,其相應(yīng)的直接函數(shù)依賴(lài)度為d({UserNo},{UserName})=1,d({UserName},{UserNo})=0;而由屬性依賴(lài)?yán)碚?可得出UserNo┆塥DUserName,其相應(yīng)的直接屬性依賴(lài)度為d({UserNo},{UserName})=1,d({UserName},{UserNo})=0.9。由此可見(jiàn),函數(shù)依賴(lài)是屬性依賴(lài)的特殊化,而屬性依賴(lài)是函數(shù)依賴(lài)的細(xì)化。
2 直接依賴(lài)性的復(fù)合型神經(jīng)網(wǎng)絡(luò)生成方法
由于神經(jīng)網(wǎng)絡(luò)是擬合高維映射的主要方法之一,由1.3節(jié)可知,一般的高維映射不僅是簡(jiǎn)單的多維輸入對(duì)應(yīng)多維輸出的關(guān)系,而是具有復(fù)雜屬性依賴(lài)性的映射關(guān)系;又因?yàn)樯窠?jīng)網(wǎng)絡(luò)在擬合具有傳遞依賴(lài)性的高維映射能力較差,所以需要復(fù)合型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)擬合復(fù)雜的映射關(guān)系。復(fù)合型神經(jīng)網(wǎng)絡(luò)的生成流程見(jiàn)圖2。
圖片
圖2 復(fù)合型神經(jīng)網(wǎng)絡(luò)生成流程
2.1 分析高維映射中的屬性依賴(lài)關(guān)系
分析高維映射中的屬性依賴(lài)關(guān)系這是生成方法的第一步,包括:
1) 分析高維映射中的屬性所屬的類(lèi)型(包括直接輸入屬性、直接輸出屬性、轉(zhuǎn)換屬性3類(lèi));
2) 分析各個(gè)屬性之間的關(guān)系;
3) 給每個(gè)單元屬性集的直接依賴(lài)關(guān)系賦予相應(yīng)的直接依賴(lài)度。
2.2 提取具有直接依賴(lài)性的單輸出屬性集子映射
由定理6、9可以看出,當(dāng)輸出屬性集合包含越多屬性時(shí),該系統(tǒng)的精確度越低。因此,本節(jié)根據(jù)上一步所分析的單元屬性集的依賴(lài)關(guān)系,依照屬性依賴(lài)?yán)碚?定理5),提取出具有直接依賴(lài)性的單輸出屬性集子映射。通過(guò)將具有相同的單輸出屬性集的子映射關(guān)系提取出來(lái),同時(shí)計(jì)算多輸入屬性集與單輸出屬性集的直接依賴(lài)度。
例如,存在某個(gè)高維映射f,其單元屬性集的直接依賴(lài)關(guān)系分別為{A1}D{B1},{A2}D{B1},{A2}D{B2},{B1}D{B2}為,其中A1,A2為外輸入屬性;B1,B2為外輸出屬性。子映射的直接依賴(lài)度分別為d({A1},{B1})=0.68;d({A2},{B1})=0.3;d({A2},{B2})=0.2;d({B1},{B2})=0.75。
根據(jù)屬性依賴(lài)?yán)碚摲治隹傻?{A1,A2}D{B1},{A2,B1}D{B2}(其中{A1,A2}={A1}∪{A2},{A2,B1}={A2}∪{B1})。并且由于任意的單元屬性集交集為空集,由此可得d({A1,A2},{B1})=0.98;d({A2,B1},{B2})=0.95。
2.3 合并融合度高的子映射
該步驟的主要思想就是對(duì)具有融合度較高的子映射集合進(jìn)行組合,構(gòu)造一個(gè)新的子映射,即簡(jiǎn)化復(fù)合型神經(jīng)網(wǎng)絡(luò)的內(nèi)在結(jié)構(gòu),提高其效率。例如存在一個(gè)映射關(guān)系(a,b)(c)=(a+b)(d)=(sin c),其中包含的2個(gè)直接依賴(lài)關(guān)系如下: f1:{a,b}D{c}, f2:{c}Drvltt9t,但是由于f1與f2的融合度較高,因此存在一個(gè)復(fù)合子映射: f3:{a,b}Tl1jdtv9(其中d=sin (a+b))。雖然f3為傳遞依賴(lài)的子映射,但仍可采取神經(jīng)網(wǎng)絡(luò)方法對(duì)其進(jìn)行擬合。
2.4 構(gòu)建復(fù)合型神經(jīng)網(wǎng)絡(luò)
該步驟的主要思想就是將2.3節(jié)中所得出的子映射采用神經(jīng)網(wǎng)絡(luò)進(jìn)行擬合,然后將所有的神經(jīng)網(wǎng)絡(luò)進(jìn)行結(jié)合,構(gòu)建一個(gè)復(fù)合型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。由2.2節(jié)所得出的子映射關(guān)系:{A1,A2}D{B1},{A2,B1}D{B2},因此,需要構(gòu)造2個(gè)子神經(jīng)網(wǎng)絡(luò)模型分別對(duì)應(yīng)f1:A1×A2B1, f2:A2×B1B2。其中f1、 f2分別為所需擬合的高維映射f的子映射。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段,因?yàn)椴捎脴颖緮?shù)據(jù)進(jìn)行訓(xùn)練,所以各神經(jīng)網(wǎng)絡(luò)模型可以同時(shí)進(jìn)行訓(xùn)練。但是進(jìn)行識(shí)別計(jì)算時(shí),必須依據(jù)依賴(lài)關(guān)系內(nèi)在的拓?fù)浣Y(jié)構(gòu)進(jìn)行映射計(jì)算。上述映射關(guān)系對(duì)應(yīng)的拓?fù)浣Y(jié)構(gòu)如圖3。
圖片
圖3 映射關(guān)系的拓?fù)浣Y(jié)構(gòu)
復(fù)合型神經(jīng)網(wǎng)絡(luò)在進(jìn)行識(shí)別計(jì)算時(shí),應(yīng)先將A1,A2代入子神經(jīng)網(wǎng)絡(luò)模型f1計(jì)算得出B1;然后將f1的輸出元B1與原有的輸入元A1結(jié)合代入子神經(jīng)網(wǎng)絡(luò)模型f2進(jìn)行第2次運(yùn)算,得出B2;最后將B1和B2結(jié)合成{B1,B2}作為復(fù)合型神經(jīng)網(wǎng)絡(luò)的外部輸出。
2.5 復(fù)合型神經(jīng)網(wǎng)絡(luò)的外部結(jié)構(gòu)與內(nèi)部結(jié)構(gòu)
由復(fù)合型神經(jīng)網(wǎng)絡(luò)的外部結(jié)構(gòu)(如圖4)與內(nèi)部結(jié)構(gòu)(如圖5)可見(jiàn),復(fù)合型神經(jīng)網(wǎng)絡(luò)并沒(méi)有改變?cè)窠?jīng)網(wǎng)絡(luò)的外部輸入―輸出關(guān)系,僅僅改變了其內(nèi)部關(guān)系,而且對(duì)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、采取的訓(xùn)練算法,甚至是否采取神經(jīng)網(wǎng)絡(luò)方法也沒(méi)有作規(guī)定。對(duì)于具有復(fù)雜屬性依賴(lài)性的高維映射,可以采用多種系統(tǒng)(模糊推理系統(tǒng)、數(shù)學(xué)公式、混沌系統(tǒng)等)對(duì)其內(nèi)在的子映射進(jìn)行擬合。因此,屬性理論不僅對(duì)如何構(gòu)造最優(yōu)復(fù)合型神經(jīng)網(wǎng)絡(luò)提供了理論依據(jù),而且對(duì)復(fù)合型系統(tǒng)的建模提供了具有嚴(yán)格理論基礎(chǔ)的方法。
圖片
圖4 復(fù)合型神經(jīng)網(wǎng)絡(luò)的外部結(jié)構(gòu)
圖片
圖5 復(fù)合型神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)
2.6 神經(jīng)網(wǎng)絡(luò)的優(yōu)化算法的復(fù)雜度分析
本文以采取監(jiān)督選取中心法訓(xùn)練的RBF神經(jīng)網(wǎng)絡(luò)為研究對(duì)象,分析普通RBF與基于屬性依賴(lài)?yán)碚摰腞BF(ADO-RBF)的時(shí)間復(fù)雜度。
一般神經(jīng)網(wǎng)絡(luò)算法分為2個(gè)階段:訓(xùn)練階段與識(shí)別階段。
設(shè)Tt(m,n),Rt(m,n)為擬合m-n維映射的普通RBF的訓(xùn)練算法和識(shí)別算法的時(shí)間復(fù)雜度,ct為普通RBF中間層的中心數(shù),it為訓(xùn)練的迭代次數(shù);Ta(m,n),Ra(m,n)為ADO-RBF的訓(xùn)練算法和識(shí)別算法的時(shí)間復(fù)雜度,k為ADO-RBF的神經(jīng)網(wǎng)絡(luò)個(gè)數(shù),m1,m2,…,mk為ADO-RBF輸入層的輸入維度,c1,c2,…,ck分別為ADO-RBF中間層的中心數(shù),n1,n2,…,nk為ADO-RBF輸入層的輸出維度,i1,i2,…,ik為訓(xùn)練的迭代次數(shù),s為樣本個(gè)數(shù)。
經(jīng)過(guò)分析,普通RBF的訓(xùn)練階段分為修改權(quán)系數(shù)、學(xué)習(xí)中心、學(xué)習(xí)誤差3個(gè)步驟,并且每個(gè)步驟的時(shí)間復(fù)雜度皆為O(s•i•m•n•c),因此Tt(m,n)=O(s•m•n•it•ct)。由于ADO-RBF為復(fù)合型神經(jīng)網(wǎng)絡(luò),因此其時(shí)間復(fù)雜度Ta(m,n)=Os•∑kj=1ij•mj•nj•cj。由于經(jīng)過(guò)2.1~2.5節(jié)方法分析后的復(fù)合型神經(jīng)網(wǎng)絡(luò)必定滿足:
j∈N,j≤k,mj≤m,ij≤it,cj≤ct(10)
∑kj=1nj=n(11)
由式(10)和(11)可得Ta(m,n)=O(s•∑kj=1ij•mj•nj•cj)≤O(s•m•n•it•ct)=Tt(m,n)。因此,在訓(xùn)練階段,ADO-RBF優(yōu)于普通RBF。
而在識(shí)別階段,Rt(m,n)=O(i•m•n•c),Ra(m,n)=O(∑kj=1ij•mj•nj•cj)。同理,Ra(m,n)=O(∑kj=1ij•mj•nj•cj)≤O(i•m•n•c)=Rt(m,n)。因此,在識(shí)別階段,ADO-RBF也優(yōu)于普通RBF。
綜上所述,ADO-RBF的運(yùn)算時(shí)間比普通RBF要少。
3 實(shí)驗(yàn)和結(jié)果分析
為了驗(yàn)證神經(jīng)網(wǎng)絡(luò)的直接屬性依賴(lài)優(yōu)化法的性能,本文采用某公司中的軟件項(xiàng)目估算系統(tǒng)作為例子,結(jié)合RBF神經(jīng)網(wǎng)絡(luò),將結(jié)果與普通RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行比較。其中RBF的學(xué)習(xí)方法采用監(jiān)督選取中心進(jìn)行,并且中心個(gè)數(shù)為49個(gè),樣本數(shù)據(jù)為49個(gè)。
在軟件項(xiàng)目估算中,存在nг關(guān)系,包含12個(gè)屬性,分別為:1)項(xiàng)目序號(hào);2)項(xiàng)目名稱(chēng);3)項(xiàng)目規(guī)模;4)需求變更率;5)需求人員技能;6)原型化程度;7)編碼人員技能;8)測(cè)試用例總數(shù);9)評(píng)審工作量;10)測(cè)試人員技能;11)生產(chǎn)率;12)遺留缺陷密度[19]。其中{A1,A2,…,A10}為外輸入屬性集,{A11,A12}為外輸出屬性集,A11為轉(zhuǎn)換屬性。經(jīng)過(guò)專(zhuān)家的研究分析,軟件項(xiàng)目估算系統(tǒng)中存在2個(gè)直接屬性依賴(lài)關(guān)系:f1:{A3,A4,A5,A6,A7}D{A11},f2:{A3,A4,A8,A9,A10,A11}D{A12} [19],其直接依賴(lài)度分別為:d({A3,A4,A5,A6,A7},{A11})=1,d({A3,A4,A8,A9,A10,A11},{A12})=1。由此可得出復(fù)合型神經(jīng)網(wǎng)絡(luò)中的2個(gè)子模型f1與f2。由于2個(gè)子模型的融合度較低,因此直接采用2.4節(jié)中的復(fù)合型神經(jīng)網(wǎng)絡(luò)進(jìn)行歷史曲線擬合與估算。
圖6是ADO-RBF和RBF對(duì)軟件項(xiàng)目估算訓(xùn)練數(shù)據(jù)集的擬合性能比較,評(píng)價(jià)標(biāo)準(zhǔn)是誤差的絕對(duì)值之和??梢钥闯?RBF對(duì)訓(xùn)練數(shù)據(jù)的擬合程度并不理想,而 ADO-RBF不僅擬合程度高于RBF,而且學(xué)習(xí)效率也優(yōu)于 RBF(普通RBF的訓(xùn)練時(shí)間為15.39@s,而ADO-RBF為13.39@s)。
圖片
圖6 擬合性能比較
4 結(jié)語(yǔ)
本文提出了屬性依賴(lài)的概念、基本原理及其在神經(jīng)網(wǎng)絡(luò)的應(yīng)用,通過(guò)嚴(yán)格的定義與公式推演證明了相關(guān)的定理,并通過(guò)實(shí)例證明該理論在實(shí)際應(yīng)用的可行性。屬性依賴(lài)是函數(shù)依賴(lài)的進(jìn)一步推廣,其適用范圍并不局限于數(shù)據(jù)庫(kù)領(lǐng)域,其他領(lǐng)域(例如神經(jīng)網(wǎng)絡(luò)、主成分分析等)也適用。但當(dāng)前理論尚存在某些問(wèn)題,需要進(jìn)一步完善,包括:單元屬性集之間的直接依賴(lài)度的統(tǒng)計(jì)確定方法;具有循環(huán)依賴(lài)性的屬性關(guān)系圖的拓?fù)淝蠼夥椒?屬性集的主成分分析法等。
神經(jīng)網(wǎng)絡(luò)的屬性依賴(lài)優(yōu)化方法與其他的神經(jīng)網(wǎng)絡(luò)優(yōu)化方法不同,它以新的概念和理論作為支撐,并且容易與其他方法有機(jī)地結(jié)合使用。本文結(jié)合實(shí)例,采用了該優(yōu)化方法建立軟件項(xiàng)目估算模型,具有較高的估計(jì)精度。
參考文獻(xiàn):
[1]楊國(guó)為,王守覺(jué),閆慶旭. 分式線性神經(jīng)網(wǎng)絡(luò)及其非線性逼近能力研究[J].計(jì)算機(jī)學(xué)報(bào),2007,30(2):192-199.
[2]李寧,謝振華,謝俊元,等. SEFNN:一種基于結(jié)構(gòu)進(jìn)化的前饋神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)算法[J].計(jì)算機(jī)研究與發(fā)展,2006,43(10):1713-1718.
[3]馬銘,周春光,張利彪,等. 一種優(yōu)化模糊神經(jīng)網(wǎng)絡(luò)的多目標(biāo)微粒群算法[J].計(jì)算機(jī)研究與發(fā)展,2006,43(12):2104-2109.
[4]田大新,劉衍珩,李賓. 基于Hebb規(guī)則的分布神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法[J].計(jì)算機(jī)學(xué)報(bào),2007,30(8):1379-1388.
[5]凌錦江,周志華. 基于因果發(fā)現(xiàn)的神經(jīng)網(wǎng)絡(luò)集成方法[J].軟件學(xué)報(bào),2004,15(10): 1479-1484.
[6]王正群,陳世福,陳兆乾. 優(yōu)化分類(lèi)型神經(jīng)網(wǎng)絡(luò)線性集成[J].軟件學(xué)報(bào),2005,16(11):1902-1908.
[7]李凱,黃厚寬. 一種基于聚類(lèi)技術(shù)的選擇性神經(jīng)網(wǎng)絡(luò)集成方法[J].計(jì)算機(jī)研究與發(fā)展,2005,42(4):594-598.
[8]劉宇,覃征,盧江,等. 多模態(tài)粒子群集成神經(jīng)網(wǎng)絡(luò)[J].計(jì)算機(jī)研究與發(fā)展, 2005,42(9):1519-1526.
[9]李艷來(lái),王寬全,張大鵬. 多層前饋式神經(jīng)網(wǎng)絡(luò)的HJPS訓(xùn)練算法[J].計(jì)算機(jī)研究與發(fā)展,2005,42(10):1790-1795.
[10]許少華,何新貴,王兵. 一種分式過(guò)程神經(jīng)元網(wǎng)絡(luò)及其應(yīng)用研究[J].計(jì)算機(jī)研究與發(fā)展,2006,43(12):2088-2095.
[11]汪蔚,王榮杰,胡清. 基于PCA和神經(jīng)網(wǎng)絡(luò)的故障診斷技術(shù)[J].計(jì)算機(jī)工程,2008,34(7):184-185.
[12]蔣華剛,吳耿鋒. 基于人工免疫原理的RBF網(wǎng)絡(luò)預(yù)測(cè)模型[J].計(jì)算機(jī)工程,2008,34(2):202-205.
[13]邢進(jìn)生,劉人境. 基于加工工序的高維多輸入層神經(jīng)網(wǎng)絡(luò)及應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2004,24(2):64-67.
[14]JACOBSON N. Lectures in abstract algebra I: Basic concepts[M]. Berlin:Springer-Verlag,1951.
[15]DATE C J. An introduction to database systems[M].8th ed. New Jersey:Addison Wesley,2003.
[16]FELLAR W. An introduction to probability theory and its applications [M]. 3rd ed. New Jersey:Wiley,1968.
[17]阿黑波夫, 薩多夫尼齊, 丘巴里闊夫. 數(shù)學(xué)分析講義[M]. 王昆揚(yáng),譯.北京:高等教育出版社,2006.
[18]CORMEN T H, LEISERSON C E, RIVEST R L. Intruduction to algorithms[M]. 2nd ed. Cambridge:The MIT Press,2002.
[19]CAPERS J. Estimating software costs[M]. New York: McGraw Hill,2007.
[20]ASH R B, DOLEANS-DADE C A. Probability and measure theory[M]. 2nd ed. Salt Lake City:Academic Press,1999.
篇4
關(guān)鍵詞:網(wǎng)絡(luò)安全;入侵檢測(cè);常用技術(shù)
中圖分類(lèi)號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2011)12-2781-02
Discussion Intrusion Detection Several General Techniques
GAO Kai
(Department of Computer Science and Technology, Shaanxi University of Technology, Hanzhong 723001, China)
Abstract: Firewall, intrusion detection system as a reasonable supplement, has been in the network security plays a very important role. In this paper, the definition of intrusion detection technology, discusses the basic principles of intrusion detection, intrusion detection is discussed in detail several general techniques.
Key words: network security; intrusion detection; general techniques
網(wǎng)絡(luò)安全的本質(zhì)是要保障數(shù)據(jù)的保密性、完整性、可用性、可控性和不可否認(rèn)性。保密性指信息不泄露給非授權(quán)用戶(hù)、實(shí)體或過(guò)程;完整性指數(shù)據(jù)未經(jīng)授權(quán)不能被改變的特性;可用性指可被授權(quán)實(shí)體訪問(wèn)并按需求使用的特性;可控性指對(duì)信息的傳播及內(nèi)容具有控制能力;不可否認(rèn)性指保證任何一方無(wú)法抵賴(lài)自己曾經(jīng)做過(guò)的操作,從而防止中途欺騙。入侵檢測(cè)技術(shù)就是通過(guò)收集和分析網(wǎng)絡(luò)行為、安全日志、審計(jì)數(shù)據(jù)等安全信息,檢查計(jì)算機(jī)系統(tǒng)或網(wǎng)絡(luò)中是否存在違反安全策略的行為和被攻擊的跡象。
1 入侵檢測(cè)技術(shù)
入侵檢測(cè)系統(tǒng)IDS(Intrusion Detection Systems)是一種主動(dòng)保護(hù)自己免受攻擊的一種網(wǎng)絡(luò)安全技術(shù)。作為防火墻的合理補(bǔ)充,入侵檢測(cè)技術(shù)能夠幫助系統(tǒng)對(duì)付網(wǎng)絡(luò)攻擊,擴(kuò)展了系統(tǒng)管理員的安全管理能力,提高了信息安全基礎(chǔ)結(jié)構(gòu)的完整性。
有效的入侵檢測(cè)系統(tǒng)應(yīng)該既能正確識(shí)別入侵行為,又能保障系統(tǒng)自身的安全并適應(yīng)網(wǎng)絡(luò)環(huán)境發(fā)展的需要。從數(shù)據(jù)處理的角度來(lái)看,入侵檢測(cè)系統(tǒng)是一個(gè)典型的數(shù)據(jù)處理過(guò)程,它通過(guò)對(duì)大量的系統(tǒng)審計(jì)數(shù)據(jù)進(jìn)行分析,來(lái)判斷被檢測(cè)的系統(tǒng)是否受到入侵攻擊。具體到系統(tǒng)的檢測(cè)機(jī)制,其實(shí)就是一個(gè)系統(tǒng)主體行為的分類(lèi)系統(tǒng),它需要把對(duì)系統(tǒng)具有惡意的行為從大量的系統(tǒng)行為中區(qū)分出來(lái)。而解決問(wèn)題的關(guān)鍵就是如何從已知的數(shù)據(jù)中獲得系統(tǒng)的正常行為知識(shí)或有關(guān)入侵行為的知識(shí)。顯然,在入侵檢測(cè)系統(tǒng)的研究領(lǐng)域中,相關(guān)的知識(shí)獲取技術(shù),諸如模式匹配、數(shù)據(jù)挖掘、神經(jīng)網(wǎng)絡(luò)等技術(shù)以及各種分類(lèi)算法的研究占有重要的地位,下面我們討論一下這幾種技術(shù):
2 入侵檢測(cè)的幾種常用技術(shù)
2.1 模式匹配技術(shù)
這是最簡(jiǎn)單、通用的入侵檢測(cè)方法:遍歷事件流是否存在己定義模式(類(lèi)似于殺毒程序的特征匹配),從而發(fā)現(xiàn)違背安全策略的行為。如“^ GET [^ls] *'/ etc/Passwd |s”是發(fā)出HTTP請(qǐng)求詢(xún)問(wèn)UNIX密碼文件,定義含有該命令信息的事件為入侵事件,當(dāng)觀察事件與該規(guī)則匹配時(shí)就認(rèn)定為入侵。其特點(diǎn)是原理簡(jiǎn)單、擴(kuò)展性好、檢測(cè)效率高,可以實(shí)時(shí)檢測(cè),但只能適用于比較簡(jiǎn)單的攻擊方式,并且誤報(bào)率高。隨著網(wǎng)絡(luò)傳輸速度的提高,目前急需解決的是快速匹配的問(wèn)題,著名的snort便采用這種檢測(cè)手段。
2.2 神經(jīng)網(wǎng)絡(luò)技術(shù)
一個(gè)神經(jīng)網(wǎng)本質(zhì)上是由大量計(jì)算單元(computational units)組成的,單元之間通過(guò)帶有權(quán)值的連接進(jìn)行交互,共同實(shí)現(xiàn)復(fù)雜的映射功能。初始階段,用正常的用戶(hù)歷史行為訓(xùn)練網(wǎng)絡(luò),網(wǎng)絡(luò)的輸入為用戶(hù)當(dāng)前輸入的命令和已經(jīng)執(zhí)行的N個(gè)命令。用戶(hù)執(zhí)行過(guò)的命令被神經(jīng)網(wǎng)絡(luò)用來(lái)預(yù)測(cè)用戶(hù)輸入的下一個(gè)命令,當(dāng)用這個(gè)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)不出某用戶(hù)正確的后繼命令,即在某種程度上表明了用戶(hù)行為與其輪廓框架的偏離,這時(shí)有異常事件發(fā)生。系統(tǒng)同時(shí)要提供對(duì)所定義的網(wǎng)絡(luò)結(jié)構(gòu)、連接的權(quán)值進(jìn)行修正的功能,根據(jù)新鮮的觀測(cè)值訓(xùn)練網(wǎng)絡(luò),允許其學(xué)習(xí)新的系統(tǒng)行為。神經(jīng)網(wǎng)絡(luò)方法對(duì)異常檢測(cè)來(lái)說(shuō)具有很多優(yōu)勢(shì):由于不使用固定的系統(tǒng)屬性集來(lái)定義用戶(hù)行為,因此屬性的選擇是無(wú)關(guān)的:神經(jīng)網(wǎng)絡(luò)對(duì)所選擇的系統(tǒng)度量(Metrics)也不要求滿足某種統(tǒng)計(jì)分布條件,因此,與傳統(tǒng)的統(tǒng)計(jì)分析相比,神經(jīng)網(wǎng)絡(luò)方法具備了非參量化統(tǒng)計(jì)分析的優(yōu)點(diǎn)。同時(shí)神經(jīng)網(wǎng)絡(luò)具有概括和抽象的能力,對(duì)不完整輸入信息具有一定程度的容錯(cuò)處理能力。
2.3 免疫技術(shù)
免疫系統(tǒng)最基本也是最重要的能力是識(shí)別“自勿非自我”(Self/ Nonself),即它能夠識(shí)別哪些屬于正常機(jī)體,不屬于正常的就認(rèn)為是異常。Forrest等人發(fā)現(xiàn):對(duì)一個(gè)特定的程序來(lái)說(shuō),其系統(tǒng)調(diào)用序列是相當(dāng)穩(wěn)定的,使用系統(tǒng)調(diào)用序列來(lái)識(shí)別“自我”,應(yīng)該可以滿足系統(tǒng)的需要。在系統(tǒng)的訓(xùn)練階段建立起反映正常行為的知識(shí)庫(kù),這里定義的模式以系統(tǒng)進(jìn)程為中心,有別于其它檢測(cè)系統(tǒng)中以用戶(hù)為中心的行為模式。在實(shí)際檢測(cè)過(guò)程中,收集各個(gè)特權(quán)進(jìn)程(Privilege Process)所產(chǎn)生的系統(tǒng)調(diào)用序列,與正常的行為模式相比較,偏離了正常模式的系統(tǒng)進(jìn)程被認(rèn)為是出現(xiàn)了異常。Forrest小組提出了短序列匹配算法,用于計(jì)算實(shí)際系統(tǒng)調(diào)用序列與正常序列模式的相似程度。
2.4 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘通常稱(chēng)之為知識(shí)發(fā)現(xiàn),是一種脫機(jī)知識(shí)創(chuàng)建過(guò)程。這些知識(shí)是隱含的、事先未知的、潛在的有用信息,提取的知識(shí)表示為規(guī)則、特征及模式等形式。其過(guò)程一般包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)開(kāi)采、知識(shí)評(píng)價(jià)和呈現(xiàn)。
數(shù)據(jù)挖掘技術(shù)適于從歷史行為數(shù)據(jù)中進(jìn)行數(shù)據(jù)提取,在入侵檢測(cè)系統(tǒng)中,可應(yīng)用于對(duì)用戶(hù)行為數(shù)據(jù)進(jìn)行特征的提取。其分析方法主要有以下4種:關(guān)聯(lián)分析,序列模式分析,分類(lèi)分析和聚類(lèi)分析。其中,關(guān)聯(lián)分析和序列分析方法可以發(fā)現(xiàn)隱藏在數(shù)據(jù)間的關(guān)系,提取出入侵者入侵行為之間的關(guān)聯(lián)特征,找出各種入侵行為之間的相關(guān)性。分類(lèi)分析方法可以在前兩項(xiàng)分析的基礎(chǔ)上,對(duì)具有不同的行為特征的入侵進(jìn)行分類(lèi),判斷入侵行為的可疑程度。聚類(lèi)分析根據(jù)一定的規(guī)則對(duì)用戶(hù)行為數(shù)據(jù)重新劃分,以此獲得更好的結(jié)果。
2.5 數(shù)據(jù)融合技術(shù)
隨著因特網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)規(guī)模也在不斷擴(kuò)大,IDS中的待處理數(shù)據(jù)也呈幾何級(jí)數(shù)增長(zhǎng)。于是海量數(shù)據(jù)處理問(wèn)題也正在成為IDS的關(guān)鍵問(wèn)題。而正在興起的數(shù)據(jù)融合技術(shù)為該問(wèn)題提供了較為良好的解決方案。
數(shù)據(jù)融合在這里是指我們?cè)贗DS中采用多種分析和檢測(cè)機(jī)制,針對(duì)系統(tǒng)中不同的安全信息進(jìn)行分析,并把它們的結(jié)果進(jìn)行融合和決策。這樣會(huì)有效提高系統(tǒng)檢測(cè)的正確率,降低虛帶率。入侵檢測(cè)中的數(shù)據(jù)融合問(wèn)題早已被人提出,并有一些組織致力于這方面的研究。
3 結(jié)束語(yǔ)
入侵檢測(cè)是對(duì)計(jì)算機(jī)和網(wǎng)絡(luò)資源上的惡意使用行為進(jìn)行識(shí)別和響應(yīng),它不僅檢測(cè)來(lái)自外部的入侵行為,同時(shí)也監(jiān)督內(nèi)部用戶(hù)的未授權(quán)活動(dòng)。本文主要闡述了目前網(wǎng)絡(luò)面臨的安全問(wèn)題、入侵檢測(cè)技術(shù)的基本概念、分析了常用的入侵檢測(cè),對(duì)今后進(jìn)一步研究入侵檢測(cè)技術(shù)有一定的指導(dǎo)意義。
參考文獻(xiàn):
[1] 付玉珍,張清華.計(jì)算機(jī)網(wǎng)絡(luò)入侵檢測(cè)技術(shù)研究進(jìn)展[J].茂名學(xué)院學(xué)報(bào),2007(6).
[2] 姚麗娟.網(wǎng)絡(luò)入侵檢測(cè)技術(shù)綜述[J].軟件導(dǎo)刊,2010(6).
[3] 何小虎.計(jì)算機(jī)網(wǎng)絡(luò)入侵檢測(cè)探討[J].科技信息,2010(14).
篇5
[關(guān)鍵詞]數(shù)據(jù)挖掘數(shù)據(jù)挖掘方法
隨著信息技術(shù)迅速發(fā)展,數(shù)據(jù)庫(kù)的規(guī)模不斷擴(kuò)大,產(chǎn)生了大量的數(shù)據(jù)。但大量的數(shù)據(jù)往往無(wú)法辨別隱藏在其中的能對(duì)決策提供支持的信息,而傳統(tǒng)的查詢(xún)、報(bào)表工具無(wú)法滿足挖掘這些信息的需求。因此,需要一種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)據(jù),并從中抽取有價(jià)值的潛在知識(shí),數(shù)據(jù)挖掘(DataMining)技術(shù)由此應(yīng)運(yùn)而生。
一、數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘是指從數(shù)據(jù)集合中自動(dòng)抽取隱藏在數(shù)據(jù)中的那些有用信息的非平凡過(guò)程,這些信息的表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等。它可幫助決策者分析歷史數(shù)據(jù)及當(dāng)前數(shù)據(jù),并從中發(fā)現(xiàn)隱藏的關(guān)系和模式,進(jìn)而預(yù)測(cè)未來(lái)可能發(fā)生的行為。數(shù)據(jù)挖掘的過(guò)程也叫知識(shí)發(fā)現(xiàn)的過(guò)程。
二、數(shù)據(jù)挖掘的方法
1.統(tǒng)計(jì)方法。傳統(tǒng)的統(tǒng)計(jì)學(xué)為數(shù)據(jù)挖掘提供了許多判別和回歸分析方法,常用的有貝葉斯推理、回歸分析、方差分析等技術(shù)。貝葉斯推理是在知道新的信息后修正數(shù)據(jù)集概率分布的基本工具,處理數(shù)據(jù)挖掘中的分類(lèi)問(wèn)題,回歸分析用來(lái)找到一個(gè)輸入變量和輸出變量關(guān)系的最佳模型,在回歸分析中有用來(lái)描述一個(gè)變量的變化趨勢(shì)和別的變量值的關(guān)系的線性回歸,還有用來(lái)為某些事件發(fā)生的概率建模為預(yù)測(cè)變量集的對(duì)數(shù)回歸、統(tǒng)計(jì)方法中的方差分析一般用于分析估計(jì)回歸直線的性能和自變量對(duì)最終回歸的影響,是許多挖掘應(yīng)用中有力的工具之一。
2.關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是一種簡(jiǎn)單,實(shí)用的分析規(guī)則,它描述了一個(gè)事物中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式,是數(shù)據(jù)挖掘中最成熟的主要技術(shù)之一。關(guān)聯(lián)規(guī)則在數(shù)據(jù)挖掘領(lǐng)域應(yīng)用很廣泛適合于在大型數(shù)據(jù)集中發(fā)現(xiàn)數(shù)據(jù)之間的有意義關(guān)系,原因之一是它不受只選擇一個(gè)因變量的限制。大多數(shù)關(guān)聯(lián)規(guī)則挖掘算法能夠無(wú)遺漏發(fā)現(xiàn)隱藏在所挖掘數(shù)據(jù)中的所有關(guān)聯(lián)關(guān)系,但是,并不是所有通過(guò)關(guān)聯(lián)得到的屬性之間的關(guān)系都有實(shí)際應(yīng)用價(jià)值,要對(duì)這些規(guī)則要進(jìn)行有效的評(píng)價(jià),篩選有意義的關(guān)聯(lián)規(guī)則。
3.聚類(lèi)分析。聚類(lèi)分析是根據(jù)所選樣本間關(guān)聯(lián)的標(biāo)準(zhǔn)將其劃分成幾個(gè)組,同組內(nèi)的樣本具有較高的相似度,不同組的則相異,常用的技術(shù)有分裂算法,凝聚算法,劃分聚類(lèi)和增量聚類(lèi)。聚類(lèi)方法適合于探討樣本間的內(nèi)部關(guān)系,從而對(duì)樣本結(jié)構(gòu)做出合理的評(píng)價(jià),此外,聚類(lèi)分析還用于對(duì)孤立點(diǎn)的檢測(cè)。并非由聚類(lèi)分析算法得到的類(lèi)對(duì)決策都有效,在運(yùn)用某一個(gè)算法之前,一般要先對(duì)數(shù)據(jù)的聚類(lèi)趨勢(shì)進(jìn)行檢驗(yàn)。
4.決策樹(shù)方法。決策樹(shù)學(xué)習(xí)是一種通過(guò)逼近離散值目標(biāo)函數(shù)的方法,通過(guò)把實(shí)例從根結(jié)點(diǎn)排列到某個(gè)葉子結(jié)點(diǎn)來(lái)分類(lèi)實(shí)例,葉子結(jié)點(diǎn)即為實(shí)例所屬的分類(lèi)。樹(shù)上的每個(gè)結(jié)點(diǎn)說(shuō)明了對(duì)實(shí)例的某個(gè)屬性的測(cè)試,該結(jié)點(diǎn)的每一個(gè)后繼分支對(duì)應(yīng)于該屬性的一個(gè)可能值,分類(lèi)實(shí)例的方法是從這棵樹(shù)的根結(jié)點(diǎn)開(kāi)始,測(cè)試這個(gè)結(jié)點(diǎn)指定的屬性,然后按照給定實(shí)例的該屬性值對(duì)應(yīng)的樹(shù)枝向下移動(dòng)。決策樹(shù)方法是要應(yīng)用于數(shù)據(jù)挖掘的分類(lèi)方面。
5.神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)建立在自學(xué)習(xí)的數(shù)學(xué)模型基礎(chǔ)之上,能夠?qū)Υ罅繌?fù)雜的數(shù)據(jù)進(jìn)行分析,并可以完成對(duì)人腦或其他計(jì)算機(jī)來(lái)說(shuō)極為復(fù)雜的模式抽取及趨勢(shì)分析,神經(jīng)網(wǎng)絡(luò)既可以表現(xiàn)為有指導(dǎo)的學(xué)習(xí)也可以是無(wú)指導(dǎo)聚類(lèi),無(wú)論哪種,輸入到神經(jīng)網(wǎng)絡(luò)中的值都是數(shù)值型的。人工神經(jīng)元網(wǎng)絡(luò)模擬人腦神經(jīng)元結(jié)構(gòu),建立三大類(lèi)多種神經(jīng)元網(wǎng)絡(luò),具有非線形映射特性、信息的分布存儲(chǔ)、并行處理和全局集體的作用、高度的自學(xué)習(xí)、自組織和自適應(yīng)能力的種種優(yōu)點(diǎn)。
6.遺傳算法。遺傳算法是一種受生物進(jìn)化啟發(fā)的學(xué)習(xí)方法,通過(guò)變異和重組當(dāng)前己知的最好假設(shè)來(lái)生成后續(xù)的假設(shè)。每一步,通過(guò)使用目前適應(yīng)性最高的假設(shè)的后代替代群體的某個(gè)部分,來(lái)更新當(dāng)前群體的一組假設(shè),來(lái)實(shí)現(xiàn)各個(gè)個(gè)體的適應(yīng)性的提高。遺傳算法由三個(gè)基本過(guò)程組成:繁殖(選擇)是從一個(gè)舊種群(父代)選出生命力強(qiáng)的個(gè)體,產(chǎn)生新種群(后代)的過(guò)程;交叉〔重組)選擇兩個(gè)不同個(gè)體〔染色體)的部分(基因)進(jìn)行交換,形成新個(gè)體的過(guò)程;變異(突變)是對(duì)某些個(gè)體的某些基因進(jìn)行變異的過(guò)程。在數(shù)據(jù)挖掘中,可以被用作評(píng)估其他算法的適合度。
7.粗糙集。粗糙集能夠在缺少關(guān)于數(shù)據(jù)先驗(yàn)知識(shí)的情況下,只以考察數(shù)據(jù)的分類(lèi)能力為基礎(chǔ),解決模糊或不確定數(shù)據(jù)的分析和處理問(wèn)題。粗糙集用于從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)分類(lèi)規(guī)則的基本思想是將數(shù)據(jù)庫(kù)中的屬性分為條件屬性和結(jié)論屬性,對(duì)數(shù)據(jù)庫(kù)中的元組根據(jù)各個(gè)屬性不同的屬性值分成相應(yīng)的子集,然后對(duì)條件屬性劃分的子集與結(jié)論屬性劃分的子集之間上下近似關(guān)系生成判定規(guī)則。所有相似對(duì)象的集合稱(chēng)為初等集合,形成知識(shí)的基本成分。任何初等集合的并集稱(chēng)為精確集,否則,一個(gè)集合就是粗糙的(不精確的)。每個(gè)粗糙集都具有邊界元素,也就是那些既不能確定為集合元素,也不能確定為集合補(bǔ)集元素的元素。粗糙集理論可以應(yīng)用于數(shù)據(jù)挖掘中的分類(lèi)、發(fā)現(xiàn)不準(zhǔn)確數(shù)據(jù)或噪聲數(shù)據(jù)內(nèi)在的結(jié)構(gòu)聯(lián)系。
8.支持向量機(jī)。支持向量機(jī)(SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展出來(lái)的一種新的機(jī)器學(xué)習(xí)方法。它基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則上的,盡量提高學(xué)習(xí)機(jī)的泛化能力,具有良好的推廣性能和較好的分類(lèi)精確性,能有效的解決過(guò)學(xué)習(xí)問(wèn)題,現(xiàn)已成為訓(xùn)練多層感知器、RBF神經(jīng)網(wǎng)絡(luò)和多項(xiàng)式神經(jīng)元網(wǎng)絡(luò)的替代性方法。另外,支持向量機(jī)算法是一個(gè)凸優(yōu)化問(wèn)題,局部最優(yōu)解一定是全局最優(yōu)解,這些特點(diǎn)都是包括神經(jīng)元網(wǎng)絡(luò)在內(nèi)的其他算法所不能及的。支持向量機(jī)可以應(yīng)用于數(shù)據(jù)挖掘的分類(lèi)、回歸、對(duì)未知事物的探索等方面。
事實(shí)上,任何一種挖掘工具往往是根據(jù)具體問(wèn)題來(lái)選擇合適挖掘方法,很難說(shuō)哪種方法好,那種方法劣,而是視具體問(wèn)題而定。
三、結(jié)束語(yǔ)
目前,數(shù)據(jù)挖掘技術(shù)雖然得到了一定程度的應(yīng)用,并取得了顯著成效,但仍存在著許多尚未解決的問(wèn)題。隨著人們對(duì)數(shù)據(jù)挖掘技術(shù)的深人研究,數(shù)據(jù)挖掘技術(shù)必將在更加廣泛的領(lǐng)域得到應(yīng)用,并取得更加顯著的效果。
篇6
關(guān)鍵詞:智能控制 專(zhuān)家控制 模糊控制 神經(jīng)網(wǎng)絡(luò)控制 遺傳算法
1.引言
智能控制是自動(dòng)控制發(fā)展的高級(jí)階段,是人工智能、控制論、信息論、系統(tǒng)論、仿生學(xué)、進(jìn)化計(jì)算和計(jì)算機(jī)等多種學(xué)科的高度綜合與集成,是一門(mén)新興的邊緣交叉學(xué)科。智能控制是當(dāng)今國(guó)內(nèi)、外自動(dòng)化學(xué)科中的一個(gè)十分活躍和具有挑戰(zhàn)性的領(lǐng)域,代表著當(dāng)今科學(xué)和技術(shù)發(fā)展的最新方向之一。它不僅包含了自動(dòng)控制、人工智能、系統(tǒng)理論和計(jì)算機(jī)科學(xué)的內(nèi)容,而且還從生物學(xué)等學(xué)科汲取豐富的營(yíng)養(yǎng),正在成為自動(dòng)化領(lǐng)域中最興旺和發(fā)展最迅速的一個(gè)分支學(xué)科。
2.智能控制產(chǎn)生的背景
從控制理論學(xué)科發(fā)展的歷程來(lái)看,該學(xué)科的發(fā)展經(jīng)歷了三個(gè)主要階段。
第一階段為20世紀(jì)40—60年代的“經(jīng)典控制理論”時(shí)期,經(jīng)典控制理論以反饋理論為基礎(chǔ),是一種單回路線性控制理論。主要采用傳遞函數(shù)、頻率特性、根軌跡為基礎(chǔ)的頻率分析方法。主要研究單輸入一單輸出、線性定長(zhǎng)系統(tǒng)的分析和設(shè)計(jì)。
第二階段為20世紀(jì)60—70年代的“現(xiàn)代控制理論”時(shí)期,現(xiàn)代控制理論主要研究具有高性能、高精度的多變量參數(shù)系統(tǒng)的最優(yōu)控制問(wèn)題。采用的方法包括狀態(tài)空間法、bellman動(dòng)態(tài)規(guī)劃方法,kalman濾波理論和pontryagin極大值原理等?,F(xiàn)代控制理論可以解決多輸入多輸出問(wèn)題,系統(tǒng)可以是線性定長(zhǎng)的,也可以是非線性時(shí)變的。
第三階段為20世紀(jì)70年代至今的“大系統(tǒng)理論”和“智能控制理論”時(shí)期。由于現(xiàn)代控制理論過(guò)多地依賴(lài)對(duì)象的數(shù)學(xué)模型,其控制算法較為理想化,設(shè)計(jì)方法非常數(shù)字化,因此在面對(duì)難以用數(shù)學(xué)模型描述或者具有時(shí)變、非線性、不確定特性的復(fù)雜系統(tǒng)時(shí),現(xiàn)代控制系統(tǒng)也顯得無(wú)能為力。為了提高控制系統(tǒng)的品質(zhì)和尋優(yōu)能力,控制領(lǐng)域的研究人員開(kāi)始考慮把人工智能技術(shù)用于控制系統(tǒng)。近年來(lái),控制領(lǐng)域的研究人員把傳統(tǒng)的控制理論與模糊邏輯、神經(jīng)網(wǎng)絡(luò)、遺傳算法等智能技術(shù)相結(jié)合,充分利用人的經(jīng)驗(yàn)知識(shí)對(duì)復(fù)雜系統(tǒng)進(jìn)行控制,逐漸形成了智能控制這一新興學(xué)科。
3.智能控制的基本概念和特點(diǎn)
傳統(tǒng)的控制方法建立在被控對(duì)象的精確數(shù)學(xué)模型之上,智能控制是針對(duì)系統(tǒng)的復(fù)雜性、非線性、不確定性等提出來(lái)的。ieee控制系統(tǒng)協(xié)會(huì)把智能控制歸納為:智能控制系統(tǒng)必須具有模擬人類(lèi)學(xué)習(xí)和自適應(yīng)的能力。一個(gè)智能控制系統(tǒng)一般應(yīng)具有以下一些特點(diǎn)。
1)能對(duì)復(fù)雜系統(tǒng)(如非線性、多變量、時(shí)變、環(huán)境擾動(dòng)等)進(jìn)行有效的全局控制,并具有較強(qiáng)的容錯(cuò)能力;
2)具有以只是表示的非數(shù)學(xué)廣義模型和以數(shù)學(xué)模型表示的混合控制過(guò)程,能根據(jù)被控對(duì)象的動(dòng)態(tài)過(guò)程進(jìn)行辨識(shí),采用開(kāi)閉環(huán)控制和定性與定量相結(jié)合的多模態(tài)控制方式;
3)能對(duì)獲取的信息進(jìn)行實(shí)時(shí)處理并給出控制決策,通過(guò)不斷優(yōu)化參數(shù)和尋找控制器的最佳結(jié)構(gòu)形式,以獲得整體最優(yōu)控制性能。
4)具有自學(xué)習(xí)、自適應(yīng)、自組織能力,能從系統(tǒng)的功能和整體優(yōu)化的角度來(lái)分析和綜合系統(tǒng),以實(shí)現(xiàn)預(yù)期的控制目標(biāo)。
4.智能控制理論的基本內(nèi)容
4.1 專(zhuān)家控制(ec-expert control)
由人工智能領(lǐng)域發(fā)展起來(lái)的專(zhuān)家控制是一種基于知識(shí)的智能計(jì)算機(jī)程序的技術(shù)。專(zhuān)家控制的實(shí)質(zhì)是基于控制對(duì)象和控制規(guī)律的各種知識(shí),并且要以智能的方式利用這些知識(shí),以求得控制系統(tǒng)盡可能的優(yōu)化和實(shí)用化。專(zhuān)家系統(tǒng)一般由知識(shí)庫(kù)、推理機(jī)、解釋機(jī)制和知識(shí)獲取系統(tǒng)等組成。知識(shí)庫(kù)用于存儲(chǔ)某一領(lǐng)域?qū)<业慕?jīng)驗(yàn)性知識(shí)、原理性知識(shí)、可行操作與規(guī)則等??赏ㄟ^(guò)知識(shí)獲取系統(tǒng)對(duì)原有知識(shí)進(jìn)行修改和擴(kuò)充。推理機(jī)根據(jù)系統(tǒng)信息并利用知識(shí)庫(kù)中知識(shí)按一定的推理策略來(lái)解決當(dāng)前的問(wèn)題。解釋機(jī)制對(duì)找到的知識(shí)進(jìn)行解釋?zhuān)瑸橛脩?hù)提供了一個(gè)人機(jī)界面。專(zhuān)家控制的特點(diǎn)為:
1)具有領(lǐng)域?qū)<壹?jí)的專(zhuān)業(yè)知識(shí),能進(jìn)行符號(hào)處理和啟發(fā)式推理。
2)具有獲取知識(shí)能力,具有靈活性、透明性和交互性。
4.2模糊控制(fc-fuzzy control)
模糊控制是以模糊集合論、模糊邏輯推理和模糊語(yǔ)言變量為基礎(chǔ)的一種計(jì)算機(jī)數(shù)字控制。對(duì)于無(wú)法建立數(shù)學(xué)模型或難以建立數(shù)學(xué)模型的場(chǎng)合,可以用模糊控制技術(shù)來(lái)解決。模糊控制就是在被控對(duì)象模糊模型的基礎(chǔ)上,利用模糊控制器,采用推理的手段進(jìn)行系統(tǒng)控制的一種方法。模糊模型是用模糊語(yǔ)言和規(guī)則描述的一個(gè)系統(tǒng)的動(dòng)態(tài)特性及性能指標(biāo)。模糊控制器由模糊化、規(guī)則庫(kù)、模糊推理和清晰化四個(gè)功能模塊組成。模糊化模塊實(shí)現(xiàn)對(duì)系統(tǒng)變量論域的模糊劃分和對(duì)清晰輸入值的模糊化處理。規(guī)則庫(kù)用于存儲(chǔ)系統(tǒng)的基于語(yǔ)言變量的控制規(guī)則和系統(tǒng)參數(shù)。模糊推理是一種從輸入空間到輸出空間的非線性映射關(guān)系,控制規(guī)則形式為if{控制輸入a}then{控制輸出b},即如果已知控制輸入a,則通過(guò)模糊推理得出控制輸出b。清晰化模塊將推出的模糊推理推出的控制輸出轉(zhuǎn)化為清晰的輸出值。模糊控制的特點(diǎn)為:
1)提供了一種實(shí)現(xiàn)基于自然語(yǔ)言描述規(guī)則的控制規(guī)律的新機(jī)制。
2)提供了一種非線性控制器,這種控制器一般用于控制含有不確定性和難以用傳統(tǒng)非線性理論處理的場(chǎng)合。
4.3 神經(jīng)網(wǎng)絡(luò)控制(nnc-neural networks control)
神經(jīng)網(wǎng)絡(luò)控制是在控制系統(tǒng)中采用神經(jīng)網(wǎng)絡(luò)這一工具,對(duì)難以通過(guò)常規(guī)方法進(jìn)行描述的復(fù)雜非線性對(duì)象進(jìn)行建模,或充當(dāng)控制器,或信息處理,或模式識(shí)別,或故障診斷等,或以上幾種功能的組合,這種神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)的控制方式即為神經(jīng)網(wǎng)絡(luò)控制。神經(jīng)網(wǎng)絡(luò)控制采用仿生學(xué)的觀點(diǎn)對(duì)智能系統(tǒng)中的高級(jí)信息處理問(wèn)題進(jìn)行研究,神經(jīng)網(wǎng)絡(luò)控制的特點(diǎn)為:
1)能充分逼近任意非線性特性。
2)分布式并行處理機(jī)制。
3)自學(xué)習(xí)和自適應(yīng)能力。
4)數(shù)據(jù)融合能力。
5)適合于多變量系統(tǒng),可進(jìn)行多變量處理。
4.4 遺傳算法(ga-genetic algorithm)
遺傳算法是一種基于生物進(jìn)化模擬的啟發(fā)式智能算法,它的基本策略是:將待優(yōu)化函數(shù)的自變量編碼成類(lèi)似基因的離散數(shù)值碼,然后通過(guò)類(lèi)似基因進(jìn)化的交叉、變異、繁殖等操作獲得待優(yōu)化函數(shù)的最優(yōu)或近似最優(yōu)解。在智能控制中,遺傳算法廣泛應(yīng)用于各類(lèi)優(yōu)化問(wèn)題,遺傳算法可以用于復(fù)雜的非線性系統(tǒng)的辨識(shí),多變量系統(tǒng)控制規(guī)則的優(yōu)化,智能控制參數(shù)的優(yōu)化等常規(guī)控制方法難以奏效的問(wèn)題。遺傳算法具有可擴(kuò)展性,可以同專(zhuān)家系統(tǒng)、模糊控制和神經(jīng)網(wǎng)絡(luò)結(jié)合,為智能控制的研究注入新的活力。如可用遺傳算法對(duì)模糊控制的控制規(guī)則和隸屬度函數(shù)進(jìn)行優(yōu)化,對(duì)神經(jīng)網(wǎng)絡(luò)的權(quán)值進(jìn)行優(yōu)化等。遺傳算法的特點(diǎn)為:
1)以決策變量的編碼作為運(yùn)算對(duì)象。
2)直接以目標(biāo)函數(shù)值作為搜索信息。
3)同時(shí)進(jìn)行解空間的多點(diǎn)搜索。
4)使用自適應(yīng)的概率搜索技術(shù)。
5.結(jié)束語(yǔ)
智能控制已廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)、軍事等眾多領(lǐng)域,已經(jīng)解決了大量的傳統(tǒng)控制無(wú)法解決的實(shí)際控制應(yīng)用問(wèn)題,呈現(xiàn)出強(qiáng)大的生命力和發(fā)展前景。它將隨著專(zhuān)家系統(tǒng)、模糊控制、神經(jīng)網(wǎng)絡(luò)等控制技術(shù)的發(fā)展而不斷發(fā)展。
參考文獻(xiàn):
[1]師黎,陳鐵軍,李曉媛等,智能控制理論及應(yīng)用[m].北京:清華大學(xué)出版社.2009.
[2]黃志高,徐成金,譚斌.智能控制理論綜述[j].土木機(jī)床,2004 (3):30-32.
[3]宋勝利.智能控制技術(shù)概論[m].北京:國(guó)防工業(yè)出版社,2008.
[4]王永驥,涂健,神經(jīng)元網(wǎng)絡(luò)控制[m].北京:機(jī)械工業(yè)出版社,1998.
[5] rubaai a,kotaru r,kankam m d.a continually online - trained neural network controller for brushless dc motor drives [j].lndustry applications,ieee transactions ,2000 ,36(2):475 - 483.
篇7
關(guān)鍵詞:智能控制;應(yīng)用;探討;
前言:
隨著時(shí)代的發(fā)展,科學(xué)技術(shù)的進(jìn)步,計(jì)算機(jī)技術(shù)已經(jīng)逐漸成為人們?nèi)粘I钪胁豢煞指畹囊徊糠?,而自人工智能的概念被提出后,各?guó)將更多的精力投入到智能的研究上,隨著信息化時(shí)代的到來(lái),自動(dòng)化技術(shù)與智能控制技術(shù)的結(jié)合越來(lái)越符合當(dāng)前工業(yè)的發(fā)展。智能控制作為以眾多學(xué)科為基礎(chǔ)的過(guò)程控制中最為重要的一部分,在社會(huì)上的各行各業(yè)都有著十分重要的作用。除此之外,智能控制同樣是當(dāng)今社會(huì)處于前沿的科學(xué)技術(shù),因此,如何將智能控制更好地應(yīng)用于實(shí)際具有十分重要的社會(huì)意義。
1 智能控制綜述
隨著科學(xué)技術(shù)的發(fā)展,人們生活質(zhì)量的提高,對(duì)工業(yè)生產(chǎn)的需求越來(lái)越旺盛,從而導(dǎo)致了過(guò)程控制也就是控制科學(xué)這一項(xiàng)技術(shù)的誕生。智能控制是指通過(guò)控制智能機(jī)器完成目標(biāo)的控制過(guò)程,智能控制作為控制過(guò)程的重要組成部分,隨著各界人士不斷的鉆研,目前智能控制的理論已相對(duì)成熟。智能控制是人工智能、控制論、信息論與運(yùn)籌學(xué)等技術(shù)相互交叉所形成的符合當(dāng)展的一項(xiàng)新型的理論與技術(shù),也因此其應(yīng)用領(lǐng)域正在不斷的擴(kuò)大。目前主要通過(guò)兩種研究方法來(lái)研究智能控制,提高智能控制所具備的一些能力,如學(xué)習(xí)能力、組織綜合能力、適應(yīng)能力以及優(yōu)化能力,從而保證智能控制能更好地發(fā)揮其相應(yīng)的社會(huì)作用。
2 智能控制所采用的手段
2.1 專(zhuān)家控制
專(zhuān)家控制其實(shí)就是將專(zhuān)家系統(tǒng)引入控制領(lǐng)域的一種新型的智能控制,而隨著時(shí)間的發(fā)展,專(zhuān)家控制逐漸成為智能控制的重要組成部分。專(zhuān)家系統(tǒng)通過(guò)知識(shí)庫(kù)采集相關(guān)知識(shí)進(jìn)行推理,從而使專(zhuān)家控制能最大限度地模仿專(zhuān)家的經(jīng)驗(yàn)推理出解決對(duì)策以及方案,專(zhuān)家控制最大的優(yōu)點(diǎn)便是它是通過(guò)各種知識(shí)進(jìn)行推理從而得出最終的解決對(duì)策,而不是通過(guò)一個(gè)固定的規(guī)則或數(shù)據(jù)模型得到的結(jié)果。目前專(zhuān)家系統(tǒng)的應(yīng)用極其廣泛,但是仍有許多問(wèn)題值得進(jìn)一步的研究,以便專(zhuān)家控制系統(tǒng)具備自主學(xué)習(xí)能力,從而能使智能控制更加完善。
2.2 模糊控制
自1956年模糊控制被第一次提出以后,就成為了智能控制中的重要組成部分,并被廣泛地應(yīng)用于實(shí)際中。模糊控制相對(duì)于其它智能控制手段最主要的特點(diǎn)就是算法簡(jiǎn)單、執(zhí)行速度快、容易實(shí)現(xiàn)目標(biāo),也因此,模糊控制被廣泛地應(yīng)用于較為復(fù)雜的領(lǐng)域解決較為復(fù)雜的問(wèn)題。所謂的模糊控制是基于模糊推理等理論,從而使機(jī)器能以較為接近人類(lèi)思維的語(yǔ)言邏輯進(jìn)行分析,從而控制系統(tǒng)進(jìn)行工作,以便達(dá)到無(wú)人控制的目標(biāo)。到目前為止,雖然作為智能控制的重要組成部分的模糊控制已經(jīng)發(fā)展得相當(dāng)不錯(cuò)了,但是仍然存在著一定的問(wèn)題需要改善。
2.3 神經(jīng)網(wǎng)絡(luò)控制
所謂的神經(jīng)網(wǎng)路控制就是將神經(jīng)系統(tǒng)融入智能控制中,是基于結(jié)構(gòu)模擬人腦生理結(jié)構(gòu)而形成的智能控制和辨識(shí)方法,其中BP網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)控制的主要網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)控制在控制領(lǐng)域具有十分重要的作用,這主要是因?yàn)樯窠?jīng)網(wǎng)絡(luò)控制在理論上是非線性函數(shù)且能執(zhí)行并行分布處理,具有較強(qiáng)的學(xué)習(xí)能力與適應(yīng)能力,可以進(jìn)行多變量的處理。但是神經(jīng)網(wǎng)絡(luò)控制同樣具有不可忽視的缺陷,目前正在進(jìn)一步研發(fā)將神經(jīng)網(wǎng)絡(luò)理論應(yīng)用到具體的控制系統(tǒng),以便提高智能控制的性能。
2.4 混沌控制
混沌控制同樣也是智能控制的重要組成部分,于1963年被氣象學(xué)家所提出,是非線性動(dòng)力系統(tǒng)的理論,而且由于混沌控制在工業(yè)上所具有的重要應(yīng)用價(jià)值,使得混沌控制成為了當(dāng)代社會(huì)的重要研究方向。目前常用的混沌控制方法包括OGY法、連續(xù)反饋控制法等控制方法。混沌,顧名思義就是在確定的系統(tǒng)中出現(xiàn)的貌似隨機(jī)的現(xiàn)象,是一種十分普遍的運(yùn)動(dòng)情況。近幾年,混沌控制逐漸成為了非線性系統(tǒng)領(lǐng)域重點(diǎn)研究對(duì)象,但是由于其發(fā)展時(shí)間較短,仍舊需要進(jìn)一步的研究。
3 智能控制的應(yīng)用
3.1 智能機(jī)器人
智能控制現(xiàn)階段被廣泛地應(yīng)用于各個(gè)領(lǐng)域。自人工智能理念被提出以后,智能機(jī)器人的研究便成為了各界學(xué)者關(guān)注的重點(diǎn),而現(xiàn)在的智能機(jī)器人研究相對(duì)成熟,主要是因?yàn)橘x予“思維能力”的相應(yīng)控制系統(tǒng)十分完善,能準(zhǔn)確地對(duì)周?chē)沫h(huán)境等情況進(jìn)行檢測(cè),同時(shí)進(jìn)行定位,而智能控制系統(tǒng)強(qiáng)大的學(xué)習(xí)能力也提高了智能機(jī)器人對(duì)環(huán)境的適應(yīng)能力。目前智能機(jī)器人在社會(huì)上有著十分廣泛的應(yīng)用,其中多數(shù)都是危險(xiǎn)作業(yè),如挖礦、水下運(yùn)載器、水下無(wú)人機(jī)等的作業(yè)都是通過(guò)智能控制實(shí)現(xiàn)的。
3.2 智能監(jiān)控
智能監(jiān)控是智能控制的主要應(yīng)用領(lǐng)域。在工業(yè)生產(chǎn)中,智能監(jiān)控是必不可少的,這主要是為了保證加工的效率和準(zhǔn)確度,同時(shí)由于目前將智能控制技術(shù)與自動(dòng)化技術(shù)相結(jié)合以成為工業(yè)生產(chǎn)的主要方式,而利用智能控制不僅可以提高控制精度與工作效率,避免了工作人員的操作,降低了操作的難度,避免了客觀因素對(duì)電氣設(shè)備的干擾,提高了電氣設(shè)備的自動(dòng)化程度,促進(jìn)了工業(yè)的發(fā)展。除此之外,智能控制同樣被應(yīng)用行器的過(guò)程控制以及醫(yī)療過(guò)程控制中,從而保證飛行器的飛行安全,合理地評(píng)估用藥,可以看出智能監(jiān)控對(duì)社會(huì)的發(fā)展十分重要。
3.3 智能檢測(cè)
設(shè)備具有一定的使用壽命,并且極易受到外界因素的干擾,從而降低機(jī)器的使用壽命,造成大量的損失,因此必須采取一定的措施延長(zhǎng)設(shè)備預(yù)期使用壽命,而智能檢測(cè)在這方面具有得天獨(dú)厚的優(yōu)點(diǎn)。智能檢測(cè)是通過(guò)合理的分析設(shè)備所運(yùn)行的情況,從而判斷設(shè)備可能出現(xiàn)故障的地方及原因,并發(fā)出警告,以便維修人員能及時(shí)地檢修,及時(shí)地排除故障,從而保障設(shè)備的正常運(yùn)行,延長(zhǎng)機(jī)器的使用壽命,并在一定程度上降低損失。目前智能故障檢測(cè)廣泛地應(yīng)用于雷達(dá)以及火電站鍋爐給水過(guò)程等方面。
3.4 智能儀器
隨著電子技術(shù)的發(fā)展,微電子元件具有十分廣闊的市場(chǎng),而隨著微電子元件的發(fā)展,人工智能與智能控制技術(shù)正朝著更高的集成化、網(wǎng)絡(luò)化、模塊化的方向發(fā)展,從而與工業(yè)生產(chǎn)相結(jié)合,形成自動(dòng)化程度更高的設(shè)備,從而實(shí)現(xiàn)無(wú)人控制與遠(yuǎn)程控制的目標(biāo)。
4 智能控制的應(yīng)用前景
到現(xiàn)在為止,智能控制的發(fā)展歷史極其短暫,僅僅只有六十年,但是在這短短的六十年間,智能控制逐漸成為了各個(gè)領(lǐng)域的主要應(yīng)用技術(shù)。雖然智能控制的發(fā)展十分迅速,但是由于發(fā)展時(shí)間較短,仍然存在很多的問(wèn)題,因此需要加強(qiáng)對(duì)智能控制的研究,從而使其應(yīng)用更為安全且廣泛。這就需要相關(guān)的學(xué)者繼續(xù)完善智能控制的相關(guān)理論,并且在一定程度上提高智能控制系統(tǒng)的穩(wěn)定性、可控性等性能,并且解決當(dāng)前智能控制中所遇到的問(wèn)題,從而使智能控制應(yīng)用于更廣的領(lǐng)域。
5 結(jié)語(yǔ)
綜上所述,隨著經(jīng)濟(jì)的發(fā)展,科學(xué)技術(shù)的進(jìn)步,當(dāng)今社會(huì)的IT行業(yè)正處于蓬勃發(fā)展的時(shí)期,而智能控制更是基于人工智能理論所衍生的更符合當(dāng)今社會(huì)發(fā)展的一項(xiàng)新型的學(xué)科。人工智能控制是一項(xiàng)基于運(yùn)籌學(xué)、人工智能以及控制理論等所衍生的一項(xiàng)交叉技術(shù),目前為止,應(yīng)用最為廣泛的智能控制手段包括模糊控制、專(zhuān)家控制、神經(jīng)網(wǎng)絡(luò)控制以及混沌控制,并且逐漸在社會(huì)中發(fā)揮著重要的作用,從而為我國(guó)的發(fā)展做出一份貢獻(xiàn)。
參考文獻(xiàn)
篇8
人工智能作為一門(mén)課程[1],開(kāi)設(shè)時(shí)間距今只有40多年,但發(fā)展極為迅猛。人工智能課程的內(nèi)容涉及計(jì)算機(jī)科學(xué)、數(shù)學(xué)、系統(tǒng)科學(xué)、控制科學(xué)、信息科學(xué)、心理學(xué)、電子學(xué)、生物學(xué)、語(yǔ)言學(xué)等等,幾乎所有科學(xué)工作者都可以在人工智能中找到自己感興趣的問(wèn)題。目前,國(guó)內(nèi)外已有眾多高校指定人工智能為計(jì)算機(jī)科學(xué)與技術(shù)及其相關(guān)專(zhuān)業(yè)的主修專(zhuān)業(yè)基礎(chǔ)課程,它在拓展計(jì)算機(jī)和自動(dòng)控制的研究和應(yīng)用領(lǐng)域方面有著極其誘人的學(xué)科發(fā)展前景。自2003年起,國(guó)內(nèi)諸多高等院校陸續(xù)開(kāi)設(shè)“智能科學(xué)與技術(shù)”本科專(zhuān)業(yè),同時(shí)也有更多高校在傳統(tǒng)信息類(lèi)專(zhuān)業(yè)中加大了人工智能課程的課時(shí)比重,因此如何提高人工智能課程的教學(xué)質(zhì)量顯得尤為重要。?
本文結(jié)合人工智能課程的特點(diǎn)以及自己教學(xué)與研究的實(shí)踐,對(duì)本課程的教學(xué)進(jìn)行一些探討,以期改進(jìn)人工智能課程教學(xué)方法,達(dá)到提高本課程教學(xué)質(zhì)量的目的。??
一、兼顧課程內(nèi)容的統(tǒng)一性和差異性??
人工智能課程的核心內(nèi)容主要集中在對(duì)基本概念、基本原理、基本方法和重要算法及其應(yīng)用的認(rèn)識(shí)和理解上,盡管各種基本概念、原理、方法和算法在一定程度上自成體系,但是它們之間又存在著許多內(nèi)在聯(lián)系和規(guī)律。從這一點(diǎn)來(lái)看,人工智能課程與其他很多計(jì)算機(jī)課程是不同的,這就要求人工智能課程的授課要具有自己的特色。?
知識(shí)表示、知識(shí)推理、知識(shí)應(yīng)用是人工智能課程的三大內(nèi)容,解決任何一個(gè)人工智能問(wèn)題都離不開(kāi)兩個(gè)步驟,即知識(shí)表示和問(wèn)題求解。由此,人工智能課程從總體結(jié)構(gòu)上就有了一個(gè)比較清晰的脈絡(luò),即首先必然要學(xué)習(xí)各種知識(shí)表示方法,然后是利用這些知識(shí)進(jìn)行推理,進(jìn)而實(shí)現(xiàn)知識(shí)應(yīng)用,最終達(dá)到問(wèn)題求解的目的。問(wèn)題求解又分為基本的問(wèn)題求解方法和高級(jí)問(wèn)題求解方法。圖搜索策略、啟發(fā)式搜索、消解原理以及規(guī)則演繹系統(tǒng)等都屬于基本的問(wèn)題求解方法。計(jì)算智能、專(zhuān)家系統(tǒng)、機(jī)器學(xué)習(xí)、自動(dòng)規(guī)劃等屬于高級(jí)問(wèn)題求解方法。?
同時(shí),人工智能課程某些章節(jié)或者某些方法算法在一定程度上又自成體系。例如,各種不同的知識(shí)表示方法不管是數(shù)據(jù)結(jié)構(gòu)還是表示形式都完全不相同。又例如,人工智能有許多不同的學(xué)派[2],本課程往往同時(shí)會(huì)介紹不同學(xué)派的算法,這些學(xué)派在人工智能的基礎(chǔ)理論和方法、技術(shù)路線等方面是完全不同的,甚至是對(duì)立的。?
這些都要求我們?cè)诮虒W(xué)過(guò)程中不僅要強(qiáng)調(diào)人工智能課程理論的統(tǒng)一性和完整性,又要兼顧各學(xué)派的特點(diǎn),尊重甚至調(diào)動(dòng)學(xué)生們對(duì)不同人工智能學(xué)派及其方法的興趣。在編寫(xiě)和選用教材時(shí)也要注重這一點(diǎn),我們選用的是蔡自興教授編寫(xiě)的《人工智能及其應(yīng)用》系列教材[1,2],該教材以邏輯主義學(xué)派為主線,兼顧引進(jìn)其他學(xué)派的精華內(nèi)容,具有較強(qiáng)的科學(xué)性。
??二、實(shí)施分層次教學(xué)??
各高校一般同時(shí)為計(jì)算機(jī)相關(guān)專(zhuān)業(yè)的本科生和研究生開(kāi)設(shè)了人工智能課程,甚至有的非計(jì)算機(jī)類(lèi)專(zhuān)業(yè)也開(kāi)設(shè)有人工智能課程。不同層次的學(xué)生對(duì)人工智能課程要求掌握的程度不同,我們首先明確本科生和研究生以及非計(jì)算機(jī)類(lèi)專(zhuān)業(yè)學(xué)生的教學(xué)目的和教學(xué)內(nèi)容,做到分層次設(shè)計(jì)人工智能課程教學(xué)?過(guò)程。?
本科階段的人工智能課程課時(shí)量較少,本科層次只需要做到對(duì)大部分人工智能概念和算法了解、認(rèn)識(shí),少部分達(dá)到理解層次。本科生一般都是在高年級(jí)(三年級(jí)下期或者四年級(jí)上期)開(kāi)設(shè)人工智能課程,這時(shí)已有不少學(xué)生準(zhǔn)備繼續(xù)讀研或者已經(jīng)被保研,因此在兼顧全體學(xué)生教學(xué)層次的同時(shí),要注意給這部分學(xué)生足夠的相關(guān)參考書(shū)目,讓他們能夠利用課余時(shí)間廣泛深入了解人工智能相關(guān)算法,老師在課后還應(yīng)和他們進(jìn)行充分討論,培養(yǎng)他們對(duì)人工智能的特別興趣。?
非計(jì)算機(jī)類(lèi)專(zhuān)業(yè)的學(xué)生往往需要學(xué)習(xí)如何利用人工智能知識(shí)解決該專(zhuān)業(yè)領(lǐng)域內(nèi)的問(wèn)題,因此在教學(xué)中要盡量有專(zhuān)業(yè)針對(duì)性地進(jìn)行教學(xué)。例如針對(duì)農(nóng)科類(lèi)專(zhuān)業(yè),在教學(xué)專(zhuān)家系統(tǒng)過(guò)程中,我們要求學(xué)生參考北京農(nóng)業(yè)信息技術(shù)研究中心開(kāi)發(fā)的農(nóng)業(yè)專(zhuān)家系統(tǒng)開(kāi)發(fā)平臺(tái)(paid5?0)理解并開(kāi)發(fā)與本專(zhuān)業(yè)領(lǐng)域相關(guān)的簡(jiǎn)易農(nóng)業(yè)專(zhuān)家系統(tǒng)。?
給研究生開(kāi)設(shè)人工智能課程要求做到概念理解,基本算法精通,即要求全面、系統(tǒng)地掌握人工智能的基本概念、基本原理、典型方法和若干應(yīng)用實(shí)例,并且能靈活運(yùn)用所學(xué)知識(shí)闡述解決實(shí)際問(wèn)題的方法和途徑。課程教學(xué)中要致力于培養(yǎng)學(xué)生分析問(wèn)題與解決問(wèn)題的能力,要求研究生將人工智能方法與自己的研究方向相結(jié)合,用人工智能方法解決所研究課題中的實(shí)際問(wèn)題,并撰寫(xiě)相關(guān)的課程論文,以小型研討會(huì)的形式進(jìn)行報(bào)告交流。實(shí)踐證明,我們的研究生的人工智能教學(xué)效果明顯提升,成效突出。
??三、案例驅(qū)動(dòng),寓教于樂(lè)??
采用案例教學(xué)是為了充分調(diào)動(dòng)學(xué)生的學(xué)習(xí)興趣,增強(qiáng)學(xué)生學(xué)習(xí)的自覺(jué)性[3]。通過(guò)案例教學(xué)能把枯燥的人工智能理論知識(shí)具體化、形象化,可以使學(xué)生更加感性地理解課堂教學(xué)內(nèi)容。這些案例都是以教師所從事的科研項(xiàng)目中的實(shí)際應(yīng)用環(huán)境為背景進(jìn)行闡述的,讓學(xué)生能在實(shí)際環(huán)境中理解概念和知識(shí),學(xué)會(huì)利用人工智能知識(shí)去分析和解決實(shí)際問(wèn)題。在教學(xué)過(guò)程中要選擇學(xué)生容易接受的案例,體現(xiàn)理論聯(lián)系實(shí)際的特色,激發(fā)學(xué)生的興趣。?
例如,在講授“計(jì)算智能”內(nèi)容時(shí),我們結(jié)合黃河三門(mén)峽和小浪底水庫(kù)水沙聯(lián)合智能調(diào)度系統(tǒng)[4]進(jìn)行講解。綜合三門(mén)峽水庫(kù)和小浪底水庫(kù)防洪運(yùn)用的基本原則、歷年調(diào)度方案、專(zhuān)家的經(jīng)驗(yàn)、歷年數(shù)據(jù)和現(xiàn)有的調(diào)水調(diào)沙數(shù)學(xué)模型,分別利用模糊決策、神經(jīng)網(wǎng)絡(luò)、遺傳算法及綜合集成方法來(lái)實(shí)現(xiàn)三門(mén)峽、小浪底水庫(kù)水沙聯(lián)合調(diào)度。?
又例如為了讓學(xué)生走近機(jī)器人,我們進(jìn)行了一場(chǎng)機(jī)器人展示課,將研究所現(xiàn)有的MOROCS?1(中南一號(hào)智能移動(dòng)機(jī)器人)、ASR(廣茂達(dá))、AmigoBot(自主移動(dòng)機(jī)器人)、CanDroid(罐頭機(jī)器人)、MD?375 Rover(人控漫游車(chē))、Fokker D7(人控飛機(jī),1:72)、Rockit OWI?769K(聲按、壓控火牛機(jī)器人)、Hexapod Monster(六足爬行機(jī)器人)、Hubo(多機(jī)能歌舞機(jī)器人)等各類(lèi)機(jī)器人全部拿出來(lái)給學(xué)生做了功能演示[5]。親眼看到這么多機(jī)器人,同學(xué)們都非常興奮,對(duì)人工智能課程的興趣高漲。?
在進(jìn)行案例教學(xué)時(shí),引導(dǎo)學(xué)生帶著問(wèn)題和求知欲望深入理論的學(xué)習(xí),讓學(xué)生在案例中尋找問(wèn)題的答案并獲取知識(shí)。在講授利用神經(jīng)網(wǎng)絡(luò)進(jìn)行水庫(kù)調(diào)度時(shí),引導(dǎo)學(xué)生分析如何確定神經(jīng)網(wǎng)絡(luò)的輸入端數(shù)據(jù),什么是泛化能力以及如何提高神經(jīng)網(wǎng)絡(luò)的泛化能力。?
為了鞏固所學(xué)內(nèi)容,可以讓學(xué)生組成討論小組對(duì)教師提出的論題進(jìn)行討論,分小組闡述自己的觀點(diǎn),這樣有助于提高學(xué)生學(xué)習(xí)的主動(dòng)性,還有助于培養(yǎng)學(xué)生思考問(wèn)題的能力和提高理論教學(xué)的效果。案例教學(xué)的關(guān)鍵在于引導(dǎo)學(xué)生利用所學(xué)到的理論知識(shí)去解釋、分析和解決現(xiàn)實(shí)案例中的問(wèn)題,以達(dá)到訓(xùn)練學(xué)生理論運(yùn)用和深入理解理論知識(shí)的目的。?
此外,我們挑選了機(jī)器人足球、拖拉機(jī)撲克牌、中國(guó)象棋、五子棋等普遍受人喜愛(ài)的智能游戲,讓學(xué)生親手設(shè)計(jì)小型智能游戲軟件,在設(shè)計(jì)的過(guò)程中掌握高深的人工智能理論知識(shí),讓學(xué)生學(xué)得會(huì)、用得上、記得牢。
??四、結(jié)語(yǔ)??
以上談到的一些教學(xué)方法是我們?cè)诮虒W(xué)過(guò)程中總結(jié)體會(huì)比較深刻的方面,以供探討。事實(shí)上,要進(jìn)一步提高人工智能課程的教學(xué)質(zhì)量,還有很多方面需要改革和加強(qiáng)。如不斷強(qiáng)調(diào)人工智能教師的專(zhuān)業(yè)素質(zhì),要求他們?cè)谥v授好人工智能課程的同時(shí),努力提升出自身的專(zhuān)業(yè)素質(zhì),給學(xué)生一個(gè)良好的專(zhuān)業(yè)素質(zhì)導(dǎo)向。其次,在人工智能課程教學(xué)過(guò)程中還需要有培養(yǎng)實(shí)用型人才的教學(xué)理念,特別是注重培養(yǎng)有創(chuàng)新意識(shí)的實(shí)用型人才。注重培養(yǎng)學(xué)生的質(zhì)疑能力,只有通過(guò)質(zhì)疑和提出問(wèn)題,學(xué)生的創(chuàng)新意識(shí)才能夠得到不斷強(qiáng)化,創(chuàng)新思維能力才能夠得以不斷提高。?
人工智能學(xué)科是一門(mén)非常年輕、又非常前沿的學(xué)科,有其自身的突出特點(diǎn),人工智能課程教學(xué)必然與其他計(jì)算機(jī)專(zhuān)業(yè)課程教學(xué)不同,需要更多的從事人工智能教學(xué)的教師在自身的教學(xué)實(shí)踐中不斷積累經(jīng)驗(yàn),進(jìn)行廣泛的教學(xué)交流。
參考文獻(xiàn)?
[1]
蔡自興, 徐光祐. 人工智能及其應(yīng)用(第三版)(研究生用書(shū))[M]. 北京: 清華大學(xué)出版社, 2004(8): 1-4.?
[2]蔡自興, 徐光祐. 人工智能及其應(yīng)用(第三版)(本科生用書(shū))[M]. 北京: 清華大學(xué)出版社, 2003(8):288-290.?
[3]雷煥貴, 段云青. 中美案例教學(xué)的比較[J]. 教育探索, 2010(6): 150-151.?
篇9
關(guān)鍵詞:音樂(lè)檢索;音樂(lè)分類(lèi);音樂(lè)信息檢索系統(tǒng)
1.序言
隨著多媒體和Internet的技術(shù)的發(fā)展和深入普及,推動(dòng)著各種基于Internet 的音頻應(yīng)用逐步走向?qū)嵱?。各種音頻數(shù)據(jù)的數(shù)量正在呈指數(shù)增長(zhǎng),其信息量也在迅速膨脹。語(yǔ)音和音樂(lè)是兩類(lèi)最重要的音頻信息。如何快速有效地在大量的音樂(lè)數(shù)據(jù)中查詢(xún)到所需要的內(nèi)容,已經(jīng)成為現(xiàn)代信息檢索領(lǐng)域的一個(gè)研究重點(diǎn)。
目前現(xiàn)有絕大多數(shù)的音樂(lè)搜索平臺(tái)都只支持文本的檢索,比如www.baibu.com。用戶(hù)可以通過(guò)歌名、歌詞等信息搜索到相關(guān)的音頻文件。但是,許多情況下,人們只記得一部分音樂(lè)內(nèi)容,比如旋律。他們希望可以通過(guò)這些信息直接搜索到相關(guān)的歌曲。如何基于實(shí)際音樂(lè)內(nèi)容快速查找到音樂(lè)信息成為當(dāng)前的一個(gè)研究熱點(diǎn)。
2.數(shù)字音頻
要對(duì)音樂(lè)信息進(jìn)行搜索,首先就需要了解音頻信息的記錄方式。當(dāng)前音頻信息聲音可通過(guò)多種格式進(jìn)行存儲(chǔ),總結(jié)下來(lái)基本上可以分為兩類(lèi):記錄聲音波形變化的格式(如WAV格式)和記錄聲音指令的格式(以MIDI格式為代表)。
波形音頻文件是以數(shù)字方式來(lái)表示波形,使用采樣位數(shù)、采樣頻率和聲道數(shù)這三個(gè)參數(shù):對(duì)聲波進(jìn)行采樣、量化、編碼,最后轉(zhuǎn)換成數(shù)字形式,并壓縮儲(chǔ)存的聲音文件。
而與波形文件相MIDI是Musical Instrument Digital Interface的縮寫(xiě),又稱(chēng)作樂(lè)器數(shù)字接口,是數(shù)字音樂(lè)/電子合成樂(lè)器的統(tǒng)一國(guó)際標(biāo)準(zhǔn)。MIDI文件相對(duì)波形文件來(lái)說(shuō)較小,它記錄的內(nèi)容是一系列可以被 PC 的聲卡解釋的數(shù)字音樂(lè)指令(音符)。
波形音頻文件是對(duì)實(shí)時(shí)播放的音樂(lè)信號(hào)進(jìn)行采樣和數(shù)字編碼,記錄了實(shí)際的演奏效果。而MIDI格式則是記錄的一系列音符的演奏信息,如音符的起始、結(jié)束、控制變化等等信息。
另外隨著網(wǎng)絡(luò)和多媒體技術(shù)的進(jìn)一步發(fā)展,人們對(duì)于數(shù)字音頻技術(shù)的研究進(jìn)一步深入,又出現(xiàn)了多種有損壓縮的編碼格式,這些編碼格式,以極小的聲音失真換取了較高的壓縮比,比如在因特網(wǎng)上廣泛流傳的.MP3格式就是其中的代表。
正是由于不同的音頻記錄格式,并且在每一種格式下又各自有著一系列不同的格式,如何使不同的格式能夠統(tǒng)一為一種能夠?yàn)橛?jì)算機(jī)檢索所識(shí)別的代碼就成為了音樂(lè)信息檢索面臨的主要問(wèn)題。
3.音樂(lè)信息檢索
鑒于音樂(lè)信息的多種多樣,目前針對(duì)音樂(lè)信息的提取也提出的了多種方法。其中大致可以分為基于旋律和基于內(nèi)容兩種方法。
由于MIDI音樂(lè)的編碼方式較為簡(jiǎn)單,記錄的文件相對(duì)較小,目前音樂(lè)信息檢索的一個(gè)方向就是把復(fù)雜的波形文件進(jìn)行一定的處理,使之成為一段類(lèi)似于MIDI音樂(lè)文件的旋律編碼。目前有一些音樂(lè)信息檢索的研究方向就是以MIDI文件為核心,把一系類(lèi)不同格式的音樂(lè)文件通過(guò)系統(tǒng)自動(dòng)分析和處理,轉(zhuǎn)化成為以記錄音樂(lè)文件旋律為主的MIDI文件,再通過(guò)與其他MIDI文件之間的相互匹配,最終達(dá)到查找出相似旋律文件的目的。
而基于內(nèi)容的音頻信息檢索技術(shù)則直接對(duì)音頻進(jìn)行分析,從中抽取內(nèi)容特征,然后利用這些內(nèi)容特征建立索引并進(jìn)行檢索,避免了用MIDI文件作為音頻信息的轉(zhuǎn)化過(guò)程。因而基于內(nèi)容的音頻數(shù)據(jù)信息檢索是目前發(fā)展比較迅速,研究較為深入的一個(gè)方向,它可以成為其他許多應(yīng)用研究的基礎(chǔ)。
4.基于內(nèi)容的音樂(lè)信息檢索
4.1音頻的抽?。?/p>
對(duì)數(shù)字音樂(lè)進(jìn)行搜索的前提條件,就需要明確那一段音樂(lè)是我們要進(jìn)行搜索的目標(biāo),有的搜索是針對(duì)整個(gè)一個(gè)音樂(lè)文件而言,需要做到所有整個(gè)音樂(lè)文件的匹配,這樣的搜索相對(duì)費(fèi)時(shí),而有些搜索只要求搜索內(nèi)容相近,或者部分相似的內(nèi)容,這樣我們就不需要對(duì)整個(gè)音樂(lè)文件都去進(jìn)行信息的抽取。在明確信息搜索的目標(biāo)后,我們就需要對(duì)信息進(jìn)行提取,目前提取特征有兩種方法:一是提取感性特征,如音高、響度、節(jié)奏;二是計(jì)算非感性屬性或稱(chēng)物理特性,如Mel頻率倒頻譜系數(shù)、平均過(guò)零率、線性預(yù)測(cè)系數(shù)等
4.2音頻的分類(lèi):
由于目前的數(shù)字音樂(lè)文件數(shù)量龐大,要將所有的文件都遍歷之后進(jìn)行查詢(xún)顯然不可能。因此目前常用的方法主要是實(shí)現(xiàn)按一定的方法將音樂(lè)文件進(jìn)行分類(lèi),如分為然后根據(jù)特征文件的分類(lèi)按圖索驥去進(jìn)行有針對(duì)的查找。
目前常用的音頻分類(lèi)方法主要有:
(1)基于決策樹(shù)的分類(lèi)方法
所謂決策樹(shù)是一個(gè)類(lèi)似流程圖的樹(shù)型結(jié)構(gòu),樹(shù)的每個(gè)結(jié)點(diǎn)代表一個(gè)屬性(取值) 的測(cè)試,其分支代表測(cè)試結(jié)果,樹(shù)的每個(gè)葉結(jié)點(diǎn)代表-個(gè)類(lèi)別。樹(shù)的最高層結(jié)點(diǎn)是根結(jié)點(diǎn)。
(2)神經(jīng)網(wǎng)絡(luò)分類(lèi)算法
神經(jīng)網(wǎng)絡(luò)是一組相互連接的輸入輸出單元,這些單元之間的每個(gè)連接都關(guān)聯(lián)一個(gè)權(quán)重。 在網(wǎng)絡(luò)學(xué)習(xí)階段,網(wǎng)絡(luò)通過(guò)調(diào)整權(quán)重來(lái)實(shí)現(xiàn)輸入樣本與其相應(yīng)(正確) 類(lèi)別的對(duì)應(yīng)。 由于網(wǎng)絡(luò)學(xué)習(xí)主要是針對(duì)其中的連接權(quán)重進(jìn)行,因此神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)有時(shí)也稱(chēng)為連接學(xué)習(xí)。
(3)貝葉斯分類(lèi)方法
貝葉斯分類(lèi)算法是統(tǒng)計(jì)學(xué)分類(lèi)方法,它是一類(lèi)利用概率統(tǒng)計(jì)知識(shí)進(jìn)行分類(lèi)的算法。在許多場(chǎng)合,樸素貝葉斯分類(lèi)算法可以與決策樹(shù)和神經(jīng)網(wǎng)絡(luò)分類(lèi)算法相媲美,該算法能運(yùn)用到大型數(shù)據(jù)庫(kù)中,且方法簡(jiǎn)單、分類(lèi)準(zhǔn)確率高、速度快。[5]
(4)近鄰算法
用該方法進(jìn)行預(yù)測(cè)的基本概念就是相互之間"接近"的對(duì)象具有相似的預(yù)測(cè)值。如果知道其中一個(gè)對(duì)象的預(yù)測(cè)值后,可以預(yù)測(cè)其最近的鄰居對(duì)象。
5.基于內(nèi)容的音樂(lè)信息檢索系統(tǒng)
由于目前音樂(lè)信息檢索還不能做到完全自動(dòng)化,因此目前的音樂(lè)信息檢索系統(tǒng)應(yīng)該包含以下一些步驟:
第一步,建立數(shù)據(jù)庫(kù)。對(duì)數(shù)字音樂(lè)進(jìn)行分析,并提取特征,再通過(guò)音頻分割,識(shí)別分類(lèi)以后將音樂(lè)數(shù)據(jù)裝入數(shù)據(jù)庫(kù)的原始音頻庫(kù),將特征裝入音頻特征庫(kù)。數(shù)據(jù)庫(kù)建立以后就可以進(jìn)行音樂(lè)信息檢索。
第二步,確定查詢(xún)特征矢量。即用戶(hù)通過(guò)查詢(xún)界面確定樣本并設(shè)定屬性值,可以是一段哼唱的聲音,可以是具體的數(shù)字音樂(lè)文件,然后提交查詢(xún),系統(tǒng)對(duì)樣本提取特征,結(jié)合屬性值確定查詢(xún)特征矢量。
篇10
關(guān)鍵詞:數(shù)據(jù)挖掘;Web數(shù)據(jù)挖掘;Web內(nèi)容挖掘;Web使用挖掘;Web結(jié)構(gòu)挖掘
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2012)32-7636-03
基于Internet的服務(wù)也飛速產(chǎn)生并發(fā)展起來(lái),企業(yè)急需從Internet這個(gè)巨大的信息源中分析客戶(hù)行為,尋找商機(jī)。就是從這樣的商業(yè)角度考慮,在20世紀(jì)80年代末的時(shí)候數(shù)據(jù)挖掘(Data Mining)技術(shù)被開(kāi)發(fā)出來(lái)。Web數(shù)據(jù)挖掘就是在Web網(wǎng)絡(luò)基礎(chǔ)上引入數(shù)據(jù)挖掘的思想和方法。通過(guò)這一方法解決在Web網(wǎng)絡(luò)中遇到的一些問(wèn)題,從而形成了Web數(shù)據(jù)挖掘?;赪eb網(wǎng)絡(luò)的數(shù)據(jù)挖掘是數(shù)據(jù)挖掘領(lǐng)域的一個(gè)新的重要研究方向,它可以滿足電子商務(wù)未來(lái)發(fā)展趨勢(shì)的需要。
1 Web數(shù)據(jù)挖掘的研究背景和國(guó)內(nèi)外現(xiàn)狀
有統(tǒng)計(jì)指出,我國(guó)境內(nèi)的Web站點(diǎn)已將近有200萬(wàn)個(gè),全國(guó)現(xiàn)有網(wǎng)民3億7千萬(wàn)人。網(wǎng)上的信息量已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò)人們的處理能力。Web站點(diǎn)每天都在發(fā)生著不斷的變化,網(wǎng)上的內(nèi)容在不斷的擴(kuò)大和更新。龐大的快速增長(zhǎng)的數(shù)據(jù)中一定有許多有價(jià)值的信息,如何發(fā)現(xiàn)并利用這些信息變成了擺在我們面前的一道難題?,F(xiàn)在利用數(shù)據(jù)挖掘技術(shù)與Web技術(shù)相結(jié)合形成Web挖掘,就是用來(lái)解決這個(gè)難題的有效方法。
2 Web數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘是指從大型數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中提取隱含的、未知的、非平凡的及有潛在應(yīng)用價(jià)值的信息或模式。數(shù)據(jù)挖掘是一種綜合了數(shù)據(jù)庫(kù)、人工智能以及統(tǒng)計(jì)學(xué)等多個(gè)學(xué)科技術(shù)的信息處理方法。通過(guò)對(duì)歷史積累的大量數(shù)據(jù)的有效挖掘,試圖從這些數(shù)據(jù)中提取出先前未知但有效和有用的知識(shí)[1-2]。
web挖掘是Web數(shù)據(jù)挖掘(Web Data Mining)的簡(jiǎn)稱(chēng),也可以被稱(chēng)為Web知識(shí)發(fā)現(xiàn)(WebKnowledge Discovery),他是在數(shù)據(jù)挖掘的基礎(chǔ)上研究發(fā)展而來(lái)的,是數(shù)據(jù)挖掘技術(shù)在Web技術(shù)中應(yīng)用的體現(xiàn)。Web挖掘技術(shù)涉及眾多學(xué)科的知識(shí),如數(shù)據(jù)庫(kù)技術(shù)、網(wǎng)絡(luò)技術(shù)、統(tǒng)計(jì)數(shù)學(xué)、人工智能等,是一個(gè)交叉性的研究領(lǐng)域。[7]
數(shù)據(jù)挖掘所需要的豐富的信息資源其實(shí)就蘊(yùn)藏在Web中。Web中蘊(yùn)藏了許多豐富和動(dòng)態(tài)的超鏈接信息以及Web 頁(yè)面的訪問(wèn)和使用信息。而Web挖掘的主要工作就是從Web 文檔和Web 活動(dòng)中發(fā)現(xiàn)并取得感興趣的潛在的有用模式和隱藏信息。
3 Web 數(shù)據(jù)挖掘的分類(lèi)
Web數(shù)據(jù)挖掘可以被分為Web內(nèi)容挖掘(Web Content Mining)、Web結(jié)構(gòu)挖掘(Web Structure Mining)、Web使用記錄挖掘(Web Usage Mining),這三大類(lèi)。這三大類(lèi)在實(shí)際使用過(guò)程中并不是獨(dú)立使用的,而是相互聯(lián)系、相互交叉和相互滲透的。關(guān)系如圖1所示。
(1) Web內(nèi)容挖掘
從Web頁(yè)面文檔內(nèi)容及后臺(tái)交易數(shù)據(jù)庫(kù)中發(fā)現(xiàn)有價(jià)值信息的過(guò)程稱(chēng)為Web內(nèi)容挖掘。其實(shí)Web內(nèi)容挖掘我們可以理解為是從浩瀚無(wú)際的Web資源中發(fā)現(xiàn)信息、取得信息或資源的過(guò)程。Web內(nèi)容挖掘發(fā)現(xiàn)Web資源中的有效數(shù)據(jù)的方法是先對(duì)Web網(wǎng)頁(yè)上的內(nèi)容做資料挖掘,然后對(duì)Web的資源實(shí)行自動(dòng)檢索。Web資源的形式是豐富多樣的,Web上的資源內(nèi)容主要包括網(wǎng)絡(luò)頁(yè)面上的內(nèi)容信息和頁(yè)面后臺(tái)在數(shù)據(jù)庫(kù)中發(fā)生的交易記錄等。頁(yè)面上的信息是非常豐富的,它包括文本、動(dòng)畫(huà)、超鏈接、圖片、音頻/視頻之類(lèi)的多媒體數(shù)據(jù)。Web內(nèi)容挖掘主要使用兩種方法:Web頁(yè)面內(nèi)容信息挖掘和搜索結(jié)果再次挖掘(即對(duì)初步搜索或挖掘的結(jié)果作進(jìn)一步的改進(jìn)挖掘處理)。
(2) Web結(jié)構(gòu)挖掘
WSM(Web Structure Mining)是Web挖掘中的一個(gè)重要分類(lèi)方向,它的主要工作方法是通過(guò)研究和分析各個(gè)網(wǎng)絡(luò)頁(yè)面之間的結(jié)構(gòu)信息,從而找到隱藏在頁(yè)面內(nèi)容之外有價(jià)值的信息的過(guò)程。
網(wǎng)頁(yè)正文,網(wǎng)頁(yè)所含的超文本標(biāo)記以及網(wǎng)頁(yè)間的超鏈接,這三個(gè)部分組成了Web頁(yè)面中的有效信息。其實(shí)實(shí)際上,僅僅網(wǎng)頁(yè)之間的超鏈接,并不能代表Web的結(jié)構(gòu):
從廣義上講,Web的結(jié)構(gòu)包含有:
① URL字符串中的目錄路徑結(jié)構(gòu)信息;
② 網(wǎng)頁(yè)內(nèi)部?jī)?nèi)容的可以用HTML、XML表示成的樹(shù)形結(jié)構(gòu);
③ 網(wǎng)頁(yè)之間的超鏈接結(jié)構(gòu)。
Web結(jié)構(gòu)挖掘涉及到海量的計(jì)算信息數(shù)據(jù),怎樣解決大量信息數(shù)據(jù)和有限的計(jì)算存儲(chǔ)空間之間的矛盾,怎樣提升數(shù)據(jù)挖掘算法的效率和實(shí)時(shí)性將是一個(gè)有待大家繼續(xù)深入探討研究的問(wèn)題。
(3) Web使用記錄的挖掘[3]
網(wǎng)絡(luò)上的原始數(shù)據(jù)是Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘的對(duì)象。但是Web使用記錄的挖掘則卻和前兩者并不相同,它是對(duì)web上第二類(lèi)數(shù)據(jù)即Web日志數(shù)據(jù)及相關(guān)數(shù)據(jù)的挖掘。Web使用記錄是通過(guò)挖掘Web訪問(wèn)記錄發(fā)現(xiàn)有價(jià)值的數(shù)據(jù),提取感興趣,有價(jià)值的模式。
通過(guò)分析這些信息數(shù)據(jù),我們可以理解并且分析用戶(hù)的行為,從而發(fā)現(xiàn)電子商務(wù)的潛在客戶(hù),幫助我們不斷地改善Web站點(diǎn)的結(jié)構(gòu)或?yàn)橛脩?hù)提供個(gè)性化的服務(wù),并且對(duì)Web服務(wù)器系統(tǒng)的性能進(jìn)行改進(jìn)。
Web使用記錄挖掘應(yīng)用的技術(shù)主要有路徑分析、關(guān)聯(lián)規(guī)則分析、序列模式分析、聚類(lèi)分析、統(tǒng)計(jì)分析等。Web使用記錄挖掘可以發(fā)現(xiàn)潛在的用戶(hù)、改進(jìn)電子商務(wù)網(wǎng)站的建設(shè),增加個(gè)性化服務(wù)等。
這方面的研究主要有兩個(gè)方向:一般訪問(wèn)模式挖掘和個(gè)性化的使用記錄挖掘。
4 數(shù)據(jù)挖掘的主要技術(shù)
數(shù)據(jù)挖掘技術(shù)是多個(gè)不同學(xué)科領(lǐng)域的技術(shù)與成果結(jié)合的成果,現(xiàn)今的數(shù)據(jù)挖掘技術(shù)主要有人工智能、數(shù)據(jù)庫(kù)技術(shù)、概率與數(shù)理統(tǒng)計(jì)三個(gè)主要方面。以下是幾種比較常用的技術(shù):
(1)關(guān)聯(lián)分析
關(guān)聯(lián)分析是指如果兩個(gè)或多個(gè)事物之間存在一定的關(guān)聯(lián),那么其中一個(gè)事物就能通過(guò)其他事物進(jìn)行預(yù)測(cè)[7]。它的目的是為了挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。從大量的數(shù)據(jù)中發(fā)現(xiàn)其關(guān)聯(lián)知識(shí)在市場(chǎng)定位、決策分析和商業(yè)管理等領(lǐng)域是極為有用的。例如,網(wǎng)絡(luò)中的電子商店收集存儲(chǔ)了大量的客戶(hù)銷(xiāo)售數(shù)據(jù),這些數(shù)據(jù)清晰地記錄了每個(gè)客戶(hù)的購(gòu)買(mǎi)事務(wù);比如交易的受理時(shí)間、顧客選擇購(gòu)買(mǎi)的物品、物品的數(shù)量及金額等。商家可以通過(guò)利用這些數(shù)據(jù)使用關(guān)聯(lián)分析知道每個(gè)顧客進(jìn)入電子商場(chǎng)購(gòu)物時(shí),商家想知道的是顧客會(huì)購(gòu)買(mǎi)哪些商品?除了這個(gè)商品以外還會(huì)買(mǎi)什么,它們之間的聯(lián)系時(shí)什么?購(gòu)買(mǎi)這些商品的顧客有什么共同的特點(diǎn)?通過(guò)得到的這些信息可以很好的幫助店家,制訂出針對(duì)商品和顧客管理的一系列商業(yè)決策,從而提高銷(xiāo)售額。
(2) 聚類(lèi)分析
數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以規(guī)則分為一系列有意義的子集,稱(chēng)為聚類(lèi)。將由聚類(lèi)所生成的一組數(shù)據(jù)對(duì)象的集合,他們之間的相似度比較高,每一個(gè)個(gè)體之間的;離得較近;不同組中的對(duì)象差異較大,個(gè)體之間距離則較遠(yuǎn)。在實(shí)際情況的使用中,可以根據(jù)已有顧客的數(shù)據(jù),可以利用聚類(lèi)分析將掌握的客戶(hù)數(shù)據(jù)根據(jù)客戶(hù)之間的共同特點(diǎn)來(lái)細(xì)分的市場(chǎng),比如追求相似利益的人群、具有相同愛(ài)好的人群、相同年齡層次的人群、相同收入水平的人群、相同職業(yè)特征的人群等等,制定正確的市場(chǎng)策略,使企業(yè)在如此激烈的競(jìng)爭(zhēng)環(huán)境中取得有利位置。
(3) 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)的工作原理是對(duì)人類(lèi)大腦思維系統(tǒng)的一個(gè)簡(jiǎn)單的結(jié)構(gòu)模擬。人腦神經(jīng)元的基本功能是多個(gè)神經(jīng)元連接而成的多層網(wǎng)絡(luò)模仿而成。神經(jīng)網(wǎng)絡(luò)是仿照生理神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立的非線性預(yù)測(cè)模型,通過(guò)學(xué)習(xí)進(jìn)行模式識(shí)別。正是它的出現(xiàn)為許多傳統(tǒng)信息難以解決的問(wèn)題提供了一種較為簡(jiǎn)單有效的方法,所以近年來(lái)人工神經(jīng)網(wǎng)絡(luò)技術(shù)得到不斷成熟和發(fā)展。
(4) 分類(lèi)分析
數(shù)據(jù)挖掘中應(yīng)用比較頻繁的方法就是分類(lèi)。分類(lèi)是找出一組類(lèi)別,能夠描述數(shù)據(jù)集合典型特征的模型,它具有此類(lèi)數(shù)據(jù)的共同特點(diǎn),可以用它來(lái)分類(lèi)識(shí)別未知數(shù)據(jù)的歸屬或類(lèi)別。
分類(lèi)一般用于預(yù)測(cè)有限離散值。但某些情況下,需要預(yù)測(cè)某數(shù)值屬性的值(連續(xù)數(shù)值),在這種情況下分類(lèi)就稱(chēng)為預(yù)測(cè)。
(5) 決策樹(shù)
決策樹(shù)從它的名字就不難發(fā)現(xiàn)它的結(jié)構(gòu)就像一棵樹(shù)。它利用樹(shù)的結(jié)構(gòu)將數(shù)據(jù)記錄進(jìn)行分類(lèi),是一種預(yù)測(cè)模型。決策樹(shù)分類(lèi)方法是一種通過(guò)構(gòu)造決策樹(shù)來(lái)發(fā)現(xiàn)訓(xùn)練集中分類(lèi)知識(shí)的數(shù)據(jù)挖掘方法,其關(guān)鍵是能夠構(gòu)造出規(guī)模小、精度高的決策樹(shù)。例如,我們要分析一個(gè)公司的客戶(hù)接受某項(xiàng)新產(chǎn)品的情況,我們可以從中選取50 個(gè)客戶(hù),其中25 個(gè)愿意接受并購(gòu)買(mǎi)這個(gè)新產(chǎn)品的,25 個(gè)不愿意接受并購(gòu)買(mǎi)這個(gè)新產(chǎn)品的。我們通過(guò)建立決策樹(shù)的方法來(lái)來(lái)分析客戶(hù)的情況,并從中分析和尋找到一些潛藏的規(guī)則信息,然后幫助企業(yè)銷(xiāo)售。
5 結(jié)束語(yǔ)
該文討論了Web數(shù)據(jù)挖掘的基本概念、基礎(chǔ)工作原理和所使用的關(guān)鍵技術(shù)。在未來(lái)隨著電子商務(wù)的迅速發(fā)展,Web數(shù)據(jù)挖掘有了更廣闊的舞臺(tái)。Web挖掘技術(shù)能夠幫助我們發(fā)現(xiàn)一些與用戶(hù)檢索的關(guān)鍵詞密切相關(guān)的有價(jià)值網(wǎng)頁(yè),從而實(shí)現(xiàn)個(gè)性化檢索。它可以幫助商家發(fā)現(xiàn)和獲取客戶(hù),對(duì)商家的市場(chǎng)策略進(jìn)行調(diào)整和改進(jìn),并對(duì)其進(jìn)行正確的決策指導(dǎo),促進(jìn)電子商務(wù)的發(fā)展。
參考文獻(xiàn):
[1] L Wu,P.S.Yu,A.Baliman.Speed Tracer:A Web usagemining andanalysist001.IBM Systems Journal,37(1):89-105,1998.
[2] N.Good,B.Schafer,J.Konstan,A.Borchers,B.Sarwar,J.Herlocker,and J.Riedl,(1999).Combining Collaborative Filtering With Personal Agents forBetter Recommendations.In Proceedings of the conference,439-446.
[3] 韓家煒,孟小峰,王靜,等.Web挖掘研究[J].計(jì)算機(jī)研究與發(fā)展,2001,38(4):405-414.
[4] Jiawei Han and Micheline Kamber.Data Mining:Technique and Concepts,Morgan Kaufmann Publishers,2001.
[5] 李鳳慧.面向電子商務(wù)的web數(shù)據(jù)挖掘的研究[D].山東:山東科技大學(xué),2004,6.
熱門(mén)標(biāo)簽
神經(jīng)內(nèi)科論文 神經(jīng)外科 神經(jīng)網(wǎng)絡(luò)論文 神經(jīng)內(nèi)科 神經(jīng)元 神經(jīng)科學(xué) 神經(jīng) 神經(jīng)病學(xué) 神經(jīng)阻滯 神經(jīng)網(wǎng)絡(luò) 心理培訓(xùn) 人文科學(xué)概論
相關(guān)文章
1神經(jīng)網(wǎng)絡(luò)在工程造價(jià)中的運(yùn)用
4教學(xué)法在神經(jīng)內(nèi)科護(hù)理教學(xué)的應(yīng)用
相關(guān)期刊
-
中國(guó)神經(jīng)腫瘤
主管:中山大學(xué)腫瘤防治中心;中國(guó)抗癌協(xié)會(huì)神經(jīng)腫瘤專(zhuān)業(yè)委員會(huì)
級(jí)別:部級(jí)期刊
影響因子:--
-
現(xiàn)代神經(jīng)疾病
主管:中華人民共和國(guó)國(guó)家衛(wèi)生
級(jí)別:北大期刊
影響因子:1.69
-
中國(guó)神經(jīng)免疫學(xué)和神經(jīng)病...
主管:中華人民共和國(guó)國(guó)家衛(wèi)生健康委員會(huì)
級(jí)別:統(tǒng)計(jì)源期刊
影響因子:1.5
-
國(guó)際神經(jīng)病學(xué)神經(jīng)外科學(xué)
主管:中華人民共和國(guó)教育部
級(jí)別:統(tǒng)計(jì)源期刊
影響因子:1.43