計算機(jī)語言學(xué)關(guān)鍵問題研究

時間:2022-01-28 08:21:42

導(dǎo)語:計算機(jī)語言學(xué)關(guān)鍵問題研究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

計算機(jī)語言學(xué)關(guān)鍵問題研究

摘要:近幾年,隨著產(chǎn)業(yè)界人工智能領(lǐng)域應(yīng)用服務(wù)不斷落地,學(xué)術(shù)界對于AI分支科學(xué)的研究也愈加深入。NLP,即自然語言處理,在信息時代向智能時代的過渡中發(fā)揮著極其重要的作用。由此衍生出的一門高度交叉的新興學(xué)科,計算機(jī)語言學(xué),也正在進(jìn)行著突飛猛進(jìn)的發(fā)展。自然語言處理是計算機(jī)翻譯的過程,涉及數(shù)據(jù)挖掘、知識圖譜、機(jī)器學(xué)習(xí)及與語言計算相關(guān)的語言學(xué)等研究。中文自然語言處理是以轉(zhuǎn)換自然語言為基本原則,遵循基于規(guī)則、基于統(tǒng)計等研究思路,并且適當(dāng)添加一些可靠的實(shí)例來完成翻譯過程。本文我們將圍繞計算機(jī)在處理中文自然語言方面的問題來展開分析,通過詳細(xì)的分析了解一下中文自然語言處理的基本概念,再來研究一下中文自然語言處理的關(guān)鍵問題與步驟。

關(guān)鍵詞:自然語言處理;自動分詞;機(jī)器學(xué)習(xí);語言學(xué)

一、針對于中文自然語言處理含義的分析

語言是人傳遞信息的關(guān)鍵因素,其本身的復(fù)雜性與語言描述外部世界的復(fù)雜性,表明機(jī)器理解語言是一個艱難的過程。所以說要采取有效手段促使消除語言和交流障礙的信息化,從而通過算法和數(shù)據(jù)模型處理來達(dá)到自然語言處理的目的。所謂自然語言處理,包括詞法分析、語法分析、語義分析、篇章理解,通過自然語言處理能夠更好的研究和實(shí)現(xiàn)人和計算機(jī)之間用自然語言進(jìn)行有效通信的手段。自然語言處理和語言學(xué)的分析研究有著深遠(yuǎn)的聯(lián)系,但是也同樣有著一定的區(qū)別。對自然語言處理的研究不是單一的研究自然語言,而是在研究自然語言的基礎(chǔ)上來研究和實(shí)現(xiàn)自然語言通信的計算機(jī)系統(tǒng)。通過大規(guī)模的數(shù)據(jù)訓(xùn)練機(jī)器,使機(jī)器掌握自然語言間的規(guī)則,進(jìn)行準(zhǔn)確的處理與翻譯。自然語言處理問題主要包括了對計算機(jī)和人類思維的學(xué)習(xí),但是翻譯工作是一項(xiàng)比較復(fù)雜的過程,同時也是一種從簡單智能到相對信息化問題的過程,在處理中存在對各種特殊的常識處理存在匱乏的因素,也就導(dǎo)致出現(xiàn)一些語境分析不透徹的情況發(fā)生,進(jìn)一步也將會影響相應(yīng)的處理結(jié)構(gòu)[1]。

二、針對于中文自然語言處理與計算機(jī)結(jié)合的分析

中文自然語言處理就是對漢語中的漢字等自然語言處理翻譯的過程,當(dāng)前我國相關(guān)研究人員對自然語言處理信息化的研究力度還不夠深入。這是由于中文自然語言處理,相比于英語等有天然分隔符的語言,難度更大。例如,界定單詞邊界的詞法分析任務(wù),也被稱為“中文自動分詞”的任務(wù),是中文語言處理的首要步驟。其中,新詞發(fā)現(xiàn)、歧義切分等關(guān)鍵問題又是基于對語言的理解之上的。下面我們再來詳細(xì)了解一下中文自然語言處理技術(shù)發(fā)展的基本現(xiàn)狀,首先我們根據(jù)以GATE為基礎(chǔ)的自然語言處理技術(shù)來展開分析。由于以GATE為基礎(chǔ)的自然語言處理技術(shù)是語言工程學(xué)軟件體系結(jié)構(gòu)的基礎(chǔ),從而一些關(guān)于工程學(xué)的語言行為就都是能夠?qū)I(yè)化進(jìn)行衡量的。在經(jīng)過自然語言處理以及人工交互的處理以后,能夠更加全面的構(gòu)成相應(yīng)的軟件和應(yīng)用,最終再通過計算機(jī)語言學(xué)中的各種工具和計算機(jī)科學(xué)專業(yè)的可預(yù)測性來完成進(jìn)一步的設(shè)施組織[2]。

三、針對于中文自然語言處理關(guān)鍵問題的分析

中文自然語言處理主要體現(xiàn)在中文自然語言信息主題知識獲取瓶頸處理上,因?yàn)橹形淖匀徽Z言處理的領(lǐng)域以及時間的處理、對機(jī)器翻譯的知識性等都應(yīng)當(dāng)進(jìn)一步結(jié)合這種模式的深度和難度,最后完成中文自然語言處理的傳統(tǒng)信息知識處理。需要注意的是應(yīng)當(dāng)根據(jù)語義網(wǎng)來更加直觀的分析系統(tǒng)規(guī)劃的各個流程,然后依據(jù)適應(yīng)性來適當(dāng)增加對中文自然語言有關(guān)知識的系統(tǒng)支持和關(guān)注。相關(guān)人員對中文自然語言信息統(tǒng)計機(jī)器翻譯模型順利的開展和完成統(tǒng)計工作,能夠有效的對中文自然語言處理的相關(guān)手段提供更多的關(guān)注,根據(jù)當(dāng)前的翻譯系統(tǒng)來選擇一種比較相近的編碼過程,進(jìn)而專業(yè)的推出解碼的主要法則。中文自然語言信息統(tǒng)計要合理的從處理技術(shù)的應(yīng)用中體現(xiàn)出來,在信息理論模型當(dāng)中完成噪聲處理復(fù)雜問題。除此之外,在面對中文自然語言信息處理其他一些問題時,一般情況下都是通過采用中文自然語言信息聚類處理來完成的,在當(dāng)前現(xiàn)有層次的算法的基礎(chǔ)上合理的來對平面分割算法等手段進(jìn)行利用,最后通過有效的結(jié)合算法性能共同完成分析過程[3]。

四、總結(jié)

通過上述問題的分析,我們已經(jīng)意識到中文自然語言處理和計算機(jī)結(jié)合的重要性和必要性。隨著人工智能相關(guān)技術(shù)的不斷發(fā)展,中文自然語言處理和計算機(jī)的結(jié)合問題也將會面臨大量的知識成本,這就要求從中文自然語言的處理、發(fā)展歷程以及傳統(tǒng)處理手段等來進(jìn)一步對建模的核心問題完成相應(yīng)的處理。針對于不同類型的限制條件和因素最大限度的達(dá)到最優(yōu)的處理效果,并且管理人員和工作人員還可以通過相應(yīng)的實(shí)驗(yàn)來進(jìn)行中文自然語言信息的處理,最終實(shí)現(xiàn)更精準(zhǔn)的效果和目的,更好的推動中文自然語言處理與計算機(jī)的結(jié)合。

參考文獻(xiàn)

[1]自然語言處理與中文計算會議征文通知[J].計算機(jī)應(yīng)用研究,2013(2):12-13.

[2]第五屆國際自然語言處理與中文計算會議暨第24屆國際東方語言計算機(jī)處理會議(NLPCC-ICCPOL2016)[J].計算機(jī)工程與設(shè)計,2016(11):111-113.

[3]劉源等著.信息處理用現(xiàn)代漢語分詞規(guī)范及自動分詞方法[M].桂林:廣西科學(xué)技術(shù)出版社,1994.

作者:龐宇 單位:北方工業(yè)大學(xué)計算機(jī)學(xué)院