人工智能應用研究與文獻計量學分析
時間:2022-09-14 08:44:47
導語:人工智能應用研究與文獻計量學分析一文來源于網友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1引言
20世紀八十年代,我國制定了十年科學發(fā)展計劃,將“智能模擬”作為重要研究方向。受此計劃的指引,人工智能也開始嘗試進入醫(yī)學領域。對醫(yī)學領域中人工智能的應用,許多學者都從各自的專業(yè)的角度進行了研究。為了深入了解目前我國人工智能在醫(yī)學領域應用研究的情況,本文對中國知網上收集的在1981至2018年期間的相關文獻的年份分布、作者、作者單位和區(qū)域、發(fā)文期刋、基金資助情況進行了計量學分析。
2資料和方法
2.1資料
在中國知網數(shù)據庫中檢索,具體步驟如下:進入高級檢索界面,先選擇一個檢索條件,以“主題”為檢索項,輸入“人工智能”和“醫(yī)學”二個檢索詞,選擇“精確”匹配,兩詞之間選擇“并含”布爾邏輯運算,最后添加“同義詞擴展”,檢索截至時間為2018年12月31日。檢索結果共有相關文獻1118篇。通過對檢索出每一篇文獻逐個閱讀分析,剔除新聞報道113篇,廣告11篇,科普類文獻45篇,無關文獻423篇,相同文獻2篇,共得到524篇有效文獻。
2.2方法
在收集上述數(shù)據的基礎上,本文建立電子表格數(shù)據庫,從發(fā)文年份、作者單位、發(fā)文區(qū)域、發(fā)文期刊、合作度、合作率、研究的成熟度、值得關注的作者等多個方面進行統(tǒng)計分析,繪制出多種圖表。
3結果與分析
3.1文獻年份分布情況的分析
從圖1可知,在醫(yī)學領域應用人工智能的研究始于1981年,到2018年已經歷了37年。在這期間,該項研究的文獻數(shù)量雖有多次小幅波動,但總體呈階梯式增長的趨勢。發(fā)展的第一階段是嘗試期,為1981年到2000年。這20年中,平均每年的文獻僅有2.45篇。2001-2014年是第二階段的起步期。在這14年中,年平均文獻有19篇。2015-2018年是第三階段的發(fā)展期,年平均文獻有52.25篇,是嘗試期的21.33倍,是起步期的2.75倍。
3.2發(fā)表文獻作者的分析
3.2.1高產作者單位有效文獻的作者共有1241人次,從中篩選出前九名高產作者。這些高產作者單位來自于中國醫(yī)學科學院、中醫(yī)科學院、華中科技大學、中國食品藥品檢定研究院、蘭州大學、復旦大學、上海中醫(yī)藥大學。了解這些研究機構研究的情況,這樣有助于讀者快速掌握當前國內人工智能在醫(yī)學領域應用研究的現(xiàn)狀。3.2.2合作度和合作率文獻篇均作者數(shù)為合作度。合作文獻占總文獻量比例為合作率[1-2]。從合作撰文的各類比例來看,226篇為獨自撰文,占總數(shù)45.12%;2人合著共計103篇,占總數(shù)的18.97%;3人合著共計60篇,占總數(shù)的11.05%;其他共計135篇,占總數(shù)的24.86%。獨著比合著比率小,這說明研究的相關文獻以合作撰文為主。合作度在一定程度上反映了研究難度[3],合作率則在一定程度上反映了研究水平[4]。整個合作率和合作度呈階段性變化,且與前文所述的文獻發(fā)文變化息息相關。因此,以前述劃分的階段來觀察其變化規(guī)律。各時期的合作度以及合作率分別為:嘗試期是2.47和67.35%,起步期是1.99和43.98%,發(fā)展期是2.83和60.29%。整個研究的合作度約為2.37(1241/524),合作率為52.67%(276/524)。故研究的整體合作水平不高。3.2.3研究的成熟度統(tǒng)計文獻第一作者的論文數(shù)量如表1所示。發(fā)表1篇論文的作者有420人,占總人數(shù)的91.90%,高出洛特卡定律規(guī)定標準的31.18%[5]。這說明,研究人工智能在醫(yī)學領域中應用的論文主要是來自于只寫作1篇論文的作者,即多數(shù)學者都是剛剛進入,研究還不太深入。文獻作者按其地位的不同分為核心作者和非核心作者兩類。依據普萊斯的核心作者計算公式[6]:
3.3發(fā)表文獻的單位和區(qū)域分析
通過對文獻第一作者單位統(tǒng)計分析,結果表明高等院校是發(fā)文的主體,共有383人,占總數(shù)的75.25%。在高等院校中,最主要的是綜合類院校,共有163人,占總數(shù)的32.02%。這說明來自高等院校的人員是研究的主力,綜合類院校是該領域的主要研究力量。例如,中南大學為綜合類院校,既有理工類學院又有醫(yī)學學院。同一學校內高水平多學科的科研團隊便利協(xié)同合作,取長補短,同時,還可方便獲取豐富的理工類和醫(yī)學類資源。作者為公司企業(yè)的有14人,占總數(shù)的2.75%。這說明當前研究主要停留在科研上,與生產結合不夠緊密,科研成果轉化率較低。通過對文獻第一作者單位所屬區(qū)域統(tǒng)計分析,結果表明除西藏、青海、海南、澳門以外,其他省份均開展相關的研究。研究主要分布在華北、華東和中南。華北地區(qū)發(fā)表文獻154篇,占總量的30.43%,是發(fā)表文獻最多的區(qū)域。在此區(qū)域中發(fā)文最多是京津冀,共有145篇,占總量的28.49%。華東地區(qū)發(fā)表文獻139篇,占總量的27.47%,是發(fā)表文獻位列第二的區(qū)域。在此區(qū)域中發(fā)文最多是位于長江三角洲的上海、江蘇、浙江,共有108篇,占總量的21.22%。中南地區(qū)發(fā)表文獻95篇,占總量的18.77%,是發(fā)表文獻位列第三的區(qū)域。在此區(qū)域中發(fā)文最多是湖南、湖北、廣東,共有72篇,占總量的14.15%。整個研究形成了四個核心研究區(qū)域(京津冀、長三角、湘鄂粵、川陜渝)布局。
3.4期刊情況的分析
有效文獻中,碩士論文有85篇、博士論文有31篇、期刊論文有375篇、會議論文有30篇、報紙有3篇。根據布拉德福定律,按其刊文量的遞減順序排列可分為核心區(qū)、相關區(qū)和離散區(qū)[8],且每個區(qū)的刊文數(shù)量基本相等,此時各區(qū)的期刊數(shù)量呈1:n:n2的關系[9]?,F(xiàn)將期刊論文劃分為三個區(qū),如表2所示。核心區(qū)是載文量2-12篇的期刊,總和為125篇,占有效期刊論文總數(shù)的1/3。該區(qū)期刊數(shù)為27,其中只有2個期刊的載文量為2篇,其余25個期刊的載文量均為大于2篇.相關區(qū)是載文量1-2篇的期刊,論文總數(shù)125篇,占有效期刊論文總數(shù)的1/3。該區(qū)期刊數(shù)為86,其中有39個期刊的載文量為2篇,其余47個期刊的載文量均為1篇。離散區(qū)的期刊數(shù)量為125種,刊文量均為1篇。核心區(qū)、相關區(qū)和離散區(qū)的期刊數(shù)量比呈27:86:125≈1:3:5,不符合布拉德福定律。這說明人工智能在醫(yī)學領域應用研究的文獻刊物分布未能趨于合理,整體處于無序分散的狀態(tài),即研究沒有形成核心期刊區(qū)。
4結論和展望
1981-2018年期間發(fā)表的人工智能在醫(yī)學領域的應用研究文獻,具有以下特點:(1)研究總體上呈現(xiàn)出階梯式增長趨勢,并由此劃分為嘗試期、起步期、發(fā)展期三個發(fā)展階段;(2)從高產作者角度看,關注發(fā)文量位于前三的研究機構是中國醫(yī)學科學院、中醫(yī)科學院、華中科技大學;(3)高校教師構是主要研究者,約三成來自于綜合類院校,但合作團隊較小,且團隊多為同單位同部門;(4)論文主要是來自于獨自撰文,未形成核心研究力量;(5)現(xiàn)已形成四個核心研究區(qū)域,即京津冀、長三角、湘鄂粵及川陜渝。
作者:陳書敏 黃智軍 施俊容 楊文 王嘉毅 單位:江西醫(yī)學高等??茖W校