學(xué)術(shù)期刊影響力排序與分區(qū)方法
時間:2022-03-10 05:20:28
導(dǎo)語:學(xué)術(shù)期刊影響力排序與分區(qū)方法一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
學(xué)術(shù)期刊(以下簡稱“期刊冶)在促進科學(xué)知識的創(chuàng)新、科技成果的轉(zhuǎn)化以及社會科技的進步等方面發(fā)揮著重要作用。在一定時間內(nèi)某期刊所出版的學(xué)術(shù)論文對后續(xù)某段時間內(nèi)相關(guān)領(lǐng)域知識創(chuàng)新的促進能力被稱之為期刊影響力[1]。期刊排序分區(qū)是衡量期刊影響力的重要指標(biāo),通常由某種或某些文獻計量學(xué)指標(biāo)(又稱“期刊表征因素冶)來度量,對總體評估期刊的學(xué)術(shù)質(zhì)量、宏觀考量期刊的辦刊定位與出版策略、學(xué)術(shù)績效短期評價、圖書機構(gòu)期刊采購等具有非常重要的參考意義。特別地,從科研管理實踐來看,期刊排序分區(qū)是對于以數(shù)量勝質(zhì)量、賺取獎金和應(yīng)付考核投機行為的低成本有效對策[2]。最常見的期刊影響力度量指標(biāo)是影響因子。普遍認為,影響因子越大,期刊影響力就越大。因此,期刊排序分區(qū)方法通常與影響因子有關(guān)。例如,適用于SCI英文期刊的排序分區(qū)方法主要包括:科睿唯安公司的期刊引用報告分區(qū)方法(簡稱“JCR分區(qū)冶)[3]和中國科學(xué)院文獻情報中心的分區(qū)方法(簡稱“中科院分區(qū)冶)[4]。在JCR分區(qū)方法中,將某一個學(xué)科的所有期刊都按照上一年的影響因子降序排列后,依據(jù)學(xué)科內(nèi)期刊總數(shù)目,平均將這些期刊分為4個區(qū),每個所占期刊數(shù)目比例為25%。在中科院分區(qū)方法中,采用期刊的前3年影響因子均值進行降序排位,然后將這些期刊以固定但非平均的方式劃分為四個區(qū),期刊的區(qū)分位分別是5%,6%~20%,21%~50%,51%~100%。然而,隨著各個學(xué)科知識創(chuàng)新日漸加速、跨學(xué)科研究日趨普遍、文獻出版方式日呈多樣化,僅僅使用影響因子來進行期刊分區(qū)存在一定的缺陷。研究工作者試圖開發(fā)一個更為合理的期刊影響力度量指標(biāo),探索可以較為全面反映學(xué)術(shù)期刊質(zhì)量和影響力的新型期刊分區(qū)方法。在影響因子基礎(chǔ)上,人們已經(jīng)研究了多種新的指數(shù),如h指數(shù)[5,6]、及其改進g指數(shù)[7]、特征因子[8-9]、f(x)指數(shù)[10]、PR8指數(shù)[11]以及學(xué)術(shù)期刊影響力指數(shù)(AcademicJournalCloutIndex,CI)[12]等。特別地,中國科學(xué)文獻評價研究中心的期刊影響力指數(shù)CI,目前已經(jīng)成為了國內(nèi)中文期刊文獻分區(qū)的重要依據(jù)。該指標(biāo)是一種依賴于將“總被引頻次冶和“影響因子冶的非線性綜合指標(biāo)[12]。CI分區(qū)方法首先將期刊的CI值作為排序度量值對特定學(xué)科的所有期刊進行降序排位,然后采用與JCR分區(qū)相似的方式,依據(jù)某個學(xué)科內(nèi)所有期刊的數(shù)量來平均分割成四個分區(qū)。盡管影響因子是衡量期刊影響力的重要指標(biāo),但是期刊影響力是多個方面因素的綜合影響結(jié)果,其影響因素指標(biāo)體系是由一系列具有內(nèi)在關(guān)聯(lián)的評價指標(biāo)所構(gòu)成[13]。顯然,綜合各種指標(biāo)的期刊影響力評價方法能夠從多個層面反映出期刊影響力的真實水平。然而,當(dāng)前分區(qū)方法沒有反映出其它多種期刊因素(如即年指標(biāo)、半衰期、互引指數(shù)等)。近年來,不少研究趨向于利用采用相關(guān)系數(shù)[14]、線性回歸[15]、因子分析[16-17]等線性分析方法綜合多種期刊表征因素,進行期刊影響力綜合評價并排序。盡管文獻[14]中同時也使用TOPSIS來捕獲期刊表征因素之間非線性關(guān)系,但僅限于因素之間的二次關(guān)系。總的來說,當(dāng)前方法難以捕獲多個期刊表征因素之間的非線性關(guān)系,而且難以描述特定學(xué)科內(nèi)期刊的全局和局部關(guān)系。另外,諸多期刊因素之間存在多重共線性關(guān)系會干擾期刊影響力評價。因此,針對目前的分區(qū)方法不足,本文利用相關(guān)系數(shù)矩陣和方差膨脹因子挑選高獨立性的若干重要期刊表征因素,并利用深度自編碼器的高維非線性刻畫能力,綜合集成這些因素,從而生成一種新的期刊排序度量指標(biāo)并基于此進行期刊分區(qū)。
1方法
1.1實證數(shù)據(jù)選取與預(yù)處理。本文數(shù)據(jù)來源于2017年中國學(xué)術(shù)期刊影響因子年報(人文社會科學(xué))[12],總共選擇“圖書館學(xué);情報學(xué)冶(以下簡稱“圖情冶)、“法律冶和“體育冶三個學(xué)科中的學(xué)術(shù)期刊為實證研究樣本,其中“圖情冶學(xué)科包含43種期刊,“法律冶學(xué)科包含94種期刊,“體育冶包含41種期刊。每一種期刊包含學(xué)術(shù)期刊影響力指數(shù)(AcademicJournalCloutIndex,簡稱CI)和期刊分區(qū)(Q),以及35項學(xué)術(shù)期刊計量指標(biāo)或表征因素(簡稱“因素冶)。例如,復(fù)合類指標(biāo)、綜合類指標(biāo)、人文社科影響因子指標(biāo)、出版指標(biāo)、引證指標(biāo)、網(wǎng)絡(luò)傳播指標(biāo)等。因為少量期刊缺失個別因素的數(shù)據(jù),需要對數(shù)據(jù)進行篩選。本文采用如下篩選方案:(1)剔除存在較多缺失因素數(shù)據(jù)的期刊:“圖情冶期刊中的英文期刊《JournalofDataandInformationScience》,“法律冶期刊中的《中國法律評論》、《交大法學(xué)》、《蘇州大學(xué)學(xué)報(法學(xué)版)》、《國際法研究》、《醫(yī)學(xué)與法學(xué)》、《廣西政法管理干部學(xué)院學(xué)報》、《河南警察學(xué)院學(xué)報》、《中國律師》、《新疆警察學(xué)院學(xué)報》、《廣州市公安管理干部學(xué)院學(xué)報》、《遼寧公安司法管理干部學(xué)院學(xué)報》、《中國刑警學(xué)院學(xué)報》,“體育冶期刊中的英文期刊《JournalofSportandHealthScience》和《當(dāng)代體育科技》;(2)存在缺失單個因素數(shù)據(jù)的期刊,采用該學(xué)科內(nèi)其它期刊該因素值的平均值作為其估計值,如《情報學(xué)報》的“web即年下載率冶;(3)用邊界值代替非確切數(shù)值,如“>20冶的數(shù)值均以“20冶替代;(4)刪除不必要的冗余因素和分區(qū)無關(guān)因素,如“影響因子排序冶是與“影響因子冶的冗余,“研究層次冶是與分區(qū)無關(guān)的因素。最終選用42種“圖情冶期刊,82種“法律冶期刊和39種“體育冶期刊為研究對象,每一種期刊均包含33個因素,如表1所示。根據(jù)中國學(xué)術(shù)期刊影響因子年報的方法,這些因素分為三組,分別是:“上年期刊主要影響因子冶,“其它各類計量指標(biāo)冶和“人文社科類影響因子、被引頻次及可被引文獻量冶,詳細信息如表1所示。因為所有期刊影響力因素的取值范圍差異很大,比如“復(fù)合總被引冶的數(shù)值量級可達上萬,而“復(fù)合影響因子冶的數(shù)值量級只有10左右,所以本文采用數(shù)據(jù)標(biāo)準(zhǔn)化來減少計算誤差。標(biāo)準(zhǔn)化的定義為:z(i)=x(i)-滋(i)滓(i)(1)其中為x(i)為期刊x的第i個因素的原始數(shù)值,滋(i)和滓(i)分別為數(shù)據(jù)中所有期刊的該因素的均值和標(biāo)準(zhǔn)差,z(i)為標(biāo)準(zhǔn)化之后該因素的數(shù)值。1.2深度自編碼器。深度自編碼器(以下簡稱自編碼器)作為深度學(xué)習(xí)領(lǐng)域的重要組成部分,是一種無監(jiān)督的深度神經(jīng)網(wǎng)絡(luò)[18]。它不僅能夠表達高維非線性變量關(guān)系,而且能夠?qū)⑵鋲嚎s為低維關(guān)系,從而為衡量期刊的排序分區(qū)提供一個可視化的表達和分析。在實際應(yīng)用當(dāng)中,自編碼器具有重建過程簡單、可堆疊多層等優(yōu)點,通常由輸入層、編碼解碼隱含層和輸出層組成。其中,輸入層和輸出層維度(神經(jīng)元數(shù)目)相等,輸入層和隱含層之間構(gòu)成編碼器,輸入信號x沂Rd通過編碼過程在編碼隱含層產(chǎn)生含數(shù)據(jù)特征的激勵a沂Rm,解碼隱含層和輸出層之間構(gòu)成解碼器,a通過解碼過程得到重構(gòu)信號y沂Rd,解碼是編碼的逆向運算。在本文中,x代表期刊,用d個期刊因素表示,y表示重構(gòu)之后的期刊。自編碼器的訓(xùn)練目標(biāo)是使原始輸入y抑x,從而捕獲數(shù)據(jù)中最重要的信息。如圖1所示,本文采用L層自編碼器,其過程可用如下公式表示:輸入層-編碼隱含層:a(1)=f(Wx+b)(2)編碼隱含層:a(i+1)=f(W(i)a(i)+b(i)),i=1,…,L(3)其中,W和b分別為各層的權(quán)值矩陣和偏置項,L為編碼隱含層的數(shù)目,f(誗)為激活函數(shù),本文中采用sigmoid函數(shù),其定義為f(z)=11+e-z,值域為[0,1]。在本文的自編碼器實現(xiàn)中,輸入層包含神經(jīng)元數(shù)目對應(yīng)于期刊因素的數(shù)目。同時,也設(shè)計了包含不同隱層數(shù)目的自編碼器構(gòu)架,用來調(diào)查特定學(xué)科內(nèi)期刊的全局和局部關(guān)系以及期刊排序分區(qū)。在可視化當(dāng)中,最后一個編碼隱含層的神經(jīng)元輸出值分別作為期刊的坐標(biāo)值。該值又稱為隱空間主元值,簡稱隱元值。
2實證分析
2.1期刊因素分析與選擇。盡管期刊擁有多達33個因素,然而有的因素與其它因素密切相關(guān),相互之間存在較高的相關(guān)性,導(dǎo)致因素之間存在共線性問題。比如在2017年的“圖情冶期刊中,第2個因素“復(fù)合影響因子冶與第3個因素“復(fù)合他引影響因子冶之間的相關(guān)性高達0.9969,它與第4個“復(fù)合5年影響因子冶之間的相關(guān)性為0.9768。再如,第11個因素“可被引文獻量冶與第33個因素“可被引文獻量2016冶的相關(guān)系數(shù)等于1,其中的原因在于數(shù)據(jù)來源于2017年中國學(xué)術(shù)期刊影響因子年報,所以這兩個因素包含相同的數(shù)據(jù)。指導(dǎo)期刊發(fā)展的首要任務(wù)是明確重要的因素、并剔除冗余的因素。以“圖情冶期刊為例,我們首先計算了方差膨脹因子(簡稱VIF)。結(jié)果表明,“可被引文獻比冶(15.279)、“基金論文比冶(22.645)、“平均引文數(shù)冶(24.273)、“引用半衰期冶(20.735)和“被引半衰期冶(15.520)這五個因素的VIF在15和25之間,存在較嚴(yán)重的共線性現(xiàn)象,括號中數(shù)值為對應(yīng)的VIF值;更為嚴(yán)重的是,其它因素的VIF遠大于25,甚至高達10的7次方,存在極度共線性現(xiàn)象。由此可見,“圖情冶期刊的因素之間存在非常嚴(yán)重的多重共線性現(xiàn)象。其次,按照表1里面的因素編號順序,我們計算了建立因素之間的兩兩相關(guān)系數(shù)矩陣,從而挑選共線性程度較低的期刊因素。因為我們不關(guān)注相關(guān)性的正負,而是關(guān)注相關(guān)性的大小,所以相關(guān)系數(shù)矩陣包含的是相關(guān)系數(shù)的絕對值。為了進一步分析這些因素之間的關(guān)系,我們應(yīng)用非負矩陣分解算法對該矩陣實施聚類。經(jīng)觀察發(fā)現(xiàn),這些因素可以形成4個聚類。其中,第1個聚類包含11個因素,包括10種綜合類、復(fù)合類以及社科統(tǒng)計源期刊引用的影響因子和即年指標(biāo)、以及“web即年下載率冶,其內(nèi)部的平均相關(guān)系數(shù)高達0.935。第2個聚類包含10個因素,包括8種復(fù)合類、綜合類總被引和各種統(tǒng)計源引用、“被引期刊數(shù)冶和“總下載量(萬次)冶,其內(nèi)部的平均相關(guān)系數(shù)為0.841。第3個聚類包含7個因素,包括4種可被引文獻量、2種半衰期和“引用期刊數(shù)冶,其內(nèi)部的平均相關(guān)系數(shù)為0.545。第4個聚類包含5個因素,分別是“可被引文獻比冶、“基金論文比冶、“平均引文數(shù)冶、“他引總引比冶、“互引指數(shù)冶,其內(nèi)部的平均相關(guān)系數(shù)較低,僅為0.229。圖2(a)顯示了因素相關(guān)系數(shù)圖,其中節(jié)點表示期刊因素,連邊表示因素之間的相關(guān)系數(shù),粗連邊表示高相關(guān)性,細連邊表示低相關(guān)性;為了突顯聚類,因素聚類用虛線框和對應(yīng)的序號進行標(biāo)定。最后,針對相關(guān)系數(shù)很高的聚類,只選擇其中第一個因素作為該聚類的代表因素。對于相關(guān)系數(shù)較低的聚類,選擇全部的因素??偣搏@得了8個因素,包括“復(fù)合總被引冶、“復(fù)合影響因子冶、“可被引文獻量冶、“可被引文獻比冶、“基金論文比冶、“平均引文數(shù)冶、“他引總引比冶和“互引指數(shù)冶。在重新計算它們的VIF之后,我們發(fā)現(xiàn)由于“可被引文獻量冶的VIF值(4.314)相對其它的因素而言數(shù)值較大,而且與其他因素的相關(guān)性超過了0.600,因此為了降低共線性程度進一步剔除了該因素。最終采用其它7個因素進行期刊影響力分析。如圖2(b)所示,這些因素的VIF值均小于2.500,平均VIF值為1.693,“基金論文比冶具有最大的VIF值2.207。同時,我們也統(tǒng)計了它們之間的相關(guān)系數(shù)。如圖2(c)表示,其相關(guān)性絕對值總體較低,平均相關(guān)系數(shù)僅為0.250;最大的相關(guān)性發(fā)生在“基金論文比冶因素,它分別與“平均引文數(shù)冶和“復(fù)合影響因子冶之間的相關(guān)系數(shù)值為0.557和0.520;最小的相關(guān)性發(fā)生在“復(fù)合影響因子冶和“他引總引比冶之間,兩者幾乎完全獨立。這些結(jié)果表明,所選因素之間具有很低的共線性程度,可以用來進行下一步的期刊排序,從而可以用來指導(dǎo)期刊發(fā)展和提高期刊影響力。2.2基于深度自編碼器的期刊排序。在實證分析中,根據(jù)隱層數(shù)目與神經(jīng)元數(shù)目,設(shè)計了不同構(gòu)架的自編碼器,以將上一節(jié)選出的期刊因素拼接在一起作為自編碼器的輸入。采用了四種不同層數(shù)的自編碼器構(gòu)架,其隱層數(shù)目分別為1,2,3,4,并分別調(diào)查了每一種構(gòu)架對應(yīng)的隱層神經(jīng)元數(shù)目。通常隱層數(shù)目在3及以上的自編碼器被稱為深度自編碼器。為了描述方便,這里采用{A,B,C,D}的格式來表示自編碼器構(gòu)架,其中字母數(shù)目表示層數(shù),字母本身表示該層的神經(jīng)元數(shù)目。以“圖情冶期刊為例,我們設(shè)計了漸進式的構(gòu)架設(shè)計策略,即先調(diào)查隱層數(shù)目為1時對應(yīng)的神經(jīng)元數(shù)目,然后在此基礎(chǔ)上調(diào)查隱層數(shù)目為2時對應(yīng)的神經(jīng)元數(shù)目,以此類推,直至確定最后一個自編碼器構(gòu)架中的神經(jīng)元數(shù)目。具體過程如下:(1)當(dāng)采用一個隱層{L}的時候,我們分別調(diào)查了L分別等于2~10、15、20、30、40、50和60條件下自編碼器的隱空間輸出結(jié)果。由于CI是目前最好的期刊影響力度量指標(biāo)之一,我們計算了第一個隱元與CI的相關(guān)系數(shù),并期望第一隱元能夠正向衡量期刊影響力,所以選擇這個相關(guān)系數(shù)為正且數(shù)值最大時對應(yīng)的神經(jīng)元數(shù)目作為該隱層的最佳神經(jīng)元數(shù)目。我們發(fā)現(xiàn),L=3對應(yīng)最好結(jié)果。同時,該值也可為多個期刊的影響力分布提供了一種可視化手段。因此我們選擇3作為自編碼器{L}的隱層神經(jīng)元數(shù)目,同時也是自編碼器{L,3}中第二個隱層的神經(jīng)元數(shù)目。(2)當(dāng)自編碼器采用{L,3}構(gòu)架時,我們分別調(diào)查了L在同樣條件下自編碼器的隱空間輸出結(jié)果。通過與上一步類似的方法,確立隱層神經(jīng)元數(shù)目L=5。(3)當(dāng)自編碼器采用{L,5,3}構(gòu)架時,確立隱層神經(jīng)元數(shù)目L=50。(4)當(dāng)自編碼器采用{L,50,5,3}構(gòu)架時,確定隱層神經(jīng)元數(shù)目L=30。雖然可以繼續(xù)增加層數(shù)時,但是采用更多隱層構(gòu)架的自編碼所產(chǎn)生的隱元數(shù)值卻越來越小,趨向于過擬合。最終,我們最多只考慮采用四層的深度自編碼器構(gòu)架。此外,盡管最終獲得了三個維度的隱變量,但結(jié)果表明只取前兩個隱元來顯示期刊分布就足夠了。圖3(a)、(b)、(c)、(d)分別顯示了“圖情冶期刊由四種自編碼器生成的隱空間分布。為了方便可視化,使用CI分區(qū)作為期刊的標(biāo)記,其中圓點、方塊、三角和淺藍菱形分布表示1、2、3、4區(qū)期刊。由四個不同構(gòu)架自編碼器生成的期刊分布結(jié)果如下:(1)當(dāng)采用第1個自編碼構(gòu)架時:對比CI分區(qū)結(jié)果,第一個隱元與CI值的Spearman相關(guān)系數(shù)等于0.7582。其中,CI值排名前三的1區(qū)期刊《中國圖書館學(xué)報》、《圖書情報工作》、《情報雜志》與其它1區(qū)期刊相對分散;有兩個1區(qū)期刊《大學(xué)圖書館學(xué)報》《圖書館論壇》與2區(qū)期刊靠近;大多數(shù)2區(qū)期刊與1區(qū)期刊鄰近,但《醫(yī)學(xué)信息學(xué)雜志》遠離其它2區(qū)期刊;隸屬于3區(qū)的期刊與4區(qū)期刊和2區(qū)期刊均呈現(xiàn)較大重疊混雜。(2)當(dāng)采用第2個自編碼構(gòu)架時:第一個隱元與CI值的Spearman相關(guān)系數(shù)等于0.8028。期刊分布更加突顯了1區(qū)期刊與其它期刊的不同,大部分1區(qū)期刊保持與其它期刊分離的狀態(tài);兩個2區(qū)期刊《情報學(xué)報》和《現(xiàn)代圖書情報技術(shù)》靠近1區(qū)期刊;此外,在2區(qū)期刊當(dāng)中,除了《醫(yī)學(xué)信息學(xué)雜志》之外,《現(xiàn)代情報》也略遠離其它同分區(qū)期刊;4區(qū)期刊《圖書情報導(dǎo)刊》遠離其它的同分區(qū)期刊。(3)當(dāng)采用第3個自編碼構(gòu)架時:期刊的分布范圍進一步縮小,期刊分區(qū)邊界初步顯現(xiàn),呈現(xiàn)出與第一個隱元相關(guān)的趨勢,其與CI值的spearman相關(guān)系數(shù)為0.826;CI值排名第一和第二的1區(qū)期刊《中國圖書館學(xué)報》《圖書情報工作》突顯出了與其它期刊不同,而其他兩個2區(qū)期刊《情報學(xué)報》和《現(xiàn)代圖書情報技術(shù)》呈現(xiàn)靠近1區(qū)期刊的趨勢,分別與《情報雜志》、《情報理論與實踐》和《情報科學(xué)》相近。(4)當(dāng)使用第4個自編碼構(gòu)架時,所有期刊被映射成一條近似單調(diào)直線,能夠使用第一個隱元對期刊進行排序和分區(qū),其中第一個隱元與CI值的Spearman相關(guān)系數(shù)為0.8503;1區(qū)期刊可分為三組,第一組包括《中國圖書館學(xué)報》和《圖書情報工作》;第二組包括《情報雜志》《情報理論與實踐》《情報資料工作》《情報科學(xué)》《圖書情報知識》《圖書與情報》,但是2區(qū)期刊《情報學(xué)報》和《現(xiàn)代圖書情報技術(shù)》位于其中;第三組包括《大學(xué)圖書館學(xué)報》《圖書館論壇》,但是它們與其他分區(qū)的期刊混雜在一起。此外,其它分區(qū)期刊存在不同程度的混雜重疊。總的來說,自編碼器能夠一個以非線性方式綜合了多個高獨立性期刊因素的期刊排序度量,其第一個隱元可以用來作為期刊排序度量值(排序得分)。另外,也應(yīng)用深度自編碼器在“法律冶期刊和“體育冶期刊。由于篇幅限制,只選用了采用一個隱層和四個隱層這兩種自編碼器構(gòu)架的期刊排序結(jié)果,如圖4所示。期刊排序結(jié)果表明,這兩大類期刊表現(xiàn)為與“圖情冶期刊相似的規(guī)律。當(dāng)采用一個隱層時,期刊較為分散,第一個隱元與CI的相關(guān)系數(shù)分別為0.748和0.501,但是該構(gòu)架利于發(fā)現(xiàn)離群期刊,如“法律冶期刊里面的《法制與社會》和《武漢公安干部學(xué)院學(xué)報》,“體育冶期刊中的《冰雪運動》。當(dāng)采用四個隱層時,期刊分布呈現(xiàn)規(guī)律性,第一個隱元與CI的相關(guān)系數(shù)分別為0.796和0.838。再次說明,第一個隱元可以用來作為分區(qū)得分。2.3分區(qū)方法對比?,F(xiàn)有分區(qū)方法均根據(jù)期刊順序和數(shù)量來實施,可分為基于平均劃分的方法和基于固定非平均劃分的方法。前者的代表方法包括JCR分區(qū)方法和CI分區(qū)方法,后者的代表方法有中科院分區(qū)?;诂F(xiàn)有的劃分策略,本節(jié)對應(yīng)地設(shè)計了深度學(xué)習(xí)平均分區(qū)方法(簡稱DL平均分區(qū))和深度學(xué)習(xí)非平均方法(簡稱DL非平均分區(qū)),并以“圖情冶期刊為例進行對比分析。JCR分區(qū)和中科院分區(qū)分別使用影響因子作為期刊排序度量,而中國學(xué)術(shù)期刊影響因子年報(簡稱“年報冶)提供的兩大類影響因子:復(fù)合類和綜合類。為了實施后續(xù)的期刊分區(qū)方法對比,首先調(diào)查了復(fù)合類影響因子與綜合類影響因子在JCR分區(qū)和中科院分區(qū)中的差異。對比結(jié)果表明,兩者無論是對于JCR分區(qū)還是對于中科院分區(qū)而言,結(jié)果非常接近,在42個“圖情冶期刊中只有2個期刊的分區(qū)不同。因此,在后續(xù)的分區(qū)方法對比當(dāng)中,只采用“復(fù)合影響因子冶(簡稱“影響因子冶)來分析JCR分區(qū)和中科院分區(qū)結(jié)果。對應(yīng)于期刊分區(qū)策略,分區(qū)方法對比分為兩個部分。首先,以CI分區(qū)為基準(zhǔn),對比了采用平均劃分的JCR分區(qū)方法和DL平均分區(qū)方法。主要對比結(jié)果如下:(1)在CI的1區(qū)期刊列表中,JCR分區(qū)將《情報科學(xué)》和《圖書館論壇》分為2區(qū),DL平均分區(qū)將《大學(xué)圖書館學(xué)報》和《圖書館論壇》分為2區(qū);(2)在CI的2區(qū)期刊列表中,JCR分區(qū)將《圖書館雜志》《國家圖書館學(xué)刊》分為1區(qū),將《圖書館理論與實踐》和《醫(yī)學(xué)信息學(xué)雜志》為3區(qū);DL平均分區(qū)將《情報學(xué)報》和《現(xiàn)代圖書情報技術(shù)》分為1區(qū),將《圖書館雜志》、《圖書館工作與研究》和《圖書館理論與實踐》為3區(qū);(3)在CI的3區(qū)期刊列表中,JCR分區(qū)和DL平均分區(qū)同時將《中華醫(yī)學(xué)圖書情報雜志》分為2區(qū)、將《農(nóng)業(yè)圖書情報學(xué)刊》和《農(nóng)業(yè)網(wǎng)絡(luò)信息》分為4區(qū);此外,JCR分區(qū)將《文獻》為4區(qū),而DL平均分區(qū)卻將其分為2區(qū),將《圖書館學(xué)刊》和《四川圖書館學(xué)報》分為4區(qū);(4)在CI的4區(qū)期刊列表中,JCR分區(qū)將《大學(xué)圖書情報學(xué)刊》《圖書館界》為3區(qū),DL平均分區(qū)將《古籍整理研究學(xué)刊》《圖書館界》《數(shù)字圖書館論壇》《中國典籍與文化》分為3區(qū)。其次,以采用非平均劃分的中科院分區(qū)為基準(zhǔn),對照CI值和CI分區(qū),設(shè)計了一個CI非平均分區(qū),并對比了DL非平均分區(qū)。主要對比結(jié)果如下:(1)中科院分區(qū)的兩個1區(qū)期刊中,CI和DL非平均分區(qū)將《大學(xué)圖書館學(xué)報》分別分為2區(qū)和3區(qū);(2)在中科院分區(qū)的六個2區(qū)期刊中,CI和DL非平均分區(qū)都將《圖書情報工作》分為1區(qū),將《情報雜志》分為2區(qū);前者將《情報資料工作》《現(xiàn)代圖書情報技術(shù)》分為3區(qū);后者將《圖書情報知識》《圖書與情報》分為3區(qū);(3)在中科院分區(qū)的十三個3區(qū)期刊中,CI和DL非平均分區(qū)都將《情報理論與實踐》《情報科學(xué)》分為2區(qū);前者將《信息資源管理學(xué)報》分為4區(qū);后者將《情報學(xué)報》分為2區(qū),將《圖書館雜志》《圖書館工作與研究》分為4區(qū);(4)在中科院分區(qū)的二十一個4區(qū)期刊中,CI非平均分區(qū)將《圖書館理論與實踐》分為3區(qū),DL非平均分區(qū)將《中華醫(yī)學(xué)圖書情報雜志》和《文獻》分為3區(qū)。綜上所述,在給定平均劃分條件下,三種分區(qū)方法在1區(qū)和4區(qū)的分區(qū)結(jié)果差異不大;在給定非平均劃分條件下,由于非平均劃分條件下1區(qū)和2區(qū)期刊數(shù)目較小,三種分區(qū)方法的結(jié)果差異稍大;少量期刊主要表現(xiàn)為分區(qū)差值臨近,沒有出現(xiàn)跨越一個及以上分區(qū)的差異情況;此外,《中國圖書館學(xué)報》在所有分區(qū)結(jié)果中均排名第一。詳細對比結(jié)果如表2和表3所示。
3結(jié)論
現(xiàn)有分區(qū)方法(JCR分區(qū)、CI分區(qū)和中科院分區(qū))只使用單個期刊因素或兩個期刊因素對期刊進行排序,而忽視了能夠充分反映期刊性質(zhì)的其它多種期刊因素。另外,在使用多種期刊因素來評價期刊影響力時,因素之間的多重共線性關(guān)系會干擾評價的準(zhǔn)確性。針對這些問題,本文以“圖書館學(xué);情報學(xué)冶為實例進行研究。首先,利用相關(guān)系數(shù)矩陣和方差膨脹因子挑選了高獨立性的七個重要期刊因素,包括“復(fù)合總被引冶、“復(fù)合影響因子冶、“可被引文獻比冶、“基金論文比冶、“平均引文數(shù)冶、“他引總引比冶和“互引指數(shù)冶。然后,應(yīng)用漸進式深度自編碼器構(gòu)架設(shè)計策略,提出了一種基于深度自編碼器的期刊排序方法。實例研究結(jié)果表明,本文方法不僅能提供一個多層次分析特定學(xué)科中期刊的全局和局部關(guān)系,而且能夠以非線性方式將多個期刊表征因素融合為單個期刊排序得分,進而能進行期刊影響力排序并實施期刊分區(qū)。