網(wǎng)絡(luò)資源信息老化研究論文
時間:2022-03-12 08:51:00
導語:網(wǎng)絡(luò)資源信息老化研究論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
科學文獻老化的探索源于1944年美國紐約大學的戈斯內(nèi)爾(C.F.Gosnell)在美國《大學與研究機構(gòu)圖書館》雜志上發(fā)表的題為《大學圖書館中文獻老化問題》的論文,在傳統(tǒng)文獻老化規(guī)律研究領(lǐng)域,已經(jīng)形成了以半衰期(Half-Life)和普賴斯指數(shù)(PriceIndex)為主要指標,以負指數(shù)模型、巴爾頓—凱普勒老化方程、布魯克斯老化方程等為方法的研究體系。但是,這些指標和模型是否同樣適用于網(wǎng)絡(luò)信息資源的老化研究,目前還沒有得到充分的論證。以下的部分,我們在分析網(wǎng)絡(luò)信息資源老化原因的基礎(chǔ)上,通過比較傳統(tǒng)文獻資源和網(wǎng)絡(luò)信息資源老化的差異,從理論上初步探討衡量網(wǎng)絡(luò)信息資源老化的指標。
1網(wǎng)絡(luò)信息資源老化的原因及特征
1.1網(wǎng)絡(luò)信息資源老化的原因
網(wǎng)絡(luò)信息資源的老化是指網(wǎng)絡(luò)信息資源中情報的有效價值隨著時間的流逝逐漸衰減,利用率逐步降低。這與傳統(tǒng)文獻的老化一樣,是一種普遍存在的現(xiàn)象。造成網(wǎng)絡(luò)信息資源老化的因素很多,我們大致可以將其歸納為以下幾個方面:
(1)網(wǎng)絡(luò)信息資源的增長。情報學家M.勞恩曾說過:“文獻增長得越快,文獻的半衰期就越短?!毙畔①Y源的增長和老化是同一事物的兩個方面,它們從不同的角度反映信息資源的動態(tài)變化。眾所周知,網(wǎng)絡(luò)信息資源的增長速度極其驚人。以我國為例,據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心的統(tǒng)計,2002年12月31日,全國網(wǎng)頁總數(shù)為157,091,220個,字節(jié)總數(shù)為2,877,754,095KB[1];2003年12月31日,全國網(wǎng)頁總數(shù)為311,864,590個,字節(jié)總數(shù)為6,059,431,526KB[2];到2004年12月31日,全國網(wǎng)頁總數(shù)就達到了650,682,300個,字節(jié)總數(shù)增長到20,537,214,718KB,與2003年相比,增幅分別為108.6%和238%[3]。
(2)網(wǎng)絡(luò)信息資源的更新。網(wǎng)絡(luò)信息資源的更新是指網(wǎng)絡(luò)信息資源在載體形態(tài)、數(shù)據(jù)組織方式、網(wǎng)址等外在特征不變的情況下,所含知識和情報在內(nèi)容上的變化。1998和1999年,Bar-Ilan和Peritz對信息計量學領(lǐng)域網(wǎng)絡(luò)信息的生命周期研究表明,在6個月內(nèi)近50%的網(wǎng)頁發(fā)生了變化[4];而WallaceKoehler的觀察結(jié)果更為顯著,他發(fā)現(xiàn)97%的網(wǎng)站6個月內(nèi)會發(fā)生變化,如觀察時間為1年,則比例上升為99%。對于網(wǎng)頁而言,這組數(shù)據(jù)分別為98.3%和99.1%[5]。應(yīng)該指出的是,網(wǎng)絡(luò)信息資源更新并沒有引起網(wǎng)絡(luò)信息資源總量的增長。
(3)網(wǎng)絡(luò)信息資源的消失。網(wǎng)絡(luò)信息資源的消失是指網(wǎng)絡(luò)信息資源無論出于何種原因,被從系統(tǒng)中刪除,不能再被訪問和利用。文獻[4]表明,68%的網(wǎng)頁1年內(nèi)將被從網(wǎng)上移除;而文獻[5]發(fā)現(xiàn),有12.2%的網(wǎng)站和20.5%的網(wǎng)頁6個月后不能再被訪問到。1年后,分別上升到17.7%和31.8%。并且,每周有0.5%的網(wǎng)頁和網(wǎng)站消失。與網(wǎng)絡(luò)信息資源的更新不同,網(wǎng)絡(luò)信息資源的消失意味著網(wǎng)絡(luò)信息資源總量的減少。
(4)替代性網(wǎng)絡(luò)信息資源的出現(xiàn)。隨著人類對客觀事物和社會運動規(guī)律認識水平的提高,原有的知識不斷被完善和突破。同時,由于技術(shù)的進步和社會信息需求的共同推動,網(wǎng)上信息的加工深度越來越大,原有的知識和情報被包含在新的知識和情報之中,因而,原來不完善、不全面的陳舊信息資源逐漸不再被利用。替代性網(wǎng)絡(luò)信息資源的出現(xiàn)并不意味著原有信息資源的更新和消失,而表現(xiàn)為網(wǎng)絡(luò)信息資源中,蘊含新知識和情報的信息的出現(xiàn)和信息總量的增長。
(5)網(wǎng)絡(luò)信息資源的吸引力。網(wǎng)絡(luò)信息資源的吸引力主要來自兩個方面:一是網(wǎng)絡(luò)信息資源所揭示和反映的對象所處的發(fā)展階段。處于誕生和發(fā)展初期的事物,相關(guān)網(wǎng)絡(luò)信息資源的數(shù)量往往呈指數(shù)增長,老化遵循負指數(shù)函數(shù)關(guān)系。進入成熟期后,信息的增長速率變小,老化曲線也變得平緩,半衰期加長。當對該事物的認識積累到一定程度,將出現(xiàn)質(zhì)的飛躍,相關(guān)信息的增長進入新一輪的指數(shù)增長階段,相應(yīng)的,老化曲線也恢復成負指數(shù)曲線。二是網(wǎng)絡(luò)信息資源的受關(guān)注程度。對于網(wǎng)絡(luò)信息資源所揭示和反映的對象而言,受關(guān)注程度越高,往往意味著知識更新越快,半衰期越短,反之則越長。對于網(wǎng)絡(luò)信息資源自身而言,其受關(guān)注程度遵循“Winnertakesall”法則,受關(guān)注程度越高的網(wǎng)絡(luò)信息資源半衰期越短,也就是說信息更新越快,質(zhì)量和數(shù)量也穩(wěn)步提升。
1.2網(wǎng)絡(luò)信息資源老化的特征
網(wǎng)絡(luò)信息資源老化與傳統(tǒng)文獻資源老化既有相同之處,又有顯著的差異,其獨特之處主要表現(xiàn)在:
(1)非累積性。傳統(tǒng)文獻資源的重要特征之一就是其存在的永續(xù)性,即使這些載體上的知識和情報完全失去了使用價值,它也不會消失。原有信息的修正與更新、替代信息的生產(chǎn)以及新信息的產(chǎn)生必須依靠新的載體。因此,傳統(tǒng)文獻資源從數(shù)量上來說,總是不斷增長的。而網(wǎng)絡(luò)信息資源則不然。網(wǎng)絡(luò)環(huán)境中的信息是介于產(chǎn)生后永續(xù)存在與即刻消失兩種狀態(tài)之間的第三類信息,它的更新和消亡是其存在和運動的常態(tài)。在網(wǎng)絡(luò)環(huán)境下,新信息的出現(xiàn)并不一定意味著信息總量的增長,而且,相當一部分信息在喪失其使用價值之后會徹底消失,引起信息總量的減少,呈現(xiàn)負增長狀態(tài)。所以,我們認為網(wǎng)絡(luò)信息資源具有非累積性,這表明網(wǎng)絡(luò)信息資源的老化研究往往只能基于特定時間點或時間段,難以系統(tǒng)地回溯其歷史狀態(tài)。
(2)動態(tài)性。動態(tài)性與非累積性是內(nèi)在統(tǒng)一的。任何信息都是外在形態(tài)與所含內(nèi)容的統(tǒng)一體。記錄信息的載體和信息的組織方式是信息資源的外在形態(tài),而內(nèi)容,即其所蘊含的知識和情報才是核心。傳統(tǒng)文獻資源的外部形態(tài)和內(nèi)容是不可分割的,因而必然具有累積性。而網(wǎng)絡(luò)信息資源的外部形態(tài)和內(nèi)容可以是相互獨立的,因此,在網(wǎng)絡(luò)信息資源載體的形態(tài)、信息組織方式、網(wǎng)址等保持不變的情況下,內(nèi)容可以不斷更新,甚至刪除,這就體現(xiàn)為它的非累積性。眾所周知,半衰期、普賴斯指數(shù)的測定都是依據(jù)特定領(lǐng)域文獻資源的被利用情況,而網(wǎng)絡(luò)信息資源的動態(tài)性使其老化規(guī)律的研究增加了新的內(nèi)容,即對網(wǎng)絡(luò)信息資源自身生命周期的研究。
(3)不完全性。傳統(tǒng)文獻,的生產(chǎn)和傳播是受控的,由相關(guān)機構(gòu)統(tǒng)一審核和管理。因此,在傳統(tǒng)文獻資源老化研究中,研究對象的范圍一般相當清晰,在數(shù)量上也是可數(shù)的。而在網(wǎng)絡(luò)信息資源的老化研究中,研究對象的不完全性卻是無法回避的問題。導致該問題出現(xiàn)的原因主要來自兩個方面:一是網(wǎng)絡(luò)的開放性決定了網(wǎng)上信息的基本上處于不受控制的狀態(tài),因此,任何研究者都無法確知網(wǎng)絡(luò)信息資源的精確構(gòu)成和分布狀況,在研究特定領(lǐng)域的網(wǎng)絡(luò)信息資源時,也就不可能準確地劃定研究對象的范圍和數(shù)量。二是網(wǎng)絡(luò)信息資源的非累積性和動態(tài)性造成了研究對象在時間維度上的缺失,因此,在研究中也就難以系統(tǒng)地回溯研究對象的歷史狀態(tài)。
2衡量網(wǎng)絡(luò)信息資源老化狀況的指標
根據(jù)網(wǎng)絡(luò)信息資源老化的原因及其特征,我們從網(wǎng)絡(luò)信息資源自身的生命周期和網(wǎng)絡(luò)信息資源被利用情況兩個方面,建立衡量網(wǎng)絡(luò)信息資源老化狀況的指標。
2.1網(wǎng)絡(luò)信息資源的生命周期
網(wǎng)絡(luò)信息資源的生命周期反映的是網(wǎng)絡(luò)信息資源自身的老化狀況,可以采用半衰期和生存期兩項指標衡量。
2.1.1半衰期
半衰期源于物理學領(lǐng)域,原指放射性元素的原子核有半數(shù)發(fā)生衰變所需的時間。我們借用這一概念,將網(wǎng)絡(luò)信息資源的半衰期定義為網(wǎng)絡(luò)信息資源的基本構(gòu)成元素有半數(shù)發(fā)生變化所需的時間。根據(jù)是否考慮網(wǎng)絡(luò)信息資源的增量部分,網(wǎng)絡(luò)信息資源的半衰期又可以分為靜態(tài)半衰期和動態(tài)半衰期。
(1)靜態(tài)半衰期。靜態(tài)半衰期是指在不考慮增長的情況下,網(wǎng)絡(luò)信息資源的基本構(gòu)成元素有半數(shù)發(fā)生變化(含消失)的時間。例如,以網(wǎng)頁為基本構(gòu)成元素,考察網(wǎng)站A的靜態(tài)半衰期。假設(shè)網(wǎng)站A有10000個網(wǎng)頁,每個月有1000個不同的網(wǎng)頁發(fā)生變化,并且有100個網(wǎng)頁消失。根據(jù)上述定義,網(wǎng)站A的靜態(tài)半衰期為10000÷2÷(1000+100)=4.55(月)或0.38(年)。
(2)動態(tài)半衰期。動態(tài)半衰期是在考慮增長的情況下,網(wǎng)絡(luò)信息資源的基本構(gòu)成元素中較新的一半產(chǎn)生于多長時間內(nèi)。例如,在上例的基礎(chǔ)上,假設(shè)網(wǎng)站A每個月新增500個網(wǎng)頁。根據(jù)動態(tài)半衰期的定義,網(wǎng)站A的動態(tài)半衰期為10000÷[2×(1000+500)-(500-100)]=3.85(月)或0.32(年)。
當然,半衰期的計算在實際研究中情況會復雜得多。首先,網(wǎng)頁不會勻速地發(fā)生變化、消失和增長;其次,一個網(wǎng)頁可能連續(xù)多次發(fā)生變化,由于我們考察的基本元素是網(wǎng)頁,因此只能將其計為一次;第三,在計算動態(tài)半衰期時必須認識到,新增網(wǎng)頁也會發(fā)生變化;最后,出于研究的需要,我們可能會選擇在信息組織上比網(wǎng)頁粒度更細的單元作為基本構(gòu)成元素,譬如知識單元、網(wǎng)絡(luò)鏈接、單詞等。
2.1.2生存期
網(wǎng)絡(luò)信息資源的生存期是指特定網(wǎng)絡(luò)信息資源的URL存續(xù)時間。如同人的遺傳密碼一樣,URL是區(qū)分不同網(wǎng)絡(luò)信息資源的唯一標識,因此,我們認為URL是判定網(wǎng)絡(luò)信息資源生存期最理想的依據(jù)。根據(jù)該定義,只要URL保持不變,無論內(nèi)容如何變化,都視為同一個網(wǎng)絡(luò)信息資源。在極端情況下,特定URL所對應(yīng)的網(wǎng)絡(luò)信息資源內(nèi)容甚至可以為空反之,即使內(nèi)容沒有發(fā)生任何變化,只要URL被改動,我們就視為原信息資源“生命”的終結(jié)和新網(wǎng)絡(luò)信息資源的誕生。當然,如果特定網(wǎng)絡(luò)信息資源及其URL同時被刪除,同樣也意味著該網(wǎng)絡(luò)信息資源生存期的終止。
2.2網(wǎng)絡(luò)信息資源的價值周期
網(wǎng)絡(luò)信息資源的價值周期的計量依據(jù)是其被利用的狀況,這與傳統(tǒng)文獻資源老化規(guī)律的研究思路基本相同。文獻半衰期的研究可以分為學科文獻的半衰期和論文的半衰期。學科文獻的半衰期是指某學科(專業(yè))現(xiàn)時尚在利用的全部文獻中較新的一半是在多長一段時間內(nèi)發(fā)表的;論文半衰期是指引用這篇論文的全部其他論文的二分之一是在這篇后的多長時間內(nèi)發(fā)表的。需要強調(diào)的是,學科文獻的半衰期是相對于被引文獻而言,而論文的半衰期是相對于引用文獻而言的[6]。與此相對應(yīng),我們?nèi)匀灰浴鞍胨テ凇睘橹笜撕饬烤W(wǎng)絡(luò)信息資源的價值周期,并按研究對象分為宏觀網(wǎng)絡(luò)信息資源半衰期和微觀網(wǎng)絡(luò)信息資源半衰期。
(1)宏觀網(wǎng)絡(luò)信息資源半衰期。根據(jù)學科文獻半衰期的概念,我們將宏觀網(wǎng)絡(luò)信息資源半衰期定義為某主題領(lǐng)域網(wǎng)絡(luò)信息資源所含鏈接的鏈宿所指資源中較新的一半是在多長時間內(nèi)產(chǎn)生的。例如,如果我們說網(wǎng)絡(luò)信息計量學的網(wǎng)絡(luò)信息資源半衰期是1.2年,就表明在我們進行統(tǒng)計研究的那一年里,在網(wǎng)上的網(wǎng)絡(luò)信息計量學文獻中的鏈接所指資源的50%是在最近1.2年內(nèi)發(fā)表的。
宏觀網(wǎng)絡(luò)信息資源半衰期的研究是基于網(wǎng)絡(luò)信息資源中的鏈接。由于網(wǎng)絡(luò)信息資源中的鏈接與文獻的被引文獻是性質(zhì)完全不同的兩類事物,因此,在借鑒其研究思路的同時,我們應(yīng)該注意自身的特殊性。筆者認為,最重要的幾個需要解決的問題是:第一,必須明確鏈接的目的,也就是鏈源與鏈宿之間的關(guān)系;第二,當鏈宿的時間晚于鏈源所在網(wǎng)絡(luò)信息資源的時間時應(yīng)當如何計算;第三,是應(yīng)該采用網(wǎng)絡(luò)信息資源中所有的鏈接,還是只考察出鏈;第四,從理論上來說,我們需要獲得該主題領(lǐng)域的所有網(wǎng)絡(luò)信息資源,并提取其所含有的鏈接。由于網(wǎng)絡(luò)信息資源的不完全性,研究結(jié)果可能與客觀實際存在相當程度的差異。
(2)微觀網(wǎng)絡(luò)信息資源半衰期。參照論文半衰期的概念,微觀網(wǎng)絡(luò)信息資源半衰期是指指向該網(wǎng)絡(luò)信息資源的全部其他網(wǎng)絡(luò)信息資源的二分之一是在其后的多長時間內(nèi)出現(xiàn)的。例如,網(wǎng)上某文檔的半衰期是1.5年,就意味著該文檔所獲得入鏈的鏈源所在網(wǎng)絡(luò)信息資源的50%出現(xiàn)于其后的1.5年內(nèi)。
與宏觀網(wǎng)絡(luò)信息資源半衰期的研究相比,微觀網(wǎng)絡(luò)信息資源半衰期研究所面臨的問題相對較少。根據(jù)上述定義,微觀網(wǎng)絡(luò)信息資源半衰期的研究不涉及自鏈,并且基本不會出現(xiàn)入鏈的鏈源所在資源的時間早于研究對象出現(xiàn)時間這樣的情況。因此,需要考慮的問題中最主要的就是解決或盡量縮小網(wǎng)絡(luò)信息資源的不完全性。盡管有研究表明,網(wǎng)絡(luò)鏈接的使用動機與文獻引用動機存在巨大差異,但筆者認為,無論處于何種動機,網(wǎng)絡(luò)信息資源獲得入鏈就意味著其使用價值的實現(xiàn),我們在計量其半衰期時不必做過多的區(qū)分[7]。
3網(wǎng)絡(luò)信息資源老化研究展望
網(wǎng)絡(luò)信息資源的老化研究與網(wǎng)絡(luò)信息資源的增長、分布與利用研究共同構(gòu)成了網(wǎng)絡(luò)信息計量學研究的基本框架,對豐富與完善網(wǎng)絡(luò)信息計量學的學科體系具有極高的理論價值。同時,網(wǎng)絡(luò)信息資源老化研究的成果也是網(wǎng)絡(luò)信息資源建設(shè)、管理和利用的依據(jù),具有重要的現(xiàn)實意義。
目前,國內(nèi)對網(wǎng)絡(luò)信息資源的老化研究才剛剛起步,所見文獻僅有2004年王宏鑫和邱均平在《情報理論與實踐》第4期所發(fā)表的《關(guān)于網(wǎng)絡(luò)信息老化研究的若干問題》一文[8]。因此,在現(xiàn)階段應(yīng)該借鑒文獻計量學的研究成果,在充分認識網(wǎng)絡(luò)信息資源與傳統(tǒng)文獻資源所存在差異的基礎(chǔ)上,建立網(wǎng)絡(luò)信息資源老化研究的理論與方法體系,為探索網(wǎng)絡(luò)信息資源老化規(guī)律和實踐應(yīng)用奠定基礎(chǔ)。
【參考文獻】
12002年中國互聯(lián)網(wǎng)絡(luò)信息資源數(shù)量調(diào)查報告./html/Dir/2003/11/22/1393.htm
22003年中國互聯(lián)網(wǎng)絡(luò)信息資源數(shù)量調(diào)查報告./download/manual/report20030330.pdf
32004年中國互聯(lián)網(wǎng)絡(luò)信息資源數(shù)量調(diào)查報告./download/2005/2005041401.pdf
4Bar-Ilan,PeritzB.C.ThelifespanofaspecifictopicontheWeb:thecaseof"informatrics"aquantitativeanalysis.Scientometrics.1999,46(3):371-382
5WallaceKoehler.AnAnalysisofWebPageandWebSiteConstancyandPermanence.JournaloftheAmericanSocietyforInformationScience.1999,50(2).
6邱均平編著.文獻計量學.北京:科學技術(shù)文獻出版社,1988.
7HakJoonKim.Motivationsforhyperlinkinginscholarlyelectronicarticles:Aqualitativestudy.JournaloftheAmericanSocietyforInformationScience.2000,51(10)
8王宏鑫,邱均平.關(guān)于網(wǎng)絡(luò)信息老化研究的若干問題.情報理論與實踐.2004(4)
- 上一篇:機械化質(zhì)量工作意見
- 下一篇:現(xiàn)代住宅景觀需求論文