網(wǎng)絡(luò)分類法構(gòu)建研究論文

時間:2022-03-12 08:59:00

導(dǎo)語:網(wǎng)絡(luò)分類法構(gòu)建研究論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

網(wǎng)絡(luò)分類法構(gòu)建研究論文

【內(nèi)容提要】文章從建構(gòu)方法、原則、語言、大綱、現(xiàn)代技術(shù)應(yīng)用、具體問題等方面,概括了近年來網(wǎng)絡(luò)信息分類法構(gòu)建研究進(jìn)展。

【摘要題】信息資源建設(shè)與管理

【關(guān)鍵詞】網(wǎng)絡(luò)信息分類法/網(wǎng)絡(luò)信息組織/分類法構(gòu)建

【正文】

根據(jù)網(wǎng)絡(luò)信息和用戶檢索需求的特點(diǎn),依據(jù)網(wǎng)絡(luò)環(huán)境構(gòu)建科學(xué)、實(shí)用的網(wǎng)絡(luò)信息分類法,是信息資源組織管理研究的重點(diǎn)之一。本文主要以1999年—2005年的中國學(xué)術(shù)期刊網(wǎng)數(shù)據(jù)為信息源,從構(gòu)建方法、原則、語言、大綱、信息技術(shù)應(yīng)用等6個方面回顧了近年來網(wǎng)絡(luò)信息分類法構(gòu)建的研究進(jìn)展。

1構(gòu)建網(wǎng)絡(luò)信息分類法的依據(jù)或方法

目前,網(wǎng)絡(luò)信息分類法主要是指網(wǎng)絡(luò)搜索引擎分類體系?;凇胺诸惞ぞ咄ǔJ歉鶕?jù)分類對象的特點(diǎn)和用戶需求,結(jié)合一定的技術(shù)環(huán)境建立的”認(rèn)識,馬張華在《分類搜索引擎類目體系研究》一文中論述了分類搜索引擎類目結(jié)構(gòu)的編制依據(jù):(1)從分類對象來看,網(wǎng)絡(luò)資源的特點(diǎn)是數(shù)量、種類多,動態(tài)性強(qiáng),新興科學(xué)、商業(yè)、娛樂的資源數(shù)量較多,傳統(tǒng)知識門類的資源相對較少,要求有新的、適合處理對象的分類架構(gòu)。(2)從用戶需求來看,網(wǎng)絡(luò)的使用對象涉及所有的終端用戶。(3)從技術(shù)環(huán)境來看,網(wǎng)絡(luò)信息分類體系應(yīng)充分利用計算機(jī)操作環(huán)境與超文本技術(shù),在體系構(gòu)建、類目設(shè)置等方面發(fā)展不同于傳統(tǒng)分類法的技術(shù)特色。[1]

陳樹年提出建構(gòu)網(wǎng)上知識分類體系的(基本結(jié)構(gòu))編制方法,即:①有一個涵蓋各知識領(lǐng)域、結(jié)構(gòu)清晰、層次簡明、能滿足網(wǎng)上信息組織需要的分類體系;②采用等級結(jié)構(gòu)展示知識的系統(tǒng)聯(lián)系,構(gòu)成枝干分明的主題樹或脈絡(luò)清晰的知識地圖;③類目的排列和檢索結(jié)果的排列方法應(yīng)采用對用戶最有用的排列次序;④分類體系的標(biāo)記應(yīng)適當(dāng)保留。[2]石曉華等在分析了網(wǎng)絡(luò)信息分類法與傳統(tǒng)分類法的優(yōu)劣之后,首次提出了建構(gòu)《中國網(wǎng)絡(luò)信息分類法》的建議,并列舉了具體的編制方法,即:①以傳統(tǒng)分類主題體系為基礎(chǔ),建構(gòu)多維的分類體系;②欄目因需而設(shè),突出重點(diǎn);③控制分級,減少欄目層次;④根據(jù)用戶確定欄目名稱的規(guī)范程度。[3]張琪玉則提出了一整套設(shè)計方針,即:①為不同類型的需求提供不同特性的分類體系;②在統(tǒng)一框架下設(shè)置分散獨(dú)立、各自完整的分類體系;③分類體系的類目設(shè)置不以網(wǎng)羅全部網(wǎng)絡(luò)信息資源為目標(biāo);④分類體系應(yīng)具有開放性和可變性,并應(yīng)有反映新穎信息的措施。他也設(shè)計了一個供普通用戶使用的分類體系框架。[4]王知津贊同石曉華的第①、②、③建議,認(rèn)為可以借鑒傳統(tǒng)分類體系,構(gòu)建《網(wǎng)絡(luò)信息分類法》,實(shí)現(xiàn)網(wǎng)絡(luò)信息分類法與主題詞表的結(jié)合,即分類主題一體化。實(shí)現(xiàn)分類主題一體化,需要做好三個方面的工作:①建立一個結(jié)構(gòu)簡明的知識分類體系,通過對信息資源的系統(tǒng)分類,實(shí)現(xiàn)對網(wǎng)絡(luò)信息的宏觀控制;②建立一個智能化的控制詞表,實(shí)現(xiàn)作者語言與用戶檢索語言的控制和轉(zhuǎn)換;③建立分類體系與控制詞表的系統(tǒng)聯(lián)系,即將標(biāo)引語言納入分類體系,這樣既可以用自然語言直接檢索,也可以在任何類下進(jìn)行語詞檢索,從而較好實(shí)現(xiàn)分類與主題的兼容。[5]董琳提出的思路是設(shè)計一個融知識分類、行業(yè)分類、網(wǎng)站信息分類于一體的綜合性中文網(wǎng)站分類體系。[6]該體系把一級大類分為5大模塊:較豐富信息的模塊、高查詢率模塊、學(xué)科專業(yè)模塊、查詢?nèi)肟谀K、綜合網(wǎng)站模塊。常設(shè)20個一級類目,把主題作為主要聚類標(biāo)準(zhǔn),學(xué)科和專業(yè)作為輔助聚類標(biāo)準(zhǔn)。

另外,陸寶益提出編制的具體步驟,即建立專門機(jī)構(gòu),配備專業(yè)人員;開展深入調(diào)研,制定可行計劃;廣泛征求意見,不斷修改完善。[7]其他學(xué)者,如陳代春、趙培云、劉穎、許磊等也從不同角度論述了如何構(gòu)建統(tǒng)一的網(wǎng)絡(luò)信息分類法的問題。

2網(wǎng)絡(luò)信息分類法構(gòu)建的原則

構(gòu)建新的網(wǎng)絡(luò)信息分類體系,需要吸收現(xiàn)有搜索引擎分類體系優(yōu)勢,借鑒傳統(tǒng)分類法的部分長處,并遵循基本的設(shè)計指導(dǎo)原則。有的學(xué)者[8]認(rèn)為,強(qiáng)調(diào)類表的科學(xué)性和專業(yè)性,而忽略了最終用戶——信息需求者的利益,是傳統(tǒng)文獻(xiàn)分類法無法適應(yīng)網(wǎng)絡(luò)信息分類的基本原因之一,所以建立中文網(wǎng)絡(luò)信息分類體系應(yīng)以實(shí)用性為主。持相同觀點(diǎn)的學(xué)者,如,史學(xué)斌提出“實(shí)用性、自然性、系統(tǒng)性和技術(shù)性、針對性”原則[9]。鄭慶勝指出“實(shí)用性、全面性、規(guī)律性、統(tǒng)一性和特殊性”原則[10]等。

持相反觀點(diǎn)的學(xué)者認(rèn)為,首要的原則是科學(xué)性原則。吳丹認(rèn)為,與傳統(tǒng)分類法一樣,網(wǎng)絡(luò)信息分類也必須具備科學(xué)性原則,分類體系仍必須以科學(xué)的知識分類為基礎(chǔ),即科學(xué)性原則、易用性原則、針對性原則、動態(tài)性原則[11]。其他學(xué)者,如陸寶益提出“科學(xué)性、自然性、實(shí)用性、同一性、通用性、兼容性、發(fā)展性”原則[12]、朱蓓玲提出“科學(xué)性、實(shí)用性、易用性、自然性、針對性、快捷性、系統(tǒng)技術(shù)性”原則[13]。敬卿、吳靜提出的“科學(xué)性、實(shí)用性、易用性、自然性、通用性”原則[14]。鄧香蓮提出的“科學(xué)性、簡潔性、直接性、實(shí)用性、動態(tài)性、自然性”原則[15]也應(yīng)歸屬此類。

關(guān)于網(wǎng)絡(luò)信息分類體系的原則,研究者智者見智,較多學(xué)者都提到了應(yīng)遵循“科學(xué)性、實(shí)用性、自然性”原則。主要分歧是強(qiáng)調(diào)科學(xué)性優(yōu)先還是實(shí)用性優(yōu)先。筆者認(rèn)為,網(wǎng)絡(luò)信息分類法要適應(yīng)組織網(wǎng)絡(luò)信息動態(tài)變化的需要,滿足用戶復(fù)雜的信息查詢需求,對于綜合性、大眾性的中文網(wǎng)絡(luò)信息分類體系,必須以實(shí)用性原則為主,兼顧科學(xué)性的原則。

3網(wǎng)絡(luò)信息分類法構(gòu)建的語言

從實(shí)踐來看,傳統(tǒng)的文獻(xiàn)分類法使用的是典型的人工語言,而網(wǎng)絡(luò)信息分類法使用的主要是自然語言。因?yàn)槿斯ふZ言嚴(yán)格的規(guī)范性使用戶喪失了檢索中的自主性和能動性,背離了以人為本的原則,自然語言是檢索語言發(fā)展的必然。[16]張琪玉教授則指出由于自然語言有其固有的缺陷,網(wǎng)絡(luò)信息檢索不可能僅僅使用自然語言,也必須使用人工語言。情報檢索用語發(fā)展的大趨勢,是情報檢索語言的自然語言化和自然語言的情報檢索語言化,是兩者的初級結(jié)合到完全融合的過程。[17]所以有的學(xué)者認(rèn)為需要對網(wǎng)絡(luò)受控語言進(jìn)行適合于網(wǎng)民大眾習(xí)慣用語的改造,提出了“受控語言網(wǎng)民化”的思想。[18]陳晶也指出:“改進(jìn)受控語言的易用化是網(wǎng)絡(luò)環(huán)境下的大勢所趨,而對自然語言進(jìn)行必要的控制也是網(wǎng)絡(luò)環(huán)境下勢在必行的,兩者的相互滲透、有機(jī)結(jié)合是情報檢索語言發(fā)展的大趨勢。”[19]

有的學(xué)者認(rèn)為分類主題一體化語言,實(shí)質(zhì)是受控語言內(nèi)部的一體化,它不能適應(yīng)網(wǎng)絡(luò)檢索的發(fā)展,應(yīng)當(dāng)建立更適合于網(wǎng)絡(luò)信息檢索的自然語言與受控語言結(jié)合的一體化語言。[20]有的學(xué)者通過分析受控語言和自然語言各自在網(wǎng)絡(luò)中的應(yīng)用,分析其優(yōu)缺點(diǎn),指出無論受控語言還是自然語言都有各自獨(dú)特的優(yōu)點(diǎn)和缺陷,不能彼此取代,可以相互補(bǔ)充。而“它們在網(wǎng)絡(luò)中的應(yīng)用研究也表明兩者之間呈現(xiàn)出明顯的相互交織兼容的趨勢”。[21]

筆者認(rèn)為,任何一種語言都有長處和短處,都不能完全滿足網(wǎng)絡(luò)用戶多樣化需求,分類語言和主題語言相結(jié)合、自然語言和人工語言相結(jié)合才是建構(gòu)網(wǎng)絡(luò)信息分類法的發(fā)展趨勢。

4網(wǎng)絡(luò)信息分類法的大綱設(shè)計

對網(wǎng)絡(luò)信息分類法進(jìn)行深入研究并提出大綱或框架的代表作有文獻(xiàn)[22]、[23]、[24]。陳樹年闡述了構(gòu)建網(wǎng)上分類體系的原則與技術(shù)后,提出了一個適用于一般用戶的綜合性中文搜索引擎的信息分類大綱,該大綱包括22個大類,即哲學(xué)與宗教、人文與社會科學(xué)、社會文化、文學(xué)與藝術(shù)、教育與人才、體育與健身、休閑與生活娛樂、旅游與服務(wù)業(yè)、醫(yī)學(xué)與健康、經(jīng)濟(jì)與金融、政治、法律、軍事、歷史與地理、自然科學(xué)、農(nóng)業(yè)科學(xué)、工程技術(shù)、計算機(jī)與網(wǎng)絡(luò)、新聞與媒體、圖書館與參考資料、國家與地區(qū)、綜合網(wǎng)站。并指出以學(xué)術(shù)和技術(shù)為主的搜索引擎、專業(yè)搜索引擎最好以權(quán)威分類法(或其中的某些類)為基礎(chǔ),經(jīng)過一定的改造后用于網(wǎng)上信息的組織和檢索,因?yàn)槠淇茖W(xué)的體系和嚴(yán)密的結(jié)構(gòu)是非專業(yè)人員所不能獨(dú)立完成的。[22]吳丹采取學(xué)科分類與事物分類兼顧的方式,也設(shè)計了一個包含有18個大類和若干二級類目的網(wǎng)絡(luò)信息分類體系設(shè)計方案。18個大類,即政治法律與軍事、新聞與媒體、商業(yè)與經(jīng)濟(jì)、自然科學(xué)、農(nóng)業(yè)與工程技術(shù)、計算機(jī)與網(wǎng)絡(luò)、教育、哲學(xué)與宗教、人文社會科學(xué)、文化藝術(shù)、歷史與地理、國家與地區(qū)、旅游與交通、醫(yī)學(xué)與健康、生活服務(wù)、體育與健身、娛樂休閑、圖書館與參考資料。[23]許培揚(yáng)提出了中文網(wǎng)絡(luò)信息分類法應(yīng)由簡表、主表、索引和使用指南四部分組成。簡表一般由1-4級類目構(gòu)成,主表由全部類目構(gòu)成。索引包括:①本表與其他分類體系的對應(yīng),用于不同分類體系的轉(zhuǎn)換;②英譯名稱索引,從英查漢或從漢查英。使用指南是分類體系的詳細(xì)說明。[24]

5現(xiàn)代技術(shù)在網(wǎng)絡(luò)信息分類法構(gòu)建中的應(yīng)用

由于網(wǎng)絡(luò)信息分類法必須能適應(yīng)網(wǎng)絡(luò)技術(shù)環(huán)境,這就要求在編制過程中適當(dāng)采用許多現(xiàn)代信息技術(shù),如自動分類技術(shù)、人工智能技術(shù)、網(wǎng)格技術(shù)等等,以適應(yīng)網(wǎng)絡(luò)技術(shù)環(huán)境的發(fā)展特點(diǎn)。馬張華專文闡述了超文本技術(shù)在網(wǎng)絡(luò)信息分類法編制中的應(yīng)用。[25]他指出:超文本技術(shù)可以改進(jìn)主題之間多維關(guān)系的揭示;可以從多個角度組織信息資源;可以進(jìn)行輪排,亦即多表列類;可以設(shè)置鏡像類目,根據(jù)需要對某些重點(diǎn)類目或熱點(diǎn)類目突出反映;可以動態(tài)設(shè)置類目和動態(tài)揭示類目之間的關(guān)系,根據(jù)需要及時增添類目或刪改類目;可用于聯(lián)結(jié)不同的檢索系統(tǒng),增加檢索入口;可以聯(lián)結(jié)分類體系與相應(yīng)的說明文字與規(guī)則系統(tǒng)。

陳旭論述了分面分類在網(wǎng)絡(luò)信息分類法編制中的應(yīng)用。[26]文章首先論述了在編制網(wǎng)絡(luò)信息分類法時,可根據(jù)需要利用仿分技術(shù)編制各種類型的通用復(fù)分表、專用復(fù)分表及規(guī)定必要的仿分。其次論述了分面敘詞表的應(yīng)用。最后論述了分面分類在可視化檢索中的應(yīng)用。即在檢索界面上設(shè)置主題分面、書目形式分面、時間分面和地域分面,然后再按等級列舉的方式分別展開,既便于類表的修訂與維護(hù),又便于用戶檢索更為專指的信息。

周淑云在《分類主題一體化構(gòu)建網(wǎng)絡(luò)信息分類體系》[27]一文中指出,理想的網(wǎng)絡(luò)分類法應(yīng)是分類法和主題法的結(jié)合使用,理想的模式是以“分類一主題”的方式對知識進(jìn)行組織,形成一種兼具分類、主題兩種標(biāo)引和查找功能的新型檢索語言,從而為不同層次和不同需求的用戶分別提供不同的信息查詢功能。分類主題一體化的網(wǎng)絡(luò)分類體系既突破了傳統(tǒng)分類法層層劃分、層層隸屬的等級結(jié)構(gòu)又克服了主題法系統(tǒng)性差,將同類信息分類的特點(diǎn)。對此問題進(jìn)行論述的還有郭麗芳、梅伯平、蘇瑞竹等。

6構(gòu)建中微觀層面的具體問題

對網(wǎng)絡(luò)信息分類法編制的一些具體問題,許多學(xué)者都予以了詳細(xì)的探討。

陳樹年在《網(wǎng)絡(luò)信息分類法研究》中研究了聚類標(biāo)準(zhǔn)、大類設(shè)置、展開層次、類目種類、類目名稱、多分類體系、分類標(biāo)準(zhǔn)與使用次序、類目設(shè)置的均衡性和規(guī)律性、重點(diǎn)類目、交叉關(guān)系的處理、類目的排列、類目的注釋和說明、用戶界面的設(shè)計等,并給出了相應(yīng)的改進(jìn)意見。[28]他認(rèn)為,關(guān)于聚類標(biāo)準(zhǔn),綜合性網(wǎng)絡(luò)信息分類法聚類的主要標(biāo)準(zhǔn)應(yīng)當(dāng)是“主題和專題”,專業(yè)搜索引擎可以學(xué)科或?qū)I(yè)為主要聚類標(biāo)準(zhǔn),或結(jié)合主題聚類運(yùn)用;關(guān)于大類的設(shè)置數(shù)量通常以10-20個為宜;關(guān)于類目的名稱要做到準(zhǔn)確、通用和精練;關(guān)于類目種類包括“子類”與“網(wǎng)站”兩種,“在每一類下,把內(nèi)容寬泛,各個下位類不能容納的信息歸納為‘綜合網(wǎng)站’集中收錄是網(wǎng)絡(luò)分婁法實(shí)用的作法”。

其它方面,人們觀點(diǎn)大致雷同。如,關(guān)于分類體系展開層次,陳樹年提出基本應(yīng)控制在3-6級之間;趙培云認(rèn)為根據(jù)目前網(wǎng)絡(luò)信息的實(shí)際情況和用戶瀏覽查詢心理,綜合性網(wǎng)絡(luò)信息分類標(biāo)準(zhǔn),類目應(yīng)控制在三、四層為宜,專業(yè)搜索引擎和網(wǎng)站可適當(dāng)延伸。[29]張琪玉提出類目細(xì)分應(yīng)控制在五級左右。[30]

總之,由于網(wǎng)絡(luò)信息、網(wǎng)絡(luò)信息用戶、網(wǎng)絡(luò)信息技術(shù)環(huán)境等特點(diǎn),這就決定了網(wǎng)絡(luò)信息分類法的編制原則和技術(shù)方法,有別于傳統(tǒng)分類法的編制原則和技術(shù)方法,但是傳統(tǒng)文獻(xiàn)分類法和現(xiàn)有網(wǎng)絡(luò)信息分類體系的成功經(jīng)驗(yàn)可以給網(wǎng)絡(luò)信息分類法提供有益的借鑒。我們建議,應(yīng)當(dāng)由國家信息產(chǎn)業(yè)部牽頭,組織圖書情報界專家、計算機(jī)專家、網(wǎng)絡(luò)公司等相關(guān)專家,廣泛征求意見,盡早編制出一部用戶滿意、質(zhì)量較高的網(wǎng)絡(luò)信息分類法。

【參考文獻(xiàn)】

[1]馬張華.分類搜索引擎類目體系研究.圖書情報工作,2001(2):36-40

[2][22]陳樹年.搜索引擎及網(wǎng)絡(luò)信息資源的分類組織.圖書情報工作,2000(4):31-37

[3]石曉華,王春芳。網(wǎng)絡(luò)信息分類與傳統(tǒng)分類法的優(yōu)劣分析——兼談構(gòu)建《中國網(wǎng)絡(luò)信息分類法》.圖書館理論與實(shí)踐,2001(1):43-45

[4][30]張琪玉.網(wǎng)絡(luò)信息檢索工具的分類體系.江蘇圖書館學(xué)報,2002(4):7-11

[5]王知津,肖洪.網(wǎng)絡(luò)信息組織對傳統(tǒng)信息組織的借鑒.圖書館工作與研究,2003(4):2-7

[6]董琳.網(wǎng)絡(luò)信息分類組織的發(fā)展趨勢與標(biāo)準(zhǔn)化.圖書情報知識,2004(2):65-67

[7][12]陸寶益.論創(chuàng)建我國統(tǒng)一的網(wǎng)絡(luò)信息分類法.中國圖書館學(xué)報,2004(6):44-47

[8]千忠紅.網(wǎng)絡(luò)信息環(huán)境下的傳統(tǒng)分類法.圖書情報工作,1999(2):37-39

[9]史學(xué)斌.網(wǎng)絡(luò)信息分類體系.圖書館,2002(1):33-35,20

[10]鄭慶勝,易曉陽.從新浪等網(wǎng)站看網(wǎng)絡(luò)信息分類體系的建立.圖書館建設(shè),2003(1):69-71

[11][23]吳丹.網(wǎng)絡(luò)信息分類體系設(shè)計.圖書情報知識,2002(5):37-39

[13]朱蓓玲.淺析構(gòu)建網(wǎng)絡(luò)信息分類體系.情報雜志,2004(8):110-111,114

[14]敬卿,吳靜.網(wǎng)絡(luò)分類目錄規(guī)范化初探.圖書館,2002(1):49-50

[15]鄧香蓮.文獻(xiàn)信息分類與網(wǎng)絡(luò)信息分類之比較研究.情報資料工作,2002(6):43-45

[16]粟慧.以人為本的必然:人工檢索語言向自然語言的轉(zhuǎn)變.圖書館,2000(2):9-10

[17]張琪玉.網(wǎng)絡(luò)信息檢索用語言的發(fā)展趨勢.圖書館雜志,2001(3):5-7

[18]梁樹柏,高夕果.受控語言網(wǎng)民化的思考.情報雜志,2002(8):69-71

[19]陳晶.論網(wǎng)絡(luò)環(huán)境下情報檢索語言的發(fā)展.情報雜志,2002(6):54-55

[20]呂娟,袁相琴.論第四種情報檢索語言系統(tǒng).中國圖書館學(xué)報,2002(1):87-92

[21]焦玉英,李法運(yùn).網(wǎng)絡(luò)環(huán)境下信息檢索語言的優(yōu)化研究.情報學(xué)報,2003(3):291-296

[24]許培揚(yáng),張玢.網(wǎng)絡(luò)信息分類標(biāo)準(zhǔn)研究進(jìn)展.醫(yī)學(xué)情報工作,2002(6):324-326

[25]馬張華,李玲.超文本技術(shù)在分類法編制中的應(yīng)用.大學(xué)圖書館學(xué)報,2001(1):60-62,66

[26]陳旭.分面分類在網(wǎng)絡(luò)資源組織中的應(yīng)用.圖書情報工作,2002(1):59-61

[27]周淑云.分類主題一體化構(gòu)建網(wǎng)絡(luò)信息分類體系.現(xiàn)代情報,2003(4):113-114

[28]陳樹年.網(wǎng)絡(luò)信息分類法研究.現(xiàn)代圖書情報技術(shù),2002(3):54-57

[29]趙培云.如何構(gòu)建統(tǒng)一的網(wǎng)絡(luò)信息分類標(biāo)準(zhǔn).河南圖書館學(xué)刊,2004,24(2):64-65