大數(shù)據(jù)技術(shù)論文范文

時(shí)間:2023-04-05 20:56:39

導(dǎo)語:如何才能寫好一篇大數(shù)據(jù)技術(shù)論文,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

大數(shù)據(jù)技術(shù)論文

篇1

數(shù)據(jù)背景下的機(jī)器算法

專業(yè)

計(jì)算機(jī)科學(xué)與技術(shù)

學(xué)生姓名

楊宇瀟

學(xué)號

181719251864

一、 選題的背景、研究現(xiàn)狀與意義

為什么大數(shù)據(jù)分析很重要?大數(shù)據(jù)分析可幫助組織利用其數(shù)據(jù)并使用它來識別新的機(jī)會。反過來,這將導(dǎo)致更明智的業(yè)務(wù)移動(dòng),更有效的運(yùn)營,更高的利潤和更快樂的客戶。

在許多早期的互聯(lián)網(wǎng)和技術(shù)公司的支持下,大數(shù)據(jù)在2000年代初的數(shù)據(jù)熱潮期間出現(xiàn)。有史以來第一次,軟件和硬件功能是消費(fèi)者產(chǎn)生的大量非結(jié)構(gòu)化信息。搜索引擎,移動(dòng)設(shè)備和工業(yè)機(jī)械等新技術(shù)可提供公司可以處理并持續(xù)增長的數(shù)據(jù)。隨著可以收集的天文數(shù)據(jù)數(shù)量的增長,很明顯,傳統(tǒng)數(shù)據(jù)技術(shù)(例如數(shù)據(jù)倉庫和關(guān)系數(shù)據(jù)庫)不適合與大量非結(jié)構(gòu)化數(shù)據(jù)一起使用。 Apache軟件基金會啟動(dòng)了第一個(gè)大數(shù)據(jù)創(chuàng)新項(xiàng)目。最重要的貢獻(xiàn)來自Google,Yahoo,F(xiàn)acebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是復(fù)雜數(shù)據(jù)準(zhǔn)備和ETL的旗艦,可以為許多數(shù)據(jù)存儲或分析環(huán)境提供信息以進(jìn)行深入分析。 Apache Spark(由加州大學(xué)伯克利分校開發(fā))通常用于大容量計(jì)算任務(wù)。這些任務(wù)通常是批處理ETL和ML工作負(fù)載,但與Apache Kafka等技術(shù)結(jié)合使用。

隨著數(shù)據(jù)呈指數(shù)級增長,企業(yè)必須不斷擴(kuò)展其基礎(chǔ)架構(gòu)以最大化其數(shù)據(jù)的經(jīng)濟(jì)價(jià)值。在大數(shù)據(jù)的早期(大約2008年),Hadoop被大公司首次認(rèn)可時(shí),維護(hù)有用的生產(chǎn)系統(tǒng)非常昂貴且效率低下。要使用大數(shù)據(jù),您還需要適當(dāng)?shù)娜藛T和軟件技能,以及用于處理數(shù)據(jù)和查詢速度的硬件。協(xié)調(diào)所有內(nèi)容同時(shí)運(yùn)行是一項(xiàng)艱巨的任務(wù),許多大數(shù)據(jù)項(xiàng)目都將失敗。如今,云計(jì)算已成為市場瞬息萬變的趨勢。因?yàn)楦鞣N規(guī)模的公司都可以通過單擊幾下立即訪問復(fù)雜的基礎(chǔ)架構(gòu)和技術(shù)。在這里,云提供了強(qiáng)大的基礎(chǔ)架構(gòu),使企業(yè)能夠勝過現(xiàn)有系統(tǒng)。

二、 擬研究的主要內(nèi)容(提綱)和預(yù)期目標(biāo)

隨著行業(yè)中數(shù)據(jù)量的爆炸性增長,大數(shù)據(jù)的概念越來越受到關(guān)注。 由于大數(shù)據(jù)的大,復(fù)雜和快速變化的性質(zhì),許多用于小數(shù)據(jù)的傳統(tǒng)機(jī)器學(xué)習(xí)算法不再適用于大數(shù)據(jù)環(huán)境中的應(yīng)用程序問題。 因此,在大數(shù)據(jù)環(huán)境下研究機(jī)器學(xué)習(xí)算法已成為學(xué)術(shù)界和業(yè)界的普遍關(guān)注。 本文主要討論和總結(jié)用于處理大數(shù)據(jù)的機(jī)器學(xué)習(xí)算法的研究現(xiàn)狀。 另外,由于并行處理是處理大數(shù)據(jù)的主要方法,因此我們介紹了一些并行算法,介紹了大數(shù)據(jù)環(huán)境中機(jī)器學(xué)習(xí)研究所面臨的問題,最后介紹了機(jī)器學(xué)習(xí)的研究趨勢,我們的目標(biāo)就是研究數(shù)據(jù)量大的情況下算法和模型的關(guān)系,同時(shí)也會探討大部分細(xì)分行業(yè)數(shù)據(jù)量不大不小的情況下算法的關(guān)系。

三、 擬采用的研究方法(思路、技術(shù)路線、可行性分析論證等)

 1.視覺分析。大數(shù)據(jù)分析用戶包括大數(shù)據(jù)分析專業(yè)人士和一般用戶,但是大數(shù)據(jù)分析的最基本要求是視覺分析。視覺分析直觀地介紹了大數(shù)據(jù)的特征,并像閱讀照片的讀者一樣容易接受。 2.數(shù)據(jù)挖掘算法。大數(shù)據(jù)分析的理論中心是數(shù)據(jù)挖掘算法。不同的數(shù)據(jù)挖掘算法依賴于不同的數(shù)據(jù)類型和格式來更科學(xué)地表征數(shù)據(jù)本身。由于它們被全世界的統(tǒng)計(jì)學(xué)家所公認(rèn),因此各種統(tǒng)計(jì)方法(稱為真值)可以深入到數(shù)據(jù)中并挖掘公認(rèn)的值。另一方面是這些數(shù)據(jù)挖掘算法可以更快地處理大數(shù)據(jù)。如果該算法需要花費(fèi)幾年時(shí)間才能得出結(jié)論,那么大數(shù)據(jù)的價(jià)值是未知的。 3.預(yù)測分析。大數(shù)據(jù)分析的最后一個(gè)應(yīng)用領(lǐng)域是預(yù)測分析,發(fā)現(xiàn)大數(shù)據(jù)功能,科學(xué)地建立模型以及通過模型吸收新數(shù)據(jù)以預(yù)測未來數(shù)據(jù)。 4.語義引擎。非結(jié)構(gòu)化數(shù)據(jù)的多樣化為數(shù)據(jù)分析提出了新的挑戰(zhàn)。您需要一套工具來分析和調(diào)整數(shù)據(jù)。語義引擎必須設(shè)計(jì)有足夠的人工智能,以主動(dòng)從數(shù)據(jù)中提取信息。 5.數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。大數(shù)據(jù)分析是數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理的組成部分。高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理確保了分析結(jié)果在學(xué)術(shù)研究和商業(yè)應(yīng)用中的可靠性和價(jià)值。大數(shù)據(jù)分析的基礎(chǔ)是前五個(gè)方面。當(dāng)然,如果您更深入地研究大數(shù)據(jù)分析,則還有更多特征,更深入,更專業(yè)的大數(shù)據(jù)分析方法。

四、 論文(設(shè)計(jì))的工作進(jìn)度安排

2020.03.18-2020.03.20 明確論文內(nèi)容,進(jìn)行相關(guān)論文資料的查找與翻譯。2020.04.04-2020.04.27:撰寫開題報(bào)告 。

2020.04.28-2020.04.30 :設(shè)計(jì)實(shí)驗(yàn)。

2020.05.01-2020.05.07 :開展實(shí)驗(yàn)。

2020.05.08-2020.05.15 :準(zhǔn)備中期檢查。

2020.05.16-2020.05.23:根據(jù)中期檢查的問題,進(jìn)一步完善實(shí)驗(yàn)2020.05.24-2020.05.28 :完成論文初稿。

2020.05.29-2020.06.26 :論文修改完善。

 

五、 參考文獻(xiàn)(不少于5篇)

1 . 王偉,王珊,杜小勇,覃雄派,王會舉.大數(shù)據(jù)分析——rdbms與mapreduce的競爭與共生 .計(jì)算機(jī)光盤軟件與應(yīng)用,2012.被引量:273.

2 . 喻國明. 大數(shù)據(jù)分析下的中國社會輿情:總體態(tài)勢與結(jié)構(gòu)性特征——基于百度熱搜詞(2009—2 012)的輿情模型構(gòu)建.中國人民大學(xué)學(xué)報(bào),2013.被引量:9. 3 . 李廣建,化柏林.大數(shù)據(jù)分析與情報(bào)分析關(guān)系辨析.中國圖書館學(xué)報(bào),2014.被引量:16.

4 . 王智,于戈,郭朝鵬,張一川,宋杰.大數(shù)據(jù)分析的分布式molap技術(shù) .軟件學(xué)報(bào),2014.被引量:6.

5 . 王德文,孫志偉.電力用戶側(cè)大數(shù)據(jù)分析與并行負(fù)荷預(yù)測 .中國電機(jī)工程學(xué)報(bào),2015.被引量:19.

6 . 江秀臣,杜修明,嚴(yán)英杰,盛戈皞,陳玉峰 ,郭志紅.基于大數(shù)據(jù)分析的輸變電設(shè)備狀態(tài)數(shù)據(jù)異常檢測方法 .中國電機(jī)工程學(xué)報(bào),2015.被引量:8.

7 . 喻國明. 呼喚“社會最大公約數(shù)”:2012年社會輿情運(yùn)行態(tài)勢研究——基于百度熱搜詞的大 數(shù)據(jù)分析.編輯之友,2013.被引量:4.

六、指導(dǎo)教師意見

 

 

 

 

 

 

 

 

簽字:                  年     月    日

七、學(xué)院院長意見及簽字

 

 

 

 

 

 

 

篇2

大數(shù)據(jù)時(shí)代的到來,計(jì)算機(jī)信息處理技術(shù)也存在著很大風(fēng)險(xiǎn),其中最突出的問題是計(jì)算機(jī)病毒以及惡意盜版軟件等,給用戶使用計(jì)算機(jī)產(chǎn)生了極大的消極影響。這些還是一些比較基礎(chǔ)的問題,隨著計(jì)算機(jī)技術(shù)的發(fā)展,還出現(xiàn)篡改數(shù)據(jù)、冒名頂替等問題,影響計(jì)算機(jī)技術(shù)服務(wù)質(zhì)量,計(jì)算機(jī)信息處理技術(shù)受到了前所未有的考驗(yàn)。另外,大數(shù)據(jù)時(shí)代的到來,還出現(xiàn)了許多新型網(wǎng)絡(luò)技術(shù),針對一些繁瑣的問題能夠有效解決,提高了人們的工作效率,然而,這也在一定程度上降低了網(wǎng)絡(luò)的真實(shí)性,特別是在網(wǎng)絡(luò)交流和溝通日益緊密的前提下,導(dǎo)致網(wǎng)絡(luò)信息真假難分,不僅增加了信息搜索難度,而且致使人們無法快速獲得真實(shí)信息。因此,提高計(jì)算機(jī)信息處理技術(shù)至關(guān)重要。

2大數(shù)據(jù)時(shí)代計(jì)算機(jī)信息處理技術(shù)

2.1信息采集、加工方面

計(jì)算機(jī)信息處理技術(shù)要進(jìn)行工作,首先,要采集數(shù)據(jù)信息,計(jì)算機(jī)技術(shù)都是建立在數(shù)據(jù)采集基礎(chǔ)之上的,數(shù)據(jù)采集主要是針對目標(biāo)信息源進(jìn)行實(shí)時(shí)的信息監(jiān)督和控制,并將才覺得數(shù)據(jù)儲存在計(jì)算機(jī)數(shù)據(jù)庫中,為各個(gè)軟件提供信息支持,確保下一項(xiàng)工作順利進(jìn)行;其次,對數(shù)據(jù)信息進(jìn)行加工,按照用戶的要求,對數(shù)據(jù)信息進(jìn)行加工;最后,將加工好的數(shù)據(jù)信系進(jìn)行分類,最終傳送到用戶手中,實(shí)現(xiàn)數(shù)據(jù)采集、加工以及傳送目標(biāo)。

2.2存儲方面

計(jì)算機(jī)存儲技術(shù)是將采集的信息儲存到計(jì)算機(jī)數(shù)據(jù)庫之中,在用戶需要某一項(xiàng)信息過程中,可以通過數(shù)據(jù)庫直接將數(shù)據(jù)調(diào)取出來,計(jì)算機(jī)以其儲存量大、速度快等優(yōu)勢,受到人們越來越多的關(guān)注,另外,計(jì)算機(jī)技術(shù)還能夠?qū)崿F(xiàn)長時(shí)間儲存。

2.3信息安全方面

大數(shù)據(jù)時(shí)代的到來,讓人們感受技術(shù)帶來的便捷的同時(shí),也讓人們意識到數(shù)據(jù)信息安全對人們的重要性。因此,為了能夠提高數(shù)據(jù)信息的安全、可靠性,可以通過以下幾個(gè)方面進(jìn)行:首先,建立計(jì)算機(jī)信息安全體系,加大專業(yè)技術(shù)人才的培養(yǎng)力度,投入資金,為構(gòu)建計(jì)算機(jī)安全體系奠定堅(jiān)實(shí)的基礎(chǔ);其次,加大研究力度,開發(fā)信息安全技術(shù)產(chǎn)品。傳統(tǒng)信息安全技已經(jīng)無法滿足大數(shù)據(jù)時(shí)代數(shù)據(jù)安全需求,為了能夠盡快改善數(shù)據(jù)安全問題,應(yīng)加大研究力度,尋求更好的解決方案,有效避免數(shù)據(jù)信息受到威脅;最后,重視對重要數(shù)據(jù)的檢測,大數(shù)據(jù)時(shí)代的突出特點(diǎn)是數(shù)據(jù)量大,無法實(shí)現(xiàn)對每一個(gè)數(shù)據(jù)的檢測。因此,為了提高數(shù)據(jù)安全系數(shù),應(yīng)加強(qiáng)對重點(diǎn)數(shù)據(jù)信息的檢測,從而確保數(shù)據(jù)信息安全。

2.4信息處理技術(shù)的發(fā)展

計(jì)算機(jī)硬件具有一定局限性,在一定程度上阻礙了計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,而云計(jì)算網(wǎng)絡(luò)能夠突破這一弊端。因此,推廣和應(yīng)用云計(jì)算機(jī)網(wǎng)絡(luò)成為未來大數(shù)據(jù)時(shí)代計(jì)算機(jī)信息處理的主要發(fā)展趨勢。傳統(tǒng)計(jì)算機(jī)網(wǎng)絡(luò)是將硬件與網(wǎng)絡(luò)有機(jī)結(jié)合,抑制了計(jì)算機(jī)信息處理技術(shù)的發(fā)展,將二者分離開,促使云計(jì)算主筋形成云計(jì)算網(wǎng)絡(luò),從而構(gòu)建大數(shù)據(jù)信息網(wǎng)絡(luò)系統(tǒng),推動(dòng)我國社會不斷發(fā)展。

3結(jié)論

篇3

基本的大數(shù)據(jù)的處理流程可以分成數(shù)據(jù)采集、數(shù)據(jù)處理與集成、數(shù)據(jù)分析和數(shù)據(jù)解釋4個(gè)階段。首先獲取數(shù)據(jù)源的數(shù)據(jù),因?yàn)樵跀?shù)據(jù)源端的數(shù)據(jù)包含各種各樣的結(jié)構(gòu),需要使用某種方法將其進(jìn)行預(yù)處理,使數(shù)據(jù)成為某種可以用一種算法分析的統(tǒng)一數(shù)據(jù)格式,接著需要找到這種數(shù)據(jù)分析的算法,將預(yù)處理過的數(shù)據(jù)進(jìn)行算法特定的分析,并將分析的結(jié)果用可視化等手段呈現(xiàn)至用戶端。

1.1數(shù)據(jù)采集

大數(shù)據(jù)的采集是整個(gè)流程的基礎(chǔ),隨著互聯(lián)網(wǎng)技術(shù)和應(yīng)用的發(fā)展以及各種終端設(shè)備的普及,使得數(shù)據(jù)的生產(chǎn)者范圍越來越大,數(shù)據(jù)的產(chǎn)量也越來越多,數(shù)據(jù)之間的關(guān)聯(lián)也越來越復(fù)雜,這也是大數(shù)據(jù)中“大”的體現(xiàn),所以需要提高數(shù)據(jù)采集速度和精度要求。

1.2數(shù)據(jù)處理與集成

數(shù)據(jù)的處理與集成主要是對前一步采集到的大量數(shù)據(jù)進(jìn)行適當(dāng)?shù)念A(yù)處理,包括格式化、去噪以及進(jìn)一步集成存儲。因?yàn)閿?shù)據(jù)采集步驟采集到的數(shù)據(jù)各種各樣,其數(shù)據(jù)結(jié)構(gòu)也并不統(tǒng)一,不利于之后的數(shù)據(jù)分析,而且,一些數(shù)據(jù)屬于無效數(shù)據(jù),需要去除,否則會影響數(shù)據(jù)分析的精度和可靠性,所以,需要將數(shù)據(jù)統(tǒng)一格式并且去除無效數(shù)據(jù)。通常會設(shè)計(jì)一些過濾器來完成這一任務(wù)。

1.3數(shù)據(jù)分析

在完成了數(shù)據(jù)的采集和處理后,需要對數(shù)據(jù)進(jìn)行分析,因?yàn)樵谶M(jìn)行數(shù)據(jù)分析后才能體現(xiàn)所有大數(shù)據(jù)的重要價(jià)值。數(shù)據(jù)分析的對象是上一步數(shù)據(jù)的處理與集成后的統(tǒng)一格式數(shù)據(jù),需要根據(jù)所需數(shù)據(jù)的應(yīng)用需求和價(jià)值體現(xiàn)方向?qū)@些原始樣本數(shù)據(jù)進(jìn)一步地處理和分析?,F(xiàn)有的數(shù)據(jù)分析通常指采用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘工具對集中存儲的數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)分析服務(wù)與傳統(tǒng)數(shù)據(jù)分析的差別在于其面向的對象不是數(shù)據(jù),而是數(shù)據(jù)服務(wù)。

1.4數(shù)據(jù)解釋

數(shù)據(jù)解釋是對大數(shù)據(jù)分析結(jié)果的解釋與展現(xiàn),在數(shù)據(jù)處理流程中,數(shù)據(jù)結(jié)果的解釋步驟是大數(shù)據(jù)分析的用戶直接面對成果的步驟,傳統(tǒng)的數(shù)據(jù)顯示方式是用文本形式體現(xiàn)的,但是,隨著數(shù)據(jù)量的加大,其分析結(jié)果也更復(fù)雜,傳統(tǒng)的數(shù)據(jù)顯示方法已經(jīng)不足以滿足數(shù)據(jù)分析結(jié)果輸出的需求,因此,數(shù)據(jù)分析企業(yè)會引入“數(shù)據(jù)可視化技術(shù)”作為數(shù)據(jù)解釋方式。通過可視化結(jié)果分析,可以形象地向用戶展示數(shù)據(jù)分析結(jié)果。

2云計(jì)算與大數(shù)據(jù)分析的關(guān)系

云計(jì)算是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動(dòng)態(tài)易擴(kuò)展且經(jīng)常是虛擬化的資源,是一種按使用量付費(fèi)的模式。這種模式提供可用的、便捷的、按需的網(wǎng)絡(luò)訪問,進(jìn)入可配置的計(jì)算資源共享池(資源包括網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用軟件、服務(wù)),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務(wù)供應(yīng)商進(jìn)行很少的交互。目前,國內(nèi)外已經(jīng)有不少成熟的云計(jì)算的應(yīng)用服務(wù)。數(shù)據(jù)分析是整個(gè)大數(shù)據(jù)處理流程里最核心的部分。數(shù)據(jù)分析是以數(shù)據(jù)的價(jià)值分析為目的的活動(dòng),而基于大數(shù)據(jù)的數(shù)據(jù)分析通常表現(xiàn)為對已獲取的海量數(shù)據(jù)的分析,其數(shù)據(jù)來源可能是企業(yè)數(shù)據(jù)也可能是企業(yè)數(shù)據(jù)與互聯(lián)網(wǎng)數(shù)據(jù)的融合。從目前的趨勢來看,云計(jì)算是大數(shù)據(jù)的IT基礎(chǔ),是大數(shù)據(jù)分析的支撐平臺,不斷增長的數(shù)據(jù)量需要性能更高的數(shù)據(jù)分析平臺承載。所以,云計(jì)算技術(shù)的不斷發(fā)展可以為大數(shù)據(jù)分析提供更為靈活、迅速的部署方案,使得大數(shù)據(jù)分析的結(jié)果更加精確。另一方面,云計(jì)算的出現(xiàn)為大數(shù)據(jù)分析提供了擴(kuò)展性更強(qiáng),使用成本更低的存儲資源和計(jì)算資源,使得中小企業(yè)也可以通過云計(jì)算來實(shí)現(xiàn)屬于自己的大數(shù)據(jù)分析產(chǎn)品。大數(shù)據(jù)技術(shù)本身也是云計(jì)算技術(shù)的一種延伸。大數(shù)據(jù)技術(shù)涵蓋了從數(shù)據(jù)的海量存儲、處理到應(yīng)用多方面的技術(shù),包括海量分布式文件系統(tǒng)、并行計(jì)算框架、數(shù)據(jù)庫、實(shí)時(shí)流數(shù)據(jù)處理以及智能分析技術(shù),如模式識別、自然語言理解、應(yīng)用知識庫等等。但是,大數(shù)據(jù)分析要走向云計(jì)算還要賴于數(shù)據(jù)通信帶寬的提高和云資源的建設(shè),需要確保原始數(shù)據(jù)能遷移到云環(huán)境以及資源池可以隨需彈性擴(kuò)展。

3基于云計(jì)算環(huán)境的Hadoop

為了給大數(shù)據(jù)處理分析提供一個(gè)性能更高、可靠性更好的平臺,研究者基于MapReduce開發(fā)了一個(gè)基于云計(jì)算環(huán)境的開源平臺Hadoop。Hadoop是一個(gè)以MapReduce算法為分布式計(jì)算框架,包括分布式文件系統(tǒng)(HDFS)、分布式數(shù)據(jù)庫(Hbase、Cassandra)等功能模塊在內(nèi)的完整生態(tài)系統(tǒng),已經(jīng)成為當(dāng)前最流行的大數(shù)據(jù)處理平臺,并被廣泛認(rèn)可和開發(fā)應(yīng)用。基于Hadoop,用戶可編寫處理海量數(shù)據(jù)的分布式并行程序,并將其運(yùn)行于由成百上千個(gè)節(jié)點(diǎn)組成的大規(guī)模計(jì)算機(jī)集群上。

4實(shí)例分析

本節(jié)以電信運(yùn)營商為例,說明在云計(jì)算環(huán)境中基于Hadoop的大數(shù)據(jù)分析給大數(shù)據(jù)用戶帶來的價(jià)值。當(dāng)前傳統(tǒng)語音和短信業(yè)務(wù)量下滑,智能終端快速增長,移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)發(fā)展迅速,大數(shù)據(jù)分析可以為運(yùn)營商帶來新的機(jī)會,幫助運(yùn)營商更好地轉(zhuǎn)型。本文數(shù)據(jù)分析樣本來自于某運(yùn)營商的個(gè)人語音和數(shù)據(jù)業(yè)務(wù)清單,通過Hadoop2.6.0在Ubuntu12.04系統(tǒng)中模擬了一個(gè)大數(shù)據(jù)分析平臺來處理獲得的樣本。希望通過對樣本數(shù)據(jù)的分析與挖掘,掌握樣本本身的一些信息。以上分析只是一些很基本的簡單分析,實(shí)際上樣本數(shù)據(jù)中所蘊(yùn)含的價(jià)值要遠(yuǎn)遠(yuǎn)大于本文體現(xiàn)的。以上舉例意在說明基于云計(jì)算的大數(shù)據(jù)分析可以在數(shù)據(jù)分析上體現(xiàn)出良好的性能,為企業(yè)帶來更豐富更有效率的信息提取、分類,并從中獲益。

5結(jié)束語

篇4

司法會計(jì)鑒定書

(文號)

(鑒定專用用章)

(日期)

緒 言

×年×月×日,本院法紀(jì)檢察科提出委托,要求對A某某案中直接經(jīng)濟(jì)損失數(shù)額作出司法會計(jì)鑒定結(jié)論。

A某某,男,×歲,大專文化程度,現(xiàn)任甲公司證券業(yè)務(wù)部副經(jīng)理。×年×月×日,其在未對新開戶股民B某某賬戶完成驗(yàn)資的情況下,擅自允許該戶全額透支交易近×元,給本單位造成巨大經(jīng)濟(jì)損失。

檢驗(yàn)收集了與A×#B某某股東賬戶相聯(lián)系的甲公司證券業(yè)務(wù)部×年×月×日和×年×月×日的B某某資金賬戶及其相關(guān)的交割單和委托單、中央登記結(jié)算公司A×#B某某股東賬戶籌碼清單等會計(jì)資料。

檢驗(yàn)采用核對法和分析法,逐一核對交易數(shù)量、金額和委托手續(xù),對比委托價(jià)與成交價(jià)、申報(bào)時(shí)間與成交時(shí)間,計(jì)算虧損數(shù)額。

所列檢材均冠以S字母,統(tǒng)一以兩位數(shù)編號。

檢 驗(yàn)

1.甲公司證券業(yè)務(wù)部B某某資金賬戶記錄:×年×月×日開戶,未存入資金,×年×月×日賣出股票收回資金×元,×年×月×日與×年×月×日之間無記錄(見S03)。

2.甲公司證券業(yè)務(wù)部B某某資金賬戶×年×月×日清算交割單及其配對交割單記錄:先買入后賣出,再買入再賣出;共×股票×股,成交總額×元,賣出×股,成交總額×元,軋差-×元,與當(dāng)日余額一致。顯然,該戶未曾存入資金,第一、第二筆買入交易系全額透支?!聊辍猎隆寥找陨腺Y料記錄:賣出×股票×股,成交總額×元。至此,×股×股票全部平倉,交易虧損×元,與×年×月×日余額一致(見S01、S02)。

3.甲公司證券業(yè)務(wù)部B某某資金賬戶買入×股×股票有委托單,其中,×股委托價(jià)與成交價(jià)一致,申報(bào)時(shí)間與成交時(shí)間幾乎一致;×股委托價(jià)與成交價(jià)一致,申報(bào)時(shí)間等于成交時(shí)間;×股與×股合填一份委托單,且混填×股和×股賣出;×股委托價(jià)與成交價(jià)相近,申報(bào)時(shí)間等于成交時(shí)間(見S04至S36、附表)。

4.甲公司證券業(yè)務(wù)部B某某資金賬戶賣出×股×股票,僅有×年×月×日表明×股賣出委托的×股和×股兩份賣出委托單,但另有×股和×股賣出混填在×股買人委托單上;×股委托價(jià)與成交價(jià)相近,申報(bào)時(shí)間與成交時(shí)間幾乎一致(見S05、S37至附表)。

5.中央登記結(jié)算公司A×#B某某股東賬戶籌碼清單顯示,該戶×年×月×日賣出×股,系乙公司證券業(yè)務(wù)部強(qiáng)行平倉,無委托單(見S57、附表)。

6.甲公司證券業(yè)務(wù)部B某某資金賬戶清算交割單顯示,每筆交易數(shù)量和成交總額均與配對交割單數(shù)量和成交總額合計(jì)數(shù)一致(見S01至S02、S06至S36、S39至S56)。

論 證

1.按股票交易管理規(guī)定,股民開設(shè)資金賬戶需存入一定數(shù)量的資金,并只能在此額度內(nèi)買入股票;委托單限填一次同向交易委托內(nèi)容,更不能混填反向交易委托內(nèi)容。履行股票交易管理的行為人理應(yīng)制止這些不規(guī)范的交易行為。

2.按股票交易管理規(guī)定,委托人須在事先填妥委托單,管理行為人應(yīng)對買入委托人的資金狀況嚴(yán)格審核,決定是否向交易員申報(bào),避免出現(xiàn)既委托價(jià)等于成交價(jià),又申報(bào)時(shí)間等于成交時(shí)間的情況。

3.按最高人民檢察院有關(guān)罪認(rèn)定的規(guī)定,直接經(jīng)濟(jì)損失必須是與管理活動(dòng)有直接因果關(guān)系,且對財(cái)產(chǎn)所有權(quán)的喪失,行為人顯已不具備挽回能力。若嚴(yán)格規(guī)范交易行為,上述B某某賬戶的虧損當(dāng)可避免。且根據(jù)中央登記結(jié)算公司A×#B某某股東賬戶籌碼清單,現(xiàn)籌碼已全部平倉,管理行為人顯已無力挽回?fù)p失,所以,×元符合以上的兩個(gè)條件。

4.按股票交易管理規(guī)定,股票業(yè)務(wù)與自營業(yè)務(wù)的賬戶必須分開,因此,不能將在B某某賬戶非法自營交易所獲取的盈利視為彌補(bǔ)該賬戶虧損的能力。

結(jié) 論

因甲公司證券業(yè)務(wù)部股票交易管理行為人疏于職守,使B某某賬戶交易行為嚴(yán)重不規(guī)范,造成直接經(jīng)濟(jì)損失×元(大寫)。

鑒定人:

(簽 章)

(鑒定資格證書號:×)

復(fù)核人:

日期:

第二部分文證審查意見

司法會計(jì)文證審查意見書

文號

一、基本情況

x年x月x日,公訴人某某某提出委托,要求對A某某案件中的司法會計(jì)鑒定結(jié)論文書進(jìn)行審查。

x鑒定機(jī)構(gòu)提供的鑒定結(jié)論稱,因甲公司證券業(yè)務(wù)部股票交易管理行為人疏于職守,使B某某賬戶交易行為嚴(yán)重不規(guī)范,造成直接經(jīng)濟(jì)損失×元。

二、審查情況

該鑒定思路清晰、方法得當(dāng)、檢驗(yàn)充分,但論證尚缺火候。需在“所收集檢材是否合法”和“所收集檢材是否真實(shí)有效”兩個(gè)問題上,補(bǔ)充論證。

篇5

大數(shù)據(jù)時(shí)代科技期刊的傳播媒介將是多樣化的,傳播范圍更廣,傳播速度更快??萍计诳梢酝ㄟ^互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動(dòng)智能終端以及社交網(wǎng)絡(luò)等搭建交流平臺,實(shí)現(xiàn)紙媒科技期刊和網(wǎng)絡(luò)學(xué)術(shù)數(shù)據(jù)庫資源同步以及無時(shí)間限制、無地域限制的資源共享。在這個(gè)平臺上,學(xué)者可以更方便地獲取各領(lǐng)域的學(xué)術(shù)資源,隨時(shí)隨地發(fā)表個(gè)人學(xué)術(shù)成果,與其他學(xué)者進(jìn)行學(xué)術(shù)探討及交換意見等。大數(shù)據(jù)更易滿足用戶需求,更好地提升了用戶體驗(yàn):一些國外期刊與facebook和twitter等集成,深化了期刊的服務(wù)內(nèi)涵;也有一些期刊增加了數(shù)字技術(shù),例如讀者可通過掃描期刊上的二維碼觀看一場手術(shù)視頻等。這些全新資源使學(xué)術(shù)交流更加便捷、更加個(gè)性化,同時(shí)也推動(dòng)了學(xué)術(shù)研究成果的傳播。

就大數(shù)據(jù)時(shí)代而言,青年編輯具有一定的優(yōu)勢,主要體現(xiàn)在:

①青年編輯對互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動(dòng)智能終端以及社交網(wǎng)絡(luò)等平臺較為熟悉,運(yùn)用起來更得心應(yīng)手。

②青年編輯的思維敏捷、思想活躍,好奇心更強(qiáng),適應(yīng)新事物、學(xué)習(xí)新知識的速度更快。正因?yàn)榍嗄昃庉嬀哂行聲r(shí)代的種種優(yōu)勢,所以更應(yīng)該不斷學(xué)習(xí),不斷完善自我,從而適應(yīng)新時(shí)代的要求。

大數(shù)據(jù)時(shí)代對于青年編輯而言既是機(jī)遇也是挑戰(zhàn)。青年編輯要積極探索新技術(shù)在收發(fā)稿件、編輯加工、稿件校對、圖文編排等編輯出版環(huán)節(jié)中的應(yīng)用,利用新的技術(shù)和手段提高編校效率、拓寬思路。為此,在基本編輯技能和專業(yè)知識的基礎(chǔ)上應(yīng)具備下列幾方面的素質(zhì)。青年編輯應(yīng)該熟練應(yīng)用一些基本軟件:主要的繪圖軟件Visio、Origin7.0、Chemoffice、AutoCAD;圖片效果處理的常用軟件Photoshop、Illustrator、Coreldraw;數(shù)學(xué)公式編輯軟件MathType以及排版軟件Latex等。青年編輯要了解編輯行業(yè)不斷更新的新技術(shù):DOI作為數(shù)字對象唯一標(biāo)識符,是云計(jì)算背景下最佳的“大數(shù)據(jù)”樣本存儲和應(yīng)用技術(shù);CrossRef推出的CrossMark可使讀者了解該篇論文的“前世今生”,包括這篇論文是否更正或修改過,哪篇博客或哪些媒體介紹過該論文,以及該論文被下載的次數(shù)等;ORCID使作者能夠跨學(xué)科、跨機(jī)構(gòu)地將自己的身份連接到研究對象,如數(shù)據(jù)集、設(shè)備和引文等,且該身份是唯一的;Cited-by引文追蹤服務(wù)可以使出版商和作者了解該論文或期刊的引用情況;FundRef主要用于資助情況(機(jī)構(gòu)、項(xiàng)目名稱等)的規(guī)范化,也可讓資助者了解產(chǎn)出情況。青年編輯應(yīng)熟練地掌握和應(yīng)用英語,只有具有一定的英語閱讀和英語寫作能力,才能迅速地了解并跟蹤國際學(xué)術(shù)發(fā)展的走向和國際科技期刊的前沿信息,及時(shí)發(fā)現(xiàn)并糾正英文摘要和英文題目中出現(xiàn)的錯(cuò)誤并檢查英文文獻(xiàn)的引用是否恰當(dāng),才能使科技期刊與國際接軌,提高期刊的影響力。

二、積極面對改革

在我國科技期刊編輯還埋頭于日常繁瑣的編輯業(yè)務(wù)時(shí),國外期刊的經(jīng)營模式和出版方式已經(jīng)發(fā)生了翻天覆地的變化。我國期刊這種規(guī)模小、實(shí)力弱的發(fā)展?fàn)顟B(tài)已經(jīng)無法適應(yīng)當(dāng)前的“國際化”趨勢,更無法與國際出版集團(tuán)相抗衡。為此,、教育部、原新聞出版總署等一直在積極推動(dòng)科技期刊改革。面對不斷深化的體制改革,青年編輯的首要任務(wù)是轉(zhuǎn)變思想觀念,認(rèn)清科技期刊的改革形勢和政策環(huán)境,不再閉門造車,從傳統(tǒng)的繁瑣重復(fù)的工作中走出來,努力接受新事物、新思想,提高網(wǎng)絡(luò)運(yùn)用能力和計(jì)算機(jī)運(yùn)用能力,只有這樣才能為改革做好準(zhǔn)備。

三、結(jié)論

篇6

>> 大數(shù)據(jù)關(guān)鍵技術(shù) 大數(shù)據(jù)關(guān)鍵技術(shù)分析及系統(tǒng)實(shí)例分析 淺談大數(shù)據(jù)基礎(chǔ)理論與關(guān)鍵技術(shù)發(fā)展 電力信息大數(shù)據(jù)高速存儲及檢索關(guān)鍵技術(shù)研究 電力大數(shù)據(jù)可視化系統(tǒng)開發(fā)關(guān)鍵技術(shù)研究及趨勢 投資統(tǒng)計(jì)大數(shù)據(jù)處理關(guān)鍵技術(shù) 基于大數(shù)據(jù)的信息系統(tǒng)關(guān)鍵技術(shù) 淺析云環(huán)境下的大數(shù)據(jù)關(guān)鍵技術(shù) 面向大數(shù)據(jù)的Deep Web數(shù)據(jù)系統(tǒng)關(guān)鍵技術(shù)研究 大數(shù)據(jù)安全和隱私保護(hù)技術(shù)體系的關(guān)鍵技術(shù)研究 移動(dòng)數(shù)據(jù)庫關(guān)鍵技術(shù)及應(yīng)用探討 社會網(wǎng)絡(luò)大數(shù)據(jù)分析框架及其關(guān)鍵技術(shù) 農(nóng)業(yè)云大數(shù)據(jù)自組織推送關(guān)鍵技術(shù)綜述 基于大數(shù)據(jù)的信息系統(tǒng)關(guān)鍵技術(shù)研究 云計(jì)算環(huán)境下的大數(shù)據(jù)可靠存儲關(guān)鍵技術(shù)概述 面向大數(shù)據(jù)的分布式系統(tǒng)設(shè)計(jì)關(guān)鍵技術(shù)研究 大數(shù)據(jù)時(shí)代下軟件工程關(guān)鍵技術(shù)分析 移動(dòng)互聯(lián)網(wǎng)的大數(shù)據(jù)處理關(guān)鍵技術(shù) 電信運(yùn)營商大數(shù)據(jù)變現(xiàn)之關(guān)鍵技術(shù) 移動(dòng)通信網(wǎng)絡(luò)中大數(shù)據(jù)處理的關(guān)鍵技術(shù) 常見問題解答 當(dāng)前所在位置:l.

[4]Big data[EB/OL]..

[18]丁智,林治.MapRdeuce編程模型、方法及應(yīng)用綜述[J].電腦知識與技術(shù),2014,10(30):70607064.

[19]江舢,金晶,劉鵬展,等.分布式海量數(shù)據(jù)批處理技術(shù)綜述[Z].中國科技論文在線,2012.

[20]吳哲夫,肖鷹,張彤.大數(shù)據(jù)和云計(jì)算技術(shù)探析[J].互聯(lián)網(wǎng)天地,2015(4):611.

[21]馬紅玉,張柳.大數(shù)據(jù)中的可視化分析技術(shù)[J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2014,45(s):5658.

篇7

關(guān)鍵詞:大數(shù)據(jù);數(shù)字圖書館;數(shù)據(jù)庫

中圖分類號:G252 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)22-0261-04

Abstract: With the development of the Internet, information technology is developing fast, big data, cloud computing, Internet of things, such as vigorous development, the age of the Internet to a new level. In this paper is based on digital library as the background, study of characteristic database in the two projects and related statistical data.

Key words: big data; digital library; the database

從這個(gè)“大數(shù)據(jù)”展上看到了什么?2016年5月25日,中國大數(shù)據(jù)產(chǎn)業(yè)峰會暨中國電子商務(wù)創(chuàng)新發(fā)展峰會在貴陽開幕。國務(wù)院總理出席開幕式并發(fā)表致辭。在致辭中說,當(dāng)今世界,信息化浪潮席卷全球,大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等蓬勃發(fā)展,使互聯(lián)網(wǎng)[1]時(shí)代邁上一個(gè)新臺階。今天的中國要把握住世界科技革命的歷史機(jī)遇[1],按照創(chuàng)新、協(xié)調(diào)、綠色、開放、共享的發(fā)展理念,加快創(chuàng)新型國家建設(shè),著力推進(jìn)結(jié)構(gòu)性改革尤其是供給側(cè)結(jié)構(gòu)性改革,推動(dòng)信息化與實(shí)體經(jīng)濟(jì)深度融合發(fā)展,不斷提升全要素生產(chǎn)率,努力保持經(jīng)濟(jì)中高速增長、邁向中高端水平。

表示,要通過簡政放權(quán)放管結(jié)合積極培育發(fā)展大數(shù)據(jù)等信息網(wǎng)絡(luò)產(chǎn)業(yè)。依靠改革推動(dòng)發(fā)展,這方面需要市場主導(dǎo),政府也大有可為。要打破“信息孤島”和“數(shù)據(jù)煙囪”,推動(dòng)政府信息共享,提升政府效能,讓企業(yè)和群眾辦事創(chuàng)業(yè)更方便。除涉及國家安全、商業(yè)秘密、個(gè)人隱私以外的數(shù)據(jù),都應(yīng)向社會開放。充分利用信息化手段完善市場監(jiān)管,形成線上線下一體化監(jiān)管格局,實(shí)現(xiàn)“人在干、數(shù)在轉(zhuǎn)、云在算”。利用大數(shù)據(jù)等技術(shù)為民謀利、解民所憂,促進(jìn)形成公平普惠、便捷高效的民生服務(wù)體系。

我國數(shù)字圖書館的建設(shè)與發(fā)展,需要一大批高水平、高素質(zhì)的圖書館專業(yè)隊(duì)伍。

中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所所長孫坦以“數(shù)字圖書館的發(fā)展與變革-面向語義信息環(huán)境的嵌入式圖書館服務(wù)”為題,從基于系統(tǒng)的服務(wù)變化、基于館員的服務(wù)變化以及再造數(shù)字信息基礎(chǔ)設(shè)施等方面對數(shù)字圖書館的發(fā)展與變革進(jìn)行了詳細(xì)論述。

浙江圖書館副館長劉曉清以“數(shù)字圖書館建設(shè)與技術(shù)創(chuàng)新探索”為題,從數(shù)字圖書館的理想與現(xiàn)實(shí)、浙江數(shù)字圖書館建設(shè)、資源建設(shè)與整合、服務(wù)推廣、數(shù)字圖書館案例的討論、技術(shù)與服務(wù)創(chuàng)新探索等方面對數(shù)字圖書館的建設(shè)與服務(wù)作了講解。提出數(shù)字圖書館是一個(gè)生態(tài)系統(tǒng),數(shù)字圖書服務(wù)要形成產(chǎn)品,追求用戶體驗(yàn)的不斷提升

1 大數(shù)據(jù)中數(shù)字圖書館和自建數(shù)據(jù)庫分析

我們以中國知網(wǎng)電子資源為檢索平臺,以主題=“大數(shù)據(jù)數(shù)字圖書館”搜索,從發(fā)表年度,學(xué)科,來源數(shù)據(jù)庫這三個(gè)方面進(jìn)行統(tǒng)計(jì),結(jié)果如下圖、表。

圖3和表3是分別對應(yīng)的,從圖表中我們看出,2002年一直到2015年,大數(shù)據(jù)的數(shù)字圖書館方面的文章基礎(chǔ)都是在500-600篇左右徘徊,沒有太大的發(fā)展和突破,圖書情報(bào)與數(shù)字圖書館, 計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用這兩個(gè)學(xué)科所占比例達(dá)到90%以上,來源數(shù)據(jù)庫主中中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫占了7473篇,中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫占880篇,還有特色期刊占了316篇,還有一些中國重要報(bào)紙全文數(shù)據(jù)庫和中國重要會議論文全文數(shù)據(jù)庫有300多篇。

圖6和表6是分別對應(yīng)的,從圖表中我們看出,2002年一直到2015年,自建數(shù)據(jù)庫方面的文章基礎(chǔ)都是在50-300篇左右,圖書情報(bào)與數(shù)字圖書館, 計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用這兩個(gè)學(xué)科所占比例達(dá)到95%以上,其他領(lǐng)域相對較少,來源數(shù)據(jù)庫中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫占了3698篇,中國優(yōu)秀碩士學(xué)位論文,特色期刊,中國重要報(bào)紙全文數(shù)據(jù)庫分別只有100多篇.

從圖6,表6中,我們可以看出,在大數(shù)據(jù)時(shí)代背景下,數(shù)字圖書館在近10年左右,創(chuàng)新和發(fā)展得很少, 數(shù)字圖書館在圖書情報(bào)領(lǐng)域,計(jì)算機(jī)領(lǐng)域應(yīng)用的比較廣泛.

2 特色數(shù)據(jù)庫研究

本文之前研究的課題《基于物聯(lián)網(wǎng)技術(shù)的苗木種質(zhì)資源管理應(yīng)用研究》[2],再加上現(xiàn)在正在研究的課題《花卉資源的關(guān)聯(lián)規(guī)則算法》為依據(jù),

《基于物聯(lián)網(wǎng)技術(shù)的苗木種質(zhì)資源管理應(yīng)用研究》項(xiàng)目中,數(shù)據(jù)庫主要是搜集苗木信息,并設(shè)計(jì)相關(guān)數(shù)據(jù)庫,研究的是苗木種質(zhì)資源這塊內(nèi)容。

《花卉資源的關(guān)聯(lián)規(guī)則算法》項(xiàng)目主要研究的是花卉信息數(shù)據(jù)中的相關(guān)內(nèi)容。

這兩個(gè)項(xiàng)目中研究的都是正對某一領(lǐng)域而專門制作的數(shù)據(jù)庫的研究,《基于物聯(lián)網(wǎng)技術(shù)的苗木種質(zhì)資源管理應(yīng)用研究》是針對苗木數(shù)據(jù)庫而創(chuàng)建的數(shù)據(jù)庫,《花卉資源的關(guān)聯(lián)規(guī)則算法》是針對花卉數(shù)據(jù)庫而創(chuàng)建的數(shù)據(jù)庫,在苗木數(shù)據(jù)庫中可以查詢到苗木的形態(tài)特征,生長習(xí)性,繁殖要點(diǎn),栽培管理,觀賞應(yīng)用以及其他的相關(guān)知識。通過對實(shí)物的認(rèn)識,了解,可以加深課本知識,通過實(shí)踐來認(rèn)識書本上的知識,融會貫通?!痘ɑ苜Y源的關(guān)聯(lián)規(guī)則算法》通過對花卉信息的收集,通過關(guān)聯(lián)規(guī)則算法,找出相關(guān)性,通過后臺特色數(shù)據(jù)庫的研究,可以加深相關(guān)專業(yè)對花卉的理解,加大圖書館中花卉方面書籍的流通,從而方便管理,對花卉信息提供一定的決策支持。

3 結(jié)束語

“如果能夠妥善應(yīng)用大數(shù)據(jù),我們可以擁抱更為美好的未來。”印度國家信息技術(shù)學(xué)院(NIIT)全球首席執(zhí)行官帕特瓦爾丹說,大數(shù)據(jù)就像新的原油一樣寶貴,對大數(shù)據(jù)的利用開辟了一個(gè)新興領(lǐng)域。他說,過去三、四十年,中國發(fā)展迅速,這使得數(shù)億人擺脫貧困,中國一直在發(fā)展服務(wù)業(yè)和電商產(chǎn)業(yè),制造業(yè)正在迅速現(xiàn)代化,這些產(chǎn)業(yè)已經(jīng)比較成熟,中國現(xiàn)在需要新的增長點(diǎn)。“我很高興看到中國政府現(xiàn)在開始關(guān)注大數(shù)據(jù)、互聯(lián)網(wǎng)產(chǎn)業(yè),并把它們打造成經(jīng)濟(jì)發(fā)展新引擎。”

參考文獻(xiàn):

[1] 王浩, 劉冰, 張琳琳. 大數(shù)據(jù)時(shí)代高校圖書館信息服務(wù)模式發(fā)展研究[J]. 新世界圖書館, 2016(2).

篇8

一、存在的主要問題

我國在統(tǒng)計(jì)學(xué)研究生人才培養(yǎng)模式的創(chuàng)新和實(shí)踐上存在的主要問題表現(xiàn)為:

1.培養(yǎng)目標(biāo)不清楚。經(jīng)濟(jì)統(tǒng)計(jì)學(xué)和數(shù)理統(tǒng)計(jì)學(xué)在培養(yǎng)目標(biāo)上,表述不清楚,主要以培養(yǎng)教學(xué)和科研的理論人才為主,特別是數(shù)理統(tǒng)計(jì)學(xué),因?yàn)閿?shù)理統(tǒng)計(jì)在統(tǒng)計(jì)學(xué)提升為一級學(xué)科之前為數(shù)學(xué)下設(shè)的一個(gè)二級學(xué)科,其培養(yǎng)仍然是數(shù)學(xué)人才,與當(dāng)今對統(tǒng)計(jì)學(xué)的要求相差較遠(yuǎn)。而從學(xué)生的就業(yè)角度來看,應(yīng)為應(yīng)用型的復(fù)合型人才為主。就從培養(yǎng)目標(biāo)來看,學(xué)校和學(xué)生以及社會對人才的需求上存在著很大的差異。所以如何將這幾者統(tǒng)一在一起,發(fā)揮培養(yǎng)目標(biāo)的導(dǎo)向性作用,變得非常重要。大部分沒有明確要掌握的統(tǒng)計(jì)工具、數(shù)據(jù)來源問題。

數(shù)據(jù)來源主要分為四大類:問卷調(diào)查、網(wǎng)絡(luò)數(shù)據(jù)、數(shù)據(jù)庫、試驗(yàn)設(shè)計(jì)。針對這四大類數(shù)據(jù)來源,必須有相應(yīng)的培養(yǎng)目標(biāo)。如調(diào)查數(shù)據(jù),就涉及到問卷設(shè)計(jì)、數(shù)據(jù)獲取、數(shù)據(jù)自動(dòng)提取、數(shù)據(jù)處理;網(wǎng)絡(luò)數(shù)據(jù)如何利用爬蟲技術(shù)?如何從大數(shù)據(jù)數(shù)據(jù)庫提取數(shù)據(jù)?

2.課程體系陳舊、無法適應(yīng)大數(shù)據(jù)時(shí)代。統(tǒng)計(jì)學(xué)提升為一級學(xué)科后,經(jīng)濟(jì)統(tǒng)計(jì)學(xué)和數(shù)理統(tǒng)計(jì)學(xué)的課程設(shè)置都不再適合統(tǒng)計(jì)學(xué)研究生的培養(yǎng)。而且以前的統(tǒng)計(jì)學(xué)的課程設(shè)置本身也存在著很多問題。比如:(1)課程涉及的領(lǐng)域不能更好地體現(xiàn)統(tǒng)計(jì)的應(yīng)用性。統(tǒng)計(jì)學(xué)是一門綜合性、適應(yīng)面非常廣的應(yīng)用型的學(xué)科。而目前很多統(tǒng)計(jì)學(xué)研究生培養(yǎng)的課程體系過分注重理論的研究,比如數(shù)理統(tǒng)計(jì)學(xué)就過分注重?cái)?shù)學(xué)基礎(chǔ)類課程的學(xué)習(xí),經(jīng)濟(jì)統(tǒng)計(jì)學(xué)只注重經(jīng)濟(jì)問題的一些簡單理論分析。導(dǎo)致課程設(shè)置的范圍狹窄,開設(shè)的交叉學(xué)科和跨學(xué)科課程較少,大多數(shù)研究生都被束縛在本專業(yè)的研究方向上,致使研究生視野不夠?qū)捳{(diào),科研能力和適應(yīng)能力受到很大的限制。(2)前沿性知識在研究生專業(yè)課程中所占的比重不足。統(tǒng)計(jì)學(xué)課程內(nèi)容較為陳舊,研究性、前沿性不夠,有些課程內(nèi)容沒有反映出統(tǒng)計(jì)學(xué)學(xué)科領(lǐng)域內(nèi)的一些最新知識和科研成果,尤其是一些反映統(tǒng)計(jì)學(xué)學(xué)科領(lǐng)域的熱點(diǎn)、重點(diǎn)的研究以及未來發(fā)展趨勢等前沿性的知識,很少能夠及時(shí)地反映到研究生教育的課程內(nèi)容中。(3)研究生課程創(chuàng)新性不足。統(tǒng)計(jì)學(xué)研究生層次差距很大,比如數(shù)理統(tǒng)計(jì)學(xué)的研究生很多本科為數(shù)學(xué)專業(yè),很多統(tǒng)計(jì)學(xué)的基礎(chǔ)課程沒有開設(shè),而有些同學(xué)本科為統(tǒng)計(jì)學(xué)專業(yè),致使碩士生課程與本科生課程拉不開檔次,教學(xué)內(nèi)容重復(fù),教學(xué)方法與教學(xué)形式比較單一,大都采取以講授為主,討論為輔的授課方法,部分課程因?yàn)闆]有較嚴(yán)格的課外文獻(xiàn)的閱讀要求,致使課堂上的討論較難深入,考試以論文形式,學(xué)生通過率很高,課程結(jié)束后學(xué)生收獲不大。

3.實(shí)踐環(huán)節(jié)未得到應(yīng)該的重視和體現(xiàn)。傳統(tǒng)的統(tǒng)計(jì)學(xué)研究生在實(shí)踐教學(xué)環(huán)節(jié)方面比較欠缺,不重視諸如統(tǒng)計(jì)軟件、實(shí)習(xí)實(shí)訓(xùn)、實(shí)驗(yàn)課程、產(chǎn)學(xué)研合作等,缺乏數(shù)據(jù)環(huán)境。

4.考核制度沒有真正得到落實(shí)。在研究生培養(yǎng)模式中,考核制度起著篩選、分流、淘汰、激勵(lì)的作用,對研究生的培養(yǎng)質(zhì)量起到了保障作用,但實(shí)際中很難真正落實(shí)。一方面,是因?yàn)檠芯糠諊粷庠斐傻?,另一方面,部分學(xué)生為就業(yè)奔波,投放在論文上的精力不夠,再加上經(jīng)費(fèi)不足,這在一定程度上影響了畢業(yè)論文的質(zhì)量。統(tǒng)計(jì)學(xué)碩士研究生的培養(yǎng)還需要從整體優(yōu)化的角度去研究與實(shí)踐。

二、統(tǒng)計(jì)學(xué)碩士生人才培養(yǎng)構(gòu)建

如何構(gòu)建統(tǒng)計(jì)學(xué)研究生人才培養(yǎng)的新模式必須回答三個(gè)基本問題:為什么要構(gòu)建新的培養(yǎng)模式?新的培養(yǎng)模式主要有哪些內(nèi)容?怎樣進(jìn)行構(gòu)建?必須明確新的人才培養(yǎng)模式目的,在于提高研究生教學(xué)質(zhì)量和專業(yè)人才培養(yǎng)質(zhì)量,從而適應(yīng)當(dāng)今社會對統(tǒng)計(jì)學(xué)高層次人才的需求;必須明確新的人才培養(yǎng)模式的具體培養(yǎng)目標(biāo),從而進(jìn)行具體構(gòu)建。

首先需明確制定新的人才培養(yǎng)模式的途徑和措施,以下主要從新的人才培養(yǎng)模式構(gòu)建的具體內(nèi)容、思路和方法方面進(jìn)行研究與實(shí)踐探索。

1.培養(yǎng)目標(biāo)的明確及其導(dǎo)向作用的發(fā)揮。隨著研究生的不斷擴(kuò)招,培養(yǎng)以教學(xué)和科研的理論人才為主的培養(yǎng)目標(biāo)已經(jīng)不再適應(yīng)社會的需求和發(fā)展,特別是統(tǒng)計(jì)學(xué)本身就是應(yīng)用型的學(xué)科。研究生人才成為了推動(dòng)生產(chǎn)力發(fā)展的直接力量,所以應(yīng)用復(fù)合型的人才更多地被社會所需要,所以明確培養(yǎng)目標(biāo)是研究生教育成功的第一步,而真正發(fā)揮科學(xué)的培養(yǎng)目標(biāo)的導(dǎo)向作用是研究生教育成功的關(guān)鍵。

2.統(tǒng)計(jì)學(xué)研究生課程體系的完善。課程體系是人才培養(yǎng)模式的重要組成部分。完善統(tǒng)計(jì)學(xué)學(xué)科研究生課程體系是統(tǒng)計(jì)學(xué)研究生人才培養(yǎng)模式的關(guān)鍵。統(tǒng)計(jì)學(xué)學(xué)科研究生培養(yǎng)模式的課程體系建設(shè)創(chuàng)新,應(yīng)在思想方法上真正重視統(tǒng)計(jì)學(xué)研究生課程體系建設(shè),真正體現(xiàn)課程建設(shè)的創(chuàng)新性,不斷加快和完善統(tǒng)計(jì)學(xué)碩士生課程體系的設(shè)計(jì)、創(chuàng)新、內(nèi)容修訂和評估體系,以適應(yīng)新興學(xué)科、邊緣學(xué)科和交叉學(xué)科發(fā)展對研究生知識結(jié)構(gòu)的要求,并精選課程內(nèi)容,編寫高質(zhì)量教材和改進(jìn)課程教學(xué)方法,建立合理、完善的課程檢査評估體系,為提高研究生課程教學(xué)質(zhì)量提供堅(jiān)實(shí)的保障。

3.強(qiáng)化實(shí)踐教學(xué)環(huán)節(jié)和統(tǒng)計(jì)軟件應(yīng)用能力。開始針對統(tǒng)計(jì)學(xué)研究生的實(shí)驗(yàn)課程體系,強(qiáng)化統(tǒng)計(jì)學(xué)軟件如SAS、R、SPSS等編程與實(shí)際問題的實(shí)現(xiàn)等,強(qiáng)化與企事業(yè)單位的合作,從畢業(yè)論文、專業(yè)實(shí)習(xí)等方面加強(qiáng)合作,提升研究生的實(shí)際動(dòng)手能力,讓其初步具有在企事業(yè)單位從事相關(guān)工作的能力。同時(shí)需要強(qiáng)化研究生的統(tǒng)計(jì)軟件的學(xué)習(xí)和應(yīng)用,現(xiàn)今數(shù)據(jù)量越來越大、數(shù)據(jù)結(jié)構(gòu)越來越復(fù)雜,使得要解決實(shí)際問題必須熟練掌握統(tǒng)計(jì)軟件的使用和編程,否則無法很好地完成處理、分析數(shù)據(jù)的實(shí)際需要。

4.構(gòu)建科學(xué)合理的考核制度?,F(xiàn)在大多數(shù)考核仍為考試驅(qū)動(dòng)型,學(xué)生只會考試,沒有形成有效知識結(jié)構(gòu),應(yīng)用實(shí)踐能力弱。對于應(yīng)用性較強(qiáng)的一類課程應(yīng)該從大作業(yè)、專題報(bào)告、程序編寫、軟件應(yīng)用、討論、上機(jī)操作、考試等多維度進(jìn)行知識水平測度。構(gòu)建科學(xué)合理的多樣化、多元化的考評范式,對學(xué)生產(chǎn)生潛移默化的影響。強(qiáng)調(diào)課前、課中、課后的相互聯(lián)系,增強(qiáng)學(xué)生自學(xué)能力,強(qiáng)化師生互動(dòng),把學(xué)生從應(yīng)考能手培養(yǎng)成具有創(chuàng)新意思和實(shí)際動(dòng)手能力的科研好手。同時(shí)還要不斷完善學(xué)術(shù)規(guī)范,將其納人考核范圍之內(nèi),建立健全一套科學(xué)、合理、共同遵守的學(xué)術(shù)規(guī)范,對學(xué)術(shù)不端行為加以監(jiān)督和懲處,以凈化研究生的學(xué)術(shù)環(huán)境。要不斷提高學(xué)位論文質(zhì)量并將其作為考核研究生創(chuàng)新能力的一項(xiàng)指標(biāo)。

三、培養(yǎng)模式構(gòu)建的具體內(nèi)容

1.重構(gòu)統(tǒng)計(jì)學(xué)碩士課程體系:學(xué)位課,基礎(chǔ)課,實(shí)驗(yàn)課,實(shí)踐課。學(xué)位課注重統(tǒng)計(jì)學(xué)基礎(chǔ)的搭建,基礎(chǔ)課拓展學(xué)生統(tǒng)計(jì)基本方法,實(shí)驗(yàn)課培養(yǎng)學(xué)生動(dòng)手能力,實(shí)踐課的培養(yǎng)讓學(xué)生適應(yīng)數(shù)據(jù)環(huán)境。大數(shù)據(jù)分析需要的基本知識領(lǐng)域:(1)數(shù)據(jù)的存儲、管理:數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)集市、分布式數(shù)據(jù)庫,云存儲、云計(jì)算、分布式、動(dòng)態(tài)式存儲;(2)數(shù)據(jù)ETL、處理:多源異構(gòu)、非結(jié)構(gòu)化數(shù)據(jù)的清洗、轉(zhuǎn)換、綜合、優(yōu)化,文本處理、日志處理、圖像、視頻處理等,注重?cái)?shù)據(jù)質(zhì)量、數(shù)據(jù)管理等;(3)數(shù)據(jù)統(tǒng)計(jì)分析與挖掘:時(shí)序、多源、多元、面板、大數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計(jì)、預(yù)測、挖掘、開發(fā)等;(4)數(shù)據(jù)可視化i可視化是基本要求,可視化易于接受,直觀形象;(5)大數(shù)據(jù)分析案例:必須引入金融、電信、電商、移動(dòng)互聯(lián)、醫(yī)藥、零售、能源等領(lǐng)域的大數(shù)據(jù)真實(shí)案例,豐富認(rèn)識。

2.合理分配各課程模塊的學(xué)分和學(xué)時(shí),注重實(shí)踐課程的設(shè)置,大部分院校碩士生課程主要以理論為主,強(qiáng)化實(shí)踐教學(xué)及其重要。

3.主動(dòng)適應(yīng)大數(shù)據(jù),開設(shè)大數(shù)據(jù)相關(guān)課程,如大數(shù)據(jù)平臺、計(jì)算平臺、編程平臺、數(shù)據(jù)平臺、可視化平臺等。

4.強(qiáng)化實(shí)踐教學(xué)環(huán)節(jié),提高前沿性知識課程所占比重。

5.合理開設(shè)交叉學(xué)科和跨學(xué)科課程。

篇9

Abstract The arrival of the era of big data endows the library with new service content and requirements. In the aspect of open data services, libraries need to switch roles, and to provide users with collections catalog, data governance,open access, knowledge discovery, semantic analysis and other services.

Keywords big data;open data;library service;knowledge discovery;information organization

大數(shù)據(jù)帶來的信息風(fēng)暴正在變革人類的生活、工作和思維[1]。在大數(shù)據(jù)時(shí)代,滲透到各個(gè)行業(yè)、領(lǐng)域的數(shù)據(jù)成為了推動(dòng)社會發(fā)展的要素之一,因此有人稱大數(shù)據(jù)時(shí)代的數(shù)據(jù)就是“金礦”。但這種“金礦”的價(jià)值挖掘與實(shí)現(xiàn)需要借助相應(yīng)的技術(shù)與平臺,也需要人類智慧的參與,于是,對大數(shù)據(jù)資源的高效利用成為了相關(guān)業(yè)界如IT、企業(yè)、科研等普遍關(guān)注的問題。以信息組織、信息利用為所長的圖書館,也感受到了大數(shù)據(jù)時(shí)代所帶來的變化,在近年來也展開了大量的圖書館視野下的相關(guān)理論研究。

大數(shù)據(jù)帶給圖書館的影響與變化主要是數(shù)據(jù)的變化,即圖書館從面對傳統(tǒng)的有序、單一、少量的結(jié)構(gòu)化數(shù)據(jù)如數(shù)據(jù)庫數(shù)據(jù)向無序、多元、海量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)方向轉(zhuǎn)移。其中,作為大數(shù)據(jù)組成部分、集合了理念與實(shí)踐的開放數(shù)據(jù)(Open Data)也受到了關(guān)注與研究。本文在概述大數(shù)據(jù)與開放數(shù)據(jù)的基礎(chǔ)上,對開放數(shù)據(jù)視角下的圖書館角色進(jìn)行了審視與分析,最后對大數(shù)據(jù)時(shí)代開放數(shù)據(jù)環(huán)境下的圖書館創(chuàng)新服務(wù)如數(shù)據(jù)監(jiān)管、知識發(fā)現(xiàn)等服務(wù)進(jìn)行了列舉和概述。

1 大數(shù)據(jù)與開放數(shù)據(jù)概述

1.1 大數(shù)據(jù)

目前,業(yè)界對大數(shù)據(jù)還沒有一個(gè)明確的定義,但也一般都認(rèn)為大數(shù)據(jù)是不可能用常規(guī)軟件和分析工具進(jìn)行分析的巨大數(shù)據(jù)集[2]。此外,大數(shù)據(jù)既有結(jié)構(gòu)化數(shù)據(jù),也有非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),涵蓋了文本、數(shù)字、圖像、視頻等多種類型,并可跨越多個(gè)數(shù)據(jù)平臺,如社交媒體網(wǎng)絡(luò)、網(wǎng)絡(luò)日志文件、傳感器、智能手機(jī)的定位數(shù)據(jù)、數(shù)字化文檔及歸檔的照片和視頻等[3]。

1.2 開放數(shù)據(jù)

互聯(lián)網(wǎng)與開放獲取(Open Access,OA)運(yùn)動(dòng)的發(fā)展,既使得人們的信息交流更加便捷與方便,也讓對開源和開放知識、數(shù)據(jù)、資源的利用逐漸成為人們獲取信息的主要組成部分。由此而產(chǎn)生的自由開放思維也成了人們信息獲取的主要思維,總是期待著出現(xiàn)解決不局限于軟件、開放格式和數(shù)據(jù)自由公開與再使用的開放信息,于是一種實(shí)現(xiàn)了更廣范圍的公開與再使用數(shù)據(jù)即開放數(shù)據(jù)便應(yīng)運(yùn)而生。

對開放數(shù)據(jù)的定義存在爭論,不同的組織、機(jī)構(gòu)也存在不同的理解視角,但對于開放數(shù)據(jù)的內(nèi)涵即其是一種理念及實(shí)踐、數(shù)據(jù)不受版權(quán)與專利等機(jī)制限制、可以被任何人自由獲取還是都能接受與認(rèn)可。有學(xué)者也曾對開放數(shù)據(jù)的內(nèi)涵闡釋為:按照用戶特定的需求和一定的互聯(lián)網(wǎng)協(xié)議、規(guī)則、框架,對Web數(shù)據(jù)進(jìn)行存儲和組織的活動(dòng),而利用的數(shù)據(jù)來自不同的數(shù)據(jù)源或是不同的數(shù)據(jù)類型,最終目標(biāo)是實(shí)現(xiàn)信息在網(wǎng)絡(luò)空間的開放、共享與重用,以尋求信息數(shù)據(jù)最大可能的無限獲取與重用[4]。

開放數(shù)據(jù)與一般的數(shù)據(jù)相比,其最大的特征就是數(shù)據(jù)集增值方式,即對象數(shù)據(jù)包含了所有的事實(shí)、數(shù)據(jù)、信息乃至智慧和知識,也不如其它傳統(tǒng)數(shù)據(jù)可以直接獲取、利用和分析,依賴于見證者而存在,不是我們接受或不接受的數(shù)據(jù)或其它,是我們給予、分享和接受的記憶[5]。同時(shí),開放數(shù)據(jù)還具有開放性增值方式,因而在用戶多、普及率高的政府網(wǎng)站及公共信息服務(wù)、商業(yè)應(yīng)用等領(lǐng)域應(yīng)用廣泛,目前,英、美、澳等政府和淘寶等商業(yè)組織都應(yīng)用開放數(shù)據(jù)進(jìn)行信息公開等服務(wù),以增強(qiáng)與公眾、用戶之間的交流與互信。

2 基于開放數(shù)據(jù)視角的圖書館角色審視與定位

在開放數(shù)據(jù)的具體實(shí)踐如開放存取運(yùn)動(dòng)、開放研究出版、科學(xué)家電子實(shí)驗(yàn)筆記開放及科學(xué)知識的出版與交流等形式中,圖書館都是各個(gè)實(shí)踐形式的主要參與者與推行者,但由于開放數(shù)據(jù)運(yùn)動(dòng)目前在各國的實(shí)踐主體主要是政府,并且世界主要發(fā)達(dá)國家如美國、英國、法國等也均承諾政府將把公眾的需求放在重要位置,通過征求公眾意見逐步開放有價(jià)值的數(shù)據(jù)集,體現(xiàn)了政府在開放數(shù)據(jù)運(yùn)動(dòng)中的絕對推動(dòng)者、踐行者地位。在這種環(huán)境下,圖書館必須準(zhǔn)確定位自己的角色,發(fā)揮自身優(yōu)勢為開放數(shù)據(jù)的發(fā)展提供服務(wù),如基于開放數(shù)據(jù)的館藏目錄、開放獲取等。

Hope Leman認(rèn)為在開放數(shù)據(jù)運(yùn)動(dòng)中,圖書館員是知識工具箱與支持專家,即實(shí)現(xiàn)對概念的知識注釋、實(shí)驗(yàn)及相關(guān)技術(shù)研發(fā)的知識支持[6]。我國學(xué)者劉春麗、徐躍權(quán)則認(rèn)為在開放數(shù)據(jù)環(huán)境中,圖書館可能扮演與研究周期各個(gè)階段的科學(xué)產(chǎn)出匹配的知識服務(wù)中心和開放數(shù)據(jù)的管理和保存中心兩大角色[7]。

(1)知識服務(wù)中心。隨著科學(xué)研究的周期不同,圖書館在科研過程中所發(fā)揮的作用和提供的服務(wù)也隨之不同,如在科學(xué)研究的概念階段,圖書館可為進(jìn)行科學(xué)理念、研究計(jì)劃討論的用戶提供開放書目等服務(wù),并將討論結(jié)果等形成新的知識分享數(shù)據(jù);在數(shù)據(jù)分析與出版階段,圖書館可借助于在開放存取期刊發(fā)表、提交到機(jī)構(gòu)知識庫中等途徑將科學(xué)研究的結(jié)論、實(shí)驗(yàn)數(shù)據(jù)、科研過程等進(jìn)行開放獲取與共享交流;在同行評審階段,圖書館可以發(fā)揮科研情報(bào)中心的作用,基于學(xué)術(shù)社交網(wǎng)絡(luò)及開放存取平臺,分析科學(xué)研究論文與數(shù)據(jù)的使用與評價(jià)活動(dòng),提取基于使用與評價(jià)的選擇性計(jì)量指標(biāo)(Altmetrics),對科學(xué)論文和科學(xué)數(shù)據(jù)的科學(xué)價(jià)值進(jìn)行評價(jià),進(jìn)而評估論文與作者在某一個(gè)研究領(lǐng)域的學(xué)術(shù)影響力[7]。

(2)開放數(shù)據(jù)的管理與保存中心。歐洲研究圖書館協(xié)會主席Paul Ayris博士認(rèn)為在科學(xué)研究的開放工作流中,要增加專業(yè)圖書館的可見度,要重視科學(xué)數(shù)據(jù)的再利用及科學(xué)數(shù)據(jù)保存的可持續(xù)性[8]。筆者以為在以數(shù)據(jù)密集型為科學(xué)研究特征的第四代科研范式下,數(shù)據(jù)特別是產(chǎn)生于實(shí)驗(yàn)、記錄了科研過程等重要信息的科學(xué)數(shù)據(jù)是科學(xué)研究所重視和再利用的數(shù)據(jù)對象,圖書館有責(zé)任與義務(wù)扮演開放數(shù)據(jù)管理與中心的角色,以為科學(xué)家等用戶群體提供開放數(shù)據(jù)的檢索、分析、保存等服務(wù)?;陂_放數(shù)據(jù)的連續(xù)利用視角,圖書館還需進(jìn)行諸如開放數(shù)據(jù)的關(guān)聯(lián)與、標(biāo)示與引用等服務(wù)。

3 大數(shù)據(jù)時(shí)代的圖書館開放數(shù)據(jù)服務(wù)

大數(shù)據(jù)帶給社會以數(shù)據(jù)驅(qū)動(dòng)的社會創(chuàng)新與發(fā)展動(dòng)力,因此如美國總統(tǒng)科學(xué)技術(shù)顧問委員會給總統(tǒng)和國會的報(bào)告所說“聯(lián)邦政府的每一個(gè)機(jī)構(gòu)和部門,都要制定一個(gè)應(yīng)對大數(shù)據(jù)的戰(zhàn)略”[9]一樣,包括政府在內(nèi)的社會各個(gè)機(jī)構(gòu)如美國政府、歐盟等都制定了應(yīng)對大數(shù)據(jù)的戰(zhàn)略對策。2010年11月,歐盟通信委員會向歐洲議會提交了“開放數(shù)據(jù): 創(chuàng)新、增長和透明治理的引擎”報(bào)告[10],首次將開放數(shù)據(jù)與大數(shù)據(jù)關(guān)聯(lián)到了一起,并以開放數(shù)據(jù)為核心,對大數(shù)據(jù)時(shí)代的挑戰(zhàn)進(jìn)行了戰(zhàn)略部署。但將大數(shù)據(jù)概念應(yīng)用到開放數(shù)據(jù)上,則首先意味著數(shù)據(jù)的規(guī)模和類型有了變化,產(chǎn)生于社交媒體、智能終端、傳感器上的海量非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)都是開放數(shù)據(jù)的范疇;其次,意味著數(shù)據(jù)的應(yīng)用發(fā)生了變化,即數(shù)據(jù)不再是單一領(lǐng)域的數(shù)據(jù),而是覆蓋了用戶的所有需求領(lǐng)域,并可直接獲取和應(yīng)用。

大數(shù)據(jù)賦予開放數(shù)據(jù)的新要求也意味著大數(shù)據(jù)時(shí)代的圖書館開放數(shù)據(jù)服務(wù)將被賦予新的要求,筆者認(rèn)為,大數(shù)據(jù)時(shí)代的圖書館開放數(shù)據(jù)服務(wù),主要有:

(1)多領(lǐng)域數(shù)據(jù)源的整合與開放服務(wù)。從目前的開放數(shù)據(jù)運(yùn)動(dòng)發(fā)展來看,主要實(shí)踐有開放政府?dāng)?shù)據(jù)、開放存取學(xué)術(shù)期刊與機(jī)構(gòu)知識庫,距大數(shù)據(jù)時(shí)代所要求的多類型、多領(lǐng)域發(fā)展程度要求尚遠(yuǎn)。圖書館由于有著涵蓋了所有領(lǐng)域的豐富館藏資源,是大數(shù)據(jù)時(shí)代數(shù)據(jù)開放與整合的最佳實(shí)踐者。因此,圖書館可整合多方資源,如科技、人文、氣象、政務(wù)等諸多領(lǐng)域的報(bào)告、實(shí)驗(yàn)數(shù)據(jù)等資源,進(jìn)行數(shù)據(jù)的整合與開放,讓公眾通過圖書館的一站式檢索服務(wù)平臺來獲取所需的數(shù)據(jù)。

(2)基于知識聯(lián)盟的數(shù)據(jù)開放與共享服務(wù)。由于大數(shù)據(jù)時(shí)代的開放數(shù)據(jù)是整合了不同系統(tǒng)、政府和部門之間的數(shù)據(jù)集,這就需要建立一個(gè)數(shù)據(jù)共享和互操作的框架,如新澤西州運(yùn)輸部利用采集到的數(shù)據(jù)(在汽車制造商的管轄下)能夠發(fā)現(xiàn)諸如擁堵和交通流等問題,而這些功能通常是由當(dāng)?shù)鼗蛉珖恼煌ㄟ\(yùn)輸部門負(fù)責(zé)[11]。圖書館可借鑒這些成功的案例進(jìn)行構(gòu)建或參與到由政府、企業(yè)、社會機(jī)構(gòu)組成的知識聯(lián)盟,利用協(xié)作分析技術(shù)對數(shù)據(jù)和系統(tǒng)進(jìn)行無縫隙整合。

(3)基于一站式服務(wù)平臺的知識發(fā)現(xiàn)服務(wù)。數(shù)據(jù)“開放”的核心是為了用戶更高效的發(fā)現(xiàn)和利用,以縮小信息所有者和用戶的信息不對稱距離。EDS、PRIMO、SUMMON等一站式知識發(fā)現(xiàn)平臺的應(yīng)用為圖書館的開放數(shù)據(jù)知識發(fā)現(xiàn)服務(wù)提供了方便,圖書館可應(yīng)用這些平臺對用戶提供知識咨詢等服務(wù)。

(4)數(shù)據(jù)的開發(fā)、創(chuàng)建、共享與轉(zhuǎn)換服務(wù)。此類服務(wù)在圖書館界已有著成功的實(shí)踐,如開源站點(diǎn)biblios.net采用了類似維基模式向圖書館界提供開放MARC數(shù)據(jù)的開發(fā)、創(chuàng)建、共享、轉(zhuǎn)換服務(wù),目前以3000萬余條數(shù)據(jù)成為為全球最大的免費(fèi)圖書館編目數(shù)據(jù)平臺[12],德國國家圖書館[13]、大英圖書館[14]也宣布對外提供開放數(shù)據(jù)服務(wù)。

(5)數(shù)據(jù)監(jiān)管服務(wù)。開放數(shù)據(jù)的檢索、價(jià)值挖掘與應(yīng)用實(shí)現(xiàn),必須經(jīng)過一定的排列、存檔與管理過程,而這些數(shù)據(jù)有可能是來自于有數(shù)據(jù)組織經(jīng)驗(yàn)和能力的政府、企業(yè)、公益組織等,也可能是來自于只提供數(shù)據(jù)而沒有數(shù)據(jù)組織或沒有組織意愿的公眾、機(jī)構(gòu)。圖書館可發(fā)揮自身的信息組織、信息分類特長,對這些數(shù)據(jù)進(jìn)行修改、合并、標(biāo)引、分析與索引,即提供數(shù)據(jù)監(jiān)管服務(wù),使數(shù)據(jù)集合之后獲取最大收益。

篇10

大會熱忱歡迎從事信息安全領(lǐng)域管理、科研、教學(xué)、生產(chǎn)、應(yīng)用和服務(wù)的組織機(jī)構(gòu)和個(gè)人踴躍投稿。所投稿件經(jīng)過專家組評審后,錄取論文將在《信息網(wǎng)絡(luò)安全》(2015年第9期)雜志正刊上刊登,并收錄中國知網(wǎng)論文庫。《信息網(wǎng)絡(luò)安全》將贈送國家圖書館等單位作為藏書收藏,并向錄取論文作者發(fā)放稿費(fèi),專委會還將向優(yōu)秀論文作者頒發(fā)獎(jiǎng)金和獲獎(jiǎng)證書。

一、會議主題

2015年是網(wǎng)絡(luò)強(qiáng)國戰(zhàn)略的起步年。網(wǎng)絡(luò)強(qiáng)國離不開自主可控的安全技術(shù)支持,只有實(shí)現(xiàn)網(wǎng)絡(luò)和信息安全的前沿技術(shù)和科技水平的趕超,才能實(shí)現(xiàn)關(guān)鍵核心技術(shù)的真正自主可控,才能實(shí)現(xiàn)從戰(zhàn)略層面、實(shí)施層面全局而振的長策。當(dāng)前,信息網(wǎng)絡(luò)應(yīng)用飛速發(fā)展,技術(shù)創(chuàng)新的步伐越來越快,云計(jì)算、大數(shù)據(jù)、移動(dòng)網(wǎng)絡(luò)、物聯(lián)網(wǎng)、智能化、三網(wǎng)融合等一系列信息化應(yīng)用新概念、新技術(shù)、新應(yīng)用給信息安全行業(yè)提出新的挑戰(zhàn)。同時(shí),國際上網(wǎng)絡(luò)安全技術(shù)事件和政治博弈越來越激烈和復(fù)雜,“工業(yè)4.0”時(shí)代對網(wǎng)絡(luò)安全的沖擊來勢洶涌。我們需要全民樹立建設(shè)網(wǎng)絡(luò)強(qiáng)國的新理念,并切實(shí)提升國家第五空間的戰(zhàn)略地位和執(zhí)行力。本次會議的主題為“科技是建設(shè)網(wǎng)絡(luò)強(qiáng)國的基礎(chǔ)”。

二、征文內(nèi)容

1. 關(guān)于提升國家第五空間的戰(zhàn)略地位和執(zhí)行力的研究

2. 云計(jì)算與云安全

3. 大數(shù)據(jù)及其應(yīng)用中的安全

4. 移動(dòng)網(wǎng)絡(luò)及其信息安全

5. 物聯(lián)網(wǎng)安全

6. 智能化應(yīng)用安全

7. 網(wǎng)絡(luò)監(jiān)測與監(jiān)管技術(shù)

8. 面對新形勢的等級保護(hù)管理與技術(shù)研究

9. 信息安全應(yīng)急響應(yīng)體系

10. 可信計(jì)算

11. 網(wǎng)絡(luò)可信體系建設(shè)研究

12. 工業(yè)控制系統(tǒng)及基礎(chǔ)設(shè)施的網(wǎng)絡(luò)與信息安全

13. 網(wǎng)絡(luò)與信息系統(tǒng)的內(nèi)容安全

14. 預(yù)防和打擊計(jì)算機(jī)犯罪

15. 網(wǎng)絡(luò)與信息安全法制建設(shè)的研究

16. 重大安全事件的分析報(bào)告與對策建議

17. 我國網(wǎng)絡(luò)安全產(chǎn)業(yè)發(fā)展的研究成果與訴求

18. 其他有關(guān)網(wǎng)絡(luò)安全和信息化的學(xué)術(shù)成果

凡屬于網(wǎng)絡(luò)安全和信息安全領(lǐng)域的各類學(xué)術(shù)論文、研究報(bào)告和成果介紹均可投稿。

三、征文要求

1. 論文要求主題明確、論據(jù)充分、聯(lián)系實(shí)際、反映信息安全最新研究成果,未曾發(fā)表,篇幅控制在5000字左右。

2. 提倡學(xué)術(shù)民主。鼓勵(lì)新觀點(diǎn)、新概念、新成果、新發(fā)現(xiàn)的發(fā)表和爭鳴。

3. 提倡端正學(xué)風(fēng)、反對抄襲,將對投稿的文章進(jìn)行相似性比對檢查。

4. 文責(zé)自負(fù)。單位和人員投稿應(yīng)先由所在單位進(jìn)行保密審查,通過后方可投稿。

5. 作者須按計(jì)算機(jī)安全專業(yè)委員會秘書處統(tǒng)一發(fā)出的論文模版格式排版并如實(shí)填寫投稿表,在截止日期前提交電子版的論文與投稿表。

6、論文模版和投稿表請到計(jì)算機(jī)安全專業(yè)委員會網(wǎng)站下載,網(wǎng)址是:.cn。

聯(lián)系人:田芳,郝文江

電話:010-88513291,88513292

征文上傳Email 地址: