高性能計(jì)算機(jī)范文
時(shí)間:2023-03-23 15:32:53
導(dǎo)語(yǔ):如何才能寫好一篇高性能計(jì)算機(jī),這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
從今年7月開(kāi)始,惠普開(kāi)展了為期半年、涉及全國(guó)20個(gè)油田的高性能計(jì)算機(jī)應(yīng)用巡展,石油行業(yè)用戶對(duì)由刀片和集群構(gòu)建的高性能計(jì)算機(jī)非常熱衷,對(duì)這種高性能計(jì)算機(jī)所表現(xiàn)出的高性能、低能耗、易管理、易擴(kuò)展等特性贊賞有加。
無(wú)獨(dú)有偶,隨著最新一期的全球最快計(jì)算機(jī)排行榜(TOP500)于11月30日出爐,專家關(guān)于刀片+集群快速增長(zhǎng)的預(yù)言成真。在TOP500中,采用刀片和集群架構(gòu)的高性能計(jì)算機(jī)數(shù)量大幅增加,成為TOP500中增長(zhǎng)最好的一種類型?;萜杖雵鶷OP500的系統(tǒng)中,95%是采用刀片服務(wù)器。
刀片保證投資回報(bào)
早在兩年前,就有專家預(yù)言:未來(lái)的2~3年內(nèi),刀片式服務(wù)器將以其高服務(wù)器密度、敏捷式部署維護(hù)、全方位監(jiān)控管理融合、高可擴(kuò)展性與可用性,全面取代傳統(tǒng)基于機(jī)架式服務(wù)器的集群系統(tǒng),基于刀片式服務(wù)器的集群系統(tǒng)將得到大量應(yīng)用。
事實(shí)表明,基于刀片服務(wù)器的集群系統(tǒng)的潛力正在逐漸釋放。2006年的中國(guó)TOP100排行榜顯示,超過(guò)70%的系統(tǒng)采用了集群體系結(jié)構(gòu),而值得關(guān)注的是,其中有26套是刀片服務(wù)器集群系統(tǒng),惠普和IBM分別占有13套和11套。在這26套系統(tǒng)中,有17套用于石油勘探,6套用于網(wǎng)絡(luò)游戲。
中國(guó)惠普有限公司副總裁,商用產(chǎn)品事業(yè)部總經(jīng)理?xiàng)钪Z礎(chǔ)認(rèn)為:過(guò)去,用戶大量采用基于PC服務(wù)器的集群系統(tǒng),并在過(guò)去3~5年成為一個(gè)主流發(fā)展方向。不過(guò)在最近兩三年,基于刀片服務(wù)器的集群系統(tǒng)開(kāi)始大范圍推廣應(yīng)用。在中國(guó),石油行業(yè)是采用刀片服務(wù)器最多的一個(gè)行業(yè)。
在分析形成這一趨勢(shì)的原因時(shí),江漢油田勘探開(kāi)發(fā)研究院計(jì)算機(jī)中心的總工程師羅忠輝認(rèn)為,刀片服務(wù)器作為一種高可用高密度的低成本服務(wù)器平臺(tái),在高密度、易擴(kuò)展和低成本方面都更適合地震資料處理等石油行業(yè)的關(guān)鍵應(yīng)用需求;同時(shí),刀片式服務(wù)器集群節(jié)點(diǎn)密度高于傳統(tǒng)的1U機(jī)柜,占地面積更少,可以在有限的空間整合巨大的運(yùn)算能力,即使在未來(lái)增加更多的節(jié)點(diǎn),也不需要考慮機(jī)房空間問(wèn)題;在通風(fēng)、耗電等方面,比1U機(jī)柜更適合地球物理的應(yīng)用;在密集型的高性能計(jì)算中,刀片式服務(wù)器在布線和相互連接方面比傳統(tǒng)的機(jī)架式服務(wù)器又有很大的改進(jìn)。
而楊諾礎(chǔ)認(rèn)為,石油行業(yè)在IT應(yīng)用上與大部分行業(yè)不一樣的地方是更重視投資回報(bào),IT應(yīng)用與企業(yè)的回報(bào)率直接掛鉤,勘探的一個(gè)誤差會(huì)導(dǎo)致幾十萬(wàn)美元的成本增加。采用刀片構(gòu)建集群系統(tǒng),可以降低風(fēng)險(xiǎn)成本,IT投資回報(bào)率比較明顯。
兩大典型應(yīng)用
在中國(guó),高性能計(jì)算機(jī)應(yīng)用已經(jīng)有十多年的歷史,用戶在選擇適合自己的系統(tǒng)上更顯理性。相比用機(jī)架式服務(wù)器構(gòu)建HPC,用刀片構(gòu)建HPC具有更多優(yōu)勢(shì):它可以節(jié)省機(jī)柜空間,系統(tǒng)密度高;節(jié)省電力,刀片系統(tǒng)的能耗明顯比機(jī)架系統(tǒng)低;容易部署和管理,刀片采用模塊化架構(gòu),需要就可以插入,沒(méi)有太多的線纜,都在機(jī)架內(nèi)完成;集成了網(wǎng)絡(luò)設(shè)施,可以配置10G光纖通道與Infiniband等。
在中國(guó)石油行業(yè),兩大基于刀片的集群系統(tǒng)廣受好評(píng)。第一個(gè)集群系統(tǒng)是部署在大慶油田公司勘探開(kāi)發(fā)研究院的刀片服務(wù)器集群地震資料處理系統(tǒng)。該系統(tǒng)采用惠普開(kāi)發(fā)出的刀片服務(wù)器架構(gòu),集成了692臺(tái)惠普第三代服務(wù)器產(chǎn)品――HP BL20PG3、HP DL380G3和HP DL580G3三種服務(wù)器,選用了1432個(gè)Intel 至強(qiáng)CPU,其峰值浮點(diǎn)計(jì)算能力超過(guò) 9.8萬(wàn)億次,位居中國(guó)刀片服務(wù)器集群系統(tǒng)榜首,是國(guó)內(nèi)處理規(guī)模最大的地震資料處理系統(tǒng)。該處理系統(tǒng)用于大慶探區(qū)地震資料的高分辨目標(biāo)處理和疊前偏移處理,使大慶油田公司勘探開(kāi)發(fā)研究院具備了二維地震資料目標(biāo)處理2萬(wàn)公里、三維疊前偏移處理1萬(wàn)平方公里的年處理能力。
刀片服務(wù)器集群系統(tǒng)采用惠普的刀片服務(wù)器架構(gòu)。整個(gè)系統(tǒng)由常規(guī)計(jì)算節(jié)點(diǎn)、偏移計(jì)算節(jié)點(diǎn)、管理節(jié)點(diǎn)、I/O節(jié)點(diǎn)、核心交換網(wǎng)絡(luò)和管理網(wǎng)絡(luò)組成,并安裝了Redhat Linux AS 3.5版本操作系統(tǒng)、CMU和SIM集群管理及監(jiān)控等系統(tǒng)軟件,利用惠普公司開(kāi)發(fā)的iLO高級(jí)管理技術(shù),實(shí)現(xiàn)服務(wù)器集群的遠(yuǎn)程管理。常規(guī)計(jì)算節(jié)點(diǎn)采用200多臺(tái)HP ProLiant BL20pG3刀片服務(wù)器,千兆網(wǎng)絡(luò)端口直聯(lián),安裝在6個(gè)機(jī)柜中。HP ProLiant BL20pG3采用2個(gè)Intel 至強(qiáng)3.4 GHz DP處理器。而偏移計(jì)算節(jié)點(diǎn)則采用400多臺(tái)HP ProLiant BL20pG3。
另一個(gè)典型系統(tǒng)部署在中國(guó)地球物理界最大的專業(yè)服務(wù)公司――中國(guó)石油集團(tuán)東方地球物理公司研究院大港分院。大港分院采用了HP高性能計(jì)算集群系統(tǒng),以HP刀片式服務(wù)器作為計(jì)算節(jié)點(diǎn),實(shí)現(xiàn)二維常規(guī)處理12000公里、三維常規(guī)處理6000平方公里、迭前偏移處理3000平方千米的年處理能力,使大港分院地震資料處理能力和處理水平大幅度提升。
大港分院選用了由HP提供的包括硬件和軟件在內(nèi)的整套高性能計(jì)算方案,包括119個(gè)HP ProLiant BL20P節(jié)點(diǎn)、14個(gè)基于Intel至強(qiáng)處理器ProLiant DL380G2作為I/O節(jié)點(diǎn),以集群技術(shù)組成超級(jí)并行計(jì)算機(jī)作為地震資料處理的主機(jī)系統(tǒng),共131個(gè)節(jié)點(diǎn),262個(gè)處理器,整體計(jì)算能力實(shí)現(xiàn)浮點(diǎn)計(jì)算達(dá)1.4萬(wàn)億次/秒。
在整套系統(tǒng)中,硬件系統(tǒng)包括:I/O節(jié)點(diǎn)采用主頻為3.06Hhz的HP ProLiant DL380G2 2U機(jī)架式服務(wù)器,計(jì)算節(jié)點(diǎn)采用主頻為2.8Hhz的HP ProLiant BL20pG2刀片式服務(wù)器,監(jiān)控分發(fā)節(jié)點(diǎn)采用HP ProLiant DL380G2 2U機(jī)架式服務(wù)器,物理節(jié)點(diǎn)采用HP ProLiant DL360 1U機(jī)架式服務(wù)器,互連網(wǎng)絡(luò)系統(tǒng)采用HP ProCurve Switch 高性能網(wǎng)絡(luò)交換機(jī),每套PC-Cluster計(jì)算機(jī)系統(tǒng)由兩個(gè)網(wǎng)絡(luò)系統(tǒng)組成,一個(gè)為高性能的千兆以太網(wǎng)傳輸數(shù)據(jù)信息,一個(gè)為10/100快速以太網(wǎng)傳輸管理控制信息;存儲(chǔ)系統(tǒng)采用HP Smart Array機(jī)群陣列盤柜。
管理和服務(wù)最被看重
那么,用戶選擇刀片的標(biāo)準(zhǔn)是什么?江漢油田勘探開(kāi)發(fā)研究院計(jì)算中心總工程師羅中輝指出,用戶最看重的是管理和服務(wù)。大港分院副總工程師兼計(jì)算機(jī)服務(wù)中心主任張武斌也認(rèn)為,以刀片服務(wù)器為節(jié)點(diǎn)的高性能集群系統(tǒng)試運(yùn)行以來(lái),最大的感覺(jué)之一就是系統(tǒng)管理方便了。HP提供的集群系統(tǒng)管理軟件Cluster Management Utility管理功能全面,還具有遠(yuǎn)程管理特性,使用戶能夠在任何終端管理集群系統(tǒng),查看機(jī)器的運(yùn)行狀況。“現(xiàn)在,我們?cè)谧约旱霓k公室里就可以管理這套系統(tǒng),不必再跑到機(jī)房了,非常便捷?!?/p>
集群系統(tǒng)管理軟件Cluster Management Utility(CMU)是一個(gè)Beowulf Cluster系統(tǒng)環(huán)境下的管理軟件,它提供了友好的圖形用戶界面。比如,CMU使用了RILOE板并集成了iLO的特性,使遠(yuǎn)程文本控制臺(tái)在服務(wù)器的所有狀態(tài)下均可遠(yuǎn)程控制服務(wù)器電源。無(wú)論服務(wù)器處于何種狀態(tài),遠(yuǎn)程BIOS設(shè)置借助獨(dú)立于CMU的WEB瀏覽器,遠(yuǎn)程訪問(wèn)圖形控制臺(tái)。由于CMU具有將一個(gè)節(jié)點(diǎn)的系統(tǒng)磁盤分區(qū)克隆到其他集群節(jié)點(diǎn)的能力,能夠避免對(duì)集群中各節(jié)點(diǎn)進(jìn)行系統(tǒng)安裝或配置所帶來(lái)的耗時(shí)、費(fèi)力的工作,這一特性使大港分院能夠在3天內(nèi)就完成了集群系統(tǒng)的安裝。
篇2
關(guān)鍵詞:科學(xué)計(jì)算;大數(shù)據(jù)處理;超級(jí)計(jì)算機(jī);模擬仿真;并行計(jì)算
1引言
在現(xiàn)代科學(xué)研究和工程實(shí)踐中,通常使用數(shù)學(xué)方程式來(lái)表示某些自然科學(xué)規(guī)律,產(chǎn)生了眾多復(fù)雜繁瑣的數(shù)學(xué)計(jì)算問(wèn)題[1]?;谄胀ㄓ?jì)算工具來(lái)解決這些問(wèn)題,將耗費(fèi)大量人力物力,甚至無(wú)法得到準(zhǔn)確結(jié)果。而科學(xué)計(jì)算[2],利用計(jì)算機(jī)仿真、重現(xiàn)、預(yù)測(cè)或探索自然世界萬(wàn)物運(yùn)動(dòng)規(guī)律和演變特性的全過(guò)程,通過(guò)研究合理的計(jì)算方法,設(shè)計(jì)高效的并行算法,研制合適的應(yīng)用程序,能準(zhǔn)確、高效地模擬各領(lǐng)域研究過(guò)程,分析計(jì)算結(jié)果。然而,普通計(jì)算機(jī)的科學(xué)計(jì)算能力往往是有限的,現(xiàn)有的計(jì)算能力無(wú)法高效地解決某些基礎(chǔ)學(xué)科和工程技術(shù)部門的科學(xué)計(jì)算問(wèn)題,如長(zhǎng)期天氣預(yù)報(bào)、石油勘探、飛機(jī)整體氣動(dòng)力等等。
與此同時(shí),地震檢測(cè)儀、粒子碰撞器、天文望遠(yuǎn)鏡以及高通量分析裝置等大型科學(xué)儀器的研制和發(fā)展[3],產(chǎn)生了大量非結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù),使得“大數(shù)據(jù)”趨勢(shì)變得越來(lái)越突出[4]。如今,許多科學(xué)發(fā)現(xiàn)和見(jiàn)解由大量數(shù)據(jù)集驅(qū)動(dòng),“大數(shù)據(jù)”被認(rèn)為是除了實(shí)驗(yàn)、理論和計(jì)算方法之外的第四種科學(xué)范式[5]。數(shù)據(jù)生成的容量、速度和多樣性構(gòu)成了分析大數(shù)據(jù)的主要挑戰(zhàn)。
為提高科學(xué)計(jì)算能力,解決大數(shù)據(jù)問(wèn)題,高性能計(jì)算(HPC)[6]技術(shù)迅猛發(fā)展。高性能計(jì)算機(jī)代表用于解決計(jì)算密集型科學(xué)和工程問(wèn)題的高端計(jì)算基礎(chǔ)設(shè)施。我國(guó)的高性能計(jì)算早已突破每秒浮點(diǎn)運(yùn)算千萬(wàn)億次的壁壘,并繼續(xù)解決性能、可擴(kuò)展性、可編程性、能效和可靠性等問(wèn)題,探索新的支持技術(shù)以達(dá)到e級(jí)計(jì)算能力。
目前,高性能計(jì)算機(jī)已在多個(gè)領(lǐng)域得到了成功的應(yīng)用[7],但仍存在大量可供多個(gè)研究機(jī)構(gòu)使用的空閑節(jié)點(diǎn)。本文簡(jiǎn)介了一些高性能計(jì)算機(jī)系統(tǒng)及其性能,針對(duì)近年來(lái)在高性能計(jì)算機(jī)上的各大領(lǐng)域應(yīng)用實(shí)例進(jìn)行總結(jié),并對(duì)在其他領(lǐng)域的應(yīng)用做出了展望,以促進(jìn)更高效、全面地使用高性能計(jì)算機(jī)。
2高性能計(jì)算機(jī)系統(tǒng)概述
中國(guó)首臺(tái)千萬(wàn)億次超級(jí)計(jì)算機(jī),是“天河一號(hào)”?!疤旌右惶?hào)”超級(jí)計(jì)算機(jī)使用由中國(guó)自行研發(fā)的“龍”芯片,其峰值計(jì)算速度能夠達(dá)到1.206TFlop/s,同時(shí)Linpack實(shí)測(cè)性能達(dá)到了0.563TFlop/s,該超級(jí)計(jì)算機(jī)位居當(dāng)時(shí)公布的中國(guó)超級(jí)計(jì)算機(jī)前100強(qiáng)之首,中國(guó)成為了繼美國(guó)之后世界上第二個(gè)能夠自主研制千萬(wàn)億次超級(jí)計(jì)算機(jī)的國(guó)家。
天河一號(hào)采用6144個(gè)英特爾通用多核處理器和5120個(gè)AMD圖形加速處理器,其內(nèi)存總?cè)萘?8TB。至于點(diǎn)對(duì)點(diǎn)通信的帶寬就達(dá)到了40Gbps,而其用于共享的磁盤總?cè)萘縿t達(dá)到1PB。該超級(jí)計(jì)算機(jī)系統(tǒng)部署于天津?yàn)I海新區(qū)的國(guó)家超級(jí)計(jì)算天津中心作為業(yè)務(wù)主機(jī)。
2013年,由國(guó)防科學(xué)技術(shù)大學(xué)研制的“天河二號(hào)”大型超級(jí)計(jì)算機(jī)以每秒33.86千萬(wàn)億次的浮點(diǎn)運(yùn)算速度成為全球最快的超級(jí)計(jì)算機(jī),位列國(guó)際大型超級(jí)計(jì)算機(jī)TOP500榜首。隨后,“天河二號(hào)”實(shí)現(xiàn)了世界最快超算“六連冠”。天河二號(hào)采用基于加速器的架構(gòu)[8]。在可接受的總成本、功率預(yù)算、支持可靠性、可用性和可服務(wù)性(RAS)的能力、應(yīng)用開(kāi)發(fā)和移植的復(fù)雜性下提供高的計(jì)算性能。
天河二號(hào)的硬件系統(tǒng)由五個(gè)子系統(tǒng)組成,包括計(jì)算系統(tǒng)、通信系統(tǒng)、存儲(chǔ)系統(tǒng)、監(jiān)控診斷系統(tǒng)和服務(wù)系統(tǒng)。它由16000個(gè)節(jié)點(diǎn)組成,每個(gè)節(jié)點(diǎn)有2顆基于IvyBridge-EXeonE52692處理器和3顆XeonPhi,每個(gè)節(jié)點(diǎn)的內(nèi)存是64GB。所有的計(jì)算節(jié)點(diǎn)都通過(guò)專有的高速互連系統(tǒng)連接。還提供了一個(gè)服務(wù)子系統(tǒng)的4096個(gè)節(jié)點(diǎn),以加快高吞吐量的計(jì)算任務(wù),如大數(shù)據(jù)處理。存儲(chǔ)子系統(tǒng)包括256個(gè)I/O節(jié)點(diǎn)和64個(gè)容量為12.4PB的存儲(chǔ)服務(wù)器。天河二號(hào)文件系統(tǒng)命名為h2fs,采用麒麟操作系統(tǒng)、基于SLURM的全局資源管理。支持大多數(shù)現(xiàn)代編程語(yǔ)言,包括C、C++、Java、Python等。采用的是新型異構(gòu)多態(tài)體系結(jié)構(gòu)(Multipurpose-Heterogeneous)[9]。
天河二號(hào)的系統(tǒng)配置列于表1中。
“天河二號(hào)”集科學(xué)計(jì)算、大數(shù)據(jù)分析和云計(jì)算于一體,被認(rèn)為是滿足工業(yè)和社會(huì)需求的戰(zhàn)略基礎(chǔ)設(shè)施。以超級(jí)計(jì)算機(jī)為支撐的高性能計(jì)算應(yīng)用正加速向各個(gè)領(lǐng)域滲透。
Table1SystemindicatorsofTianhe-2
表1天河二號(hào)系統(tǒng)指標(biāo)
width=375,height=252,dpi=110
在國(guó)內(nèi)早期的高性能計(jì)算機(jī)研究中,2004年6月超級(jí)計(jì)算機(jī)曙光4000A研制成功,落戶上海超級(jí)計(jì)算中心,標(biāo)志著繼美國(guó)和日本之后,中國(guó)是第三個(gè)能研制10萬(wàn)億次高性能計(jì)算機(jī)的國(guó)家。曙光能夠每秒運(yùn)算11萬(wàn)億次,進(jìn)入全球超級(jí)計(jì)算機(jī)前十名。經(jīng)過(guò)十多年發(fā)展,曙光E級(jí)高性能計(jì)算機(jī)系統(tǒng)項(xiàng)目現(xiàn)在是國(guó)家“十三五”期間高性能計(jì)算的重點(diǎn)專項(xiàng),其最顯著的特點(diǎn)是突破了制約E級(jí)計(jì)算發(fā)展的各個(gè)關(guān)鍵技術(shù),通過(guò)這樣原型機(jī)的研制去驗(yàn)證E級(jí)的技術(shù)路線,為未來(lái)真正實(shí)現(xiàn)國(guó)產(chǎn)E級(jí)系統(tǒng)做技術(shù)鋪墊。
width=642,height=303,dpi=110
Figure1StructureofSugon’sCPU
圖1曙光CPU結(jié)構(gòu)
在2016年法蘭克福世界超算大會(huì)上,“神威·太湖之光”超級(jí)計(jì)算機(jī)系統(tǒng)成為新的榜首,速度較第二名“天河二號(hào)”快出近兩倍,效率提高三倍。
神威·太湖之光超級(jí)計(jì)算機(jī)由40個(gè)運(yùn)算機(jī)柜和8個(gè)網(wǎng)絡(luò)機(jī)柜組成。每個(gè)運(yùn)算機(jī)柜包含4塊由32塊運(yùn)算插件組成的超節(jié)點(diǎn)。每個(gè)插件由4個(gè)運(yùn)算節(jié)點(diǎn)板組成,一個(gè)運(yùn)算節(jié)點(diǎn)板又含2塊“申威26010”高性能處理器。一臺(tái)機(jī)柜就有1024塊處理器,整臺(tái)“神威·太湖之光”共有40960塊處理器。每個(gè)單個(gè)處理器有260個(gè)核心,主板為雙節(jié)點(diǎn)設(shè)計(jì),每個(gè)CPU固化的板載內(nèi)存為32GBDDR3-2133。
在2018年的法蘭克福世界超算大會(huì)上,美國(guó)能源部橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室(ORNL)推出的新超級(jí)計(jì)算機(jī)“Summit”以每秒12.23億億次的浮點(diǎn)運(yùn)算速度,接近每秒18.77億億次峰值速度奪冠,“神威·太湖之光”屈居第二。
3高性能計(jì)算機(jī)各大領(lǐng)域應(yīng)用實(shí)例分析
為充分發(fā)揮高性能計(jì)算機(jī)的優(yōu)勢(shì),極大限度地滿足客戶需求,自超級(jí)計(jì)算機(jī)在中國(guó)開(kāi)始發(fā)展以來(lái),相關(guān)團(tuán)隊(duì)都致力于擴(kuò)展高性能計(jì)算在各個(gè)領(lǐng)域的利用,迎合各領(lǐng)域應(yīng)用的計(jì)算要求,協(xié)助用戶配置應(yīng)用環(huán)境,建立高效模型,設(shè)計(jì)合理并行算法,以實(shí)現(xiàn)各領(lǐng)域的科學(xué)計(jì)算和大數(shù)據(jù)處理在高性能計(jì)算機(jī)上的應(yīng)用。
3.1生物計(jì)算與精準(zhǔn)醫(yī)療
根據(jù)廣州國(guó)家超級(jí)計(jì)算中心的內(nèi)部統(tǒng)計(jì)[10],生物醫(yī)學(xué)相關(guān)應(yīng)用現(xiàn)在是超級(jí)計(jì)算中心的主要客戶。生物醫(yī)學(xué)研究主要包括生物大分子的結(jié)構(gòu)模擬與功能建模,藥物設(shè)計(jì)與篩選,蛋白質(zhì)序列分析,基因序列分析與比對(duì),基因調(diào)控網(wǎng)絡(luò)的分析與建模,醫(yī)療衛(wèi)生的雙數(shù)據(jù)分析及生物醫(yī)學(xué)文獻(xiàn)挖掘等。
生物醫(yī)學(xué)數(shù)據(jù)繁多,且一直呈指數(shù)增長(zhǎng)。如世界最大的生物數(shù)據(jù)保存者之一,歐洲生物信息學(xué)研究所(EBI),存儲(chǔ)超過(guò)20PB的數(shù)據(jù),并且最近每年的數(shù)據(jù)量都增加一倍[11]。數(shù)據(jù)源的異質(zhì)性,包括基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)、微陣列數(shù)據(jù)、文獻(xiàn)等,使其更加復(fù)雜。
針對(duì)典型類型的大數(shù)據(jù)——基因組大數(shù)據(jù),在大數(shù)據(jù)框架(如Hadoop和Spark)的幫助下,云計(jì)算已經(jīng)在大數(shù)據(jù)處理中發(fā)揮著積極作用。現(xiàn)在,HPC在中國(guó)的快速發(fā)展使得以不同的方式解決基因組大數(shù)據(jù)挑戰(zhàn)成為可能。Yang等人[12]強(qiáng)調(diào)了在現(xiàn)代超級(jí)計(jì)算機(jī)上增強(qiáng)大數(shù)據(jù)支持的必要性,提出只需單個(gè)命令或單個(gè)shell腳本就能使當(dāng)前的大數(shù)據(jù)應(yīng)用在高性能計(jì)算機(jī)上運(yùn)行,并且支持多個(gè)用戶同時(shí)處理多個(gè)任務(wù)的Orion作為高性能計(jì)算機(jī)的大數(shù)據(jù)平臺(tái)。該平臺(tái)可以根據(jù)大數(shù)據(jù)處理需求,合理分配所需的資源量,并使用HPC系統(tǒng)軟件棧自動(dòng)建立和配置可回收的Hadoop/Spark集群。以華大基因提供的基因組學(xué)大數(shù)據(jù)作為案例研究,測(cè)試基因組分析流水線SOAPGaea的FASTQ過(guò)濾、讀取對(duì)齊、重復(fù)刪除和質(zhì)量控制四個(gè)過(guò)程,證明了Orion平臺(tái)的高效性。
為更好地了解基因的精細(xì)結(jié)構(gòu)、分析基因型與表現(xiàn)型的關(guān)系、繪制基因圖譜,DNA序列分析成為生物醫(yī)學(xué)中的重要課題[12]。
DNA序列的排序是對(duì)DNA序列分析的基礎(chǔ)[13]。通常先使用測(cè)序儀得到生物體基因組的一些片段,再利用計(jì)算機(jī)對(duì)片段進(jìn)行denovo拼接,從而得到DNA序列的排列順序。而隨著測(cè)序儀的發(fā)展,基因組的數(shù)據(jù)量增大,分析復(fù)雜性提高,普通計(jì)算工具分析數(shù)據(jù)會(huì)消耗大量時(shí)間和空間。張峰等人[14]基于高性能計(jì)算機(jī),使用一種新型序列拼接工具SGA(StringGraphAssernbler),對(duì)任務(wù)之間數(shù)據(jù)耦合度小的分批構(gòu)建FM-Index,采用粗粒度的多進(jìn)程并行;對(duì)任務(wù)之間數(shù)據(jù)耦合度較大的FM-Index合并過(guò)程,采用多線程的細(xì)粒度并行。這種多進(jìn)程與多線程的混合并行策略,使用并行計(jì)算代替通信開(kāi)銷,測(cè)試小規(guī)模數(shù)據(jù)時(shí),將索引構(gòu)建時(shí)間的最佳性能提高了3.06倍。葉志強(qiáng)等人[15]在基因組排序時(shí),引入隨機(jī)listranking算法,基于高性能計(jì)算機(jī),使用MPI并行實(shí)現(xiàn)Pregel框架的線性化步驟,利用節(jié)點(diǎn)之間的通信和計(jì)算能力,減少了線性化步驟時(shí)間。
SNP(單核苷酸多態(tài)性)檢測(cè)是DNA序列分析的關(guān)鍵步驟[16]。它將對(duì)齊的read、參考序列和被編排的數(shù)據(jù)庫(kù)(如數(shù)據(jù)庫(kù)SNPP)作為輸入,通過(guò)站點(diǎn)檢測(cè)對(duì)齊的read和引用站點(diǎn)的信息,生成SNP站點(diǎn)的列表。SNP檢測(cè)工具SoAPSNP可以用一個(gè)多星期的時(shí)間來(lái)分析一個(gè)覆蓋20倍的人類基因組。崔英博等人[17]通過(guò)重新設(shè)計(jì)SOAPSNP的關(guān)鍵數(shù)據(jù)結(jié)構(gòu)以降低內(nèi)存操作的開(kāi)銷,設(shè)計(jì)CPU與XeonPhi協(xié)作的協(xié)調(diào)并行框架,以獲得更高的硬件利用率。并提出了一種基于讀取的窗口劃分策略(RWD),在多個(gè)節(jié)點(diǎn)上提高吞吐量和并行規(guī)模,開(kāi)發(fā)了SOAPSNP的并行版本MSNP,在沒(méi)有任何精度損失的情況下,利用高性能計(jì)算機(jī)的一個(gè)節(jié)點(diǎn)實(shí)現(xiàn)了45倍的加速。
方翔等人[18]利用高性能計(jì)算機(jī),構(gòu)建了由基因組與轉(zhuǎn)錄組測(cè)序數(shù)據(jù)分析、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和分子動(dòng)力學(xué)模擬三個(gè)功能模塊組成的生物信息平臺(tái)分析水產(chǎn)病原,對(duì)約氏黃桿菌等多種水生動(dòng)物病原進(jìn)行生物信息學(xué)分析。
從生物醫(yī)學(xué)文獻(xiàn)中提取有價(jià)值的信息的一種主流方法是在非結(jié)構(gòu)化文本上應(yīng)用文本挖掘方法。然而,大量的文獻(xiàn)需要分析,這對(duì)文本挖掘的處理效率提出了巨大的挑戰(zhàn)。彭紹亮等人[19]將針對(duì)疾病實(shí)體識(shí)別的軟件DNorm加入可高效識(shí)別基因、蛋白質(zhì)、藥物、基因通路等實(shí)體關(guān)系的文本挖掘工具PWTEES流水線中,擴(kuò)充了PWTEES的功能。使用LINNAEUS導(dǎo)入MEDLIN數(shù)據(jù)庫(kù)提供的摘要,并在個(gè)人賬戶目錄下,動(dòng)態(tài)使用計(jì)算節(jié)點(diǎn),編譯安裝配置了非關(guān)系型數(shù)據(jù)庫(kù)(MySQL),將大量非結(jié)構(gòu)化數(shù)據(jù)(文獻(xiàn))轉(zhuǎn)為結(jié)構(gòu)化數(shù)據(jù)。將平時(shí)在普通服務(wù)器上需100天能完成的文本挖掘過(guò)程縮短為1小時(shí),并利用200個(gè)進(jìn)程并行挖掘7萬(wàn)篇頭頸癌相關(guān)文獻(xiàn)中的關(guān)鍵命名實(shí)體,得到了80%以上的并行效率。Xing等人[20]開(kāi)發(fā)了一個(gè)可運(yùn)行的框架PARABTM,它能夠在超級(jí)計(jì)算機(jī)上實(shí)現(xiàn)并行文本挖掘。以GNormPlus、tmVar2.0、Dnorm三種命名實(shí)體識(shí)別任務(wù)為例,對(duì)多個(gè)數(shù)據(jù)集上PARABTM的性能進(jìn)行了評(píng)價(jià)。結(jié)果表明,使用PARABTM并行處理策略中的短板匹配負(fù)載平衡算法(Short-Boardloadbalancingalgorithm),最大程度地提高了生物醫(yī)學(xué)命名實(shí)體識(shí)別的處理速度。
3.2全數(shù)字設(shè)計(jì)與制造
數(shù)字設(shè)計(jì)與制造是一種以計(jì)算機(jī)系統(tǒng)為中心的集成制造方法。隨著制造工廠中計(jì)算機(jī)系統(tǒng)數(shù)量和質(zhì)量的提高,數(shù)字化趨勢(shì)迅速。越來(lái)越多的自動(dòng)化工具被用于制造工廠,有必要對(duì)所有機(jī)器、工具和輸入材料進(jìn)行建模、模擬和分析,以優(yōu)化制造過(guò)程。而模擬能夠建模和測(cè)試一個(gè)系統(tǒng)行為特性,讓工程師能夠用更低耗、更快速同時(shí)更安全的方式來(lái)分析所做的設(shè)計(jì)會(huì)產(chǎn)生什么樣的影響。模擬的應(yīng)用范圍廣泛,涵蓋了產(chǎn)品設(shè)計(jì)、過(guò)程設(shè)計(jì)以及企業(yè)資源安排[21]。在模擬過(guò)程中,利用超級(jí)計(jì)算機(jī)強(qiáng)大的計(jì)算能力,使工程師能在幾分鐘或幾小時(shí)內(nèi)仿真和測(cè)試數(shù)千種設(shè)計(jì)方案。
利用數(shù)字化的方式,可以對(duì)產(chǎn)品進(jìn)行結(jié)構(gòu)力學(xué)分析、流體力學(xué)分析、電磁設(shè)計(jì)和多物理場(chǎng)模擬等多種計(jì)算仿真。
在計(jì)算流體力學(xué)CFD(CcomputationalFluidDynamics)領(lǐng)域的一大熱點(diǎn)研究問(wèn)題就是如何在當(dāng)前主流的眾核異構(gòu)高性能計(jì)算機(jī)平臺(tái)上進(jìn)行超大規(guī)模計(jì)算。楊梅芳等人[22]在高性能計(jì)算機(jī)的單個(gè)節(jié)點(diǎn)上,利用超然沖壓發(fā)動(dòng)機(jī)燃燒數(shù)值模擬軟件LESAP模擬一個(gè)實(shí)際發(fā)動(dòng)機(jī)燃燒化學(xué)反應(yīng)和超聲速流動(dòng)的問(wèn)題,采用OpenMP4.0編程標(biāo)準(zhǔn),向量化SIMD,優(yōu)化數(shù)據(jù)傳輸過(guò)程,均衡基于網(wǎng)格塊劃分的負(fù)載技術(shù),實(shí)現(xiàn)了軟件面向CPU+MIC異構(gòu)平臺(tái)的移植,達(dá)到了3.07倍的性能加速比。王勇獻(xiàn)等人[23]面向高性能計(jì)算機(jī)探索了高階精度CFD流場(chǎng)數(shù)值模擬程序的高效并行性。在高性能異構(gòu)并行計(jì)算平臺(tái)上進(jìn)行了多個(gè)算例的數(shù)值模擬的結(jié)果顯示最大CFD規(guī)模達(dá)到1228億個(gè)網(wǎng)格點(diǎn),共使用約59萬(wàn)CPU+MIC處理器核,實(shí)現(xiàn)了移植后的性能大幅度提高。通過(guò)將算法移植到超級(jí)計(jì)算機(jī)進(jìn)行大規(guī)模并行,能夠?qū)崿F(xiàn)高效的流體力學(xué)分析。而文獻(xiàn)[24-26]都是針對(duì)空氣動(dòng)力學(xué)中的具體分類利用高性能計(jì)算機(jī)進(jìn)行模擬以驗(yàn)證有效性的研究。利用數(shù)字化設(shè)計(jì),能夠快速低成本地對(duì)設(shè)計(jì)性能進(jìn)行分析評(píng)估。
在圖像模擬中,Metropolis光傳輸算法能夠利用雙向路徑跟蹤構(gòu)建出由眼睛到光源的路徑,是MonteCarlo方法的變體。然后,使用Metropolis算法靜態(tài)計(jì)算圖像中光線的恰當(dāng)?shù)纳⑸錉顟B(tài),由一條已發(fā)現(xiàn)的光到眼睛的路徑,能搜索到鄰近路徑。簡(jiǎn)單地說(shuō),Metropolis光傳輸算法能夠生成一條路徑并存儲(chǔ)其上的節(jié)點(diǎn),同時(shí)能通過(guò)添加額外節(jié)點(diǎn)來(lái)調(diào)整并生成新的路徑。隨著對(duì)照片級(jí)真實(shí)感圖像的要求越來(lái)越高,為Metropolis光傳輸算法開(kāi)發(fā)高效且高度可擴(kuò)展的光線跟蹤器變得越來(lái)越重要。主要是渲染圖像通常需要花費(fèi)大量時(shí)間,開(kāi)發(fā)高效且高度可擴(kuò)展的光線跟蹤器的困難來(lái)自不規(guī)則的存儲(chǔ)器訪問(wèn)模式、光攜帶路徑的不平衡工作量以及復(fù)雜的數(shù)學(xué)模型和復(fù)雜的物理過(guò)程。Wu等人[27]提出了一種基于物理的高度可擴(kuò)展的并行光線追蹤器,并在高性能計(jì)算機(jī)上進(jìn)行了實(shí)現(xiàn),利用多達(dá)26400個(gè)CPU內(nèi)核,證明了其可擴(kuò)展性,能夠從復(fù)雜的3D場(chǎng)景生成逼真圖像。
模擬高場(chǎng)非局部載流子傳輸同樣需要3DMonteCarlo模擬方法,通過(guò)適當(dāng)?shù)牧孔有Uw散射效應(yīng),半經(jīng)典的MC模擬能夠給出準(zhǔn)確的結(jié)果。但是,MC方法中3D模擬和量子校正都需要巨大的計(jì)算資源[28],由效率出發(fā)超級(jí)計(jì)算機(jī)的計(jì)算能力就至關(guān)重要了。文獻(xiàn)[29]中,通過(guò)在高性能計(jì)算機(jī)上使用IntelMIC協(xié)處理器,進(jìn)一步提高了之前工作中開(kāi)發(fā)的3D并行的繼承MC模擬器的并行效率。
對(duì)于高性能計(jì)算機(jī)在全數(shù)字設(shè)計(jì)和制造領(lǐng)域的集成應(yīng)用,國(guó)家超級(jí)計(jì)算廣州中心推出了天河星光云超算平臺(tái),以云服務(wù)的方式提供CAE計(jì)算和HPC訪問(wèn),大大降低了數(shù)字設(shè)計(jì)的門檻,支持產(chǎn)品設(shè)計(jì)的全工作流。目前基于該平臺(tái)支撐的項(xiàng)目有諸如國(guó)產(chǎn)大飛機(jī)、高鐵等,都是國(guó)家工業(yè)生產(chǎn)中重要項(xiàng)目[30]。
3.3地球科學(xué)與環(huán)境工程
基于該應(yīng)用領(lǐng)域,超級(jí)計(jì)算機(jī)的主要作用在于變革對(duì)自然界中諸如地理狀況、海洋、大氣等種種元素的模擬方式。以超算為平臺(tái),不僅能模擬出地球上每個(gè)時(shí)期的狀況,甚至是對(duì)宇宙中的種種同樣能進(jìn)行模擬分析,讓地球科學(xué)和環(huán)境工程的研究范圍不再限于此時(shí)此地,而是更廣闊的空間。
在宇宙學(xué)的層面,早在2015年就利用高性能計(jì)算機(jī)模擬出宇宙大爆炸后1600萬(wàn)年之后至今約137億年的暗物質(zhì)和中微子的演化過(guò)程,并將進(jìn)一步尋找宇宙邊界的報(bào)告[31]。中微子雖然是自然界中的基本粒子之一,在宇宙大爆炸約1s后與其他等離子體物質(zhì)退耦,形成看不見(jiàn)的宇宙背景,通過(guò)物理實(shí)驗(yàn)和實(shí)際的天文觀測(cè)都無(wú)法精確測(cè)量中微子的質(zhì)量。在高性能計(jì)算機(jī)平臺(tái)上,利用3萬(wàn)億粒子來(lái)對(duì)宇宙中的中微子和暗物質(zhì)的分布和演化進(jìn)行模擬,開(kāi)創(chuàng)了宇宙學(xué)中獨(dú)立測(cè)量中微子質(zhì)量的道路。
在地球外圍層面上,大氣變化同樣是一個(gè)關(guān)注點(diǎn)。Xue等人[32]提出了一種基于高性能計(jì)算機(jī)的全球性大氣動(dòng)態(tài)模擬的混合算法。通過(guò)使用更靈活的域分區(qū)方案來(lái)支持節(jié)點(diǎn)中任意數(shù)量的CPU和加速器,算法能夠充分利用超算的優(yōu)良性能。當(dāng)使用8664個(gè)節(jié)點(diǎn),包括了近170萬(wàn)個(gè)核心時(shí),可以有效地利用節(jié)點(diǎn)內(nèi)的三個(gè)MIC卡,對(duì)兩個(gè)IvyBridgeCPU(24個(gè)內(nèi)核)實(shí)現(xiàn)4.35倍的加速。基于成功的計(jì)算-通信重疊,算法分別在弱和強(qiáng)縮放測(cè)試中實(shí)現(xiàn)了93.5%和77%的并行效率。
相較于廣袤無(wú)邊的宇宙,大部分人們對(duì)于腳下的土地更加關(guān)心。自然災(zāi)害如地震、泥石流等,可能會(huì)造成巨大的生命財(cái)產(chǎn)損失,而地下油氣資源又是經(jīng)濟(jì)社會(huì)發(fā)展所必需的,利用超級(jí)計(jì)算機(jī)去探索大地也是發(fā)展所需要的。
中石油集團(tuán)開(kāi)發(fā)的用于石油油氣勘探的GeoEast系統(tǒng)已經(jīng)經(jīng)過(guò)了十幾年的發(fā)展更新,在數(shù)據(jù)模型、數(shù)據(jù)共享、一體化運(yùn)行模式、三維可視化、交互應(yīng)用框架、地震地質(zhì)建模、網(wǎng)絡(luò)運(yùn)行環(huán)境和并行處理方面取得了多項(xiàng)創(chuàng)新與重大技術(shù)突破,是地震數(shù)據(jù)處理解釋一體化系統(tǒng)。目前GeoEastV3.0版本軟件總體達(dá)到國(guó)際同類軟件先進(jìn)水平,為推動(dòng)中國(guó)石油勘探開(kāi)發(fā)領(lǐng)域不斷取得新成果發(fā)揮了重要作用[33]。但是,這樣的一體化系統(tǒng)在使用中勢(shì)必會(huì)產(chǎn)生大量的數(shù)據(jù),這就對(duì)計(jì)算機(jī)的性能有了要求。因此,在GeoEast系統(tǒng)聞名世界的過(guò)程中,高性能計(jì)算機(jī)在幕后是功臣之一,保證了系統(tǒng)的順利運(yùn)行,助力石油勘探工作[34]。而文獻(xiàn)[35]專注于地震模擬,提出了針對(duì)英特爾至強(qiáng)處理器的對(duì)于軟件SeisSol的優(yōu)化,以適用于高性能計(jì)算機(jī)的計(jì)算環(huán)境中,通過(guò)全摩擦滑動(dòng)和地震波的耦合仿真實(shí)現(xiàn)了空前復(fù)雜的地震模型。移植到高性能計(jì)算機(jī)的SeisSol提供近乎最佳的弱縮放,在8192個(gè)節(jié)點(diǎn)上達(dá)到8.6DP-PFLOPS,在所利用的整個(gè)高性能計(jì)算機(jī)上能達(dá)到18~20DP-PFLOPS,成功模擬了1992年蘭德斯地震。
3.4智慧城市云計(jì)算
城市發(fā)展經(jīng)過(guò)多年的調(diào)整,已經(jīng)在經(jīng)濟(jì)上有了相當(dāng)進(jìn)展,目前從如何讓人們生活更加便捷出發(fā),許多地區(qū)開(kāi)始建設(shè)智慧城市。智慧城市(SmartCity)是指利用各種信息技術(shù)或創(chuàng)新意念,集成城市的組成系統(tǒng)服務(wù),以提升資源運(yùn)用的效率,優(yōu)化城市管理和服務(wù),進(jìn)而能夠提高居民生活質(zhì)量。智慧城市的發(fā)展不僅僅是對(duì)生活的改變,還能促進(jìn)生產(chǎn)方式的轉(zhuǎn)變,解決在城市擴(kuò)張及經(jīng)濟(jì)高速發(fā)展中產(chǎn)生的一系列“城市病”問(wèn)題。智慧城市,代表的是城市的智慧,由智慧,能夠衍生出智能中、知識(shí)和數(shù)字等更廣泛的內(nèi)涵[36]。
迄今為止,廣州、北京、上海、寧波、無(wú)錫、深圳、武漢、佛山等國(guó)內(nèi)城市已紛紛啟動(dòng)“智慧城市”戰(zhàn)略,相關(guān)規(guī)劃、項(xiàng)目和活動(dòng)漸次推出。高性能計(jì)算機(jī)云平臺(tái)應(yīng)運(yùn)而生,為智慧城市建立堅(jiān)實(shí)、先進(jìn)的基石。智慧城市由于其性能需求,對(duì)依賴的平臺(tái)的計(jì)算能力的要求會(huì)更高,而超算的計(jì)算能力就能為智慧城市的建設(shè)提供相當(dāng)助力。在2014年,就有中國(guó)首臺(tái)千萬(wàn)億次超級(jí)計(jì)算機(jī)“天河一號(hào)”在智慧城市中應(yīng)用的報(bào)道,以其在天津?yàn)I海區(qū)的應(yīng)用為例,“天河一號(hào)”的建筑信息領(lǐng)域的大數(shù)據(jù)平臺(tái)通過(guò)對(duì)建筑信息建模,實(shí)現(xiàn)對(duì)建筑物從規(guī)劃、設(shè)計(jì)、建造到后期物業(yè)管理理的全程數(shù)字化。此外,城市規(guī)劃、氣象預(yù)測(cè)、生物醫(yī)療、裝備制造、汽車碰撞模擬等行業(yè),也能更多地通過(guò)“天河一號(hào)”,實(shí)現(xiàn)大批量數(shù)據(jù)計(jì)算、分析和存儲(chǔ)[37]。
而高性能計(jì)算機(jī)的持續(xù)計(jì)算速度進(jìn)一步達(dá)到了億億次,所能提供的服務(wù)質(zhì)量也更高,麒麟云平臺(tái)被部署在1920個(gè)節(jié)點(diǎn)(15個(gè)機(jī)柜),其中64個(gè)節(jié)點(diǎn)(兩個(gè)機(jī)框)作為云平臺(tái)控制節(jié)點(diǎn),其余節(jié)點(diǎn)為運(yùn)行虛擬機(jī)的計(jì)算節(jié)點(diǎn)和分布式存儲(chǔ)的存儲(chǔ)節(jié)點(diǎn)。為方便管理,將計(jì)算節(jié)點(diǎn)進(jìn)行分區(qū)管理,512個(gè)節(jié)點(diǎn)(4個(gè)機(jī)柜)為一區(qū),用于滿足生產(chǎn)環(huán)境、適配環(huán)境、測(cè)試環(huán)境需要。分布式存儲(chǔ)沒(méi)有分區(qū),所有節(jié)點(diǎn)形成一個(gè)全局的分布式存儲(chǔ)池,但在使用時(shí)可按需劃分指定容量的區(qū)域供不同用途使用[38]。這種云超算服務(wù)采用麒麟安全云系統(tǒng)實(shí)現(xiàn)虛擬化技術(shù),將虛擬機(jī)資源遠(yuǎn)程推送給用戶使用[39]。可通過(guò)互聯(lián)網(wǎng)遠(yuǎn)程管理虛擬機(jī)資源,使高性能計(jì)算機(jī)云平臺(tái)資源能夠被更多人使用,超算的計(jì)算能力能夠更好地推動(dòng)社會(huì)各個(gè)領(lǐng)域發(fā)展。2017年OpenStack的第15個(gè)版本中,麒麟云團(tuán)隊(duì)在核心功能解決的Bug數(shù),以及Commits的數(shù)量均進(jìn)入全球前20,麒麟云的發(fā)展是非常迅速的,與開(kāi)源社區(qū)緊密結(jié)合,貢獻(xiàn)突出[40]。
3.5材料科學(xué)與工程
在材料科學(xué)與工程的研究中,量子力學(xué)、經(jīng)典動(dòng)力學(xué)、統(tǒng)計(jì)力學(xué)是三大基礎(chǔ)且主要的研究方向。研究人員致力于材料參數(shù)的建模、多尺度平臺(tái)開(kāi)發(fā)和新材料的設(shè)計(jì)、開(kāi)發(fā)和優(yōu)化。
分子動(dòng)力學(xué)模擬在材料科學(xué)、生物化學(xué)和生物物理學(xué)等領(lǐng)域得到了廣泛的應(yīng)用。分子動(dòng)力學(xué)(MD)是研究分子和分子的物理運(yùn)動(dòng)的計(jì)算機(jī)模擬方法,它提供分子尺度上的微觀取樣?;谀芰考?xì)化的輔助建模AMBER(AssistedModelBuildingwithEnergyRefinement)[41]是用于MD模擬的使用最廣泛的軟件包之一。然而,對(duì)于具有百萬(wàn)原子級(jí)的系統(tǒng)的AMBERMD模擬的速度仍然需要改進(jìn)。彭紹亮等人[42]在單CPU上的細(xì)粒度OpenMP并行、單節(jié)點(diǎn)CPU/MIC并行優(yōu)化和多節(jié)點(diǎn)多MIC協(xié)作并行加速方面進(jìn)行了改進(jìn)。在高性能計(jì)算機(jī)上實(shí)現(xiàn)AMBER的并行加速策略,與原程序相比,實(shí)現(xiàn)了25~33倍的最高加速比。同時(shí),對(duì)于計(jì)算資源的限制,分子動(dòng)力學(xué)軟件GROMACS不能大規(guī)模地進(jìn)行滿意的操作。Wang等人[43]提出了一種利用卸載模式加速GROMACS的方法。為了提高GROMACS的效率,提出了異步化、數(shù)據(jù)重組和數(shù)組重用等一系列方法。在這種模式下,GROMACS可以與CPU和IntelXeonPHITM多個(gè)集成內(nèi)核(MIC)協(xié)處理器同時(shí)有效地配置,充分利用高性能計(jì)算機(jī)資源。
材料輻照效應(yīng)(Materialirradiationeffect)是使用核能的重要關(guān)鍵之一。然而,由于高通量輻照設(shè)施和進(jìn)化過(guò)程知識(shí)的缺乏,此效應(yīng)的利用并不好。在高性能計(jì)算的幫助下,Hu等人[44]提出了一種新的數(shù)據(jù)結(jié)構(gòu),用于大規(guī)模并行模擬金屬材料在輻照環(huán)境下的演化?;谒岢龅臄?shù)據(jù)結(jié)構(gòu),開(kāi)發(fā)了一種新的分子動(dòng)力學(xué)軟件——CrystalMD,并在高性能計(jì)算機(jī)上進(jìn)行了二兆個(gè)原子模擬,對(duì)MD輻射效應(yīng)研究的模擬規(guī)模進(jìn)行了擴(kuò)展。
3.6其他領(lǐng)域
近年來(lái),隨高性能計(jì)算的推廣,政府部門對(duì)超級(jí)計(jì)算機(jī)的重視,舊產(chǎn)業(yè)轉(zhuǎn)向新產(chǎn)業(yè)的變化及大量有高性能計(jì)算需求的企業(yè)對(duì)超級(jí)計(jì)算機(jī)的需求增大,超算人才培養(yǎng)初見(jiàn)成效[45]。在應(yīng)用軟件開(kāi)發(fā)等推動(dòng)下,高性能計(jì)算機(jī)的適用范圍逐漸向更多領(lǐng)域滲透。
源于人工神經(jīng)網(wǎng)絡(luò)的研究深度學(xué)習(xí)作為人工智能的一個(gè)新研究領(lǐng)域,在模仿人腦的機(jī)制來(lái)解釋如圖像、聲音和文本數(shù)據(jù)上有了很大進(jìn)展。例如,卷積神經(jīng)網(wǎng)絡(luò)(CNN)能準(zhǔn)確地對(duì)大型圖像進(jìn)行識(shí)別處理,然而CNN的訓(xùn)練密集程度很高,特別是對(duì)于大型具挑戰(zhàn)性的任務(wù),卷積層的參數(shù)數(shù)據(jù)量龐大。而高性能計(jì)算機(jī)的易訪問(wèn)、高峰值等性能使學(xué)術(shù)界和工業(yè)界都可以輕松訪問(wèn)相關(guān)平臺(tái),并可以在合理的時(shí)間內(nèi)訓(xùn)練中等和較大規(guī)模的CNN。使用基于輸入展開(kāi)以將其投影為矩陣乘法(Unfold+Parallel-GEMM)的算法的CAFFE、Theano、Torch7、Chainer、CNTK和TensorFlow等最先進(jìn)的CNN基礎(chǔ)設(shè)施已可以在高性能計(jì)算機(jī)上進(jìn)行部署和應(yīng)用。
增強(qiáng)現(xiàn)實(shí)技術(shù)AR(AugmentedReality),將真實(shí)世界信息模擬至虛擬世界,讓人隨時(shí)產(chǎn)生真實(shí)感受。通過(guò)高性能計(jì)算機(jī)高效地實(shí)現(xiàn)算法,可以數(shù)字虛擬孕育“互聯(lián)網(wǎng)+”新業(yè)態(tài),開(kāi)發(fā)虛擬試衣、模擬試駕等應(yīng)用項(xiàng)目。
篇3
關(guān)鍵詞 故障解決HPS IBM 高性能計(jì)算機(jī)
引言
IBM高性能計(jì)算機(jī)系統(tǒng)承擔(dān)中國(guó)氣象局主要的天氣氣候業(yè)務(wù)科研模式運(yùn)行,系統(tǒng)在2004年末安裝以來(lái),運(yùn)行一直比較平穩(wěn)。在整個(gè)系統(tǒng)中,數(shù)據(jù)交換是通過(guò)IBM HPS(High Performance Switch)網(wǎng)絡(luò)實(shí)現(xiàn)的,通過(guò)SWITCH網(wǎng)絡(luò)為用戶的并行作業(yè)提供通信。如果SWITCH網(wǎng)絡(luò)出現(xiàn)問(wèn)題,就會(huì)影響模式的運(yùn)行效率,甚至可以導(dǎo)致整個(gè)系統(tǒng)不能使用。在2006年9月21日,科研分區(qū)的SWITCH網(wǎng)絡(luò)故障,導(dǎo)致了整個(gè)科研分區(qū)的癱瘓,9月24日故障恢復(fù);此次故障對(duì)數(shù)值預(yù)報(bào)系統(tǒng)和動(dòng)力氣候模式預(yù)測(cè)系統(tǒng)的業(yè)務(wù)模式?jīng)]有影響,只是涉及了科研分區(qū)的用戶和作業(yè)。
1 故障基本情況
1.1 故障現(xiàn)象
2006年9月21日,科研分區(qū)的系統(tǒng)性能下降,用戶作業(yè)的運(yùn)算速度比較慢,檢查發(fā)現(xiàn)HPS(High Performance Switch)[1]網(wǎng)絡(luò)的通信狀態(tài)大面積出現(xiàn)異常,影響了GPFS(General Parallel File System)[2]數(shù)據(jù)文件系統(tǒng)和作業(yè)管理軟件L DLEVEL的正常運(yùn)行,導(dǎo)致用戶無(wú)法使用數(shù)據(jù)空間和正常提交用戶作業(yè),最終導(dǎo)致了用戶無(wú)法使用科研分區(qū);在SWITCH網(wǎng)絡(luò)通信正常后,GPFS文件系統(tǒng)中的有些文件不能正常訪問(wèn)。
1.2 處理過(guò)程
在故障發(fā)生后,為了確保不影響業(yè)務(wù), 對(duì)系統(tǒng)上運(yùn)行的業(yè)務(wù)模式分析并做應(yīng)急處理。系統(tǒng)承擔(dān)的業(yè)務(wù)模式包括數(shù)值預(yù)報(bào)業(yè)務(wù)模式系統(tǒng)和動(dòng)力氣候模式系統(tǒng),這些業(yè)務(wù)模式都運(yùn)行在業(yè)務(wù)分區(qū),但是動(dòng)力氣候模式系統(tǒng)的用戶空間掛接在科研分區(qū)的服務(wù)節(jié)點(diǎn)上,為了避免維護(hù)科研分區(qū)時(shí)影響業(yè)務(wù),緊急切換HACMP(High Available Cluster Multi—Processing),使文件系統(tǒng)掛接在業(yè)務(wù)分區(qū)。
在確保業(yè)務(wù)可以穩(wěn)定運(yùn)行后,由于當(dāng)時(shí)用戶已無(wú)法使用科研分區(qū),因此首先申請(qǐng)對(duì)科研分區(qū)進(jìn)行停機(jī)維護(hù),然后分析并解決故障,處理過(guò)程如下。
(1)分析HPS網(wǎng)絡(luò)通信數(shù)據(jù),發(fā)現(xiàn)F45一S11和F46一S07的兩塊主板上的芯片內(nèi)部通信不正常,決定更換這兩塊主板;但由于備件新?lián)p的原因,只有一塊主板可用,只更換了F46一S07 SWITCH的主板。
(2)在重新加電啟動(dòng)完畢后,仍有大量的HPS網(wǎng)絡(luò)不能通信,導(dǎo)致GPFS不能穩(wěn)定工作,用戶無(wú)法正常提交作業(yè)。
(3)用SWITCH管理界面檢查SWITCH狀態(tài)時(shí),顯示大量節(jié)點(diǎn)存在光纖卡故障的報(bào)錯(cuò),但光纖卡的狀態(tài)指示燈顯示正常,更換了5塊光纖卡進(jìn)行檢測(cè),沒(méi)有作用,故排除了大批量光纖卡故障的可能。
(4)收集SWITCH的SNAP數(shù)據(jù)傳給美國(guó)實(shí)驗(yàn)室,對(duì)數(shù)據(jù)進(jìn)行分析;經(jīng)過(guò)數(shù)據(jù)的多次收集傳遞,美國(guó)實(shí)驗(yàn)室SWITCH產(chǎn)品專家對(duì)底層數(shù)據(jù)進(jìn)行分析后,建議對(duì)F20、F21、F22、F24、F28、F30、F34、F36、F38、F45、F46、F47、F48、F49、F50機(jī)柜進(jìn)行電源微碼刷新,刷新為統(tǒng)一的26A6版本后,SWITCH網(wǎng)絡(luò)恢復(fù)正常。
(5)系統(tǒng)啟動(dòng)后,對(duì)科研分區(qū)進(jìn)行檢查,發(fā)現(xiàn)不能正常訪問(wèn)GPFS文件系統(tǒng),3個(gè)文件系統(tǒng)均報(bào)I/O讀的錯(cuò)誤,但可以正常寫入數(shù)據(jù);fsl可以用mmfsck命令進(jìn)行修復(fù),但fs2和fs3均各有一個(gè)NsD(Net—work Shared Disk)的狀態(tài)為“down”狀態(tài),然后手工啟動(dòng)GPFS文件系統(tǒng),整個(gè)系統(tǒng)恢復(fù)正常。
2 故障原因分析
2.1 控制信號(hào)傳輸過(guò)程
從圖1可見(jiàn),IBM 高性能計(jì)算機(jī)系統(tǒng)是通過(guò)硬件控制終端HMC(Hardware Management Console)對(duì)主機(jī)和SWITCH的硬件進(jìn)行控制,通過(guò)HMC上的SNM (SWITCH Network Manager)軟件管理HPS,在HMC上啟動(dòng)FNMD(Federation Network Manager Daemon)進(jìn)程,實(shí)現(xiàn)對(duì)HPS網(wǎng)絡(luò)的配置、初始化、監(jiān)視、控制、恢復(fù)、分析和診斷。此功能與節(jié)點(diǎn)是否安裝操作系統(tǒng)無(wú)關(guān),因?yàn)檫@些指令直接由HMC發(fā)起,控制指令都是通過(guò)電源傳輸?shù)?,只要電源正常,就?huì)響應(yīng)執(zhí)行,SWITCH的拓?fù)浣Y(jié)構(gòu)是在電源啟動(dòng)的過(guò)程中通過(guò)自檢獲得的。
每個(gè)HMC系統(tǒng)有一個(gè)RS232串口連接CSP(Common Service Processor)[2],畢業(yè)論文實(shí)現(xiàn)對(duì)主機(jī)的控制和管理,如開(kāi)機(jī)、關(guān)機(jī)、關(guān)閉系統(tǒng)、重新啟動(dòng)等;有兩個(gè)RS422串口分別連接節(jié)點(diǎn)和SWITCH機(jī)柜的兩個(gè)BPA(Bulk Power Assembly)電源,實(shí)現(xiàn)對(duì)BPA的監(jiān)視和firmware管理。所有的HPS都是通過(guò)BPA提供電源,對(duì)于每一個(gè)SWITCH,通過(guò)HMC將信號(hào)發(fā)送給BPA,再通過(guò)BPA 將控制信息通過(guò)SWITCH的DCA(Distributed Converter Assembly)電源傳送給SWITCH,來(lái)實(shí)現(xiàn)對(duì)SWITCH的管理。
2.2 SWITCH初始化實(shí)現(xiàn)的功能
在啟動(dòng)SWITCH之前,首先要確保HMC已經(jīng)正常啟動(dòng);在SWITCH 機(jī)柜加電后,由SSP(SWITCH Service Processor)控制SWITCH的加電過(guò)程,在每一個(gè)SWITCH芯片的寄存器中記錄本地以及相鄰芯片的機(jī)柜號(hào)、端口號(hào)等信息。
在節(jié)點(diǎn)機(jī)柜加電后,每個(gè)SNI芯片寄存器中保存自己的機(jī)柜號(hào)和GX-BUS信息,并將這些信息傳輸給相鄰的SNI芯片寄存器。
由HMC節(jié)點(diǎn)啟動(dòng)FNM進(jìn)程,對(duì)所有的硬件控制器初始化,配置FNM 網(wǎng)絡(luò);網(wǎng)絡(luò)配置好以后對(duì)FNM初始化,F(xiàn)NM 將與每個(gè)激活的SWITCH和SNI網(wǎng)絡(luò)部件通信;將FRAME、CHIP、PORT、ROUTE、SWITCH等信息都保存在寄存器中,節(jié)點(diǎn)轉(zhuǎn)入LPAR狀態(tài)后將信息保存在內(nèi)存中,SWITCH初始化完畢。
轉(zhuǎn)貼于 2.3 故障原因分析
在2006年6月到9月期問(wèn),科研分區(qū)共更換了7塊BPA機(jī)柜電源、8塊SWITCH DCA電源、8塊p655 DCA節(jié)點(diǎn)電源。
由于IBM高性能計(jì)算機(jī)系統(tǒng)的有些電源模塊被更換,并且有些備件號(hào)發(fā)生了變化,雖然新備件可以實(shí)現(xiàn)對(duì)原備件的替代功能,但是新舊電源備件的微碼版本部分存在不一致;而SWITCH的控制信息是通過(guò)HMC—BPA—DCA進(jìn)行傳送,電源相關(guān)部件微碼版本的不一致影響了信息的正常傳送,進(jìn)而影響SWITCH的網(wǎng)絡(luò)初始化,不能得到正確的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),導(dǎo)致不能建立正常的SwITCH通路;而通過(guò)刷新一次機(jī)柜電源BPA同版本微碼,使電源模塊上的通信進(jìn)程狀態(tài)重新初始化(歸零操作),清除了電源模塊上的錯(cuò)誤通信信息記錄,可以將控制信息正確傳送,重新建立了正確的網(wǎng)絡(luò)通路。
GPFS文件系統(tǒng)不能正常讀寫主要是由于SWITCH網(wǎng)絡(luò)通信不穩(wěn)定,GPFS的通信頻繁發(fā)生中斷,所以GPFS的文件系統(tǒng)也會(huì)頻繁異常上線或離線(mount或umount狀態(tài)),使GPFS文件系統(tǒng)控制的有些硬盤上的NSD(Network Shared Disk)控制信息不一致,GPFS為了保證數(shù)據(jù)的安全性,系統(tǒng)自動(dòng)對(duì)此NSD進(jìn)行了隔離操作。
3 故障事件的分析和啟發(fā)
從這次發(fā)生的故障情況來(lái)看,由于在系統(tǒng)本身設(shè)計(jì)和日常維護(hù)的過(guò)程中考慮了高可靠性和對(duì)于用戶數(shù)據(jù)的一致性管理,因此在科研分區(qū)出現(xiàn)問(wèn)題的情況下,并沒(méi)有影響業(yè)務(wù)作業(yè)的正常運(yùn)行,這是對(duì)系統(tǒng)高可靠性的一次檢驗(yàn);但同時(shí)通過(guò)這次故障事件,也發(fā)現(xiàn)了我們的許多不足,并且也為日常維護(hù)提供了一個(gè)經(jīng)驗(yàn)和教訓(xùn)。
3.1 系統(tǒng)可靠性驗(yàn)證
由于在系統(tǒng)設(shè)計(jì)上考慮了用戶文件系統(tǒng)高可用性的設(shè)計(jì)以及全局的用戶環(huán)境一致性,職稱論文 同時(shí)在日常維護(hù)工作中對(duì)用戶文件系統(tǒng)都做了備份,因此對(duì)業(yè)務(wù)用戶沒(méi)有造成影響。
3.2 系統(tǒng)本身的問(wèn)題
SWITCH設(shè)備故障率比較高:從系統(tǒng)投入運(yùn)行以來(lái),SWITCH設(shè)備的故障率就比較高。2006年5月1日到10月31日期問(wèn),科研分區(qū)就出現(xiàn)了39次SWITCH硬件故障,其中光纖卡故障22次,銅卡故障6次,主板故障1次、電源故障10次;業(yè)務(wù)分區(qū)有17次SWITCH硬件故障,其中光纖卡故障8次,電源故障9次。
故障診斷定位難:在對(duì)SWITCH設(shè)備維護(hù)時(shí),光纖卡和銅卡的故障診斷相對(duì)容易,故障現(xiàn)象明顯,有冗余連接,一般不影響系統(tǒng)和用戶的正常使用;而SWITCH背板故障及電源微碼不一致等故障,則不容易定位具體的故障點(diǎn),對(duì)系統(tǒng)的影響也比較大。
3.3 日常維護(hù)及管理問(wèn)題
日常維護(hù)不夠深入:在日常的維護(hù)過(guò)程中,主要還是停留在處理現(xiàn)象明顯的軟硬件故障,并沒(méi)有對(duì)系統(tǒng)的一些潛在故障進(jìn)行分析研究,而且對(duì)系統(tǒng)了解不夠深入,在出現(xiàn)大的故障時(shí)不知如何判斷處理。
管理流程不完善:從本次故障來(lái)看,備件不能滿足在重大情況下的處理要求;廠家技術(shù)支持不暢通,響應(yīng)速度慢,這都直接延長(zhǎng)了故障恢復(fù)時(shí)問(wèn)。
4 后續(xù)工作和建議
此次故障發(fā)生后,陸續(xù)完成和制定了一些工作計(jì)劃。
(1)完成了業(yè)務(wù)分區(qū)電源微碼的檢查。察看了業(yè)務(wù)分區(qū)SWITCH的微碼版本,發(fā)現(xiàn)也存在需要重新安裝的警告提示,但是由于報(bào)錯(cuò)的機(jī)柜比較少,并沒(méi)有對(duì)系統(tǒng)造成影響,目前已經(jīng)完成對(duì)業(yè)務(wù)分區(qū)電源微碼的統(tǒng)一刷新。
(2)制定了IBM 高性能計(jì)算機(jī)系統(tǒng)業(yè)務(wù)應(yīng)急備份方案。當(dāng)遇到緊急情況時(shí),能夠快速評(píng)估當(dāng)前狀況并進(jìn)行處理。
(3)完成了系統(tǒng)存儲(chǔ)資源的擴(kuò)充。擴(kuò)大了目前用戶的存儲(chǔ)資源,并滿足了業(yè)務(wù)應(yīng)用系統(tǒng)備份的資源需求。
(4)完成了HPGS系統(tǒng)的微碼升級(jí)。2007年4月已經(jīng)將整個(gè)系統(tǒng)HPS的Service Pack版本級(jí)別升級(jí)到21。
(5)加強(qiáng)管理。督促?gòu)S家人員完善技術(shù)緊急支持的響應(yīng)速度和流程,保證技術(shù)支持的暢通;同時(shí)要確保備件的充足可用。
(6)加強(qiáng)維護(hù)手段和交流。在日常維護(hù)中,工作總結(jié) 不僅是滿足于簡(jiǎn)單的問(wèn)題解決,需要深入分析診斷,找到問(wèn)題的真正原因,避免潛在的隱患故障;同時(shí)要多通過(guò)學(xué)習(xí)以及技術(shù)交流,加深對(duì)全系統(tǒng)的了解,不斷提高維護(hù)水平,提高自己的故障解決能力。
5 結(jié)束語(yǔ)
此次故障雖然沒(méi)有對(duì)我們的業(yè)務(wù)造成影響,但是通過(guò)此次故障情況,我們看到了我們還存在的許多不足,需要我們?cè)谝院蟮墓ぷ髦屑右愿倪M(jìn)。通過(guò)不斷地分析和總結(jié),維護(hù)好我們的系統(tǒng),保持系統(tǒng)高效穩(wěn)定的運(yùn)行。
參考文獻(xiàn)
篇4
盡管如此,我國(guó)在高性能計(jì)算領(lǐng)域也取得了驕人的成績(jī)。目前世界高性能計(jì)算機(jī)TOP500中,中國(guó)已經(jīng)擁有29臺(tái)高性能計(jì)算機(jī),占世界總數(shù)的5.6%,居第四位。其中,星盈超級(jí)刀片計(jì)算機(jī)因?yàn)閾碛凶灾髦R(shí)專利,設(shè)計(jì)理念獨(dú)到,實(shí)力倍為業(yè)界看好。
據(jù)了解,2004年,蜆殼星盈公司成功推出了一臺(tái)運(yùn)算速度為每秒4.046萬(wàn)億次,實(shí)際運(yùn)算效率高達(dá)84.35%的超級(jí)刀片計(jì)算機(jī),乃世界同類產(chǎn)品中運(yùn)算效率最高的。2005年,星盈GT4000型超級(jí)刀片計(jì)算機(jī)被列入了世界高性能計(jì)算機(jī)TOP500的第100位。
傳統(tǒng)缺陷制約推廣
當(dāng)今社會(huì),服務(wù)器已經(jīng)進(jìn)入了技術(shù)、應(yīng)用和市場(chǎng)互動(dòng)并迅速發(fā)展的新階段,越來(lái)越多的領(lǐng)域都需要采用高性能計(jì)算機(jī)提高自身競(jìng)爭(zhēng)力。如國(guó)防、氣象、航天、交通、電信、金融、醫(yī)療、商務(wù)和科學(xué)等。然而,隨著需求的進(jìn)一步擴(kuò)大,傳統(tǒng)的高性能計(jì)算機(jī)在某些方面的不足更顯突出,在一定程度上又制約著高性能計(jì)算機(jī)的進(jìn)一步推廣,主要表現(xiàn)在以下幾個(gè)方面:
一、機(jī)群系統(tǒng)瓶頸。在氣象服務(wù)、石油勘探、新材料、新藥物研制等領(lǐng)域?qū)τ?jì)算任務(wù)要求都非常高,它們往往需要在較短的時(shí)間內(nèi)解決一些數(shù)據(jù)規(guī)模龐大,算法結(jié)構(gòu)十分復(fù)雜的問(wèn)題。這就不僅需要對(duì)這些數(shù)據(jù)進(jìn)行高速運(yùn)算,而且還要求存儲(chǔ)系統(tǒng)有著巨大的空間來(lái)支持。而目前傳統(tǒng)機(jī)群系統(tǒng)很難達(dá)到相應(yīng)的高速運(yùn)算與海量存儲(chǔ)要求。另外,機(jī)群系統(tǒng)內(nèi)部的一些缺陷,如I/O接點(diǎn)的數(shù)量與計(jì)算節(jié)點(diǎn)的數(shù)量不匹配、I/O節(jié)點(diǎn)與存儲(chǔ)設(shè)備之間的吞吐能力、節(jié)點(diǎn)間的大量的網(wǎng)絡(luò)數(shù)據(jù)交換等,這些瓶頸都會(huì)嚴(yán)重的影響系統(tǒng)整體效率。
二、系統(tǒng)的穩(wěn)定性與安全憂。由于企業(yè)常常要對(duì)數(shù)據(jù)進(jìn)行大規(guī)模的海量運(yùn)算,任何中斷情況都會(huì)使之前的數(shù)據(jù)計(jì)算白忙一場(chǎng),從而影響整個(gè)工作效率,因此保持系統(tǒng)運(yùn)轉(zhuǎn)的持續(xù)穩(wěn)定性十分重要。而在安全性上,隨著信息技術(shù)的發(fā)展,對(duì)企業(yè)來(lái)講沒(méi)有什么比核心數(shù)據(jù)失竊更為嚴(yán)重的事情了,而傳統(tǒng)設(shè)計(jì)在數(shù)據(jù)保護(hù)方面考慮相對(duì)較弱。
三、可拓展性和現(xiàn)有資源的利用性較差。隨著應(yīng)用的深入,每一個(gè)企業(yè)的計(jì)算需求都可能逐漸增長(zhǎng),但它們往往不愿意“棄舊換新”,而是希望將新的計(jì)算節(jié)點(diǎn)循序漸進(jìn)地添加到原有的系統(tǒng)中去,逐步擴(kuò)展為一個(gè)“包含舊系統(tǒng)”的新系統(tǒng),從而更大限度地保護(hù)原有資源。傳統(tǒng)的機(jī)群系統(tǒng),不僅購(gòu)入的初始成本高昂,而且升級(jí)過(guò)程繁瑣拓展性差,再加上各個(gè)廠家的技術(shù)標(biāo)準(zhǔn)各不相同,產(chǎn)品不能兼容使用。這些問(wèn)題對(duì)企業(yè)來(lái)講都是頭痛的問(wèn)題。
四、管理與維戶的復(fù)雜性。部署多個(gè)服務(wù)器是一個(gè)耗時(shí)和資源密集的過(guò)程。管理員需要將每個(gè)服務(wù)器安裝在機(jī)架中,進(jìn)行電源和網(wǎng)絡(luò)布線,并為其安裝軟件。在高密度的環(huán)境下,布線尤其是部署中令人頭疼的難題之一。而一般的企業(yè)都缺乏專門系統(tǒng)運(yùn)營(yíng)與維護(hù)人員,一旦發(fā)生故障,將會(huì)使管理與維護(hù)工作十分麻煩。
先進(jìn)設(shè)計(jì)理念引領(lǐng)
為了克服上述缺陷,星盈超級(jí)刀片計(jì)算機(jī)采用了一系列革命性的設(shè)計(jì)理念,其理論運(yùn)算速度可超過(guò)每秒100萬(wàn)億次浮點(diǎn),資料存儲(chǔ)量可超過(guò)1000萬(wàn)億字節(jié),達(dá)到美日等先進(jìn)國(guó)家高性能電腦的水平。星盈超級(jí)刀片計(jì)算機(jī)中的每個(gè)“刀片”就是一個(gè)運(yùn)算單元,可以在不停機(jī)的情況下隨時(shí)增加或更換。如此設(shè)計(jì)可以使產(chǎn)品具有以下幾種優(yōu)勢(shì):
首先,星盈超級(jí)刀片計(jì)算機(jī)采用Infiniband等高帶寬和低延遲的開(kāi)放和標(biāo)準(zhǔn)的網(wǎng)絡(luò)互聯(lián)設(shè)備, 并且采用的存儲(chǔ)網(wǎng)格更進(jìn)一步為支持高性能計(jì)算機(jī)系統(tǒng)提供可伸縮的存儲(chǔ)和I/O能力,消除了I/O瓶頸。值得一提的是,隨著高性能刀片計(jì)算機(jī)的體系結(jié)構(gòu)向基于標(biāo)準(zhǔn)的、機(jī)架密集的服務(wù)器的轉(zhuǎn)變,數(shù)據(jù)中心將產(chǎn)生許多問(wèn)題,星盈超級(jí)刀片計(jì)算機(jī)的體系結(jié)構(gòu)將能夠緩解和解決這些問(wèn)題。使用星盈超級(jí)刀片計(jì)算機(jī),Linux操作系統(tǒng)和InfiniBand等現(xiàn)代互聯(lián)技術(shù)來(lái)建立的高性能計(jì)算機(jī)不僅能夠提供高性能,而且能夠提供高密度,改善可管理性,降低功率消耗,增強(qiáng)部署和可服務(wù)性,大大降低總擁有成本,可以幫助用戶把計(jì)算資源最大化整合,提供了最大化計(jì)算性能密度。
其次,星盈超級(jí)刀片計(jì)算機(jī)支持最新RAID-6技術(shù),確保存儲(chǔ)數(shù)據(jù)安全。RAID-6加速技術(shù)使系統(tǒng)能夠以最高性能運(yùn)行,即使剛剛從多個(gè)磁盤故障中得以恢復(fù)也不例外。這種存儲(chǔ)加速能力可為星盈超級(jí)刀片計(jì)算機(jī)提供更快的吞吐率,并可提高數(shù)據(jù)在輸入輸出硬盤時(shí)的可靠性。
再次,星盈超級(jí)刀片計(jì)算機(jī)將傳統(tǒng)的高端服務(wù)器的所有功能集中在一塊高度壓縮的電路板中,然后再插入到機(jī)箱中。在同一系統(tǒng)里,星盈計(jì)算刀片和貯存單元可隨時(shí)升級(jí)。通過(guò)獨(dú)有的中板專利技術(shù)與內(nèi)存的高性能I/O標(biāo)準(zhǔn)接口,升級(jí)只需增加刀片或貯存單元,不需要重新布線或配置,也無(wú)需更換系統(tǒng)及操作和應(yīng)用軟件,具有超長(zhǎng)的使用生命,使得總體擁有的成本(包括購(gòu)買、維護(hù)、機(jī)房、電力、人員和管理費(fèi)用)大大降低。
最后,在安裝星盈超級(jí)刀片計(jì)算機(jī)時(shí),管理員只需要對(duì)機(jī)架進(jìn)行安裝和布線,單獨(dú)的刀片服務(wù)器無(wú)需布線。由于多個(gè)刀片服務(wù)器可以共用冗余電源,因此最大限度地減少了機(jī)架布線。對(duì)于寸土寸金的數(shù)據(jù)中心來(lái)說(shuō),根據(jù)設(shè)計(jì)和供應(yīng)商的不同,星盈超級(jí)刀片計(jì)算機(jī)能夠使服務(wù)器的密度比目前1U的機(jī)架優(yōu)化的系統(tǒng)增加100%到800%,更大的節(jié)約空間。
星盈高性能刀片計(jì)算機(jī)
篇5
隨著IBM高性能計(jì)算機(jī)“走鵑”于2008年6月誕生,高性能計(jì)算機(jī)(HPC)邁入千萬(wàn)億次門檻。用戶對(duì)高性能計(jì)算需求的持續(xù)增長(zhǎng),推動(dòng)著HPC規(guī)模越做越大。在由CPU構(gòu)成的高性能計(jì)算的世界中,由于CPU計(jì)算性能的提升速度遠(yuǎn)遠(yuǎn)落后于高性能計(jì)算需求增長(zhǎng)的速度,增加CPU的個(gè)數(shù)便成為提高HPC性能的主要途徑。如今全球高性能計(jì)算500強(qiáng)(Top500)中已經(jīng)出現(xiàn)內(nèi)核累計(jì)總數(shù)多達(dá)20多萬(wàn)個(gè)的HPC。
但是,在提升性能的同時(shí),CPU個(gè)數(shù)的增加也給HPC增添了復(fù)雜性,并帶來(lái)可用性降低、系統(tǒng)功耗驚人、成本高居不下等問(wèn)題,讓HPC廠商日益感到頭痛。于是,高性能計(jì)算廠商開(kāi)始探索新的提升HPC性能的途徑。IBM的“走鵑”就是采用CPU和Cell處理器的混合架構(gòu),AMD和Intel也都分別對(duì)外了各自的CPU+GPU(圖形處理器)的混合架構(gòu)。
作為GPU領(lǐng)域龍頭老大的NVIDIA自然不會(huì)放棄在高性能計(jì)算這一CPU的傳統(tǒng)領(lǐng)地炫耀性能的機(jī)會(huì)。它先是推出了CUDA架構(gòu),使得程序員可以用C語(yǔ)言對(duì)CPU和基于CUDA架構(gòu)的GPU進(jìn)行統(tǒng)一編程,從而解決了因編程復(fù)雜而被程序員敬而遠(yuǎn)之所造成的GPU應(yīng)用難以普及的問(wèn)題。進(jìn)而,它又推出了面向高性能計(jì)算的Tesla系列GPU。2008年11月21日,NVIDIA在美國(guó)德克薩斯州奧斯汀市舉辦的2008超級(jí)計(jì)算大會(huì)上聯(lián)手HPC的巨頭Crayon推出個(gè)人HPC。與此同時(shí),會(huì)上公布的Top500中,采用Tesla技術(shù)的HPC首戰(zhàn)便占據(jù)了第29名的位置,標(biāo)志著NVIDIA從個(gè)人HPC和高端HPC全面切入高性能計(jì)算領(lǐng)域。
為此,本報(bào)記者獨(dú)家專訪了NVIDIA高性能計(jì)算事業(yè)部總經(jīng)理Andy Keane。
HPC中的GPU
記者:GPU在高性能計(jì)算中的性能已經(jīng)到達(dá)了何種地步?
Keane:CPU的運(yùn)算速度在很大程度上還取決于緩存的大小,而GPU則是在任務(wù)并行化后用大量的線程來(lái)進(jìn)行運(yùn)算。雖然CPU已經(jīng)多核心化,可以多達(dá)8個(gè)內(nèi)核,但在并行計(jì)算時(shí),顯然不是GPU上千個(gè)線程的對(duì)手。
比利時(shí)有所大學(xué),以前用的是512個(gè)CPU組建的HPC,當(dāng)他們了解到GPU的運(yùn)行功能很強(qiáng)后,試著自己搭建了一臺(tái)配置有8個(gè)GPU的臺(tái)式機(jī),結(jié)果性能竟與以前512個(gè)CPU的HPC不相上下。
記者:既然GPU的性能遠(yuǎn)遠(yuǎn)超過(guò)CPU,那么NVIDIA何時(shí)開(kāi)始關(guān)注GPU的計(jì)算能力?
Keane:15年前,我們就開(kāi)始針對(duì)3D游戲開(kāi)發(fā)GPU了。但GPU的編程很復(fù)雜,因而應(yīng)用主要是集中在圖形顯示領(lǐng)域。之后,我們開(kāi)發(fā)了CUDA架構(gòu),你可以把CUDA想象成與x86相似的硬件架構(gòu),它允許應(yīng)用開(kāi)發(fā)者用他們熟悉的語(yǔ)言對(duì)GPU進(jìn)行快速編程,從而為GPU拓寬了應(yīng)用范圍?,F(xiàn)在,NVIDIA所有的GPU都支持CUDA架構(gòu)。
記者:懂得計(jì)算機(jī)的人都知道,并行編程要比串行編程復(fù)雜得多。程序員如何在CUDA平臺(tái)上對(duì)CPU和GPU統(tǒng)一編程?
Keane:盡管CPU與GPU之間在架構(gòu)上存有很大的區(qū)別,但我們覺(jué)得CPU與GPU的結(jié)合才是最好的計(jì)算架構(gòu)。于是我們?cè)贑UDA上推出了C語(yǔ)言編譯器,程序員在開(kāi)發(fā)應(yīng)用程序時(shí),只要對(duì)序列執(zhí)行的程序代碼和并行執(zhí)行的程序代碼簡(jiǎn)單地進(jìn)行標(biāo)注,C編譯器就可以向PC解釋哪部分該由CPU做,哪部分該由GPU做。
記者:CUDA的編程看來(lái)不難,那么搭建一個(gè)個(gè)人HPC難不難?
Keane:用Tesla組建個(gè)人HPC是件很容易的事。你只要把買到的Tesla卡插到PC主板上的PCI插槽,你的PC就變成了1臺(tái)個(gè)人HPC。
記者:Tesla貴嗎?
Keane:4個(gè)GPU的價(jià)格在9500美元~1萬(wàn)美元之間,3個(gè)GPU的Tesla價(jià)格為7000多美元。但與同等價(jià)位的工作站相比,我們的性能應(yīng)該有百倍的提升。
競(jìng)爭(zhēng)對(duì)手
記者:我們看到現(xiàn)在全球性能最高的HPC“走鵑”所采用的CELL處理器實(shí)際上就是一個(gè)集成了8個(gè)流處理器和一個(gè)CPU內(nèi)核的處理器,而GPU也是由數(shù)百個(gè)流處理器構(gòu)成的。你是如何看待CELL的?
Keane:CELL的編程要比CUDA復(fù)雜得多。CUDA本身就是一個(gè)GPU架構(gòu),我們所有GeForce、Quadro和Tesla產(chǎn)品線都可以很完美地對(duì)其提供支持。它的編程模式是很簡(jiǎn)單的,語(yǔ)言與C語(yǔ)言非常接近,編譯器與C語(yǔ)言也基本一致。唯一的改變是將之前的串行計(jì)算更新為并行計(jì)算。在過(guò)去的一年中,CUDA積累了大量的應(yīng)用程序,而且在美國(guó),也有很多活躍的論壇討論CUDA的編程問(wèn)題。我們也在CUDA中文網(wǎng)站上開(kāi)設(shè)了CUDA中國(guó)專區(qū),上面有144個(gè)使用的案例。對(duì)于程序員而言,這些編碼都是開(kāi)放的。
記者:在基于Tesla搭建的HPC中,GPU與CPU從指令集上看是異構(gòu)的。而英特爾最新展示的具有80個(gè)內(nèi)核的Larrabee卻采用的是x86指令集,從而實(shí)現(xiàn)了CPU和GPU在指令集上的兼容,對(duì)于程序員來(lái)說(shuō),這是否會(huì)比Tesla編程更為容易呢?
Keane:我并不這樣認(rèn)為。在NVIDIA的CUDA平臺(tái)上,不管面對(duì)何種架構(gòu),編程人員都可以用很普及的C語(yǔ)言去對(duì)CPU和GPU進(jìn)行統(tǒng)一編程。對(duì)于程序員來(lái)說(shuō),Tesla的編程是很簡(jiǎn)單的。而Larrabee無(wú)法用C語(yǔ)言來(lái)編程,程序員要學(xué)習(xí)這種新架構(gòu)和它的語(yǔ)言并用兩種語(yǔ)言分別對(duì)CPU和GPU進(jìn)行編程。
記者:AMD選擇GPGPU(通用GPU)來(lái)切入高性能計(jì)算領(lǐng)域,對(duì)此你有何見(jiàn)解?
Keane:關(guān)鍵要看它的普及率了。這里有兩個(gè)數(shù)據(jù):英特爾x86處理器市場(chǎng)占有85%的份額,AMD只占15%;同時(shí),AMD的FireStream只有5%的使用率。你為客戶定制產(chǎn)品的確會(huì)又好又快,但如果產(chǎn)量不高,成本無(wú)法有效攤薄,價(jià)格就會(huì)非常高。 而我們主要針對(duì)主流市場(chǎng),用更加標(biāo)準(zhǔn)的界面來(lái)制作,讓用戶很容易使用,而且有能力承受。我們能夠讓很多研究人員將原本要跑到數(shù)據(jù)中心去做的計(jì)算轉(zhuǎn)移到插有Tesla卡的工作站上,并很容易地獲得高性能計(jì)算的體驗(yàn)。
應(yīng)用領(lǐng)域
記者:TOP 500中,x86架構(gòu)CPU已經(jīng)占據(jù)了90%的地盤。請(qǐng)問(wèn)Tesla進(jìn)入高性能計(jì)算市場(chǎng)的機(jī)會(huì)有多大?
Keane:幾乎是100%。我們強(qiáng)調(diào)的是異構(gòu)計(jì)算,GPU不可能完全取代CPU,只是能顯著地減少CPU的數(shù)量。如果我們從另外一個(gè)角度上看這個(gè)問(wèn)題,其實(shí)全都采用一樣的架構(gòu)未必是件好事。如同在GPU領(lǐng)域,因?yàn)橛形覀僄PU、Intel的Larrabee和AMD的ATI的存在,因此大家可以互相激勵(lì),充分開(kāi)展競(jìng)爭(zhēng),刺激創(chuàng)新。但是服務(wù)器領(lǐng)域的架構(gòu)幾乎統(tǒng)一,這對(duì)創(chuàng)新是不利的。
記者:那么在工作站方面呢?
Keane:工作站的限制主要在于工作站機(jī)箱內(nèi)部空間的限制,例如工作站的電源只能提供1000W的功率,那么,我們可以在這1000W之內(nèi)給你提供盡可能高的計(jì)算性能,比如說(shuō)1T的性能。
記者:無(wú)疑,Tesla個(gè)人高性能計(jì)算機(jī)的性能遠(yuǎn)好于現(xiàn)在的工作站,但目前工作站上的很多應(yīng)用軟件都是基于UNIX系統(tǒng),廠商們?cè)敢獍阉鼈円浦驳絋esla平臺(tái)上嗎?
Keane:這些開(kāi)發(fā)商面臨著決定應(yīng)用何種并行運(yùn)算解決方案的選擇。其中之一為多核CPU解決方案,即將計(jì)算工作分配到雙核、四核甚至八核上。這樣,對(duì)于開(kāi)發(fā)人員來(lái)說(shuō),如果他們要想通過(guò)并行計(jì)算來(lái)得到性能的提升,就必須將應(yīng)用分解為4塊甚至8塊。這其中最大的挑戰(zhàn)是如何將計(jì)算工作劃分為完全均衡的4塊或者8塊。另外一種解決方案類似Intel的Larrabee,開(kāi)放人員可以用比多核解決方案更為簡(jiǎn)單的方式解決并行計(jì)算的問(wèn)題。但是針對(duì)并行運(yùn)算,GPU架構(gòu)可以非常簡(jiǎn)單地實(shí)現(xiàn)非常大規(guī)模的并行計(jì)算。如果你要按照時(shí)間和效率來(lái)衡量這幾種選擇方案,GPU無(wú)疑是效率最高的。
記者:未來(lái)工作站會(huì)不會(huì)被Tesla個(gè)人超級(jí)計(jì)算機(jī)替代?
Keane:對(duì)于任何使用集群的用戶,都有應(yīng)用Tesla GPU的需要。我將努力說(shuō)服他們中的所有人。利用工作站進(jìn)行高性能計(jì)算的用戶也是我們的目標(biāo)人群,我們也希望讓他們認(rèn)識(shí)到我們的好處。事實(shí)上,如果用戶很看重預(yù)算和效率,對(duì)成本和時(shí)間很敏感,那么Tesla對(duì)他們來(lái)說(shuō)就很有價(jià)值。
未來(lái)發(fā)展
記者:在CPU領(lǐng)域,虛擬化是一個(gè)很時(shí)尚的話題,Tesla也能虛擬化嗎?
Keane:如果CPU可以做到虛擬化,那么GPU也可以做到虛擬化。因?yàn)樗麄兌际腔谔幚砥骷軜?gòu)的。就好像將GPU作為CPU的一個(gè)資源,只要CPU可以實(shí)現(xiàn)虛擬化,那么GPU也可以作為CPU的資源實(shí)現(xiàn)虛擬化。
記者:Tesla現(xiàn)在使用C語(yǔ)言編程。我們知道C語(yǔ)言與硬件很容易結(jié)合,也易于控制。聽(tīng)說(shuō)NV還要在Tesla上使用Fortran,這樣會(huì)不會(huì)影響到效率?未來(lái)還會(huì)有其他語(yǔ)言嗎?
Keane:Fortran是非常結(jié)構(gòu)化的語(yǔ)言,并行計(jì)算的性能非常好,在GPU上的執(zhí)行效率甚至更高。同時(shí),在未來(lái)我們還將增加C++等語(yǔ)言。
記者:既然在Tesla計(jì)算機(jī)中,Tesla GPU要與CPU協(xié)同工作,那么,未來(lái)GPU和CPU會(huì)不會(huì)集成在一個(gè)芯片上?
Keane:我們不認(rèn)為GPU和CPU將會(huì)融合。因?yàn)槟壳癎PU的設(shè)計(jì)比CPU還要復(fù)雜,GPU擁有更多的核心,更高的內(nèi)存容量,芯片的面積也很大。我們的客戶也對(duì)計(jì)算性能和內(nèi)存提出更高的要求。我們所能做的是提升制造工藝,從而降低芯片的面積。
我們當(dāng)然可以把一個(gè)小型CPU集成進(jìn)來(lái),但這樣對(duì)GPU計(jì)算性能的提升并沒(méi)有益處。就高性能計(jì)算而言,高速異構(gòu)計(jì)算架構(gòu)是一個(gè)CPU搭配多個(gè)GPU,然后更多的CPU搭配更多的GPU,這樣,GPU就可以發(fā)揮加速器的作用。
篇6
有人問(wèn),浪潮對(duì)高性能計(jì)算機(jī)有什么看法?也許發(fā)問(wèn)的人應(yīng)該首先弄清楚高性能計(jì)算機(jī)是什么。高端計(jì)算機(jī)=高性能計(jì)算=HPC=linpack?高端應(yīng)用=高性能計(jì)算 =高性能科學(xué)計(jì)算=科研計(jì)算?事實(shí)上,我們應(yīng)該把高端應(yīng)用理解為高性能計(jì)算機(jī),把高性能計(jì)算機(jī)理解為高性能科學(xué)計(jì)算,這與國(guó)外的理解是不太一樣的。
像IBM和HP,在這一領(lǐng)域稱得上壟斷者,他們花了很少的精力來(lái)講高性能計(jì)算,花了更多的精力來(lái)講高端服務(wù)器,他們?yōu)槭裁催@么做?其實(shí),在總結(jié)了這些廠商在國(guó)內(nèi)外的盈利情況之后,我們發(fā)現(xiàn),高性能計(jì)算產(chǎn)品并沒(méi)有為IBM這樣的廠商帶來(lái)很大的利潤(rùn),反而是商業(yè)應(yīng)用為他們帶來(lái)了更多的收入。但目前我國(guó)做高性能計(jì)算研究的企業(yè)主要面向科研和高效市場(chǎng),而要讓這些用戶拿出很多的錢來(lái)買一個(gè)產(chǎn)品是不現(xiàn)實(shí)的。這又是一個(gè)我國(guó)與國(guó)外的差異所在。
另外的差異就體現(xiàn)在研究方面。在國(guó)內(nèi),無(wú)論是企業(yè)界還是學(xué)術(shù)界,大家在講到體系結(jié)構(gòu)的時(shí)候會(huì)比較注重于集群,在其他重要體系結(jié)構(gòu)的研究上投入較少,也就是說(shuō),國(guó)內(nèi)的高性能計(jì)算體系結(jié)構(gòu)以集群為主,對(duì)SMP/NUMA等體系結(jié)構(gòu)的研究較少,過(guò)于依賴國(guó)外底層技術(shù),對(duì)處理器、芯片組、交換互連的研究投入不足;重單一指標(biāo),不重綜合指標(biāo),重系統(tǒng)浮點(diǎn)計(jì)算性能指標(biāo),對(duì)綜合應(yīng)用能力的重視不夠;重視數(shù)值計(jì)算類應(yīng)用,強(qiáng)調(diào)高端系統(tǒng)數(shù)值計(jì)算能力,不重視OLTP指標(biāo)、SPECWEB等面向商業(yè)應(yīng)用的指標(biāo)。即使在高性能計(jì)算領(lǐng)域也有這樣的問(wèn)題,如比較注重計(jì)算能力的提升,而對(duì)應(yīng)用建模的研究和算法這些方面的研究就比較弱一些。所以在這種情況下,我們應(yīng)該在戰(zhàn)略的角度上更加關(guān)注高端商業(yè)產(chǎn)業(yè)的發(fā)展,提供一些基礎(chǔ)技術(shù)。
從目前來(lái)看,無(wú)論是國(guó)內(nèi)還是國(guó)外的企業(yè)都很注重虛擬技術(shù),對(duì)于如何把高端的服務(wù)器產(chǎn)品折合成小的服務(wù)器產(chǎn)品滿足不同的應(yīng)用,或者如何把小的產(chǎn)品整合成大的產(chǎn)品,來(lái)滿足大的需求,也有不同的看法。未來(lái)的一個(gè)發(fā)展方向是,我們做出的中高端服務(wù)器產(chǎn)品要是一流的產(chǎn)品,而且能逐漸應(yīng)用在越來(lái)越多的領(lǐng)域中。
篇7
第一,基于多核CPU技術(shù)的刀片服務(wù)器已經(jīng)成為高性能計(jì)算的發(fā)展趨勢(shì)。值得關(guān)注的是,排名全球第一的高性能計(jì)算機(jī)“走鵑”,采用的就是混合架構(gòu),并且涵蓋了CELL芯片。
第二,GPU技術(shù)會(huì)給地球物理、高密度運(yùn)算、可視化處理帶來(lái)新機(jī)會(huì)。GPU技術(shù)被證明是一項(xiàng)加快計(jì)算、可視化、圖像分析、模式識(shí)別、計(jì)算機(jī)視覺(jué)完美結(jié)合的技術(shù)。東方地球物理公司研究院(以下簡(jiǎn)稱東方地球)也在做應(yīng)用GPU技術(shù)的相關(guān)實(shí)驗(yàn),并且應(yīng)用了768個(gè)節(jié)點(diǎn)。整個(gè)中石油一共用了7套系統(tǒng)做實(shí)驗(yàn),應(yīng)用環(huán)境就是油田,并且目前已經(jīng)取得了一些進(jìn)展。國(guó)外的一些同行公司也在應(yīng)用了GPU的混合架構(gòu)上成功地開(kāi)發(fā)了自己的應(yīng)用軟件。隨著地震軟件商對(duì)GPU技術(shù)的支持,可視化處理解釋系統(tǒng)、疊前遷移數(shù)字建模的效率很可能會(huì)大幅度提升。目前這項(xiàng)技術(shù)存在的最大問(wèn)題是很少有支持這個(gè)平臺(tái)的應(yīng)用軟件。
第三,高密度、多路服務(wù)器技術(shù)將會(huì)成為地震處理和綜合解釋研究的新平臺(tái)。我們與專家交流后認(rèn)為,四路服務(wù)器可能是比較合適的選擇,不僅胖節(jié)點(diǎn)可以采用多路服務(wù)器,包括東方地球現(xiàn)在進(jìn)行的信息化建設(shè)也是采用多路服務(wù)器來(lái)作為一個(gè)大平臺(tái),分區(qū)給不同應(yīng)用使用。
第四,萬(wàn)兆以太網(wǎng)將給高性能計(jì)算的發(fā)展帶來(lái)新生機(jī)。盡管目前由于成本太高,萬(wàn)兆以太網(wǎng)和Infiniband的應(yīng)用市場(chǎng)不及千兆以太網(wǎng),但它們還是相當(dāng)有競(jìng)爭(zhēng)力的。1995年新興的網(wǎng)絡(luò)技術(shù)只能提供10兆以太網(wǎng),到1998年,已經(jīng)發(fā)展成為千兆以太網(wǎng),1999年更推出了萬(wàn)兆以太網(wǎng)。如今,超萬(wàn)兆以太網(wǎng)已經(jīng)脫離了實(shí)驗(yàn)階段。有專家預(yù)測(cè),到2011年~2018年的時(shí)候,網(wǎng)絡(luò)技術(shù)才會(huì)出現(xiàn)比較大的改進(jìn),萬(wàn)兆以太網(wǎng)也會(huì)因?yàn)槌杀镜慕档投鸩教娲壳暗那д滓蕴W(wǎng)。
篇8
關(guān)鍵詞:高性能計(jì)算;應(yīng)用;中醫(yī)藥
中圖分類號(hào):R-3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-5707(2016)06-0010-03
Abstract: High performance computing (HPC), as a new and important research tool, has been applied in many fields successfully. Application of HPC in the TCM field is still in the exploratory stage. HPC in the future may be innovatively applied in the field of genomics Chinese herbal medicine, virtual medicine screening of new TCM, TCM data mining and big data analytics, modeling and simulation and so on.
Key words: high performance computing (HPC); application; TCM
高性能計(jì)算是計(jì)算機(jī)科學(xué)的一個(gè)分支,研究并行算法和開(kāi)發(fā)相關(guān)軟件,致力于開(kāi)發(fā)高性能計(jì)算機(jī)。高性能計(jì)算是世界各國(guó)競(jìng)相發(fā)展的前沿技術(shù),是體現(xiàn)一個(gè)國(guó)家綜合實(shí)力和科技競(jìng)爭(zhēng)力的重要指標(biāo)。
科學(xué)計(jì)算作為科研方法變革的產(chǎn)物,已經(jīng)發(fā)展成為與傳統(tǒng)的理論、實(shí)驗(yàn)并駕齊驅(qū)的第三種科研方法,并且日益成為越來(lái)越重要的科研方法。科學(xué)計(jì)算方法的運(yùn)用,是高性能計(jì)算應(yīng)用的基礎(chǔ)和前提條件,而使高性能計(jì)算真正發(fā)揮作用主要取決于高性能計(jì)算的應(yīng)用研究水平[1]。本文對(duì)于促進(jìn)高性能計(jì)算未來(lái)在中醫(yī)藥領(lǐng)域的應(yīng)用、豐富中醫(yī)藥信息學(xué)的研究?jī)?nèi)容及由此產(chǎn)生的中醫(yī)藥科研方法的創(chuàng)新具有推動(dòng)作用。
1 高性能計(jì)算應(yīng)用概況
1.1 我國(guó)在高性能計(jì)算應(yīng)用領(lǐng)域仍處于落后水平
在高性能計(jì)算的研發(fā)和應(yīng)用領(lǐng)域美國(guó)一直處于世界領(lǐng)先水平,日本和歐洲國(guó)家緊隨其后長(zhǎng)期位居世界先進(jìn)行列。近年來(lái),我國(guó)在高性能計(jì)算硬件的研發(fā)方面取得了突破性進(jìn)展,通過(guò)自主創(chuàng)新逐步掌握了一批硬件研發(fā)的關(guān)鍵技術(shù)。中國(guó)國(guó)防科技大學(xué)研制的天河系列超級(jí)計(jì)算機(jī)連續(xù)多次在世界超級(jí)計(jì)算機(jī)排行榜中名列首位,標(biāo)志著我國(guó)高性能計(jì)算的硬件研究水平目前已經(jīng)接近國(guó)際先進(jìn)水平。但在應(yīng)用軟件方面的發(fā)展嚴(yán)重滯后于硬件的發(fā)展水平,自主開(kāi)發(fā)的高性能計(jì)算應(yīng)用軟件嚴(yán)重匱乏,需要大量購(gòu)買和引進(jìn)國(guó)外開(kāi)發(fā)的應(yīng)用軟件,重要和關(guān)鍵部門的應(yīng)用受制于人[2]。應(yīng)用軟件是高性能計(jì)算應(yīng)用的基礎(chǔ),由于應(yīng)用軟件研發(fā)水平的嚴(yán)重落后,目前我國(guó)在高性能計(jì)算應(yīng)用領(lǐng)域仍處于落后水平。
1.2 國(guó)內(nèi)外高性能計(jì)算主要的應(yīng)用領(lǐng)域
高性能計(jì)算作為嶄新和重要的科研工具,目前已經(jīng)在眾多的領(lǐng)域得到了成功應(yīng)用,各種前沿科學(xué)研究、技術(shù)開(kāi)發(fā)和工程設(shè)計(jì)都越來(lái)越多地使用了高性能計(jì)算,高性能計(jì)算已經(jīng)日益成為科技創(chuàng)新的重要力量。目前主要的應(yīng)用領(lǐng)域包括氣象數(shù)值模擬與預(yù)報(bào)、地震預(yù)報(bào)、納米技術(shù)、生物醫(yī)學(xué)、環(huán)境科學(xué)、空間科學(xué)、材料科學(xué)、計(jì)算物理、計(jì)算化學(xué)、流體力學(xué)、地震三維成像、石油勘探、天體星系模擬、大氣與海洋模擬、固體地球模擬、工業(yè)設(shè)計(jì)、核武器研究、全球氣候模型、湍流分析、飛行動(dòng)力學(xué)、海洋環(huán)流、流體力學(xué)和超導(dǎo)模型等[1]。在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用目前主要集中在人類基因組學(xué)、蛋白質(zhì)組學(xué)、藥物設(shè)計(jì)、分子動(dòng)力學(xué)模擬等方面。
1.3 高性能計(jì)算應(yīng)用的瓶頸
高性能計(jì)算雖然已經(jīng)在眾多領(lǐng)域得到了成功應(yīng)用,但由于技術(shù)難度等的限制,仍然屬于高投入高產(chǎn)出的非普及型應(yīng)用。目前制約高性能計(jì)算應(yīng)用的主要問(wèn)題包括軟件開(kāi)發(fā)的技術(shù)難度非常大,系統(tǒng)使用成本過(guò)高,不僅體現(xiàn)在軟硬件購(gòu)置費(fèi)用昂貴,而且系統(tǒng)運(yùn)行維護(hù)成本過(guò)高,大型系統(tǒng)的年電費(fèi)需上千萬(wàn)元[2]。比較高精尖的應(yīng)用范圍、非常高的技術(shù)要求和過(guò)高的使用成本,這些都限制了高性能計(jì)算的廣泛應(yīng)用。
2 高性能計(jì)算在中醫(yī)藥領(lǐng)域應(yīng)用的可行性分析
2.1 高性能計(jì)算在領(lǐng)域應(yīng)用的前提條件
高性能計(jì)算在領(lǐng)域應(yīng)用的條件首先需要應(yīng)用領(lǐng)域具有較高的科研水平,特別是能夠通過(guò)科學(xué)計(jì)算的方法建立相應(yīng)的數(shù)學(xué)物理模型和應(yīng)用軟件來(lái)解決實(shí)際問(wèn)題,利用高性能計(jì)算才有可能促成應(yīng)用領(lǐng)域研究水平的大幅度提高。通過(guò)對(duì)高性能計(jì)算應(yīng)用領(lǐng)域的最高學(xué)術(shù)獎(jiǎng)戈登獎(jiǎng)獲獎(jiǎng)項(xiàng)目的分析,這些獲獎(jiǎng)的應(yīng)用項(xiàng)目絕大多數(shù)都具有多學(xué)科交叉融合的背景,這反映了高性能計(jì)算的應(yīng)用需要應(yīng)用領(lǐng)域與計(jì)算機(jī)科學(xué)、數(shù)學(xué)等學(xué)科的跨學(xué)科合作[3]。隨著高性能計(jì)算的應(yīng)用,近些年高性能計(jì)算與應(yīng)用學(xué)科的交叉學(xué)科不斷涌現(xiàn),產(chǎn)生了計(jì)算化學(xué)、計(jì)算物理學(xué)、計(jì)算生物學(xué)等許多新興學(xué)科,這些交叉學(xué)科的產(chǎn)生標(biāo)志著高性能計(jì)算在這些領(lǐng)域得到了高水平應(yīng)用。
2.2 計(jì)算生物學(xué)的啟示
計(jì)算生物學(xué)是一門以生命科學(xué)中的現(xiàn)象和規(guī)律作為研究對(duì)象,以解決生物學(xué)問(wèn)題為最終目標(biāo),通過(guò)模擬和仿真的方法對(duì)生物學(xué)問(wèn)題進(jìn)行定量和定性研究的新興學(xué)科。計(jì)算生物學(xué)與生物信息學(xué)比較,最大的不同之處在于生物信息學(xué)側(cè)重于生物信息的采集、存儲(chǔ)、處理和分析,而計(jì)算生物學(xué)側(cè)重于對(duì)生命現(xiàn)象進(jìn)行研究、解決生物學(xué)問(wèn)題[4]。目前計(jì)算生物學(xué)領(lǐng)域的研究主要集中在蛋白質(zhì)行為的模擬、藥物分子的篩選、基因測(cè)序等方面。
雖然目前中醫(yī)藥領(lǐng)域還不滿足高性能計(jì)算的應(yīng)用條件,但通過(guò)借鑒計(jì)算生物學(xué)的研究方法,未來(lái)有可能在中醫(yī)藥領(lǐng)域開(kāi)展具有創(chuàng)新性的高性能計(jì)算的應(yīng)用研究。
3 高性能計(jì)算在中醫(yī)藥領(lǐng)域應(yīng)用的展望
3.1 中藥植物藥的基因組學(xué)
基因組學(xué)是遺傳學(xué)的一個(gè)分支,研究生物基因組和如何利用基因,涉及基因作圖、測(cè)序和整個(gè)基因組功能分析,研究?jī)?nèi)容包括以全基因組測(cè)序?yàn)槟繕?biāo)的結(jié)構(gòu)基因組學(xué)和以基因功能鑒定為目標(biāo)的功能基因組學(xué)?;蚪M學(xué)是高性能計(jì)算應(yīng)用的一個(gè)重要方向,沒(méi)有高性能計(jì)算人類的基因組計(jì)劃就不可能實(shí)現(xiàn),高性能計(jì)算已經(jīng)成為基因組學(xué)研究不可或缺的科研工具。隨著基因組學(xué)研究的深入、技術(shù)的成熟和成本的大幅度下降,使得基因組學(xué)的研究逐漸由人類的基因組學(xué)擴(kuò)展到動(dòng)物、植物等多個(gè)相近領(lǐng)域。利用高性能計(jì)算在基因組學(xué)方面成熟的應(yīng)用軟件開(kāi)展中藥植物藥的基因組學(xué)研究未來(lái)有可能是高性能計(jì)算在中醫(yī)藥領(lǐng)域的重要應(yīng)用。
3.2 中藥新藥的虛擬藥物篩選
利用高性能計(jì)算進(jìn)行虛擬藥物篩選目前已經(jīng)成為西藥新藥開(kāi)發(fā)的一條嶄新和重要的途徑。新藥研發(fā)的核心工作之一是從大量的化合物樣品庫(kù)中發(fā)現(xiàn)有藥理活性的化合物,計(jì)算機(jī)虛擬篩選輔助新藥開(kāi)發(fā)是利用統(tǒng)計(jì)學(xué)和分子模型化技術(shù)來(lái)指導(dǎo)新的先導(dǎo)結(jié)構(gòu)的發(fā)現(xiàn)或設(shè)計(jì),從而減少實(shí)驗(yàn)室的工作量,縮短開(kāi)發(fā)周期、降低開(kāi)發(fā)成本。近年來(lái)對(duì)多靶點(diǎn)藥物的研究已經(jīng)成為國(guó)際上新藥開(kāi)發(fā)的一個(gè)重要的研究熱點(diǎn),中藥是天然的多靶點(diǎn)藥物,蘊(yùn)含著巨大的新藥創(chuàng)制的潛力[5-6]。應(yīng)用高性能計(jì)算開(kāi)展中藥新藥的虛擬藥物篩選有可能成為中藥新藥開(kāi)發(fā)的嶄新途徑。
3.3 中醫(yī)藥數(shù)據(jù)挖掘和大數(shù)據(jù)分析
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。大數(shù)據(jù)分析是指對(duì)規(guī)模巨大的數(shù)據(jù)進(jìn)行分析,目前世界各國(guó)對(duì)大數(shù)據(jù)分析技術(shù)高度重視,大數(shù)據(jù)被視為國(guó)家重要的戰(zhàn)略資源。數(shù)據(jù)挖掘和大數(shù)據(jù)分析是高性能計(jì)算應(yīng)用的重要領(lǐng)域之一。目前中醫(yī)藥領(lǐng)域的數(shù)據(jù)挖掘和大數(shù)據(jù)分析主要集中在對(duì)方劑配伍規(guī)律、中醫(yī)證治規(guī)律等的研究,現(xiàn)有的研究水平還不能構(gòu)成對(duì)高性能計(jì)算的迫切需求。隨著數(shù)據(jù)挖掘和大數(shù)據(jù)分析在中醫(yī)藥領(lǐng)域應(yīng)用水平的提高,數(shù)據(jù)研究的內(nèi)容、方法和結(jié)果的日趨豐富,隨著數(shù)據(jù)量的積累和研究方法復(fù)雜度的提高,中醫(yī)藥數(shù)據(jù)挖掘和大數(shù)據(jù)分析未來(lái)有可能成為高性能計(jì)算在中醫(yī)藥領(lǐng)域富有潛力的應(yīng)用。
3.4 模擬與仿真
模擬與仿真是依靠計(jì)算機(jī)通過(guò)數(shù)值計(jì)算和圖像顯示的方法,對(duì)工程、物理、生物等各類問(wèn)題進(jìn)行研究。高性能計(jì)算不僅具有強(qiáng)大的計(jì)算功能,還可以模擬或代替由于受經(jīng)濟(jì)或者其他條件限制不能進(jìn)行的實(shí)驗(yàn)。2013年10月,哈佛大學(xué)教授Martin Karplus、斯坦福大學(xué)教授Michael Levitt和南加州大學(xué)教授Arieh Warshel因“為復(fù)雜化學(xué)系統(tǒng)創(chuàng)立了多尺度模型”而獲得諾貝爾獎(jiǎng),評(píng)委會(huì)聲明中稱這一成果意味著對(duì)于化學(xué)家來(lái)說(shuō)計(jì)算機(jī)已經(jīng)成為同試管一樣重要的工具[1]。
計(jì)算機(jī)模擬方法在生命科學(xué)中已經(jīng)得到了迅速的發(fā)展和廣泛的應(yīng)用。高性能計(jì)算應(yīng)用領(lǐng)域的最高學(xué)術(shù)獎(jiǎng)戈登獎(jiǎng)獲獎(jiǎng)項(xiàng)目“在20萬(wàn)CPU核和異構(gòu)體系結(jié)構(gòu)上的千萬(wàn)億次持續(xù)性能血流模擬”,該項(xiàng)目模擬了血液流動(dòng)狀態(tài),可以輔助血栓的早期病理學(xué)診斷及抗血栓藥物的研究。另一項(xiàng)獲獎(jiǎng)項(xiàng)目“呼之欲出的貓:包含109規(guī)模神經(jīng)元、1013規(guī)模突觸的大腦皮質(zhì)模擬”,對(duì)神經(jīng)元和突觸規(guī)模與貓大腦相當(dāng)?shù)拇竽X皮質(zhì)功能進(jìn)行了模擬,并以此為基礎(chǔ)開(kāi)展了認(rèn)知計(jì)算的研究[3]。此外國(guó)內(nèi)外大量的高性能計(jì)算被用于分子動(dòng)力學(xué)模擬,分子動(dòng)力學(xué)模擬是一種數(shù)值模擬方法,通過(guò)將分子抽象為由化學(xué)鍵連接的質(zhì)點(diǎn)按照基于牛頓力學(xué)的數(shù)學(xué)模型迭代求解分子體系的行為。利用高性能計(jì)算進(jìn)行分子動(dòng)力學(xué)模擬已經(jīng)成為化學(xué)和生物學(xué)研究中與實(shí)驗(yàn)手段相當(dāng)?shù)臉?biāo)準(zhǔn)研究方式[7-8]。模擬和仿真技術(shù)在中醫(yī)藥研究中的應(yīng)用未來(lái)有可能成為高性能計(jì)算在中醫(yī)藥領(lǐng)域創(chuàng)新性的應(yīng)用。
4 小結(jié)
高性能計(jì)算的應(yīng)用是使高性能計(jì)算真正發(fā)揮作用的軟實(shí)力,是高性能計(jì)算領(lǐng)域重要的研究?jī)?nèi)容。高性能計(jì)算的應(yīng)用需要多學(xué)科的交叉與合作,計(jì)算生物學(xué)的產(chǎn)生標(biāo)志著高性能計(jì)算在生物醫(yī)學(xué)領(lǐng)域得到了成功應(yīng)用。
高性能計(jì)算在中醫(yī)藥領(lǐng)域的應(yīng)用目前還處于探索階段,尚不具備大規(guī)模應(yīng)用的條件和基礎(chǔ)。未來(lái)有可能通過(guò)借鑒計(jì)算生物學(xué)的研究方法在中藥植物藥的基因組學(xué)、中藥新藥的虛擬藥物篩選、中醫(yī)藥數(shù)據(jù)挖掘和大數(shù)據(jù)分析、模擬與仿真等領(lǐng)域進(jìn)行開(kāi)創(chuàng)性的應(yīng)用研究。高性能計(jì)算在中醫(yī)藥領(lǐng)域的應(yīng)用將會(huì)對(duì)中醫(yī)藥科研方法的創(chuàng)新與發(fā)展產(chǎn)生深刻的影響。
參考文獻(xiàn)
[1] 顧蓓蓓,武虹,遲學(xué)斌,等.國(guó)內(nèi)外高性能計(jì)算應(yīng)用發(fā)展概況分析[J].科研信息化技術(shù)與應(yīng)用,2014,5(4):82-91.
[2] 周興銘.高性能計(jì)算技術(shù)發(fā)展[J].自然雜志,2011,33(5):249-254.
[3] 張理論,鄧小剛.戈登獎(jiǎng)――分析與思考[J].計(jì)算機(jī)工程與科學(xué), 2012,34(8):44-52.
[4] 徐書(shū)華,金力.計(jì)算生物學(xué)[J].科學(xué),2009,61(4):34-37.
[5] 朱偉,羅頌平.治療輸卵管阻塞性不孕的中藥多靶活性成分計(jì)算機(jī)虛擬篩選[J].時(shí)珍國(guó)醫(yī)國(guó)藥,2012,23(6):1531-1532.
[6] ,孫曉波.網(wǎng)絡(luò)藥理學(xué):中醫(yī)藥現(xiàn)代化的新機(jī)遇[J].藥學(xué)學(xué)報(bào),2012,47(6):696-703.
篇9
技術(shù)的進(jìn)步正在帶來(lái)資源的解放。在石油勘探領(lǐng)域,這絕不是一句空話。在高性能計(jì)算逐漸成為石油勘探海量數(shù)據(jù)分析的基礎(chǔ)保障后,每一次技術(shù)的演進(jìn)都會(huì)帶來(lái)勘探效率的提升及勘探技術(shù)革新的可能。所以,對(duì)于更強(qiáng)大的高性能計(jì)算技術(shù)的出現(xiàn),石油勘探行業(yè)甚至已經(jīng)從“需求”變成了“渴求”。業(yè)內(nèi)眾多研究機(jī)構(gòu)一直在期盼數(shù)年后才會(huì)成熟的、比目前全球最先進(jìn)高性能計(jì)算技術(shù)強(qiáng)大數(shù)百倍的百億億級(jí)(即每秒能實(shí)現(xiàn)百億億次浮點(diǎn)計(jì)算)高性能計(jì)算技術(shù)能夠更快到來(lái),為其所用。但在今年召開(kāi)的以石油行業(yè)應(yīng)用為核心的第七屆高性能計(jì)算(HPC)及企業(yè)解決方案研討會(huì)上,記者發(fā)現(xiàn),隨著國(guó)內(nèi)石油勘探難度的加大,用戶對(duì)更強(qiáng)、更先進(jìn)的高性能計(jì)算平臺(tái)和相關(guān)技術(shù)的需求也出現(xiàn)了新的變化。
開(kāi)源+節(jié)流 化解“找油難”
在今年的研討會(huì)上,東方地球物理公司研究院處理中心總工程師賴能和特別強(qiáng)調(diào)了石油勘探行業(yè)目前面臨的三大“計(jì)算”挑戰(zhàn):可控震源高效采集技術(shù)的快速發(fā)展和廣泛應(yīng)用,使日產(chǎn)數(shù)據(jù)采集量直線上升,計(jì)算壓力進(jìn)一步加大;高密度高覆蓋采集提高了勘探的精度,使精細(xì)化的數(shù)據(jù)分析成為可能,對(duì)計(jì)算能力的提升產(chǎn)生了更強(qiáng)烈的需求;高密度采集成為一種新趨勢(shì),數(shù)據(jù)體越來(lái)越大,導(dǎo)致了計(jì)算效能的降低。
和去年相比,東方地球物理公司研究院處理中心今年承接的高密度海量數(shù)據(jù)3D項(xiàng)目更多、數(shù)據(jù)體也更大。賴能和告訴記者,處理中心目前承載的薩科桑3D、塔里木哈7、新疆瑪湖、新疆大慶3D、博孜3D等30個(gè)寬方位資料和科研攻關(guān)項(xiàng)目共涉及19029平方公里、384.8TB的數(shù)據(jù)量,均是采用高密度海量數(shù)據(jù)處理。這對(duì)處理中心的軟硬件處理能力、技術(shù)和資源配置都帶來(lái)了巨大壓力。
事實(shí)上,東方地球物理公司研究院處理中心的壓力恰恰來(lái)自“找油難”。石油是不可再生資源,當(dāng)大區(qū)塊開(kāi)發(fā)告一段落后,石油勘探業(yè)一方面要用更精細(xì)化的手段在原有開(kāi)采區(qū)塊發(fā)掘新機(jī)會(huì),一方面則要積極向海洋拓展或到過(guò)去“看不上”的區(qū)域去找油。這種轉(zhuǎn)變帶來(lái)的直接影響正是賴能和所說(shuō)的因數(shù)據(jù)體量飛速增長(zhǎng)而產(chǎn)生的計(jì)算壓力?!暗刭|(zhì)結(jié)構(gòu)越來(lái)越復(fù)雜,對(duì)計(jì)算的需求也會(huì)越來(lái)越大。以海洋石油的開(kāi)采為例,其計(jì)算量往往要比陸地石油開(kāi)采大好幾倍。近年來(lái)主流軟件的演變從時(shí)間偏移到深度偏移再到逆時(shí)偏移,計(jì)算量越來(lái)越大。盡管集群?jiǎn)蝹€(gè)節(jié)點(diǎn)的計(jì)算性能在提升,但集群節(jié)點(diǎn)量的增速也并沒(méi)有降低?!庇⑻貭枺ㄖ袊?guó))企業(yè)解決方案部能源行業(yè)資深企業(yè)客戶經(jīng)理杭曉東認(rèn)為石油勘探行業(yè)產(chǎn)生的“開(kāi)源”需求,僅依靠提升CPU的計(jì)算能力已無(wú)法滿足,這也是讓英特爾改變產(chǎn)品發(fā)展方向,從異構(gòu)向微異構(gòu)調(diào)整的原因。今年,英特爾推出的Xeon Phi協(xié)處理器就是這樣的產(chǎn)品,在提升單點(diǎn)性能
得到大幅提升,從而讓高性能計(jì)算的效能提升。
在英特爾數(shù)據(jù)中心及互聯(lián)系統(tǒng)事業(yè)部技術(shù)計(jì)算和平臺(tái)應(yīng)用支持團(tuán)隊(duì)平臺(tái)架構(gòu)師何萬(wàn)青看來(lái),高性能計(jì)算技術(shù)不僅能幫用戶“開(kāi)源”,還能幫用戶“節(jié)流”,以提高產(chǎn)量。他說(shuō):“Xeon Phi的出現(xiàn)提供了一種可能性——用比較少的節(jié)點(diǎn)提供更高密度的計(jì)算能力。如野外的數(shù)據(jù)采集工作,就可以因?yàn)轱@卡被集成到處理器中的特性而實(shí)現(xiàn)現(xiàn)場(chǎng)粗粒度的計(jì)算處理工作,減輕數(shù)據(jù)總量負(fù)擔(dān)?!痹婆c大數(shù)據(jù)應(yīng)用的可能
高性能計(jì)算與可視化應(yīng)用難以落實(shí)到云計(jì)算系統(tǒng)的現(xiàn)實(shí),曾一度讓業(yè)界認(rèn)為“云”將與石油勘探行業(yè)無(wú)緣。目前,對(duì)非結(jié)構(gòu)化數(shù)據(jù)的分析更有價(jià)值的Hadoop,對(duì)于幾乎沒(méi)有非結(jié)構(gòu)化數(shù)據(jù)的石油勘探行業(yè)似乎也是無(wú)用之物。云計(jì)算與大數(shù)據(jù)真的不適合石油勘探行業(yè)嗎?這個(gè)問(wèn)題已經(jīng)出現(xiàn)了新的答案。
在石油行業(yè),斯倫貝謝、蘭德馬克、Nice等服務(wù)公司正在提供功能較為完整的石油軟件云服務(wù)解決方案,并已被多家國(guó)際知名石油公司所采用。中石油也已經(jīng)啟動(dòng)了云技術(shù)平臺(tái)建設(shè)項(xiàng)目。
“三年前我們開(kāi)始探討虛擬化機(jī)制,嘗試勘探開(kāi)發(fā)上的一些應(yīng)用。去年正式立項(xiàng)做云計(jì)算的技術(shù)測(cè)試、跟蹤并組織隊(duì)伍,主要進(jìn)行四點(diǎn)應(yīng)用的實(shí)驗(yàn),今年?duì)幦〈钜粋€(gè)實(shí)用的環(huán)境?!敝袊?guó)石油大慶油田公司勘探開(kāi)發(fā)研究院總工程師張鐵剛?cè)缡墙榻B了中石油云計(jì)算平臺(tái)項(xiàng)目的進(jìn)展情況。他說(shuō),目前中石油總部的云計(jì)算平臺(tái)主要在考慮如何實(shí)現(xiàn)數(shù)據(jù)中心的整合、資源優(yōu)化、高效利用,結(jié)合能源應(yīng)用的特點(diǎn),讓云平臺(tái)在地學(xué)綜合研究、辦公經(jīng)營(yíng)管理業(yè)務(wù)以及生產(chǎn)管理方面發(fā)揮價(jià)值。
對(duì)于高密度采集這類應(yīng)用,中石油已經(jīng)完成了基于虛擬化技術(shù)的實(shí)驗(yàn),實(shí)驗(yàn)證明云平臺(tái)確實(shí)可以大幅降低地學(xué)應(yīng)用研究的成本。張鐵剛很看好云平臺(tái)在中石油生產(chǎn)管理效率提升和辦公運(yùn)維管理簡(jiǎn)化方面的前景。據(jù)他介紹,初期測(cè)試結(jié)果顯示,通過(guò)資源整合,中石油可以將各單位門戶服務(wù)器的利用率從20%提高到70%,將專業(yè)應(yīng)用服務(wù)器的利用率從20%提高到40%。他直言,在中石油云技術(shù)平臺(tái)建設(shè)項(xiàng)目中,英特爾提供了很多重要的技術(shù)支持,特別是將其為互聯(lián)網(wǎng)公司構(gòu)建云計(jì)算系統(tǒng)的經(jīng)驗(yàn),傳遞到了高性能計(jì)算領(lǐng)域。
在石油勘探業(yè),高性能計(jì)算集群規(guī)模越來(lái)越大,卻未必能帶給用戶最佳的投資回報(bào)。計(jì)算的高峰期資源不足,低谷期資源卻被閑置。特別是,在集群空載狀態(tài)下同樣要支付巨額電費(fèi)。與互聯(lián)網(wǎng)企業(yè)的需求一樣,不少高性能計(jì)算用戶也希望能彈性調(diào)配計(jì)算資源,分享低谷期的計(jì)算平臺(tái),用于日常生產(chǎn)、辦公。今天,中石油的嘗試已經(jīng)把云的設(shè)想變?yōu)楝F(xiàn)實(shí)。
石油勘探行業(yè)是個(gè)典型的海量數(shù)據(jù)行業(yè),但它對(duì)數(shù)據(jù)處理的需求與大數(shù)據(jù)目前的定義還存在很大差距。雖然目前石油勘探行業(yè)的典型應(yīng)用還沒(méi)有必須依賴Hadoop的需要,但賴能和認(rèn)為,這項(xiàng)新技術(shù)依舊值得他們長(zhǎng)期跟蹤。因?yàn)槿绻鸋adoop發(fā)展到了適合其應(yīng)用模型時(shí),就會(huì)成為大幅降低硬件采購(gòu)成本的一個(gè)選擇。
相關(guān)鏈接
跳出“石油”看高性能計(jì)算
篇10
關(guān)鍵詞:聚羧酸系高性能減水劑混凝土 減水率
前言
近年來(lái),我國(guó)的基礎(chǔ)建設(shè)如高鐵、公路、機(jī)場(chǎng)、大壩、市政工程等一直保持高速增長(zhǎng),同時(shí)也推動(dòng)了混凝土外加劑技術(shù)的飛速發(fā)展?;炷镣饧觿┑陌l(fā)展大致可分以下幾個(gè)階段:第一階段是起步階段,以普通減水劑木質(zhì)素為代表;第二階段以萘系高效減水劑為代表的發(fā)展階段,涌現(xiàn)了三聚氰胺、氨基磺酸鹽系、脂肪族減水劑等多種減水劑;第三階段即現(xiàn)階段,是混凝土外加劑走向高科技領(lǐng)域的階段,以聚羧酸系高性能減水劑為主要代表。自20世紀(jì)80年代后期,歐美等國(guó)家開(kāi)始對(duì)聚羧酸系減水劑進(jìn)行研究開(kāi)發(fā),并于90年代中期開(kāi)始推廣應(yīng)用,其中日本推廣比較成功。與傳統(tǒng)的減水劑相比它具有摻量少、減水率高、堿含量低、強(qiáng)度增加大、塌落度損失小、環(huán)境友好等特點(diǎn)。同時(shí),萘資源的緊缺 、工業(yè)萘價(jià)格的不斷上漲、萘系減水劑生產(chǎn)周期較長(zhǎng)、環(huán)境污染等問(wèn)題日益突出,也使聚羧酸系減水劑的應(yīng)用勢(shì)在必行。它必將代替萘系減水劑,成為主流產(chǎn)品。本文介紹的聚羧酸系減水劑生產(chǎn)工藝過(guò)程簡(jiǎn)單,所有原料基本全部轉(zhuǎn)化為減水劑,不需要分離提純,無(wú)三廢排放,所合成的減水劑質(zhì)量穩(wěn)定,非常適合工業(yè)化生產(chǎn)。
1聚羧酸系減水劑的作用機(jī)理
混凝土中摻入減水劑后,可在保持流動(dòng)性的條件下顯著地降低水灰比。減水劑產(chǎn)生減水的效果主要是由于混凝土對(duì)減水劑的吸附和分散作用。而減水劑實(shí)際上就是一種使水泥粒子高度分散并使分散體系穩(wěn)定的表面活性劑,分散效果越好,體系越穩(wěn)定,減水效果越好,其混凝土的性能就越好。而水泥粒子的分散穩(wěn)定性又取決于吸附表面的活性劑的靜電斥力和立體穩(wěn)定效應(yīng)。據(jù)DLVO理論,水泥在水溶液中醚鍵的氧與水分子反應(yīng)形成強(qiáng)力的氫鍵,并形成親水保護(hù)膜,據(jù)分析立體保護(hù)膜提供了分散穩(wěn)定性。
傳統(tǒng)的減水劑在被水泥顆粒表面吸附后呈剛性鏈平臥吸附狀態(tài),立體穩(wěn)定效應(yīng)沒(méi)有發(fā)揮出來(lái)。而聚羧酸系減水劑一方面由于-COOH、―SO3負(fù)離子提供靜電斥力,另一方面聚羧酸系減水劑分子結(jié)構(gòu)中醚鍵與水分子形成氫鍵,從而形成親水性立體保護(hù)膜,該保護(hù)膜既有分散性又提供了水泥粒子的分散穩(wěn)定性,因此聚羧酸系減水劑在低水灰比條件下能夠更好的保持混凝土的工作性能及坍落度 。
2試驗(yàn)
2.1合成原料:聚乙二醇(分子量1000)、引發(fā)劑、阻聚劑、甲基丙烯酸、丙烯酸羥丙酯、催化劑、自制A料和B料。
2.2儀器設(shè)備:電子稱、分析天平、電熱套、磁力攪拌器、溫度管、燒杯、恒溫水浴鍋 、水泥凈漿攪拌機(jī)、60L單臥軸式強(qiáng)制攪拌機(jī)等。
2.3試驗(yàn)原料:鼎鑫普通硅酸鹽水泥、曲寨普通硅酸鹽水泥、正定河砂、鹿泉人工碎石
2.4合成步驟
大單體的合成:稱取定量的溶融的聚乙二醇、催化劑和阻聚劑在100℃~120℃下進(jìn)行酯化反應(yīng),時(shí)間約2個(gè)小時(shí),測(cè)定酯化率合格后,反應(yīng)結(jié)束。
減水劑的合成:將定量的大單體和甲基丙烯酸、丙烯酸羥丙酯等按比例混合,加入助劑A料和B料在水溶液中聚合,時(shí)間約為5小時(shí),然后用濃度為32%的液堿中和至 pH值6-7即得。
2.5水泥凈漿流動(dòng)度試驗(yàn)
試驗(yàn)參照GB8077-2000《混凝土外加劑勻質(zhì)性實(shí)驗(yàn)方法》進(jìn)行,稱取水泥300g,水87g,外加劑摻量為0.20%時(shí)測(cè)定摻不同羧酸減水劑的水泥凈漿流動(dòng)度,并以此作為表征其性能的參數(shù)。
2.6混凝土減水率試驗(yàn)
減水率測(cè)試按國(guó)家標(biāo)準(zhǔn)GB8076-2008《混凝土外加劑》測(cè)試坍落度損失。
2.7 凝結(jié)時(shí)間的測(cè)定
參照GB/T1346-2001《水泥標(biāo)準(zhǔn)稠度用水量、凝結(jié)時(shí)間、安定性檢測(cè)方法》測(cè)定水泥凈漿凝結(jié)時(shí)間。
3結(jié)果與討論
3.1減水劑的勻質(zhì)性指標(biāo)
按照國(guó)標(biāo)GB8077-2000《混凝土外加劑勻質(zhì)性實(shí)驗(yàn)方法》檢測(cè)所合成的減水劑勻質(zhì)性項(xiàng)目指標(biāo).見(jiàn)表1.
表1 聚羧酸系減水劑勻質(zhì)性指標(biāo)
由勻質(zhì)性指標(biāo)可知,所合成的減水劑氯離子幾乎沒(méi)有,堿含量也比較低,完全符合混凝土配制的要求。
3.2水泥凈漿流動(dòng)度試驗(yàn)
分別用鼎新水泥P.042.5和曲寨水泥P.042.5兩種不同品牌的水泥,用本試驗(yàn)羧酸(代號(hào)為A)和某品牌羧酸減水劑在三個(gè)不同摻量(摻量以固體計(jì))下進(jìn)行對(duì)比試驗(yàn)。見(jiàn)表2
表2水泥凈漿流動(dòng)度試驗(yàn)情況
從上表可以看出,A 羧酸系減水劑對(duì)不同品牌的水泥適應(yīng)性較好,在摻量允許范圍內(nèi)隨著摻量增加,凈漿流動(dòng)度逐漸增大,且狀態(tài)良好。與同類羧酸減水劑相比性能也具有一定的優(yōu)越性。但從經(jīng)濟(jì)角度講,推薦摻量為0.20%。
3.3不同摻量的減水率試驗(yàn)情況
本實(shí)驗(yàn)采用鼎新水泥P.042.5和基準(zhǔn)水泥P.042.5 兩種水泥分別進(jìn)行測(cè)試,且分別采用0.12%、0.16%、0.20%三個(gè)不同的摻量予以確定。 結(jié)果見(jiàn)表3。
表3A羧酸減水劑減水率情況表
從上表可以看出A羧酸減水劑的減水率隨著摻量的增加明顯的增大,而且其在摻量較低時(shí)仍具有很高的減水率。
3.4混凝土性能試驗(yàn)情況
本實(shí)驗(yàn)采用鼎新水泥P.042.5 為試驗(yàn)水泥,比較本試驗(yàn)羧酸(代號(hào)A)和某品牌羧酸在相同摻量0.20%下的混凝土性能。詳見(jiàn)表4
表4不同羧酸的混凝土性能試驗(yàn)表
從上表可以看出,A羧酸減水劑所表現(xiàn)出的性能指標(biāo)均符合GB8076-2008標(biāo)準(zhǔn)要求,且在同摻量下性能指標(biāo)優(yōu)于某品牌羧酸產(chǎn)品,所表現(xiàn)出的高減水率和增強(qiáng)性有利于配制高標(biāo)號(hào)或大坍落度要求的混凝土。
4結(jié)論:
用聚乙二醇、催化劑和阻聚劑、甲基丙烯酸、丙烯酸羥丙酯等原料兩步合成出性能優(yōu)異、質(zhì)量穩(wěn)定的聚羧酸系高性能減水劑。
本工藝生產(chǎn)的聚羧酸系高性能減水劑堿含量小于1.5%,且基本不含氯離子,無(wú)毒,對(duì)環(huán)境無(wú)污染,屬綠色環(huán)保產(chǎn)品。
本工藝生產(chǎn)的聚羧酸系高性能減水劑具有較高的減水率,適于配制商品混凝土、泵送混凝土、高強(qiáng)高性能混凝土等。
參考文獻(xiàn)
[1]郭延輝等.聚羧酸高性能減水劑及其應(yīng)用技術(shù)―現(xiàn)狀、發(fā)展趨勢(shì)和我們的任務(wù).聚羧酸系高性能減水劑及其應(yīng)用技術(shù).北京:機(jī)械工業(yè)出版社 ,2005.8
[2]姜國(guó)慶.日本高性能AE減水劑的研究進(jìn)程及應(yīng)用現(xiàn)狀.化學(xué)建材,2000(2):42
[3]朱俊林等.聚羧酸系高性能混凝土減水劑的研制.聚羧酸系高性能減水劑及其應(yīng)用技術(shù).北京:機(jī)械工業(yè)出版社 ,2005.8
熱門標(biāo)簽
相關(guān)期刊
-
Numerical Mathematics
主管:國(guó)家教育部
級(jí)別:SCI期刊
影響因子:0.11
-
江蘇船舶
主管:江蘇省交通運(yùn)輸廳
級(jí)別:省級(jí)期刊
影響因子:0.18
-
計(jì)算機(jī)科學(xué)技術(shù)學(xué)報(bào)
主管:中國(guó)計(jì)算機(jī)學(xué)會(huì);中國(guó)科學(xué)院計(jì)算技術(shù)研究所
級(jí)別:SCI期刊
影響因子:0.51
-
土木工程學(xué)報(bào)
主管:中華人民共和國(guó)住房和城鄉(xiāng)建設(shè)部
級(jí)別:北大期刊
影響因子:2.24