“大數(shù)據(jù)的概念聽上去和云計算一樣,有些‘高大上’,但是大數(shù)據(jù)絕不是一個空泛的口號,事實上它不僅改變了人們的生存面貌,更為科學(xué)研究帶來重大的機遇?!敝袊茖W(xué)院遙感與數(shù)字地球所研究員郭華東說。
依托海量的數(shù)據(jù)狀態(tài)和云級別的數(shù)據(jù)處理能力,大數(shù)據(jù)以其Volume(大量)、Velocity(高速)、Variety(多樣)、Veracity(真實)的4V特點,帶來了一場全方位的思維變革、產(chǎn)業(yè)變革和管理變革。郭華東表示:“它把我們的科學(xué)研究各個領(lǐng)域以及各個環(huán)節(jié)都推到了一個前所未有的‘大數(shù)據(jù)時代’?!苯?,以“科學(xué)大數(shù)據(jù)的前沿問題”為主題的第507次香山科學(xué)會議在北京香山飯店舉行,會議邀請了來自全國各地多學(xué)科跨領(lǐng)域的專家學(xué)者,共同探討大數(shù)據(jù)時代下科學(xué)研究的基礎(chǔ)設(shè)施、創(chuàng)新模式與共享機制以及人才培養(yǎng)等問題。
大數(shù)據(jù)讓科研面臨新挑戰(zhàn)
在中國科學(xué)院計算機網(wǎng)絡(luò)信息中心主任黃向陽看來,計算機技術(shù)、以互聯(lián)網(wǎng)為代表的通信技術(shù)和以物聯(lián)網(wǎng)為代表的傳感技術(shù)的持續(xù)創(chuàng)新和廣泛應(yīng)用使人類的數(shù)據(jù)化能力和范圍快速擴張?!耙源罂茖W(xué)裝置為代表的機構(gòu)內(nèi)部產(chǎn)生的數(shù)據(jù)量能夠被測量和記錄的越來越多,而我們對事物、現(xiàn)象等的測量、記錄也更加頻繁和細(xì)致?!彼f。
“如今,這種擴張讓我們看到大量從宏觀到微觀、從自然到社會的觀察,計算、傳播等儀器設(shè)備和活動都在快速產(chǎn)生著海量、多樣的數(shù)據(jù)。”黃向陽說,“比如高通量科學(xué)儀器、望遠(yuǎn)鏡、衛(wèi)星、加速器、傳感器網(wǎng)絡(luò)、醫(yī)療成像設(shè)備、測序儀等各種科研儀器和裝置、模擬方法、智能終端以及各種應(yīng)用等,這些都使得科研領(lǐng)域被推到了一個前所未有的‘大數(shù)據(jù)’時代?!?/span>
海量數(shù)據(jù)的劇增,勢必讓量變引起質(zhì)變,黃向陽表示,不斷增加的數(shù)據(jù)引發(fā)人們思維和行為模式的變革,而在科學(xué)研究領(lǐng)域,這也將直接為科研模式帶來極大的改變?!袄^實驗科學(xué)、理論科學(xué)、計算科學(xué)之后出現(xiàn)了第四種研究范式,即‘?dāng)?shù)據(jù)密集型科學(xué)’,成為大數(shù)據(jù)時代下的新模式?!?/span>
“我們有理由相信,大數(shù)據(jù)為科學(xué)研究帶來了重大機遇,比如當(dāng)所能利用的數(shù)據(jù)增加時,人們將可以做很多在小數(shù)據(jù)基礎(chǔ)上無法完成的事情?!秉S向陽說。
取之于科學(xué)用之于科學(xué)
中國科學(xué)院高能物理研究所計算中心主任陳剛說:“中國的髙能物理實驗每年產(chǎn)生的數(shù)據(jù)也達(dá)到PB級(百萬GB級——編者注)。高能物理實驗是典型的大科學(xué)裝置和大科學(xué)研究項目,這意味著跨國家跨地域的國際合作。這樣的大科學(xué)項目需要將實驗數(shù)據(jù)收集和存儲起來,并通過高速網(wǎng)絡(luò)分發(fā)給處于不同國家或機構(gòu)的合作者。這對高速網(wǎng)絡(luò)提出了巨大挑戰(zhàn)?!标悇偙硎?,正因如此,高能物理需要建設(shè)專用高速網(wǎng)絡(luò)并采用新的網(wǎng)絡(luò)技術(shù)來實現(xiàn)數(shù)據(jù)的全球共享。
“通俗的說,科學(xué)大數(shù)據(jù)是科學(xué)工程研究中的海量數(shù)據(jù)。”中國科學(xué)院遙感與數(shù)字地球研究所研究員王力哲說。在他看來,大數(shù)據(jù)“無處不在,且蘊含著巨大的經(jīng)濟(jì)價值”,它既是一門多學(xué)科融合的一個交叉學(xué)科,也在反過來影響和改變著更多的科學(xué)領(lǐng)域。
王力哲以我國人口密度對比線——“胡煥庸線”的形成機理分析作為一個實例來解釋科學(xué)大數(shù)據(jù)知識發(fā)現(xiàn)的理論方法:“‘胡煥庸線’的形成涉及多方面自然、社會、經(jīng)濟(jì)因素的影響,個體空間行為—空間過程—空間格局的相互作用機理模型極其復(fù)雜;這項研究伴隨著超長序列的海量空間數(shù)據(jù)和社會經(jīng)濟(jì)數(shù)據(jù),包括地理、氣候、遙感、 人口、工農(nóng)業(yè)生產(chǎn)、資源、環(huán)境、商業(yè)、教育、交通等等?!彼硎?,“而空間大數(shù)據(jù)時代的到來,使用超長時空序列的、多源、異構(gòu)的自然、社會、經(jīng)濟(jì)空間大數(shù)據(jù),進(jìn)行空間大數(shù)據(jù)分析和知識發(fā)現(xiàn),能夠為研究‘胡煥庸線’形成機理進(jìn)而為‘新型城鎮(zhèn)化建設(shè)’這一重大國家需求提供理論決策支持?!?/span>
在天文領(lǐng)域,大數(shù)據(jù)也在為挖掘有價值的信息及規(guī)律發(fā)揮著重要的作用。中國科學(xué)院國家天文臺研究員趙永恒說:“隨著全球各個大型巡天觀測項目的開展,天文學(xué)研究的模式正在從以往的小樣本向著大數(shù)據(jù)模式轉(zhuǎn)變,海量的天文數(shù)據(jù)給天文學(xué)家?guī)砹司薮蟮臋C遇和挑戰(zhàn),天文學(xué)的研究也越來越離不開大數(shù)據(jù)集的統(tǒng)計分析,即數(shù)據(jù)挖掘和知識發(fā)現(xiàn)?!?/span>
他表示,現(xiàn)如今,對這些海量天文大數(shù)據(jù)進(jìn)行數(shù)據(jù)處理與分析已經(jīng)超越了當(dāng)前的計算能力?!叭绾螌μ煳拇髷?shù)據(jù)進(jìn)行高效和及時的處理從而加速天文學(xué)研究的科學(xué)產(chǎn)出已成為天文觀測和天文研究迫切需要解決的難題,而大數(shù)據(jù)無疑可以幫助天文學(xué)家重新審視和了解我們的宇宙?!?/span>
大數(shù)據(jù)管理帶來新思考
盡管大數(shù)據(jù)時代的到來為諸多科研領(lǐng)域帶來新的曙光,然而如何將科學(xué)數(shù)據(jù)變成創(chuàng)新資源,并在數(shù)據(jù)共享的積極作用下有效保障國家安全與個人隱私,成為人們關(guān)心的話題。
“尤其像現(xiàn)在,科學(xué)數(shù)據(jù)的應(yīng)用邊界,已經(jīng)從傳統(tǒng)的科研和教育領(lǐng)域,向社會經(jīng)濟(jì)和商業(yè)領(lǐng)域延伸,因此這仍然是一個復(fù)雜的、系統(tǒng)的問題。”中科院網(wǎng)絡(luò)信息中心科學(xué)數(shù)據(jù)中心主任黎建輝說。
據(jù)他介紹,為此,國際國內(nèi)均在做一些有益的探索和嘗試?!霸趯W(xué)術(shù)領(lǐng)域,新的數(shù)據(jù)出版模式正在逐步形成?!崩杞ㄝx說,“在商業(yè)領(lǐng)域,數(shù)據(jù)集
市作為在云計算技術(shù)支持下的數(shù)據(jù)共享、交換與交易的模式,在國內(nèi)外呈現(xiàn)快速發(fā)展的趨勢?!?/span>
在浩瀚的數(shù)據(jù)海洋里挖掘和捕捉能夠推動人類進(jìn)步的信息,與此同時還要保障一系列的數(shù)據(jù)安全隱患,在復(fù)旦大學(xué)上海數(shù)據(jù)科學(xué)實驗室主任朱揚勇看來,培養(yǎng)數(shù)據(jù)科學(xué)家十分重要?!斑@里說的是數(shù)據(jù)科學(xué)家而非傳統(tǒng)的信息科學(xué)家,他們關(guān)注對數(shù)據(jù)現(xiàn)象和規(guī)律的研究,并開始出現(xiàn)在領(lǐng)先的企業(yè)和大學(xué)中,發(fā)揮著他們的巨大作用?!?/span>
合格的大數(shù)據(jù)人才需要具備哪些品質(zhì)?王力哲表示:“數(shù)據(jù)科學(xué)是一個多學(xué)科融合的交叉學(xué)科;數(shù)據(jù)科學(xué)是以數(shù)據(jù)為研究對象,以信息論、統(tǒng)計學(xué)、數(shù)據(jù)理論、數(shù)學(xué)分析等理論為研究手段,以獲取海量數(shù)據(jù)中蘊含的知識為目標(biāo)的一門學(xué)科。” 也正因此,他認(rèn)為從事大數(shù)據(jù)研究勢必應(yīng)該是復(fù)合型人才。
“除此之外,他還要關(guān)注國際數(shù)據(jù)科學(xué)領(lǐng)域熱點議題,關(guān)心數(shù)據(jù)及其涉及的一系列政策、標(biāo)準(zhǔn)、技術(shù)、方法和國際發(fā)展態(tài)勢?!敝袊茖W(xué)院地理科學(xué)與資源研究所研究員劉闖表示,“世界性的數(shù)據(jù)科學(xué)領(lǐng)域?qū)W術(shù)帶頭人正在一些熱點議題中涌現(xiàn)出來?!?/span>
她認(rèn)為,數(shù)據(jù)領(lǐng)域國家化人才還應(yīng)對數(shù)據(jù)領(lǐng)域熱點問題把握準(zhǔn)確,有一定超前的戰(zhàn)略思想,并在這些問題上有“開放的、獨特的學(xué)術(shù)業(yè)績”。
“我國在數(shù)據(jù)領(lǐng)域培養(yǎng)國家化人才方面與大國地位差距甚遠(yuǎn),特別是一些關(guān)鍵性領(lǐng)域尚屬空白。在這個方面,我們還有很多工作要做?!眲㈥J說。
聲音連線
大數(shù)據(jù)或許可以“創(chuàng)造大腦”
10月26日,由復(fù)旦大學(xué)主辦的浦江創(chuàng)新論壇·未來科學(xué)論壇上,多位國內(nèi)外頂尖科學(xué)家齊聚一堂,圍繞“關(guān)注未來:拓展認(rèn)知的疆界”這一主題,就當(dāng)今時代科學(xué)發(fā)展最具吸引力的重大領(lǐng)域展開了精彩的討論。
據(jù)中新社報道,中國科學(xué)院院士,北京航空航天大學(xué)校長懷進(jìn)鵬在論壇上公布了一個有趣的科學(xué)設(shè)想:大數(shù)據(jù)也許可以“創(chuàng)造大腦”。從神經(jīng)科學(xué)來認(rèn)知腦,也許通過數(shù)據(jù)人類可以創(chuàng)造一個腦。孩子學(xué)習(xí)識物的時候,不需要一兩百張、而是通過20張左右的圖片,他就能學(xué)會區(qū)別什么是馬,什么是牛,什么是車,這與大數(shù)據(jù)識別有著相似之處。
懷進(jìn)鵬設(shè)想,通過研究從數(shù)據(jù)科學(xué)到電腦到智腦的演化,也許能從無數(shù)據(jù)到大數(shù)據(jù)建立人腦圖譜,在移動計算和現(xiàn)有的大數(shù)據(jù)當(dāng)中嘗試“創(chuàng)造大腦”,創(chuàng)造一個部分的功能或者仿真一個功能,使電腦向智腦轉(zhuǎn)換。
今天的時代是一個用戶產(chǎn)生內(nèi)容的時代,但是對于大數(shù)據(jù)的運用,基本還停留在淺顯的層面,如通過網(wǎng)頁瀏覽量數(shù)據(jù)分析用戶的喜好、需求等。更多的數(shù)據(jù)依然是無序、不可被分析的狀態(tài)。
懷進(jìn)鵬說,如果能建立一種智能模式,“教會”電腦掌握從數(shù)據(jù)的無序到有序關(guān)聯(lián),以便認(rèn)識人的一部分世界,通過建立一系列融合關(guān)聯(lián),讓電腦學(xué)會構(gòu)成一個時間段的社會理解,用芯片或者機器創(chuàng)造“一天的宇宙”。
加入電腦能夠形成跨語言之間的遷移學(xué)習(xí),最后形成自主生長和所派生的復(fù)雜結(jié)構(gòu)下相互數(shù)據(jù)、信息和知識之間的關(guān)聯(lián),以便對智腦的理解有附加的幫助,在這樣的方式下通過數(shù)據(jù)分析出傳播學(xué)、社會學(xué)的新特征?;蛟S還可以了解人是如何學(xué)習(xí)和記憶的,如何認(rèn)知和增長智力、形成自主學(xué)習(xí)的,甚至了解情感形成的過程。
“也許通過數(shù)據(jù),我們可以創(chuàng)造一個腦,因為基于數(shù)據(jù)的科學(xué)可以使得機器更聰明,也可以使得社會更理性?!睉堰M(jìn)鵬展望說。(記者 劉曉瑩)