在成都飛往拉薩的航班上,透過飛機舷窗俯瞰,青藏高原雪峰如海,冰川如練。這片250萬平方公里的土地,既是世人眼中的“世界屋脊”,更是孕育了長江、黃河、雅魯藏布江等10多條大江大河的“亞洲水塔”。
然而,要算清這座水塔的水量賬,過去幾乎是不可能的事。“當?shù)匮鯕庀”?、溫度低、風雪大、輻射強,導致普通監(jiān)測儀器故障率高、壽命短、維護也極為困難?!敝袊茖W院青藏高原研究所研究員李新說,“就算儀器扛住了高寒低溫的惡劣環(huán)境,數(shù)據(jù)也很難傳回來?!?/p>
如今,這個局面正在被改變。在北京林萃路,一個由十幾名研究員領(lǐng)銜的“數(shù)據(jù)工廠”——國家青藏高原科學數(shù)據(jù)中心(以下簡稱“中心”),正在為“亞洲水塔”打造可靠的數(shù)字底座。截至今年5月,中心發(fā)布的數(shù)據(jù)集總數(shù)達8585個,累計下載量達6PB。
攻克數(shù)據(jù)關(guān)卡
“青藏高原的每一組數(shù)據(jù),都來之不易?!敝行闹魅卫钚抡f。
高原上,冬天零下二三十度是家常便飯,普通監(jiān)測設(shè)備撐不過一個冬天就“罷工”?!坝袝r候辛辛苦苦把設(shè)備架好,第二年開春去看,已經(jīng)被風吹雪掩,無法使用了?!崩钚抡f。
即便設(shè)備扛住了,青藏高原近80%的地區(qū)沒有通訊網(wǎng)絡(luò)覆蓋,4G信號更是奢望,數(shù)據(jù)存在存儲卡里,就是傳不出來。過去,科考隊只能一次次進山,靠人工下載取回數(shù)據(jù)?!把鹏敳夭冀髰{谷就是典型的‘通信盲區(qū)’,高山深谷人力難以到達,很難采集到有效數(shù)據(jù)并傳輸?shù)街行?。”李新感慨道?/p>
為解決這些難題,中心自主研發(fā)了適應(yīng)高寒極端環(huán)境的衛(wèi)星物聯(lián)網(wǎng)觀測終端,還研制出無人機高速中繼系統(tǒng)、無人機載徑流監(jiān)測系統(tǒng)、“智能鷹眼”等新裝備,硬是在高原上織起了一張“天—空—地”立體監(jiān)測網(wǎng)。
天基層面,中心整合高分系列衛(wèi)星、風云系列衛(wèi)星等國產(chǎn)衛(wèi)星及國際衛(wèi)星資源,實現(xiàn)對青藏高原全域的周期性監(jiān)測;空基層面,運用無人機搭載多種智能載荷,對冰川凍土、雅魯藏布江大峽谷、拉魯濕地等重點區(qū)域?qū)嵤└叻直媛?、高頻次觀測;地基層面,通過在六大流域24個地面觀測站部署中心研發(fā)的物聯(lián)網(wǎng)監(jiān)測信息系統(tǒng),持續(xù)采集水文、氣象、生態(tài)等62類關(guān)鍵指標的原位數(shù)據(jù),累計接收數(shù)據(jù)超過20億條。
此外,中心還建立了覆蓋數(shù)據(jù)全生命周期的動態(tài)安全管理機制,為每個數(shù)據(jù)集賦予全球唯一的DOI“身份證”,實現(xiàn)數(shù)據(jù)精準溯源。
讓數(shù)據(jù)“活”起來
在做好數(shù)據(jù)存檔的同時,中心還致力于讓數(shù)據(jù)真正“活”起來,釋放其科學價值。一組數(shù)字足以說明其效果:中心注冊用戶超過14萬,2025年平臺數(shù)據(jù)下載量超過2100TB、頁面訪問量超過1.65億次;三分之二的數(shù)據(jù)完全公開、免注冊下載,國際下載占比高達27%……
“第三方測評機構(gòu)按可查找、可訪問、可互操作、可重用原則評估地學領(lǐng)域的數(shù)據(jù)中心,我們中心多次獲得第一。雖然我們的數(shù)據(jù)量不算大,但下載量和流通速度常年排名靠前。”中國科學院青藏高原研究所研究員、國家青藏高原科學數(shù)據(jù)中心副主任馮敏告訴記者。
在國家數(shù)據(jù)中心體系里,中心率先引入同行評審機制。每個數(shù)據(jù)集不僅要先技術(shù)評審,檢查完整性、元數(shù)據(jù)規(guī)范性,還要送專家?guī)爝M行同行評議。
“專家要打開數(shù)據(jù)、檢查方法、評估精度,并給出反饋,這相當于給數(shù)據(jù)做一次‘學術(shù)審稿’。像期刊審稿一樣,專家不僅指出問題,更提出建議,幫助數(shù)據(jù)提交者改進?!瘪T敏說,依托在線數(shù)據(jù)庫運作系統(tǒng),觀測數(shù)據(jù)中哪個數(shù)值異常、什么時候采集的、誰采集的,都能追溯到。
得益于嚴格的質(zhì)量把控,中心的數(shù)據(jù)產(chǎn)品開始在高水平科學研究中發(fā)揮關(guān)鍵作用。以青藏高原湖泊研究為例,依托中心數(shù)據(jù)產(chǎn)品,科學家對湖泊數(shù)量、面積、水量變化有了更精準的把握,支撐了一系列高水平成果的產(chǎn)出;研制的首套中國區(qū)域75年長時序近地面氣象驅(qū)動數(shù)據(jù),已成為高原氣候變化研究和工程安全評估的關(guān)鍵數(shù)據(jù);全球地表太陽輻射數(shù)據(jù),為新能源資源評估提供了重要依據(jù)。
截至今年4月,對中心表示致謝的論文已超過11000篇,且數(shù)量呈快速上升態(tài)勢。2025年10月,中心申報的“地球大數(shù)據(jù)創(chuàng)新青藏高原高質(zhì)量數(shù)據(jù)集”入選國家數(shù)據(jù)局發(fā)布的“高質(zhì)量數(shù)據(jù)集典型案例”,總規(guī)模超過600TB。
數(shù)據(jù)不光支撐科研,還直接服務(wù)國家需求和產(chǎn)業(yè)發(fā)展?!爸行陌l(fā)布的數(shù)據(jù)已應(yīng)用于川藏鐵路建設(shè)、雅魯藏布江下游水電工程、冰湖潰決應(yīng)對等國家重大工程;同時,還有多家企業(yè)依托中心發(fā)布的產(chǎn)品,優(yōu)化了產(chǎn)業(yè)布局,比如比亞迪汽車股份有限公司利用中心共享的太陽輻射、植被、社會經(jīng)濟數(shù)據(jù)進行了大數(shù)據(jù)分析,助力公司決策?!崩钚抡f。
AI賦能地球“管理”
當前,人工智能(AI)賦能千行百業(yè)的熱潮正席卷而來。在地球科學領(lǐng)域,遙感、地理信息雖已廣泛引入AI,但在支撐地球系統(tǒng)預(yù)測和決策層面,AI的潛力仍未得到充分釋放?!叭绾巫孉I真正理解地球系統(tǒng)的復雜過程,依然是一個難題?!崩钚抡f。
這正是中心團隊選擇深入研究的方向。在數(shù)據(jù)產(chǎn)品研發(fā)上,中心已建立起“多源觀測+AI智能融合+物理模型同化”的復合生產(chǎn)模式。針對青藏高原復雜的地形、氣候環(huán)境,中心通過融合多源觀測和模型模擬結(jié)果,生成了高分辨率氣候驅(qū)動、冰川湖泊分布與變化等一系列數(shù)據(jù)產(chǎn)品。其中,中國區(qū)域氣象要素驅(qū)動數(shù)據(jù)集兩套版本累計被瀏覽31萬余次、下載4.4萬余次。
“數(shù)據(jù)產(chǎn)品的價值,最終要看科學家能不能直接拿來用。AI幫我們解決了復雜環(huán)境下數(shù)據(jù)生產(chǎn)的效率問題,但每一個產(chǎn)品背后,都還需要實測數(shù)據(jù)的校準和專家的把關(guān)。”馮敏說。
在此基礎(chǔ)上,中心正將目光投向更具挑戰(zhàn)性的目標——地球系統(tǒng)的建模與數(shù)字孿生。中心團隊提出了“AI驅(qū)動的青藏高原觀測—數(shù)據(jù)—模型一體化”框架,探索引入多主體強化學習方法,讓多個智能體在虛擬環(huán)境中模擬推演氣溫上升、冰川消融、湖泊擴張、人類適應(yīng)等過程的演變規(guī)律,為地球系統(tǒng)預(yù)測和災(zāi)害預(yù)警提供決策支持。
“與通用大語言模型不同,我們更強調(diào)在地球系統(tǒng)預(yù)測和決策中發(fā)揮作用。不僅要預(yù)測,更要能評估決策干預(yù)的效果;不僅要技術(shù)上可行,更要對實際有用。”李新說。
面向未來,中心與中國科學院磐石模型團隊、浦江實驗室團隊等團隊交流,探索數(shù)據(jù)同化、強化學習、因果分析在數(shù)字孿生地球中的結(jié)合,逐步構(gòu)建能夠模擬和預(yù)測高原地球系統(tǒng)變化的數(shù)字孿生平臺?!拔覀兿M麛?shù)據(jù)不只是記錄高原發(fā)生了什么,更能為理解高原變化的機制、應(yīng)對未來的不確定性提供科學依據(jù)?!崩钚抡f。
從破解“獲取難、傳輸難”到擁抱“AI”,這群在高原上“追數(shù)據(jù)”的人,正以數(shù)據(jù)為筆,在雪域高原書寫新的可能。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2026 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導報》社有限責任公司