
? 本報記者 劉琴
作為人工智能(AI)與機器人技術結合的前沿領域,具身智能產業(yè)正在從實驗室技術驗證邁向實際場景規(guī)?;瘧?,但高質量數(shù)據(jù)的短缺成為制約其快速發(fā)展的核心瓶頸。如何破解這一難題,成為業(yè)內熱議的話題。記者就此采訪了具身智能領域多位專家。
數(shù)據(jù)采集為何難
“數(shù)據(jù)是具身智能產業(yè)的核心生產要素與‘燃料’,是算法、算力之外決定智能系統(tǒng)能力上限的關鍵變量?!焙比诵螜C器人創(chuàng)新中心首席運營官劉傳厚介紹說,具身智能模型需海量多模態(tài)數(shù)據(jù)(視覺、力覺、觸覺、運動軌跡、物理交互等)訓練,數(shù)據(jù)的規(guī)模、質量、多樣性直接決定模型感知、決策、控制能力與泛化性。當前,具身智能機器人與人類對話聊天時,有時會“答非所問”;跑步時,會因自身不穩(wěn)而摔倒……這些都與缺乏高質量數(shù)據(jù)有關。
“對于具身智能而言,數(shù)據(jù)是連接虛擬與物理現(xiàn)實的‘橋梁’?!背鞘兄g(北京)科技有限公司副總經理兼具身事業(yè)部總經理薛清恒表示,高質量數(shù)據(jù)決定了具身智能的泛化能力,只有豐富、高質量的數(shù)據(jù)才能讓機器人在面對從未見過的場景、物體或干擾時,依然能做出正確的物理操作。
高質量的數(shù)據(jù)對提升具身智能機器人性能至關重要,但采集高質量數(shù)據(jù)面臨多重挑戰(zhàn)。
樂聚(深圳)機器人技術有限公司常務副總裁柯真東介紹道,采集高質量具身智能數(shù)據(jù)有五大難點。首先,采集成本高,需要專門的硬件設備和人員;其次,采集效率很低,采集和訓練流程需要大量時間;第三,不同傳感器有不同的數(shù)據(jù)格式和標準,導致數(shù)據(jù)難以共享和使用;第四,具身智能涉及多種感官和信息,采集和處理這些數(shù)據(jù)非常復雜;第五,行業(yè)標準不統(tǒng)一,導致采集到的數(shù)據(jù)質量很難保障。
“物理世界交互的復雜性、高成本與異構性等特征,導致具身智能數(shù)據(jù)采集難度極大?!眲骱裾f,數(shù)據(jù)采集需部署人形機器人、機械臂、多模態(tài)傳感器等專用硬件,而單臺人形機器人成本高達數(shù)十萬元,采集1萬小時數(shù)據(jù)需上百萬元軟硬件投入。此外,真實場景環(huán)境復雜,具身智能數(shù)據(jù)采集需改造場地適配多場景,規(guī)?;瘓鼍安渴鸪杀靖吲c難度大。
在北京人形機器人創(chuàng)新中心具身天工事業(yè)部負責人、具身智能機器人數(shù)據(jù)與訓練基地負責人蔣未來看來,高質量數(shù)據(jù)采集主要面臨三大難點:一是場景碎片化,真實環(huán)境千差萬別,每個變量都在考驗算法的泛化能力;二是不同構型的機器人傳感器布局、關節(jié)自由度、控制接口各不相同,導致不同構型的數(shù)據(jù)難以遷移;三是數(shù)據(jù)質量參差不齊,數(shù)據(jù)采集涉及動作捕捉、多模態(tài)同步、人工標注等環(huán)節(jié),任何環(huán)節(jié)偏差都可能產出“低質”數(shù)據(jù)。
采集方式各有千秋
據(jù)了解,目前主流的具身智能采集方式主要有3種:真實物理遙操作、仿真合成數(shù)據(jù)以及互聯(lián)網(wǎng)視頻學習/人體動作捕捉。
薛清恒介紹說,真實物理遙操作采集方式數(shù)據(jù)質量最高,但采集效率極低、成本極高,難以在短時間內獲取百萬級數(shù)據(jù);仿真合成數(shù)據(jù)采集速度快、成本低,但仿真中的物理參數(shù)往往與現(xiàn)實不符,導致在仿真中訓練好的模型在現(xiàn)實中往往“失靈”;互聯(lián)網(wǎng)視頻學習/人體動捕采集方式成本相對適中,但視頻數(shù)據(jù)缺少“動作標簽”和“力覺信息”,數(shù)據(jù)利用率較低。
薛清恒表示,現(xiàn)階段,沒有單一的有效數(shù)據(jù)采集方式,需要采用“虛實結合,預訓練+微調”的復合模式。
蔣未來認為,人形機器人要想真正走進千行百業(yè),就需要海量、多樣、高質量的數(shù)據(jù)“原料”。真機數(shù)據(jù)是機器人智能從虛擬走向現(xiàn)實的必經之路,能夠精準還原力覺反饋、觸覺信息、環(huán)境干擾等仿真難以復制的細節(jié)。此外,真機數(shù)據(jù)還能有效解決“分布偏移”問題,機器人可以學習適應各種環(huán)境特征與突發(fā)情況,從而真正實現(xiàn)從實驗室走向現(xiàn)實世界的跨越。
柯真東認為,更有效獲取高質量數(shù)據(jù)的策略是分級訓練和分層數(shù)據(jù),即用低成本的數(shù)據(jù)做預訓練,用高質量的真機數(shù)據(jù)做精調和落地微調。
在劉傳厚看來,“仿真數(shù)據(jù)打底擴量+便攜式輕量化采集+真機少量精調+Ego-centric(第一人稱視角)多模態(tài)數(shù)據(jù)采集補全場景理解”的融合數(shù)據(jù)采集路徑最有效,可平衡數(shù)據(jù)質量、成本與規(guī)模,是當前行業(yè)主流演進方向。
“三位一體”破解采集難題
如何破解高質量數(shù)據(jù)短缺難題,推動具身智能產業(yè)發(fā)展?
劉傳厚表示,在技術層面,需要攻關仿真與遷移技術、發(fā)展數(shù)據(jù)生成與增強技術、創(chuàng)新輕量化采集技術等,從而提升數(shù)據(jù)供給效率;在產業(yè)生態(tài)層面,通過建設國家級數(shù)據(jù)基礎設施、構建數(shù)據(jù)共享與交易生態(tài)、推動場景開放與協(xié)同采集等方式,實現(xiàn)共建共享,打破數(shù)據(jù)孤島;在政策與資本層面,通過出臺專項扶持政策、引導資本精準投入、設立產業(yè)基金等方式,支撐和引導產業(yè)發(fā)展。
劉傳厚認為,各類企業(yè)要進行差異化布局。頭部企業(yè)要聚焦仿真技術、世界模型研發(fā),建設自有數(shù)據(jù)采集平臺,主導行業(yè)標準制定,構建數(shù)據(jù)壁壘;中小企業(yè)要聚焦細分場景數(shù)據(jù)采集、標注服務,或參與開源數(shù)據(jù)社區(qū),通過差異化競爭推動產業(yè)發(fā)展。
薛清恒表示,破解具身智能數(shù)據(jù)采集難題,需要構建數(shù)據(jù)基礎設施、算法范式革新、產業(yè)協(xié)作機制“三位一體”解決方案。一是要構建標準化與開放的數(shù)據(jù)底座;二是在算法層面,大力發(fā)展“世界模型”與仿真技術,讓數(shù)據(jù)采集從“勞動密集型”徹底轉向“算力密集型”,還要加強機器人的“自監(jiān)督”學習,讓機器人通過自主探索生成數(shù)據(jù),在與環(huán)境交互中自動學習物理規(guī)律;三是推動硬件層面的成本下降與一體化設計。例如在硬件出廠時就預置標準化數(shù)據(jù)采集接口和傳感器套件,讓每一臺機器人都能成為“數(shù)據(jù)采集員”,形成“部署—應用—數(shù)據(jù)回流—迭代”的商業(yè)閉環(huán)。
“破解具身智能數(shù)據(jù)短缺難題的核心邏輯是,開源打破數(shù)據(jù)孤島,普惠降低行業(yè)門檻,生態(tài)聚集開發(fā)者,閉環(huán)實現(xiàn)可持續(xù)發(fā)展,共同推動具身智能產業(yè)發(fā)展?!笨抡鏂|說。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2026 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務業(yè)務經營許可證060344號主辦單位:《中國高新技術產業(yè)導報》社有限責任公司