机器人数据采集:从数采场到真实世界,普通人成“数据工人”,新问题待解 📅 2026/6/26 12:45:11 做数采的年轻人在北京五道口的一栋大楼里全副武装的张磊化名正参加机器人采集数据的试岗培训将桌上羽毛球放进球筒。他头戴有两个摄像头的黑色头盔手腕绑摄像机腰缠数据线手套布满传感器。他得用慢动作且无多余动作手不出汗因手套价值5万元损坏赔不起。大学毕业两年这是张磊第四份数采工作。前三份是真机遥操第四份公司用自研可穿戴设备采集数据。过去两三年具身智能升温但缺数据成瓶颈觅蜂科技姚卯青称具身智能模型达类人初步能力需一亿小时量级数据而全球有效数据仅约几十万小时。张磊2024年开始数采此前卖房经亲戚介绍转行。那年国内人形机器人创业热融资56起超50亿元。他第一份工作在小初创企业后辗转千寻、松灵。他热衷加班夜班月入最多9000多元想赚快钱攒钱买房。他不愁被机器人取代愁工作枯燥。00后李子豪是大型数采场实习采集员即将从河北二本师范院校人工智能专业毕业。高考本想报土木工程经老师建议读人工智能。毕业后同学就业不一他采集机器人夹三明治数据工作重复。大型数采场的科幻与现实张磊入行时数采是机器人公司自己的事小规模、自用型。到李子豪入行数采成基础设施生意走向大型数采场。2025年以来各地政府和国资支持建设全国至少15座京津冀等地均有。大型数采场占地3000 - 5000平方米有些达上万平方米部署上百台机器人。北京人形机器人创新中心具身智能机器人数据采集与训练基地是全国领先数采场一年产能最高达十几万小时数据按小时或条数出售客户是头部企业和大模型公司。这类数采场创造新岗位但部分不高效。投入超亿元未盈利设备和软件问题多数据生产链条原始。走出数采场此前多采用有机器人本体的数据采集方式。2024年前后学术界探索UMI、Ego等无本体采集方式2025年下半年产业界升温。张磊最新工作属无本体采集见证技术路线变迁。过去VLA模型依赖真机数据产能有限。英伟达范麟熙提出用WAM取代VLA用UMI和Ego数据取代真机数据但无本体采集短期内难完全替代真机遥操。一副手套背后的新生意2025年90后林成志接美国公司需求生产穿戴式数采设备。他此前在大疆等工作后自主创业。完成委托后自己做数采业务用数据手套和有深度图功能的头显。张磊试岗公司的设备融合多种技术两副手套近10万元设备不成熟。行业头部公司和资本入场觅蜂科技推出设备并融资。灏存科技创始人熊鹏航称2026年一季度订单增多。如何让更多人接纳新型数采林成志组织工厂采集数据给工人设备和补贴但工厂配合不易。他还鼓励工人居家采集。觅蜂科技采用加盟方式京东发动大规模数据采集行动。劳务中介变得重要能对接工厂资源。张磊试岗培训的数采员由中介招募中介抽成。Tina发现数据采集市场大想与觅蜂科技合作。被机器人采集的人数据采集全民化招聘多是兼职或临时工。但完成任务拿报酬不易有诸多要求。面试注重身体细节培训也有要求有人中途退出。数采员采集数据卖给机器人公司赚取日薪。数据采集全民化带来隐私、权属等新问题。在机器人走进生活前人类要为其提供数据。