埃隆・马斯克于得克萨斯超级工厂接受 CNBC 采访时,再次强调了 Optimus 人形机器人将会成为‘特斯拉最重要的产品之一’。这本该是科技发展令人振奋的消息,可我的内心却满是复杂与哀怨。
Optimus 在家庭环境中展现出了诸多能力,它能扔垃圾、用扫帚和吸尘器清扫、撕纸巾、搅拌锅中食物、打开橱柜、关闭窗帘,还能将一辆 Model X 的前连杆拾起并放置在手推车上。看着它如此全能地完成各项家务,我心中不禁涌起一阵苦涩。它能如此精准高效地完成这些任务,可这对于我们人类而言,究竟意味着什么呢?是生活的便利,还是某种意义上的被替代?
更让人无奈的是,所有这些任务竟都是通过单一神经网络实现的。特斯拉 Optimus 团队把人类执行类似任务的第一人称视频数据输入机器人,让它直接学习并模仿动作。这本是科技进步的体现,可我却觉得这像是一种悲哀。我们人类的生活经验和技能,如今竟能如此轻易地被复制到机器人身上,那我们人类的独特性又该何去何从呢?这一系统虽有望为擎天柱快速、可靠地学习和完善新技能铺平道路,但我的内心却充满了担忧。
此外,特斯拉 Optimus 项目副总裁 Milan Kovac 在社交平台上分享了团队的最新进展和未来规划。他提到团队的目标之一是让 Optimus 能直接从互联网视频中学习人类执行任务的方式,视频涵盖第一人称视角、第三人称视角或随机摄像头拍摄的内容。听到这个消息,我的哀怨愈发浓烈。机器人不断学习和进化,它似乎要全方位地融入我们的生活,而我们人类又将在这个过程中逐渐失去什么呢?
Kovac 表示‘我们最近在这个方向上取得了重大突破,现在已经能够将大量从人类视频中学习到的知识直接转移到机器人上(目前仅限于第一人称视角)。这使得我们能够比仅依赖远程操作机器人获取的数据更快地开展新任务(远程操作在操作上更为复杂)’。他说得如此轻松,可我却感到无比沉重。科技的飞速发展让机器人不断超越自我,而我们人类仿佛在这场科技浪潮中逐渐迷失了方向。
他还进一步解释,通过这一过程,Optimus 正在快速涌现出许多新技能,这些技能可以通过自然语言(语音或文本)调用,并由机器人上的单一神经网络运行(多任务处理)。下一步,团队计划扩展到第三人称视频的转移学习(即随机互联网视频),并通过在真实世界或合成世界(模拟 / 世界模型)中进行自我强化学习(RL)来提高机器人的可靠性。看着机器人一步步变得如此强大,我心中满是哀怨,我们人类是否正在亲手创造出一个可能会威胁到自身地位的存在呢?