Dutch ingenuity: A brainless soft robot running on aira year agohttps://arstechnica.com/science/2025/05/dutch-scientists-built-a-brainless-soft-...传统机器人依赖复杂控制系统或人工智能实现运动,常导致动作僵硬不自然。荷兰AMOLF研究所的科学家开发出仅靠气流驱动的无脑机器人,具备奔跑、越障和游泳能力。这一发现源于对气管在气压动力学作用下产生振荡的观察,由此产生了自维持的周期性运动。气管中观察到的运动模式反映了从单细胞生物到人类的自然生物运动规律。该研究与1996年奥运会使用的『飞行人偶』背后的物理学原理相通,展现了气流驱动运动的实际应用价值。
Lisping at JPLa year agohttps://flownet.com/gat/jpl-lisp.html从个人视角讲述的JPL实验室中Lisp语言的兴衰史。火星漫游车样本返回计划(MRSR)是重量近一吨、预算达数十亿美元的大型任务。1988年David Miller提出使用小型漫游车的革命性构想,由此诞生了小型机器人Tooth。Tooth和Robby均采用Lisp编程,Robby直接在车载系统运行Lisp,Tooth则使用定制版Lisp编译器。采用ALFA语言编程的Rocky系列漫游车最终发展为火星探路者任务的旅居者号,该任务改用C语言编程。1999年,基于Harlequin Common Lisp开发的远程代理软件曾短暂控制深空1号探测器两天。由于政治因素和实际困难(包括系统集成问题和管理层决策),Lisp最终在JPL被淘汰。作者试图在谷歌重新推广Lisp未果,最终选择重返JPL工作。作者批判了软件工程中可替换组件模式的弊端,以及Java等语言的垄断现象。JPL弃用Lisp的部分原因在于,其进程间通信所使用的C程序存在可靠性缺陷。
Humanoid Robots in Kickboxing Competitiona year agohttps://www.bbc.co.uk/news/videos/cgeg2x3lwepo两名人形机器人在中国杭州进行了一场跆拳道比赛该赛事是中国中央广播电视总台世界机器人大赛的组成部分参赛机器人由宇树科技研发活动包含格斗演示和正式对抗赛这是全球首场人形机器人格斗体育赛事
Tensegritya year agohttps://en.wikipedia.org/wiki/Tensegrity张拉整体是一种基于连续张力网络中孤立受压构件的结构原理。该术语由巴克敏斯特·富勒于1960年代创造,结合了'张力完整性'的概念。核心原理包括连续张力、间断压缩、预应力状态、自平衡、极简主义和可扩展性。应用领域涵盖建筑(如库利尔帕桥)、机器人(如NASA超级球机器人)和生物学(如人体生物张拉整体结构)。早期案例包括1951年的天塔和肯尼斯·斯内尔森的针塔(1968年)。数学上,张拉整体结构呈现拉胀响应和负泊松比特性。其起源存在争议,受到苏联构成主义和富勒网格球顶的双重影响。
Hugging Face unveils two new humanoid robotsa year agohttps://techcrunch.com/2025/05/29/hugging-face-unveils-two-new-humanoid-robots/Hugging Face发布了两款新型开源人形机器人:HopeJR和Reachy Mini。HopeJR是一款拥有66个自由度的全尺寸机器人,能够行走和移动手臂。Reachy Mini是一款桌面型设备,可以转动头部、说话、听声音并测试AI应用程序。预计这些机器人将在年底前开始发货,目前已开放预订。HopeJR的预估价格约为3000美元,而Reachy Mini的售价在250至300美元之间。这些机器人是开源的,用户可自行组装、重建并了解其工作原理。此次发布得益于Hugging Face于四月收购Pollen Robotics。Hugging Face持续拓展机器人领域,2024年推出LeRobot,2025年更新了SO-101机械臂。通过与Yaak合作,LeRobot的训练数据已扩展至包含自动驾驶机器信息。
Copper adds ROS2/Zenoh migration path to its deterministic Rust runtimea year agohttps://www.copper-robotics.com/whats-new/zenoh-and-ros2-support-landedCopper v0.8版本引入了全新的Zenoh与ROS2桥接器该桥接器支持从ROS2逐步迁移至Copper而无需全系统重构可优先将性能关键任务迁移至Copper,充分利用其确定性及Rust优先技术栈优势Copper能通过Zenoh发布ROS2兼容主题,无需ROS2构建或colcon工具链社区还发布了纯cu_zenoh_sink组件,实现超越ROS2的更广泛互操作性Zenoh作为通用桥接层,连接Copper与非Copper进程及混合语言架构特别感谢Zettascale的Julien Enoch对Zenoh开发的支持
Want a humanoid, open-source robot for just $3k? Hugging Face is on ita year agohttps://arstechnica.com/ai/2025/05/hugging-face-hopes-to-bring-a-humanoid-robot-...Hugging Face正进军机器人领域,推出两款新型机器人,其中包括名为HopeJR的人形机器人。HopeJR拥有66个驱动自由度,能够行走、操控物体,售价约为3000美元。该机器人采用开源设计,是与法国机器人公司The Robot Studio合作开发的产物。Hugging Face致力于降低机器人技术门槛,防止少数大型企业垄断该领域。
Oh Fuck! How Do People Feel about Robots That Leverage Profanitya year agohttps://arxiv.org/abs/2505.05831该研究探讨了机器人在出错场景中使用脏话以改善人类用户的社会感知。研究进行了三个阶段的探索性工作:两项基于在线视频的实验和一次现场概念验证部署。结果显示,言语承认错误是有益的,但非脏话回应与脏话回应之间几乎没有显著差异。在美国文化背景下,许多用户不介意机器人说脏话,甚至觉得这很亲切且幽默。这项研究为挑战典型规范的机器人角色设计提出了一个有前景的设计空间。
Autonomous drone defeats human champions in racing firsta year agohttps://www.tudelft.nl/en/2025/lr/autonomous-drone-from-tu-delft-defeats-human-c...代尔夫特理工大学的自主无人机在A2RL无人机锦标赛中获胜,击败了自主无人机和人类无人机竞速冠军。该无人机采用创新的深度神经网络实现高性能控制,在复杂赛道上达到了95.8公里/小时的时速。这是人工智能无人机首次在国际赛事中战胜人类飞行员,标志着物理AI领域的重大进展。该无人机仅依靠单个前视摄像头(类似人类FPV飞行员),这为AI感知系统增加了挑战性。AI系统直接控制无人机电机,通过强化学习优化性能,不断逼近物理极限。这项技术具有更广泛的应用前景,包括快递无人机、灾难救援和自动驾驶汽车等领域。
LeCabot, a $135 open-source alternative to Spot by BostonDynamicsa year agohttps://github.com/phospho-app/lecabotLeCabot是为SO-100机械臂和Go2机器狗设计的移动操控模组,通过phosphobot使用Meta Quest头显进行控制这是波士顿动力Spot机器人的开源低成本替代方案组件包括树莓派5、12V电池、SO-100支架及各类连接器组装步骤涵盖3D打印支架、钻孔、部件安装和扎带固定电源配置需通过转换器将12V电池连接至SO-100和树莓派在树莓派上安装phosphobot系统,并配置Meta Quest端的远程操作应用通过phosphobot控制面板连接Unitree Go2,即可使用Meta Quest启动远程操控
Scaling Laws in Autonomous Drivinga year agohttps://waymo.com/blog/2025/06/scaling-laws-in-autonomous-drivingWaymo的研究探索了自动驾驶中的缩放定律,与AI突破中的趋势相似。增加数据和计算资源可提升自动驾驶车辆性能,使自动驾驶和机器人技术受益。自动驾驶中的运动预测和规划遵循与训练计算量相关的幂律缩放,类似于大语言模型。数据规模和推理计算能力的提升对处理复杂驾驶场景至关重要。自动驾驶的闭环性能随训练数据和计算量增加而改善,表明其现实世界效益。研究发现可预测的缩放规律能增强自动驾驶安全性和行为识别能力。研究意义延伸至机器人规划任务,指导数据收集和模型训练策略。Waymo在多模态基础模型方面的工作影响着更广泛的AI研究,并带来职业发展机遇。
Amazon is reportedly training humanoid robots to deliver packagesa year agohttps://www.theverge.com/news/680258/amazon-training-package-delivery-humanoid-r...亚马逊正在为仿人机器人开发AI软件,用于包裹配送机器人将通过Rivian电动货车运输进行现实场景测试亚马逊正在旧金山建设'仿人机器人训练基地'该训练设施包含障碍赛道和用于训练的Rivian货车亚马逊计划实现机器人自主搭车完成包裹投递新成立的自主AI团队正研发多功能灵活机器人助手亚马逊正在测试Agility Robotics的'Digit'和Unitree价值1.6万美元的仿人机器人2020年收购Zoox彰显亚马逊推进配送全自动化的决心
Real-time action chunking with large modelsa year agohttps://www.pi.website/research/real_time_chunking机器人必须实时运行,这与聊天机器人或图像生成器不同,因为输入与输出之间的延迟会影响性能。视觉-语言-动作模型(VLA)虽前景广阔,但因模型庞大且依赖高性能GPU导致运行缓慢。动作分块(每次推理调用执行多个动作)能缓解问题,但可能导致分块间动作不连贯。初始模型(π0、π0-FAST、π0.5)采用同步执行机制,分块间的停顿会降低系统表现。实时分块技术(RTC)被开发用于实现无缝实时执行,消除动作断层。RTC将分块过渡视为图像修复问题,通过重叠动作确保连贯性。扩散模型和流模型天生擅长修复任务,使RTC无需调整训练即可生效。实验表明RTC能提升速度与精度,即使面对300毫秒的高延迟仍表现稳健。在人为增加延迟的测试中,RTC保持稳定性能,而同步方法显著退化。随着模型规模扩大,未来机器人系统需具备多层级实时推理能力以处理复杂任务。
GeneralistAI – Research Preview of Dextrous Bimanual Robotic Manipulationa year agohttps://generalistai.com/blog.html通用机器人公司正在使用端到端AI模型开发通用型机器人。这些模型经过训练,可在不同机器人和环境中执行灵巧的传感器运动策略。机器人由神经网络实时控制,传感器数据处理频率达100Hz。任务能力包括精细运动控制、空间定位精度和抗干扰稳定性。双机械臂协调可完成复杂动作,如拆解乐高积木结构。高频控制实现了动态行为,如空中抓取时的微调摆动。模型能在未见过的机械臂和新环境中实现策略迁移,无需预先数据。已展示的能力包括紧固件分类、纸盒折叠和螺丝装卸等任务。关闭纸盒等精密操作需要毫米级精度控制。该系统展现了在现实应用中实现自主灵巧操作的潜力。
Choosing Electric Motors for the Robot Arma year agohttps://robonine.com/choosing-electric-motors-for-the-robot-arm/文章讨论了机械臂电机的选型问题,重点分析了Viper X 300 S型机械臂的配置方案Trossen Robotics公司选用了DYNAMIXEL XM430-W350和XM540-W270伺服电机,其堵转扭矩分别为4牛米和10牛米9个伺服电机总成本达3,590美元,对于经济型机械臂而言价格偏高运动学计算表明:考虑到有效扭矩约为堵转扭矩的一半,基座关节需要8牛米扭矩的驱动装置对比了三种伺服驱动方案:步进电机(Nema 17、Nema 23)、PWM电机(Dsservo 160 kg*cm)和UART通讯电机(Feetech STS 3215-C01)电机选型的关键指标包括扭矩、精度、电流、电压、反馈功能、重量及成本发动机扭矩定义为力与力臂的乘积,是提升重载的关键参数机器人定位精度至关重要,其中重复定位精度和绝对精度是核心指标反馈系统包含霍尔传感器、旋转变压器、电位器、光学编码器和磁编码器用于位置检测,以及电流/温度传感器用于状态监控步进电机因体积大、重量高、扭矩及定位精度逊于伺服电机而不作为首选方案PWM电机缺乏反馈和精确定位功能,而UART电机虽精度更高但成本显著增加测试发现伺服电机存在回程间隙和过热问题,71°C为临界温度阈值
Gemini Robotics On-Device brings AI to local robotic devicesa year agohttps://deepmind.google/discover/blog/gemini-robotics-on-device-brings-ai-to-loc...Gemini Robotics On-Device被介绍为一款高效、设备端的机器人模型,具备通用灵巧性和快速任务适应能力。该模型独立于数据网络运行,适用于对延迟敏感的应用及网络不稳定或完全无连接的环境。开发者可使用Gemini Robotics SDK对该模型进行评估、测试,并通过少量演示快速适配新领域。Gemini Robotics On-Device专为双臂机器人优化,具有快速实验、强适应性和低延迟推理特性。该模型在视觉、语义和行为泛化方面表现卓越,能理解自然语言指令并执行灵巧任务(如拉开包链/叠衣服)。在复杂多步骤指令和挑战性任务中,其性能优于其他设备端替代方案。开发者仅需50-100次演示即可微调模型以获得更好性能。模型已适配不同机器人形态,包括Franka FR3双臂机器人和Apollo人形机器人。开发过程采用责任准则与安全措施,包含语义和物理安全评估。Gemini Robotics On-Device初期仅向精选的可信测试团队开放,用于收集反馈与安全评估。该模型及SDK旨在通过解决延迟和连接问题,加速机器人领域创新。
V-JEPA 2a year agohttps://ai.meta.com/vjepa/?_fb_noscript=1V-JEPA 2是当前最先进的视频世界模型,专为视觉理解和预测而训练它能在全新环境中实现零样本机器人控制,无需大量训练数据该模型在运动理解、视觉推理和基于上下文线索预判动作方面表现卓越V-JEPA 2采用两阶段训练:视觉数据的自监督学习与机器人数据的微调模型基于Droid数据集62小时的机器人数据训练,可执行伸手抓取、分拣放置等任务潜在应用包括家务机器人助手和可穿戴设备的实时危险预警系统Meta将开源V-JEPA 2供社区拓展,预计将在多领域催生创新应用场景
We accidentally solved robotics by watching 1M hours of YouTubea year agohttps://ksagar.bearblog.dev/vjepa/文章探讨了为何单纯扩大语言模型(LLM)规模无法解决机器人问题,因为机器人需要理解物理规律而不仅是语言。V-JEPA 2作为解决方案被提出,该模型通过100万小时YouTube视频训练来预测现实中的下一时刻动态,而非仅预测下一个单词。该模型采用10亿参数的ViT-g编码器理解物理场景,并通过预测器填补被遮蔽的视频片段。V-JEPA 2-AC版本进一步增加transformer模块,仅用62小时原始机器人视频就能预测动作结果。模型展现出零样本泛化能力,在不同物体和光照的新环境中仍保持高成功率,如抓取等任务。使用V-JEPA 2-AC进行规划比扩散模型快15倍(单次动作16秒 vs 4分钟)。当与语言模型结合时,该模型在视频问答任务表现优异,挑战了『理解世界必须依赖语言监督』的传统认知。局限性包括对摄像头位置敏感、长时规划存在偏差、需视觉目标而非语言指令等。未来可能发展出与现实世界 grounding 能力媲美文本模型的世界模型,以及像ChatGPT理解语言那样精通物理规律的机器人。
China hosts first autonomous AI robot football matcha year agohttps://www.theguardian.com/technology/2025/jun/30/china-hosts-first-fully-auton...在北京举行的3对3人形机器人足球赛中,四支由人工智能驱动的队伍展开了较量。这些机器人在踢球和保持平衡等基本足球技能上表现笨拙,经常摔倒。博斯特机器人公司CEO程浩表示,体育竞赛是测试人形机器人的理想场景。未来或可实现人类与机器人足球对抗,但安全是首要考量。清华大学的THU机器人队以5-3战胜中国农业大学的山海队,夺得冠军。
Robotic tongue drummer bangs out all the ambient hitsa year agohttps://blog.arduino.cc/2025/06/07/this-robotic-tongue-drummer-bangs-out-all-the...舌鼓是一种传统上由丙烷气罐制成的打击乐器,通过敲击可发出特定音高的音符。杰里米·库克建造了一个机器人,利用电磁铁敲击小型舌鼓的八个簧片进行演奏。机器人框架采用激光切割的中密度纤维板制成,以PVC管作为垂直支撑,电磁铁安装在可调节的摩擦臂上。通过Arduino Opta Lite微型PLC控制电磁铁,配合固态继电器扩展模块,每个电磁铁可处理24V直流电压和2A电流。该机器人配备MIDI输入接口,可实时手动控制或演奏预设乐曲,兼容库克设计的I2C和串行适配器。这款机器人舌鼓手曾在奥兰多创客博览会上展出,观众可亲身体验其演奏效果。