首页 >> 科技 >

UC伯克利等团队推出高效动作Tokenizer「FAST」,训练效率跃升五倍

2025-01-22 22:15:02 来源:网易 用户:刘振琦 

研究者近期提出了FAST,这是一种专为VLA模型设计的动作Tokenizer,结合了离散余弦变换(DCT)和字节对编码(BPE),显著缩短了训练时间,并提升了复杂任务的学习和执行效率,为机器人自回归Transformer训练带来了重要突破。FAST通过DCT压缩原始动作块,结合BPE进行编码,实现了动作的高效Tokenization,提高了从大规模数据预训练的迁移能力,并增强了机器人执行语言指令的能力。实验结果显示,FAST与π0 VLA结合,在1万小时的机器人数据上训练,效果与最先进的扩散VLA相当,但训练时间缩短了最多五倍。此外,研究者还发布了通用的机器人动作Tokenizer FAST+,能高效地标记各种机器人动作序列,并在DROID数据集上训练出通用策略,实现了新环境中对多种指令的泛化执行。

尽管FAST在训练效率上取得了显著进步,但当前的模型在推理速度上仍存在不足。未来,研究者计划借鉴LLM中加速离散自回归Transformer模型推理的技术,以提高VLA的推理速度。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章
版权与免责声明:
①凡本网注明"来源:智车网"的所有作品,均由本网编辑搜集整理,并加入大量个人点评、观点、配图等内容,版权均属于智车网,未经本网许可,禁止转载,违反者本网将追究相关法律责任。
②本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
③如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,我们将在您联系我们之后24小时内予以删除,否则视为放弃相关权利。
滚动资讯