欢迎来车东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智猩猩
美团浙大等发布移动端视觉语言助手MobileVLM
2024-01-03
arXiv
9
智东西1月3日消息,来自美团、浙大、大连理工的团队推出一款专为移动设备设计的视觉语言助手MobileVLM,相关论文于12月30日发表于arXiv平台。据介绍,这是一种专门针对移动设备运行的多模态视觉语言模型,是无数面向移动的架构设计和技术的融合,其中包括一组从头开始训练的1.4B和2.7B参数规模的语言模型。根据几个典型的VLM基准评估,MobileVLM表现出了与一些更大的模型同等的性能。团队测量了 高通骁龙888 CPU和英伟达Jeston Orin GPU上的推理速度,分别获得了每秒21.5个Token和65.3个Token的最先进性能。
论文地址:arxiv.org/pdf/2312.16886
美团