欢迎来车东西
登录
免费注册
我的订阅
关注我们
智东西
车东西
芯东西
智猩猩
国产模型新SOTA:IDEA研究院升级开集检测模型
智东西5月24日消息,近日,IDEA研究院CVR团队推出全新升级版开集检测模型Grounding DINO 1.5,实现了当前开集目标检测的最先进水平(SOTA),在图像和文本的语义理解上表现出色,能够快速、准确地根据语言提示检测和识别图像中的目标对象。模型分为Pro和Edge两个版本,Pro版本在大规模数据集构建和高精度需求场景中表现卓越;Edge版实现了端侧可部署,可赋能具身智能、自动驾驶等新型应用场景,运行速度有望提升至20到30FPS。
该团队去年在GitHub上推出了广受关注的开集检测模型Grounding DINO和能检测、分割一切的Grounded SAM。这些开源模型被国内外很多团队用于各类视觉及多模态应用中。Grounding DINO 1.5在其前身 Grounding DINO的基础上,通过结合更大的视觉backbone扩大模型尺寸,并使用超过2000万的Grounding数据获得了丰富的语料,大幅提升了检测精度和速度,且通过Pro和Edge版本分别针对不同应用场景进行了优化。
论文链接:https://arxiv.org/abs/2405.10300
技术博客:https://www.deepdataspace.com/blog/Grounding-DINO-1.5-Pro
Playground链接:https://deepdataspace.com/playground/grounding_dino
Grounding DINO 1.5 API:https://deepdataspace.com/request_api?from=banner_dino1.5_pro
IDEA研究院