国产模型新SOTA：IDEA研究院升级开集检测模型

智东西5月24日消息，近日，IDEA研究院CVR团队推出全新升级版开集检测模型Grounding DINO 1.5，实现了当前开集目标检测的最先进水平（SOTA），在图像和文本的语义理解上表现出色，能够快速、准确地根据语言提示检测和识别图像中的目标对象。模型分为Pro和Edge两个版本，Pro版本在大规模数据集构建和高精度需求场景中表现卓越；Edge版实现了端侧可部署，可赋能具身智能、自动驾驶等新型应用场景，运行速度有望提升至20到30FPS。

该团队去年在GitHub上推出了广受关注的开集检测模型Grounding DINO和能检测、分割一切的Grounded SAM。这些开源模型被国内外很多团队用于各类视觉及多模态应用中。Grounding DINO 1.5在其前身 Grounding DINO的基础上，通过结合更大的视觉backbone扩大模型尺寸，并使用超过2000万的Grounding数据获得了丰富的语料，大幅提升了检测精度和速度，且通过Pro和Edge版本分别针对不同应用场景进行了优化。

论文链接：https://arxiv.org/abs/2405.10300

技术博客：https://www.deepdataspace.com/blog/Grounding-DINO-1.5-Pro

Playground链接：https://deepdataspace.com/playground/grounding_dino

Grounding DINO 1.5 API：https://deepdataspace.com/request_api?from=banner_dino1.5_pro