在此工作期间,高明飞曾担任加州帕洛阿尔托市 Salesforce Research 的高级研究科学家。她拥学系的博士学位。她的研究兴趣包括 3D 场景理解、物体检测、视觉与语言、动作识别、弱/自监督学习以及多模态学习。高明飞目前是加州桑尼维尔市苹果公司的高级应用科学家。
Donald Rose 是 Salesforce AI Research 的技术作家。他拥有加州大学欧文分校信息与计算机科学博士学位。Rose 博士专注于技术内容创作和编辑,参与过多个项目,包括博客文章、视频脚本、新闻通讯、媒体/公关材料、社交媒体和写作研讨会。他热衷于帮助研究人员将他们的研究成果转化为面向更广泛受众的出版物,利用多种媒体模式整合现有内容,以及撰写有关 AI 的评论文章。
词汇表
注释:分配给数据的简短描述(例如,概念名称)。(例如,将“狗”一词分配给狗的图像。)AI 模型在训练过 手机号数据库列表 程中使用带注释的数据,学习如何在面对新数据时识别类似的模式。标签的另一个术语。
边界框:围绕目标物体的紧密且精确的框;在图像中绘制的用于捕捉目标概念的框。它限制(包围)目标概念(物体)。边界框可以是 AI 模型尝试学习该概念时用于训练的输入数据,也可以是 AI 模型做出的输出预测。
边界框标签/注释:为边界框创建并分配的标签(通常由人创建)。
真实边界框:在用于训练和测试的数据上手动标记的边界框;因此,它被认为是最佳正确(真实)的框,以完美或近乎完美的精度限制(包围)目标概念(对象)。
标签:注释的另一个术语(参见“注释”定义)。
定位:给定一张图像和该图像中一个物体的名称,视觉语言模型可以定位物体的位置,而无需任何额外的监督。
开放词汇对象检测或开放词汇检测 (OVD):就其最终实现而言,可以说这是人工智能对象检测的“圣杯”:能够在现实世界图像(测试数据)中检测新对象时超越有限的对象类别(训练期间学习到的)。真正通用的对象检测器应该是完全开放的,能够识别任何图像中的任何对象(并正确分配任何标签),这与大多数当前系统不同,它们是“封闭的”(检测对象类型有限)。