Facebook 团队宣布对其用于描述发布在平台上的照片的 AI 进行重大改进,该技术专为视障用户设计。
该系统由 Facebook 于 2016 年设计,经过改进以提供更快、更准确的动态。 但它的最新更新更进了一步,因为它可以提供更详细的照片描述。
Facebook 改进其人工智能以帮助视障用户
对于 Facebook 上发布的每张图片,人工智能都会自动生成一个字幕,试图描述场景。 Facebook 不希望这个项目只描述图像的单个元素,而是要传达整个场景,以便用户可以理解上下文并欣赏帖子。
这个新版本的 AI 中存在的一个目标,已经可以识别更多元素并提供更详细的场景描述。 它不仅可以区分是人还是动物,还可以识别不同类型的活动、地点,甚至元素的位置。
例如,在上图中,人工智能能够识别出有 5 个戴帽子和打鼓的人。 但不仅如此,它还可以描述场景是如何设置的以及哪些元素是重要的。 正如您在照片中看到的那样,所有信息都按照可以理解整个场景上下文的方式进行分类。
所有这些信息都将帮助视障人士了解他们的朋友在他们的照片中分享了什么。 当然,他们可能不希望获得出现在其供稿中的每张照片的信息,因此 Facebook 将允许他们选择何时接收更详细的描述。