谷歌图像识别新进展:简单准确描述图像场景

315

谷歌研究院的科学家通过一篇博文向世人展示谷歌在图像识别领域的最新研究进展。也许,未来谷歌的图像识别引擎不仅可以识别出图片中有什么,而且可以给整个场景以简短而准确的描述。这一突破性进展来自机器语言翻译研究方面的研究成果:通过一种递归神经网络将一种语言的语句转换为向量表达,再通过第二个递归神经网络将向量表达转换为目标语言的语句。

谷歌用深度卷积神经网络取代上述的第一种递归神经网络,深度卷积神经网络可用于识别图像中的对象。通过该方法可以将图像中的对象转换为语句,描述图像中的场景。虽然这个概念很简单,但实现非常复杂,实验得到的语句的比较合理,但仍不够理想,此研究还处于早期阶段。下图就是一个通过这种方法识别图像中的对象,并得出简单描述的过程。

来源:cnBeta

当前文章:Search » 谷歌图像识别新进展:简单准确描述图像场景