设为首页 加入收藏

TOP

谷歌新研究项目曝光:用文字自动说明复杂图像
2014-11-23 23:45:41 来源: 作者: 【 】 浏览:5
Tags:谷歌新 研究项目 曝光 文字 自动 说明 复杂 图像

图像识别技术在过去短短几年内取得了很大进步,进步速度可能超过了其他任何一个领域,而谷歌已经让最终用户体验到了这种进步。例如,若想了解我们取得了多大的进步,只要在Google Photos上面 搜索 你自己的照片即可。但是,识别物体(以及基本的场景)却还只是迈出了第一步。


ilsvrc2012_val_00021791 今年9月份,谷歌对外 演示 了它的新技术,这项技术利用当前深受欢迎的 深度学习 方法,不仅可以识别单一物体的图像,而且还能对一张照片中的不同物体进行分类(例如,果篮中不同类型的水果)。


一旦你能做到这一点,你还可以用自然语言对图像做出完整描述,这正是谷歌当前正在做的 事情 。根据谷歌研究院(Google Research)的一份最新文件,该公司现已开发了一套具有“自学”能力的新系统,可以极为精确地描述像下面这样的图像。


正如谷歌研究人员所指出的,解决这一问题的常见方法是,首先运用计算机视觉算法进行计算,然后用自然语言处理方法来进行描述。这听上去合情合理,但谷歌研究人员却认为,更好的解决办法是,“将最新的计算机视觉和语言模式整合到一个联合训练的系统中,然后提取照片,直接生成人类读得懂的单词序列进行描述。”谷歌表示,在将两个 递归神经网络 整合以后,这种方法在机器翻译中 效果非常好 。这种自动描述系统(captioning system)的工作机制略有不同,但基本上都采用相同的方法。


2014-11-18_0828 (1)


这并不意味着谷歌的方法是完美的。根据数据集的不同,谷歌电脑字幕系统在 BLEU测试 (这种测试手段往往被用于对机器翻译质量和人类翻译质量进行比较)中的得分一般介于27分到59分之间。人类的得分往往在69分左右。尽管如此,相比其他得分不超过25分的方法,谷歌的自动描述系统仍然向前迈出了一大步。


翻译:皓岳


New Google Research Project Can Auto-Caption Complex Images


】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到: 
上一篇 山羊模拟器推出《魔兽世界》风.. 下一篇 Android Auto 为开发者启动了引..

评论

帐  号: 密码: (新用户注册)
验 证 码:
表  情:
内  容: