能够识别图片中的物体的智能工具

QQ图片20150521093446.png

人工智能研究最有趣的领域之一就是计算机视觉（computer vision），从无人驾驶汽车内部构件到机器猜年龄，计算机视觉系统软件拥有着很大的开发潜能。

近期，计算机科学家史蒂芬·沃尔夫勒姆（Stephen Wolfram）发布了一种新工具，名叫“沃尔夫勒姆图片识别项目”（ Wolfram Image Identification Project）。用户借助这项工具首先需要上传或者链接到一张图片，然后就可以看到计算机如何来识别图片中物体。

沃尔夫勒姆是这样描述他的工具的：跟很多计算机视觉项目不同，沃尔夫勒姆项目围绕一种“人工神经网络”而建立。人工神经网络实际上是一种软件框架，它的设计灵感来自能够进行图片识别的生物大脑。沃尔夫勒姆构造的“人工神经网络”是可以通过数千万标签图片“训练”出来的。

“我们不需要用老方法来描述一个物体，比如椅子。我们所做的一切就是提供很多类型的椅子。你也可以这么说，‘任何跟我们想将其定义为椅子的物体’。这样，我们就会把那些跟我们所定义的‘椅子’很接近图片贴上‘椅子’标签，其他则排除在外。”沃尔夫勒姆表示。

Business Insider网站通过测试发现，在多数情况下，这款图片识别器能够至少抓住图片中的“关键点”。比如，它能够将希拉里·克林顿和玛丽莎·梅耶尔准确地归类为“人”，不过它无法识别按名字来识别出他们。它能够将Paris cafe Le Comptoir归类为“一座建筑”。

不过，在某些情况下，沃尔夫勒姆识别工具会完全忽略掉图片中的人，将焦点集中于某些没有生命的物体上。比如，在拳王格罗夫金（Gennady Golovkin）一张拳击比赛图片中，这项算法锁定在了拳击手套上，并提供了有关这双拳击手套的其他信息，比如重量和材质。

在另一张肯德基宣传广告图片中，该算法忽视掉了里面的主人公，只是将焦点放在了主人公身旁的汽车，并将其识别为“交通”。

对于三星手机，这项工具将其识别为“远程控制”，跟上面提到的拳击手套一样，系统还提供一些文字介绍。

在这张特斯拉汽车图片中，系统注意到了汽车前面站立的人（特斯拉CEO马斯克），但是它将马斯克身后的汽车归类为“两门”小轿车，而不是四门汽车。

在另一张视频游戏Doom4截图中，系统将图片中的士兵竟然识别为一只“蜘蛛”，并在下面提供有关这类蜘蛛的名称和最大年龄信息。

智能界（www.znjchina.com）是中国首家专注于报道智能科技前沿的综合垂直门户，秉承“引领未来智能生活”的理念，持续关注智能家居、可穿戴设备、智能医疗、机器人、3D打印、智驾等诸多科技前沿领域，提供最前沿、最时尚、最实用、最专业的硬件产品介绍、硬件评测、服务定制、最新资讯、圈子交流等服务，致力于成为最具价值的智能科技信息互动平台。

智能界【微信公众号ID：znjchina】【新浪/腾讯微博：@智能界】

QQ图片20150410113851.jpg

能够识别图片中的物体的智能工具

业界·智界科技9年前

零氪科技成立医疗智能科技公司入驻

雷军旗下金山云融资3亿美元全面降

全民4K时代来临明基BenQ星辰W1700

星辰4K 璀璨如真明基发布W1700家用

幸福感提升双12小米生态链推出多款

能够识别图片中的物体的智能工具

业界·智界科技9年前

零氪科技成立医疗智能科技公司 入驻

雷军旗下金山云融资3亿美元 全面降

全民4K时代来临 明基BenQ星辰W1700

星辰4K 璀璨如真 明基发布W1700家用

幸福感提升 双12小米生态链推出多款

零氪科技成立医疗智能科技公司入驻

雷军旗下金山云融资3亿美元全面降

全民4K时代来临明基BenQ星辰W1700

星辰4K 璀璨如真明基发布W1700家用

幸福感提升双12小米生态链推出多款