谷歌意图让机器识别视频中人行为

机器视觉是一项综合技术，包括图像处理、机械工程技术、控制、电光源照明、光学成像、传感器、模拟与数字视频技术、计算机软硬件技术(图像增强和分析算法、图像卡、 I/O卡等)。

　　谷歌在机器视觉学习方面积累大量的数据以及技术，最近，他们推出了一个新的视频数据库，名称为“原子视觉行为(AVA)“，该数据可由一个或多个标签组成，能够推动计算机视觉识别影像中行为的研究。

　　说到图像识别，其实谷歌的照片应用就可以自动识别出宠物图像，很多公司也在图片识别上作出很多优化尝试，比如Shutterstock上周公布了一项全新的测试功能，用户可以根据自己的布局来搜索股票照片。

　　相较于这些发生在静态图像领域的机器视觉识别技术，应用到视频中的难度会更大，因为在视频中，每一帧画面的都包括各种复杂的场景，而且很多时候视频中一个动作是由不同的人发出的。不过视频识别方面的应用现在也有一些案例，比如著名色情网站Pornhub，它可以自动对成人视频进行分类，包括让系统识别出特定的性姿势。

　　谷歌的软件工程师也解释道， “让机器去识别影像中的人类行为是发展计算机视觉的一大难题，尽管过去几年在图像分类和寻找物体方面取得了突破。”所以谷歌推出了这个AVA数据库，AVA包括80多个被动作标签标注的Youtube视频网址，比如握手、接吻、喝酒、拥抱等等。

　　谷歌希望通过开放这个数据库，进一步改进他们基于视频识别的机器视觉能力。

来源：镁客网

谷歌意图让机器识别视频中人行为

赵辛

Leave a Comment Cancel Reply

登录

注册

《公共安全视频图像信息联网共享应用标准体系（2017版）》发布

湖南湘西机场总体规划通过评审

赵辛

Related posts

斥资120亿美元！印度将进一步升级机场基础设施

昆明机场组织开展2023年应对非法干扰暨反恐防恐应急处置演练

221家货代入选商务部“中国国际货代行业重点联系企业名单2019”

Leave a Comment Cancel Reply