澎思科技申省梅:后深度学习时代的智能视觉技术落地|ccf-gair 2019
发表时间:2019-10-07 10:43:37 作者:雕刻机

7月12日-7月14日,2019第四届全球人工智能与机器人峰会(ccf-gair 2019)于深圳正式召开。峰会由中国计算机学会(ccf)主办,雷锋网、香港中文大学(深圳)承办,深圳市人工智能与机器人研究院协办,得到了深圳市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流博览盛会,旨在打造国内人工智能领域极具实力的跨界交流合作平台。

7月14日下午,在「智慧城市·视觉智能」专场上,澎思科技首席科学家、新加坡研究院院长申省梅进行了题为「后深度学习时代的智能视觉技术落地」的演讲。

作为人工智能领域崭露头角的公司,申省梅介绍道,澎思科技从传感器-图像处理到3d几何,从机器学习到深度学习、增强学习,从监督学习到半监督、无监督学习都有布局,澎思拥有计算机视觉全栈技术,并在人脸识别、行人检测,目标跟踪、行人再识别、车辆异常行为检测、自动驾驶、移动操作机器人等多项大赛中拿到冠军。

在限制条件下的人脸识别已经取得了很好的成绩,但对于如何提高非受限条件下的动态人脸识别效率,申省梅认为除了在人脸识别技术上不断提高外,还要从源端着手,以及采用图像增强的方法,比如超分辨,去除运动模糊、降噪、去抖动、去雾、去雨、去雪等。

另外,在视觉的落地上,申省梅认为应该坚持“以商业价值为导向的算法开发”。用“最有效的算法+最经济的软硬体”解决客户的刚需,更重要的是,算法-软硬件变动更新速度,要快速对接客户的不同需求,形成敏捷而有价值的运营模式。

获得最佳视觉模型最简单的规则是,足够多的平衡数据、足够好的数据标注、足够深的网络。

随着大量数据的生成,半监督无监督的探讨有所突破,计算机视觉的未来发展十分乐观。

随着工业界对计算机视觉的持续青睐,众多企业将结合实际应用场景来剪枝优化迁移,不断开拓新的应用领域,人工智能行业的发展还远没有到巅峰,还有众多的落地机会。

澎思科技申省梅:后深度学习时代的智能视觉技术落地|ccf-gair 2019

澎思科技首席科学家申省梅

以下是申省梅大会现场全部演讲内容,雷锋网作了不改变原意的整理及编辑:

大家好,我是澎思科技的申省梅,我今天跟大家分享的是课题是“后深度学习时代的智能视觉技术落地——商业价值为导向的技术研发”。

澎思科技申省梅:后深度学习时代的智能视觉技术落地|ccf-gair 2019

今天的内容分为三个部分,第一部分是计算机视觉澎思科技的全栈技术;第二,有这样的技术之后,商业价值在哪里?我们要讲的是以商业价值为导向的算法开发。第三部分,分享一下人工智能行业的发展前瞻。

澎思科技申省梅:后深度学习时代的智能视觉技术落地|ccf-gair 2019

计算机视觉澎思科技的全栈技术

澎思的计算机视觉全栈技术包含两个方面,首先是澎思有一支全球顶尖的算法团队,有国际前沿的算法研发能力。计算机视觉包含了对周围世界的描述-几何学,和计算机模仿大脑对看到的世界的学习建模。以前的学习是机器学习,现在深度学习逐步代替了机器学习,并且我们也看到了很多几何学方面出现的问题和局限,大家用深度学习把它解决得很好。我们从传感器(包括普通相机、高清相机、tof 传感器,imaging lidar),我们从它的底层的研究、图像的处理到3d融合、3d重建,从机器学习到深度学习,从深度学习到强化学习,从监督学习到半监督、无监督学习,横跨了所有的计算机视觉领域。

澎思科技申省梅:后深度学习时代的智能视觉技术落地|ccf-gair 2019

另一方面,我们团队也参与了很多产品、解决方案的研发,拥有丰富的经验。

澎思科技申省梅:后深度学习时代的智能视觉技术落地|ccf-gair 2019

这里跟大家分享一下我们在计算机视觉领域展现的成果。我们曾参加过多项国际比赛,并拿到冠军,包括人脸方面的,如人脸识别。目标检测、图像分类、图像分割方面的奖项,也包括情感、目标跟踪,及智能交通方面,还有机器人、自动驾驶方面的比赛。去年我们在iros的操作机器人当中拿到冠军,还有neurips里面的自动驾驶也拿到了冠军,这个自动驾驶牵涉的技术面是非常广的,有机器视觉,还有导航、控制。刚才大家提到了很多机器人跟别的学科的不同,就是因为它不仅仅是看到了、理解了,还要做决策,做决策的过程实际上是一个交互的过程。

澎思科技申省梅:后深度学习时代的智能视觉技术落地|ccf-gair 2019