• 新闻
  • 2021-06-24
  • OPPO在国际人工智能会议CVPR 2021获多项佳绩,
    自研算法首次赋能智慧工厂

    OPPO在CVPR 2021竞赛中刷新获奖记录,共获一项第一,六项第二,四项第三
    从计算智能到人本智能 OPPO AI正在向更“懂”人,更前沿的方向探索

    2021年6月24日,中国,深圳 —— 一年一度的全球计算机视觉顶级会议CVPR(Conference on Computer Vision and Pattern Recognition国际计算机视觉与模式识别会议)落下帷幕,OPPO在六大赛道共十一项赛项中取得一项第一,六项第二,四项第三的优异成绩,再次展示了强劲的AI创新实力。

    多目标行为分析赛道

    值得一提的是,OPPO在多目标行为分析(Multi-Agent Behavior)赛道中收获颇丰,其所应用的AI算法能基于特征点信息准确判别、预测动物及人在复杂交互内容下的行为。OPPO凭借着先进的AI算法能力,从全球240多个顶尖参赛团队中脱颖而出,获得子赛项少样本行为分类任务(Learning New Behavior)第一,及传统分类(Classical Classification)与标注风格迁移任务(Annotation Style Transfer)赛项的第二与第三名。目前,这项技术正在OPPO智慧工厂发挥着保护作用,工人们在这套算法的辅助下,可以避免关键生产环节的错漏错放,令自身和产线更安全。

    OPPO的先进算法在OPPO智慧工厂中发挥着保护作用

    本次参加CVPR 2021竞赛的团队来自OPPO智能感知与交互研究部,先后在多目标行为分析、足球行为分析、长视频理解、时空行为检测、跨模态分析及人机交互识别六大赛道上取得优异的成绩。他们通过对算法的优化、训练,不断强化OPPO 的AI能力,让AI更好地为人类服务。

    OPPO 智能感知首席科学家郭彦东表示:“非常高兴OPPO智能感知与交互研究部继CVPR 2020的首次亮相后,再度取得佳绩。去年我们夺得第一名的“极端超级分辨率感知”技术,将模糊的照片“算”得更清晰,而此次获奖的多目标行为分析、时空行为检测、基于多张2D图片的3D人脸重建等技术,涉及行为识别、时空动作定位、人脸识别等更复杂、前沿的领域,能够在智能制造、智慧家居、智能美颜等应用场景发挥重要作用。我们希望通过不断的努力,让AI能够真正地为人所用,为我们带来更智能更便捷的生活。”

    从计算智能到人本智能,OPPO让AI更“懂”人
    秉持着“科技为人 以善天下”的企业使命,OPPO正在围绕“以人为本”不断构建自身AI能力。在基于多张2D图片的3D人脸重建(3D Face Reconstruction From Multiple 2D Images)挑战赛中,OPPO自研的AI算法所还原的三维人脸模型与真实人脸误差仅为1.5mm-1.6mm,在主要指标成绩排名中取得第二名。该算法克服了在实际生活中,特别是动态视频拍摄时,因为动作导致的人脸五官点不明晰、表情夸张、甚至图片数据失真等问题,

    事实上,OPPO自研的人脸检测算法已能够识别635个人脸特征关键点,并实现30次/秒的高速运行。在不久前发布的OPPO Reno6上,依托于该算法架构的AI焕采人像视频技术为用户轻松打造了动态的自然美妆效果。这项技术将推动人像视频技术“升维”进化,以3D级的特征点识别、令“上妆”效果更服帖;也将在社交平台上制作出更丰富更贴合的AR特效,让用户在日常生活中享受到技术带来的美好瞬间。

    基于多张2D图片的3D人脸重建赛道

    让AI理解我们所处的时间和空间
    目前,OPPO的AI能力已发展到可以识别人在时空环境中的行为状态。在足球行为分析(SoccerNet)赛道中,OPPO取得动作定位(Action Spotting)和回放定位(Replay Grounding)两个赛项第二名。这项挑战需要在一段足球比赛视频中辨别出十几种关键动作,包括越位、红牌这类基础规则复杂,动作幅度小,人类都很难识别的行为。同时AI算法还需要排除摄影机位不同等干扰因素,准确定位回放片段在原始比赛视频中发生的时间点。不久的将来,这项技术将为体育爱好者们带来福利,在比赛后AI可以实时整理精彩集锦。在该技术的帮助下,手机相册也可以自动制作类似“精彩一周”的视频集锦,让用户可以随时回顾自己生活中的美好瞬间。

    足球行为分析赛道

    在跨模态行为分析(MMact)赛道上,OPPO分别在行为识别(Cross-Modal Action Recognition)与行为定位(Cross-Model Action Temporal Localization)两个子赛项中取得第二名。OPPO强大的AI算法仅通过视觉信息便可准确识别一段视频中人物在特定空间内发生的交谈、屈膝、走动等十余种动作。该技术未来有望广泛应用在家居场景,为家中老人、小孩、宠物带来更贴心的照料。即使父母不在身边,AI也可以在宝宝下意识做出危险性动作的时候,及时提醒父母,避免宝宝受到伤害。

    此外,OPPO还在时空行为定位(AVA-Kinetics)赛道获得第三名。AVA数据集作为行业内第一个开辟时空行为检测的数据集,使用该数据集的定位赛项历来是人工智能的热门赛道之一,每年不乏来自谷歌、脸书、商汤等国际顶尖科技公司与院校的知名团队参与其中。时空行为定位算法不仅可以准确识别视频中人们的行为,还可以同步定位其所处的时间段和空间范围。这也意味着,OPPO的AI技术不仅能理解你在做什么,还可以在时空中“找到”你。

    OPPO正在向更高维度的AI技术探索
    本次CVPR上,OPPO首次在学术界更为前沿的赛道取得了突破。在长视频理解(LOVEU)挑战中,OPPO的泛化性AI算法在通用事件检测(无限制)及通用事件检测 (仅可用kinetics-GEBD 数据训练) 两大赛项中均获得第三名。该赛道需要AI在预先没有特定分类标准的情况下,自行理解视频的意义并分割出其边界的时间段落。因此,对算法的泛化性提出了极大挑战,AI需要像人一样思考,理解视频中人类动作、颜色、物品、乃至光源的变化,并对变化点进行判断。未来,这项技术可以广泛应用在视频领域,作为AI处理视频的基础工序,为后续包括人脸识别、行为识别等AI任务的选择和执行奠定基础。

    一系列成绩取得的背后,都离不开持之以恒的积淀。2020年,OPPO研究院正式成立智能感知与交互研究部,主要关注语音语义、计算机视觉等领域,屡次获得国内外权威竞赛的奖项肯定,并实现了应用落地。OPPO在CVPR 2020极端超分辨率感知赛项第一名和手持设备视觉定位挑战第三名;在2020年国际模式识别大会(ICPR 2020)中,OPPO自研人脸检测算法获得第二名。截至2021年3月31日,OPPO在AI领域的全球专利申请超过2450件,主要布局在计算机视觉、语音技术、自然语言处理、机器学习等方面。

    在不断提升自身实力的同时,OPPO也正积极创建开放生态,让AI技术赋能更多前沿应用领域。OPPO 先进的人脸识别算法在2021年2月上线OPPO开放平台与OPPO快应用4.0引擎,供开发者免费调用,孵化多款AR表情小游戏;今年5月,在强大AI底层能力的支持下,OPPO CybeReal全时空间计算AR应用再度升级,让AR内容的创作更简单、更即时,希望尽早将更沉浸的AR体验带到每个人的身边。