近日,国际人工智能顶会CVPR 2024举办的第6届自然场景情感行为分析挑战赛(6th Workshop and Competition on Affective Behavior Analysis in-the-wild,简称ABAW)公布比赛结果,天翼云AI团队(CtyunAI)在情感识别任务中表现出色,斩获双赛道亚军、单个赛道季军,并受邀在CVPR ABAW研讨会上作论文分享。这是继天翼云在CVPR中荣获多次佳绩后再一次斩获殊荣。

天翼云AI团队包揽CVPR自然场景情感行为分析挑战赛三项大奖!  第1张

天翼云AI团队包揽CVPR自然场景情感行为分析挑战赛三项大奖!  第2张

天翼云AI团队包揽CVPR自然场景情感行为分析挑战赛三项大奖!  第3张

天翼云AI团队包揽CVPR自然场景情感行为分析挑战赛三项大奖!  第4张

CVPR会议是由IEEE主办的关于计算机视觉和模式识别的国际学术会议,收录了该领域最新的研究成果和技术发展,是全球计算机视觉三大顶级会议之一

ABAW竞赛是由国际顶级计算机视觉研究者和科学家们共同发起的竞赛,致力于解决自然情境下计算机对人的情感行为进行分析的问题,并以此提升人机交互系统的场景应用能力,目标是创造出能够理解人的感觉、情绪和行为的机器和机器人,从而让机器能够与人类互动并有效地成为人类的数字助手。 

本届竞赛共吸引了来自世界各地的100多支团队参加,其中不乏国内外知名大学和研究机构,如中国科学院、中国科学技术大学等。参赛队伍需要对来源于现实场景的594个视频共300万帧图像进行分析,通过视频中的图像、人物、声音来预测指定人物在连续时间下的情感。

天翼云AI团队在本次竞赛中尝试简化问题,仅使用纯视觉特征进行任务建模。首先,通过使用可扩展的vision表征学习的掩码式自动编码器(Masked Autoencoder)在大量人脸表情相关的数据集上进行预训练,以学习鲁棒的图像表征;其次,在比赛提供的aff-wild2数据集上使用Expr标签进行微调,以更好地适合该数据集的分布;最后,利用时域卷积网络(Temporal Convolutional Network)和Transformer对数据在时间维度上进行建模,从而使模型能够通过视频的上下文对结果进行预测,大大提升了模型的任务表现。

当前,以大模型为代表的AI技术的发展及应用已步入爆发期,并成为驱动产业数字化与智能化的重要引擎。天翼云将继续在图像、音频及多模态领域持续深耕,不断夯实国云智算底座,推动AI技术变革升级,为数字经济发展注入新的活力。