LIPLAB 冯奕老师在广告理解研究方面取得新进展

发布日期:2025-03-04 浏览次数:


在人工智能和大数据驱动的广告行业中,多模态广告理解( Multimodal Ad Understanding ) 正成为一项关键研究课题。近日,我院LIPLAB冯奕老师团队在该领域的研究取得新进展,其提出的多模态广告理解任务成功被人工智能顶级会议 AAAI 2025 录用,并在 Senior Member Presentation Track 展示,标志着该研究得到同行的认可。


广告不仅是信息的传递,更是一种复杂的说服过程。广告主通常通过文本、图像、音频和视频等多种模态相结合,潜移默化地影响用户的认知和决策。例如,一个广告可能通过视觉元素营造情绪氛围,通过文案塑造品牌理念,甚至通过隐藏信息激发潜在需求。因此,单纯依赖文本或图像分析已不足以揭示广告的真正意图,多模态广告理解成为揭示广告如何影响用户决策的关键。


当前,社交媒体、短视频和电商平台上的广告形式日益多样,用户在接收广告时,往往难以察觉广告背后的深层次意图。如图 1 所示,一则广告可能通过柔和色调和温馨音乐传递信任感,或者通过夸张词汇和紧迫感制造购买冲动。要想实现更透明、更智能的广告推荐系统,就必须深入理解广告的说服技巧和隐藏意图,从而提升广告的可信度、优化广告投放策略,并增强用户体验。



针对这一挑战,冯奕老师团队首次提出了一种系统性的多模态广告理解任务,重点挖掘广告背后的说服技巧和隐藏意图。该研究结合深度学习、跨模态信息融合、情感分析等技术,从广告文本、图像、音频等多模态信息中提取关键特征,构建智能模型,以更精准地识别广告的真实意图。研究成果不仅推动了人工智能在广告理解领域的发展,同时也为广告行业提供了一种新型的智能解析工具,有助于优化广告内容创作,提高广告透明度,并增强用户信任感。相关成果《 Understanding Advertisements 》被 AAAI 2025 录用,冯奕老师为第一作者。


未来,团队将继续探索多模态广告理解的前沿技术,推动智能广告解析在精准营销、用户洞察等领域的广泛应用,为智能广告生态系统提供更科学、更高效的解决方案。


冯奕老师目前聚焦于交叉人工智能、多模态领域研究。近年来,已在 ACL、AAAI、IJCAI、EMNLP、TKDD 等自然语言处理国际顶级期刊会议以第一作者发表论文多篇。担任 ACL ARR、AAAI、IJCAI 等国际顶会 ( 高级 ) 程序委员会委员,AIJ、TALLIP 等期刊审稿人。欢迎对交叉人工智能、多模态相关领域感兴趣的 2025 级研究生与 2026 级推免研究生学生联系和讨论:fy@nju.edu.cn。对 LIPLAB 研究工作感兴趣的同学可访问 http://liplab.site  查看更多信息。