为进一步拓宽学生学术视野,激发科研创新思维,加强校际学术交流,近日,浙外语言智能学院特邀北京大学信息管理系博士生张嘉骏做客线上,带来了一场题为《HUMORCHAIN:理论引导的多阶段可解释多模态幽默生成研究》的精彩学术报告。学术报告由罗城副研究员主持,学院师生线上线下参加。
幽默作为人类创造性活动与社会联结的独特机制,长期以来都是人工智能生成领域亟待攻克的重要挑战。报告中,张嘉骏同学深入浅出地分享了其被计算机视觉顶级会议 CVPR 2026 录用的最新研究成果——HUMORCHAIN(多模态幽默生成方法框架)。该研究首次将幽默理论中的认知结构嵌入多模态生成任务,创新性地提出了一种理论引导的多阶段推理框架。该框架通过整合视觉语义解析、基于幽默与心理学的深度推理,以及微调后的幽默评估判别器,成功构建了可解释且可控的认知推理链,并在人类幽默偏好、Elo/BT评分及语义多样性等关键指标上显著优于当前最先进的基线模型,有力证明了理论驱动的结构化推理能够有效引导大模型生成更符合人类感知的优质幽默内容。
在互动环节中,张嘉骏同学结合自身研究经验,与语言智能学院的老师、同学深入探讨了如何将抽象的幽默认知理论有效融入具体的模型框架等核心问题,并就AI在跨文化幽默理解方面的潜力与挑战交换了意见。思想的碰撞进一步激发了大家对AI与语言学交叉领域的研究热情。
此次报告不仅展示了多模态幽默生成的技术突破,更引发了大家对于机器如何理解人类情感与智慧的深层思考。这种理论驱动与技术创新相结合的研究范式,为语言智能领域注入了新的活力。期待未来能有更多同学以此为契机,在语言智能的广阔蓝海中激发创新灵感,共同探索学术前沿的无限可能!