周昀也没多紧张,毕竟都在NeurIPS上做过报告了,区区一个毕业答辩还不是轻松拿捏?
“大家好,我叫周昀,我的毕业论文题目是《基于最优传输理论的多模态语义对齐与融合方法研究》。”
看到这个标题,除了原本就看过论文的林院长、邓永华和答辩组老师之外,在座的其他老师都不由地挑了挑眉。
如果是其他学生取这个题目,他们可能会想:这学生疯了?
但如果是周昀的话:有点意思,先看看怎么个事。
“这个选题倒是有点意思啊?”一位坐在后排的老师点了点头,“很大胆的选题,看题目应该是偏理论研究。”
“是啊,很久没看到过这样的毕业论文了,不愧是研一就能发NeurIPS还能申请提前毕业的学生。”
还没开始讲,几位老师就小声讨论了一下,不过很快他们就停止了讨论,因为周昀开始了他的报告。
“我的研究主要是多模态的语义对齐与融合,主要的想法是将多模态特征分布视为概率测度,
利用OT框架实现对齐,具体包括分层OT来处理数据簇结构,以及OT变体来适应高维嵌入的性质。
为了方便理解,我会模拟两类数据的对齐过程,分别是:视觉μ和语言ν。
以下是其的基本原理.......
然后,在对其阶段,我将视觉μ和语言ν分布建模为经验测度,通过Kantorovich双对偶形式求解Wasserstein距离:
W(μ,ν)=sup_{f,g:f(x)+g(y)≤c(x,y)}∫fdμ+∫gdν,
其中c(x,y)=||x-y||^2/2对应Brenier势的梯度映射
......”
大多数人一开始还能跟的上,因为没有涉及到什么具体的数学公式,都是一些思路,
就像你在学微积分的时候,老师一开始告诉你微积分的主要思想是‘分割求极限’,因为你知道极限是什么,所以听上去多少能领悟一点,
但是一旦老师开始讲到具体的题目的时候,部分学生就开始听不懂了,等更加深入地运用到一些实际问题的时候,就只有少数学生能跟上了。
现在的答辩现场大概就是这么个情况,从原本好好的答辩,变成了周昀在给各位老师上课的感觉,
更重要的是,下面大多数老师都表现出一种小学生上高数课的清澈的愚蠢,至于那些旁听的研一研二学生就更别说了,听到现在估计就只会啊吧啊吧了。
周昀的报告透露着一种‘老艺术家’的从容不迫,在谈到复杂数学公式的时候也是信手捏来,
而且对于一些比较抽象的数学理论,他也尽可能用相对通俗一点的语言解释,
但是数学这东西,就算再通俗,也是有一定门槛在这的,显然,现在这道门槛已经卡住了在座的大多数人。