• 学术动态 |正文
  • 我院双周学术论坛第2次报告:Variational Inference for Multiple Correlated Outcomes in Large Scale Genomics Data
    (发布时间:2019-03-28)


       3月27日,我院双周学术论坛在德经楼Z1-307举行。本次学术论坛的主题为“Variational Inference for
    Multiple Correlated Outcomes in Large Scale Genomics Data”,我院史兴杰博士进行了报告。论坛由陈耀辉教授主持,该研究方向的全体教师及部分研究生参加了本次学术活动。
       史兴杰博士汇报了他最新的论文《多响应变量的变分推断方法及其在大规模GWAS中的应用》。在简单介绍大规模的GWAS数据结构后,他指出该工作的出发点是考虑大规模多元响应变量线性模型的变量选择问题。史兴杰博士与合作者基于变分推断(Variational Inference)提出了一个新的贝叶斯变量选择方法VIMCO,并给出了快速的变分EM算法。他指出,该算法的计算复杂度关于样本容量和变量维数均为线型增长,因此在处理大规模数据集上十分高效。    
       最后,史兴杰博士通过数值模拟表明,当被解释变量内部相关性很高时,vimco在变量选择的准确性上要显著优于基准方法;当被解释变量内部相关性较低时,vimco与基准方法具有同样的准确性。两个GWAS案例分析也显示了该方法的有效性。最后,给出了实现该方法的R软件包vimco。
       报告结束后,与会教师就该论文的研究背景、假设条件,以及在金融大数据中的应用等相关问题进行了热烈讨论,并提出了一些建议。此次报告使在场的老师和同学们对高维大数据的变量选择前沿有了更为深入的了解,激发了研究灵感,拓展了研究思路。