康江瑞计算数学与统计研讨会:半监督学习及其以后的代表性和多样化子数据选择

Time

-

位置

RE 102

发言人: 康江瑞,博士.D. 候选人,伊利诺伊理工学院
 

标题: 半监督学习及其以后的代表性和多样性子数据选择

文摘: 半监督学习(Semi-Supervised Learning, SSL)是一种流行的学习模式,它有效地利用了标记和未标记的数据来提高训练性能. 如果标记的数据没有预先给出, 如何选择样本进行标注也会显著影响性能, 特别是当标签预算非常低的时候. 然而,以往对这一问题的研究要么缺乏理论保证,要么缺乏实际意义. 填补这个空缺, 我们提出了一种代表性和多样性子数据选择方法(RDSS)。, 最小化一个新的标准ą-Maximum平均差异(ą-MMD),评估子数据的代表性和多样性. 我们证明了该方法在低预算学习中的泛化能力和优化算法的有限样本误差界. 实验结果表明,RDSS持续提高了几种流行的SSL框架的性能,并且优于主动学习(AL)和半监督主动学习(SSAL)中使用的最先进的样本选择方法。. 如果时间允许,还将介绍ą-MMD在其他SSL和贝叶斯优化问题中的潜在应用.

 

计算数学与统计研讨会

标签:

走进校园