标题:PADS: Prior-Assisted Data Splitting for False Discovery Rate Control
报告时间:2025年05月07日(星期三)13:30-14:30
报告地点:人民大街校区惟真楼523
主讲人: 刘军
主办单位:数学与统计学院
报告内容简介:
Mirror statistic (or knockoff statistic) is a key component for most p-value-free feature selection methods. However, it is unclear how to choose the best statistic when additional prior information or covariate information is available. In this paper, we first describe a large class of possible choices of mirror statistics and derive an optimal form of mirror statistic inspired by the two-stage formula proposed in Li and Fithian (2021). Theoretically, we demonstrate the power advantage of this optimal form by considering the Rare/Weak signal model. With prior information, evenly splitting the data into two halves is no longer the most efficient way. Building upon the optimal form of the mirror statistic, we investigate how the splitting ratio affects the power of a feature selection procedure and introduce the Adaptive-Data-Splitting (ADS) approach. Both simulations and real data examples show that ADS performs significantly better than the original equal-splitting.
主讲人简介:
刘军1981年毕业于清华附中;1985年于北京大学获得数学学士学位;1991年在美国芝加哥大学获统计学博士学位。自2000年至今,刘军担任美国哈佛大学统计系终身教授,并于2003-2015年兼任哈佛生物统计系教授。他曾任哈佛统计系助理教授(1991-1994);斯坦福大学统计系助理教授、副教授、终身教授(1994-2004);北京大学数学学院长江讲座教授、清华大学数学系访问教授,并获国家级高层次青年人才(2005)。他于2015年领导创建清华大学统计学研究中心,并任名誉主任至2024年。2024年7月他以筹建发展委员会主任身份领导在清华大学创建统计与数据科学系。
刘军一直从事于贝叶斯统计理论、蒙特卡洛方法、统计机器学习、状态空间模型和时间序列、生物信息学、计算生物学等方向的研究,并做出杰出贡献,对大数据处理和机器学习领域有深远影响。他于2002年获得考普斯会长奖 (COPSS Presidents' Award,公认为国际统计学界的最高荣誉); 2010年获得世界华人应用数学最高荣誉晨兴应用数学金奖(三年一度,不超过45岁);2014年被ISI评为论文高频引用的数学家;2016年获得泛华统计协会许宝騄奖(三年一度,不超过51岁);2004、2005年分别成为美国数理统计学会和美国统计学会会士(Fellow); 2022年当选国际计算生物学会会士;2025年当选美国国家科学院院士。
刘军教授还曾任美国统计协会会刊(JASA)联席主编及多个国际一流统计杂志副编等职。截至2025年5月,他在各类国际顶尖学术杂志(如Science,Nature,Cell,JASA,JMLR等)及书刊上发表论文300余篇和一本专著。他已经指导了40多位博士生、30多位博士后。