报 告 人:陈国波 副研究员
报告题目:大规模医学遗传数据分析与实践
报告时间:2023年6月9日(周五)上午9:00
报告地点:静远楼1506
主办单位:数学与统计学院、数学研究院、科学技术研究院
报告人简介:
陈国波,2009年浙江大学数量遗传学博士,2011~2015年澳大利亚昆士兰大学大脑研究所博士后。2017年至今,浙江省人民医院临床医学研究所副研究员。从事统计遗传学研究,在Nature,Lancet,Am J Hum Genet,Hum Mol Genet,Bioinformatics,Mol Ecology等杂志发表论文40余篇,Google Scholar引用超3200次,H-index 19。
报告摘要:
医学遗传学数据逐渐涌现为数据挖掘与分析的重要场景,尤其DNA测序数据结合表型数据构成全基因组关联分析(Genome-wide association studies,GWAS)的规范数据格式,直接可以作为各类医学预测的数据源。但医学数据和DNA数据受到隐私保护的各类限制,现实中很难直接使用或者交互,极大限制了数据体量的扩增。本研究采用随机矩阵的计算框架,采用projection的方式,对基因型数据进行单向哈希加密,精准测算projection所需要的维度k与最终求解精度的量化关系,开发出适用于多方计算的encG-reg(encrypted genotype regression)。以两份真实世界的UKBiobank的约50万GWAS样本以及中国本土6个基因组相关研究所的约6万份GWAS样本,展示了如何在多方计算下采用encG-reg完成医学遗传学数据的亲属鉴定,以及将要展开的进一步工作内容和数据分析层面的各类挑战。