Nature|把一千个中国人的基因组拼在一起

张开发
2026/6/7 22:36:15 15 分钟阅读
Nature|把一千个中国人的基因组拼在一起
这篇发表于2026年4月的 Nature 重量级研究来自西湖大学杨剑教授团队构建了迄今规模最大的中国人群泛基因组图谱。摘要泛基因组正在从根本上改变我们解析复杂变异基因组区域的能力。然而现有的人类泛基因组受制于样本量偏小在医学和群体遗传学中的应用价值十分有限。作为1000中国人泛基因组1KCP项目的一部分研究生成了1,116个二倍体基因组组装55个从头组装1,061个泛基因组引导式组装平均组装大小为2.98 Gb平均质量值为46。基于这些组装我们构建了一个泛基因组其中包含4.053亿碱基对的序列——这些序列在现行参考基因组GRCh38和CHM13中均不存在涵盖2,620万碱基对的功能性基因及预测调控元件。我们系统编目了全谱系遗传变异包括3,540万个小变异、110,530个结构变异SV、485,575个串联重复序列TR以及嵌入非参考序列中的86万个嵌套变异。这一规模庞大的数据集支撑了对医学遗传学相关多尺度基因变异的精细表征涵盖基因改变型SV、TR扩增、基因簇变异及HLA基因单倍型。结合1KCP基因表达数据我们开展了泛变异表达数量性状位点eQTL定位分析系统解析了多种变异类型对基因表达的调控作用。研究共鉴定出3,256个涉及复杂变异SV、TR及嵌套变异的eQTL并阐明了其调控机制的复杂性。最后构建了1KCP泛变异填充参考面板提供多类型遗传标记以提升未来关联研究的分辨率。本研究资源深化了我们对复杂变异及其功能影响的认识为理解人类健康提供了新的视角。1KCP网站这项研究最具实用价值的部分之一是团队为研究社区打造的公开数据平台https://yanglab.westlake.edu.cn/1kcp基于1KCP数据集研究开发了1KCP网站配备了用户友好的工具用于查询、可视化和推入各种类型的遗传变异。该资源在推动遗传学研究和临床应用方面具有显著潜力尤其是在东亚人群中。关于1KCP1000中国全基因组项目1KCP招募了数千名中国个体进行了短读和长读长全基因组测序目标是建立一个大规模的二倍体组装面板和丰富的遗传变异目录在1KCP项目第一阶段生成了1,116个高质量的二倍体基因组组装其中包括55个新生成组装和1,061个全基因组知情组装平均大小为2.98 Gb平均质量值QV为。构建了一个全基因组包含4.053亿碱基对这些序列在当前文献GRCh38和CHM13中缺失其中包括2620万个功能性基因和调控元件碱基对。还构建了全面的遗传变异谱包括3540万个小变异、110530个结构变异、485575个串联重复序列、086万个嵌套变异位点以及36个HLA基因的2617个等位基因。参考Wang, Y., Duan, Z., Chen, D. et al. The 1000 Chinese Pangenome empowers medical and population genetics. Nature (2026). https://doi.org/10.1038/s41586-026-10315-yhttps://yanglab.westlake.edu.cn/1kcp/home

更多文章