人类泛基因组参考联盟的科学家发布了一个新的高质量参考人类基因组序列集合,其中包括 47 人的基因组,目标是到 2024 年年中将这一数字增加到 350 人。
原始参考人类基因组序列已有近 20 年历史,并且随着技术进步和研究人员修复错误并发现人类基因组的更多区域而定期更新。
然而,它从根本上限制了它对人类物种多样性的表示,因为它仅包含大约 20 个人的基因组,而且大部分参考序列仅来自一个人。
当前的参考人类基因组序列存在反映缺失信息的缺口,尤其是在重复且难以阅读的区域。
最近的技术进步,例如一次读取较长 DNA 的长读长 DNA 测序,帮助研究人员填补了这些空白,从而创建了第一个完整的人类基因组序列。
这个完整的人类基因组序列于 2022 年 4 月作为端粒到端粒 (T2T) 联盟的一部分发布,并被纳入当前的泛基因组参考。
利用先进的计算技术比对各种基因组序列,人类泛基因组参考联盟构建了一个新的人类泛基因组参考,泛基因组中的每个组件都覆盖了 99% 以上的预期序列,准确率超过 99%。
它还建立在之前的参考基因组序列的基础上,增加了超过 1 亿个新碱基。
虽然以前的参考基因组序列是单一的和线性的,但新的泛基因组同时代表了人类基因组序列的许多不同版本。
这为研究人员使用泛基因组分析其他人类基因组序列提供了更广泛的选择。
“通过使用泛基因组参考,我们可以更准确地识别更大的基因组变异,称为结构变异,”Mobin Asri 博士说。加州大学圣克鲁斯分校的学生。
“我们能够找到使用以前依赖线性参考序列的方法无法识别的变体。”
结构变异可能涉及数千个碱基。到目前为止,由于使用单一参考序列的偏差,研究人员一直无法使用短读长测序来识别每个人类基因组中存在的大多数结构变异。
“人类泛基因组参考将使我们能够代表基因组区域中数以万计的新基因组变异,这些区域以前无法进入,”博士廖文伟说。耶鲁大学学生。
“有了泛基因组参考,我们可以通过提高对基因和疾病特征之间联系的理解来加速临床研究。”
“虽然这项工作仍在进行中,但泛基因组是公开的,可以被世界各地的科学家用作新的标准人类基因组参考,”洛克菲勒大学研究员埃里希贾维斯博士说。
“这个复杂的基因组集合代表了比以往任何时候都更准确的人类遗传多样性。”
“随着他们掌握的遗传数据的广度和深度以及基因组组装质量的提高,研究人员可以完善他们对基因与疾病特征之间联系的理解,并加速临床研究。”
该团队的工作发表在《自然》杂志上。