Y染色体携带决定男性特征和用于生产精子的基因。它个头小,模样也非常奇怪,所携带基因量很少,而且充满了反向、重复的DNA片段,这使得测序工作十分困难——对Y染色体进行全面测序一度被认为是不可能完成的任务。不过近期,最新的“长读”测序技术终于揭示了贯穿一整条Y染色体的完整遗传信息,对数十条来自全球男性的Y染色体进行了全面、可靠的测序。

这一艰巨、突破性的工作于2023年8月发表在《自然》杂志。同行表示,它将指引我们探索性别基因、精子基因的作用机制,理解Y染色体的演化方式,以及分析它会否如预测那样在几百万年内消失。

Y很奇怪

大约60年前我们就已知道有种特殊的染色体决定人类和其他哺乳动物的出生性别。女性有一对X染色体,而男性有一条X染色体和一条体型小得多的Y染色体。

Y染色体决定男性性别,因为它携带一种名为SRY的基因,该基因指导胚胎内细胞脊发育成睾丸。胚胎睾丸会产生雄性激素,进而引导男婴男性特征的发育。

相比X染色体和另外22种常染色体,Y染色体相当独特,体型很小,携带基因也很少——区区27个,要知道X染色体上有大约1000个基因。

Y染色体基因包括SRY、少量指导精子生成的基因、一些似乎对生命至关重要的基因——这些基因里有不少在X染色体上有对应者。许多Y染色体基因(包括精子基因RBMY和DAZ)以多个拷贝形式存在。此外,DNA序列倒置、缺失的情况很常见。

Y染色体还具备许多似乎对生物性状无贡献的DNA序列。此类“垃圾DNA”由高度重复序列组成,这些序列源自旧病毒的碎片、死亡基因以及碱基的简单重复。

Y染色体为什么如此独特?故事要从演化讲起。大量证据表明,1.5亿年前,X和Y只是一对普通染色体(当时还在鸟类和鸭嘴兽中),彼此并无差异,父母各提供一条——就像常染色体那样。后来,这对染色体中某条的SRY基因演化,界定了一种新的原始Y染色体。这种原始Y染色体便被永远限制于睾丸内,并且因大量细胞分裂和极少修复而发生一系列突变。

原始Y染迅速衰退,每百万年失去约10个活跃基因,数量从原来的1000个减少到目前的区区27个。它一端的一个“伪常染色体”小区域保留了最初形式,与X染色体相同。关于这种衰退会否持续,学界有很大争论,因为按照这个速度,全人类的Y染色体将在几百万年内消失(就像啮齿动物已经遭遇的那样)。

技术升级推动测序突破

人类基因组的第一份草图于1999年完成。自那以后,科学家成功对所有常染色体以及X染色体进行了测序(只留下少数缺漏)。他们使用短读长测序技术来实现目标,具体操作包括将DNA切割成大约100个碱基的小片段,然后像拼图一样重新组装它们。直到最近,新技术才有能力沿单个长DNA分子进行碱基测序,得到数千个碱基的长读片段。这些较长读段更容易区分,故而更容易组装。因此,科学家得以解析Y染色体上那些令人困惑的重复和环状结构。

2023年3月,美国国家人类基因组研究所的生物信息学家亚当 · 菲利普(AdamPhillippy)和端粒到端粒联盟(T2T)报道了除Y染色体外的人类基因组完整测序。而眼下,正如他们于《自然》发表新文章所介绍的那样,Y染色体6200万碱基的复杂排列已被详尽解析,此前部分测序工作所缺漏的3000万碱基信息也补上了。菲利普等人在《自然》上不只发了一篇文章,另一份同时见刊的工作还对来自世界各地21个不同群体男性的43条Y染色体进行了测序,旨在采样人类的遗传变异。

测序43条Y染色体后,研究团队发现,它们的遗传差异很大。团队成员之一查尔斯 · 李(CharlesLee)表示:“我很惊讶于Y染色体上某些基因的拷贝数差异。举个例子,A男性的Y染色体有23个名为TSPY的基因拷贝,该基因被认为与精子形成有关,B男性的Y染色体却有39个TSPY拷贝。”此外,他们还发现Y染色体大量重复区域的多少和组成存在差异。

遗传学家马克 · 乔布林(MarkJobling,未参与工作)指出:“这篇论文证实了Y染色体的基因内容本质上是保守的,Y染色体仍在退化并注定消失的想法被这一事实彻底击垮了。”

研究人员现在可以开展大规模研究,挖掘Y染色体变异与健康问题的相关性,例如与Y染色体有关的膀胱癌。

资料来源The Conversation