上周,金州杀手嫌疑犯的被捕让很多人措手不及。在侦探能够通过 DNA 追踪到这名连环强奸犯和杀人犯之前,许多人并没有认真考虑过将自己的基因材料交给私人公司的后果。现在,这位(再次被怀疑,但未被定罪)金州杀手表亲的数据据称能够帮助破解这起长期悬案,人们不得不开始问自己,他们和其他人到底愿意以 DNA 样本的形式向公司提供多少信息(更不用说 Facebook 了)。他们应该给多少? 历史上 DNA 追踪失败的例子比比皆是。以一名幽灵女连环杀手为例,她的基因物质出现在欧洲数十个犯罪现场。基因匹配非常一致,警方确信她一定是个杀人无数的女凶手。事实上,DNA 之所以如此完美匹配,是因为它属于一名在棉签工厂工作的女性,警方从这家工厂获得棉签(棉签未经认证,无法用于 DNA 采集——哎呀!)。 休斯顿一名男子因 DNA 证据似乎将他与强奸案联系起来而被判入狱四年。直到他的母亲看到一份关于犯罪实验室分析错误的报告后,一名律师才重新评估了数据,并意识到技术人员在分析样本时犯了根本性错误。 这并不是说涉嫌谋杀的凶手是无辜的;他将接受审判,由陪审团评估手头的证据。网上基因组共享很可能帮助将一名凶残的强奸犯和杀人犯绳之以法。但这则新闻提醒我们,DNA 分析是一种笨重的工具,而且越来越受欢迎、便宜且方便使用。 但对许多人来说,这则消息最令人惊讶,因为它表明消费者 DNA 测试能够揭示你的血统真相。不同的 DNA 测试套件可能会(甚至很有可能)在种族和血统方面得到不同的结果。那么这有什么不同呢? 首先,介绍一下 DNA 检测的工作原理造成这种困惑的部分原因在于,人们不了解遗传学家在分析你的 DNA 时真正关注的是什么。大多数方法都依赖于一种叫做 SNP 的东西(稍后会详细介绍),但寻找祖先和确定直系亲属之间的区别在于你如何处理这些 SNP。并非每家公司都会同时追踪直系亲属和远亲族谱,但 Ancestry 等公司会这样做——他们会追踪你的潜在远亲,并提供你的远古祖先可能来自哪里的摘要。 “当您将样本寄给我们时,第一步是从脸颊细胞中提取 DNA,以便我们对其进行基因分型。DNA 包含大约 30 亿个字母,但我们要查看 70 万个特定位置,我们知道这些位置在人与人之间是不同的,”Ancestry 的人口遗传学家 Julie Granka 说道。 这些特定位置被称为 SNP,即单核苷酸多态性。当你的身体在制造新细胞时复制 DNA 时,机器经常会犯一些错误。大多数重大错误都会被捕获。如果关键蛋白质的密码被搞乱,该细胞通常就无法存活,而且你有一些拼写检查蛋白质可以修复错误。但很容易在单个位置上出现错误。 您的 DNA 由核苷酸组成,科学家将其称为 A、T、C 和 G(腺苷、酪氨酸、胞嘧啶和鸟嘌呤),它们相互配对。只要一条 DNA 链上有 A,那么与之匹配的那条链上就应该有 T,C 和 G 也是如此。偶尔,复制链的蛋白质会意外地将错误的核苷酸插入 DNA 中并不重要的区域。也许它根本不编码任何东西(您的大多数 DNA 都没有!),或者它可能是一个足够小的错误,不会改变细胞的功能。这就是 SNP:单个位置的单个变化。 一些 SNP 会导致疾病,但出于基因检测的目的,我们只关注良性位点。 由于这些 SNP 对细胞功能没有影响,因此它们不会被固定下来。它们会代代相传。因此,如果一千年前英国的一个人在 3455 位置上获得了一个由 A 变为 C 的 SNP,那么这个人的许多后代都会拥有完全相同的 SNP。更重要的是,由于可能出现 SNP 的位置有数十亿个,因此 SNP 是独一无二的。如果您在 3455 位置上有一个 A 到 C 的 SNP,那么您的祖先很有可能来自英国。如果不是,这并不意味着您不是来自英国——这只意味着您没有那个特定的标记。 由于您可能与近亲共享大量 SNP,因此 Ancestry 等公司可以使用相同的 SNP 数据来查明谁可能是您的表亲(只要该人在他们的数据库中)。因此,在某种程度上,大部分基因检测只是基于您与其他人共享的 DNA 百分比(由 SNP 估计)。但情况比这要复杂一些。 血统测试和家族测试有着根本的不同,但也存在着奇怪的相似之处23andMe 和 Ancestry 等公司拥有大量 SNP 数据库,这些 SNP 可追溯到世界某些地区。当他们分析您的样本时,他们会将您的 SNP 组与他们的数据库进行比较,然后使用匹配结果确定您的祖先可能来自哪些地区。 但这个过程并不完美。Granka 解释说,你的家谱信息基于统计模型。它可以告诉你你可能来自哪里,但仅此而已。Ancestry 和该领域的其他公司一样,建立了一个参考人群数据库。不过,你的结果直接反映了该公司使用的参考人群,这就是你会得到不同答案的原因。 这意味着您的所有祖先数据大多是估算值。这就是为什么公司会为您的结果附加一个置信区间。他们可能会说您有 48% 的东欧血统,但他们对这个结果的把握在 30% 到 80% 之间。大多数人只关注 48%,而忘记了结果并非确定的。但这一点再怎么强调也不为过:所有祖先结果都基于一个模型,而该模型可能是错误的。公司正在使用尖端科学方法来确定哪些参考人群来自世界哪些地区,但这始终是基于假设和估计。 另一方面,家谱测试则更为直接。“我们正在寻找与数据库中其他人相匹配的你的基因链,”格兰卡说。“相同的基因链来自共同的祖先。”因此,如果 A 和 B 的 DNA 有大约 12.5% 是相同的——即完全相同——我们可以说 A 和 B 有共同的祖父母。如果 C 和 D 的 DNA 有 50% 是相同的,那么这些人要么是父母和孩子,要么是两个亲兄弟姐妹。 发现区别了吗?血统测试基于一个可能存在缺陷的模型,而家谱则是纯数学。 问题不在于你向公司提供了多少信息我们都提供了多少信息?这就是我们所有人提供的信息量。据称,金州杀手之所以没有被抓获,是因为他交出了自己的 DNA。他的一个表亲将自己的DNA 上传到一个免费的业余网站上,该网站允许用户使用完整的基因组序列来寻找亲属——他可能是从某种付费服务中获得的。一些公司,如 23andMe 和 Ancestry,允许客户下载他们的原始数据,然后他们可以将其上传到其他网站。 部分原因是,正是由于 GEDmatch(这位表亲使用的网站)等公司的存在,我们才如此迅速地遇到了与 DNA 相关的隐私问题。Ancestry 和 23andMe 等公司历来拒绝执法部门的请求,也许是因为他们知道消费者不会愿意将自己的 DNA 交给一家可能会将这些数据交给警方的公司。但这并不是说他们能够抵抗法院命令。 更重要的是,这甚至与你个人交出什么无关。如果有足够多的人提供他们的 DNA,理论上,公司或执法部门可以开始为其他人建立档案,就像 Facebook 可以拥有不在 Facebook 上的人的档案一样。当你交出你的基因数据时,你就永远交出了它。没有人能告诉你这对你个人来说是否是个好主意,但你应该仔细考虑潜在的后果——尤其是如果这一切都是为了估算的话。 如果侦探、律师,当然还有犯罪实验室技术人员已经利用我们掌握的少量 DNA 证据犯错,想想他们利用整个数据库还会犯多少错误。甚至连金州杀手都差点被误认——俄勒冈州一家法院强迫一名 73 岁的男子提供 DNA 样本,当时侦探声称他们有证据表明他是 2017 年的连环杀手。错误总是会发生。DNA 并非万无一失,我们最好记住这一点。是的,将您的全基因组提供给免费网站可以帮助您找到失散多年的亲人。它甚至可以帮助逮捕危险的罪犯。但它也可能让您的一个表亲因他们没有犯下的罪行而被传唤。 注意:本文的早期版本错误地将 DNA 碱基对称为“氨基酸”。当然,它们不是氨基酸,作者要感谢 Twitter 让她保持诚实和准确。 |
《红三四郎》:一部讲述红色斗士在世界各地驰骋的热血动作片1969年播出的《红三四郎》是龙之子制作公司...
2011 年,南加州的野生动物研究人员欣喜地发现,一只新的雄性美洲狮闯入了圣安娜山脉,加入了当地一小...
今晚东部时间 9 点,全世界将首次目睹一位最新的普通公民交出一大笔现金,以换取一次罕见的太空和月球旅...
詹姆斯韦伯太空望远镜距离地球近一百万英里,用于研究宇宙。自 2021 年 12 月 25 日发射以来...
Danchi Tomoo (第二季) - Danchi Tomoo - 全方位评价和推荐概述《团地智...
《卡片战斗!!先锋罪系列》的魅力与评价《卡片战斗!!先锋罪系列》是一部电视动画,改编自 Bushir...
喜欢冒险的背包客和小镇居民很快就能在开车上下班时不用手握方向盘。美国汽车制造商通用汽车表示,到 20...
这项返校优惠让您仅需 49.99 美元即可获得 Microsoft Office Pro 2021 ...
NOBLESSE 的全面评测与推荐概述《NOBLESSE》是一部电视动画系列,于 2020 年 10...
《与僧侣的淫欲之夜》——一个关于深切欲望与救赎的故事《与僧侣的淫欲之夜...》是一部 2017 年播...
少年好莱坞 - 少年好莱坞 - 综合评论和推荐概述《少年好莱坞》是 2014 年播出的电视动画系列,...
古代骨骼可以为科学家提供关于古代人类身体状况的重要信息,但要找到史前尸体营养来源的证据则更具挑战性。...
侏罗纪时期,非洲和南美洲分裂,大西洋诞生,分离后在几内亚西海岸留下了一片浅海高原。“所有的沉积物都非...
《佛兰德斯的狗 -我的帕特拉什-》的诉求与评价《佛兰德斯的狗:我的帕特拉什》是一部电视动画系列,于 ...
从游戏和社交媒体到在线课程,孩子们与数字世界的联系比以往任何时候都更加紧密。这让他们能够获得父母在他...