近年来,23魔方在祖源方面开展深入研究。近日相继发表两篇有关基因祖源的学术论文。祖源测试的趣味性和准确性,为23魔方的消费级基因检测提供了可落地的应用场景。
根据23魔方目前掌握的中国人基因数据,以及现有历史资料分析推算,自明朝以来中国共有22万个家谱,大约25%的家族覆盖了中国人口的70%左右。截止到2019年5月,23魔方已完成4650个家谱的数据化,覆盖8%的中国人;预计到2019年底,23魔方将完成3.4万个家谱的数据化,覆盖60%的中国人。换句话说,届时60%的中国人,男性凭借自身基因,女性凭借父亲的基因,透过23魔方的基因检测,可以和数据化后的家谱相匹配,从而间接找到散失多年的家族与亲人。目前,已有6名用户通过23魔方的基因检测找到了亲生父母。
“基因检测匹配家谱的原理,在于男性特有的Y染色体比较稳定,大约每过140年,才有一个基因位点会产生突变。”周坤说,家谱之所以可以和基因检测相关联,是因为Y染色体“传男不传女”的特点,与中国家庭撰写家谱的习惯相似,通过把家谱与家谱传人的Y染色体基因数据化并形成样本数据库,便可以为进行基因检测的用户匹配对应家谱。
以开放的心态构建基因数据库
在周坤看来,23魔方的使命是通过基因检测,帮助用户完成生命的数据化。自创立以来,23魔方保有的基因数据以每年200%300%的速度增长,但对于更深入地开发应用,23魔方的样本数量依然不算充裕。周坤表示,譬如像“疾病预测”这样的应用需要分析以生命数据化为前提的超大量样本,并形成可随时调用的开放数据库,才能将这项利于全人类的技术真正落地。
“这样的数据库,理应是开放的、包容的,充满多样性的。”周坤说,未来23魔方将构建面向整个产业的基因数据库。然后和用户和业界同仁一起挖掘应用,并推动医药产业和生命科学进步。他相信随着数据量的增加,疾病预测等以基因检测为基础的创新应用,终将一一成为可能。而开放的数据库则能大大缩短从“可能”到“现实”的距离。