切换到宽版
  • 529阅读
  • 0回复

[世界人口]《自然》人工智能有助于为非洲量身定制药物--但非洲人应引领潮流 [复制链接]

上一主题 下一主题
 
只看楼主 倒序阅读 0 发表于: 04-10
只要有基础设施、训练有素的员工和安全的数据库,只需极少数据的计算模型就能改变非洲的生物医学和药物开发研究。
一名艾滋病毒呈阳性的肺结核病人手持一包药片的特写,这是他接受治疗的一部分
个体之间的基因差异会影响他们对药物的反应。

一个人对药物的反应在一定程度上取决于其基因。据联合国估计,到 2050 年,非洲大陆的人口将占世界总人口的近 25%。然而,药物基因组学研究--研究基因变异如何影响药物反应--在非洲人口中却非常缺乏。

药物基因组学数据库PharmGKB中只有不到5%的数据来自非洲人群1。美国食品和药物管理局提供药物遗传学建议的 300 多种药物中,只有 15 种在非洲群体中进行过研究2。

人工智能 (AI) 可以帮助缩小这一差距。在全球北方的许多国家,经过训练可识别药物基因变异(可能影响药物作用的DNA突变)的人工智能模型正在兴起。但非洲人口基因数据的匮乏,以及培训和基础设施的缺乏,阻碍了此类模型在非洲的应用。在此,我们概述了克服这些障碍的方法。

非洲需要药物基因学
药物基因数据有两个主要用途。首先,它们可用于选择最适合个人的药物--例如,HLA-B 免疫反应基因中存在药物基因突变的人对抗病毒药物阿巴卡韦过敏,因此应选择其他药物3。其次,这些信息可用于调整现有药物的剂量。例如,编码参与药物代谢的细胞色素 P450 酶的基因 CYP2C9 发生突变,导致常用血液稀释剂华法林的分解能力降低。有这种变异的人应该服用较低剂量的药物,以防止体内未代谢的华法林积聚,从而增加大出血的风险4。


但是,在全球北方产生的药物基因信息并不总是与非洲人群相关,因为基因变异在不同种族地理群体中的出现频率各不相同。出于以下几个原因,对专门影响生活在非洲和非洲移民社群中的非洲人药物反应的变异进行研究至关重要。

首先,依赖全球北方的临床数据可能会危及非洲人的健康。以依非韦伦为例。这种前景广阔的艾滋病药物曾在美国和欧洲成功使用,2015 年在津巴布韦作为一线治疗药物上市。但针对津巴布韦人的剂量建议并未考虑到非洲人比欧洲人和美国人更有可能携带 CYP2B6 基因突变。这种突变与一系列副作用有关5。在欧洲和美国患者中,头晕、烦躁或头痛是常见的副作用6,而在津巴布韦,许多人在服用依非韦伦时出现幻觉、焦虑和自杀念头7。


其次,药物基因变异的影响需要与非洲与世界其他地区不同的其他几个因素一并考虑。例如,每年非洲有 250 万人感染结核病,除其他治疗外,他们通常会服用抗菌药物利福平。但利福平会加速人体代谢药物的能力8 ,因此,如果一个人正在服用治疗其他疾病的药物,其剂量可能需要调整。饮食等生活方式因素也会影响药物代谢,因为不同人群的饮食习惯各不相同,会改变人的肠道微生物群落,进而影响人体对药物的处理方式。在非洲以外进行的研究很可能无法考虑到这些复杂因素。

第三,商业动机。非洲人口加上散居国外的非洲人,代表着巨大的药品市场份额。对药物剂量和处方进行调整,使其对这些人群安全,很可能会提高药物的使用率,从而增加全球制药公司的利润。

非洲地平线上的人工智能
药物基因变异很难发现--需要大量的临床和基因数据才能确定与药物反应变化相关的变异。人工智能模型通过搜索科学文献,寻找人类遗漏的药物基因关联,正在推动这一领域的发展。



为了识别更多变异,下一步--在 GPT-4 和 LLaMA 等大型语言模型的基础上--是训练 "基础 "人工智能模型,将多种类型的数据汇集在一起进行分析。对于药物遗传学来说,这些信息将包括生物库等大规模遗传学资源;包含医疗文本和治疗反应的电子健康记录;记录药物不良反应和处方建议的临床试验报告和药物标签;以及现有科学文献中有关遗传学和药物活性的体内和体外数据。

目前已在开发用于临床科学的基础模型,例如从成像数据中识别癌症的生物标志物9。我们预计,在未来一两年内,将有应用于药物遗传学的开放式基础模型问世。

这些基础模型将偏向于全球北方国家,因为它们的训练数据主要来自欧洲后裔(见 "数据偏差")。但是,非洲的研究人员可以利用一种叫做迁移学习的方法,即使用一个较小的数据集对训练有素的基础模型进行微调--在这种情况下,使用的是非洲人口的特定信息。迁移学习已成功应用于图像识别,通过少量贴有标签的照片让模型学习新的模式10。我们相信,已经有足够多的非洲数据可供迁移学习开始识别药物基因变异。

数据偏差。饼状条形图显示,用于识别药物基因变异的主要信息来源偏向于欧洲后裔。

资料来源 GWAS 目录:https://go.nature.com/4CPZMJQ;英国生物库: A. Fry et al. J. Epidemiol. 186, 1026-1034 (2017); PharmGKB: https://go.nature.com/4A75YAX

取得进展的四个步骤
在英国咨询公司 Oxford Insights 公布的人工智能就绪指数中,非洲国家大多排名靠后,就政府在公共服务中实施人工智能的就绪程度而言,撒哈拉以南非洲是全球得分最差的地区11。为确保非洲科学界做好准备,利用转移学习和未来的人工智能工具开展药物遗传学研究,需要做出以下改变(另见 "人工智能在药物遗传学中的未来")。

人工智能在药物遗传学中的未来
人工智能(AI)的前沿方法有朝一日可以帮助为非洲量身定制药物。

方法 1. 在所有药物类别中,抗癌药物拥有最多的药物遗传学信息。这是因为抗癌药物经常使用培养皿中培养的癌细胞和 "微型肿瘤 "进行体外测试,在收集大量其他生物数据的同时也收集基因信息。利用这些丰富数据的人工智能模型正被用于预测患者对抗癌药物的反应。利用 "迷你肝脏 "和其他药物代谢体外模型的类似方法,对抗癌药物以外的药物遗传学也很有用。

方法 2. 人工智能模型越来越善于预测 "错义 "基因变异(改变蛋白质中的一个氨基酸)何时会改变蛋白质的结构12 ,以及这种改变是否会妨碍蛋白质的正常功能。利用这些模型分析非洲流行的变异体后,可以从机理上模拟这些变异体如何影响非洲最常用的处方药。这可以帮助研究人员确定潜在的药物基因变异,从而为进一步研究确定优先次序。



培训非洲研究人员。非洲的科学家最有能力利用非洲传统医药知识,也最有能力了解本地区的疾病流行情况。因此,非洲人能够最好地确定非洲大陆有效药物发现和药物定制所需的研究和数据。

国际资助者、研究机构和制药公司必须投资培训非洲的人工智能和药物遗传学研究人员。与非洲的一些倡议合作,如非洲药物计量学组织(Pharmacometrics Africa)--一个提供临床药理学培训的非营利组织--可以帮助研究机构建设本地能力。

不断收集数据。虽然迁移学习有助于确定非洲常见的药物基因变异,但要全面掌握非洲人群之间的药物基因差异,还需要更多的基因组序列和重点临床试验结果。非洲并不是同质的--不同的民族地理群体应分别考虑,就像生物医学研究考虑不同的欧洲人群一样。非洲大陆的临床试验数量正在增加;未来的试验必须包括跨越多个种族的不同人群。

目前,希望在非洲各地开展临床试验的研究人员需要向各国卫生部门提出申请,而每个国家的法律标准、费用和答复时限都不尽相同。当非洲药品管理局全面运作后,整个非洲大陆的临床试验法规将实现统一。在此之前,研究人员可以从 "临床试验社区 "获得帮助。"临床试验社区 "是由位于南非比勒陀利亚的临床软件公司 Nuvoteq 托管的一个平台,提供有关在非洲各国开展临床试验的各种监管和伦理要求的最新资源。

投资基础设施和设备。许多非洲国家缺乏基因组学设施。一组国际知名的基因组学研究人员希望在非洲建立八个基因组学卓越中心,每个中心都与当地的学术单位和公共卫生机构协调。这一举措可以将世界一流的基因组学研究带到非洲,产生识别药物基因变异所需的数据。要实现这一目标,国际资助者、当地政府和位于埃塞俄比亚亚的斯亚贝巴的非洲疾病控制和预防中心之间需要进行强有力的协调,以确保项目资金落到实处。


为了科学的发展,允许为人工智能发明申请专利

基因组学工具,如药物遗传学检测试剂盒,可分析生物样本中涉及药物反应的数千个基因突变,必须为非洲人量身定制。这项技术可以帮助临床医生根据每个病人的基因特征调整药物处方,为非洲带来个性化医疗。制造这些工具的公司,如美国生物技术公司 Illumina,应与非洲科学家合作,在发现与非洲相关的变异基因时将其纳入其中。

制定数据共享和伦理研究框架。单个非洲机构、城市甚至国家都不可能具备开展世界级药物遗传学研究的所有必要条件--人员能力、研究基础设施和数据收集场所。因此,需要共享数据。

但当地研究人员担心,与全球北方的同行相比,公开共享他们的数据会使他们处于不利地位,因为后者可能拥有更多的资源、基础设施和熟练人员来分析数据和发表研究结果。由于获得共享和再利用样本的伦理批准非常耗时--例如,解释和获得基因组学研究的知情同意往往需要将同意书翻译成当地语言,这就加剧了这种不情愿。

非洲科学家必须建立可信赖的研究网络来共享数据。这些努力将受益于非洲大陆一级的数据共享法律和伦理框架,从而实现跨国合作。



泛非生物信息学网络(H3ABioNet)就是非洲大陆数据共享如何促进世界级研究的一个很好的例子。该研究联盟为非洲人类遗传与健康(H3Africa)计划管理数据存储和网络基础设施,这是迄今为止协调非洲基因组学研究的最大努力。该网络在多个非洲国家拥有设施,并为人类基因组学制定了明确的数据提交和访问政策。该网络将地方领导的管理委员会与培训、良好的计算基础设施和明确的数据质量政策结合起来,使研究成果能够存入共享数据库,并纳入欧洲基因组-表型组档案等国际数据库。

当开放数据的共享受到限制时--比如病人的生物医学数据--"分散式 "人工智能算法可以提供帮助。这些算法根据来自众多机构的数据进行训练,但允许每个机构对自己的数据保密。这种合作算法已在欧洲和美国的参考中心和医院进行试点,用于医学影像数据。

非洲正在迈出实现药物遗传学研究的第一步,而人工智能可以在推动该领域发展方面发挥关键作用。通过成功的能力建设,非洲人民将受益于更安全、更有效的治疗,从而降低非洲大陆的医疗成本。否则,世界卫生组织提出的在本十年内根除疾病的目标就不可能实现。

《自然》杂志第 628 卷第 265-267 期(2024 年)

doi: https://doi.org/10.1038/d41586-024-01001-y
快速回复
限100 字节
 
上一个 下一个