
①在AI驱动的今天,高质量数据是医疗产业发展不可或缺的核心战略资源; ②从全国首批重大疾病数据产品挂牌,到重大疾病数据可信数据空间落地,医疗数据要素化正从理念走向现实; ③高质量真实世界数据的获取和治理仍是当前的重要挑战。
《科创板日报》11月27日讯(记者 徐红)今年4月,美国国立卫生研究院(NIH)一纸禁令,宣布禁止包括中国在内的特定国家研究人员访问其核心生物数据库,其中就包括在癌症研究领域极具权威、使用广泛的SEER(Surveillance, Epidemiology, and End Results)数据库。
这一事件犹如一记警钟,让整个生物医药行业前所未有地意识到,在AI驱动的今天,高质量数据同样是产业发展不可或缺的核心战略资源,其价值不亚于实验室中的任何高端仪器。这也表明,打造自主可控、质量过硬的数据库,已经不再是一道选择题,而是必然之路。
在日前举办的2025全球数商大会“可信数据流通赋能生命健康产业新未来”论坛上,《科创板日报》记者进一步获悉,从可信数据空间的建设,到医疗数据的系统化治理,一系列举措正在积极推进,旨在逐步打破数据壁垒,推动行业协同发展。
▌医疗数据治理:变“废”为宝
近年来,数据要素的战略地位在国家层面得到空前提升。
2019年10月,十九届四中全会首次提出将数据作为新的生产要素;2020年,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,正式将数据与土地、劳动力、资本、技术等传统要素并列为五大生产要素之一。
2023年12月,国家数据局挂牌成立,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用。成立之后,国家数据局又火速联合16部门明确了“数据要素X”三年行动,并将医疗健康作为重点行业之一,提出有序释放健康医疗数据价值,加强医疗数据融合创新。
在上海这样拥有海量数据资源的超大城市,可信数据空间建设已在城市、行业和区域层面全面铺开,包括由上海数据集团申报的“上海城市可信数据空间”已成为国家数据局首批试点项目,进入试运行后吸引近300家企业加入,开发了超过300个数据产品。
而在行业级应用方面,据《科创板日报》记者在会上了解,医疗数据作为最具社会价值的“黄金资源”之一,也正在加速从患者诊疗的“副产品”转化为推动医学创新、优化医疗资源配置的强大动力。
上海市第一人民医院便积极投身于这一进程。院长郑兴东介绍道:“去年在相关部门的支持下,我们率先对院内数据资源进行了系统梳理与规划,聚焦10个重点学科,推出20款专病数据产品,并实现了挂牌交易。”
“这些产品的背后,不仅凝聚着医生的专业智慧,更是医疗数据从‘被动存储’到‘主动创造价值’的一次跃升。“郑兴东院长强调,在这一过程中,医院始终坚持一个根本原则:医疗数据的治理与流通必须以公共利益和患者福祉为导向。“我们推动数据流通的最终目的,并非单纯追求商业化交易,而是为了让医学更精准、健康服务更高效,让科研成果更快地惠及社会。”
上海市生物医药行业协会会长傅大煦则表示,“从上海的实践来看,无论是全国首批重大疾病数据产品挂牌,还是重大疾病数据可信数据空间的关键落地,都标志着医疗数据要素化正从理念走向现实,展现出可操作、可复制的路径与价值。”
他进一步指出,长期以来,生物医药创新更多依赖科学家的个人经验与技术积累,研发周期长、试错成本高。而如今,越来越多企业开始借助真实世界数据与临床队列研究,显著提升研发效率与决策准确性。
胰腺癌素有“癌中之王”之称,是一种疾病负担沉重、治疗效果差的恶性肿瘤。近十年来,其发病与死亡率呈现显著上升趋势,为患者家庭和社会带来了沉重的经济负担。
上海交通大学医学院附属仁济医院教授王理伟分享了中国晚期胰腺癌大数据平台的建设成果,目前该平台已覆盖全国31个省市10万例患者数据,为精准治疗提供了坚实支撑。
王理伟教授表示,现在大多数药物在上市前要做注册临床研究,但新药注册临床研究通常设定严格的入排标准,研究对象多为“理想化”患者,这与真实临床实践中复杂的患者情况存在差异。
因此,真实世界研究能够与传统临床试验互为补充,为新药上市后的实际应用、临床指南的制定以及医保决策提供来自真实场景的重要证据。该大数据平台系统描绘了中国胰腺癌的真实诊疗图景,同时鉴于中国胰腺癌新发病例约占全球四分之一,因此开展针对中国人群的大数据研究,对提升全球胰腺癌诊疗水平同样至关重要。
值得一提的是,基于真实世界数据的精准药物研发也在逐步开花结果。王理伟教授举例提到,恒瑞医药自主研发的、研发进度全球领先的KRAS G12D抑制剂HRS-4246,正是基于对中国胰腺癌患者KRAS突变真实世界数据的分析,针对高频突变位点G12D进行开发,其针对晚期胰腺癌的IB/II期临床研究已取得积极成果,展现了以真实世界证据支撑药物开发的广阔前景。
▌高质量数据:稀缺的“战略资源”
在美国,利用真实世界数据(Real World Evidence,RWD)支持新药及其新适应症的开发与审批,已成为监管实践中的重要趋势,尤其在罕见病药物和补充已上市药品的新适应症方面,真实世界证据发挥了关键作用。
例如,FDA曾加速批准了治疗特定白血病的药物Blinatumomab(博纳吐单抗),其审批中使用了历史上的患者诊疗数据作为外部对照。另一个典型案例是,FDA基于来自电子健康记录和大型保险数据库的真实世界证据,于2019年批准抗癌药帕博西尼的适应症扩大至男性乳腺癌患者,这一决策背后的主要原因是男性患者数量稀少,难以开展大规模随机临床试验。
真实世界研究包括临床治疗中患者治疗的全过程数据,如电子病历、电子健康档案、医保数据、药品和疾病登记、个人健康设备收集的信息等。
罗氏制药医学部AI创新业务负责人陈哲告诉《科创板日报》记者,高质量的真实世界数据对于新药研发意义重大。成熟、规范的真实世界数据库在欧美较为普遍,制药企业基于这些数据做研究不仅能显著降低研究成本,速度还非常快。
他进一步举例说明,在乳腺癌药物研发中,由于患者5年生存率已显著提升,若开展传统随机对照试验(RCT),为验证药物有效性需对患者进行长期随访,整个研究周期可能长达6至7年。
“而如果利用已有的历史真实世界数据,研究人员就能立即开展分析。对于新药上市而言,节约时间不仅意味着更早惠及患者,也意味着更重要的市场窗口。“他说。
回到国内,一个不争的事实是,虽然我们拥有海量的真实世界数据,但数据质量却参差不齐,高质量真实世界数据的获取和治理仍是当前的重要挑战。据《科创板日报》记者了解,这与产业尚处发展早期、各项法规及配套机制仍有待完善有关。相比之下,美国已涌现出较多的专注于数据分析的医疗科技公司,为制药公司的研究提供支持;欧洲则有政府主导建立的生物医学数据库,助力科研与商业化应用。
事实上,个体化医疗的实现同样离不开规模化、高质量的数据支撑。罗氏制药创新数据资源解决方案策略及孵化器负责人李丽莎表示,若要对每位患者实现精准用药,必须基于大量真实世界数据训练AI模型,方能为患者提供更精准的预测与治疗方案。
然而,当前数据缺失与“数据孤岛”问题仍然制约着这一目标的实现。现有的AI工具更多还是侧重于辅助医生和患者进行数据整理与快速结构化处理。
例如,罗氏与中山医院、上海人工智能实验室共同开发的MDT智能体,在肝癌MDT诊疗中(多学科诊疗)可以实现患者病史资料的快速结构化。患者仅需上传病史资料照片,系统约10分钟内即可完成关键信息的结构化提取,并自动生成临床指标趋势图,显著提升病史整理效率。
但单纯提高效率并未充分发挥数据及AI的全部潜力。“更重要的是,有了这样的工具,我们还能不断将高质量的数据沉淀下来。随着病例积累至数百甚至上千例,再通过对这些数据开展算法学习,就有希望挖掘出具有临床指导意义的新发现,进而反馈于诊疗决策,帮助医生实现更智慧的医疗实践。“李丽莎表示。
能够看到的是,上海在医疗数据可信流通领域的探索还在深化中。以本次论坛上首发的全国医疗数据网络观数台为例。据生物芯片上海国家工程研究中心(公司)副总裁、芯超数据首席运营官李苇刚表示,该平台着力解决的是真实世界数据流通过程中“第一公里”的难题,这也是当前行业面临的一大痛点。
“常见的情况是,数据需求方会问数据方‘你们有哪些数据’,而数据方则反问‘你们具体需要什么数据’。双方往往难以快速达成数据需求的一致。观数台的核心价值,正是在于为数据需求方和供应方搭建起一座沟通的桥梁,有效回应了这一关键问题。”李苇刚进一步解释道。
陈哲亦向记者透露,接下来罗氏计划联合医院与企业等合作伙伴,在数据应用方面开展更多尝试,探索方向将涵盖血液肿瘤、流感等多个疾病领域。