经济观察网记者张玲“中国有数百种通用型号,其中90%用处不大,无法开发,只会加剧资源和人力的浪费,应该被淘汰。”1月18日,在“北京CGT新趋势大会”上,中国科学院院士、益博生物首席科学家陈润生向经济观察报谈了他对国产大模型的看法。
陈润生是中国最早从事理论生物学、生物信息学和非编码RNA研究的研究者之一,也是中国开设生物信息学课程的第一人。他参与了人类基因组计划,负责分析遗传密码的生物信息,还参与了水稻遗传密码的解码。
三年前,年过八旬的陈润生放下学业,加入一家从事免疫细胞基础研究和临床应用的企业益博生物担任首席科学家,希望将基础研究转化为产品,解决实际问题。
现在,陈润生已经83岁了,他仍然活跃在中国科学院的公开课上。他的生物信息学吸引了成千上万的年轻人来上课。陈润生认为,为了让1000多人坐在观众席上认真听讲,我们必须向他们传达有用和有趣的内容。为了和年轻人打交道并“跟上潮流”,陈润生每天都看书,自学大模特。
在generate的大模型蓬勃发展的2023年,陈润生团队开发了医疗多模态数据智能集成计算平台“灵枢”,该平台可以将当前的生物医学大数据整合为一个大模型,其核心内容包括一个算法盒子、三个医疗应用和三类多模态数据。目前,陈润生团队正在尝试将中医数据整合到模型中,希望实现“中西医结合”,为疾病治疗带来更大的效益。
在陈润生看来,真正专业的大模型应该是纵向构建的,能够解决具体的实际问题,提高社会效率,在某个领域做到第一。他认为,中国应该考虑建立一个国家模式,这是适应当前国际竞争的一种方式。
来源:图片由受访者提供
|对话|
经济观察报:谈谈你们团队开发的“灵枢”医疗数据平台。现在进展如何,结果如何?dct变换系数的物理意义
陈润生:我希望将大模型应用到健康领域,所以我建立了一个大模型,希望整合与生物学相关的信息,如转录组、警句和蛋白质组,并用大模型进行分析。
我希望这个大模型能有一些特色,所以我会融入中医的知识。中医与现有知识的融合度较低,我认为这种融合具有深远的意义。多模态融合不是简单地将信息加在一起,而是内部知识之间的相互作用。如果我们成功地添加了中药,它可以更好地改变医学参数,那么它表明中药的信息是不可替代的,并且这样的信息可以提高对大模型的判断。
当然,会有一些技术问题,因为没有先例,美国人不会把中医纳入大模型,因为他们不懂。将中药纳入一个大模型相对容易,但其成分比西药复杂。但是,添加中药非常困难。这些内容中没有语言。我们已经尝试建立一些规则,但尚未完成的内容正在不断完善。
我希望建立一个专业的大模型,用专业的数据训练它,它就会成为一个专门的“大脑”。《灵枢》是这样的。中医建筑在系统中的建立是一种模式。为什么叫“灵枢”?我们询问了一些老中医,他们提到中医最经典的两部经典是《灵枢》和《苏文》。我认为灵枢这个名字在语言方面更优美。
经济观察网:以医疗领域的大模式为例。什么样的大模型才是真正有价值的?
陈润生:人工智能需要学习。在相同的技术条件下,知识和数据的积累决定了一个模型的质量。要做出一个能够真正为临床服务的大型模型需要付出很多努力,主要是因为数据收集困难。比如做一个成像的大模型,只给它几个图像。这个模型肯定是没用的,它需要提供几十万甚至几百万张图像。有必要让模型学习所有可能的情况,以便它可以成为权威。
如果我们笼统地谈论一个通用的医疗模式,我不相信有人能做好。我更喜欢立式模型。真正专业的大模型应该是纵向打造的,能够解决具体的实际问题,提高社会效率,在某个领域做到第一。
例如,可以制作一个模型来管理所有患者的登记、治疗过程和其他相关信息,但它不涉及特定患者的诊断和治疗。医疗过程涉及多个方面,如临床检查、影像学检查等。整个过程可以通过一个大模型来管理,许多问题都可以得到解决。更现实的例子是内科。其实内科就是把患者的各种指标集中到医师身上,未来大模型可以处理所有指标。医疗领域最先被取代的群体可能是医师,因为他们主要负责整合检测指标。
一个好的大模型应该真正解决实际问题,并具有足够的准确性和效率。中国有数百种大型模型,其中90%用处不大,只会加剧资源和人力的浪费,应该被淘汰。
中国应该考虑建立一个国家模式,这是适应当前国际竞争的一种方式。
经济观察报:你在益博生物的主要职责是什么?
陈润生:在基础研究方面,中科院的研究人员已经积累了一定的能力。这些积累基本上解决了科学问题,但也可以转化为解决实际问题的产品。这是我在这里的一个重要原因。
人类依靠免疫系统来抵抗疾病。免疫系统是如何工作的?它涉及许多细胞,如众所周知的T细胞(一种淋巴细胞)、NK细胞(自然杀伤细胞)等。但是谁能察觉哪些是异物呢?感知后,它将信号传递给具有杀伤功能的免疫细胞?这需要DC细胞(树突细胞)承担起最初的责任。pantum p1000驱动
DC细胞一直是免疫系统和疾病相关免疫研究的重要领域。既然这种细胞在整个免疫系统中起着如此重要的作用,我们是否可以人为地给它添加一些信号?我们能人工改造DC细胞并通过添加一些物质来刺激免疫系统吗?这涉及到很多与分子水平有关的内容,也与遗传密码有关,这是我在这个领域可能发挥作用的地方。
经济观察网:我国生物信息学领域的产学研融合情况如何?
陈润生:在我熟悉的领域,中国在基础研究方面做得很好。在一些狭窄的领域,如非编码RNA,论文和其他引用数量甚至超过了美国,但我们的转化水平比美国差得多。
我们需要建立更有效的机制来实现基础研究成果的转化。过去,研究人员只发表论文,发现某个靶点与肿瘤有关,但他们没有思考如何将其转化为可用的药物,这需要一套转化机制。美国大学有一个由专利申请人和律师组成的特殊团队。完成研究后,研究人员自然会联系学校的内部团队,他们会帮助处理转型的各个方面,非常顺利。
因为最近的转型工作,我也接触到了一些与公司相关的事务,并发现这些事务需要各自分工,而只有分工合作才能有效推进,而我们的角色永远是技术提供者。那些从事后端工作的人是不可能取代我们的,因为他们没有原创发现,但我们很难将原创发现转化为产品和应用。在转变创新时,科学家要么采用合作模式,要么不得不改变角色,迫使自己从科学家变成首席执行官。
经济观察网:精准医疗研究可能成为国家间新一轮科技竞争的关键。这会增加基因数据在国家间流通的难度吗?
陈润生:这是一个基本而重要的问题。如果遗传资源完全封闭,不向外界提供信息,别人也不会向你提供信息,也就不会有交流。我们必须提炼敏感信息,并确定哪些信息可以交流,哪些信息需要保密。例如,如果中华民族具有特定的遗传特征,显然需要保密,但这并不意味着人类基因组测序的结果不能公开。如果我们只对黄种人进行测序而不公开这些结果,那么人类基因组学就无法对不同种族进行多组分析。实达网络百度百科
我们自己的人类基因组数据是最丰富的,将来我们可能可以用这个来玩游戏和与其他国家交流。
经济观察网:渐冻症患者蔡磊希望人工智能能够帮助攻克渐冻症等疑难杂症。从科学的角度来看,这种可能性存在吗?
陈润生:这种可能性存在。大模型至少可以为渐冻症的诊断和治疗提供更好的信息,这是可以实现的。通过积累更多的信息并通过人工智能进行分析,科学家肯定可以找到更有效的解决逐渐冷冻的方法。当然,这需要大量的工作,例如收集渐冻症患者的数据和临床表现,然后收集这些信息来建立一个纵向模型,然后看看我们是否可以获得临床医生以前不知道的新发现。如果有新的发现,就会有可能帮助患者的新尝试。
经济观察网:您对科学家精神的理解是什么?
陈润生:科学家的精神就是研究科学规律、探索科学真理、实事求是。
我已经83岁了,我仍然自己做所有的演示幻灯片,而且我每天都要看书。我自学了大模型。你不能放弃学习,这是做科研的基本素质。如果你有一天不学习,你肯定会落后于潮流。
版权声明:以上内容为经济观察报原创作品,版权归经济观察报所有。未经经济观察报授权,严禁转载或镜像,否则将依法追究相关行为人的法律责任。版权合作请致电【010-60910566-1260】。
张玲经济观察报记者
大健康新闻部记者关注健康领域的大公司、大医生、重要事件和人物邮箱:zhangling@eeo.com.cn。
未经允许不得转载:科技让生活更美好 » 专访中国科学院院士陈润生:中国90%的大模型该被淘汰