深势科技首席科学家张林峰解密,为什么AI+Science突然热?
        来源:中国电子报、电子信息产业网    作者:editor    发布时间:2021-11-16

深度2.jpg

今年,AI+Science(AI+科学研究)突然变成焦点,全球主流IT厂商纷纷在该领域进行密集布局,无论产业界还是学界,也似乎有了一个共识:传统科学领域将是AI的下一个主战场。因为AI+ Science的火热,深势科技首席科学家张林峰今年轮番被很多重要的科技论坛邀请演讲,分享这个领域的趋势。

做微观世界的达索?

从介绍来看,深势科技是一家将AI与分子模拟算法结合,打造微尺度工业设计平台的初创公司。仅从这样的介绍,记者依然很难理解,这家公司到底做什么,又为什么AI+Science突然热起来?

“就技术出发谈技术永远是比较复杂的,从应用场景去看就相对好理解。” 深势科技创始人、首席科学家张林峰这样回应《中国电子报》记者的问题,简而言之,深势科技是利用“多尺度建模+机器学习+高性能计算”加速微观尺度下的研发的问题。

“比如药物研发,我们会首先从构成药物的最基本的分子出发,通过设计分子的种类和结构,进而把分子搭建组合成能治病的药物。比如新能源电池研发,如果把电池中的锂换成钠,众所周知,钠离子的半径比锂离子更大,于是相应的材料会膨胀变得更大,导电率和导电效率或许就会低一些。无论是药物,还是材料的性质,本质上都要归因于微观的原子的组成成分,如果元素变了,其性能与结构也会发生变化。我们所做的就是解决微尺度下的设计精准度与效率的问题。”张林峰说。

不同的领域有不同的专业设计工具,半导体领域所用的EDA设计工具中,国际三巨头Synopsys、Cadence和Mentor Graphic占全球市场的份额超过60%;在航空航天领域,达索公司的CATIA三维交互设计软件,是不折不扣的霸主,波音、空客、火箭和空间站都用该软件设计。“我们的目标是要做微观设计世界的达索公司。”张林峰说。

“希望通过我们的计算模拟工具能够让制药企业、电池和材料企业得到接近实验精度的物质的物理、化学性质,进而获得理想的药物、材料等,把以实验为主的研发范式,变为‘计算设计-实验验证’的研发范式,大大提升效率与准确度,来去赋能这些产业,这是我们做的事情。”张林峰表示,与上一代的打分函数、经验力场为代表的经验方法不同,也区别于常用的AI从大量实验数据中提取规律的“归纳”方法,深势科技是通过“多尺度建模+机器学习+高性能计算”的组合,打造成一个工业设计平台,能够实现多尺度分子模拟的精度与效率的统一。

具体而言,深势科技的算法是利用AI大幅加速量子力学、分子动力学等物理学模型的求解,再结合高性能计算等计算手段,计算分子尺度的物理、化学问题。在保证了计算效率和精度的基础上,还具备很强的通用性,可以为药物、材料领域带来极具突破性的计算模拟以及设计工具。

AI那么热,为何AI公司不赚钱?

为什么AI+Science又突然热起来?张林峰表示,这或许与AI从数据分析,到科学模型,都在创造新的机会,并日益展现出在科学领域解决问题的巨大潜力有关。

张林峰认为,长期以来我们对世界的认知遵循着两大范式:开普勒范式和牛顿范式。前者从数据中提取规律,后者寻求基本原理。两者都能用来解决实际问题。当代AI在CV、NLP等领域的应用是集前者之大成,而当代仿真模拟和工业设计软件则是后者的精华沉淀。开普勒范式面临的挑战是所谓“知其然不知其所以然”的问题,即模型的可解释性、可迁移性等;而牛顿范式面临的挑战是带来棘手又漫长的计算过程,即所谓“维度灾难”。“AI+Science”的本质实则是两种范式的结合。由此,带来“AI+Science”的系统性机会。以机器学习为代表的AI具备复杂数据处理的能力,可以使得训练出来的物理模型兼具微观尺度的精度和宏观尺度的效率,能够真正有效解决科学计算中的“维度灾难”问题。

以深势科技的分子动力学模拟项目为例,这个项目获得了国际高性能计算应用领域最高奖项“戈登·贝尔奖”,它是以量子力学、分子动力学第一性原理进行精准建模,用机器学习方法加速计算效率和搜索效率,实现了精度与效率的统一,也是人们第一次把机器学习、科学计算、高性能计算整合在一起,这套方法可以系统性地解决药物设计、材料设计和化工设计等领域中的微观设计层面问题,实现“既快又准”的计算模拟。

一方面我们看到AI的赋能正在各个领域带来突破性的变革,另一方面却又目睹大量的AI创业公司不赚钱,难以为继的产业现状,如何看待这样的局面。

张林峰认为,事实上任何一个技术要盈利都需要找到现实痛点场景,用技术去解决它,而且解决它要有巨大效率提升和成本降低,要有足够的规模空间。比如互联网技术只是工具,淘宝用它解决了买家和卖家之间面临鸿沟的大问题,微信用它解决朋友之间连接与交流的问题,阿里与腾讯找到了不同的问题场景、痛点场景。

与此同时,作为公司经营者必须要思考,基于该痛点场景的商业模型,是否足以支撑一个公司的持续发展,或者说在产业链分工上是否可以成为独立的一部分。张林峰说:“比如说共享单车,它是否能够支撑一个公司独立运营,还是成为一个大公司、大平台的一部分,这需要思考。”

“从需求的规模化与提供能力的稀缺性来看,我们选择以AI+分子模拟来服务药物设计、电池材料设计,都满足了这两个维度。”目前药物研发与设计的格局就像20年前的半导体,仿真模拟与数据已经结合,但仍在持续探索的阶段;而电池材料的格局则像十多年前的药物设计,设计研发的需求正因为产业的发展而不断扩大,但计算模拟与数据处理的工具才刚刚登上舞台。无论是药物发现,还是新材料研发都是万亿级的大市场,其研发体系创新与变革将是巨大而广阔的市场。AI+Science给了科学计算一套极具颠覆性的解决方案,这套方案也重新定义了算力的使用方式、数据的生成方式、软件的开发方式、直到实际问题的解决方式。

从落地的角度看,目前深势科技的软硬件产品与技术,包括微尺度工业设计平台,已经在药物发现领域的蛋白质结构与机制研究,以及药物活性筛选、优化与设计中落地,与多家头部药企和新能源电池企业达成了合作。同时,推出了面向新型科学计算场景的Lebesgue云原生科学计算平台,可以帮助科研用户如同使用水电一般“即开即用”的使用算力。

深度1.jpg

新工业软件的新思路?

目前,在核心工业软件领域中的CAD研发设计类软件市场,法国达索、德国西门子、美国PTC以及美国Autodesk公司在我国市场占有率达90%以上。研发设计软件是一个需要持续投入和市场应用良性互动的行业,国外研发设计软件从二维的AutoCAD到三维的CATIA、NX等软件,基本上都经过了几十年的更新和迭代,掌握了核心关键技术,如三维几何引擎、约束求解器等,这些技术壁垒使本土软件处于被动局面。

“如果按照原来的传统思路发展工业设计软件,我们很难超越,但用新的思路和新的方法,就有机会。”张林峰认为,现在正处于一个拐点上,而要抓住拐点,需要用整合和融合的思路。数据和模拟手段的结合将对工业设计和控制产生巨大的影响,而计算模拟的发展也处于历史的拐点上,一方面,以多尺度物理模型为基础,高性能计算为引擎,机器学习为整合数据、连接不同的物理尺度,将电子结构、分子动力学以及宏观尺度的模型和数据放在同一框架下,能够引发微尺度工业设计体系的变革,带来精准度与效率的大大提升。另一方面,从底层技术创新到场景快速落地的链条也正在被打通。

就像三维设计软件必然会革二维设计软件的命一样,工业设计软件同样需要新的思路和新的方法,张林峰认为AI+分子模拟算法结合,将会在微尺度工业设计领域引发新一轮的设计工具革命。

除了新思路、新范式来做新工业软件,张林峰谈到的第二个维度是用户与技术迭代。全球设计软件发展到今天已经很成熟,那么作为新思路下的新工具,要想成熟,也同样必须经历与用户市场的互动与迭代,加速技术工程化、产业化。张林峰讲了一个故事,关于深势科技第一个工业级药物设计SaaS软件——Hermite。产品打磨初期,即获得了头部制药企业的高度关注,并在产品迭代过程中给出了非常充分的反馈。产品在部署到药企之前的不成熟,到部署后的逐步完善,整个过程的打磨都促使深势科技的团队必须从用户交互、与工业流程结合等更多的维度进行思考,并实现产品升级。

其实没有一个软件和服务,从诞生起就能够成熟,迭代很重要,并要在这个迭代的过程中不断找到专业的人来做专业的事,这是张林峰的第二体会。

张林峰谈到的第三个维度是开源社区。“无论是传统的以实验室为单位的开发模式还是闭源的商业软件开发模式,都没有办法满足领域内对新生产力工具的日益增长的开发需求。所以需要通过开源的合作模式,把希望通过计算建模突破科学边界,解决困难问题的人团结起来。”张林峰说。

关于AI+Science,关于深势科技,清流资本2B领域负责人任晓晨表示,“科学模拟是高端科技和制造发展的核心驱动力之一。从牛顿的物理世界到薛定谔的微观世界,人类对分子世界的理解和掌握是推动21世纪科技革命的最关键钥匙。期待与深势科技一起,共同见证和开拓人类探索世界的新边界。”


留言