训练模型|算力时代,谁主沉浮( 二 )


清华大学教授陈文光与张云泉在2020年推出了相应的AIperf测试标准,并致力于将其国际化 。但他坦言:“推出一个国际化的测试标准是很有难度的,后续还要努力 。”
“蛮算”的AI计算
在实际应用中,传统超算最适合用于科学和工程计算,这类计算有可计算模型,可以发展有很高精度的算法,计算结果精度也非常高 。但有些问题是科学计算力不能及的,如缺乏数学模型的问题和超高维问题 。这时,以机器学习为代表的AI计算就派上了用场 。
不过,张林波介绍,机器学习等是一种类似统计的方法,与科学计算相比其结果精度不高 。另外,AI计算还有稳定性问题、模型泛化受限等问题 。
他举例说,在新冠肺炎疫情暴发之初,许多人一窝蜂地用肺部影像识别来鉴定新冠病毒感染,发了很多论文,但后来发现这些论文的结论几乎没有可用的 。
“图像识别是机器学习最擅长的领域,发生上述情况的原因可能是训练数据太小或是机理不清,但或许这才是AI计算要去深究的,比如摸清机理后设计更先进的算法等 。”基于现阶段AI计算机的作用,张林波认为现在的“人工智能计算”简称为“智能计算”或“智算”有点误导人——“这样的AI计算并不‘智能’ 。”
“没有知识库、没有逻辑处理能力,当我们搞不清楚某问题的机理时,拿一个神经网络靠机器的规模去模仿它,这不叫‘智算’,叫‘蛮算’ 。”张林波说 。
国家气象信息中心副总工程师沈文海对此产生了共鸣 。他提出,气象部门也在做AI应用方面的探索,但都是各自为战——围绕某个痛点,如AI识别云图、台风规模和路径等,把数据拿来、接入计算资源、识别一番,确实有点“傻算”“蛮算”意味 。
“我们缺乏一个长期计划或整个气象部门的AI规划 。”沈文海认为,长此以往就有很大的弊端,一是没有对机理成因方面的探讨,二是低水平重复 。
“制定一个覆盖整个气象部门的AI应用发展规划,确实很有难度,并且这会引发对算力中心的新需求 。”沈文海说 。
融合发展仍是趋势
对算力中心提出新需求的,还有时下热门的数字孪生 。
数字孪生是机器学习领域非常重要的研究方向之一 。在借由大量传感器将物理世界数字化、虚拟化的数字孪生世界里,AI可以做的事情很多,包括预测物理世界未来如何进一步演进、衍生 。
中国科学院半导体技术研究所研究员李卫军说,数字孪生“绝对需要超大的一个计算系统”,因为它不仅需要包含神经网络计算,也需要很多逻辑计算 。“这是一个大型的逻辑计算与抽象思维相结合的应用场景” 。
从本质上来说,高性能计算和AI计算都是在模拟人的智能:前者模拟人的逻辑计算能力,后者模拟的是人的抽象思维 。只不过,超级计算机现在在逻辑计算方面比人的计算能力强亿万倍,而AI计算机目前却只能用深度神经网络来获得一个近似的结果 。
显然,两种不同的能力也不能用同一种标准评价孰好孰坏 。
李卫军认为,将来数字孪生要发展,需要传统超算与AI计算实现融合,这是逻辑计算和抽象思维的一种融合,虽然它需要怎样的计算结构和算法目前还不得而知 。
在HPC和AI融合发展的道路上,排在全球超算TOP500榜单前列的“大机器”先走一步 。
日本“富岳”超级计算机(Fugaku)和美国“顶点”(Summit)不仅科学计算能力出众,而且能支撑大规模的AI计算(如图计算)需求 。这缘于它们的异构架构——高性能CPU支撑其高精度浮点计算性能,大量加速芯片支撑深度学习应用 。它们作为世界上最先进的计算机,多少代表着未来计算融合发展的方向 。

推荐阅读