训练模型|算力时代,谁主沉浮

【训练模型|算力时代,谁主沉浮】
训练模型|算力时代,谁主沉浮
文章图片
图片来源:unsplash
采访人员 赵广立
当今,“算力”越来越成为科技进步、经济社会发展的底座,但“算力”并非千篇一律 。
20世纪60年代,为解决大规模数值计算、仿真模拟等科学工程计算问题,超级计算中心应运而生,至今仍以大国重器的形象为诸多行业提供科学计算服务 。
21世纪前10年,互联网信息服务、高并发访问等网络计算与数据存储所寄的云计算中心开始落地,各大公有云平台拔地而起、攻城略地 。
近10年来,人工智能(AI)计算中心开始出现,主要用来处理影像、语音、自然语言等识别问题,综合应用多种技术实现推理、训练模型开发 。
这三类计算中心,虽然各自特点鲜明、用途有异,但超算与AI计算、云计算与超算、AI计算与云计算“我中有你、你中有我”的情形并不鲜见,相互之间的界限逐渐模糊 。然而,随之而来的以偏概全、以此代彼的乱象,竟逐渐成了一些地方建设算力中心的“糊涂账” 。
乱象源于缺乏相应测试标准
城市应该建设什么样的算力中心?如何推动算力中心健康发展?近日,在一场以“数智创新,算力赋能”为主题的2021算力中心健康发展研讨会上,中国工程院院士郑纬民等业内学者从不同角度提供了意见参考 。
中国计算机学会高性能计算专家委员会秘书长、中国科学院计算技术研究所研究员张云泉在发言时提到,此前,某市建设了AI计算中心,号称算力是超级计算机的数万倍 。“‘花钱少、算力高’这种不规范、不专业的对比让业内人士很反感 。”
张云泉说,AI计算中心很热门,但如何引导其健康发展,“是当下行业面临的一个重要议题” 。
国家信息中心2020年12月发布了《智能计算中心规划建设指南》,定义“智能计算中心”是基于最新AI理论,采用领先AI计算架构,提供AI应用所需算力服务、数据服务和算法服务的公共算力新型基础设施 。
“自从AI成为‘新基建’,各地政府争先恐后,出钱建设AI计算中心,但总的来说,应用还不是太明确 。”郑纬民在上述研讨会上说,无论超算中心还是AI计算中心,最重要的是应用匹配 。“当前最应该做的事,不是以新基建之名撺掇政府建设算力中心,而是要真正做出来几个实际应用 。”
这代表了业界务实的态度 。中国科学院数学与系统科学研究院研究员张林波也提出,很赞同各类算力中心应该各自发挥所长,做最适合的事情 。但他话锋一转:“AI计算现在有点咄咄逼人,好多人甚至觉得AI计算能够取代传统的科学计算 。”
“这是宣传不当引起的概念混淆 。”张云泉认为,在高性能计算(HPC)、云、AI融合发展的趋势下,要清晰界定三类算力中心各自的内涵与外延,以及它们之间的相互关系,明晰不同计算精度算力与不同应用之间的匹配 。
对算力概念的混淆曾闹出过啼笑皆非的事 。一次,张云泉向某学会领导汇报HPC的研制,不料却遭到“批评”:“现在都什么时代了,你还在谈高性能计算,太过时了 。”
概念混淆之后紧跟着的是价格乱象 。一般而言,算力配置不同会导致造价迥异——即使同等算力,不同的CPU主频、带宽及时延要求也会让机器造价差别巨大,但一些厂商拿AI计算中心“花钱少、算力高”作为卖点吆喝,就不属此类了 。
道理很简单:同样一个对外标称100P的算力中心,用建设AI计算中心的预算一定造不出超算中心的效果 。
“概念混淆、价格混乱的主要原因是没有对应的测试标准,孰好孰坏一测就知道了 。”张云泉建议,要在行业中推行与AI计算平台相适应的标准 。

推荐阅读