|
科技日报:https://digitalpaper.stdaily.com ... t_591553.htm?div=-1
【深瞳工作室出品】
采写:本报记者 都 芃
策划:刘 恕 李 坤
沿出城公路行驶20余公里,在植被覆盖的山脚下,一处灰白色的现代建筑藏身于此。这是西部某城于2022年开工建设的智算中心。
这座西部小城夏季平均气温仅有23摄氏度,凉爽的气候、较低的土地价格,以及丰富的清洁能源,吸引了大量算力企业来此投资。
不愿具名的业内知情人士告诉记者,这座千卡规模的智算中心,上架率不足50%。即便已上架的服务器,实际利用率不足30%,而年运营成本则超过3000万元。
在全国,这样的智算中心不是个例。
截至2024年11月,全国已投运的智算中心项目近150个,在建和规划建设的智算中心项目近400个。据浪潮人工智能研究院测算,我国智算中心平均算力使用率仅为30%。
人工智能技术的飞速发展,催生智能算力建设热潮。但在这股热潮下,不少盲目上马的智算中心正在空转,大量闲置算力等待激活。
高质量需求遭遇低质量扩张
算力是计算机处理数据能力的统称。如果把大模型等人工智能产品看作一辆高速行驶的汽车,数据是汽油燃料,算力则是发动机。根据运算精度、效率等指标的不同,算力大致可分为通用算力、智能算力、超算算力等。其中,平衡精度与效率、能够执行复杂机器学习算法的智能算力,是当下市场抢手资源。
工信部数据显示,截至2024年底,我国算力总规模达280EFLOPS(EFLOPS表示每秒百亿亿次浮点运算),其中智能算力规模达90EFLOPS,占比32%。
赛迪顾问曾发布报告估计,2023年,中国智能算力需求达到123.6EFLOPS,但供给仅为57.9EFLOPS,有超过50%的智算需求未得到满足。随着大模型等人工智能技术的发展,这一缺口不断扩大。
智算需求高涨的同时,部分已经建设完成的智算资源却长期处于闲置状态。
上述知情人士告诉记者,目前对于各地智算中心的闲置率没有准确统计数字,但据他估算,部分三四线城市中小规模的智算中心,整体利用率不足三成。
脱离实际需求的盲目建设是导致部分算力闲置的重要原因。人工智能技术快速发展初期,部分地区为了培育和支撑当地数字经济产业,通常鼓励建设算力中心等数字基础设施,并予以现金补贴等优惠政策。
例如,2023年云南昆明出台10条措施加快人工智能产业发展,提出支持智算中心、算力大模型服务平台等建设,按平台软件和硬件设备实际投资的15%给予补贴,最高不超过5000万元。
同年,安徽省也出台政策支持各类市场主体建设智算中心,对规模400P(1P为每秒计算1000万亿次)以上单体智能算力建设项目,省市按1∶2比例对建设和运营经费予以补贴。
软通动力首席人工智能官金亚东认为,在人工智能产业发展初期,算力资源紧缺,建设投入成本大,对算力供给方予以补贴等支持政策符合产业初期发展需求。
但补贴吸引来的并非都是理性投资者。金亚东表示,许多快速上马建设的智算中心通常由分散的社会资本和城市资本建设。“这些资本的特点是资金充足,但不懂行业,很难找到合适的需求方。”他说。
追逐短期利益的“外行”投资者缺乏对人工智能技术发展趋势的深入分析,以及配套相关产业规划,这使得部分智算中心建设时只追求单一指标,导致“建成即落后”,难以满足市场上日渐复杂的智算需求,低质量算力供给出现过剩。
上述知情人士举例说,高性能智算中心服务器通常采用CPU(中央处理器)、GPU(图形处理器)、NPU(神经网络处理器)等相互混搭的异构计算架构,以充分发挥不同算力芯片在性能、成本和能耗上的优势。“但有些所谓的智算中心大量配置同一类芯片,花了不少钱,其实应用场景很窄。”他说。
不仅是芯片,为了充分发挥服务器性能以及保障稳定运行,高性能的智算中心还要在存储、散热等方面进行强化设计。中国科学院计算技术研究所研究员张云泉此前在调研中发现,部分智算中心的机架功率密度不足15千瓦,远低于高性能人工智能训练所需的至少40千瓦的功率密度要求。“真正能支撑大模型训练的高端算力中心很少,且训练效率不超过30%。”张云泉说。
为闲置的算力找合适的需求
当下,围绕人工智能大模型产生的训练需求,毫无疑问是智算市场中的主力需求。但随着以DeepSeek R1为代表的推理模型的火热,智算需求也在不断发生变化。
如果把训练阶段的大模型看作学龄前儿童,其需要家长投入大量精力教会它们基本技能。而进入到推理阶段的大模型,则可以算是具备生活自理、自主学习能力的青少年,不再需要家长投入大量精力,也就是算力进行高强度教育。
训练和推理阶段对算力需求的差别主要体现在精度和规模上。训练阶段,算力精度至少为16位浮点,才能基本保证计算准确性。但进入推理阶段,16位浮点精度可谓游刃有余,即使是更低的精度也可以有效满足需求。而在规模上,相比于训练阶段动辄千卡、万卡规模的算力需求,推理阶段所需的算力甚至可以被容纳在一个与电脑机箱大小相当的推理一体机中。
推理模型的特点给市场带来了明显变化,算力需求正在变得更加碎片化。“DeepSeek爆火之前,智算中心主要瞄准大企业、大模型的训练需求,现在很多小公司、AI创业者基于DeepSeek等模型的研发,也对智算产生大量需求。”上述知情人士告诉记者,这些算力需求单独来看并不大,对灵活性和成本敏感度要求更高,但积少成多后,总体需求仍十分可观,有望激活部分闲置的算力资源。
“世界上没有用不掉的算力,重点在于找到合适的应用。”金亚东认为,当下算力市场更重要的是做好“散对散”之间的配对,单体100P至1000P规模的算力供给方和大约5000万家中小型企业或许才是未来市场的主角。
作为经济发展的“毛细血管”,数量众多的中小企业有着更明显的长尾效应。他们广泛参与到算力消纳中,能够让整个产业生态更具活力,推动资源高效配置。
在浙江杭州临平区,当地在2021年率先提出发展算力产业,建成全国首个算力小镇,聚集起算力产业链上下游企业1700余家。
2024年10月入驻算力小镇的优服工业,是一家专注于数控机床后市场一站式服务的中小企业。基于“AI+AR”技术,公司打造出数控领域的“超级工程师”,通过AR眼镜实现了数控机床的智能报修和远程运维管理。
“我们需要的算力规模,在国内数控机床维保行业里目前是最大的。但现在我们不用到处去找算力,小镇平台就可以直接提供,并且价格比市面上还要低,这对成本控制很有帮助。”优服工业运营经理叶飞说。
像优服工业这样需要算力的中小企业,在小镇里占了大约70%。面对它们的算力需求,算力小镇打造出算力调度平台和大模型服务平台,整合阿里云、中国联通等多方资源,解决项目资源分布不均、供需匹配不足等难点痛点问题,为其他地区借助算力服务广大企业,尤其是中小企业提供了可供参考的样板。
推动算力资源高效配置
碎片化、分散化的算力需求,对于当下的算力市场既是机遇,也是挑战。如何激活闲置算力资源,推动算力普惠,让算力用得到、用得起、用得好?相关部门正在围绕提升供给、激活需求两方面发力。
中国信息通信研究院院长余晓晖认为,我国算力基础设施建设已达到世界领先水平,但标准化、普惠化算力服务统一大市场尚未形成,需要在统筹全国算力设施区域优化布局的基础上,解决好算力服务统一市场构建和资源全域有效利用问题,促进算力资源高效配置。
围绕建设统一的算力服务体系,我国多地开展积极探索,相继发布了10余个算力调度平台,一些企业也开展了算力并网探索。
|
|