发布日期:2025-04-12 22:02点击次数:98
近日股票配资哪个品牌好,第十三届中国电子信息博览会(简称“电博会”)在深圳会展中心举行,AI硬件相关展区尤为热闹。
回溯大模型发展历程,以ChatGPT为代表的大模型掀起训练热潮,算力需求集中于大规模数据训练阶段,依赖昂贵的GPU集群,推高行业门槛,形成“国与国算力竞赛、头部企业主导”的格局。
然而,随着DeepSeek等大模型通过算法优化与混合精度训练降低推理成本,AI算力需求正从“烧钱式”训练向高效能推理转变,这一趋势在电博会上成为焦点话题。
这一变化直接催生AI一体机需求井喷。神州数码展示的神州鲲泰问学一体机DeepSeek版、中昊芯英的刹那高性能TPU芯片等产品备受关注。
据参展商介绍,支持32B模型推理的一体机价格打到了十万元级,主打“开箱即用”全流程部署,满足企业数据本地化需求。
存储作为AI的“血液系统”,也在适应新需求。大模型训练需TB级带宽、百万级IOPS及毫秒级延时,数据采集阶段要支持多源实时接入,推理完成后需低成本归档。希捷科技高级架构师程津辉强调,机械硬盘与固态硬盘将长期共存,前者在成本与数据持久性上占优,后者胜在性能,二者协同满足不同场景需求。
电博会上,从一体机厂商到存储企业,折射出AI硬件产业链的深层变革:当算力从训练竞赛转向推理普惠,数据从大水漫灌变为精准处理,硬件设施正从“奢侈品”走向“必需品”。而这场始于电博会的技术展示,正是AI硬件迈向“深水区”的缩影。在算力需求结构变迁中,国产厂商迎来突破窗口,行业则在算存协同、场景适配中探寻新平衡。
新战场:算力需求转向推理
AI的三大核心要素包括算法、算力、数据。数据是训练和优化模型的基础资源,算法决定了数据处理与问题解决的方式,而算力则为复杂计算提供硬件支持,三者共同推动人工智能技术的发展与应用。
AI时代需要怎样的算力?“计算机系统结构的教科书称‘Make the common case fast’,也就是加快经常性事件。经常性事件的特点是耗时最多、频度最高的事件。在AI计算中,经常性的事件是巨大数量的矩阵计算。”中国计算机行业协会信息存储与安全专委会会长谢长生表示。
AI是算力的吞金猛兽,以GPU为代表的算力设施急剧增长,成为商业的最大赢家,全球范围内万卡、10万卡集群不断涌现,掀起了建设浪潮。
ChatGPT等大模型的出现,AI算力集中在训练,规模是以大数据和算力堆砌为主,需要GPU卡作为集群训练,费用非常昂贵。
其次,大模型对算力、存储性能要求高,造成大模型在国内的受众群体明显偏少,主要是国与国之间的算力竞赛,以及国内头部互联网厂家和大模型企业为主。
与此同时,数据的利用也比较粗糙,前期大模型是采用通用大数据大水漫灌的方式,把数据“堆”在一起进行计算,整体数据的清洗比较低。
曙光存储华南大区行业总监叶国烽谈到,DeepSeek的出现让AI普惠成为了可能。通过算法优化和混合精度训练,现在推理模型成本大幅度降低,用一张卡到数百张卡都可以实现集群的搭建,且费用可控,它的受众群众是全行业或是全民。
如今在训练过程中引入多阶段的动态数据生成,以及结合私有领域的算法,推理模型的精准化和高效性都得到了很大的提升。
这也给算力基础设施带来了新的变化,原来都是单一大模型训练,算力以单精度为主,DeepSeek时代,多模态模型包含了训练、微调和推理,不同应用对算力的需求的关注点也更多,这也是国内的硬件厂家的机会。
一体机井喷:私有化部署撬动蓝海
DeepSeek等大模型的迭代推动了AI算力服务模式的更新升级,当前提供AI算力服务的模式有公有云算力服务、智算中心、私有云和AI一体机。
在本届电博会上,神州数码、西部数据、腾讯云、研祥高科等头部企业集体亮相,展示了最新的AI服务器、存储解决方案等产品。
其中,神州数码展示了神州鲲泰问学一体机DeepSeek版。中昊芯英带来的刹那高性能TPU人工智能芯片,这款芯片拥有自主可控的IP核、全自研指令集与计算平台,技术突破也正是数字经济“算力底座”的核心支撑。
大模型由通用转为专用,原来的数据都是公共的数据,如今结合企业自己的领域数据来做精准的推算推理,一体机的需求便应运而生。
值得注意的是,一体机的需求井喷会或对公有云市场造成一定程度的替代。
亿万克华南总监柳星向记者表示,在他接触的客户中,大多会希望自己的数据独有,不希望将数据放在公有云市场去进行推理训练。
记者在现场向AI一体机的参展商了解到,以支持32B模型推理Deepseek一体机为例,价格在十万元到十几万元不等,主要取决于算力卡的类型。
这家厂商告诉记者,公司主要采用的是英特尔的算力卡,性价比更高。如果选用英伟达的4090或者H系列显卡,价格肯定不止。“他们会针对下游客户的需求量身定制,主打全流程部署,满足开箱即用的需求。”
另一方面,针对部分政企客户要求国产算力的需求,这家厂商也对如沐曦、寒武纪等国产CPU进行了相应的测试。
叶国烽谈到,DeepSeek时代更关注的是算力要求的降低,给国产GPU算力发展提供了机会,“存算网紧耦合,推理应用强协同”,更加关注用户的体验。
催生存储高带宽、低延时需求
如果说大模型是AI时代的大脑,存储是支撑运转的血液系统,DeepSeek时代存储需求正悄然发生变化。
这其中的关键在于算力、存力、运力必须平衡。“算得再快,数据跟不上就不行,而数据跟得上就要存力和运力同时来平衡。”谢长生谈到。
训练和推理过程中会涉及多种存储介质,如高带宽的内存,算力设施里的标准内存,机器里的固态硬盘,乃至外置连接的网络存储。
为适应AI的新需求,中科曙光旗下曙光存储发布了双引擎存储节点ParaStor F9000,这套产品使用于多模态大模型训练、企业级高并发推理以及自动驾驶和具身智能两个新型场景。
叶国烽谈到,大模型对存储的要求不一样。在数据采集和推理阶段,需要对多源数据采集,比如视频、文本、图片的实时采集。同时需要存储支持分层,避免资源浪费,在数据准备阶段也需要存储支持动态清洗、数据转换和自动化标签,提升前期数据准备的效率。
在训练与推理过程中,千亿级的参数模型训练,需要TB级的带宽以及百万级的IOPS,以及毫秒级的延时。同时,保证加载保存的时间从小时级压缩到分钟级的效率。数据推理完成后,需要把数据做归档,实现数据从高速数据盘到低速的数据介质归档,最终降低存储的成本。
在此背景下,机械硬盘速度明显不及固态硬盘,业界因此有了被固态硬盘替代的声音。
对此,希捷科技高级架构师程津辉表示,机械硬盘和固态硬盘应该是长期共同发展的技术路线。成本上,机械硬盘更占优。性能上,固态硬盘更占优。耐用性来看,机械硬盘的磁介质在不加电的情况下存放时间更长,假设数据硬盘有损坏,数据部分丢失,也能找回绝大多数数据。固态硬盘目前擦写的次数和写入的容量,一点也不逊于机械硬盘,但是在保存的条件和时间与机械硬盘稍有差距。
大数据存储作为数字经济的核心基础设施,在数字经济潮涌与大模型井喷的时代股票配资哪个品牌好,算力正如水、电一般,逐日成为现代社会赖以生存的稀缺资源。