当前,人工智能已进入场景落地的关键阶段。随着大规模模型数量逐渐收敛、推理应用数量爆发式增长,基于代币数量的AI推理成本和效率问题日益凸显。在此背景下,先进的存储能力作为数据元素的主要载体,是提升AI推理性能、控制成本的关键。 11月4日,在中国信息通信研究院组织的北京活动“耕耘中国行”上,来自信息通信研究院、中国移动云、华为、Silicon Mobile等机构和企业的嘉宾深入探讨了先进存储功能在模型开发中的支撑作用、AI时代的大规模AI挑战及未来发展趋势。人工智能推理面临成本与效率的困境。在“元年”“大规模模型部署”,各行各业不再满足于拥有庞大的模型,而是希望将模型功能无缝集成到现实业务场景中。从投资研究、档案分析到智能客服、医学影像辅助诊断等,人工智能推理在数千个行业中发挥着作用。但随着代币调用数量的爆发式增长,推理成本不断上升,“不可能、慢、贵”已成为行业通病。与会专家指出,今天,人工智能推理技术在千行百业中发挥作用。推理不再是简单的问答,而是海量、多模态、动态增长的数据的持续处理过程,各种数据类型要求存储系统能够同时高效地处理文本、图像、音频、视频甚至传感器数据,同时创建高质量的数据集变得非常重要。华为数据存储产品线战略与业务发展部总裁王旭东表示,数据存储功能面临三大挑战:数据无法妥善管理、算力无法交付、成本无法降低。”华为数据存储产品线战略与业务发展部总裁王旭东表示,各种推理数据源很难形成高质量、可持续交付的数据集。系统带宽和IOPS(每秒读写次数)不足,导致GPU等计算资源长期闲置,成本高昂。传统存储架构无法满足这些需求。满足高性能、低延迟、异构数据集成的要求,给业务发展带来了瓶颈,阻碍了AI应用的部署。要克服推理困境,需要克服两个技术障碍:“内存墙”和“容量墙”。据与会专家介绍,昂贵的HBM(高带宽内存)h。性能强大,但价格昂贵且不能无限扩展。这限制了模型理解时间并增加了硬件成本。 HBM可以通过高性能AI SSD更好地扩展,同时大容量AI SSD可以作为HDD的替代品。此外,企业对安全、可靠、环保的数据存储解决方案的要求也越来越高。先进的存储能力是克服这种情况的关键。新京报贝壳财经记者在会上了解到,我国存储技术已取得技术突破,有能力在AI领域引领世界。通过我们的技术创新和环境协同模式,我们将加速在数千个行业的应用。中国移动云能力中心首席项目工程师周宇表示,移动云特别采用分层缓存调度、高速数据互联技术,增加带宽,独享多模数据。存储和标准化、架构捆绑和重组以及其他技术帮助改善了这种情况。它还通过成熟的存储、高密度闪存、数据缩减和具有本地 SPU 密度的服务器来提高存储性能并降低成本。移动云作为未来趋势,将推动存储从被动存储走向智能计算协同,逐步实现高密度全闪存存储、高速数据互联、存储与计算融合等技术,加速技术融合,构建长期的多体联合存储体系,并强调生态协同。王旭东介绍,华为针对AI推理推出了UCM推理内存数据管理技术,从“集中优质数据、加速AI训练、优化推理”三个角度打造了AI推理加速解决方案。据报道,UCM可降低首令牌延迟高达90%,系统性能提升高达22倍,上下文推理窗口扩大10倍以上。北京硅基流科技有限公司首席解决方案官谭安波表示,硅基流打造的AI基础设施工具链拥有适应多模态模型和国内外算力的核心推理框架,适应升腾,优化DeepSeek模型,实现性价比提升,从推理框架扩展到MaaS服务平台,实现主流开源模型,通过推理加速和API为开发者提供服务,在解决方案上结合UCM技术卸载KVCache,释放显存,提升性能。n 解决长上下文等痛点。基于存储的 KVCache 解决方案显着提高了系统性能。中国信息通信研究院首席专家石友康表示,学校开展了政策研究、标准制定和测试服务等多项工作,并与产业链企业合作成立了“计算机产业发展方阵先进存储人工智能推理工作组”。同时他提出了三点建议:鼓励存储前沿技术的研发和创新,推动存储与计算更加紧密结合,加强存储与计算协同产业生态圈的打造。这份报告要求业界同仁凝聚共识,共同推动我国存款会计行业协调发展。新京报贝壳财经记者 魏博雅 编辑杨娟凡纠正穆湘桐