Gartner在2024年针对企业CIO和技术高管的一项调研显示,超过60%的中国企业计划在未来12至24个月内部署生成式人工智能。AI、模型的构建,将颠覆数据中心基础设施的建设、运维和运营。一个全新的数据中心智能化时代已经拉开序幕。
AI重新定义数据中心
从物理机时代到虚拟化时代,再到云计算时代,数据中心基础设施一直在持续进化之中,其形态、架构以及所用到的技术在不断变化,但唯一不变的是,它始终是业务创新的基石。迈入智能化时代,数据中心正加速从传统的成本中心向价值中心转变。以“AI+数据”为驱动的数据中心,将为千行百业的数智化创新提供源源不断的智能算力。
工业和信息化部、中央网络安全和信息化委员会办公室等部门联合发布的《算力基础设施高质量发展行动计划》中提出,到2025年,算力规模超过300 EFLOPS,其中智能算力占比达到35%。毋庸置疑,AI技术将重塑整个数据中心行业,这不仅仅反映在技术层面,更关键的是重新定义运作模式,带来效率的提升、成本的降低和商业模式的改变。
当前,国内各地的大型智算中心如雨后春笋般不断涌现。德勤发布的报告《2024 AI智算产业趋势展望:数据智能时代的到来》中提到,智算中心设施加速落地,高效地整合、调度算力资源、为开发者提供良好的支撑是竞争的关键。
作为企业创新的催化剂,戴尓科技秉承AI-First技术战略,将从技术、应用场景、生态等维度,引导数据中心的智能化升级,注重算力、存储、网络与应用需求协同发展的同时,致力于实现现代化数据中心的建运一体、安全可信和绿色可持续,从而帮助企业用户构建敏捷的数智底座,更好地支撑业务创新。
数据中心智能化升级
面临新挑战
工业和信息化部印发的《新型数据中心发展三年行动计划(2021-2023年)》中提出,随着新一代信息技术快速发展,数据资源存储、计算和应用需求大幅提升,传统数据中心正加速向新型数据中心演进。新型数据中心具备高技术、高算力、高能效、高安全等特征,同时要推进算力供应多元化,以便更好地支撑各类智能应用。
数据中心的智能化建设需要不断创新和适应新的技术和新的需求。归纳起来,人工智能对数据中心基础设施提出了一系列新的要求。
增强的计算能力
AI特别是深度学习的训练和推理需要强大的计算能力。IDC预测,全球人工智能服务器的市场规模将从2022年的195亿美元增长至2026年的347亿美元。现代化数据中心需要配备高性能的计算资源,以及优化的计算架构来满足智算的需求。比如,现在万卡GPU集群就备受瞩目。
随需扩展的存储能力
IDC发布的《全球季度企业基础设施季度追踪报告:买家和云部署》显示,2024年第一季度,全球企业用于云部署的计算和存储基础设施产品的支出同比增长36.9%,达到330亿美元。现代化数据中心需要足够的存储空间、高性能的存储解决方案,以满足AI对快速读取和写入的需要。在这一背景下,软件定义、分布式、全闪存储等几乎成了标配。
强大的网络连通和访问能力
随着数据量的增加,现代化数据中心需要更高的数据吞吐量和网络带宽来处理数据的传输和交换。如今,在数据中心,400G/800G网络越来越普遍。另外,现代化数据中心与边缘数据中心间的组网互联,也需要优化网络配置,降低网络时延,提升用户服务体验。
高效的散热与制冷
美国Uptime Institute预测,到2025年,AI相关业务在全球数据中心用电量中的占比将从2%增加到10%;到2030年,智能计算的年耗电量将占全球发电总量的5%。现代化数据中心要走高效、清洁、集约、循环的绿色可持续发展道路,以保证设备的稳定运行,同时降低能源消耗。在现代化数据中心里,高密度集成的IT设备、液冷系统、高压直流供配电系统等正得到越来越广泛的使用。
更好地保护数据安全与隐私
一方面,网络安全威胁与日俱增;另一方面,AI系统处理的数据可能包含大量敏感信息。因此,现代化数据中心必须加强数据安全和隐私保护措施,比如采用更先进的加密技术和访问控制等,并且要遵守不断变化的法律法规,以保证数据不被未授权访问或泄露,并且实现合规运营。
智能化、自动化的管理与运维
AI的运用可以帮助数据中心实现智能化管理,比如使用机器学习算法进行能耗优化、预测性维护等,并且能够提高数据中心的运维效率,减少人为错误。
智算数据中心建设的“狂飙”模式已经开启。未来,不管是新建数据中心,还是旧数据中心的改造,都将以AI为驱动。这就对数据中心的设计、建设和运营提出了新的挑战。戴尔科技致力于打造AI的基座,即智能、灵活、有弹性的现代化数据中心,更充分地释放数据潜能。
戴尔科技打造
端到端AI基础设施
戴尔科技2025财年第一财季报告显示,基础设施解决方案集团(ISG)营收达到92亿美元,同比增长22%;其中,服务器和网络业务营收增长42%,创历史新高。强劲的增长,其动力之一就是戴尔科技在AI方面的持续投入与优化。
“没有哪个公司比戴尔科技更有能力将AI引入企业。”戴尔科技集团副董事长兼首席运营官Jeff Clarke表示,“凭借广泛的产品组合,我们在帮助客户构建符合性能、成本和安全要求的AI解决方案方面,具有独特优势。”
戴尔科技AI-First技术战略正在持续发挥作用。在Forrester发布的《Forrester Wave: 2024年第一季度AI基础设施》报告中,戴尔科技成为该报告中唯一一家跻身“领导者象限”的基础设施供应商。其中,戴尔科技在“战略愿景、合作伙伴生态、支持服务和产品,以及营收表现”等多项标准中均获得最高分。
在数据中心领域,戴尔科技围绕“算、网、存、管”提供整体参考架构,以端到端的AI平台解决方案,为新质生产力的打造夯实算力底座。
1、造多元化算力平台
采用行业领先设计的戴尔科技Precision工作站,能够很好地支撑各种设计、创意和AI应用程序,主要包括台式工作站、移动工作站,以及专为AI设计的工作站和相关配件等。以AI就绪的Precision工作站为例,它为AI开发人员和数据科学家量身定制,搭载全新的 NVIDIA RTX GPU、英特尔至强CPU和数据科学软件堆栈。借助这一完整的解决方案,用户不仅可以自由在本地对生成式AI模型进行原型设计、开发和微调,还能灵活地试验和校准AI工作负载,实现新洞察,而且不会产生额外的成本。
基于PowerEdge AI加速计算平台,戴尔科技不断丰富其现代化数据中心多元化算力平台。举例来说,戴尔科技首款8路机架式服务器PowerEdge XE9680,专为AI、深度学习和高性能计算工作负载构建,凭借众多插槽接口与驱动器数量,实现了最佳扩展与高性能的实时AI操作。
在提升AI算力方面,戴尔科技PowerEdge 16G服务器针对GPU进行了专门设计和优化,能够支持英特尔、NVIDIA等不同品牌的GPU加速卡,以GPU分布式训练、GPU池化、边缘AI计算等多种解决方案,全面满足AI训练、微调、推理等不同的应用需求。
2023年9月公布的业内权威的MLPerf Inference V3.1推理基准测试结果显示,在20个数据中心项目赛道中,戴尔科技PowerEdge取得了7个项目的第一名,在所有参评GPU服务器产品中综合成绩最佳。
戴尔科技与NVIDIA深度合作,发布了多款PowerEdge服务器,利用NVIDIA全栈AI解决方案,包括GPU、DPU和NVIDIA AI Enterprise软件套件等,广泛应用于语音识别、网络安全、推荐系统等应用场景。举例来说,与上一代非加速服务器相比,通过NVIDIA加速的戴尔科技PowerEdge服务器在大型语言模型上的推理能效提高了300倍。
另外值得一提的是,英特尔推出了业内首款集成HBM的x86 CPU——Xeon Max,它无需GPU加速卡,即可实现内存带宽密集型应用的加速,比如模型推理、模型微调等。戴尔科技就推出了多款支持英特尔Xeon Max处理器的PowerEdge服务器,为用户提供多一种选择。
戴尔科技还特别成立了AI HPC创新实验室,将AI与并行计算等技术进行融合,更好地支撑CAE、分子动力学、生命科学等高性能计算应用。
求臻医学深度融合基因检测与人工智能技术,专注于肿瘤液态活检领域的诊断产品开发和智能迭代升级。在测序环节,实验人员会使用高通量测序仪对样本进行测序,而生物信息部门则利用AI技术对这些测序数据进行质量控制、比对和变异检测,以更高的精度和更高的效率识别出基因变异情况。为了满足大数据量、计算密集型需求,求臻医学基于多台戴尔科技PowerEdge服务器,构建了一个高性能的计算集群,利用其超强的算力和高性能的存储能力,有效解决了大量样本数据并行分析的难题。
2、构建AI存力“铁三角”
为了更好地支持AI应用创新,企业需要构建具有极致性能、安全可靠、高可扩展和高能效的新一代存储系统。基于PowerScale、ECS和ObjectScale,戴尔科技致力于打造AI存力底座的“铁三角”。
作为AI就绪型数据平台,Dell PowerScale系列最新产品F910在性能、容量及密度上实现了大幅提升,并通过OneFS软件在安全性、多云支持、效率以及简化管理等多方面实现了创新。另外,Dell PowerScale也是全球率先通过NVIDIA DGX SuperPOD AI基础架构验证的以太网存储解决方案,能够帮助客户实现更快、更高效的AI存储。
戴尔科技ECS企业级对象存储,专为大规模支持AI、机器学习、分析和云原生应用程序而设计,提供丰富的S3兼容性,支持用户在单一全局命名空间下管理全球级分布式存储基础架构,能够高性能地处理海量数据。
戴尔科技ObjectScale是一款高性能的容器化对象存储解决方案,专为Kubernetes打造,功能非常强大,提供Object Lock无版本化、高效处理大型对象和Bucket Logging能力,以及灵活性,能够很好地满足AI、大数据分析的需求。
3、三位一体的数据保护
2024年戴尔科技全球数据保护指数(GDPI)显示,69%的企业对于在网络攻击中的恢复能力缺乏信心。在数据安全方面,戴尔科技也有自己的“杀手锏”,即构建备份、容灾和数据避风港Cyber Recovery“三位一体”多重数据恢复防线,提升企业的网络弹性。
戴尔科技最新推出的PowerProtect Data Domain数据保护存储设备——DD9410和DD9910,具有更高的性能、效率和安全性,以及强大的数据类型不变性和完整性功能,可以在保护数据安全、抵御网络攻击方面发挥核心作
面对全球汽车产业的电动化、智能化趋势,上汽乘用车公司通过强化云计算、大数据、AI、边缘计算的服务能力,实现新旧发展动能转换。
在这一过程中,上汽乘用车与戴尔科技合作,引入其PowerEdge服务器、PowerScale AI文件存储、PowerStore和PowerMAX全闪存储,以及PowerProtect数据保护存储、Cyber Recovery数据避风港等方案,为技术创新提供了有力保障,不仅有效促进了新能源汽车的销量增长,而且实现了ADAS智能驾驶数据的闭环管理,提升了数据存储效能与管理水平,重复数据删除率达5:1,数据安全性达到99.999%,可有效防范勒索病毒侵扰。用。
总结来说,戴尔科技正不断完善和优化自身的AI基础设施解决方案组合,以全面、高效、安全、灵活,满足不同企业用户对AI创新的需要。
AI-First引领
未来数据中心变革
未来的数据中心建设一定是AI-First,即以AI为核心和驱动力实现技术、架构、功能和服务的演进和升级,进而影响到企业的产品开发、服务设计、业务流程优化等,也都应优先考虑和应用AI技术。
戴尔科技的成功实践证明,AI确实能够提升数据中心的效率、降低成本、改善用户体验,并且实现绿色可持续发展。Gartner预测,到2026年,超过80%的企业将使用生成式AI的API或AI模型,或者在生产环境中部署支持AI的应用。这就需要不断变革、优化数据中心这一AI底座,为业务的转型赋能。