2023-12-17 22:03:25 來源: 搜虎网
11月29日,由多IT传媒主办的“数字创新·AI未来”-2023中国数据与存储峰会在北京成功举办。 浪潮信息存储产品线副总经理刘希猛、分布式存储总经理姜乐国受邀出席会议,分享了生成式AI和大模型存储的创新理念和实践,并与合作伙伴和客户共同探讨如何以创新发展应对瞬息万变的新时代。
刘希猛 浪潮信息存储产品线副总经理
新场景:数聚AI加速企业智能化场景转型
生成式AI和大模型已与千行百业全面融合,带来自动驾驶、智能制造、智慧医疗等AI+创新应用场景。 这些新的应用场景将加速传统行业向智能化转型。
AI+在千行百业的创新应用带来了数据的爆发式增长,数据要素在工业智能化过程中发挥着重要作用。 IDC发布的最新数据显示,中国数据量将从2022年的23.88ZB增长到2027年的76.6ZB,增速全球第一。 其中,企业数据占比70%,只有24%的数据用于分析或AI决策,这意味着企业将有更大的空间挖掘数据的价值。
我国高度重视数据要素的作用,先后出台了《计算基础设施高质量发展行动计划》、《数据要素白皮书》、《生成式人工智能暂行办法》等一系列政策服务”推动企业激活数据要素潜力。 加快人工智能引领发展。
AI时代,原始数据呈现出多源、多态的趋势,既包括文本、图像、音频、视频等感知数据,也包括激光、毫米波、红外等非感知数据,这将生成 TB 甚至 PB 的多态数据。 这一趋势给数据存储、管理和应用带来了新的需求和挑战。
这些新的需求和挑战体现在海量多模态数据、超大读写带宽、超高读写IOPS、全生命周期管理四个方面。 姜乐国表示,随着训练模型从LLM(语言)、ALM(音频)、CV(计算视觉)、VL(多模态)到FMLM(混合模态)的转变,对数据存储的要求从PB级别提升到EB级别容量。 需求包括从100GB带宽到TB级带宽的性能访问要求。 还要求多源异构数据之间快速转换和传输、生命全生命周期管理、数据安全可靠。
新存储:分布式融合存储助力企业突破创新
面对AI时代多源多状态数据的挑战,企业需要支持多种架构、持久且灵活的数据基础设施来部署和实施生成式AI的创新应用。
浪潮信息存储始终坚持“分层解耦”理念,提供从数据中心、硬件平台、大模型智能计算软件栈OGAI、基础大模型的完整全栈解决方案,应对生成式AI和大模型时代。楷模。 全面的需求和挑战。 其中,分布式融合存储平台解决了多模态、多态数据的需求和挑战。
浪潮信息存储面向生成式AI的分布式融合存储解决方案,结合了生成式AI和大模型的数据采集、数据准备、数据训练、数据推理和数据归档五个阶段,并提供同一套存储的端到端数据流支持满足文本、音频、图像、视频、代码以及多模态和全模态模型需求的流程。 它具有终极集成、终极容量、终极性能、终极管理四大特征。
最终融合面向海量、多源、异构的非结构化数据场景。 集多种存储介质、多协议实时互访互操作、系统扁平化扩展于一体。 一套存储即可实现多模态场景应用; 最终容量从PB级到EB级甚至ZB级,通过多种容量算法的支持,可以优化存储空间利用率,最大化客户的投资回报; 通过存储性能的极致提升,实现极致性能,带来超大带宽和超高IOPS,满足生成式AI和大模型场景严苛的存储需求; Ultimate Management提供闪存、磁盘、磁带、光盘四种介质,以及热、温、冷四种存储资源,实现资源的互操作,可以实现数据全生命周期的管理。
刘希孟认为,在非结构化数据爆炸的生成式AI和大模型时代,浪潮信息的分布式存储平台无论是基于高性能文件、流对象的智能应用,都将成为企业简化IT部署的重要工具。或原生大数据。 并重点支持实施生成式人工智能创新。
新实践:远大模式与企业AIGC的创新实践
作为全球领先的IT基础设施产品、解决方案和服务提供商,浪潮信息建立了大机型应用场景的整体解决方案。
2023年10月,浪潮信息帮助中国科学技术大学升级校级“融合计算平台”,部署25个GPU服务器节点和40个分布式融合存储节点,满足不同领域产生的海量多模态数据需求。学科和领域。 推动人工智能驱动的高水平科学研究和创新。
在帮助企业应用生成式人工智能和大模型实现数字化创新方面,浪潮信息不仅提供数据中心和硬件平台,还凭借在数据基础设施方面的领先地位,为企业提供大模型智能计算软件栈OGAI和基础大模型。 “来源2.0”。
刘希孟介绍,大模型智能计算软件栈OGAI“元脑生智”是浪潮信息以大模型为核心技术的生成式AI开发应用场景,提供从集群系统环境部署到算力调度保障和大模型的一切服务。开发全栈、全流程的软件进行管理,从而降低大模型算力系统的使用门槛,优化大模型的研发效率,保障大模型的生产和应用。
源大模型是浪潮信息存储支持生成式AI和大模型的最佳实践。 基于浪潮信息大模型整体解决方案的“源2.0”大模型已正式发布并全面开源。 这也将更好地满足企业大模型开发应用的需求,推动企业应用创新。
在“Source 1.0”中文大模型的训练中,AS13000采用了最新的硬件平台,配备全闪存SSD和高速IB网络,支撑“Source 1.0”训练过程的高效完成。 在近期发布的“Source 2.0”大模型中,浪潮信息存储作为模型训练的基础,在数据采集、预处理、训练和归档等方面发挥着重要作用,凭借“Source 2.0”高度灵活的可扩展能力,为模型训练提供了良好的基础。获取12PB中国数学数据作为坚实后盾,使模型训练不存在容量瓶颈。
2023存储技术创新奖:HF18000、AS13000
浪潮信息存储此次荣获“2023年度高端存储产品金奖”和“2023年度存储技术创新奖”。 一年来,浪潮信息存储在金融行业的六大银行、股份制银行、城商行等用户实现了全面突破。
未来,浪潮信息将继续秉承创新的服务理念。 基于浪潮信息的基础平台能力和JDM衍生的存储场景社区定制能力,将持续为企业带来先进的产品、技术和解决方案,与客户和合作伙伴共同努力。 让我们共同努力,帮助企业加快数字化转型创新,加快高质量发展,服务未来数字化转型。
搜虎网转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
据统计,我国机动车保有量已达4.35亿辆,新注册登记汽车更是连续十年以每年超过20...
讯 www.yule.com.cn 法国当地时间5月18日,第77届戛纳电影节于首周末举办贾樟...
昨天,国家文物局发布安徽淮南武王墩一号墓考古发掘以及文物保护重要成果,墓主人...
本周五,楼市迎来诸多利好,四项重磅政策同时出炉,包括购房首付比例下调、公积金贷...
了2024年金融债券(第一期),发行规模为10亿元;兴业消费金融分别发行了三期金融债...