DeepSeek开源周,开源模式有望重塑市场格局。中国银河给予传媒互联网行业推荐评级!

mulianneng4个月前未分类364

中国银河03月02日发布研报,给予传媒互联网行业推荐评级。

事件:DeepSeek于 2025年2月24日正式启动"开源周",计划在 2月24 日~28 日连续5天每天开源一个项目。

Day1-FlashMLA:动态分配资源,优化算力使用 FlashMLA是专为英伟达 HopperGPU优化的高效MLA解码内核,专为处理可变长度序列设计。在同时处理长文本和短文本时,它可以精准地为不同长度的文本分配恰当的算力。

Day2-DeepEP:MoE高效运转,提高整体效率 DeepEP是首个用于MoE(混合专家模型)训练和推理的开源 EP 通信库,能够让 MoE 模型各部分间沟通更快、消耗更少,提升了整体运行效率。

Day3-DeepGEMM:通用矩阵乘法性能优化 DeepGEMM是一个矩阵乘法加速库,能够为 V3/R1 的训练和推理提供支持。其在各种矩阵形状上的性能与专家调优的库相当,在某些情况下更优,且安装时无需编译。

Day4-DualPipe& EPLB:开源优化并行策略 DualPipe 是一种用于V3/R1 训练中计算与通信重叠的双向管道并行算法,将硬件资源利用率提升超 30%。EPLB 则是一种针对V3/R1的专家并行负载均衡器,基于 MoE 架构,优化 GPU间的负载分布,减少GPU闲置现象。

Day5-3FS:高速数据访问,提高模型训练效率 Fire-Flyer 文件系统是一个专门为了充分利用现代SSD和 RDMA网络带宽而设计的并行文件系统,能实现高速数据访问,提升AI模型训练和推理的效率。

开源模式重塑市场格局,有望促进产业生态繁荣。DeepSeek以领先的模型性能和积极的开源策略, 大幅缩小了以往开源模型和闭源模型间的性能差距,打破了技术垄断的局面。我们认为,DeepSeek 的开源模式推动了大模型从"重资本军备竞赛"走向"合作共创平台",改变了行业的商业模式。企业可以通过开源合作,利用全球开发者的智慧和力量进行创新,降低研发成本,提高创新效率。大模型从上游的硬件算力到下游的应用有望形成了一个完整的产业生态系统,进一步推动产业的生态繁荣。

投资建议:DeepSeek的开源策略引发了行业震动,带动一众AI企业纷纷加入开源行列。2025 年以来,字节豆包、阿里通义千问等均推出开源模型。众多企业的参与壮大了开源阵营,促进了 AI 产业生态的繁荣。同时,各方的紧密协作有助于推动 AI 产业的整体发展,提高产业的竞争力。建议关注:AI赋能下具有价值重塑空间、积极拥抱 AI的头部互联网大厂:腾讯控股、阿里巴巴-W。


相关文章

10年发展历经4大阶段的云计算,中国服务商如何发力?

10年发展历经4大阶段的云计算,中国服务商如何发力?

云计算现在已经是一个耳熟能详的概念了,很多人理解的云计算,就是把算力放到网上,需要的时候去网上调用。但其实云计算最核心的一点是要让算力本身可以像电力一样作为各行各业的基础设施,能够被即插即用。算力与电...

多家公司Chrome扩展被攻击对用户投毒,网安公司也中招!

据媒体报道,近日,多家公司的Chrome浏览器扩展功能遭到黑客攻击,导致用户敏感数据面临泄露风险。其中,美国加州的数据安全初创公司Cyberhaven成为受害者之一,该公司已对外证实遭受恶意网络攻击。...

云计算的发展历程

云计算的发展历程

计算主要经历了四个阶段才发展到现在这样比较成熟的水平,这四个阶段依次是电厂模式、效用计算、网格计算和云计算。①电厂模式阶段。电厂模式就好比是利用电厂的规模效应,来降低电力的价格,并让用户使用起来更方便...

中国互联网2024年业收入稳中求进,研发经费持续增长亮点多

2024年,我国互联网及相关服务业表现平稳,呈现出一系列新的发展趋势。在整体运营状况方面,尽管面临一定挑战,我国规模以上互联网企业的业务收入依然保持在稳定水平,全年累计达到18049亿元,仅比上一年微...

华为AI平台宣布:接入国家超算互联网!

2月6日,华为中国宣布,华为ModelEngine支持DeepSeek全系列本地部署。据国家超算互联网消息,目前DeepSeek系列模型已上线该平台,用户可在线完成该模型的推理、部署及定制化训练与开发...

LINUX系统误操作删除/格式化的数据恢复

Linux操作系统是世界上流行的操作系统之一,被广泛用于服务器、个人电脑、移动设备和嵌入式系统。Linux系统下数据被误删除或者误格式化的问题非常普遍。下面简单聊一下基于linux的文件系统(EXT2...