DeepSeek扔的第二枚开源王炸到底是什么？

栏目分类

热点资讯

新闻动态

你的位置：leyu乐鱼体育app > 新闻动态 > DeepSeek扔的第二枚开源王炸到底是什么？

发布日期：2025-03-07 09:51 点击次数：77

2 月 25 日，开源放福利的 DeepSeek 甩出了一张王炸——开源全球首个面向 MoE 模型的全栈通信库 DeepEP。因为直接解决了 AI 算力焦虑，GitHub 瞬间飙出 1500 星（指收藏量），圈内集体炸锅，其重要性可见一斑。

很多人好奇 DeepEP 意味着什么？想象一下双十一的快递驿站：2048 个快递小哥（GPU）在 200 个仓库（服务器）间疯狂搬运包裹（AI 数据），传统运输系统就相当于让小哥们蹬三轮送货，而 DeepEP 直接给全员配上了"磁悬浮 + 量子传送"套装，稳定高效的传递信息。

特点一：直接改变运输规则

在 2024 年 8 月 29 日的英伟达电话会议上，黄仁勋曾经专门强调了 NVLink（英伟达开发的一种让 GPU 之间直接互连的技术，双向互传速度可达 1.8TB/S）对于低延迟、高输出和大型语言模型的重要性，认为它是推动大模型发展的关键技术之一。

然而这个被吹爆的 NVLink 技术，这次直接被中国团队玩出了新高度。DeepEP 玄妙之处就在于对 NVLink 的优化，这意味着在同个仓库的快递员之间，用磁悬浮轨道运输，速度高达每秒 158 个集装箱（GB/s），相当于把北京到上海的距离缩短到喝一口水的时间。

黑科技二是其所包含的 RDMA 技术的低延迟内核，试想下，不同城市的仓库之间，货物直接"量子传送"，每架飞机（网卡）运力达每秒 47 个集装箱，还能让飞机一边装货一边飞行，计算与通信重叠，彻底告别停机等待。

特点二：智能分拣黑科技：AI 版"最强大脑"

当货物需要分发给不同专家（MoE 模型中的子网络）时，传统分拣员要逐个拆箱检查，而 DeepEP 的"调度 - 组合"系统就像拥有预知能力：在训练预填充模式，4096 个数据包同时走智能传送带，自动识别同城或跨城件；在推理预填充模式，128 个加急包裹走 VIP 通道，163 微秒送达比人类眨眼快 5 倍。与此同时采用动态变轨技术，遇到流量洪峰秒切传输模式，完美适配不同场景需求。

特点三：FP8 "缩骨术"

普通货物用标准箱子（FP32/FP16 格式）运输，而 DeepEP 能把货物压缩成微型胶囊（FP8 格式），同样卡车能多装 3 倍货物。更神奇的是，这些胶囊到达目的地后会自动恢复原状，既省邮费又省时间。

这套系统已在 DeepSeek 自家仓库（H800 GPU 集群）实测：同城货运速度提升 3 倍，跨城延迟降低到人类难以感知的程度，而最颠覆性的是它实现了真正的"无感传输"——就像快递小哥边骑车边往快递柜里塞包裹，整个过程行云流水。

现在 DeepSeek 把这张王牌开源，相当于把顺丰的无人分拣系统图纸公之于众，原本需要 2000 台 GPU 的重型任务，现在几百台就能轻松拿捏。

在更早之前，DeepSeek 发布了其"开源周"的第一项成果：FlashMLA（直译为快速多头潜在注意力机制）的代码，同样是减少大模型训练过程中成本的关键技术之一。为了缓解产业链上下游的成本焦虑，DeepSeek 正在倾囊相授。

此前潞晨科技创始人尤洋在社交媒体发文表示，"短期内，中国的 MaaS 模式可能是最差的商业模式"，其简单估算，如果每日输出 1000 亿 token，基于 DeepSeek 的服务每月的机器成本是 4.5 亿元，亏损 4 亿元；用 AMD 芯片月收入 4500 万元，月机器成本 2.7 亿元，这意味着亏损也超过 2 亿元。

上一篇：【通达信】短线新星指标公式副图+选股妖股基因超短线爆发点源码

下一篇：芯动联科: 3月21日召开分析师会议, 华安证券、高盛亚洲等多家机构参与