你的位置:leyu乐鱼体育app > 新闻动态 > DeepSeek扔的第二枚开源王炸到底是什么?
DeepSeek扔的第二枚开源王炸到底是什么?
发布日期:2025-03-07 09:51 点击次数:68
2 月 25 日,开源放福利的 DeepSeek 甩出了一张王炸——开源全球首个面向 MoE 模型的全栈通信库 DeepEP。因为直接解决了 AI 算力焦虑,GitHub 瞬间飙出 1500 星(指收藏量),圈内集体炸锅,其重要性可见一斑。
很多人好奇 DeepEP 意味着什么?想象一下双十一的快递驿站:2048 个快递小哥(GPU)在 200 个仓库(服务器)间疯狂搬运包裹(AI 数据),传统运输系统就相当于让小哥们蹬三轮送货,而 DeepEP 直接给全员配上了"磁悬浮 + 量子传送"套装,稳定高效的传递信息。
特点一:直接改变运输规则
在 2024 年 8 月 29 日的英伟达电话会议上,黄仁勋曾经专门强调了 NVLink(英伟达开发的一种让 GPU 之间直接互连的技术,双向互传速度可达 1.8TB/S)对于低延迟、高输出和大型语言模型的重要性,认为它是推动大模型发展的关键技术之一。
然而这个被吹爆的 NVLink 技术,这次直接被中国团队玩出了新高度。DeepEP 玄妙之处就在于对 NVLink 的优化,这意味着在同个仓库的快递员之间,用磁悬浮轨道运输,速度高达每秒 158 个集装箱(GB/s),相当于把北京到上海的距离缩短到喝一口水的时间。
黑科技二是其所包含的 RDMA 技术的低延迟内核,试想下,不同城市的仓库之间,货物直接"量子传送",每架飞机(网卡)运力达每秒 47 个集装箱,还能让飞机一边装货一边飞行,计算与通信重叠,彻底告别停机等待。
特点二:智能分拣黑科技:AI 版"最强大脑"
当货物需要分发给不同专家(MoE 模型中的子网络)时,传统分拣员要逐个拆箱检查,而 DeepEP 的"调度 - 组合"系统就像拥有预知能力:在训练预填充模式,4096 个数据包同时走智能传送带,自动识别同城或跨城件;在推理预填充模式,128 个加急包裹走 VIP 通道,163 微秒送达比人类眨眼快 5 倍。与此同时采用动态变轨技术,遇到流量洪峰秒切传输模式,完美适配不同场景需求。
特点三:FP8 "缩骨术"
普通货物用标准箱子(FP32/FP16 格式)运输,而 DeepEP 能把货物压缩成微型胶囊(FP8 格式),同样卡车能多装 3 倍货物。更神奇的是,这些胶囊到达目的地后会自动恢复原状,既省邮费又省时间。
这套系统已在 DeepSeek 自家仓库(H800 GPU 集群)实测:同城货运速度提升 3 倍,跨城延迟降低到人类难以感知的程度,而最颠覆性的是它实现了真正的"无感传输"——就像快递小哥边骑车边往快递柜里塞包裹,整个过程行云流水。
现在 DeepSeek 把这张王牌开源,相当于把顺丰的无人分拣系统图纸公之于众,原本需要 2000 台 GPU 的重型任务,现在几百台就能轻松拿捏。
在更早之前,DeepSeek 发布了其"开源周"的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码,同样是减少大模型训练过程中成本的关键技术之一。为了缓解产业链上下游的成本焦虑,DeepSeek 正在倾囊相授。
此前潞晨科技创始人尤洋在社交媒体发文表示,"短期内,中国的 MaaS 模式可能是最差的商业模式",其简单估算,如果每日输出 1000 亿 token,基于 DeepSeek 的服务每月的机器成本是 4.5 亿元,亏损 4 亿元;用 AMD 芯片月收入 4500 万元,月机器成本 2.7 亿元,这意味着亏损也超过 2 亿元。
Powered by leyu乐鱼体育app @2013-2022 RSS地图 HTML地图