潞晨尤洋争议中谈三方云平台 DeepSeek 成本:为何我不做 MaaS 了?
Episode 105 · March 6th, 2025 · 48 mins 55 secs
About this Episode
「我们的测试是,通过 MaaS 获得收入,代价太高了」
上周六,DeepSeek 发布开源周收官之作:概述了 DeepSeek 的推理优化思路,并放出了 2 月 27 日前后一个 24 小时时段内的线上时机测试。
据 DeepSeek 官方数据,这 24 小时里,他们处理的 Token 输入总量是 608B(6080 亿);输出的 token 量是 168B(1680 亿)。每秒每节点(一节点有 8 张 H800)的吞吐量达到了输入 73.7k Tokens,输出 14.8k Tokens。
做到这么大的吞吐量,他们平均只用了 226.75 个节点,每个节点是 8 张英伟达 H800,加起来是 1814 张卡。而这支撑了 DeepSeek 高达 2000万-3000 万的日活。
由此 DeepSeek 也根据 GPU 的市场价格,和自己的 API 定价,算了一个成本利润率,即这几天被广泛传播和讨论的 545%,换算成毛利是 84.5%。
这也让前段时间算过另一笔账,且结果大相径庭的的潞晨科技创始人尤洋的言论被推到了风口浪尖。
尤洋曾说,通过自己的实测,他发现中小云平台现在部署 DeepSeek,再售卖 API 给其它应用方,是巨亏的生意,月亏可达 4 亿。
亏损的核心是,尤洋自己测的吞吐量与 DeepSeek 公布的数据相差巨大(每节点每秒输出位 300 Tokens 左右)。由于 GPU 的价格在一定时间内是固定的,吞吐量,就决定了 API 服务能否赚钱。
在“被打脸”的争议中,尤洋接受了「晚点聊」的访谈。我们聊的时间是 3 月 1 日,尤洋没有特别提及 DeepSeek 的具体推理优化,他称自己不方便评价。
他更多聊了,为什么他认为中小云平台做 MaaS 服务不赚钱,也解释了他眼中的 MaaS 商业模式。他认为单纯卖 API 的 MaaS 可能更合适大型云厂商和自己开发独家模型,并能做相应深度优化的公司。
3 月 1 日,潞晨科技也宣布停止即将包括 DeepSeek API 在内的 MaaS 服务。
如果听友想更详细的了解,考虑到运维、折旧等成本的 DeepSeek 实际利润率怎么测算,可以看 Shownotes “附录”里贴的几篇相关链接,有非常详细的解读,并搭配了公式和图表。
本期嘉宾:
尤洋,潞晨科技创始人
时间线跳转:
00:04 DeepSeek 官方实测数据,惊人的吞吐量带来惊人利润率
03:10 尤洋此前的测算引发争议与讨论:亏损 4 亿 vs 毛利 85%
09:25 一个合格 to B MaaS 服务,冗余资源到底该备需求的几倍?
12:26 潞晨科技已不再做 MaaS 服务,MaaS 买的是 GPU 时间,卖的是 Token 调用,承担了链条上的最多亏损
17:57 专注给大小公司部署私有模型
22:15 强模型公司(如 OpenAI)和大型云厂商自己做 MaaS 更合理
26:22 高额利润才能带来创新投入,价格战会导致大家都没资源投入研发
28:20 实际服务中,输入、输出序列的波动,用户请求的多样化,会导致线上服务效率下降
34:28 云计算也是高弹性,AI 云平台不会成为新的云计算吗?
38:17 潞晨想做 AI 版 Databricks,而 Databricks 自己也在做这件事;创业公司的空间在哪儿?
43:00 新方向是自己训练视频生成模型,在热潮前的 2021 年 9 月开始创业的方向选择
46:37 技术和商业问题可以广开讨论,不打算再回应其他争议
相关链接:
再次深度拆解:Deepseek利润率高达85%,推理效率领先一个数量级,彻底颠覆认知!(老罗的暗中观察)
回应争议:Deepseek真实利润率是多少?到底需要多少算力?
光年之外联创再出发,与袁进辉聊 AI Infra 到底做什么?
剪辑制作:甜食
☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆
欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。
请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。
关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: