DeepSeek AI模型：用十分之一资源挑战行业能耗极限

87次阅读

共计 1065 个字符，预计需要花费 3 分钟才能阅读完成。

最近科技圈里有个事儿挺有意思的，一家叫 DeepSeek 的中国公司说他们搞了个 AI 模型，用的计算资源只有 Meta 的 Llama 3.1 的十分之一。这消息一出，整个行业都炸锅了。说实话，我第一反应是：真的假的？要知道现在这些大公司建 AI 数据中心，动不动就是一个小城市的用电量，光想想就觉得吓人。

说到这儿，我想起去年去参观某科技公司的数据中心，那场面真是壮观。一排排服务器嗡嗡作响，光是散热系统就占了好几层楼。当时我就想，这得烧掉多少电啊？现在 DeepSeek 这么一搞，确实让人看到了另一种可能性。

DeepSeek AI 模型：用十分之一资源挑战行业能耗极限

不过话说回来，这事儿没那么简单。我认识的一个在加州大学做能源研究的博士 Madalsa Singh 就提醒说，关键还得看其他大公司怎么跟进。毕竟现在大家都在疯狂建数据中心，DeepSeek 的突破能不能真的改变游戏规则，还得打个问号。

说到 DeepSeek 的技术，他们用的方法挺有意思。打个比方，就像是一个客服中心，以前是让所有专家都待命，现在他们学会了只叫真正需要的专家。这种 ’ 无辅助损失策略 ’ 听起来挺玄乎，但说白了就是更聪明地分配资源。而且他们在推理阶段也做了优化，就像写文章时不用翻整本书，只要看重点摘要就行了。

不过，也不是所有人都买账。Rystad Energy 的 Carlos Torres Diaz 就表示，他们查了半天也没找到 DeepSeek 能源消耗的具体数据。这倒提醒了我，在科技圈里，有时候宣传和现实之间还是有差距的。

说到能源问题，这确实是个两难的选择。微软的 Satya Nadella 在推特上提到一个叫 ’ 杰文斯悖论 ’ 的概念，意思是技术越高效，人们用得越多。这让我想起智能手机，虽然单个手机的能耗降低了，但全球手机数量暴增，总能耗反而更高了。

说到这儿，不得不提一下能源结构的问题。中国现在 60% 以上的电力还是靠煤炭，美国虽然主要用天然气，但化石燃料占比也不低。最近听说有些能源公司为了满足数据中心的需求，甚至推迟了老电厂的退役计划，这可不是什么好消息。

不过话说回来，传统数据中心在过去几年其实做得还不错。高盛的数据显示，2015 到 2019 年工作量翻倍了，但电力需求基本没怎么涨。只是到了 2020 年，随着 AI 技术的进步，能耗又开始飙升了。劳伦斯伯克利实验室的报告预测，到 2028 年，数据中心可能要吃掉美国 12% 的电力。

所以你看，DeepSeek 这事儿虽然让人看到了希望，但要说它真能改变整个行业的能源格局，现在下结论还为时过早。不过至少，它给我们提了个醒：在追求技术进步的同时，也得考虑考虑地球的感受。毕竟，再厉害的 AI，也得有个能运转的地球不是？

正文完

AI技术 DeepSeek 数据中心能源效率

发表至： AI行业动态

2025-02-01 04:10

0

版权声明：本文于2025-02-01转载自TheVerge，共计1065字。

转载提示：此文章非本站原创文章，若需转载请联系原作者获得转载授权。

Xbox独占游戏对微软依然重要，用于衡量《游戏增长》

SpaceX星舰火箭第五次试飞成功，助推器首次被机械臂捕获

微软推出Copilot Pages：商业用户的AI协作新平台

X公司推出全新AI图像生成器Aurora，图像逼真度超越Grok现有模型

Stargate项目：5000亿美元的AI梦想还是科技泡沫？

AI预测妊娠风险：从胎儿偏小到个性化评估的突破

评论（没有评论）

验证码

最新文章