DeepSeek AI模型:用十分之一资源挑战行业能耗极限

59次阅读
没有评论

共计 1065 个字符,预计需要花费 3 分钟才能阅读完成。

最近科技圈里有个事儿挺有意思的,一家叫 DeepSeek 的中国公司说他们搞了个 AI 模型,用的计算资源只有 Meta 的 Llama 3.1 的十分之一。这消息一出,整个行业都炸锅了。说实话,我第一反应是:真的假的?要知道现在这些大公司建 AI 数据中心,动不动就是一个小城市的用电量,光想想就觉得吓人。

说到这儿,我想起去年去参观某科技公司的数据中心,那场面真是壮观。一排排服务器嗡嗡作响,光是散热系统就占了好几层楼。当时我就想,这得烧掉多少电啊?现在 DeepSeek 这么一搞,确实让人看到了另一种可能性。

DeepSeek AI 模型:用十分之一资源挑战行业能耗极限

不过话说回来,这事儿没那么简单。我认识的一个在加州大学做能源研究的博士 Madalsa Singh 就提醒说,关键还得看其他大公司怎么跟进。毕竟现在大家都在疯狂建数据中心,DeepSeek 的突破能不能真的改变游戏规则,还得打个问号。

说到 DeepSeek 的技术,他们用的方法挺有意思。打个比方,就像是一个客服中心,以前是让所有专家都待命,现在他们学会了只叫真正需要的专家。这种 ’ 无辅助损失策略 ’ 听起来挺玄乎,但说白了就是更聪明地分配资源。而且他们在推理阶段也做了优化,就像写文章时不用翻整本书,只要看重点摘要就行了。

不过,也不是所有人都买账。Rystad Energy 的 Carlos Torres Diaz 就表示,他们查了半天也没找到 DeepSeek 能源消耗的具体数据。这倒提醒了我,在科技圈里,有时候宣传和现实之间还是有差距的。

说到能源问题,这确实是个两难的选择。微软的 Satya Nadella 在推特上提到一个叫 ’ 杰文斯悖论 ’ 的概念,意思是技术越高效,人们用得越多。这让我想起智能手机,虽然单个手机的能耗降低了,但全球手机数量暴增,总能耗反而更高了。

说到这儿,不得不提一下能源结构的问题。中国现在 60% 以上的电力还是靠煤炭,美国虽然主要用天然气,但化石燃料占比也不低。最近听说有些能源公司为了满足数据中心的需求,甚至推迟了老电厂的退役计划,这可不是什么好消息。

不过话说回来,传统数据中心在过去几年其实做得还不错。高盛的数据显示,2015 到 2019 年工作量翻倍了,但电力需求基本没怎么涨。只是到了 2020 年,随着 AI 技术的进步,能耗又开始飙升了。劳伦斯伯克利实验室的报告预测,到 2028 年,数据中心可能要吃掉美国 12% 的电力。

所以你看,DeepSeek 这事儿虽然让人看到了希望,但要说它真能改变整个行业的能源格局,现在下结论还为时过早。不过至少,它给我们提了个醒:在追求技术进步的同时,也得考虑考虑地球的感受。毕竟,再厉害的 AI,也得有个能运转的地球不是?

正文完
 0
admin-gah
版权声明:本文于2025-02-01转载自TheVerge,共计1065字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码