DeepSeek:中国AI新星如何用低成本打造高性能AI模型

60次阅读
没有评论

共计 583 个字符,预计需要花费 2 分钟才能阅读完成。

最近科技圈都在热议一家叫 DeepSeek 的中国 AI 公司。说实话,一开始我也没太当回事。毕竟现在 AI 领域的新公司太多了,动不动就说要颠覆这个颠覆那个。但深入了解后,我发现这家公司还真有点意思。

记得去年底,我在刷 App Store 的时候,发现一个叫 DeepSeek 的聊天机器人应用突然蹿到了榜首。当时我还纳闷,这又是什么新玩意儿?后来才知道,这是一家成立才一年多的中国公司做的。最让我惊讶的是,他们的 AI 模型据说性能不输给 OpenAI,但成本却低得多。这让我想起之前听一个做 AI 的朋友抱怨,说训练模型太烧钱了,动不动就要几百万美元。

DeepSeek:中国 AI 新星如何用低成本打造高性能 AI 模型

说到创始人梁文峰,这人挺有意思的。据说他创业初期只投了 1000 万人民币,这在 AI 领域简直是小本经营。但人家愣是做出了成绩,还公开说美国芯片限制不是问题,关键是要建立自己的 AI 生态。这话听着挺提气的,但具体怎么做到的,我还真有点好奇。

不过 DeepSeek 也不是没有缺点。我试过他们的聊天机器人,发现对一些敏感话题确实避而不谈。而且听说他们的服务器还出过问题,看来快速扩张带来的压力不小。

总的来说,DeepSeek 的出现确实给 AI 行业带来了不小的震动。它不仅挑战了 ’ 大投入才能出好 AI’ 的固有观念,还可能改变整个行业的游戏规则。不过话说回来,AI 这个领域变化太快,今天的热门明天可能就凉了。DeepSeek 能不能持续保持这种势头,还得继续观察。

正文完
 0
admin-gah
版权声明:本文于2025-01-28转载自The Straits Times,共计583字。
转载提示:此文章非本站原创文章,若需转载请联系原作者获得转载授权。
评论(没有评论)
验证码