短短半个月时间,一款中国实验室发布的AI模型就用令人难以置信的实力数据,震撼了整个硅谷AI领域。从科技巨头到AI新贵再到技术专家,几乎所有人都感受到了来自中国AI行业的强烈冲击。
这个实验室就是来自中国的DeepSeek,2023年刚刚创建。他们在去年年底发布了一个免费开源的大语言模型。根据该公司发表的论文,DeepSeek-R1在多个数学和推理基准测试中超越了行业领先的OpenAI o1等模型,更在性能、成本、开放性等指标方面压倒了美国AI巨头。
受到DeepSeek冲击,周一美股大跌,英伟达股价下跌近17%,市值蒸发5000多亿美元。其它芯片类和科技类个股也广泛受到冲击,博通下跌超过17%,甲骨文下跌近14%,以科技股为主的纳斯达克综合指数全天下挫3.07%,美股当天市值蒸发超过万亿美元。
在一系列第三方基准测试中,DeepSeek的模型在从复杂问题解决到数学和编程等多个领域的准确性上,超越了Meta的Llama 3.1、OpenAI的GPT-4o以及Anthropic的Claude Sonnet 3.5。
就在上周,DeepSeek又发布了推理模型R1,同样在诸多第三方测试中超越了OpenAI最新的o1。在AIME 2024数学基准测试中,DeepSeek R1取得了79.8%的成功率,超过了OpenAI的o1推理模型。在标准化编码测试中,它展示了“专家级”的表现,在Codeforces上获得了2,029的Elo评分,超过了96.3%的人类竞争对手。
毫不夸张地说,DeepSeek在美国AI行业引发了一场地震,更引发了媒体的争相报道。几乎所有的主流媒体和科技媒体,都报道了中国AI模型超过美国这一爆炸新闻。短短几天时间,DeepSeek就已经成为苹果应用商店排名第一的免费应用,力压OpenAI的ChatGPT。
几乎所有的AI巨头、风投和技术人员都只能承认,在大模型这个领域,DeepSeek至少已经可以和OpenAI平起平坐。DeepSeek不仅是性能卓越,更是经济实惠。让硅谷诸多AI巨头感到震撼和汗颜的是DeepSeek的低廉成本。R1模型的查询成本仅为每百万个token 0.14美元,而OpenAI的成本为7.50美元,使其成本降低了98%。
除了训练成本低廉,DeepSeek的团队组成也与硅谷诸多AI巨头大相径庭。DeepSeek创始人梁文峰在组建研究团队时,并未寻找经验丰富的资深软件工程师,而是专注于来自北大、清华等顶级高校的博士生。许多人曾在顶级学术期刊发表论文,并在国际学术会议上获奖,但缺乏行业经验。
没有囤积顶级GPU,没有招揽资深AI人才,没有高昂的运行成本,一样可以拿出最佳的大模型,DeepSeek的一切都让硅谷AI巨头们感到沮丧。Meta AI首席科学家杨立昆(Yann LeCun)则强调中国人是依靠开源的优势取得成功。他在对DeepSeek的成功表示赞赏的同时强调,DeepSeek的成功并非意味着中国在AI领域超越美国,而是证明了开源模型正在超越闭源系统。
值得一提的是,DeepSeek愿意将其创新成果开源,使其在全球AI研究社区中获得了更大的赞赏。 与专有模型不同,DeepSeek R1的代码和训练方法在MIT许可证下完全开源,这意味着任何人都可以获取、使用和修改该模型,没有任何限制。
喜欢这篇文章吗?转发就是对我们最大的鼓励。加上您的名片分享吧,点击这里 联系商业合作。