新闻动态

DeepSeek朝硅谷“开了一枪”

发布日期：2025-02-02 17:17 点击次数：62

《科创板日报》1 月 27 日讯（记者张洋洋）几乎是一夜之间，"来自东方的神秘力量"又一次击中海外人士心脏。

近两日，国产 AI 黑马 DeepSeek（深度求索）在全球科技界刷屏。新模型发布后的访问量激增，一度让 DeepSeek 闪崩，但问题在数分钟内得到解决。AI 界上一次出现宕机情况，还是月之暗面的 Kimi 出圈爆火之时。

截至发稿，DeepSeek 在美区苹果 App Store 的免费排行榜中飙升至第二，第一是 ChatGPT。

▍与 OpenAI "掰手腕"

DeepSeek 本次"刷屏"，起因是 1 月 20 日其正式发布推理大模型 DeepSeek-R1，该模型在数学、编程和推理等关键领域的表现，能与 OpenAI 的最强推理模型 o1 "掰手腕"，但其 API 调用成本却低了 90%-95%。

DeepSeek-R1 的惊艳表现，先是引发了海外市场的强烈关注。在美国，多位 AI 行业的资深专家和从业者盛赞 DeepSeek-R1。

美国计算机科学家、萨姆 · 奥尔特曼的导师吴恩达在第 55 届世界经济论坛（冬季达沃斯）上点赞 DeepSeek ——"我对 DeepSeek 的进展印象深刻。我认为他们能够以非常经济的方式训练模型。他们最新发布的推理模型，非常出色 …… ‘加油’！"。

微软 CEO 萨蒂亚 · 纳德拉也公开表示，"他们（DeepSeek）切实有效地开发出了一款开源模型，在推理计算方面表现出色，且超级计算效率极高。"纳德拉还强调，"我们必须非常、非常认真地对待中国的这些进展"。

DeepSeek 成立于 2023 年 5 月，其背后是国内对冲基金巨头幻方量化。

2023 年 11 月 2 日，DeeSeek 推出首个模型 DeepSeek Coder，该模型免费供商业使用且完全开源。2023 年 11 月 29 日，DeepSeek LLM 上线，其参数规模达到 67B，性能接近 GPT-4，同时还发布了该模型的聊天版本 DeepSeek Chat。

真正让 Deepseek 在 AI 界出圈的，是其在 2024 年 5 月开源的第二代 MoE 大模型 DeepSeek-V2。该模型在性能上比肩 GPT-4 Turbo，价格却只有 GPT-4 的百分之一，DeepSeek 由此被称作"价格屠夫"、" AI 界的拼多多"。

随后的 2024 年下半年，这家公司还先后发布了 DeepSeek R1-lite-preview 和 DeepSeek-V3。

到了 2025 年推出的 R1 模型，在数学能力测试中，该模型在 MATH 基准测试上达到了 77.5% 的准确率，与 OpenAI 的 o1 不相上下；在编程领域，R1 在 Codeforces 评测中达到了 2441 分的水平，高于 96.3% 的人类参与者。

而这一切，是在不到 600 万美元的投入和 2048 块低性能的 H800 芯片的条件下完成的，训练时间仅用两个月。这种"四两拨千斤"的模式，颠覆了人们对 OpenAI "大力出奇迹"式的固有认知，结果令全球侧目。

▍为何是 DeepSeek？

在国内 7 家头部的大模型创业公司当中，DeepSeek 可以说是最不显山不露水的一家。在各个大模型厂商早已开启买量，进行广告投放品牌营销时，据《科创板日报》记者了解，这家公司至今尚未有公关团队。

2023 年 4 月，幻方量化宣布成立新组织，集中资源和力量，探索 AGI 的本质。当时幻方就表示，多年以来，公司坚持把营收的大部分投入人工智能领域，建设领先的 AI 硬件基础设施，进行大规模的研究，探索人类未知的奥秘。

如今来看，在这一年多时间里，DeepSeek 的进展迅速。当下的 AI 战事进入中场，战况尤为激烈，为何是 DeepSeek 先让硅谷 "慌了神"？

近期，在微信朋友圈中，《科创板日报》记者注意到，不少 AI 领域的从业者和投资人，对此进行了分析讨论。除了技术实力本身，团队的创新理念和人才队伍，是业内人士认为 DeeSeek 能在群狼环伺的 AI 界杀出重围的主要原因。

幻方量化和 DeepSeek 创始人梁文锋，毕业于浙江大学信息与通信工程专业。业内口碑称，这是一位极致的 80 后技术理想主义者。创立幻方，梁文锋就在幕后潜心钻研技术，在 DeepSeek 时代，其依旧延续着低调作风，和一线研究员一样，每天"看论文，写代码，参与小组讨论"。

"过去很多年，中国公司习惯了别人做技术创新，我们拿过来做应用变现，但这并非是一种理所当然。这一波浪潮里，我们的出发点，就不是趁机赚一笔，而是走到技术的前沿，去推动整个生态发展。"在接受《暗涌》的采访中，梁文锋说。

DeepSeek 的招聘公告中，赫然写着"顶尖人才招聘"。公开信息显示，目前的 DeepSeek 团队，集结了一批国内名校毕业的高密度年轻人才，其中不乏应届生、实习生。在这里，工作经验不再是衡量人才的唯一标准。DeepSeek 的 HR 在社交媒体平台表示，"着重考察人选素质和对大模型的热爱"。

只要员工的技术提案有潜力，他们所需算力和资源都能得到充分满足。在大模型领域，算力是稀缺的资源，DeepSeek 则是"万卡 GPU 训练集群，无需申请，不限使用"。

对于这些人才，多名熟悉 DeepSeek 的 AI 业内人士也反馈，给出的薪酬极具竞争力。

"投身于探索 AGI 的本质，不做中庸的事，带着好奇心，用最长期的眼光去回答最大的问题"，这是 DeepSeek 官方微信号写下的简介。某种程度上，DeepSeek 代表了中国"硬核技术创新"的叙事。可喜的是，DeepSeek 并非孤例。

前不久，宇树科技发布了一段最新机器狗产品 B2-W 的演示视频，视频中 B2-W 机器狗展现了一系列高难度动作，这引来马斯克点赞转发评论，火爆全网。

几乎是在一同期，黄仁勋的英伟达中国年会之行中，宇树科技 CEO 王兴兴受邀参与，一行人当中，还有银河通用创始人兼 CTO 王鹤、深涌智能 Emerging AI 创始人黄可铖等。

以这些硬核技术的创业者和公司为代表，他们正在开启一个中国创新故事的新篇章。

热点资讯

	碳酸锂期货主力合约日内跌幅达4%…
	前中兴副所长: 中国光刻机正在清场式领先, 竞争对手连汤都喝不上…
	新增1.5T动力设计微调新款长安逸动申报信息曝光…
	酷睿Ultra 7加持, 双十二换机首选华硕天选6 Pro, 强得不像实…
	黄金，短期见顶了吗？…