什么是DeepSeek,中国的AI初创公司通过全球技术发送冲击波?

DeepSeek是一家鲜为人知的中国初创公司,他通过发布人工智能(AI)模型的能力与Google和Openai的创作相媲美,通过全球科技领域发动了冲击波。

DeepSeek-R1的创建者说,其模型是使用比美国技术巨头使用的高级芯片较少且少的计算机芯片开发的。

该模型的开发团队在上周发表的研究论文中表示,他们花了不到600万美元的计算能力来培训该模型 – 这是美国科技巨头(例如Openai和Google)所享受的数十亿美元的AI预算,例如创作者分别是Chatgpt和Gemini。

马克·安德森(Marc Andreessen)是硅谷最有影响力的技术风险投资家之一,他称赞该模型为“ AI的爆发时刻”。

一家能够与硅谷的顶级玩家相抗衡的中国小型创业公司的突然出现挑战了关于美国在人工智能中统治地位的假设,并担心NVIDIA和META等公司的高高市场估值可能会脱离现实。

周一,NVIDIA在生产动力AI的半导体方面持近纪念碑,其市值下跌了近600亿美元,其股票下跌了17%。

美国总统唐纳德·特朗普(Donald Trump)上周宣布,由位于德克萨斯州的甲骨文和日本的软银发起了一项500亿美元的AI倡议,他说DeepSeek应该作为对美国行业需要“唤醒电话”的“唤醒电话”。专注于竞争赢得的激光”。

什么是DeepSeek?

DeepSeek总部位于Hangzhou,由一名连续企业家Liang Wenfeng于2023年底成立,他还经营着对冲基金高级飞行者。

梁虽然在中国以外鲜为人知,但在将新兴技术和投资结合起来的悠久历史上。

据中国媒体媒体媒体媒体媒体融资,他在2013年与中国媒体Sina Finance的数据显示,他与吉东大学共同创立了Hangzhou Jacobi投资管理公司,该公司雇用AI来实施交易策略。

Liang在2015年和2016年分别建立了两家专注于计算机投资投资的公司-Hangzhou Huanfang Technology Co和Ningbo Huanfang量化投资管理合作伙伴关系。

在2023年接受中国媒体媒体波浪的采访中,梁否驳回了这一建议,即初创企业参与人工智能已经为时已晚,或者应该被认为是昂贵的。

“仅复制就相对便宜 – 基于公共报纸和开源法规,培训的最小时间甚至微调的时间就足够了。然而,研究涉及广泛的实验,比较以及更高的计算和人才需求。

梁说,他对AI的兴趣主要是由“好奇心”驱动的。

“从更广泛的角度来看,我们想验证某些假设。例如,我们假设人类智力的本质可能是语言,人类思想本质上可能是语言过程。”他说。

“您认为’思想’的想法实际上可能是您的大脑编织语言。这表明类似人类的AGI可能会从大型语言模型中出现。

DeepSeek没有立即回应置评请求。

周一,《华尔街日报》的记者格雷戈里·扎克曼(Gregory Zuckerman)说,他得知他以前从未听说过的梁写了他撰写的《中文版》的序言,他撰写了有关已故的美国对冲基金经理吉姆·西蒙斯(Jim Simons) 。

扎克曼在专栏中写道:“西蒙斯显然留下了深远的影响。

扎克曼写道:“即使我母亲也没有从书中得到那么多。”

为什么DeepSeek席卷了科技界?

简而言之,该公司的成功提出了有关硅谷和美国政府采取的人工智能方法的存在问题。

美国科技公司被广泛认为在AI中具有关键的优势,尤其是因为它们的规模巨大,这使他们能够从世界各地吸引顶尖人才,并在建设数据中心和购买大量昂贵的高级高位上投入大量资金结束芯片。

DeepSeek到达现场的到来挑战了这样的假设,即在AI的最前沿需要数十亿美元。

“ Openai成立于10年前,拥有4,500名员工,并筹集了66亿美元的资本。 DeepSeek成立于不到2年前,拥有200名员工,并以不到1000万美元的价格开发。

“这两家公司现在如何竞争对手?”

DeepSeek的工程师在他们的研究论文中说,他们使用了大约2,000个NVIDIA H800芯片,这些芯片比最前沿的芯片少,用于训练其模型。

该团队表示,它利用了多种专业模型共同努力,以使较慢的芯片能够更有效地分析数据。

对于美国政府而言,DeepSeek到达现场,提出了有关其试图通过限制高端筹码出口来遏制中国AI进步的战略的疑问。

DeepSeek的研究论文表明,创建高性能AI模型不需要最先进的芯片,或者中国公司仍然可以用足够数量的筹码来采购芯片,或者两者的组合。

总部位于加利福尼亚的NVIDIA的H800芯片旨在遵守美国的出口控制,直到2023年10月,当时当时总统乔·拜登(Joe Biden)的管理将其添加到其受限制项目列表中。

Liang在2023年对Waves的采访中说,他的公司在被禁止出口之前库存了10,000 nvidia a100 gpus。 GPU或图形处理单元是用于加快计算设备上图形和图像处理的电子电路。

稳定AI的前研究总监Tanishq Abraham表示,鉴于中国公司(例如阿里巴巴和Baichuan)推出了各种模型,他对中国在AI的进步水平并不感到惊讶。

亚伯拉罕对半岛电视台说:“尽管对中国获得GPU的能力有限制,但中国仍然设法从他们拥有的一切中进行了创新和挤压绩效。”

“我认为这对美国公司来说是一个教训,他们仍然可以挤出很多表现。”

加利福尼亚大学圣地亚哥分校的机器智能,计算与安全中心联合主任塔拉·贾维迪(Tara Javidi)表示,DeepSeek使她对全球AI开发的“快速进步”感到兴奋。

“我唯一的希望是,对这一公告的关注将促进该主题的更大智力兴趣,进一步扩大人才库,最后但并非最不重要的一点是增加了美国AI研究的私人和公共投资,” Javidi告诉半岛电视台。

纽约证券交易所于2025年1月27日开业 [Angela Weiss/AFP]

同时,投资者对美国科技界的信心至少在短期内受到了打击。

除了NVIDIA的戏剧性幻灯片外,Google父母Alphabet和Microsoft周一的股价分别下跌4.03%和2.14%,尽管Apple和Amazon的成绩更高。

“如果DeepSeek的成本数字是真实的,那么现在几乎任何公司的大型组织都可以建立并托管它。”昆士兰州大学AI的教授蒂姆·米勒(Tim Miller)告诉半岛电视台。

“因此,从这个意义上讲,游戏已经完全改变了,因为有一个任何人都可以玩的新“规则”。”

这是否意味着中国正在赢得AI比赛?

未必。

尽管技术分析师广泛同意,DeepSeek-R1的性能与CHATGPT相似,甚至更好地完成了某些任务,但该领域的发展很快。

OpenAI首席执行官Sam Altman本月早些时候表示,该公司将在考虑用户反馈后的几周内发布其最新的推理AI模型O3 Mini。

周一,奥特曼(Altman)承认,DeepSeek-R1在捍卫公司对更大计算能力的关注时“令人印象深刻”。

“显然,我们将提供更好的模型,并且有合法的人能够拥有一个新的竞争对手!我们将提取一些发行版。” Altman在X上说。

“但是大多数情况下,我们很高兴能继续在我们的研究路线图上执行,并认为现在比以往任何时候都更重要的计算更重要。”

奥特曼
Openai首席执行官Sam Altman于2025年1月21日在华盛顿特区与美国总统唐纳德·特朗普举行的新闻发布会上出现 [Andrew Harnik/Getty Images via AFP]

科技嗡嗡声中国的创始人鲁·马(Rui Ma)表示,当Openai于2022年最初发布Chatgpt时,中国科技领域本身就感到惊讶。

“大多数企业家完全错过了AI代表的机会,感到非常谦虚,”马云告诉半岛电视台。

“很明显,他们从那以后一直在努力工作。我认为过去的一个周末向我们展示了他们自我反思的重视程度,并以挑战“赶上”硅谷。我认为,对于美国,华盛顿应该专注于促进硅谷,而不是压制中国。”

稳定AI的前研究总监亚伯拉罕(Abraham)表示,与DeepSeek不同,OpenAI等公司并未将其最先进的车型自由地向公众提供,这也可能偏向。

“ DeepSeek可以免费使用其最佳型号。另一方面,Openai的最佳模型不是免费的。”他说。

“因此,大多数免费使用Chatgpt的人都对DeepSeek感到震惊,并认为当Openai拥有类似的表现模型已经支付了几个月时,功能有很大的跳跃。 Frontier AI模型的这种付费围墙导致人们并没有真正掌握AI的进度和能力。”

昆士兰州大学教授米勒说,DeepSeek的进步和其他最近的发展表明,中国至少在AI中与美国“在那里”。

“去年年底,我做出了一些投掷的预测,即AI的下一个科学突破可能来自一个小型球员,例如个体的大学研究人员,他们无法获得太多的计算能力 – 他们需要更聪明才能更聪明才能竞争,他说。

“ DeepSeek的明显进步几乎就是一个例子:通过没有足够的计算能力来构建与Chatgpt一样大的模型,它们必须很聪明。必要性是发明的母亲。”