说起人工智能(artificial intelligent, AI), 世界上最有名的AI应该是OpenAI公司的ChatGPT。它自从2022年末诞生至今一直就是AI领域的领头羊。后来也出来了一些优秀的AI应用,比如说,谷歌的Gemini,微软的Copilot,Anthropic公司的Claude,以及脸书的Llama。这些本猫都有试过,都非常的好,但是无一能够撼动ChatGPT的一哥位置。ChatGPT之所以厉害,是因为它有世界上最好的AI大模型,也就是人工智能大脑。理论上来说,一个大脑的神经元越多,编织的神经元网络越复杂,这个大脑就会越聪明。所有的AI公司都是在模仿人类的大脑来开发AI大模型。
从开发AI大模型角度来看,在算法和数据的部分,世界顶尖的几家AI公司之间都是差不多的。一是因为构建AI大模型的算法部分都是基于公开发表的论文,所以各自AI大模型的底层逻辑都是差不多的。二是训练AI大模型的数据也都是来自互联网的公开数据,所以数据这部分也没有什么太多竞争的余地。而可以竞争的地方就是算力部分了。也就是说,谁能往AI系统里堆更多的计算芯片让它的神经元更多,神经网络更复杂,谁的AI大模型就更聪明。
芯片一直是美国的强项。美国之所以能够在科技领域一直领先,也是因为它在芯片领域是全球最顶尖的。这就保证了像OpenAI,谷歌这一众美国的AI公司的算力一直就是世界最顶尖的,也就保证了美国在AI领域的领先。
然而,美国公司在AI领域中领先的情况突然间发生了变化。有一家中国杭州的公司DeepSeek悄无声息的撼动了ChatGPT在AI领域的地位。在2025年1月27号这一天,多年霸榜手机应用榜首的ChatGPT变成了第二名。第一名出现了一个新的名字DeepSeek。为什么说是悄无声息,一是因为DeepSeek从来没有宣传过它的产品,二是DeepSeek这个公司在AI领域不是很有名的。它的手机应用1月15号才刚刚上架,仅仅过了两周就超过了ChatGPT。这一下子,不仅ChatGPT慌了,整个美国所有搞AI的人都慌了。
物美体现在它的性能是可以比肩ChatGPT目前在市场上的旗舰模型。ChatGPT现在有两个主力模型4o和o1。这两个模型是两个不一样的的大脑,其中4o是处理日常业务的,它很聪明,反应也很快。而o1是深度思考模型,它反应慢点,但是思索更深。所以4o相当于你的一个私人助理,而o1是一个顾问。实际生活中,也不是所有事情都要问顾问的,有些简单事情4o就解决了。而DeepSeek也出了两个模型,叫V3和R1,其中V3对标4o,R1对标o1。性能几乎是一样的,能打个平手。
DeepSeek真正令人惊艳的是它的价格,也就是价廉。ChatGPT虽然免费用户也是可以使用的,但是有很多的限制。ChatGPT付费用户一个月20美刀,专业用户一个月200美刀。而DeepSeek是免费的,谁都可以免费使用它最聪明的大脑。除了手机应用之外,ChatGPT还有一个挣钱的地方,就是应用程序编程接口(API)调用。当企业在使用ChatGPT的API调用时要另付费,比如说客服。以前很多企业的客服是有人在接电话,或者在网上回答你的问题。现在人工客服已经渐渐变成AI客服了,是要比人工客服便宜很多。所以现在很多企业都使用ChatGPT的API调用服务。不仅是AI客服,还可以用AI来导航,带有AI的游戏,或者AI的股票分析系统,都是同样原理。ChatGPT不仅通过这个来挣钱,还可以通过这个方式来锁定客户。一旦企业把你的所有的客服人员都给辞掉了,用了ChatGPT服务以后,你就停不下来了。而DeepSeek也提供相同的API调用服务,价钱是ChatGPT的十分之一。
所以DeepSeek一出来,美国就炸锅了。DeepSeek登顶当天(2025年1月27日),美国所有和AI相关的股票全面大跌。跌得最严重的就是英伟达,股价一天就跌了17%,市值蒸发6000亿美元,创下美国股市历史最大单日跌幅。为什么英伟达会跌那么多?原因就是DeepSeek不仅是物美价廉和开源这么简单,而且它的开发成本也超级低。DeepSeek之所以能开源,就是因为它开发AI大模型没花几个钱。据说OpenAI做那两个AI大模型4o和o1,花了不下数十亿美刀。估计主要钱都花在买英伟达的芯片上。
而DeepSeek的这两个同等级别的AI大模型V3和R1,做出来只花了560万美元,保守估计是OpenAI的1%。因为美国对中国是有芯片禁运的限制,DeepSeek并没有用最高端的芯片来开发出它的AI大模型。虽然传说中国在早期曾经囤积了一些高级的芯片,但是也囤积不了多少。也就是说DeepSeek用很少的钱,用比较低端的芯片,就把美国投入了几十亿美元,甚至上百亿美元的事情给办了。所以市场普遍认为,对英伟达芯片的估值过高,于是就纷纷抛售英伟达的股票。美国AI公司和AI专家学者对DeepSeek为何能用如此低的成本,在如此短的时间开发训练出如此好的AI大模型表示不可思议,因为感觉DeepSeek其实没有那么强大的AI开发背景。
DeepSeek全称叫杭州深度求索人工智能基础技术研究有限公司,是一家成立于2023年7月份的公司。这个公司的创始人叫梁文峰,他曾经是中国知名量化对冲基金幻芳量化的创始人。而这个幻芳量化就是DeepSeek的母公司,是10年前成立的一家对冲基金和人工智能公司。是一家搞投资的公司,主营业务是量化投资。所谓量化投资,就是利用数理统计方法和计算机程序对大量数据进行分析,以制定投资策略的投资方式。简单来说,就是人工智能加上计算机来进行自动投资运作的公司。DeepSeek就是它的一个子公司,专门研究底层AI技术,因为它需要这个技术来进行量化投资。所以DeepSeek的AI研发背景其实是相当强大的。
但是美国那边觉得这不足以说明它为什么能够在这么短的时间内研发出最顶尖的人工智能。所以就怀疑DeepSeek是不是有使用不正当的手段弯道抄车。比如说DeepSeek有抄袭ChatGPT之类的说法。但这个明显是不可能的,因为ChatGPT是闭源的,而闭源的系统显然是无法抄袭。如果DeepSeek真的有抄袭ChatGPT的话,在它开源的一瞬间,OpenAI就会发现。
之所以本猫说DeepSeek是AI开发中的传奇,在一夜之间改变了这个世界的AI格局,是因为DeepSeek创新的思路和高超的技术是有目共睹的。面对质疑,它也从来没解释过什么。也不需要解释,开源的东西都摆在这 你想看就看嘛。对于此事,美国川普总统在1月27号也发表了回应,他说DeepSeek的出现,是对美国科技主导地位的挑战,应该成为美国AI行业的警钟。特朗普还称赞了DeepSeek的低成本模式,认为这会对AI领域带来了积极影响,可能会减少巨额支出并取得相同成果。川普说的是很诚恳的。