zt:DeepSeek横空出世,Meta慌:训练成本\'比高层薪水低\'

Technical analysis is a way to trade stocks. There are different ways to trade. You get your way that match your personality.
打印 被阅读次数
中国横空出世的AI模型DeepSeek震撼矽谷,也让Meta陷入恐慌。

中国AI新创企业DeepSeek(深度求索)近2个月接连推出新模型DeepSeek-V3与DeepSick-R1,令其APP在苹果App Store的下载排行榜中冲上第一名,将ChatGPT远抛在后。这款低成本高性能的AI模型表现与OpenAI的ChatGPT-4等全球顶尖AI语言模型不相上下,令整个矽谷为之震撼,更让美国科技巨头Meta的生成式AI部门陷入危机。

一位自称是Meta员工的网友,日前在美国匿名职场论坛TeamBlind上发文,表示DeepSeek横空出世后,技术水准就直接超越了Meta旗下的Llama 4,让Meta全公司上下陷入恐慌。更令Meta难堪的是,这家中国企业只用了550万美元(约新台币1.8亿元)来训练DeepSeek,成本只有Meta的十一分之一。

这名员工坦言,DeepSeek以超低成本完成大规模模型训练,颠覆了行业对高昂成本的传统认知,因为「单只Meta生成式AI部门里的主管薪资就已超过了DeepSeek训练AI的成本,而且我们这里有几十位领着高薪的主管,我根本无法想像他们该如何向公司证明部门目前高额成本的合理性。」

外媒The Information指出,OpenAI、Meta和其他顶尖AI公司的工程师正疯狂地研究DeepSeek模型,试图解读其技术秘密,复制其成功模式,但暂时还不得其解。Meta更为此筹组了4个「战情室」,2个聚焦研究如何降低训练和运作DeepSeek的成本,另2个则负责厘清DeepSeek使用了哪些数据来训练其模型,及基于DeepSeek模型归纳出的特质,重新建构Meta的模型。


Meta杨立昆谈DeepSeek:不是中国AI超越美国 而是…

中国公司深度求索(DeepSeek)1月20日发佈最新的DeepSeek-R1模型后,因其开发成本低、性能直追OpenAI等公司的产品,备受硅谷关注。主导Meta AI研究的首席科学家、图灵奖得主杨立昆(Yann LeCun)认为,DeepSeek带来的最大启示是开源模型正在超越专有模型。

杨立昆在Threads上的一则贴文中表示,一些人看到DeepSeek表现会想到“中国AI正在超越美国”,他认为这种解读错误,正确解读是“开源模型正在超越专有模型”。



DeepSeek-R1属开源模型(open source),开放程式码,Meta的Llama也是。




杨立昆指,DeepSeek受益于开放研究(Open Research)和开源,例如是PyTorch、Meta的Llama,“他们提出新想法,在其他人的工作基础上加以实现。由于他们的工作成果已发表并开源,因此每个人都可以从中受益,这就是开放研究和开源的力量。”

OpenAI最初成立时是一家开源AI公司,其使命是创造造福全人类的技术,之后转向闭源,特斯拉(Tesla)创办人马斯克(Elon Musk)2024年2月底入禀控告OpenAI及其行政总裁奥尔特曼(Sam Altman),马斯克方面在诉讼书讲述OpenAI公司成立协议标明会寻求开放程式码,不满其如今未有公开技术。

登录后才可评论.