评论: 斯坦福华裔科学家 50美元训练出媲美Deepseek模型
只有登录用户才能发表评论,
点击此处
登录
返回新闻帖
lue96500
发表评论于 2025-02-06 16:26:20
DeepSeek只是开了个头,指了个方向,后续值得期待。
ajaychen_2024
发表评论于 2025-02-06 14:00:53
如果换成了斯坦福的白人科学家,下面的大概会盛赞人家是天才,诺贝尔奖都可以拿
supernova13
发表评论于 2025-02-06 13:30:00
@ljcn, 蒸馏法一种模型压缩技术,当然不是DS提出的,别人也用(但有人却以此为理由污蔑DS抄袭!)。
DS取得突破的关键在于算法,其核心思想是通过一个辅助模型来加速大模型的推理,这样,大模型不需要逐步生成每个token(字或字的一部分),而是可以批量验证多个token,从而大幅提升推理速度。
================================
ljcn 发表评论于 2025-02-06 12:03:44
蒸馏法又不是DS团队首先提出的?他们首先搞了500万美元的噱头而已。人家只是照着这个思路去打你的脸。
AreyouOK?
发表评论于 2025-02-06 12:27:27
初始的感觉是梁shorted NVDIA by his news on Monday for the big gain. Money is the king.
GoldenEar
发表评论于 2025-02-06 12:26:24
电诈骗害人不浅!估计你是来自于台湾吧!呵呵呵
-------------------------------------------------
TitaniumAtlas 发表评论于 2025-02-06 11:45:38造楼下的说法发明电诈的台湾人也得得大奖啊
GoldenEar
发表评论于 2025-02-06 12:25:25
人家DS提供了免费开源的人工智能,和电信诈骗天壤之别!别胡乱比较吧!
------------------------
TitaniumAtlas 发表评论于 2025-02-06 11:45:38造楼下的说法发明电诈的台湾人也得得大奖啊
ljcn
发表评论于 2025-02-06 12:03:44
蒸馏法又不是DS团队首先提出的?他们首先搞了500万美元的噱头而已。人家只是照着这个思路去打你的脸。
supernova13 发表评论于 2025-02-06 10:22:23
前几天伯克利一个团队用30美元重复了DeepSeek的算法,如果斯坦福也是使用DS的算法,那DeepSeek应该得大奖。
不好吃懒做
发表评论于 2025-02-06 11:47:37
李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型 - 哇!!!这50元怎么花的?
TitaniumAtlas
发表评论于 2025-02-06 11:45:38
造楼下的说法发明电诈的台湾人也得得大奖啊
纷纷
发表评论于 2025-02-06 11:00:27
复制、抄袭、蒸馏……,省钱、省时、省力。厉害了!
o88
发表评论于 2025-02-06 10:37:39
风口上谁都不甘寂寞。
supernova13
发表评论于 2025-02-06 10:22:23
前几天伯克利一个团队用30美元重复了DeepSeek的算法,如果斯坦福也是使用DS的算法,那DeepSeek应该得大奖。
supernova13
发表评论于 2025-02-06 10:18:38
"据澎湃新闻报道,李飞飞曾在采访中提到,现在的AI比人类差远了,能耗高、体积庞大,而且尚未具备情感"
这句话不太对,AI的概念大于机器人概念,所以个头大小,是否具备情感并非目前的主要考虑,也非AI的无限潜力和附带的危险所在。
宝刀屠龙
发表评论于 2025-02-06 09:48:57
XM25 发表评论于 2025-02-06 09:15:00
这说明最伟大的是第一个。诺贝尔奖就是奖给原创。后面改进没什么好吹的。
==========
LLM只能是OpenAI,其他都是徒子徒孙
wd01702
发表评论于 2025-02-06 09:48:08
50美元相当于一个普通码农的时薪。是不是吹过头了,还是对deepseek 的讽刺?你要说50美元是运算的电费还说得过去。
shamrock100
发表评论于 2025-02-06 09:40:26
参考了DS的开源算法?
TitaniumAtlas
发表评论于 2025-02-06 09:38:29
蒸馏这事不禁止大公司都不愿意投资AI了,看你们还蒸馏谁去,总不能相互蒸馏吧
XM25
发表评论于 2025-02-06 09:15:00
这说明最伟大的是第一个。诺贝尔奖就是奖给原创。后面改进没什么好吹的。
bluetag
发表评论于 2025-02-06 09:13:00
这个也好,DS也好,都是跟在人家屁股后面,顶多就是有点商业价值,但没有技术价值,吹嘘成本更是笑话,创新和模仿的成本有可比性吗?
man008
发表评论于 2025-02-06 09:11:04
过几天,就会有无毛跳出来说,我发条帖子就能训练出媲美Deepseek模型了。
worley
发表评论于 2025-02-06 09:07:47
其实就是抄袭复制克隆人家ChatGPT。
创新的成本总是很高,剽窃的成本几乎为零。
整理、验证、购买高质量数据的成本需要几十亿美元,盗用的成本几乎为零。
小二哥李白
发表评论于 2025-02-06 09:07:38
这些团队所做的事情是独立验证DeepSeek论文里提出的一些有关低成本高效益的Claim并且公开发表,前几天柏克莱也有一个团队发表了成本$30的,这是学术界Peer Review的工作,没必要添油加醋上纲上线。
指鹿为马
发表评论于 2025-02-06 09:01:25
我可以不用花钱,做一个deepseek的链接,叫deepsick,马上取代deepseek。
文学城普通人
发表评论于 2025-02-06 08:48:43
蒸馏的成本和原始建模的成本根本就是两码事。想省钱就跟着别人后面干蒸馏好了,永远不会领先。
同意DEI的坏处。但是楼下强调男女差别是找不到教职的原因忽略了这些男生估计是没有什么公认过硬的成果,即使多发表几篇文章也实在不算什么大的差别,面试时候又不能最佳表现自己。国男找到教职的也多了去了,也没有每个都是俊男。
RomanticOnly
发表评论于 2025-02-06 08:44:43
这有点离谱了吧,bestbuy里面随便买个东西也不只50吧,难不成能用计算器训练吗?
groogle
发表评论于 2025-02-06 08:40:41
她吃了顿饭 就训练出来了 50块 如果碰巧是喝咖啡 更便宜
size0
发表评论于 2025-02-06 08:35:14
早说了,人工这块不是中国的就是美国华裔的。希望川建国不把李飞飞定成间谍。
ca_lowhand
发表评论于 2025-02-06 08:30:00
开卷了,支持
新桃换旧符168
发表评论于 2025-02-06 08:14:40
DEI贻害万年,美国迟早毁在这些上面还有BLM woke什么的
Q22 发表评论于 2025-02-06 07:26:50女的好混。我朋友圈里,好几个男生也是美国名校博士 -伯克利,哈佛,John Hopkins, 等等。申请美国大学教职好多拿不到的,(语言,口音,形象等,被白男刷掉)。同样级别的名校博士,女的比男的好出头,好混。
令胡冲
发表评论于 2025-02-06 07:41:36
另外李飞飞是华人教授,也应该说话慎重。别瞎扯淡太猛。
川总信了奥特曼,说五千亿我智能核爆,曼哈顿。话音未落,DeepSeek一帮小年轻说5百万就能让大模型智能涌现,豁然开朗。尘嚣未定又来个李飞飞,说50元就行。OK,川总是文科,但你这么甩他,他那么大年纪,也有面子吧?这么忽悠不好吧
硅谷工匠
发表评论于 2025-02-06 07:32:46
李飞飞怎么也堕落到什么热折腾什么的地步。
令胡冲
发表评论于 2025-02-06 07:28:22
人间一切创新的意义全在于后面跟风的。
因为第一次发现往往是偶然现象,运气使然。但后面的人就必须能重复它,搞明白为什么如此,把它从运气升级到理论必然和工程必然。青霉素等抗生素就是这样的。
—————-
新桃换旧符168 发表评论于 2025-02-06 07:05:08 其实第一个chatgpt是最难的。后面的跟风也没什么意义啦。女人做科研最大的问题就是缺少创新。女人大都做事细致认真。可以不断update一个创新的idea,但是在科研领域,创新是很重要的一环。
Q22
发表评论于 2025-02-06 07:26:50
女的好混。我朋友圈里,好几个男生也是美国名校博士 -伯克利,哈佛,John Hopkins, 等等。申请美国大学教职好多拿不到的,(语言,口音,形象等,被白男刷掉)。同样级别的名校博士,女的比男的好出头,好混。
体制内
发表评论于 2025-02-06 07:25:34
她半个小时的工资都不止50美元
令胡冲
发表评论于 2025-02-06 07:20:21
50元不可能,租一个最低档GPU虚拟机一天也要及时美元。买一个游戏GPU也得几百美元。不大可能。
蒸馏开源小模型是可能的。因为你可以对它Next token 预测的Softmax分布进行一些比较全面的采样。
但那个被蒸馏的模型都没有表现出足够推理功能。你蒸馏个小模型却有,而你又没花钱去训练它。这怎么可能。
李飞飞在噌热度。虽然也是华人。
有门部关
发表评论于 2025-02-06 07:19:41
亩产万斤不是梦。
新桃换旧符168
发表评论于 2025-02-06 07:05:08
其实第一个chatgpt是最难的。后面的跟风也没什么意义啦。女人做科研最大的问题就是缺少创新。女人大都做事细致认真。可以不断update一个创新的idea,但是在科研领域,创新是很重要的一环。
又一个无名氏
发表评论于 2025-02-06 06:58:12
李飞飞像是淘金热里卖铲子的,台湾政界里的王金平。
老李子
发表评论于 2025-02-06 06:52:24
50元?怎么算出来的?
touchlife
发表评论于 2025-02-06 06:51:48
中国人爱省钱的stereotype看来是没跑了,lol
5mslj
发表评论于 2025-02-06 06:43:07
一个行业爆发的初期,大家蜂拥而至抢风口,妖魔鬼怪和各路神仙打架,让子弹再飞一会儿吧
页次:
1
/1
每页
50
条记录, 本页显示
1
到
41
, 共
41
分页: [
1
]