评论: DeepSeek新模型大揭秘,为何它能震动全球AI圈

只有登录用户才能发表评论,点击此处登录    返回新闻帖
ajaychen_2024 发表评论于 2025-01-28 20:02:45
如果美国人都有你这么幼稚狭隘的想法,美国永远也不会进步。


生肖迷宫 发表评论于 2025-01-28 12:44:51世界AI人才的一半在中国,当中国与外国的开发思想不一样,中国AI主要用于维护极权统治,以后Deep Seek会取代五毛党,届时又会有几千万人失业,那些脑残粉红五毛党欢呼个啥劲,饭碗马上就没了
ajaychen_2024 发表评论于 2025-01-28 18:24:57
结果知耻后勇,现在中国国产成熟制成芯片倾销全球,国产七纳米已经成功,光刻机也将有重大突破。

湾区范儿 发表评论于 2025-01-28 09:52:56别忘了中国十多年前还研制成了最先进的汉芯芯片呢,结果呢?
abcdaren 发表评论于 2025-01-28 14:02:50
聪明的训练方法,硬件没有太多突破。。。
这人的脑子不可小视。
老美的搞法太烧钱:正是时候检讨自己、迎头赶上。。。使新科技更接地气!!!
生肖迷宫 发表评论于 2025-01-28 12:44:51
世界AI人才的一半在中国,当中国与外国的开发思想不一样,中国AI主要用于维护极权统治,以后Deep Seek会取代五毛党,届时又会有几千万人失业,那些脑残粉红五毛党欢呼个啥劲,饭碗马上就没了。
湾区范儿 发表评论于 2025-01-28 09:52:56
别忘了中国十多年前还研制成了最先进的汉芯芯片呢,结果呢?
abcdaren 发表评论于 2025-01-28 09:05:55
转发:
一,它是迄今最好的中文大模型平台,从理解能力和答案输出能力来看,远超此前百度的文心一言和抖音豆包。说掀翻ChatGPT尚显夸张,但确实掀翻了国内的BAT和字节跳动,比起美国科技巨头,更应该陷入恐慌的是国内互联网大厂。
二、根据这位中国博士朋友的说法,deepseek基于开源的Transformer模型,而Transformer模型由谷歌开发。所以国内媒体宣传deepseek“纯自研”“纯国产”是不准确的。而且deepseek的算力基础仍然来源于英伟达显卡。
中国内行朋友还透露deepseek团队非常有钱,提前囤了1万多张英伟达高端显卡,而华科大和中科大的实验室搞显卡如今都不太容易。从网上公开信息看,DeepSeek拥有1万张老的A100卡和3000张禁令之前的H800卡‌。按照H800显卡20万一片的价格,deepseek购买这3000张显卡就花费了超6亿元。成本不像说的那么低。。。
也就是说,deepseek的软硬件基础仍然是基于美国产品之上。
三、目前使用下来最大的缺点是比老美慢,我输出一句“你好”,它的“深度思考”时间就花费了8秒,基本一个问题想得到答案,需要等待几十秒甚至几分钟时间,这和ChatGPT的“秒回”能力形成了鲜明对比。但deepseek的差异之处在于,它把原本置于后台的机器人“深度思考”程序,转为前台公开化显示,你可以理解为能部分掩盖输出答案的缓慢,也能理解为展现其“深度思考”功能的精妙和“人性化”。
四、此前ChatGPT被诟病简中能力低下,一个原因是简中文体用户较少,导致抓取样本数据少,但deepseek拥有的先天优势是海量的中文数据抓取基础,也能够学习模拟不同的中文语气和风格,比如可以生成“贴吧老哥体”“小红书体”,你也可以通过输入指令“言辞激烈或温和”,来改变其文风。deepseek的写作能力,已经大大降低了“AI味”。毫不夸张的说,deepseek未来可以取代大部分的公文写作甚至社论写作,这对评论员来说都是不小的挑战。
五、和所有的国产大模型一样,deepseek绕不开的是审核,特别是应对政治类历史类问题。但令人诧异的是,deepseek的尺度远超BAT和字节大模型,一些敏感信息也被抓取,比如询问其对当前仿制药问题的看法,它可以生出一篇言辞尖锐的批评性文章。
硅谷工匠 发表评论于 2025-01-28 08:41:13
its like Korean war ... US has advanced weapons, Mao's team had not even winter coats.
新燕山夜话 发表评论于 2025-01-28 08:08:40
我不懂AI模型的标准和细节,但是我从美国股票市场的反应来看,DeepSeek新模型就是一匹“大黑马”。华尔街的投资人可是全世界人尖子里的尖子。再一个就是看同行对手的评价,如果他们的评论里充满了“羡慕嫉妒恨”,那Deepseek R1肯定就是个“真家伙”。如果不是,他们连正眼都不会看一看它。
GP2X 发表评论于 2025-01-28 04:06:00
从这篇里还是明显看到了幻方量化的身影。股票交易只要结果赢钱就行,不需要解释甚至科普来龙去脉。这玩儿的基础就跟那些类似算命先生的GenAI不一样。
ajaychen_2024 发表评论于 2025-01-28 03:45:59
你自己用过吗?没有调查没有发言权。我用它写过广告方案,虽然不是最好,但是也是十分不错,足够用了

银河的天空 发表评论于 2025-01-28 00:35:37测试后英文结果差距太大,准确率很低。中文还行,也就是说,糊弄鬼还行,就是适合中国的产物,对于写论文和校正以及引用文献而言,毫无作用。蒙鬼的骗骗外行的东西。
银河的天空 发表评论于 2025-01-28 00:35:37
测试后英文结果差距太大,准确率很低。中文还行,也就是说,糊弄鬼还行,就是适合中国的产物,对于写论文和校正以及引用文献而言,毫无作用。蒙鬼的骗骗外行的东西。
TitaniumAtlas 发表评论于 2025-01-27 23:37:05
更正一下,模型是开源的,数据没有
TitaniumAtlas 发表评论于 2025-01-27 23:33:35
楼下这位,不是完全开源,只是代码开源,数据和模型本身还是私有的,也就是你可以复制这么个躯体,但得从头教它学习。
TitaniumAtlas 发表评论于 2025-01-27 23:30:11
感觉有点玄学的意思,很好奇对于“习近平是独裁者吗”这样一个问题它是如何顿悟的。
wd01702 发表评论于 2025-01-27 23:15:37
成本这么低,时间这么短,效果却刚好和open ai相当。有那么巧?openAI又不是智能的极限。
wd01702 发表评论于 2025-01-27 23:06:15
既然开源,其他人就可以重复。同样的算法,更高算力的芯片,可以用更短的时间训练出同样的模型。就如同科学论文发现需要其他人重复来证明,如果我是做这行的,就会叫人按照开源算法从头复制。是真是假,很快就有结果。
俺是农民 发表评论于 2025-01-27 21:26:47
楼下,我们这儿的计算机club, 还是有一些白人的,不过,你这回答跟我说的有什么关联吗?
bigcatf4 发表评论于 2025-01-27 21:04:28
俺是农民 发表评论于 2025-01-27 20:40:49哈哈,其实它的出现,最重要的是告诉老川,他不需要让别人投资5000个亿了,最多只需要五个亿,剩下的近5000亿还是搞美国的基建吧
------------
你这话确实像农民
我们小孩学校的计算机CLUB,一个白人黑人没有,90%的印度人,剩下的华人韩国人
俺是农民 发表评论于 2025-01-27 20:40:49
哈哈,其实它的出现,最重要的是告诉老川,他不需要让别人投资5000个亿了,最多只需要五个亿,剩下的近5000亿还是搞美国的基建吧。
wyx2000 发表评论于 2025-01-27 19:12:55
”DeepSeek-R1 Zero 有的只是一套最简单的奖励系统,来激发AI的推理能力。“

又好又便宜,简单又有效。所以那些AI的各种高手都是抛开简单的搞一些复杂又低效的东西?
旁观者XWY 发表评论于 2025-01-27 19:12:00
聪明学生做题举一反三,给出多种解答方式。为什么都是人类大脑,思维能力不同?
kingdale1 发表评论于 2025-01-27 18:32:47
这个和当年AlphaGo Zero 无师自通学出的围棋套路一样,天下无敌。
0101011 发表评论于 2025-01-27 18:30:58
内行看门道,外行看热闹
页次:1/1 每页50条记录, 本页显示123, 共23  分页:  [1]