评论:DeepSeek新模型大揭秘，为何它能震动全球AI圈

ajaychen_2024 发表评论于 2025-01-28 20:02:45

如果美国人都有你这么幼稚狭隘的想法，美国永远也不会进步。

生肖迷宫发表评论于 2025-01-28 12:44:51世界AI人才的一半在中国，当中国与外国的开发思想不一样，中国AI主要用于维护极权统治，以后Deep Seek会取代五毛党，届时又会有几千万人失业，那些脑残粉红五毛党欢呼个啥劲，饭碗马上就没了

ajaychen_2024 发表评论于 2025-01-28 18:24:57

结果知耻后勇，现在中国国产成熟制成芯片倾销全球，国产七纳米已经成功，光刻机也将有重大突破。

湾区范儿发表评论于 2025-01-28 09:52:56别忘了中国十多年前还研制成了最先进的汉芯芯片呢，结果呢？

abcdaren 发表评论于 2025-01-28 14:02:50

聪明的训练方法，硬件没有太多突破。。。
这人的脑子不可小视。
老美的搞法太烧钱：正是时候检讨自己、迎头赶上。。。使新科技更接地气！！！

生肖迷宫 发表评论于 2025-01-28 12:44:51

世界AI人才的一半在中国，当中国与外国的开发思想不一样，中国AI主要用于维护极权统治，以后Deep Seek会取代五毛党，届时又会有几千万人失业，那些脑残粉红五毛党欢呼个啥劲，饭碗马上就没了。

湾区范儿 发表评论于 2025-01-28 09:52:56

别忘了中国十多年前还研制成了最先进的汉芯芯片呢，结果呢？

abcdaren 发表评论于 2025-01-28 09:05:55

转发：
一，它是迄今最好的中文大模型平台，从理解能力和答案输出能力来看，远超此前百度的文心一言和抖音豆包。说掀翻ChatGPT尚显夸张，但确实掀翻了国内的BAT和字节跳动，比起美国科技巨头，更应该陷入恐慌的是国内互联网大厂。
二、根据这位中国博士朋友的说法，deepseek基于开源的Transformer模型，而Transformer模型由谷歌开发。所以国内媒体宣传deepseek“纯自研”“纯国产”是不准确的。而且deepseek的算力基础仍然来源于英伟达显卡。
中国内行朋友还透露deepseek团队非常有钱，提前囤了1万多张英伟达高端显卡，而华科大和中科大的实验室搞显卡如今都不太容易。从网上公开信息看，DeepSeek拥有1万张老的A100卡和3000张禁令之前的H800卡‌。按照H800显卡20万一片的价格，deepseek购买这3000张显卡就花费了超6亿元。成本不像说的那么低。。。
也就是说，deepseek的软硬件基础仍然是基于美国产品之上。
三、目前使用下来最大的缺点是比老美慢，我输出一句“你好”，它的“深度思考”时间就花费了8秒，基本一个问题想得到答案，需要等待几十秒甚至几分钟时间，这和ChatGPT的“秒回”能力形成了鲜明对比。但deepseek的差异之处在于，它把原本置于后台的机器人“深度思考”程序，转为前台公开化显示，你可以理解为能部分掩盖输出答案的缓慢，也能理解为展现其“深度思考”功能的精妙和“人性化”。
四、此前ChatGPT被诟病简中能力低下，一个原因是简中文体用户较少，导致抓取样本数据少，但deepseek拥有的先天优势是海量的中文数据抓取基础，也能够学习模拟不同的中文语气和风格，比如可以生成“贴吧老哥体”“小红书体”，你也可以通过输入指令“言辞激烈或温和”，来改变其文风。deepseek的写作能力，已经大大降低了“AI味”。毫不夸张的说，deepseek未来可以取代大部分的公文写作甚至社论写作，这对评论员来说都是不小的挑战。
五、和所有的国产大模型一样，deepseek绕不开的是审核，特别是应对政治类历史类问题。但令人诧异的是，deepseek的尺度远超BAT和字节大模型，一些敏感信息也被抓取，比如询问其对当前仿制药问题的看法，它可以生出一篇言辞尖锐的批评性文章。

硅谷工匠 发表评论于 2025-01-28 08:41:13

its like Korean war ... US has advanced weapons, Mao's team had not even winter coats.

新燕山夜话 发表评论于 2025-01-28 08:08:40

我不懂AI模型的标准和细节，但是我从美国股票市场的反应来看，DeepSeek新模型就是一匹“大黑马”。华尔街的投资人可是全世界人尖子里的尖子。再一个就是看同行对手的评价，如果他们的评论里充满了“羡慕嫉妒恨”，那Deepseek R1肯定就是个“真家伙”。如果不是，他们连正眼都不会看一看它。

GP2X 发表评论于 2025-01-28 04:06:00

从这篇里还是明显看到了幻方量化的身影。股票交易只要结果赢钱就行，不需要解释甚至科普来龙去脉。这玩儿的基础就跟那些类似算命先生的GenAI不一样。

ajaychen_2024 发表评论于 2025-01-28 03:45:59

你自己用过吗？没有调查没有发言权。我用它写过广告方案，虽然不是最好，但是也是十分不错，足够用了

银河的天空发表评论于 2025-01-28 00:35:37测试后英文结果差距太大，准确率很低。中文还行，也就是说，糊弄鬼还行，就是适合中国的产物，对于写论文和校正以及引用文献而言，毫无作用。蒙鬼的骗骗外行的东西。

银河的天空 发表评论于 2025-01-28 00:35:37

测试后英文结果差距太大，准确率很低。中文还行，也就是说，糊弄鬼还行，就是适合中国的产物，对于写论文和校正以及引用文献而言，毫无作用。蒙鬼的骗骗外行的东西。

TitaniumAtlas 发表评论于 2025-01-27 23:37:05

更正一下，模型是开源的，数据没有

TitaniumAtlas 发表评论于 2025-01-27 23:33:35

楼下这位，不是完全开源，只是代码开源，数据和模型本身还是私有的，也就是你可以复制这么个躯体，但得从头教它学习。

TitaniumAtlas 发表评论于 2025-01-27 23:30:11

感觉有点玄学的意思，很好奇对于“习近平是独裁者吗”这样一个问题它是如何顿悟的。

wd01702 发表评论于 2025-01-27 23:15:37

成本这么低，时间这么短，效果却刚好和open ai相当。有那么巧？openAI又不是智能的极限。

wd01702 发表评论于 2025-01-27 23:06:15

既然开源，其他人就可以重复。同样的算法，更高算力的芯片，可以用更短的时间训练出同样的模型。就如同科学论文发现需要其他人重复来证明，如果我是做这行的，就会叫人按照开源算法从头复制。是真是假，很快就有结果。

俺是农民 发表评论于 2025-01-27 21:26:47

楼下，我们这儿的计算机club, 还是有一些白人的，不过，你这回答跟我说的有什么关联吗？

bigcatf4 发表评论于 2025-01-27 21:04:28

俺是农民发表评论于 2025-01-27 20:40:49哈哈，其实它的出现，最重要的是告诉老川，他不需要让别人投资5000个亿了，最多只需要五个亿，剩下的近5000亿还是搞美国的基建吧
------------
你这话确实像农民
我们小孩学校的计算机CLUB，一个白人黑人没有，90%的印度人，剩下的华人韩国人

俺是农民 发表评论于 2025-01-27 20:40:49

哈哈，其实它的出现，最重要的是告诉老川，他不需要让别人投资5000个亿了，最多只需要五个亿，剩下的近5000亿还是搞美国的基建吧。

wyx2000 发表评论于 2025-01-27 19:12:55

”DeepSeek-R1 Zero 有的只是一套最简单的奖励系统，来激发AI的推理能力。“

又好又便宜，简单又有效。所以那些AI的各种高手都是抛开简单的搞一些复杂又低效的东西？

旁观者XWY 发表评论于 2025-01-27 19:12:00

聪明学生做题举一反三，给出多种解答方式。为什么都是人类大脑，思维能力不同？

kingdale1 发表评论于 2025-01-27 18:32:47

这个和当年AlphaGo Zero 无师自通学出的围棋套路一样，天下无敌。

0101011 发表评论于 2025-01-27 18:30:58

内行看门道，外行看热闹

评论: DeepSeek新模型大揭秘，为何它能震动全球AI圈