我理解的DeepSeek

对生活的感受,对人生的思考,对世界的看法,对历史的感悟,对未来的期待。
打印 被阅读次数

今天下午去听了一个讲座,是研究所人工智能在医学中应用研究领域的一个专家。在讲座中,他非常兴奋地提到了一个由中国的一个年轻的人工智能研究小组所发布的最新的、也是非常具有开创性的应用软件产品DeepSeek。我对人工智能不熟悉,我以我的理解写出下面的文字,以供有兴趣的朋友参考。

一家豪华大酒店,特聘多位全球顶尖厨师,并且购置了一系列高端厨具,要打造一道惊艳世人的美食,经过精心烹制,这道美食终于问世。为了回笼,大酒店有绝对话语权,想卖多少钱就卖多少钱,想接待谁就接待谁,不想接待谁就禁止其入内。

但谁都料不到,一家毫不起眼的小饭店搅乱了原本看似稳固的美食格局。仅用着再普通不过的锅碗瓢盆,做出了与豪华大酒店不相上下的美味佳肴,成本竟仅为大酒店的百分之一。 最最关键的是,小饭店老板居然将美食配方公之于众。你想吃就自己照着做,如果你不想做饭,要来小饭店吃也行,那我就给你一个超低折扣价。

想想看,豪华大酒店的经理年薪就超过了小饭店一整年的总开销。此刻,大酒店的经理正焦头烂额,绞尽脑汁地思考如何解释呢。 而这家小饭店,正是幻方量化,他们研发出的那道独特“菜肴”,便是DeepSeek!

DeepSeekR1模型到底有多震撼:

1、推理能力无敌:‍比肩ChatGPT o1,有序推理和顿悟的强化能力非常吓人。

2、成本极低:所用的训练费用,只是chat GPT的3%~5%,甚至是更低。

3、开源彻底:任何人可随便下载部署,公开所有训练步骤与窍门。

4、免费:ChatGPT 一年约1500刀,而DeepSeek无限量免费。

5、全球搜索独苗:全球唯一的支持联网搜索的推理模型。

6、纯中国方案:Deepseek的最大成功要素是没用海外人才,没用美国AI路线。从人才到思路都不用。

7、开始用华为芯片,成本下降70%,从此不怕英伟达垄断禁售。

我刚刚回到家,就下载了DeepSeek应用程序,与ChatGPT 相比更滑顺一些,尤其是中文更顺畅些。打开电视,彭博社新闻正在播放经济新闻,纳斯达克指数因受DeepSeek 影响而大幅下跌,其中,英伟达(NVAD)最大时下跌了17%。

老生常谈12 发表评论于
回复 '新燕山夜话' 的评论 :
完全同意你的评论,还有试用华为麒麟芯片也可以,性能可达95%,以后可能使美国半导体制裁不能完全有效。

DeepSeek的重要意义,在于它把美国刻意营造的AI高大上的桌子给掀翻了。有高端芯片搞AI更好,没有高端芯片,换个思路和方法,也一样能搞AI。把AI的成本和门槛一降低,全世界都能试一试,美国就无法垄断了。OpenAI、谷歌、META这些前期投了大本钱的,想靠垄断挣大钱快钱的梦,就别做了。这是经济意义。
水星98 发表评论于
试了一下,敏感词通通不给解答。
新燕山夜话 发表评论于
DeepSeek的重要意义,在于它把美国刻意营造的AI高大上的桌子给掀翻了。有高端芯片搞AI更好,没有高端芯片,换个思路和方法,也一样能搞AI。把AI的成本和门槛一降低,全世界都能试一试,美国就无法垄断了。OpenAI、谷歌、META这些前期投了大本钱的,想靠垄断挣大钱快钱的梦,就别做了。这是经济意义。

另外,DeepSeek模型是开源和免费的,让大多数欧洲和第三世界国家都用得起。使用者多了,自然就有利于中国AI界在制定国际标准时,有更多的话语权。这是政治意义。
Unix1998 发表评论于
OpenAI 投的千亿美金废了 ,NVDIA GPU 不需要那么多了,
前提是 deepseek 没有造假。
清漪园 发表评论于
您听的这位讲座专家真的是专家吗?与我听到的AI专家的评论怎么不一样?他们都说,Deepseek大量使用的是英伟达的芯片吧。您是第一个称,他们用的是华为芯片。
魅力野花 发表评论于
AI 就是骗钱机器。
魅力野花 发表评论于
回复 '木子力_' 的评论 :
"deepseek有值得肯定的地方,但他是站在巨人的肩膀上,对整个AI产业来说,真的不算什么"---
deep seeker 是仿制品,吹牛也有可能。
木子力_ 发表评论于
比喻非常不恰当,这不是什么大饭店小饭店能说事的,deepseek有值得肯定的地方,但他是站在巨人的肩膀上,对整个AI产业来说,真的不算什么
songling 发表评论于
回复 'ahhhh' 的评论 : 我完全不懂AI,也不知道你写的那些英文字母所代表的意义,但谢谢你的批评指正。我要找一些入门书籍或文章去学习学习了。
ahhhh 发表评论于
DeepSeek R1很好,但你搬来的很多事实不对:
推理能力无敌,比肩ChatGPT o1,这两个就是矛盾的。
免费:ChatGPT 一年约1500刀,而DeepSeek不是免费。现在hosted的版本是免费使用,但是有限流。以后一定会收费。关键这不是重点。
纯中国方案:这个就扯淡了。它的数据就是GPT2(那时开始真的OPENAI)和后来的llama。不是从头开始的。所谓的AI路线,所有现在的LLM用的都是谷歌的transformer架构。
开始用华为芯片,这个就更扯淡了。

DeepSeek R1的意义是把美国用GPU,不管是数量还是质量,堆砌的AI护城河给推翻了。这一点就很伟大。扯其它的格局反而小了。
登录后才可评论.