评论:DeekSeek靠“蒸馏”火出圈：到底是创新还是剽窃？

ceocto 发表评论于 2025-01-31 18:20:47

糖醋鲤鱼发表评论于 2025-01-31 07:25:10DS所谓的蒸馏技术就是通过反向工程找出openai训练模型技术上的劣势并加以调整和改善，然后把新的算法开源了。如果DS把这些新算法当作闭源代码开发产品也许会有纠纷。现在这些算法开源了每个人都可以下载部署并开发自己训练模型，这就让openai没法去诉讼了。这也是DS聪明的地方，而且间接向别人展示了自己公司的实力。很聪明的做法，唯一不爽的就是那些市场上的所谓大咖ai公司了包括ai芯片制造公司例如英伟达。

=========

公开的代码跟DS网站上的产品不同（v3），R1的都很差，你去试试，现在好多公司Host了。

见不得不平事 发表评论于 2025-01-31 08:49:07

DeepSeek开发了一种高效低成本的蒸馏方法。其高效低成本部分震惊了美国业界。而其蒸馏所用数据模型及相关训练资料则违反了相关规则。因此它既有创新也有违规。现在美国业界处于一种难堪的地位，一方面要谴责它违规使用别人的成果，另一方面还要研究学习它的算法以提高自己的蒸馏水平。DS用别人的成果作为自己模型训练的基础属于在华人中经常会见到但会被别人所不屑的“取巧”。另一方面，它开创的高效低成本的蒸馏方法又会加速AI发展，对社会的进步起到推动作用。这就是事物的两面性。任何片面的一家之言都是不足取的。

糖醋鲤鱼 发表评论于 2025-01-31 07:25:10

DS所谓的蒸馏技术就是通过反向工程找出openai训练模型技术上的劣势并加以调整和改善，然后把新的算法开源了。如果DS把这些新算法当作闭源代码开发产品也许会有纠纷。现在这些算法开源了每个人都可以下载部署并开发自己训练模型，这就让openai没法去诉讼了。这也是DS聪明的地方，而且间接向别人展示了自己公司的实力。很聪明的做法，唯一不爽的就是那些市场上的所谓大咖ai公司了包括ai芯片制造公司例如英伟达。

TXZS 发表评论于 2025-01-31 06:44:07

whatever！反正物美价廉！爱用不用，爱咋咋地！

硅谷工匠 发表评论于 2025-01-31 05:18:37

中国站在巨人的脖子上砍巨人脚脖子。

硅谷工匠 发表评论于 2025-01-31 05:17:46

爱迪生每天接一个专利官司。

会当凌绝顶1 发表评论于 2025-01-31 01:53:38

网友评论、网友文字如下。

问题的关键是，在如此短的时间里，如此低成本，DeepSeek是怎么做到的？

业内普遍认为：DeepSeek的迅速崛起，皆因不光彩地违规非法蒸馏、偷窃数据、盗用、“山寨”、“整合”他人的模型所致。

彭博社28日报道，微软和OpenAI正在调查与DeepSeek有关的人，他们在2024年秋天就发现，有人用不正当的手段通过OpenAI的API输出了大量数据，他们或与DeepSeek有关。

英国的金融时报也于28日报道，OpenAI表示，他们已掌握了证据，证明DeepSeek涉嫌利用所谓的“蒸馏”（distillation）技术盗用其数据进行开发。

对此，业外人士不免感到困惑，因为开发人员是可以通过付费购买许可证的方式，来使用API将OpenAI的专有AI模型集成进自己的应用程序中，这难道不合法？

况且，OpenAI不是鼓励用户大量使用它的模型和数据吗？

既如此，何来不正当、非法、违规和盗用一说呢？

问题的核心在于：你是怎么利用这些资源的。

OpenAI在开放自己的数据和应用时，并不是无条件开源的，它是有明确的限制条款的。

换句话说，OpenAI的开放前提是说：你可以使用我的训练数据，在我的训练模型基础上，来开发完成你所需要的各类应用，而非是以构建自己的训练模型为目的，达到未来与我竞争的目的。

而所谓的“蒸馏”技术，正是利用像OpenAI这样的功能强大的大模型，以及通过长期投入所积累而成的大数据，来训练属于自己的较小模型，通过“蒸馏”浓缩的方式，在自己的模型上，以更低的成本、更短的时间取得更好的效能。

这在OpenAI的开放限制条款中，明显是违法的。

这，或许才是DeepSeek之所以能够在短时间内，以极低的成本达到可与OpenAI比肩的真正原因。

更进一步，美国人认为，有关中国实体企业在通过“蒸馏”技术训练自己模型的同时，还窃取了大量数据，而这些数据有可能对美国的安全构成威胁。所以不少人对于这种潜在的侵权行为，以及所带来的安全问题深表担忧。

也许有人会争辩，你凭什么说DeepSeek是盗用、抄袭？有证据吗？有！大量证据！

DeepSeek的很多回答，与人们向OpenAI提问所得到的回答一模一样！也就是说，DeepSeek真正的原始数据来源，就是OpenAI的数据库。

仅仅改变提问方式就使得抄袭者原形毕现，可不可以抄袭得高明一点，不要这么赤裸裸！

据说胡锡进也看不下去了，不惜站出来洗地，意思是孔乙己的那句话：窃书者不能算是偷。

结果成了越描越黑，这等于承认了偷的行为。

说到这种行为，美国人有治吗？

答案是：好像没有。

如果像类似DeepSeek这样的事发生在美国或英国，如此高调的宣传，以及如此有影响的公司和事件，这足以将你送上法庭，不罚你个底儿掉就不算完。

但是在别国，情形可能完全不同。不但不会感到耻辱，而且会被视为一种爱国行为，能够获得亿万个点赞！

这分明就是两个平行世界！

从小在学校就被告知：天下文章一大抄！只要你抄的，水平高，抄的艺术，不但不会影响到你的信用，而且会成为人人羡慕的英雄！

看看某些人甚至很多人，诡辩，狡辩，小偷逻辑，不以为耻，反以为荣！

硅谷工匠 发表评论于 2025-01-31 01:19:43

类似中国有高铁美国没高铁。

randomspot 发表评论于 2025-01-31 00:05:11

是不是创新，然后谁抄谁，下一个季度就见分晓

几个月后看看美国大厂的大模型是否训练成本都大幅度下降就知道了。

truth_hurts 发表评论于 2025-01-30 22:28:03

这就如同要准备托福亚斯考试就拼命刷真题一样，非常有效，但英语水平提高不大。

想不开1 发表评论于 2025-01-30 21:02:16

借腹生子没有什么大的问题，但是说成是全程自我生子，就有点过了。

白云蓝天 发表评论于 2025-01-30 20:45:28

京城老炮1950 发表评论于 2025-01-30 17:12:54
IBM大型计算机是在1984年进入中国的，当时的科学院计算所和各大专院校的计算机科学精英们都想搞一套像IBM大型机操作系统VSE和MVS一样的中国式的自己的大型机操作系统用于中国的各大商业银行。到目前为止搞出来了吗？
---------------------
拿几十年的过去和现在比？！现在中国高新技术领头人很多都是在美国搞过很多年。虽然中国总体还不能可美国比，但在某些领域完全可以赶上。我下面已经说了，在软件方面，只要搞到顶尖人才，而又没受到硬件的限制，有些方面完全可以搞成世界一流。

ljcn 发表评论于 2025-01-30 18:58:14

一个出骗子/电诈的国家，DS什么操行，你们心里没点b数？

橡皮潜艇 发表评论于 2025-01-30 18:57:35

归根到底还得靠别人。现在IP被人封锁，“蒸馏”没有来源了，还怎么玩？

TitaniumAtlas 发表评论于 2025-01-30 18:48:52

楼下完全不懂嘛，前面那部分得处理海量无格式的可能是错误的信息，最烧钱的

not4any 发表评论于 2025-01-30 18:47:26

想起了一位诚实的美国游泳选手在奥运比赛后怼了本国媒体的一句话，”不能游不过人家，就说人家吃药了。“

watcher2 发表评论于 2025-01-30 18:11:58

就算真的靠蒸馏，知不知道那会使成本降低多少？能有1%就不错了。

逆向操作 发表评论于 2025-01-30 17:41:07

一看出自“自由亚洲”就知道是FAKE NEWS。看看需要真金白银才能购买的AI 晶片制造商怎么说。 AI chipmaker Cerebras says it’s been ‘crushed with demand’ for China’s DeepSeek from business customers

京城老炮1950 发表评论于 2025-01-30 17:12:54

IBM大型计算机是在1984年进入中国的，当时的科学院计算所和各大专院校的计算机科学精英们都想搞一套像IBM大型机操作系统VSE和MVS一样的中国式的自己的大型机操作系统用于中国的各大商业银行。到目前为止搞出来了吗？

科学院计算所什么时候成立的？里面有多少人是留苏，留美和留洋的？同样科学院半导体研究所是什么时候成立的？里面有多少人是留苏，留美和留洋的？当年科学院半导体研究所成立的时候台积电在哪儿呢？台积电的张忠谋又在哪儿呢？64年过去了，64年不短啊！为什么一块小小的芯片还受制于西方的制裁？还要看人家的脸色过日子呢？
================================
白云蓝天发表评论于 2025-01-30 15:20:32 本人觉得 DeekSeek 的技术很大概率是中国自创的。在软件开发方面，中国的技术在很多方面不比美国差，而且关键是只要搞到顶尖水平的技术人员，就能做到。美国技术人员能够创造一种软件技术，难道中国技术人员连仿制的水平也没有？！

我要真普選 发表评论于 2025-01-30 17:11:00

今天說說斯大林時代風靡一時的蘇聯神話——勞模礦工斯達漢諾夫故事。舉一反三，由點及面，由面及裏，分析眼前的事物是否是謊言？會不會也很扯？
蘇聯時期《真理報》宣傳消息，礦工斯達漢諾夫6小時開採了102噸煤，一個人幹了煤礦日產量的10%，超過了普通定額的13倍。

但當時，蘇聯採煤技術很落後，一個礦工既要採煤，又要經常放下采煤的風鎬去清理和加固工作面，清理和加固完畢後，繼續拿起風鎬採煤，如此循環往復，效率很低。
不過斯達漢諾夫什麼都不用管，只負責用風鎬採煤，一路向前推進。斯達漢諾夫連續工作了5個小時45分鐘，中間沒有停歇，一口氣開採了超過100噸煤。

第二天早上，高度評價了斯達漢諾夫的成績，盛讚他創造了極具政治意義的世界紀錄，是落實斯大林同志關於領導幹部無條件提前完成年度計劃指示的最佳方法。
事蹟很快傳到了領導的耳朵裏，就囑咐過下面，要求在工人階級中尋找突出人物，樹立典型，製造英雄，振奮並鼓舞蘇聯人民，爲社會主義建設注入強大的精神力量。

最重要的一點——礦黨委全體會議警告所有人，那些懷疑、污衊、抹黑斯達漢諾夫同志事蹟的人，是反對我們國家最優秀人物的最兇惡、最卑鄙的敵人。敵人，當然得用鐵拳錘死。誰還敢多嘴？

老街口瓜子 发表评论于 2025-01-30 16:43:00

让美国蒸发上万亿，几个星际之门没了，这还了得，网络攻击，诬陷，造谣一起来，反华媒体更是上窜下跳

蓝天大地 发表评论于 2025-01-30 16:41:06

+100000

-------------------------------------------------------

Etornado 发表评论于 2025-01-30 14:39:12

我要真普選 发表评论于 2025-01-30 16:39:00

站在巨人的肩膊上吹牛B ，看誰比我高？

蓝天大地 发表评论于 2025-01-30 16:38:21

这个毛毛没有听说过商业协议。他认为所有的合同都是历史文件。

啊哈哈哈哈哈哈哈

------------------------------------------------

Simiguy 发表评论于 2025-01-30 14:10:00从人类发展的角度，这种＂偷＂值得提倡。 DS不可能什么都从头开始，open Al其实也不是从头开始。都是站在人类现有知识集基础之上的。至于楼下说的展会设计，你既然已经公开，就允许别人借鉴。天下所有车都是4个轮子，你不能说都是抄袭吧。

ajaychen_2024 发表评论于 2025-01-30 16:35:06

“实锤”？还是那句，请拿出证据。

TitaniumAtlas 发表评论于 2025-01-30 16:21:28拿笑话来论证也是醉了，ds那是看一眼的事情？偷窃人家的知识产权都实锤了。

雾蒙蒙雨霏霏 发表评论于 2025-01-30 16:25:21

酸葡萄，DS收费是OpenAI的20分之一，DS怎么去操作? 最好的策略是奋起直追，而不是做 crying baby。

Capitaltwo 发表评论于 2025-01-30 16:25:12

为了不让竞争对手对手难堪和留有余地（到底还是两岸一家亲），ds没有说他们用的都是国产gpu芯片做的系统，总共花了560万人民币成本。

弯刀月 发表评论于 2025-01-30 16:22:00

这个话题，我是法盲加科盲。你们随便吵，我歇会

TitaniumAtlas 发表评论于 2025-01-30 16:21:28

拿笑话来论证也是醉了，ds那是看一眼的事情？偷窃人家的知识产权都实锤了。

ajaychen_2024 发表评论于 2025-01-30 14:22:07 西方有一个“吹捧”中国逆向工程师的笑话，说不能在展览会让中国工程师看见触摸展品甚至看产品单张说明书，因为他们有“看一眼就能怀孕”的本事。如果DS的工程师有看一眼就“怀孕”的能力，那就是他们的真本事。

ajaychen_2024 发表评论于 2025-01-30 16:18:06

祸根是那5000亿美元的“星际之门”

杰瑞王 发表评论于 2025-01-30 16:16:00

怎回事儿？懂的都懂，不懂的在装傻；盛宴变闹剧

Panda-2020 发表评论于 2025-01-30 16:14:00

美国公司正在蒸馏DeekSeek open source

逆向操作 发表评论于 2025-01-30 16:13:26

这些质疑都出自台湾的1450

wanjiadeng 发表评论于 2025-01-30 16:10:26

回复：‘ajaychen_2024 发表评论于 2025-01-30 13:41:48
不要忘记，OPEN AI 是闭源的，而 DS 是开源的，不仅仅是公开代码，它还涉及数据、模型、工具以及整个开发流程的透明性和可访问性’

**================**

Open AI 从ChatGPT4才开始闭源的。那之前都是开源的。另外很多中国的AI模型都是基于Meta的LLaMa开源模型的

Panda44 发表评论于 2025-01-30 16:02:32

那OpenAI自己不可以“蒸馏”吗？DeepSeek还是独创了算法的！

橡皮潜艇 发表评论于 2025-01-30 15:54:58

还是要支持DS打压chatgpt的卖价。卷了我多少钱！

点点点点点 发表评论于 2025-01-30 15:50:20

文明千万不要和野蛮争论，不在一个认知水平上

点点点点点 发表评论于 2025-01-30 15:48:53

abibas有没有商标侵权adidas？这个问题的答案就能区分一个人是野蛮还是文明。

这里同理

ajaychen_2024 发表评论于 2025-01-30 15:46:55

DEEPSEEK V1早在11月份发布，V3在12月份就发布了，微软所说的“剽窃”只能是在之前的一段内事件发生因为训练模型需要时间，为什么那时不告，早不报告晚不报告，偏偏要等到股市大跳水之后微软才跳出来说。明显是因为华尔街资本大佬们十分不满，要撤资，微软才跳出来为自己的AI高费低能辩护甩锅，“都是他们DS偷的！老板不要撤资啊”

rayofday 发表评论于 2025-01-30 15:45:26

DS如果纯粹是一家民间企业参与AI生态降低研发使用成本那我是拥护的。但是它不是，最近的DS episode参与了太多利益色彩。 DS的模型已经发布有一段时间了，有反响但不轰动。但是前一阵子幻方和DS高层频频与国务院和相关领导机构互动，就是要设局在媒体及各社区自媒体的配合下在新年前发布最新产品造成轰动效应，用粉红的话说就是在AI领域对漂亮国发达科技反击，证明厉害锅在科技领域的领先地位和掀起一波新的爱国主义热潮，让漂亮国放弃对厉害锅的科技封锁。同时幻方作为量化机构非常熟悉花姐运作机制，在NASDAQ高位横盘时事先做空美股然后放出利空，配合在美国各种媒体及网络媒体的造势，打出这一发让花姐非常高兴的子弹，造成NVDA及整个科技股大盘恐慌性砸盘，收割不明就里的机构和散户。这一波幻方/DS在股市收获巨大，以致他们根本不需要在AI市场创收。被收割的也有不少逃离大A到美股讨生的天朝股民。这一波政治和金融层面的操作都非常高明，也非常邪恶????。

文学城普通人 发表评论于 2025-01-30 15:40:03

偷摸蒸馏是大家都用到一些，但是以大规模蒸馏作为手段也是绝少的，大规模蒸馏完了还要出来卖弄如何领先和成本优势，那是仅此一家了。再加上资本集团的操控市场得利，愚蠢媒体被利用，AI大拿为开源背书的狂热，所以就有了黑色星期一

老歌好听 发表评论于 2025-01-30 15:38:23

给你科普一下，第一，开源指的是算法的一部分，不含数据。用来训练的数据时AI的基础，不花时间和金钱是得不到的。DS偷的就是用美国公司根据数据训练而得到的结果，用来再次当作数据，因而被称作蒸馏，象从米酒提炼白酒一样。第二，Deepseek用从美国买来的几个大模型的API提取数据，用来开发竞争产品，这是直接违反合同的。所以说DS就是一个货真价实的山寨品
======================================]
Lira 发表评论于 2025-01-30 15:24:55既然“开源”了，不就是随便别人使用吗

Lira 发表评论于 2025-01-30 15:24:55

既然“开源”了，不就是随便别人使用吗？要不然，就用IP保护起来。
想起以前的大妓院，因为写着免费，被人多拿（不管有意无意），不高兴了，告到法院，结果人家法官说免费的东西，不能限制人拿。

橡皮潜艇 发表评论于 2025-01-30 15:24:21

离开open Ai，搞不到训练资料，DS就什么也不是。什么时候中国人可以独立生活？

ajaychen_2024 发表评论于 2025-01-30 15:20:47

看事情看两面，来看看当事人之一微软的COPILOT怎么说的：

COPILOT--
关于DeepSeek被指控偷窃模型训练数据的问题，有一些讨论和分析。

从技术角度来看，DeepSeek V3模型被指存在训练数据抄袭的问题，产生了奇怪的“幻觉”，例如自称是“GPT-4”，甚至连所讲的笑话都与GPT-4高度雷同12。这种现象可能是由于训练数据中混入了大量来自某个特定模型（例如GPT-4）的输出内容，导致新模型学习到了该模型的“说话方式”甚至“思维模式”，从而在特定情况下表现出与该模型类似的特征1。

此外，这个问题也引发了关于AI内容版权的讨论。现有的版权法难以完全适用于AI生成的内容，其“独创性”在法律上仍存争议，传统内容创造者的利益也会受到影响1。例如，《纽约时报》起诉OpenAI和微软等诉讼反映了这种焦虑1。

总的来说，DeepSeek的情况并非个例，其他大模型如Google的Gemini也曾出现过类似问题1。未来如何更好地对AI内容进行版权确定和使用，是一个需要解决的行业问题。

白云蓝天 发表评论于 2025-01-30 15:20:32

本人觉得 DeekSeek 的技术很大概率是中国自创的。在软件开发方面，中国的技术在很多方面不比美国差，而且关键是只要搞到顶尖水平的技术人员，就能做到。美国技术人员能够创造一种软件技术，难道中国技术人员连仿制的水平也没有？！关键是中国极有可能在两个方面说谎，一个大大的说低了成本，二是隐瞒硬件技术，即通过获得美国禁止出口中国的硬件才能够创建出DeekSeek。

Wuweixiao 发表评论于 2025-01-30 15:17:00

一团浆糊，有时说窍取，有时说他们其实不便宜，其实慌的一比

白云蓝天 发表评论于 2025-01-30 15:12:51

"即一个新的人工智能模型透过向一个现有模型提出数百万个问题，从中吸取其知识及模仿其推理过程。"——本人感觉靠这个是远远不够的。

而且通过这种笨办法（因为过程很繁杂，而结果很差）来建立一个新模型，还不如通过破解已有的人工智能的技术来建立一个新模型。

四月如风 发表评论于 2025-01-30 15:11:07

中共有本事自己弄出一个全新的车西，别老跟着人家屁股后面。美国花大功夫搞出来了他们弯道超车。世界上没有第二个国家如中共般无耻，抄袭偷窃简真就刻到他们骨子里。

橡皮潜艇 发表评论于 2025-01-30 15:08:28

川普说“AI”要回归经济规律，这个要挺

评论: DeekSeek靠“蒸馏”火出圈：到底是创新还是剽窃？