评论:特朗普AI顾问：DeepSeek抄袭ChatGPT

fkcom 发表评论于 2025-01-30 08:29:35

``

TXZS 发表评论于 2025-01-30 06:43:08

今年的葡萄真特么酸

TXZS 发表评论于 2025-01-30 06:41:53

“有大量证据表明。。。” ？

证据在哪儿呢？拿给瓜民们看看呗？

不会又是一袋洗衣粉吧？

会当凌绝顶1 发表评论于 2025-01-30 06:21:32

DeepSeek “深度寻找”：蒸馏，偷窃数据，盗用模型，隐瞒使用大量GPU芯片……

ajaychen_2024 发表评论于 2025-01-30 04:02:26

“可能，也许或者，if， maybe”，又拿不出实证，莫须有罢了，AI业界要向投入几千亿美元的资本大佬交待啊

玻璃坊 发表评论于 2025-01-30 03:23:18

David Sacks原话没有“抄袭”两个字、也没有暗示抄袭。
不知道标题上抄袭两个字是怎么来的

ajaychen_2024 发表评论于 2025-01-30 02:16:36

科普一下

大模型的#蒸馏(Distillation) 及#DeepSeek遭遇的指控
***youtu.be/jsLdkrM6RB8?si=m4Qz0BJNkk9X0-6K

Maui2021 发表评论于 2025-01-30 00:25:34

既然是抄作业，那架构和训练时间都没意义了。直接作弊，直接当然快。

骂人不好发表评论于 2025-01-29 19:44:38目前好像主要是集中在DS的数据蒸馏上，对于她的架构和代码并没有什么争议。transformer 是流行的架构，DS的代码是开源的。如果用了别的模型的数据蒸馏之后来训练自己的模型，想想是能够减少数据量，缩短训练时间，对于GPU的性能要求也可以降低。如果用于数据蒸馏的数据没有授权，估计会有问题。

worley 发表评论于 2025-01-29 23:17:05

中共独裁集团真无耻。

如果可以这么偷数据，美国的其它AI公司为啥不做？
搜索引擎搜集的是公开数据，如果不小心用了有版权的数据，也会吃官司。

这些公开数据价值并不大，因为只有信息而没有答案。
有价值的是“问题，答案，推理思路”，这在互联网上是搜不到的，都是需要购买的。数据科学家还要测试、验证，保证答案正确，保证推理思路正确。
而DeepSeek直接偷数据，成本就是零了。

znggg 发表评论于 2025-01-29 22:52:50

deepseek用了chatgpt污染的数据源，造成deepseek回答自己是chatgpt，这个在很多LLM中发生过，责任在chatgpt

河西海龟 发表评论于 2025-01-29 21:52:00

OpenAI偷全世界的，DeepSeek偷OpenAI的。

edccde 发表评论于 2025-01-29 21:20:57

ChatGPT抄袭全部的互联网啊，好几个起诉他侵权的官司还在打呢，在这里装什么小天真。

泥川发表评论于 2025-01-29 20:20:58

DeepSeek R1已被提炼到 Llama 70B （Meta 开发的AI模型）中，据基准和人工评估，通过R1改进的Llama 70B 比原来的更智能，并且在需要数学和事实精度的任务上表现尤为出色。

使用 DeepSeek-R1 生成的样本对 Llama70B 进行微调的版本，现已在 GroqCloud 上线，用于实时推理。

泥川发表评论于 2025-01-29 20:07:49

微软 AI 平台副总裁 By Asha Sharma 表示：“在 Azure AI Foundry 上使用 DeepSeek R1 或任何其他模型的主要优势之一是开发人员可以快速试验、迭代并将 AI 集成到他们的工作流程中。”“DeepSeek R1 经过了严格的红队测试和安全评估，包括对模型行为的自动评估和广泛的安全审查，以减轻潜在风险。”

R1 最初于本月初作为开源模型发布，微软以惊人的速度将其集成到 Azure AI Foundry 中。该软件制造商还将很快推出精简版的 R1，供 Copilot Plus PC 本地运行，我们甚至有可能看到 R1 出现在微软的其他 AI 服务中。

爱阅读的人 发表评论于 2025-01-29 19:54:00

千万别被这些人帶偏了，中国在2026 初还会上线更牛的，美国自己把产品做的更好才是硬道理. 良性竞争对市场是非常必要的.

骂人不好 发表评论于 2025-01-29 19:52:30

OpenAI如果想，可以用她的代码和自己的蒸馏后的数据试一下，看能不能复刻她的那些RL的效果和顿悟的现象。如果完全不能，那就像blue tag网友说的，开源的代码可能就没有什么意义。

不过模型已经训练出来了，周末有时间在自己的机器上装一个小的，可以和其它的模型对比着用，对于一般用户也不是什么坏事。反正我也不会取消ChatGPT的订阅。

骂人不好 发表评论于 2025-01-29 19:44:38

目前好像主要是集中在DS的数据蒸馏上，对于她的架构和代码并没有什么争议。transformer 是流行的架构，DS的代码是开源的。如果用了别的模型的数据蒸馏之后来训练自己的模型，想想是能够减少数据量，缩短训练时间，对于GPU的性能要求也可以降低。如果用于数据蒸馏的数据没有授权，估计会有问题。

bluetag 发表评论于 2025-01-29 19:34:00

开源不开源并不重要，也没有人会对它的源代码感兴趣，大家感兴趣的是它到底用了什么训练数据，它不公开训练数据，你就没法验证它公开的源代码是不是真实的，也没法验证它声称的成本是不是真实的，如果它的数据是偷来的，那它就没有任何价值，因为它的表现也没有超过之前的模型，顶多就是重复了别人的工作。

时不时来看看 发表评论于 2025-01-29 19:14:15

openai：人家把代码都拿出来了，也没有收费，还要咋样？

是不是让他们闭源，然后还给微软？怎么BillGates的后代也变强权了，以前都是收购，然后慢慢灭掉，比如IE，现在要干啥？

长剑倚天 发表评论于 2025-01-29 19:13:47

看来大嘴又被骗了！
什么顾问，解雇他！

speedingticket 发表评论于 2025-01-29 19:12:17

什么抄袭不抄袭的，无非是看到中国的进步，自己赶不上，只能找些借口，骗人骗己罢了。
ds是在chatgpt的基础上，更进一步，便宜实惠，好用
所有的科研论文都是在别人的成果的基础上,进一步深入研究的结果，论文后面有一大堆参考文献，你能说这个考研论文是抄袭参考文献的？
中国过去没有电动车，你能说中国的电动车都是抄袭外国的？

bluetag 发表评论于 2025-01-29 19:01:00

自称自己是ChatGPT已是铁证，不用抵赖了。

worley 发表评论于 2025-01-29 18:58:30

代码是用Meta和其它开源软件修改的，数据是从ChatGPT非法提取的。

lue96500 发表评论于 2025-01-29 18:53:59

1 你设限、不民主、不自由
2 客户资料不安全
3 你抄我的
绝口不提任何技术问题

supernova13 发表评论于 2025-01-29 18:52:50

关于“如果你问它你是什么模型，它会说，‘我是 ChatGPT’” 油管上有老美解释过，是正常现象。ChatGPT也曾自称是别的模型。训练模型需要海量数据，借用重叠很正常。就好比有一个著名棋谱，所有下棋的AI都会研究吸收。

viBravo5 发表评论于 2025-01-29 18:48:25

看来这是一次中美AI战中的珍珠港事件

新燕山夜话 发表评论于 2025-01-29 18:36:57

什么混蛋顾问？ChatGPT根本就不开源，没人知道其源代码，怎么抄袭？

评论: 特朗普AI顾问：DeepSeek抄袭ChatGPT