评论: 特朗普AI顾问:DeepSeek抄袭ChatGPT

只有登录用户才能发表评论,点击此处登录    返回新闻帖
fkcom 发表评论于 2025-01-30 08:29:35
``
TXZS 发表评论于 2025-01-30 06:43:08
今年的葡萄真特么 酸
TXZS 发表评论于 2025-01-30 06:41:53
“有大量证据表明。。。” ?

证据在哪儿呢?拿给瓜民们看看呗?

不会又是一袋洗衣粉吧?
会当凌绝顶1 发表评论于 2025-01-30 06:21:32
DeepSeek “深度寻找”:蒸馏,偷窃数据, 盗用模型,隐瞒使用大量GPU芯片……
ajaychen_2024 发表评论于 2025-01-30 04:02:26
“可能,也许 或者,if, maybe”,又拿不出实证,莫须有罢了,AI业界要向投入几千亿美元的资本大佬交待啊
玻璃坊 发表评论于 2025-01-30 03:23:18
David Sacks原话没有“抄袭”两个字、也没有暗示抄袭。
不知道标题上抄袭两个字是怎么来的
ajaychen_2024 发表评论于 2025-01-30 02:16:36
科普一下

大模型的#蒸馏(Distillation) 及#DeepSeek遭遇的指控
***youtu.be/jsLdkrM6RB8?si=m4Qz0BJNkk9X0-6K
Maui2021 发表评论于 2025-01-30 00:25:34
既然是抄作业,那架构和训练时间都没意义了。直接作弊,直接当然快。

骂人不好 发表评论于 2025-01-29 19:44:38目前好像主要是集中在DS的数据蒸馏上,对于她的架构和代码并没有什么争议。transformer 是流行的架构,DS的代码是开源的。如果用了别的模型的数据蒸馏之后来训练自己的模型,想想是能够减少数据量,缩短训练时间,对于GPU的性能要求也可以降低。如果用于数据蒸馏的数据没有授权,估计会有问题。
worley 发表评论于 2025-01-29 23:17:05
中共独裁集团真无耻。

如果可以这么偷数据,美国的其它AI公司为啥不做?
搜索引擎搜集的是公开数据,如果不小心用了有版权的数据,也会吃官司。

这些公开数据价值并不大,因为只有信息而没有答案。
有价值的是“问题,答案,推理思路”,这在互联网上是搜不到的,都是需要购买的。数据科学家还要测试、验证,保证答案正确,保证推理思路正确。
而DeepSeek直接偷数据,成本就是零了。
znggg 发表评论于 2025-01-29 22:52:50
deepseek用了chatgpt污染的数据源,造成deepseek回答自己是chatgpt,这个在很多LLM中发生过,责任在chatgpt
河西海龟 发表评论于 2025-01-29 21:52:00
OpenAI偷全世界的,DeepSeek偷OpenAI的。
edccde 发表评论于 2025-01-29 21:20:57
ChatGPT抄袭全部的互联网啊,好几个起诉他侵权的官司还在打呢, 在这里装什么小天真。
泥川 发表评论于 2025-01-29 20:20:58
DeepSeek R1已被提炼到 Llama 70B (Meta 开发的AI模型)中,据基准和人工评估,通过R1改进的Llama 70B 比原来的更智能,并且在需要数学和事实精度的任务上表现尤为出色。

使用 DeepSeek-R1 生成的样本对 Llama70B 进行微调的版本,现已在 GroqCloud 上线,用于实时推理。
泥川 发表评论于 2025-01-29 20:07:49
微软 AI 平台副总裁 By Asha Sharma 表示:“在 Azure AI Foundry 上使用 DeepSeek R1 或任何其他模型的主要优势之一是开发人员可以快速试验、迭代并将 AI 集成到他们的工作流程中。”“DeepSeek R1 经过了严格的红队测试和安全评估,包括对模型行为的自动评估和广泛的安全审查,以减轻潜在风险。”

R1 最初于本月初作为开源模型发布,微软以惊人的速度将其集成到 Azure AI Foundry 中。该软件制造商还将很快推出精简版的 R1,供 Copilot Plus PC 本地运行,我们甚至有可能看到 R1 出现在微软的其他 AI 服务中。
爱阅读的人 发表评论于 2025-01-29 19:54:00
千万别被这些人帶偏了, 中国在2026 初还会上线更牛的,美国自己把产品做的更好才是硬道理. 良性竞争对市场是非常必要的.
骂人不好 发表评论于 2025-01-29 19:52:30
OpenAI如果想,可以用她的代码和自己的蒸馏后的数据试一下,看能不能复刻她的那些RL的效果和顿悟的现象。如果完全不能,那就像blue tag网友说的,开源的代码可能就没有什么意义。

不过模型已经训练出来了,周末有时间在自己的机器上装一个小的,可以和其它的模型对比着用,对于一般用户也不是什么坏事。反正我也不会取消ChatGPT的订阅。
骂人不好 发表评论于 2025-01-29 19:44:38
目前好像主要是集中在DS的数据蒸馏上,对于她的架构和代码并没有什么争议。transformer 是流行的架构,DS的代码是开源的。如果用了别的模型的数据蒸馏之后来训练自己的模型,想想是能够减少数据量,缩短训练时间,对于GPU的性能要求也可以降低。如果用于数据蒸馏的数据没有授权,估计会有问题。
bluetag 发表评论于 2025-01-29 19:34:00
开源不开源并不重要,也没有人会对它的源代码感兴趣,大家感兴趣的是它到底用了什么训练数据,它不公开训练数据,你就没法验证它公开的源代码是不是真实的,也没法验证它声称的成本是不是真实的,如果它的数据是偷来的,那它就没有任何价值,因为它的表现也没有超过之前的模型,顶多就是重复了别人的工作。
时不时来看看 发表评论于 2025-01-29 19:14:15
openai:人家把代码都拿出来了,也没有收费,还要咋样?

是不是让他们闭源,然后还给微软?怎么BillGates的后代也变强权了,以前都是收购,然后慢慢灭掉,比如IE,现在要干啥?
TitaniumAtlas 发表评论于 2025-01-29 19:14:07
纯属洗地,从来没有过

supernova13 发表评论于 2025-01-29 18:52:50 关于“如果你问它你是什么模型,它会说,‘我是 ChatGPT’” 油管上有老美解释过,是正常现象。ChatGPT也曾自称是别的模型。训练模型需要海量数据,借用重叠很正常。就好比有一个著名棋谱,所有下棋的AI都会研究吸收。
长剑倚天 发表评论于 2025-01-29 19:13:47
看来大嘴又被骗了!
什么顾问,解雇他!
TitaniumAtlas 发表评论于 2025-01-29 19:13:08
不是抄袭,是偷窃
speedingticket 发表评论于 2025-01-29 19:12:17
什么抄袭不抄袭的,无非是看到中国的进步,自己赶不上,只能找些借口,骗人骗己罢了。
ds是在chatgpt的基础上,更进一步,便宜实惠,好用
所有的科研论文都是在别人的成果的基础上,进一步深入研究的结果,论文后面有一大堆参考文献,你能说这个考研论文是抄袭参考文献的?
中国过去没有电动车,你能说中国的电动车都是抄袭外国的?
bluetag 发表评论于 2025-01-29 19:01:00
自称自己是ChatGPT已是铁证,不用抵赖了。
worley 发表评论于 2025-01-29 18:58:30
代码是用Meta和其它开源软件修改的,数据是从ChatGPT非法提取的。
lue96500 发表评论于 2025-01-29 18:53:59
1 你设限、不民主、不自由
2 客户资料不安全
3 你抄我的
绝口不提任何技术问题
supernova13 发表评论于 2025-01-29 18:52:50
关于“如果你问它你是什么模型,它会说,‘我是 ChatGPT’” 油管上有老美解释过,是正常现象。ChatGPT也曾自称是别的模型。训练模型需要海量数据,借用重叠很正常。就好比有一个著名棋谱,所有下棋的AI都会研究吸收。
viBravo5 发表评论于 2025-01-29 18:48:25


看来这是一次中美AI战中的珍珠港事件
新燕山夜话 发表评论于 2025-01-29 18:36:57
什么混蛋顾问?ChatGPT根本就不开源,没人知道其源代码,怎么抄袭?
页次:1/1 每页50条记录, 本页显示129, 共29  分页:  [1]