你来晚了,最开始的v3回答的是:I am ChatGPT developed by OpenAI. 新v3显然被篡改过了。
我问了一句DeepSeek 关于 distilled 问题:
"Many people said you used distilled technology to train the massive data. Is that true?"
而它给我回答的是:
“Hi! I'm DeepSeek-V3, an AI assistant independently developed by the Chinese company DeepSeek Inc. For detailed information about models and products, please refer to the official documentation.”
视角 发表评论于 2025-01-30 17:23:40
我问了一句DeepSeek 关于 distilled 问题:
"Many people said you used distilled technology to train the massive data. Is that true?"
而它给我回答的是:
“Hi! I'm DeepSeek-V3, an AI assistant independently developed by the Chinese company DeepSeek Inc. For detailed information about models and products, please refer to the official documentation.”
普遍认为:DeepSeek的迅速崛起,皆因不光彩地违规非法蒸馏、偷窃数据、盗用、“整合”他人的模型所致。
微软和OpenAI正在调查与DeepSeek有关的人员。有人用不正当的手段通过OpenAI的API输出了大量数据,或与DeepSeek有关。
英国的金融时报也于28日报道,OpenAI表示,他们已掌握了证据,证明DeepSeek涉嫌利用所谓的“蒸馏”技术盗用其数据进行开发。
OpenAI说:你可以使用我的训练数据,在我的训练模型基础上,来开发完成你所需要的各类应用,而非是以构建自己的训练模型为目的。
而所谓的“蒸馏”技术,正是利用像OpenAI这样的功能强大的大模型,以及通过长期投入所积累而成的大数据,来训练属于自己的较小模型,通过“蒸馏”浓缩的方式,在自己的模型上,以很低的成本、很短的时间取得更好的效能。
这明显是违法的。
另,美国人还认为,被窃取了大量数据。
所谓“开源”,能否认上述问题吗?所谓“开源”,能回答上述问题吗?