DeepSeek是基于QWen和Llama的开源模型,

浮生若梦 为欢几何 踏实做事 有趣做人
打印 被阅读次数

??大家认识这个牛人吧,卷积网络之父,图灵奖得主,深度学习领域巨头?-未完的歌-??给 未完的歌 发送悄悄话?未完的歌 的博客首页?(81 bytes) (198 reads) 01/24/2025?postreply 19:23:00

??杨丽坤呀,AI大佬?-徙倚彷徨神光离合-??给 徙倚彷徨神光离合 发送悄悄话?(0 bytes) (6 reads) 01/24/2025?postreply 19:25:02

??你该明白他说的吧,?-未完的歌-??给 未完的歌 发送悄悄话?未完的歌 的博客首页?(0 bytes) (8 reads) 01/24/2025?postreply 19:25:47

??用的美国的开源模型,超过了GPT的模型?-徙倚彷徨神光离合-??给 徙倚彷徨神光离合 发送悄悄话?(0 bytes) (9 reads) 01/24/2025?postreply 19:27:02

??其实前些日子,我贴过deepseek梁文锋说过的话,?-未完的歌-??给 未完的歌 发送悄悄话?未完的歌 的博客首页?(27116 bytes) (155 reads) 01/24/2025?postreply 19:32:38

?

去看了一下DeepSeek的论文摘要,论文很明确地说,DeepSeek R1 基于是QWen和Llama的开源模型,

而Llama来自Meta的开源,首次发布是在2023年2月,所以有了AI大佬的那一段评论。。。

说到这里,的确要赞一下DeepSeek,“They came up with new ideas and built them on top of other people's work.”



?

?



登录后才可评论.