评论: GPT-4.5震撼上线!OpenAI最大最贵模型最像人类
只有登录用户才能发表评论,
点击此处
登录
返回新闻帖
Bhistory
发表评论于 2025-02-28 08:51:39
在知识和情商上,GPT-4.5提高了
其他好像没什么突破
----------------------------------------------------------------------------------------
| Benchmark | GPT-4.5 Score | Grok 3 (Standard) | Grok 3 (Think Mode) | Notes |
----------------------------------------------------------------------------------------
| Math (AIME 2024) | 36.7% | 52.2% | 93.3% | Grok 3 excels in math |
| Science (GPQA) | 71.4% | 75.0% | 84.6% | Close in standard mode |
| Coding (LiveCode) | ~70-75% (est.)| 57.0% | 79.4% | GPT-4.5 est. from o1 |
----------------------------------------------------------------------------------------
弯刀月
发表评论于 2025-02-28 07:44:00
这个小白犹上窜下跳,好像这都是他发明的
码农个体户
发表评论于 2025-02-28 05:45:06
AI 还处于初级阶段,追踪这些“进步”实在是浪费时间,过几年再关注吧
thinredline
发表评论于 2025-02-28 04:45:45
Grok3比它更有性价比,而且免费。
宝刀屠龙
发表评论于 2025-02-28 04:16:10
令胡冲 发表评论于 2025-02-27 23:45:29
说明堆积GPU的方式已经穷途末路,行不通的。再堆积10倍的GPU,甚至都取得不了10%的提升。
Token价格比DeepSeek贵65倍。这你怎么能够生存下去?无法持续。
=========================================================
算上研发成本,innovator drug比generic drug生产成本高几十倍甚至几百倍
generic每天都在揩original玩家的油,全球这些顶级原研药开发企业都死了?
事实上,所有AI玩家都在优化算力算法,但同时也都在扩大算力中心
两条腿走路才是最佳路径,只有傻叉才会认为这些大玩家只会堆算力而不知道优化算法算力
就这还出来自以为是的做专家,还是洗洗睡吧
令胡冲
发表评论于 2025-02-27 23:45:29
说明堆积GPU的方式已经穷途末路,行不通的。再堆积10倍的GPU,甚至都取得不了10%的提升。
Token价格比DeepSeek贵65倍。这你怎么能够生存下去?无法持续。
———————
GPT-410倍计算量,token价格太离谱
heisse
发表评论于 2025-02-27 22:34:12
4.5+o3+deep research+agent=Chatgpt 5,虽然还没有到AGI,但会把其他AI模型又抛到了后面, API 价格这么贵,就是防着其他人copy output数据,no more chance for distillation!!!
ca_lowhand
发表评论于 2025-02-27 21:25:00
增加了模拟情商能力,自然对话有表现力感染力。然而这么离谱的价格,决定了它只是个高级玩具,没有任何商业价值。
页次:
1
/1
每页
50
条记录, 本页显示
1
到
8
, 共
8
分页: [
1
]
其他好像没什么突破
----------------------------------------------------------------------------------------
| Benchmark | GPT-4.5 Score | Grok 3 (Standard) | Grok 3 (Think Mode) | Notes |
----------------------------------------------------------------------------------------
| Math (AIME 2024) | 36.7% | 52.2% | 93.3% | Grok 3 excels in math |
| Science (GPQA) | 71.4% | 75.0% | 84.6% | Close in standard mode |
| Coding (LiveCode) | ~70-75% (est.)| 57.0% | 79.4% | GPT-4.5 est. from o1 |
----------------------------------------------------------------------------------------