基准测试 - AI日报

当前位置：首页 >> 相关内容

o3模型基准测试分数仅为10%，远低于OpenAI宣传的25%

在首先方和第三方基准测试结果上存在差异，这也引发了人们对该公司透明度和模型测试实践的质疑。上周公开推出的模型得多得多。的独立基准测试结果。计算层级都比我们（做基准测试时使用的）版本要小。一般来说，计算···

2025-04-23145 +
阅读更多
AI应用创业公司：大模型最近的突破，全是作弊

大模型的发布，并尝试过几乎每个声称有所改进的主要新版本。月以来，我们的扫描有了很大的改进，但这是因为常规工程，而不是模型改进的提升。如果你是大模型竞品公司的工程师，这或许是个好消息！即使你一开始对科技···

2025-04-20134 +
阅读更多

首页 1 1/1 尾页