大海捞针

首页 > 大海捞针 >

大海捞针

让GPT-4.1「头皮发麻的考试」，OpenAI给大模型上强度，AI能赢吗？

当AI模型拥有千万级Token的超长记忆力时，如何检验它们的真正实力？OpenAI给出了新答案：MRCR基准测试。这不再是简单的「大海捞针」，而是要求模型在海量文本中，区分并找到多个一模一样的「针」中的特定一个，难度堪称「AI 界的奥运会」。MRCR不仅有助于揭示当前AI的能力边界，也将促使下一代
2025-05-06 11:06:00

热门文章

最新文章