当AI模型拥有千万级Token的超长记忆力时,如何检验它们的真正实力?OpenAI给出了新答案:MRCR基准测试。这不再是简单的「大海捞针」,而是要求模型在海量文本中,区分并找到多个一模一样的「针」中的特定一个,难度堪称「AI 界的奥运会」。MRCR不仅有助于揭示当前AI的能力边界,也将促使下一代