加州大学圣迭戈分校Hao AI实验室近期利用《逆转裁判》对GPT-4.1、Gemini 2.5 Pro、Llama-4 Maverick等AI模型进行了推理能力测试,AI需要收集线索、揭露矛盾,最终揭开真相,大喊“异议”,每种AI仅有5次举证失败的机会。#AI模型挑战逆转裁判#
其中O1和Gemini 2.5 Pro表现最佳,成功晋级第4关,但由于只有5次举证失败机会,参与测试的AI都没能成功通关。 http://t.cn/A6dAw6O5
来源:微博
加州大学圣迭戈分校Hao AI实验室近期利用《逆转裁判》对GPT-4.1、Gemini 2.5 Pro、Llama-4 Maverick等AI模型进行了推理能力测试,AI需要收集线索、揭露矛盾,最终揭开真相,大喊“异议”,每种AI仅有5次举证失败的机会。#AI模型挑战逆转裁判#
其中O1和Gemini 2.5 Pro表现最佳,成功晋级第4关,但由于只有5次举证失败机会,参与测试的AI都没能成功通关。 http://t.cn/A6dAw6O5
来源:微博