快讯发布

即时快讯 0

加州大学圣迭戈分校Hao AI实验室近期利用《逆转裁判》对GPT-4.1、Gemini 2.5 Pro、Llama-4 Maverick等AI模型进行了推理能力测试,AI需要收集线索、揭露矛盾,最终揭开真相,大喊“异议”,每种AI仅有5次举证失败的机会。#AI模型挑战逆转裁判#

其中O1和Gemini 2.5 Pro表现最佳,成功晋级第4关,但由于只有5次举证失败机会,参与测试的AI都没能成功通关。 http://t.cn/A6dAw6O5

来源:微博

发表评论 取消回复
图片 链接