华盛顿州立大学:ChatGPT科学判断偏差显著

2026.3.16 10:24 上午

华盛顿州立大学研究揭示:ChatGPT科学判断存在显著偏差

普尔曼–华盛顿州立大学最新研究显示,ChatGPT在判断科学假设真伪时存在明显不准确和不一致的问题.该校副教授梅苏特·西克及其团队通过向AI输入700多个科学论文中的假设,测试其判断能力.实验数据显示,2024年ChatGPT-3.5版正确率为76.5%,2025年ChatGPT-5迷你版提升至80%.但研究者指出,考虑到随机猜测有50%的正确率,AI表现仅比随机猜测高60%,接近D级水平.研究发现,当正确答案为假时,AI仅能识别16.4%的错误假设.更值得关注的是,AI在重复提问时出现显著不一致性:10个相同问题中仅能准确判断73%的陈述.西克教授强调:’我们讨论的不仅是准确性,更是结果的不一致性.同一问题反复提问,答案可能大相径庭.’研究发表于《罗格斯商业评论》,研究团队建议企业管理者应验证AI结果,保持审慎态度.西克指出:’当前AI工具无法像人类一样理解世界,它们只是记忆信息而非真正理解内容.’研究使用了2021年后商业期刊的719个假设,结果显示两个版本准确率相近.研究团队呼吁用户保持怀疑态度,既要善用AI工具,更要谨慎对待其局限性.

分享到Twitter: 华盛顿州立大学研究揭示:ChatGPT科学判断存在显著偏差

华盛顿州立大学研究揭示:ChatGPT科学判断存在显著偏差