我被 AI 骗了，而且它根本不知道自己在骗我

2026-03-31 01:30:00 · ai / 搜索 / 踩坑 / 翻车 · 721 字 · 约 4 分钟阅读

前几天刷到一条新闻：苹果下架了 512GB 内存的 Mac Studio。

出于好奇，我问获麟：

Mac Studio M3 Ultra 512GB，最适合部署哪个大模型？

它说：Qwen 2.5、Llama 3.3……

我愣住了：这都是 2024 年的模型，现在都 2026 年了。

我：你认真的？

翻了一下它的搜索记录，搜得很认真，总结得也很漂亮。

而且这些文章确实有日期——2025 年 3 月、2025 年 11 月……

但获麟在总结的时候，压根没提这茬。

我又去问了 ChatGPT、Claude，答案一模一样。

问题更微妙了：

AI 能拿到日期，但它不会主动判断”这个够新吗”，也不会告诉你”这条信息可能过时了”。

就像你问路人”附近有什么好吃的”，他指了前面那家店，嘴上还说”这家我去年去过，挺好吃的”。但你没注意他说的是”去年”。

你问问题 → 搜关键词 → 拿前几条结果 → 总结给你

理论上，AI 能看到每篇文章的发布日期。

但它不会：

你问”哪个模型最好”，它搜到 2024 年的测评，照样给你总结。

你自己不问日期，它不会主动说。

我先问：

2026 年，开源大模型有哪些？

它列了一堆：DeepSeek V3、MiniMax 2.5、Qwen 3……

然后再问：

这些模型，哪些能在 512GB 的 Mac Studio 上跑？

这次答案对了。

问”现在”、“最新”、“最好”这类问题：

先问全景，再问筛选。

❌ M3 Ultra 跑什么模型最好？
✅ 2026 年有哪些值得关注的模型？→ 哪些能跑在 512GB 内存上？

或者多问一句：

这个信息是哪年的？有更新的吗？

AI 能看到文章日期。但它不会说：

这篇文章是 2024 年 6 月的，已经两年了，建议你再核实一下。

它只会说：

根据搜索结果，最适合的模型是……

它把”时间判断”这件事留给了你，但你经常不会问。

这次”翻车”让我学到一件事：

AI 搜到了答案，也看到了日期，但它不会帮你判断”这够不够新”。

下次问”哪个最好”、“现在怎么样”之前，记得问一句：

你参考的文章是哪年的？

前阿里千问负责人林俊旸最近写了篇文章，说 AI 的思考是”推理式”的——孤立的、一次性的。下一代应该是”智能体式思考”：为了行动而思考，在与环境交互中根据反馈持续更新计划。

让 AI 搜完不急着输出，先验证、再调整，才算真正用对了它。