前几天刷到一条新闻:苹果下架了 512GB 内存的 Mac Studio。

出于好奇,我问获麟:

Mac Studio M3 Ultra 512GB,最适合部署哪个大模型?

它说:Qwen 2.5、Llama 3.3……

我愣住了:这都是 2024 年的模型,现在都 2026 年了。


我:你认真的?

翻了一下它的搜索记录,搜得很认真,总结得也很漂亮。

而且这些文章确实有日期——2025 年 3 月、2025 年 11 月……

但获麟在总结的时候,压根没提这茬。

我又去问了 ChatGPT、Claude,答案一模一样。

问题更微妙了:

AI 能拿到日期,但它不会主动判断”这个够新吗”,也不会告诉你”这条信息可能过时了”。

就像你问路人”附近有什么好吃的”,他指了前面那家店,嘴上还说”这家我去年去过,挺好吃的”。但你没注意他说的是”去年”。


AI 搜东西的逻辑

你问问题 → 搜关键词 → 拿前几条结果 → 总结给你

理论上,AI 能看到每篇文章的发布日期。

但它不会:

  • 提取日期并标注在答案里
  • 判断”这个日期够不够新”
  • 提醒你”这篇文章是两年前的”

你问”哪个模型最好”,它搜到 2024 年的测评,照样给你总结。

你自己不问日期,它不会主动说。


我换了个问法,答案完全不一样

我先问:

2026 年,开源大模型有哪些?

它列了一堆:DeepSeek V3、MiniMax 2.5、Qwen 3……

然后再问:

这些模型,哪些能在 512GB 的 Mac Studio 上跑?

这次答案对了。


正确的姿势

问”现在”、“最新”、“最好”这类问题:

先问全景,再问筛选。

❌ M3 Ultra 跑什么模型最好?
✅ 2026 年有哪些值得关注的模型?→ 哪些能跑在 512GB 内存上?

或者多问一句:

这个信息是哪年的?有更新的吗?


AI 有日期,但不判断

AI 能看到文章日期。但它不会说:

这篇文章是 2024 年 6 月的,已经两年了,建议你再核实一下。

它只会说:

根据搜索结果,最适合的模型是……

它把”时间判断”这件事留给了你,但你经常不会问。


最后

这次”翻车”让我学到一件事:

AI 搜到了答案,也看到了日期,但它不会帮你判断”这够不够新”。

下次问”哪个最好”、“现在怎么样”之前,记得问一句:

你参考的文章是哪年的?


前阿里千问负责人林俊旸最近写了篇文章,说 AI 的思考是”推理式”的——孤立的、一次性的。下一代应该是”智能体式思考”:为了行动而思考,在与环境交互中根据反馈持续更新计划。

让 AI 搜完不急着输出,先验证、再调整,才算真正用对了它。