Ollama v0.23.1 发布：Gemma 4 MTP 加速，Mac 编码速度翻倍

AI摘要

Gemma 4 发布 v0.23.1 版本，免费开源。Mac 用户首次获得 MTP 加速支持，31B 模型 coding 任务速度提升超 2 倍。同时优化 MLX 线程并升级 Go 1.26。仅限 Mac MLX 版本，Windows/Linux 暂无影响。

⏰ 发布时间：2026-05-05

⭐ 版本：v0.23.1

🆓 费用：免费开源

🔥 Mac 用户尖叫！Gemma 4 终于支持 MTP 加速了，coding 任务速度直接翻倍 💪

🔥 这次更新了什么？

ollama run gemma4:31b-coding-mtp-bf16

老规矩，先拉取模型：

ollama pull gemma4:31b-coding-mtp-bf16

Q：MTP 是什么？

A：Multi-token Prediction，一次性预测多个词元，减少推理延迟 🍎

Q：只有 Mac 能用吗？

A：目前 MTP 加速仅支持 Mac MLX 版本，CUDA 版本暂未上线

这次最让我兴奋的是 Gemma 4 终于在 Mac 上跑出满意的速度了 🏃‍♂️ 之前用 31B coding 感觉还是有点慢，现在 MTP 加速后体验应该会好很多。如果你也是 Mac + Ollama 用户，建议更新试试！