Ollama v0.31.1:Gemma 4 在 Mac 上快近 90%,MTP 多Token预测零配置加速
Ollama v0.31.1发布,核心改进:Gemma 4在Apple Silicon上推理速度提升近90%,得益于多token预测技术。底层MLX和llama.cpp引擎同步更新,所有平台获性能优化。Mac用户跑Gemma 4升级必备。
Ollama v0.31.1发布,核心改进:Gemma 4在Apple Silicon上推理速度提升近90%,得益于多token预测技术。底层MLX和llama.cpp引擎同步更新,所有平台获性能优化。Mac用户跑Gemma 4升级必备。