Ollama v0.24.0 更新:Codex App集成、内置浏览器、代码审查,本地AI编程工作台来了
Ollama v0.24.0将本地AI编程从命令行工具升级为完整工作台,集成Codex App桌面体验,支持多线程、内置浏览器实时预览代码效果并接收自然语言指令,以及代码审查模式。推荐本地模型qwen3.6、gemma4:31b等,并优化了Mac的MLX采样器。
Ollama v0.24.0将本地AI编程从命令行工具升级为完整工作台,集成Codex App桌面体验,支持多线程、内置浏览器实时预览代码效果并接收自然语言指令,以及代码审查模式。推荐本地模型qwen3.6、gemma4:31b等,并优化了Mac的MLX采样器。
Ollama发布v0.23.1和v0.23.2版本。v0.23.1为Mac MLX首次带来Gemma 4 MTP加速,31B模型编码速度提升超2倍。v0.23.2优化/api/show接口缓存,中位延迟降低约6.7倍,显著提升VS Code等工具加载速度。
Ollama v0.22.0新增两款开源模型:NVIDIA Nemotron 3 Omni多模态大模型(支持文本、代码、图像,需8GB+显存)和Poolside Laguna XS.2编程专用模型(轻量约3-4GB,4GB显存可运行)。适合需要本地多模态能力或代码补全的开发者,可通过ollama pull命令快速部署。
Ollama v0.21.1发布,主要更新包括:集成Kimi CLI,可一键启动月之暗面K2.6模型(需联网);MLX采样速度提升17%以上,Apple Silicon用户受益;新增logprobs支持;修复macOS模型选择器及Gemma 4结构化输出bug。适合Mac和Kimi用户升级。
Ollama v0.21.0版本为Apple Silicon Mac用户带来重要更新:通过MLX后端高效支持Gemma 4模型,并新增一键配置的Hermes Agent功能与GitHub Copilot CLI集成,同时优化了launch命令的配置体验。
Ollama v0.20.7修复了Gemma模型在禁用thinking模式时的输出质量问题,并为Linux平台的AMD显卡用户升级ROCm至7.2.1,提升了GPU兼容性与性能。
Ollama v0.20.6版本优化了Gemma 4模型的工具调用能力与稳定性,提升了并行工具调度的执行效率,并修复了应用层面的问题。同时补充了Hermes Agent的官方文档,建议开发者升级以获得更流畅的体验。
Ollama v0.20.5 新增 `ollama launch openclaw` 命令,可直接连接 WhatsApp、Telegram 等消息通道,便于将本地模型接入日常聊天工具。同时为 Gemma 4 模型启用 Flash Attention 以提升性能,并修复了若干问题。
Ollama v0.20.4版本发布,主要带来两项性能优化:针对Apple Silicon设备的MLX后端引入NAX注意力机制,提升M5模型推理性能;为Gemma 4系列模型启用Flash Attention,显著降低显存占用与计算开销。建议相关用户升级以获得性能提升。
Ollama发布v0.20.2版本,将桌面应用默认首页从启动页改为新建对话界面。用户打开应用即可直接开始对话,简化了操作步骤,提升了交互体验。该更新由创始人亲自提交,建议所有桌面用户升级。
Ollama v0.20.0 正式发布,完整支持 Google 最新 Gemma 4 系列模型,包括轻量级 E2B、平衡型 E4B、高效 MoE 架构的 26B 及最强性能的 31B 版本。更新还包含 MLX 优化、Tokenizer 增强及文档改进,使开发者能快速在本地体验这些高性能开源模型。
Ollama v0.19.0版本发布,重点优化了KV缓存命中率以提升响应速度并降低成本,新增Web搜索插件使AI能获取实时信息,修复了Qwen系列模型的工具调用解析等问题,同时改进了macOS的MLX Runner并修复多项错误,提升了整体稳定性和性能。