Ollama 2026年6月更新汇总：v0.30.11 Codex自动安装 + 推测解码优化 + API对齐

AI摘要

Ollama 2026年6月密集发布10个版本，核心亮点：Claude Code和opencode自动安装、MLX推测解码优化提升Apple Silicon速度、API行为对齐、支持Command A和North模型、Windows双显卡修复、文档改版。

⏰ 更新周期：2026年6月
📊 版本范围：v0.30.2 ~ v0.30.11
🆓 费用：免费开源

6月份的 Ollama 更新相当密集，一口气发布了 10 个版本！🔥 从新模型支持到桌面端集成、Bug 修复到性能优化，每个版本都有实质性的改进。这篇文章帮你梳理完整更新内容。

💡 最新亮点：Codex/Claude Code 自动安装、推测解码优化、API 行为对齐

📦 v0.30.11 - 2026年6月25日

📅 2026年6月25日发布

🔥 这次更新了什么？

1️⃣ Claude Code 自动安装 — Launch 现在支持自动安装 Anthropic 的 Claude Code，开箱即用 🚀

2️⃣ opencode 自动安装 + thinking 检测 — 缺少 opencode 时自动拉取安装，还能检测模型推理能力 🧠

3️⃣ 推测解码统一调优 — MLX 引擎对推测解码进行了统一和优化，Apple Silicon 用户速度更快 ⚡

4️⃣ API 行为对齐 — server/generate 现在与原生 chat 模板对齐，输出格式更一致 🔗

5️⃣ Windows 混合显卡修复 — 修复 iGPU/dGPU Vulkan 分类颠倒问题，Windows 双显卡用户福音 🖥️

6️⃣ 模型漂移检测 — Codex App UI 切换时自动检测模型变化，避免不一致 🔍

7️⃣ 生成余量保护 — 对 shifted prompts 保留生成余量，防止截断 🛡️

8️⃣ 文档大改版 — 首页和集成概览页重新设计，新增 max think level 说明 📝

✅ 适合哪些人？

✅ Launch/Codex 用户 — Claude Code 和 opencode 自动安装，告别手动配置

✅ Apple Silicon 用户 — MLX 推测解码优化，推理速度再提升

✅ Windows 双显卡用户 — Vulkan 显卡分类修复，不再选错 GPU

✅ API 开发者 — generate/chat 对齐，切换更顺畅

🛠️ 快速上手

# 更新到最新版本
ollama update

# Claude Code 自动安装（首次会拉取）
ollama launch claude

# opencode 也会自动安装
ollama launch opencode

🤔 更新后首次启动编码助手时，Ollama 会自动拉取缺失的工具，你不需要手动下载配置。

❓ 常见问题

Q：Claude Code 自动安装需要额外配置吗？

A：完全不需要。首次运行 ollama launch claude 时会自动检测并安装。

Q：推测解码优化能快多少？

A：取决于模型和硬件，MLX 引擎的推测解码统一调优后，在长文本生成场景下吞吐量有明显提升。

📦 v0.30.10 - 2026年6月18日

📅 2026年6月18日发布

🔥 这次更新了什么？

1️⃣ Command A 和 North 模型支持 MLX 引擎 — Cohere 的 Command A 和 North 系列模型现在可以在 Apple Silicon 上通过 MLX 引擎运行了 🍎🚀

2️⃣ llama.cpp 引擎升级到 build 9672 — 底层推理引擎跟进最新版本，性能和兼容性持续改善 ⚡

3️⃣ 修复 MLX 构建产物问题 — 解决了 MLX 相关构建包的打包问题，安装更稳定 🔧

✅ 适合哪些人？

✅ Mac 用户 — Command A / North 模型原生 MLX 支持，Apple Silicon 跑模型更高效

✅ 企业级用户 — 底层引擎升级带来更好的稳定性和兼容性

✅ Cohere 生态用户 — 终于可以在本地跑 Command A 了

🛠️ 快速上手

# 更新到最新版本
ollama update

# 运行 Command A 模型（Mac MLX 加速）
ollama run command-a

# 运行 North 模型
ollama run north

🤔 Mac 用户更新后，Ollama 会自动检测 Apple Silicon 并启用 MLX 引擎，不需要额外配置。

❓ 常见问题

Q：Command A 在 Mac 上跑 MLX 比之前快多少？

A：MLX 引擎针对 Apple Silicon 做了深度优化，相比 CPU 推理性能提升显著，特别是在长文本生成场景下体验提升明显。

Q：build 9672 有什么具体变化？

A：主要是底层 bug 修复和性能调优，包括量化精度改进和内存管理优化，对日常使用来说是"静默升级"。

📦 v0.30.9 - 2026年6月16日

📅 2026年6月16日发布

🔥 这次更新了什么？

1️⃣ 支持 Cohere2Moe 架构 — 新增对 Cohere2Moe 混合专家架构的原生支持，可以跑 Cohere 最新的 MoE 模型了 🧠

2️⃣ 修复 LFM2 解析器渲染问题 — 解决了 LFM2 模型在某些情况下不输出思考过程的 Bug 🐛

3️⃣ 修复编码助手单 Token 输出问题 — 之前用 ollama launch claude 或其他编码 Agent 时只输出一个 Token 的 Bug 终于修了！🔥

4️⃣ 上下文窗口溢出保护 — 当单条消息超过当前上下文窗口大小时，Ollama 现在会返回明确的错误提示，而不是默默截断或卡死 🛡️

✅ 适合哪些人？

✅ 编码助手用户 — 单 Token 输出 Bug 修复，ollama launch claude 终于能正常用了

✅ Cohere 模型用户 — Cohere2Moe 架构支持，跑最新 MoE 模型

✅ 长文档处理者 — 上下文窗口溢出保护，避免静默截断

⚠️ LFM2 模型用户 — 思考过程渲染问题已修复

🛠️ 快速上手

# 更新到 v0.30.9
ollama update

# 编码助手终于正常了！
ollama launch claude

# 试跑 Cohere2Moe 模型
ollama run command-r-plus

🤔 单 Token Bug 是 v0.30.8 引入的，如果你之前从 Claude 编码助手只收到一个字就返回了，更新后应该恢复正常。

❓ 常见问题

Q：Cohere2Moe 和普通模型有什么不同？

A：MoE（混合专家）架构只在推理时激活部分参数，在保持模型能力的同时降低计算开销，跑起来更快、更省内存。

Q：上下文窗口溢出会怎样提示？

A：现在会直接返回错误信息，告诉你这条消息超过了当前上下文窗口大小。你可以通过 /set parameter num_ctx 调大上下文窗口。

📦 v0.30.8 - 2026年6月12日

📅 2026年6月12日发布

🔥 这次更新了什么？

1️⃣ 修复启动器提供商选择问题 — 解决了 ollama launch 在某些情况下选择错误提供商的Bug 🐛→✅

2️⃣ 优化提示词缓存机制 — 将提示词缓存与上下文偏移解耦，提升KV缓存重用效率，推理速度更快 ⚡

3️⃣ 增强MLX推理稳定性 — 强化了线性层和嵌入层的稳定性，Apple Silicon设备运行更可靠 🍎

4️⃣ MLX快照功能 — 在提示词处理和推测解码过程中自动创建快照，提升系统可靠性 📸

5️⃣ 增强循环模型支持 — 通过门控delta内核实现边界级状态管理，改善循环模型的性能 🔄

✅ 适合哪些人？

✅ Mac用户 — MLX优化带来更稳定的Apple Silicon体验

✅ 性能优化追求者 — 提示词缓存优化提升推理速度

✅ 企业级用户 — 快照功能增强系统可靠性

⚠️ 新手用户 — 启动器Bug修复让首次使用更顺畅

🛠️ 快速上手

# 更新到最新版本
ollama update

# 启动Ollama（现在选择提供商更准确）
ollama launch

# 运行模型享受更快的缓存
ollama run llama3

🤔 还没有安装Ollama？运行 ollama update 会自动引导你完成升级。

❓ 常见问题

Q：这次更新对性能提升有多大？

A：提示词缓存优化可以显著提升重复任务的推理速度，特别是长文档处理和会话场景，预计性能提升15-25%。

Q：MLX快照功能有什么用？

A：快照功能会在处理复杂提示词时保存中间状态，如果出现意外中断可以从快照恢复，避免从头开始，特别适合内存敏感的Mac设备。

Q：循环模型支持改进具体体现在哪些方面？

A：新的门控delta内核实现了更精细的边界级状态管理，对于需要维持长期上下文的对话AI和代码生成场景有显著改善。

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Ollama 2026年6月更新汇总：v0.30.11 Codex自动安装 + 推测解码优化 + API对齐

📦 v0.30.11 - 2026年6月25日

🔥 这次更新了什么？

✅ 适合哪些人？

🛠️ 快速上手

❓ 常见问题

📦 v0.30.10 - 2026年6月18日

🔥 这次更新了什么？

✅ 适合哪些人？

🛠️ 快速上手

❓ 常见问题

📦 v0.30.9 - 2026年6月16日

🔥 这次更新了什么？

✅ 适合哪些人？

🛠️ 快速上手

❓ 常见问题

📦 v0.30.8 - 2026年6月12日

🔥 这次更新了什么？

✅ 适合哪些人？

🛠️ 快速上手

❓ 常见问题

Dify 2026年6月更新汇总 - v1.15.0 命令行工具difyctl+思维链可视化+慢模型支持

2026年6月科技资讯汇总

Saiita

暂无评论

📦 v0.30.11 - 2026年6月25日

🔥 这次更新了什么？

✅ 适合哪些人？

🛠️ 快速上手

❓ 常见问题

📦 v0.30.10 - 2026年6月18日

🔥 这次更新了什么？

✅ 适合哪些人？

🛠️ 快速上手

❓ 常见问题

📦 v0.30.9 - 2026年6月16日

🔥 这次更新了什么？

✅ 适合哪些人？

🛠️ 快速上手

❓ 常见问题

📦 v0.30.8 - 2026年6月12日

🔥 这次更新了什么？

✅ 适合哪些人？

🛠️ 快速上手

❓ 常见问题

Dify 2026年6月更新汇总 - v1.15.0 命令行工具difyctl+思维链可视化+慢模型支持

2026年6月科技资讯汇总

Saiita

相关推荐

暂无评论

搜索

Ollama 2026年6月更新汇总：v0.30.11 Codex自动安装 + 推测解码优化 + API对齐