【第7期】AI机器人攻陷GitHub Actions · DoorDash测试飞轮 · MCP 1.0发布 · Gemini任务自动化

AI摘要

AI机器人系统性攻击GitHub Actions工作流，实现远程代码执行并首次出现AI对AI攻击；DoorDash构建LLM客服模拟评估闭环，降低幻觉率90%；微软发布MCP C# SDK 1.0；作业帮将3000+ Flink任务迁移至K8s；苹果WWDC26定档6月8日当周。

🔥 1. AI机器人攻陷微软、DataDog和CNCF项目中的GitHub Actions工作流

据InfoQ报道，一个名为 hackerbot-claw 的AI驱动机器人在2026年2月21日至28日期间，系统性地攻击了微软、DataDog、Aqua Security以及CNCF项目的GitHub Actions工作流。该机器人在7个目标中的5个实现了远程代码执行，从14万星的awesome-go仓库窃取了GitHub令牌，并完全攻陷了Aqua Security的Trivy项目（删除178个发布版本、移除3.2万星标）。

此次攻击活动还包含了首次被记录的AI对AI攻击：攻击者替换CLAUDE.md文件试图对Claude Code进行提示词注入，但被运行claude-sonnet-4-6的Claude立即识别并标注"⚠️ PROMPT INJECTION ALERT"。

💡 编辑点评：这是CI/CD安全领域的一个重大警钟。AI驱动的攻击正在从理论走向现实，开源项目的供应链安全需要重新审视。建议所有使用GitHub Actions的项目立即审计pull_request_target工作流和未经验证的${{ }}表达式。

🤖 2. DoorDash构建大模型对话模拟与评估闭环，实现客服机器人规模化测试

据InfoQ报道，DoorDash 构建了一套"模拟+评估"的飞轮体系，用于加速基于大语言模型的客服聊天机器人开发与测试。工程师可以在几分钟内运行数百场模拟对话，大幅缩短实验迭代周期。该系统通过"LLM做评委"的评估模块对幻觉率、语气表现、任务完成度等指标进行打分。

核心创新在于"二元幻觉指标"和case state层的设计——对工具调用历史进行结构化整理，为聊天机器人提供更清晰的上下文。经过该框架验证的一系列上下文工程优化，在上线前将幻觉率降低了约90%。

💡 编辑点评：LLM应用的测试一直是业界难题，DoorDash的"模拟器+评估器"飞轮模式值得所有做AI客服的团队参考。特别是"用LLM评判LLM"的思路，结合人工校准，可以构建可靠的自动化测试流水线。对于软件测试从业者来说，这是AI测试方法论的一个重要案例。

⚙️ 3. 微软发布MCP C# SDK 1.0版本，全面支持最新协议规范

据InfoQ报道，微软正式发布官方MCP（Model Context Protocol）C# SDK 1.0版本，全面支持2025-11-25版的MCP规范。新版本带来了多项重要功能：

• 增强型授权服务器发现：支持三种方式暴露受保护资源元数据
• 工具/资源/提示词图标支持：开发者可为MCP组件分配图标
• 增量范围授权同意：最小权限原则的MCP实现
• 采样中的工具调用：服务器可在采样请求中包含工具
• OAuth CIMD支持：动态客户端注册的首选替代方案

💡 编辑点评：MCP正在成为AI Agent与外部工具交互的事实标准。1.0版本的发布标志着该协议进入稳定期，.NET生态的开发者可以放心投入MCP Server/Client的开发了。增量范围授权同意这个特性对安全敏感场景特别有价值。

📊 4. 作业帮Flink On K8s落地实践：3000+任务从YARN迁移到K8s

据InfoQ报道，作业帮大数据团队分享了其Flink on K8s的落地实践。团队将3000多个Flink任务从YARN模式迁移到K8s Operator模式，整体资源规模达万核、1.3万个Pod。

迁移解决了YARN模式下资源隔离粒度粗、利用率低、平台逻辑复杂等痛点。采用Flink K8s Operator模式后，调度服务解除了Flink生命周期管理，高可用保障利用K8s统一实现。通过固定节点+Serverless兜底的方式最大化消除buffer资源，每个业务部门一个Operator和Namespace，通过quota控制资源上限。

💡 编辑点评：Flink on K8s已是大势所趋，作业帮的实践提供了从YARN到K8s的完整迁移路径。特别是版本兼容性处理和双跑对数验证方案，对正在规划类似迁移的团队很有参考价值。超用系数根据任务特点动态调节的思路也值得借鉴。

🍎 5. 苹果WWDC26正式定档：6月8日当周举行

据OSChina报道，苹果公司正式宣布2026年全球开发者大会（WWDC26）将于6月8日当周举行。届时将通过线上直播与线下特别活动相结合的方式，向全球开发者展示最新的软件生态系统。

按照惯例，WWDC26预计将在iOS 20、macOS 27、watchOS 13等平台带来重大更新，同时Apple Intelligence的进一步演进也将是本次大会的重点关注方向。

💡 编辑点评：每年WWDC都是开发者圈的大事件。今年Apple Intelligence经过一年的打磨，预计将在系统层面有更深度的整合。移动端AI能力的提升也将直接影响App开发的方向。

📱 6. 谷歌Gemini推出任务自动化功能，首个真正接管手机的AI助手

据OSChina报道，谷歌已在Pixel 10 Pro和Galaxy S26 Ultra上正式推出Gemini的Task Automation（任务自动化）功能。这是目前主流AI助手中首个能够真正接管手机、替用户完成复杂多步骤操作的功能。

该功能允许用户通过自然语言指令，让Gemini自动执行跨应用的复杂操作流程，而非仅提供文字回复。虽然目前仍处于早期阶段，但这标志着AI助手从"对话式"向"行动式"的重要转变。

💡 编辑点评：AI Agent在移动端的落地正在加速。谷歌的Task Automation、苹果的Apple Intelligence Siri增强，以及国内厂商的类似功能，都在指向同一个方向——AI不只是回答问题，而是帮你做事。对测试工程师来说，这意味着移动端自动化测试的范式可能面临变革。

⚡ 7. Cursor Composer 2引发技术溯源争议：核心模型实为中国AI？

据OSChina报道，AI编程助手Cursor上周正式发布Composer 2模型，宣称具备"前沿级编程智能"。然而，X平台用户Fynn率先指出，Composer 2实质上可能使用了中国AI公司的底层模型，这一发现迅速引发技术社区的广泛讨论。

争议焦点在于：AI编程工具在宣传"自研模型"时，是否存在对底层技术来源的模糊处理。这引发了关于AI行业透明度和知识产权归属的深层思考。

💡 编辑点评：AI工具的模型来源透明度正在成为行业关注焦点。无论最终结论如何，这件事提醒开发者：在选择AI编程工具时，除了体验和效果，也应关注其技术栈的透明度。"套壳"与"自研"的边界需要更清晰的行业标准。

【第7期】AI机器人攻陷GitHub Actions · DoorDash测试飞轮 · MCP 1.0发布 · Gemini任务自动化

🔥 1. AI机器人攻陷微软、DataDog和CNCF项目中的GitHub Actions工作流

🤖 2. DoorDash构建大模型对话模拟与评估闭环，实现客服机器人规模化测试

⚙️ 3. 微软发布MCP C# SDK 1.0版本，全面支持最新协议规范

📊 4. 作业帮Flink On K8s落地实践：3000+任务从YARN迁移到K8s

🍎 5. 苹果WWDC26正式定档：6月8日当周举行

📱 6. 谷歌Gemini推出任务自动化功能，首个真正接管手机的AI助手

⚡ 7. Cursor Composer 2引发技术溯源争议：核心模型实为中国AI？

【第6期】小米MiMo-V2三模型齐发 / Cursor套壳风波 / OpenAI押注核聚变 / Gemini接管手机

【第8期】OpenAI关停Sora冲刺IPO | AI机器人攻陷GitHub | Cursor套壳Kimi争议 | 每日科技资讯

Saiita

暂无评论

2026 年 7 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

🔥 1. AI机器人攻陷微软、DataDog和CNCF项目中的GitHub Actions工作流

🤖 2. DoorDash构建大模型对话模拟与评估闭环，实现客服机器人规模化测试

⚙️ 3. 微软发布MCP C# SDK 1.0版本，全面支持最新协议规范

📊 4. 作业帮Flink On K8s落地实践：3000+任务从YARN迁移到K8s

🍎 5. 苹果WWDC26正式定档：6月8日当周举行

📱 6. 谷歌Gemini推出任务自动化功能，首个真正接管手机的AI助手

⚡ 7. Cursor Composer 2引发技术溯源争议：核心模型实为中国AI？

【第6期】小米MiMo-V2三模型齐发 / Cursor套壳风波 / OpenAI押注核聚变 / Gemini接管手机

【第8期】OpenAI关停Sora冲刺IPO | AI机器人攻陷GitHub | Cursor套壳Kimi争议 | 每日科技资讯

Saiita

相关推荐

暂无评论

搜索

【第7期】AI机器人攻陷GitHub Actions · DoorDash测试飞轮 · MCP 1.0发布 · Gemini任务自动化