中科院发布开源RISC-V处理器"香山"与操作系统"如意",启动下一代芯片联合研发。Stripe部署自主编程智能体Minions,每周生成超1300个PR,形成人机协作闭环。微软开源AI自动化测试框架AutoGenesis,用自然语言生成跨平台测试代码。华为提出AI时代软件工程实践,通过确定性框架管理AI生成内容。中科院软件所开源本地幻灯片智能体PPTAgent第二代。
📰 今日资讯速览
2026年3月27日,本期为您精选7条IT/AI/软件测试领域重要资讯,涵盖芯片开源、AI编码、自动化测试、具身智能等热点方向。
🔬 中科院发布"香山"处理器与"如意"操作系统,启动下一代RISC-V芯片联合研发
在2026中关村论坛年会RISC-V生态科技论坛上,中国科学院正式发布"香山"开源高性能RISC-V处理器与"如意"RISC-V原生操作系统。"香山"处理器性能达到国际先进水平,同步推出全球首个开源片上互连网络IP"温榆河"。目前进迭时空、蓝芯算力等企业已基于"香山"成功推出商用芯片。
论坛现场,下一代"昆明湖"架构联合研发与"如意"操作系统联合开发同步启动,中国移动、中国电信、中兴、阿里、腾讯、字节跳动等数十家单位将协同攻关。人才培养方面,"一生一芯2.0"项目已覆盖国内外1100多所高校、吸引2.7万余名参与者。
💬 点评:RISC-V是中国突破芯片生态壁垒的重要路线。"香山"实现从实验室到规模化生产线的跨越,加上中国移动、阿里、腾讯等巨头协同,标志着国产开源芯片生态进入新阶段。软件测试从业者可关注RISC-V平台的兼容性测试需求。
🤖 Stripe部署自主编程智能体Minions,每周生成超1300个PR
支付巨头Stripe工程师近日公开了其自主编程智能体Minions的运行数据——该系统每周可生成超过1300个拉取请求(PR),相比早期的1000个持续增长。Minions采用"一次性端到端"模式,任务来源包括Slack对话、缺陷报告或功能需求,通过LLM+蓝图编排自动生成可直接上线的代码变更。
该系统基于Block开发的开源智能体Goose的内部分支演进而来。所有生成的代码均经过人工审核,但不包含任何人写的代码。目前Minions在配置调整、依赖升级和小型重构等定义明确的任务上表现最佳。Stripe管理的代码支撑着每年超1万亿美元的支付额。
💬 点评:每周1300+PR是相当惊人的数字。但Stripe的做法值得借鉴——AI生成代码,人类审核把关,形成人机协作闭环。对于软件测试领域而言,这意味着测试工程师需要加速学习如何验证AI生成的代码,而非单纯编写手工用例。
🧪 微软Edge团队开源AutoGenesis:AI+MCP跨平台自动化测试
Microsoft Edge QA团队正式开源了AutoGenesis,这是一款基于AI + MCP(模型上下文协议)的自动化测试框架。核心理念是"让AI做最擅长的事(理解意图、生成代码),让确定性的程序做最擅长的事(稳定执行)"。
AutoGenesis支持Windows、macOS、iOS、Android四平台,测试人员只需用Gherkin格式的自然语言描述场景,AI即可自动生成Python测试代码。实测数据:月执行步骤200万+、通过率99%、用例规模700+。该方案有效降低了非技术背景团队成员参与自动化建设的门槛。
💬 点评:这是对软件测试工程师非常有启发的项目。AutoGenesis的思路与传统"录制回放"不同——用MCP协议标准化跨平台能力,让AI专注代码生成层,执行层完全确定性。外包测试人员也能参与自动化建设,这大大扩展了团队的产能。强烈建议测试团队关注此项目:github.com/microsoft/AutoGenesis
🏗️ 华为AI软件工程实践:30年经验打造企业级高质量软件
华为基于30年IPD流程框架,提出"非创造性活动"与"创造性活动"的二元划分体系:代码提交、编译构建、测试验证等非创造性活动全面自动化,通过分层CI/CD流水线构建"软件工厂";需求分析、架构设计等创造性活动则引入实例化需求、DDD等工程方法保障确定性。
在AI时代,华为提出四大"确定性锚点":上下文设计(意图→工程契约)、智能体扩展机制(SubAgent+Skill+MCP协同)、知识图谱构建(需求-设计-代码-用例双向追溯)、全链路监督工程(全生命周期门禁控制),旨在解决AI生成的随机性与幻觉问题。
💬 点评:华为的实践对软件工程团队有很强参考价值。"机器的归机器,人类的归人类"这一理念很清晰。特别是将工程经验转化为SubAgent、Skill和MCP的思路,与AutoGenesis的设计理念不谋而合——AI时代软件工程的核心是让AI在确定性框架内发挥创造力。
🎯 中科院软件所开源PPTAgent第二代:首个本地通用幻灯片智能体
中国科学院软件研究所中文信息处理实验室开源了第二代幻灯片智能体系统PPTAgent(DeepPresenter),业界首次将幻灯片智能体模型与完整沙箱环境一同开源,支持在单张消费级显卡和Mac终端上一键部署,全面适配华为昇腾国产化算力生态。
PPTAgent采用"生成—渲染—审视—修正"的视觉闭环工作流,9B版本在PPTEval评测中取得4.19分(GPT-5为4.22分),以远低于闭源模型的算力成本实现同等级别质量。所有内容输出为可编辑pptx格式,支持中英双语。论文DeepPresenter已公开发布。
💬 点评:能本地部署、消费级显卡跑、适配国产芯片——这三个特性让PPTAgent的实用价值远超同类方案。9B版本性能逼近GPT-5,说明开源小模型在垂直场景完全有机会。对于需要频繁制作PPT的技术团队来说,这是值得一试的工具。
🌍 蚂蚁CodeFuse发布F2LLM-v2:横扫11项MTEB榜单的多语种Embedding模型
3月26日,蚂蚁集团CodeFuse团队联合上海交通大学发布F2LLM-v2系列Embedding模型,在权威MTEB评测中横扫11项SOTA榜单,在德语、法语、日语等多语言榜单均位列第一。该模型覆盖80M到14B全尺寸,支持40多种编程语言,特别加强了中低资源语言支持。
亮点包括:支持"套娃"式动态维度调整(8维到全维度自由切换)、基于6000万清洗样本训练、小型模型采用知识蒸馏可在移动端流畅运行。完全开源,所有模型权重和技术报告均公开。
💬 点评:Embedding模型是RAG和代码助手的核心组件,F2LLM-v2的全面开源对开发者非常友好。80M小模型适合端侧部署,14B大模型适合服务端——全尺寸覆盖意味着无论什么场景都能找到合适的选择。对多语言需求大的团队尤其值得关注。
🦾 具身智能VLA技术深度解析:从理论到落地的挑战与机遇
地瓜机器人算法副总裁隋伟博士分享了VLA(视觉-语言-动作模型)在具身智能中的应用现状。VLA实现了从多模态感知到动作生成的端到端学习,构建了"所见即所动"的智能决策闭环。目前主流架构采用VLM+动作策略模块(扩散策略或流匹配)的组合方案。
隋伟博士指出,具身智能目前大约处于G2到G3阶段(从传统工业自动化向端到端学习过渡)。核心挑战在于数据获取(遥操作采集效率低、仿真有效率差)和场景泛化性不足。对于单一任务,模型已具备长程执行能力,但跨场景、跨任务的泛化仍是最大瓶颈。QCon北京站将于4月16-18日设立"具身智能与物理世界交互"专题深度探讨。
💬 点评:VLA被视为继智能驾驶之后AI的下一个爆发点。隋伟博士的分享坦诚务实——承认泛化性弱的现状,而非盲目吹捧。具身智能的测试验证将是一个全新的挑战领域,传统的功能测试方法论可能需要重新思考。值得持续关注。
📌 本期总结
本期资讯核心关键词:开源芯片生态、AI编码Agent、AI驱动测试自动化、多模态Embedding、具身智能VLA。从芯片到软件,从编码到测试,AI正在重塑整个IT产业链。尤其值得关注的是,微软AutoGenesis和Stripe Minions代表了两种AI与工程实践结合的模式——前者聚焦测试自动化民主化,后者聚焦编码效率提升——两者都强调在AI创造力与工程确定性之间找到平衡。

暂无评论
要发表评论,您必须先 登录