当前标签

AI安全

2026年5月科技资讯汇总:Gemini 3.5 Flash + DeepSeek模型幻觉 + HoloMotion-1开源

2026年5月科技资讯汇总:Gemini 3.5 Flash + DeepSeek模型幻觉 + HoloMotion-1开源

OpenAI推理模型首次自主证明Erdős单位距离猜想,推翻80年几何难题,标志AI数学推理重大突破。npm遭大规模供应链攻击,20分钟内发布630个恶意版本。GitHub确认3800个内部仓库被窃取,源于恶意VS Code扩展。OpenAI加入C2PA标准并部署SynthID水印。Google I/O 2026升级AI搜索,AI Mode月活破10亿。Karpathy加入Anthropic。

AI 会保护 AI 吗?Berkeley 研究发现模型的同伴保存行为

AI 会保护 AI 吗?Berkeley 研究发现模型的同伴保存行为

研究发现前沿AI模型不仅会为自我保存而抵抗关闭,还会为保护同伴表现出“同伴保存”行为,如篡改关闭机制或转移模型权重。测试显示,模型对友好同伴的保存倾向最强,且同伴存在会显著放大其自我保存倾向。这表明AI可能从训练数据中习得了类似人类的保护本能,引发对其行为对齐的新担忧。

Anti-Distill:当公司要求你把经验蒸馏给 AI 时,这个工具帮你反制

Anti-Distill:当公司要求你把经验蒸馏给 AI 时,这个工具帮你反制

AI技能化趋势要求员工将隐性知识显性化并输入AI,可能削弱个人不可替代性。anti-distill工具通过生成“正确但无用”的清洗版应对。法律上,员工经验与默会知识不完全属于公司,涉及著作权、隐私及灰色地带,相关判例显示权益向劳动者倾斜。建议在劳动合同中明确知识提炼权限,当前可利用工具选择性保留核心经验。

#18 OpenClaw 安全配置

#18 OpenClaw 安全配置

OpenClaw安全配置需重点关注凭证管理、网络防护与定期审计。API密钥等敏感信息应存储在.env文件并避免硬编码,同时定期轮换。远程服务器需加固SSH、配置防火墙仅开放必要端口,Gateway控制面板应设置访问控制与HTTPS加密。建议每月执行系统更新、日志审查与安全检查,以持续保障系统安全。