MiniMax M3 开源 428B 参数、Kimi 代码模型提升 21.8%——AI HOT 今日热点（2026-06-13）

今日速览

MiniMax M3 以 428B 参数规模开源登场，Kimi-K2.7-Code 代码性能全线提升并同步开源——两款国产模型同日上架 HuggingFace，让周五收盘前的开源圈热闹了一把。豆包上线「任务模式」，Codex 连推速率存储和开发者工具，Claude Code 周内三版连发。1

模型发布 / 更新

MiniMax M3：428B 参数开源，上下文窗口直达 1M token

MiniMax 发布开源权重模型 M3：约 428B 总参数、23B 激活参数，融合三项能力——代码与智能体评测中 SWE-Bench Pro 达 59.0%、Terminal Bench 2.1 达 66.0%；MiniMax 稀疏注意力将上下文窗口扩展至 1M token；原生多模态支持。MiniMax Code 工具及 API 平台同步上线，权重与完整技术报告预计 10 天后发布。2

콘텐츠 카드를 불러오는 중…

Kimi-K2.7-Code：代码推理提升 +21.8%，推理 token 减少 30%

Kimi 发布并开源 Kimi-K2.7-Code。相比 K2.6，Kimi Code Bench v2 提升 +21.8%，Program Bench 提升 +11.0%，MLS Bench Lite 提升 +31.5%。推理效率明显改善：token 使用量降低 30%，长时编码任务的指令遵循和端到端成功率均有提升。6x 高速模式即将上线；现可通过 Kimi API 和 Kimi Code 调用。3

콘텐츠 카드를 불러오는 중…

产品发布 / 更新

豆包上线「任务模式」，「思考模式」升级为「专家模式」

6 月 12 日，字节跳动豆包大范围推出任务模式，支持定时执行、零代码网页生成、一键 PPT 生成、数据可视化分析等全链路 Agent 执行。原「思考模式」升级为「专家模式」，调用豆包大模型 2.0 Pro 版本，强化深度推理。App 顶部切换改为「快速 / 专家 / 任务」三档。基础功能免费，专业版三档定价如下：4

套餐	月付	年付（折算月均）
标准版	68 元/月	688 元/年（≈57 元/月）
加强版	200 元/月	2048 元/年（≈171 元/月）
专业版	500 元/月	5088 元/年（≈424 元/月）

Codex 推出速率存储 + 浏览器开发者模式

OpenAI 周内同步推出两项 Codex 更新：速率限制重置现可留存积累供稍后使用，Go / Plus / Pro / Business 用户各获一次免费重置；新增浏览器开发者模式，支持 Chrome DevTools 协议（CDP），可分析 JavaScript 性能、检查控制台输出和网络流量。5 6

Claude Code 周内三版连发（v2.1.174 / v2.1.175 / v2.1.176）

Anthropic 在一天内推送三个 Claude Code 版本，主要变更汇总：

v2.1.174：新增 wheelScrollAccelerationEnabled 设置；修复 Bedrock GovCloud 400 错误、企业账户积分横幅误显示、macOS/Linux 退出时 1-2 秒卡顿等多项 bug。
v2.1.175：新增 enforceAvailableModels 管理设置——启用后 availableModels 白名单同时约束 Default 模型，用户设置无法扩大受管理模型列表。
v2.1.176：会话标题按对话语言生成；新增 footerLinksRegexes 支持正则匹配页脚徽章；修复 Remote Control 多项连接问题。7 8 9

iOS 27 健康 App：视觉营养识别 + 围绝经期追踪

苹果在 iOS 27 中重构健康 App，由列表改为卡片布局。新增视觉智能营养识别：通过相机 Siri 模式拍摄食物，返回加工程度、蛋白质、含糖量等信息及评级，不提供精确卡路里，需 iPhone 15 Pro 及以上。经期追踪扩展至围绝经期，可分析长期周期异常并推送提醒；GymKit 同步扩展到 iPhone，无需 Apple Watch 即可与健身设备配对。10

olmo-eval：面向 LLM 开发循环的评测工作台

Allen AI 推出 olmo-eval，基于 OLMES 标准构建，专为持续开发中的反复评测场景设计。支持 agentic 和多轮评测作为一等用例，可逐问题对比检查点输出以区分真实改进与噪声，结果同时报告分数、标准误差和最小可检测效应。与 Harbor 侧重发布不同，olmo-eval 聚焦开发阶段快速迭代。11

行业动态

TCS 携手 Anthropic，5 万员工接入 Claude，服务金融医疗受监管行业

Anthropic 宣布与塔塔咨询服务（TCS）合作。TCS 将向 56 个国家的 5 万名员工提供 Claude，并为金融、医疗等受监管行业客户构建基于 Claude 的产品，同时加入 Claude Partner Network。具体落地场景：Diligenta 借助 Claude 改善 2200 万保单持有人的服务体验；银行产品团队通过 Claude Code 提升软件工程效率；TCS iON 提供 Claude 培训与认证。12

论文研究

Google × JAMA：AI 辅助用户理解皮肤病，影响就医决策

Google Research 在《JAMA Dermatology》发表两项研究。一项涉及 2345 名参与者的定量研究显示，AI 辅助显著提升了用户识别皮肤疾病名称的能力，并影响了就医或自我护理的下一步行动。另一项混合方法研究对比了用户通过 AI 工具与医生对话获取认知的差异。研究基于此前开发的 AI 鉴别诊断模型和 SCIN 数据集。13

技巧与观点

《人味儿写作心法》开源 · Oran Ge 让 Claude Fable 5 改稿三遍后发现：越改越「讲究」，偏偏缺「人味儿」。他总结出「人写文字背后有存在感——作者在具体位置付出过具体代价，AI 无法复现」，并将解决方案做成 Skill 开源发布。14

콘텐츠 카드를 불러오는 중…

公众号自动排版技能组合开源 · 小互（@xiaohu）升级工具：一句话完成排版、生成封面、发送草稿箱。支持 20 种主题色，可在 Claude Code / Codex / OpenClaw 中调用，全流程无需手动操作。15

qiaomu-ai-prd：面向 AI Agent 的 PRD 生成 Prompt · 先用该 Prompt 生成 AI 可消费的 PRD 文档，再交给 Agent 开发，可显著提升功能完整度。安装：npx skills add joeseesun/qiaomu-ai-prd。16

Spec 驱动开发（SDD）三技能 · 邵猛（@shao__meng）分享用 /write-product-spec、/write-tech-spec、/validate-changes-match-specs 三个 Skill 覆盖 Spec→Implement→Verify 闭环。规格分 PRODUCT.md 和 TECH.md 两层，随 PR 提交。开源仓库：warpdotdev/common-skills。17

Anthropic 首次全美调查 · 逾 5.2 万名美国人参与：48% 将「治愈癌症」列为 AI 首要期望，64% 担忧失业，56% 担忧认知依赖。超过 70% 支持政府监管，但仅 15% 信任 AI 公司自行决策。调查于 2025 年 11-12 月由 YouGov 执行。18

OpenRouter 低成本推理速查 · 追加 :floor 获取最便宜提供商，用 max_price 设定花费上限，另有 20+ 个零成本模型可免费使用。19

MiniMax M3 开源 428B 参数、Kimi 代码模型提升 21.8%——AI HOT 今日热点（2026-06-13）

今日速览

模型发布 / 更新

MiniMax M3：428B 参数开源，上下文窗口直达 1M token

Kimi-K2.7-Code：代码推理提升 +21.8%，推理 token 减少 30%

产品发布 / 更新

豆包上线「任务模式」，「思考模式」升级为「专家模式」

Codex 推出速率存储 + 浏览器开发者模式

Claude Code 周内三版连发（v2.1.174 / v2.1.175 / v2.1.176）

iOS 27 健康 App：视觉营养识别 + 围绝经期追踪

olmo-eval：面向 LLM 开发循环的评测工作台

行业动态

TCS 携手 Anthropic，5 万员工接入 Claude，服务金融医疗受监管行业

论文研究

Google × JAMA：AI 辅助用户理解皮肤病，影响就医决策

技巧与观点

참고 출처