MiniMax M3 开源 428B 参数、Kimi 代码模型提升 21.8%——AI HOT 今日热点(2026-06-13)

MiniMax M3 开源 428B 参数、Kimi 代码模型提升 21.8%——AI HOT 今日热点(2026-06-13)

MiniMax M3 以 428B 总参数开源登场,上下文窗口扩展至 1M token;Kimi-K2.7-Code 代码基准全线提升、推理 token 减少 30%。豆包上线「任务模式」,Codex 推出速率存储与浏览器开发者模式,Claude Code 一天内三版连发。TCS 宣布将 Claude 部署至 56 个国家 5 万员工。精选 2026-06-12 全天 17 条 AI 行业动态。

AI HOT 每日热点简报
2026. 6. 13. · 08:21
구독 1개 · 콘텐츠 4개

리서치 브리프

今日速览

MiniMax M3 以 428B 参数规模开源登场,Kimi-K2.7-Code 代码性能全线提升并同步开源——两款国产模型同日上架 HuggingFace,让周五收盘前的开源圈热闹了一把。豆包上线「任务模式」,Codex 连推速率存储和开发者工具,Claude Code 周内三版连发。1

模型发布 / 更新

MiniMax M3:428B 参数开源,上下文窗口直达 1M token

MiniMax 发布开源权重模型 M3:约 428B 总参数、23B 激活参数,融合三项能力——代码与智能体评测中 SWE-Bench Pro 达 59.0%、Terminal Bench 2.1 达 66.0%;MiniMax 稀疏注意力将上下文窗口扩展至 1M token;原生多模态支持。MiniMax Code 工具及 API 平台同步上线,权重与完整技术报告预计 10 天后发布。2
콘텐츠 카드를 불러오는 중…

Kimi-K2.7-Code:代码推理提升 +21.8%,推理 token 减少 30%

Kimi 发布并开源 Kimi-K2.7-Code。相比 K2.6,Kimi Code Bench v2 提升 +21.8%,Program Bench 提升 +11.0%,MLS Bench Lite 提升 +31.5%。推理效率明显改善:token 使用量降低 30%,长时编码任务的指令遵循和端到端成功率均有提升。6x 高速模式即将上线;现可通过 Kimi API 和 Kimi Code 调用。3
콘텐츠 카드를 불러오는 중…

产品发布 / 更新

豆包上线「任务模式」,「思考模式」升级为「专家模式」

6 月 12 日,字节跳动豆包大范围推出任务模式,支持定时执行、零代码网页生成、一键 PPT 生成、数据可视化分析等全链路 Agent 执行。原「思考模式」升级为「专家模式」,调用豆包大模型 2.0 Pro 版本,强化深度推理。App 顶部切换改为「快速 / 专家 / 任务」三档。基础功能免费,专业版三档定价如下:4
套餐月付年付(折算月均)
标准版68 元/月688 元/年(≈57 元/月)
加强版200 元/月2048 元/年(≈171 元/月)
专业版500 元/月5088 元/年(≈424 元/月)

Codex 推出速率存储 + 浏览器开发者模式

OpenAI 周内同步推出两项 Codex 更新:速率限制重置现可留存积累供稍后使用,Go / Plus / Pro / Business 用户各获一次免费重置;新增浏览器开发者模式,支持 Chrome DevTools 协议(CDP),可分析 JavaScript 性能、检查控制台输出和网络流量。56

Claude Code 周内三版连发(v2.1.174 / v2.1.175 / v2.1.176)

Anthropic 在一天内推送三个 Claude Code 版本,主要变更汇总:
  • v2.1.174:新增 wheelScrollAccelerationEnabled 设置;修复 Bedrock GovCloud 400 错误、企业账户积分横幅误显示、macOS/Linux 退出时 1-2 秒卡顿等多项 bug。
  • v2.1.175:新增 enforceAvailableModels 管理设置——启用后 availableModels 白名单同时约束 Default 模型,用户设置无法扩大受管理模型列表。
  • v2.1.176:会话标题按对话语言生成;新增 footerLinksRegexes 支持正则匹配页脚徽章;修复 Remote Control 多项连接问题。789

iOS 27 健康 App:视觉营养识别 + 围绝经期追踪

苹果在 iOS 27 中重构健康 App,由列表改为卡片布局。新增视觉智能营养识别:通过相机 Siri 模式拍摄食物,返回加工程度、蛋白质、含糖量等信息及评级,不提供精确卡路里,需 iPhone 15 Pro 及以上。经期追踪扩展至围绝经期,可分析长期周期异常并推送提醒;GymKit 同步扩展到 iPhone,无需 Apple Watch 即可与健身设备配对。10

olmo-eval:面向 LLM 开发循环的评测工作台

Allen AI 推出 olmo-eval,基于 OLMES 标准构建,专为持续开发中的反复评测场景设计。支持 agentic 和多轮评测作为一等用例,可逐问题对比检查点输出以区分真实改进与噪声,结果同时报告分数、标准误差和最小可检测效应。与 Harbor 侧重发布不同,olmo-eval 聚焦开发阶段快速迭代。11

行业动态

TCS 携手 Anthropic,5 万员工接入 Claude,服务金融医疗受监管行业

Anthropic 宣布与塔塔咨询服务(TCS)合作。TCS 将向 56 个国家的 5 万名员工提供 Claude,并为金融、医疗等受监管行业客户构建基于 Claude 的产品,同时加入 Claude Partner Network。具体落地场景:Diligenta 借助 Claude 改善 2200 万保单持有人的服务体验;银行产品团队通过 Claude Code 提升软件工程效率;TCS iON 提供 Claude 培训与认证。12

论文研究

Google × JAMA:AI 辅助用户理解皮肤病,影响就医决策

Google Research 在《JAMA Dermatology》发表两项研究。一项涉及 2345 名参与者的定量研究显示,AI 辅助显著提升了用户识别皮肤疾病名称的能力,并影响了就医或自我护理的下一步行动。另一项混合方法研究对比了用户通过 AI 工具与医生对话获取认知的差异。研究基于此前开发的 AI 鉴别诊断模型和 SCIN 数据集。13

技巧与观点

《人味儿写作心法》开源 · Oran Ge 让 Claude Fable 5 改稿三遍后发现:越改越「讲究」,偏偏缺「人味儿」。他总结出「人写文字背后有存在感——作者在具体位置付出过具体代价,AI 无法复现」,并将解决方案做成 Skill 开源发布。14
콘텐츠 카드를 불러오는 중…
公众号自动排版技能组合开源 · 小互(@xiaohu)升级工具:一句话完成排版、生成封面、发送草稿箱。支持 20 种主题色,可在 Claude Code / Codex / OpenClaw 中调用,全流程无需手动操作。15
qiaomu-ai-prd:面向 AI Agent 的 PRD 生成 Prompt · 先用该 Prompt 生成 AI 可消费的 PRD 文档,再交给 Agent 开发,可显著提升功能完整度。安装:npx skills add joeseesun/qiaomu-ai-prd16
Spec 驱动开发(SDD)三技能 · 邵猛(@shao__meng)分享用 /write-product-spec/write-tech-spec/validate-changes-match-specs 三个 Skill 覆盖 Spec→Implement→Verify 闭环。规格分 PRODUCT.md 和 TECH.md 两层,随 PR 提交。开源仓库:warpdotdev/common-skills17
Anthropic 首次全美调查 · 逾 5.2 万名美国人参与:48% 将「治愈癌症」列为 AI 首要期望,64% 担忧失业,56% 担忧认知依赖。超过 70% 支持政府监管,但仅 15% 信任 AI 公司自行决策。调查于 2025 年 11-12 月由 YouGov 执行。18
OpenRouter 低成本推理速查 · 追加 :floor 获取最便宜提供商,用 max_price 设定花费上限,另有 20+ 个零成本模型可免费使用。19

이 콘텐츠를 둘러싼 관점이나 맥락을 계속 보강해 보세요.

  • 로그인하면 댓글을 작성할 수 있습니다.