当前位置:首页 > 人工智能 > 正文

OpenClaw 4.5 炸裂更新:视频/音乐一键生成,12 种语言随便切

OpenClaw 4.5 炸裂更新:视频/音乐一键生成,12 种语言随便切  第1张


🎉 2026 年 4 月 6 日,OpenClaw 发布最新版本 v2026.4.5,带来视频生成、音乐生成、多语言控制 UI 等重磅功能!


🆕 核心新功能

🎬 视频生成工具

新增内置 video_generate 工具,支持多家主流视频生成提供商:

  • xAI Grok Imagine Video - 前沿视频生成模型
  • 阿里云 Model Studio Wan - 国产高质量视频生成
  • Runway - 专业级视频创作工具

Agent 现在可以直接创建视频并通过回复返回生成的媒体内容!

🎵 音乐生成工具

内置 music_generate 工具,支持:

  • Google Lyria - Google 专业音乐生成模型
  • MiniMax - 高质量音频生成
  • ComfyUI 工作流 - 本地化音乐生成方案

支持异步任务跟踪,完成后自动交付音频文件。

🌍 多语言控制 UI

控制 UI 现已支持 12 种语言,包括:

  • 简体中文 🇨🇳
  • 繁体中文 🇭🇰
  • 巴西葡萄牙语 🇧🇷
  • 德语 🇩🇪
  • 西班牙语 🇪🇸
  • 日语 🇯🇵
  • 韩语 🇰🇷
  • 法语 🇫🇷
  • 土耳其语 🇹🇷
  • 印尼语 🇮🇩
  • 波兰语 🇵🇱
  • 乌克兰语 🇺🇦

全球开发者都能使用母语操作 OpenClaw!

🔧 ClawHub 技能市场集成

在控制 UI 的 Skills 面板 中直接:

  • 搜索技能
  • 查看详情
  • 一键安装

无需命令行,可视化体验更友好。


🚀 提供商生态扩展

新增 bundled 提供商

  • Qwen - 阿里云通义千问
  • Fireworks AI - 高性能推理服务
  • StepFun - 阶跃星辰大模型
  • MiniMax TTS - 语音合成服务
  • Ollama Web Search - 本地搜索集成
  • MiniMax Search - 中文搜索能力

Amazon Bedrock 增强

  • 支持 Mantle 推理服务
  • 自动发现推理配置文件
  • 支持 Claude、GPT-OSS、Qwen、Kimi、GLM 等多种模型
  • IAM 认证自动获取 bearer token,无需手动配置

OpenAI 系列更新

  • 前向兼容 openai-codex/gpt-5.4-mini
  • 支持 GPT-5 和 Codex 的低 verbosity 默认值
  • 改进工具执行进度显示
  • 支持 GPT-5.4 assistant phase 元数据

🧠 记忆系统重大升级(实验性)

Dreaming 功能

引入类梦境的记忆巩固机制,包含三个阶段:

阶段
说明
触发频率
Light
轻度记忆整理
高频
Deep
深度记忆提升
中频
REM
快速眼动期记忆固化
低频

新增命令:

  • /dreaming - 查看和管理梦境记忆
  • openclaw memory rem-harness - REM 阶段工具

配置简化:

memory:  dreaming:    enabled:true    frequency:daily  # 可选:hourly/daily/weekly

Amazon Bedrock Embeddings

支持多种嵌入模型:

  • Titan - AWS 原生嵌入模型
  • Cohere - 高质量文本嵌入
  • Nova - AWS 新一代模型
  • TwelveLabs - 视频理解嵌入

支持 AWS 凭证链自动检测,provider: "auto" 即可使用。

记忆老化控制

可配置的记忆衰减参数:

memory:  dreaming:    recencyHalfLifeDays:7    # 半衰期    maxAgeDays:30            # 最大保留天数

🛡️ 安全加固

关键安全修复

  1. 插件工具白名单保护 - 防止未授权工具调用
  2. /allowlist add/remove 权限提升 - 需要 owner 权限
  3. 浏览器 SSRF 防护 - 早期阻断重定向绕过攻击
  4. Claude CLI 安全隔离 - 清除继承的环境变量:
    • CLAUDE_CONFIG_DIR
    • CLAUDE_CODE_PLUGIN_*
    • 提供商路由和托管认证覆盖

设备配对安全

  • 非管理员配对设备只能管理自己的设备
  • 防止跨设备令牌盗窃
  • Bootstrap 令牌权限边界收紧
  • 角色前缀绑定检查

网关安全

  • 插件运行时路由写入作用域限制
  • 本地回环浏览器源认证限流
  • 并发认证请求序列化
  • 常量时间密钥比较

📱 平台体验优化

Telegram

  • ✅ 修复 DM 语音笔记预转录
  • ✅ 改进模型选择器当前模型检查
  • ✅ HTML 格式非默认 /model 确认
  • ✅ 推理预览通道仅 reasoning:stream 会话显示
  • ✅ 原生命令菜单描述长度优化

Discord

  • ✅ 修复回复标签泄露问题
  • ✅ 图像生成媒体路径持久化
  • ✅ REST、webhook、监控流量代理保持
  • ✅ @everyone 和 @here 提及门控
  • ✅ 语音连接/播放超时分离

Matrix

  • ✅ 执行审批反应锚定到主事件
  • ✅ 密钥恢复改进(秘密存储重建)
  • ✅ DM 会话作用域配置
  • ✅ 流式回复预览模式

WhatsApp

  • ✅ 恢复 blockStreaming 配置
  • ✅ 重连后看门狗超时重置
  • ✅ 防止静默重连循环

⚡ 性能与稳定性

提示词缓存优化

  • 规范化系统提示指纹(空白、换行、能力排序)
  • 移除 agent 系统提示中的重复工具清单
  • 保持 3 轮图像窗口跨工具循环
  • 确定性 MCP 工具定义排序

效果: 后续对话更可靠地复用 KV/cache

Lobster 工作流优化

  • 改为进程内运行,减少外部 CLI 开销
  • 硬化的 resume 验证
  • 每个 runner 的运行时加载记忆化

网关启动改进

  • 默认 gateway.mode 为 local
  • 检测 PID 回收(Windows/macOS)
  • 显示启动进度
  • 防止陈旧锁文件阻止健康重启

🐛 重要 Bug 修复

Agent 执行

  • GPT-5 和 Codex 默认低 verbosity
  • 工具工作时显示可见进度
  • 仅叙述计划而非执行时自动重试
  • 子代理允许列表验证和会话覆盖

配置管理

  • talk 配置规范化不再重复报告
  • 敏感字段为空时原始配置视图保持完整
  • JSON Schema  enriched 字段标题和描述

命令行工具

  • skills list --json 输出路由到 stdout
  • Commander 计算的退出码保留
  • 无效 CLI 调用不再错误报告成功

定时任务

  • 首次网关重启时重放中断的重复作业
  • 失败通知通过作业的主交付渠道发送

📊 版本统计

指标
数据
发布日期
2026-04-06
贡献者
103+
PR 数量
60+
GitHub 反应
👍 11 ❤️ 4 😂 1

🔗 相关链接

  • GitHub Release[1]
  • OpenClaw 官方文档[2]
  • ClawHub 技能市场[3]
  • Discord 社区[4]

🎯 升级建议

立即升级,如果你需要:

  • ✅ 视频/音乐生成功能
  • ✅ 多语言界面支持
  • ✅ 更安全的默认配置
  • ✅ 更好的提示词缓存复用

升级命令:

npm install -g openclaw@latest

或查看官方文档获取详细升级指南。


感谢所有贡献者的辛勤工作!🙏

引用链接

[1]GitHub Release: https://github.com/openclaw/openclaw/releases/tag/v2026.4.5

[2]OpenClaw 官方文档: https://docs.openclaw.ai

[3]ClawHub 技能市场: https://clawhub.ai

[4]Discord 社区: https://discord.com/invite/clawd


相关文章:

文章已关闭评论!