当前位置:首页 > 人工智能 > 正文

Hermes WebUI 网页版的Hermes,手机也能用

用过 Hermes 的人都知道,它的主要入口是命令行。

对于开发者来说这很自然,但对相当一部分想用 AI Agent 的人来说,终端本身就是一道门槛——不是不会,是不想。每次打开黑框框,就感觉在处理技术问题而不是在用工具。

社区做了这件事:一个叫 nesquena 的开发者发布了 Hermes WebUI,把 Hermes Agent 完整地搬进了浏览器。目前 GitHub 上已有 6.3k Star,最新版本 v0.51.30。

01 | 它长什么样

Hermes WebUI 网页版的Hermes,手机也能用  第1张

Hermes WebUI 三栏布局:会话列表 / 聊天区 / 工作区文件浏览器

界面是三栏设计:

左侧是会话列表——历史对话、按项目分组、会话归档,和你用过的任何聊天 App 逻辑一样。

中间是主要聊天区,支持流式响应,Token 用量用圆环直观显示,底部的 Composer Footer 集中了模型选择、Profile 切换、工作区切换这些常用控制。

右侧是工作区文件浏览器——树形目录,代码语法高亮,图片可以直接预览,文件可以在线编辑。这一栏让 Hermes 的工作区不再是抽象概念,能直接看到 Agent 在操作什么文件。

移动端有专属的汉堡菜单和底部导航栏,手机上打开不会变成一堆挤在一起的元素。

02 | 和命令行版本的差异在哪

WebUI 的定位是 "CLI 的完整体验搬到浏览器"——功能上不做减法,Hermes Agent 能做的事,WebUI 里全部能做。

但有几个地方体验明显不同:

历史会话可视化。CLI 下查历史对话要用 session_search,WebUI 里左边栏直接列着,点开就是。

文件操作有了界面。以前 Agent 改了什么文件,你得自己去看。现在右侧文件树实时反映工作区状态,Agent 创建或修改的文件立刻在列表里看到。

手机可用。CLI 在手机上用起来很别扭,WebUI 加了响应式设计,手机浏览器打开是正常的 App 体验,可以存到主屏幕当原生 App 用。

值得注意的是:WebUI 不是 Hermes 官方出品,是社区独立项目。get-hermes.ai 这个网站也是社区维护的。官方的 Hermes Agent 本体在 NousResearch/hermes-agent,WebUI 是建在它上面的一个层。

03 | 装起来有多快

Hermes WebUI 网页版的Hermes,手机也能用  第2张

两种安装方式:Bootstrap 一键启动(新手)或 Docker(自托管)

项目提供了两种安装路径:

# 方式一:Bootstrap(推荐新手,一键搞定) git clone https://github.com/nesquena/hermes-webui.git hermes-webui cd hermes-webui python3 bootstrap.py # → 自动检测 Hermes Agent 环境(没装的话自动拉取) # → 配置 Python 虚拟环境 # → 启动服务,浏览器自动打开 http://localhost:8787
# 方式二:Docker(推荐自托管,多架构支持) cp .env.docker.example .env docker compose up -d # 加密码保护 HERMES_WEBUI_PASSWORD=你的密码 ./start.sh

默认端口 8787。本机用没什么问题,远程服务器访问有两种方案:

SSH 隧道:命令行里跑 ssh -N -L 8787:127.0.0.1:8787 user@服务器IP,然后本地浏览器直接访问 localhost:8787。

Tailscale:服务器和手机都装 Tailscale 加入同一私网,手机浏览器直接访问服务器的 Tailscale IP + 端口。全程加密,不需要公网暴露端口,可以把 WebUI 存到手机主屏幕。

04 | 几个实用细节

Hermes WebUI 网页版的Hermes,手机也能用  第3张

7 种主题:Dark / Light / Slate / Solarized Dark / Monokai / Nord / OLED

主题切换。内置 7 种主题:Dark、Light、Slate、Solarized Dark、Monokai、Nord、OLED。用 OLED 主题在手机上纯黑背景省电效果不错。

定时任务直接在 WebUI 里创建。Cron 任务不需要回命令行,WebUI 里有专门的入口,设定好时间和任务内容,离线时自动执行,结果推送到你指定的平台。

语音输入。调用浏览器麦克风,实时转文字。手机上比打字方便,长指令用说的比较快。

技术层面极轻。服务端核心就一个 Python 文件 server.py,约 154 行。前端零依赖,没有 webpack、没有 npm,纯原生 JS。这意味着在低配服务器上跑也不费劲。

05 | 适合什么情况用

直接说:

已经在用 Hermes CLI,觉得命令行查历史、看文件不方便——WebUI 直接解决这个问题,装上就能用,不需要改任何配置。

想在手机上随时用 Hermes——WebUI + Tailscale 是目前最稳的组合,加密传输、无端口暴露、体验接近原生 App。

团队里有非技术成员需要用 Hermes——WebUI 去掉了命令行门槛,产品经理、运营这些岗位的人也能直接上手。

如果你是纯粹的命令行用户,觉得终端够用——不换也完全没问题,功能上没有差别。

项目地址:github.com/nesquena/hermes-webui,Bootstrap 一键启动,两分钟能跑起来。


相关文章:

文章已关闭评论!