一个 exe 搞定:Agent 循环、工具调用、内嵌 Web 控制台、飞书/Web 通道。
无需安装 Node.js 或 Python 来运行 Jarvis 本体。
Web 控制台新能力
- 聊天图片多模态 — 输入框左下角上传图片(最多 4 张、单张 ≤ 4MB),预览后随消息发送;以 Multimodal 格式交给大模型分析
- 视觉模型 — 是否支持图片由所选模型 API 决定(如 gpt-4o、MiniMax 多模态等),Jarvis 不提前拦截
- 截图分析 — Agent 调用 screenshot 工具后,可将截图注入下一轮对话供视觉模型解读
Skills 目录(跨平台)
- 智能路径解析 — 相对路径基于 config.toml 所在目录;自动跳过从其他操作系统同步来的无效路径(例如在 Mac 上忽略
C:\...)
- 配置向导 — Web 控制台 Skills 标签可扫描本机 Claude Code、Cursor、Hermes 等目录,一键选用或回退到内置
skills/
- 热重载 — 保存目录后立即重新加载 Skill 列表,无需重启网关(Agent 内置工具列表变更需重启)
- Mac / Windows — 同一套 Web UI;Mac 可通过 SSH 拉取编译部署,局域网访问
http://<主机>:8080/webui/
记忆与人格
- 分层记忆 — USER.md(画像与偏好)、MEMORY.md(长期知识),启动时注入 MEMORY_LAYERS
- 错误记忆 — 失败与异常写入 ERRORS.md,自动总结并跨会话避坑
- 人格系统 — 用户画像引导与 onboarding,对话更贴合你的背景
工具与自动化
- Skill — 完整 SKILL.md + 脚本工具,热重载扩展能力
- 文件系统 — 读写、搜索、Diff;可配置允许路径
- Shell — 执行系统命令,驱动编译与运维
- 定时任务 — 内置调度器,计划触发 Agent
- 无头爬虫 — Chromium 渲染动态网页,搜索 + 抓取落盘
- 系统 / 磁盘报告 — Windows、macOS、Linux 三端系统与磁盘信息
- Git / Docker / 搜索 — 常用开发工具一应俱全
连接与模型
- 飞书 / Telegram — 通道向导扫码或 Token 配置,与 Web 共用 dispatch 逻辑
- Web 控制台 — 局域网 WebSocket,流式对话、配置与通道管理
- MCP — 对接 Cursor、Claude 等客户端
- 模型 — OpenAI 兼容 API(MiniMax、DeepSeek 等)、本地 llama.cpp
安装后快速开始
- 下载 — Windows / macOS 安装包见 GitHub Releases;下载站
config.json 可配置直链
- 编辑
config.toml(安装目录或 %LOCALAPPDATA%\Jarvis\ / Mac 同级目录)配置 API Key 与 skills_dir(推荐相对路径 skills)
- Windows:运行
jarvis.exe --gateway;macOS:./jarvis-agent --gateway
- 打开
http://127.0.0.1:8080/webui/;打开 Skills 标签配置目录
- 在聊天框输入文字,或点击左下角图片按钮上传后进行多模态提问