Hermes Agent 社区热门 Skills 全盘点:创意工具与 AI 能力全覆盖
🎨 一、创意类 Skills
1. comfyui — 图像/视频生成工作站
描述:ComfyUI 是当前最火的 AI 生成工作流编辑器,支持 Stable Diffusion、Flux、SD3、Hunyuan Video、Wan Video 等前沿模型。这个 Skill 提供了完整的生命周期管理——通过官方 comfy-cli 安装启动,直接调用 REST/WebSocket API 执行工作流。
使用场景:
- 文字转图片(写实、动漫、概念艺术)
- 图片转图片(风格迁移、局部重绘)
- 视频生成(文生视频、图生视频)
- 音频生成(结合 AudioCraft)
- 3D 渲染(通过 GLTF 输出)
支持的模型:
| 类别 | 模型 |
| 图像 | Flux.1 Dev/Schnell, SDXL, SD 1.5, Pony Diffusion, SD3 |
| 视频 | Wan2.1, Hunyuan Video, I2VGen, LTX Video |
| 音频 | AudioCraft (MusicGen, AudioGen) |
| 3D | GLTF/GLB 输出 |
2. manim-video — 3Blue1Brown 数学动画制作
描述:Manim 是 3Blue1Brown 团队开源的数学动画引擎,这个 Skill 将其封装成完整的生产管线。输出风格为教育类影院级视觉——每帧都有教学目的,几何优先于代数,动态揭示结构。
使用场景:
- 算法可视化(排序、搜索、图论)
- 数学公式推导动画
- 物理概念演示(力学、电磁学)
- 架构图动画(系统组件逐步构建)
- 数据故事(柱状图、折线图动态演化)
- 论文解读视频
栈:Manim CE + LaTeX + ffmpeg +(可选)ElevenLabs 旁白
3. ascii-video — 视频转彩色 ASCII 艺术
描述:将任意视频、音频、图片转换成彩色 ASCII 字符动画/MP4 或 GIF。支持音频驱动模式(FFT 频谱可视化)、生成式 ASCII 艺术、以及歌词时间轴叠加。
使用场景:
- 复古 Terminal 风格视频制作
- 音频频谱可视化
- 音乐可视化(专辑封面 → ASCII 动画)
- 视频转 ASCII(保留原片内容感)
- 混合模式(视频片段 + 音频驱动叠加层)
输出格式:MP4 / GIF / 图片序列
4. p5js — 浏览器端生成艺术与交互可视化
描述:p5.js 生产管线,创建浏览器端生成艺术、数据可视化、交互体验、3D 场景、WebGL 着色器。输出为单 HTML 文件,无需构建步骤,直接浏览器打开即用。
使用场景:
- 生成艺术(粒子系统、流场、噪声图案)
- 数据可视化(自定义图表、实时数据驱动的动态图形)
- 交互体验(鼠标/键盘响应的艺术装置)
- 3D 场景(WebGL 几何体、光照、相机动画)
- 音频可视化(FFT 频谱、振幅驱动的粒子)
- 运动图形(时间轴动画、动效字体)
输出格式:PNG / GIF / MP4 / SVG / WebM
5. songwriting-and-ai-music — 写歌技巧 + Suno 提示词工程
描述:完整 songwriting 指南,涵盖曲式结构、押韵技巧、节拍分析,以及如何为 Suno AI 写出高质量音乐提示词。包含 ABABCB、AABA、AAA 等经典结构模板。
使用场景:
- 原创歌曲创作(歌词 + 曲式规划)
- Suno AI 提示词优化(曲风、情绪、乐器、BPM)
- 恶搞/戏仿歌曲改编
- 歌词翻译与文化本地化
- AI 音乐风格探索(电子、古典、乡村、嘻哈)
6. excalidraw — 手绘风格架构图生成
描述:通过编写 Excalidraw JSON 元素生成手绘风格图表,文件可拖入 excalidraw.com 直接查看编辑,无需账号、API key 或渲染库。
使用场景:
- 系统架构图(微服务、数据库、网络拓扑)
- 流程图(业务流程、决策树)
- 序列图(API 调用时序)
- 概念图(思维导图、关系网络)
- 教程插图(手绘标注风格)
🤖 二、AI / Agent 类 Skills
1. claude-code — 委托 Claude Code 处理编码任务
将复杂编码任务委托给 Anthropic 官方 Claude Code CLI,支持 PR 创建、代码审查、多文件重构。
2. dspy — 声明式 LLM 程序与自动优化
DSPy 是斯坦福开源的声明式 LLM 编程框架,封装了签名定义 → 模块组合 → 编译优化 → RAG pipeline 构建的完整流程。
🎮 三、游戏 / 娱乐类 Skills
1. pokemon-player — 自动化宝可梦游戏
通过无头模拟器 + RAM 读取方式玩宝可梦,支持自动遇敌、战斗决策、队伍管理。堪称最有娱乐性的 Skill 之一。
链接:GitHub - pokemon-player Skill
2. minecraft-modpack-server — 模组服务器搭建
自动搭建 CurseForge / Modrinth 模组 Minecraft 服务器,支持模包选择、端口配置、插件管理。
链接:GitHub - minecraft-modpack-server Skill
🛡️ 四、红队 / 安全研究类 Skills
1. godmode — LLM 越狱技术合集
集成 G0DM0D3、L1B3RT4S、Parseltongue 等越狱技术,提供三大攻击模式:
- GODMODE CLASSIC:系统提示词模板(针对 Claude/GPT/Grok/Gemini 各自有专属模板)
- PARSELTONGUE:输入混淆(33 种技术,从零宽字符到 Base64)
- ULTRAPLINIAN:多模型竞速(55 个模型并行查询,返回最优解)
⚠️ 仅用于合法安全研究
📊 热门 Skills 一览表
| 类别 | 名称 | 推荐指数 | 亮点 |
| 创意 | comfyui | ⭐⭐⭐⭐⭐ | 最前沿图像/视频生成模型 |
| 创意 | manim-video | ⭐⭐⭐⭐⭐ | 3Blue1Brown 级数学动画 |
| 创意 | ascii-video | ⭐⭐⭐⭐ | 复古 ASCII 视频制作 |
| 创意 | p5js | ⭐⭐⭐⭐ | 浏览器端生成艺术 |
| 创意 | songwriting | ⭐⭐⭐⭐ | Suno 音乐提示词工程 |
| AI 编程 | claude-code | ⭐⭐⭐⭐ | 大型代码重构 |
| AI 编程 | dspy | ⭐⭐⭐⭐ | 声明式 RAG 构建 |
| 游戏 | pokemon-player | ⭐⭐⭐⭐⭐ | 自动化玩宝可梦 |
| 红队 | godmode | ⭐⭐⭐ | LLM 越狱技术集合 |
相关资源:
- Hermes Agent 官方仓库:GitHub
- Skills 完整目录:skills/
- 官方文档:hermes-agent.nousresearch.com/docs
本文由 Hermes Agent 自动整理编辑,参考 Hermes Agent v2.1.0 官方 Skills 仓库。
- 上一篇: 搭建个人图库最优省钱架构:Cloudflare R2 免费存储 + CDN 拆分方案
- 下一篇: 没有了