Hermes+Obsidian+llmwiki AI如何将收藏夹变成你的第二大脑

📅 2026/6/21 1:36:57
Hermes+Obsidian+llmwiki AI如何将收藏夹变成你的第二大脑
HermesObsidianllmwiki AI如何将收藏夹变成你的第二大脑作者科技界的一粒微尘每天都在收藏从来没看过一个链接丢给 AI 助手自动提炼、分类、入库这才是收藏的正确姿势老规矩先看效果图从收藏夹链接-Hermes智能体-LLMwiki实现ingest你收藏了多少篇文章打开浏览器的收藏夹、微信的保存、知乎的收藏——里面躺着几百条链接但真正再打开看过的可能不到10%。这个问题困扰了很多人包括我。过去半年我搭建了一套从收藏到知识的完整流水线。核心就三个组件HermesAI助手 Obsidian笔记系统 LLM Wiki知识库框架效果很直接看到一个想收藏的链接丢给 AI → 自动抓取原文 → 提炼知识点 → 写入个人知识库 → 永久可检索。整个过程不需要我动手复制粘贴。这篇文章就把这套体系完整拆解出来。一、核心逻辑三级处理管线这套体系的核心不在于工具本身而在于信息的处理层级。很多人收藏夹吃灰的根本原因信息只经过了存储这一步没有经过提炼和结构化。原始材料层raw/原文快照不可修改。相当于收藏夹的数字备份。你去抓一个网页原文原封不动保存下来带时间戳和来源地址。这一步确保哪天想回头看原始内容随时能找到。知识层entities concepts经 AI 提炼后的结构化知识。从一篇文章中提取出核心概念、实体、数据、踩坑记录写成独立的知识页面。页面之间用[[wikilinks]]双向链接形成知识网络。检索层本地 RAGTF-IDF 向量检索或 Dataview 查询。知识写进去了还得能找回来。通过关键词搜索或结构化查询秒级定位到相关页面。收藏夹里100条链接 → AI 帮你变成100个知识点 → 知识点之间自动关联 → 每次搜索都能找到上下文。三级知识管线原始材料层 / 知识层 / 检索层二、HermesAI 驱动的全自动管线Hermes 是一个开源的 AI Agent 框架。在这套体系里它承担信息处理管线中的核心角色。收到一个链接后它的处理流程抓取原文访问链接 → 提取文章正文和代码块 → 保存为 Markdown 格式带上来源 URL 和 SHA256 哈希作为完整性校验。这一步对应收藏但比浏览器收藏夹多了全文备份。知识提炼阅读文章 → 识别核心概念和技术点 → 判断适合创建实体页还是概念页 → 生成符合 SCHEMA 规范的 YAML frontmatter → 写入知识库。关联入网新建的页面自动添加最低2个[[wikilinks]]指向已有页面。如果新知识点涉及已有的概念比如 OpenCV 移植涉及交叉编译工具链会在知识库中找到对应的页面形成双向链接。索引维护更新知识库目录index.md追加操作日志log.md记录处理时间和来源。下次你再丢一个链接AI 能立刻判断这是新知识点还是已有内容的补充。真实案例处理一篇技术文章昨天我丢给 Hermes 一个链接海思芯片 OpenCV 移植说明来自易百纳技术社区。AI 的处理结果是原文保存10,084 字的完整文章保存到raw/articles/带来源 URL 和时间戳。提炼概念页创建了一篇 2,323 字的知识页面《OpenCV 交叉编译与移植》包含cmake-gui 配置要点指定 aarch64-mix210-linux 交叉编译器设置目标架构为 ARM64编译踩坑记录PNG ARM NEON 宏定义兼容问题修复方法、glibc features.h 宏括号错误修复MPP Sample 集成方案Makefile.param 头文件路径添加、Makefile 链接库配置、Mat 与 MPP frame 互转关联已有知识自动添加了5个双向链接 →[[BSP 编译系统]]、[[交叉编译工具链]]、[[MPP 媒体处理流水线]]、[[鸿鸥派 HongOU PI]]做完这些知识库从26页变成了27页。每个知识点都不是孤岛而是网络中的一个节点。从收到链接到完成入库整个过程由AI自动完成三、Obsidian 插件让知识库变得可用Hermes 负责写Obsidian 负责读。光有内容不够还得能用得顺手。以下是我筛选出来的插件组合每个都有明确的用途。围绕 wiki vault 的8个核心插件各司其职Dataview —— 把笔记库当数据库查当知识库膨胀到几十上百页时靠人肉翻目录是不现实的。Dataview 让 YAML frontmatter 变成了可查询的数据库字段。每个 wiki 页面都带有这样的元数据type: entity | concept | comparison | query | summary tags: [build, hisi, tutorial] confidence: high | medium | low sources: [raw/articles/xxx.md]有了这些字段一行查询就能找到你需要的内容。查低置信度页面待审核WHERE confidence low→ 列出所有置信度低的页面定期补充查最近30天创建WHERE file.cday date(today) - dur(30 days)→ 新的知识回顾查孤儿页面没有入链WHERE length(file.inlinks) 0→ 发现孤立知识点补充反向链接按标签筛选实体WHERE contains(tags, hisi)→ 只看海思相关的内容这些查询可以直接写在知识库的首页 index.md 底部每次打开自动刷新比手动维护目录高效得多。Templater —— 一键创建结构化页面手工写 YAML frontmatter 很烦有了 Templater一切自动化。创建一个模板文件指定created字段自动填充当天日期type、tags预填默认值sources留空待补充。每次按快捷键AltN选模板输入文件名一个格式规范的新页面就自动生成。用模板的好处是一致性。如果团队多人协作或 AI 与人工混编统一的 frontmatter 结构让后续的 Dataview 查询和知识库 lint 检测都能正常工作。QuickAdd —— 一键捕获到 inbox看到好文章但没时间处理QuickAdd 解决这个问题。设置一个 Capture 模式快捷键触发弹窗输入标题和内容自动保存到raw/articles/文件名按日期自动命名。等你有空了再丢给 Hermes 做知识提炼。这一步降低了收藏的门槛——不需要打开 Obsidian不需要想放在哪个文件夹一按快捷键内容进 Inbox。Dataview 的典型查询场景以下三个查询在你搭建好知识库后可以立刻用起来场景一每周回顾——查看本周新增的知识点TABLE type, tags, file.cday as 创建日期 FROM entities OR concepts WHERE file.cday date(today) - dur(7 days) SORT file.cday DESC这个查询列出最近7天新增的所有实体页和概念页。如果某篇文章处理完后你还没读这就是提醒清单。场景二体检检查——发现孤立页面TABLE length(file.inlinks) as 入链数 FROM entities OR concepts WHERE length(file.inlinks) 0 SORT file.ctime DESC入链数为0的页面就是知识网络中的孤岛。发现一个孤岛说明这条知识还没有和其他内容产生关联——要么是 AI 处理时漏掉了要么是你需要手动补充一个链接。场景三质量审计——低置信度页面TABLE tags, confidence, file.mday as 最后修改 FROM entities OR concepts WHERE confidence low SORT file.mday ASCAI 提炼时如果只有单一来源confidence 会标记为 “low”。这些页面需要人工补充其他来源来提升置信度是维护知识的重点对象。Kanban —— 学习进度可视化在 Obsidian 里建一个看板分成三个列待学习、进行中、已完成。每次 Hermes 处理完一篇文章把对应知识点拖到进行中学完了拖到已完成。看板的价值不在工具本身而是提供了进度感。几十篇文章堆在那里容易焦虑看板清晰地告诉你还有几个没看、正在看哪个、已经消化了多少。Excalidraw —— 画架构图辅助理解处理复杂概念时一张图胜过千言万语。Excalidraw 支持手绘风格框图画 SoC 架构图、MPP 流水线图、AI 推理流程。画好的图可以直接嵌入到对应的概念页中用![[文件名.excalidraw]]引用。下次打开知识库文字描述配架构图阅读效率高很多。Obsidian Git —— 自动备份知识库是长期积累的资产丢了损失很大。Obsidian Git 每隔30分钟自动提交一次变更配合远程 Git 仓库做到增量备份。配置完成后不需要再操心有没有保存这件事。写过的内容自动进入版本管理随时可以回溯。插件组合的实际效果这些插件单独用都只是工具组合起来效果不一样输入场景浏览器看到好文章 → QuickAdd 快捷键保存到 Inbox → 丢给 Hermes 处理 → AI 自动抓取、提炼、入库查阅场景打开 Obsidian → 首页 Dataview 显示最近添加和待审核 → 点击新页面阅读 → 发现孤儿页面 → 补充反向链接维护场景定期运行 Dataview 查询低置信度页面 → 补充来源和细节 → 看 Kanban 看板 → 标记已完成四、LLM Wiki知识增长的结构化引擎Obsidian 是容器LLM Wiki 是规则。后者定义了知识应该以什么结构组织从而保证知识库能持续增长而不变成垃圾堆。核心规则只有几条三层结构raw/存原始材料不可修改entities/存实体芯片、板卡、工具concepts/存概念协议、流程、方法论comparisons/存对比分析。每层之间的界限清楚。最低链接数每个新页面至少要有2个出站[[wikilinks]]。这条规则强制新知识必须与已有知识产生关联——孤立的页面在知识网络里其实不存在。页面阈值仅在 ≥2 个来源中出现时创建独立页面。避免为一篇文章的细枝末节创建大量碎片页面。知识库的精炼比数量更重要。冲突显式化当新信息与已有内容矛盾时不覆盖同时记录两个立场并标记日期。contested字段标记矛盾页面供人工审核。这套规则不是 AI 作者自创的它来自 Andrej Karpathy 提出的LLM Wiki模式——让 AI 像人类整理知识一样持续维护一个不断增长的知识库。五、从0到1搭建实际操作步骤前提条件一台联网的 Linux 机器WSL、云服务器、本地虚拟机都行一个 GitHub 账号以及 Obsidian桌面版。步骤1创建知识库目录mkdir-p~/wiki/{raw/articles,entities,concepts,comparisons,queries}touch~/wiki/SCHEMA.md ~/wiki/index.md ~/wiki/log.md三条命令知识库的骨架就有了。步骤2配置 Hermes AgentHermes 是一个开源 AI 助手框架。安装完成后在配置文件中指定知识库路径和 LLM Wiki 技能。关键的技能文件定义了知识库结构、页面模板、处理流程和 Lint 规则。这些都在~/.hermes/skills/research/llm-wiki/下可以根据自己的需要修改。步骤2的详细配置Hermes 安装完成后关键配置在~/.hermes/config.yaml# 配置 LLM Wiki 技能skills:-name:llm-wikiconfig:wiki_path:~/wikiauto_ingest:truemax_pages_per_source:5# 模型配置model_providers:-name:deepseekmodel:deepseek-v4-flash配置完成后Hermes 就能自动识别你对知识库的指令。步骤3的详细配置Templater 配置文件路径创建_templates/目录在里面放两个模板文件。实体页模板---title:% tp.file.title %created:% tp.date.now(YYYY-MM-DD) %updated:% tp.date.now(YYYY-MM-DD) %type:entitytags:[]confidence:mediumsources:[]---概念页模板---title:% tp.file.title %created:% tp.date.now(YYYY-MM-DD) %updated:% tp.date.now(YYYY-MM-DD) %type:concepttags:[]confidence:mediumsources:[]---# % tp.file.title %## 概述## 关键内容## 相关页面Dataview 的配置更简单——装好后不需要额外设置直接在任意页面写查询代码块即可。QuickAdd 建议设置一个 Capture 快捷键绑定到raw/articles/。看到好文章按快捷键标题和内容自动写入 Inbox 目录。步骤3在 Obsidian 中打开知识库用 Obsidian 打开~/wiki/目录。安装 Dataview、Templater、QuickAdd、Excalidraw、Kanban、Obsidian Git 这些插件。在设置中配置 Templater 的模板目录_templates/创建你的第一个实体页模板和概念页模板包含完整的 YAML frontmatter 前缀。步骤4第一次测试找一个链接可以是自己的博客、刚收藏的微信文章丢给 Hermes看它怎么处理。第一次跑通后检查三个地方文章是否完整保存到了raw/articles/知识点是否提炼成了规范的 wiki 页面[[wikilinks]]是否关联到了已有内容。步骤5持续积累每天花5分钟处理2-3个收藏链接。一周后知识库有20-30页的知识一个月后可能超过100页。关键在于不要追求完美——先入库、先提炼后续通过 Dataview 查询定期补充和完善。跟其他方案的对比有人用 Notion 做知识库有人用飞书文档有人用纯文件夹。跟这些方案相比这套体系的优势在三个方面自动化程度。其他方案需要手动整理这套体系可以 AI 自动化处理。丢链接 → 自动提炼 → 入库关联全程不需要人介入。知识关联。文件夹只能单层分类双向链接可以形成网状结构。一个OpenCV 移植的知识点可以同时关联到交叉编译工具链、“MPP 媒体处理”、“鸿鸥派开发板”跨领域的关联在文件夹里是做不到的。长期可维护。纯 Markdown 格式 本地存储。没有平台锁定没有数据库依赖。换一个笔记软件把.md文件复制过去就能用。不同方案的实际效果对比维度传统收藏夹文件夹标签HermesLLM Wiki信息留存率5% (看完就忘)~30% (整理时还记得)80% (AI提炼关联)搜索效率靠记忆翻页关键词搜索结构化查询语义检索知识关联无手动建链接自动[[wikilinks]]关联长期维护成本极低(但无用)高(需手动整理)低(AI持续处理)内容可迁移性浏览器依赖Markdown可迁移纯MD本地存储团队共享不行共享文件夹Obsidian Sync/Git防丢失浏览器同步手动备份Git自动版本管理从表格可以看出传统收藏夹和文件夹方案有各自的短板而 HermesLLM Wiki 的组合在多个维度上都有明显优势。关键差异在于大部分方案聚焦存储这套方案聚焦流动——让信息从收藏走向知识。结语收藏夹吃灰的根源不在于看了就忘而在于信息进了收藏夹就停止了流动。这套体系的核心思路很简单让 AI 承担提炼和关联的工作你只需要做收藏和学习这两件事。收藏 → AI 处理 → 入库 → 检索信息的流动从单向变成闭环。从今天开始不妨试试第一步找一个你收藏了很久但没看的链接让 AI 帮你处理一次。看到结果你可能就停不下来了。实际效果一个月后的变化这套体系我跑了约一个月。知识库从0逐步增长到27页6个实体 20个概念 1个对比覆盖了芯片资料、编译系统、MPP媒体处理、AI ISP、U-Boot移植、OpenCV移植等多个方向。最直观的变化以前收藏了又忘了的资料现在能通过关键词搜索秒级定位到。以前感觉学过但记不清的问题现在能通过 [[wikilinks]] 追溯上下文。另一个意外收获因为知识是结构化的不同领域的知识点在 Graph View 里会形成跨域链接。比如 “OpenCV移植” 同时连接了 “交叉编译工具链” 和 “MPP媒体处理流水线”这种跨领域的关联在传统笔记系统里几乎不可能自然发生。你可能适合这篇文章如果你场景频率建议步骤日常阅读大量技术文章每天先装 QuickAdd 降低收藏门槛正在学习某个技术领域按需按文章步骤搭建知识库框架需要长期积累专业知识持续每周投入15分钟维护即可团队分享和知识沉淀不定期多人共建时用 Templater 保一致性往期推荐→ [用 Obsidian LLM Wiki 搭建嵌入式开发知识库]→ [Obsidian 插件怎么选从你的嵌入式项目出发] 长按识别关注不错过每一篇干货版权所有 © AI的探索之旅| 转载请联系作者