S

Skill 详情

soul-archive(灵魂存档)

Soul Archive — A digital personality persistence system + agentic memory. Builds your digital soul clone through everyday AI conversations, with proactive context injection, cross-session recall, failure-pattern warning,

来源平台:SkillHub
来源标识:SkillHub/soul-archive
源文件:原始说明
前端设计 高关注 SkillHub 高 风险 下载 150安装 30 SkillHub
来源平台SkillHub
文档版本3.0.0
热度高关注
排名信号下载 150
概述 安装 文档 下载

快速判断

Soul Archive — A digital personality persistence system + agentic memory. Builds your digital soul clone through everyday AI conversations, with proactive context injection, cross-session recall, failure-pattern warning,

最后校验2026-05-27
来源平台SkillHub
安全提示
下载副本ZIP 可用

适合任务

  • 按 SkillHub 收录说明复用成熟任务流程。
  • 通过下载包离线阅读完整 Skill 内容。
  • 结合热度指标优先评估常用 Skill。

输入与输出

输入:任务目标、上下文材料、文件路径、约束条件或需要处理的内容。

输出:按 Skill 说明生成的文档、代码、检查结果、计划、建议或操作步骤。

示例任务

  • 使用 soul-archive(灵魂存档) 帮我处理当前任务,并说明需要准备哪些输入。
  • 根据 soul-archive(灵魂存档) 的说明,先列出使用前的安全检查项。

安装方式

  1. 下载本站提供的 Skill ZIP 并解压。
  2. 把解压后的 Skill 目录放入当前 AI 工具支持的 skills 目录。
  3. 如需在线查看原始内容,可打开 GitHub 的 SKILL.md

在线原始地址:skillhub-soul-archive/SKILL.md

风险边界

SkillHub 提供了源站安全报告入口,但本站不替代人工审查。使用前仍需检查权限、外部依赖和敏感数据边界。

SKILL.md 文档介绍

🧬 Soul Archive (v3.0)

> *"Every conversation is a slice of the soul. Enough slices, and you can rebuild a complete you."*

What's New in v3.0

  • 🚫 加密层移除 —— 所有数据明文 JSON,去除 AES-256-GCM 复杂度。隐私通过本地存储 + .gitignore 保证,不再有"丢密钥即丢数据"的风险。
  • 🚫 Voice / Relationships 维度移除 —— 在 AI 对话场景里难以可靠采集,保留它们只会拉低总完整度的代表性。
  • 🆕 Workflow 维度 —— 工具/技术栈/硬规则/输出偏好,对应业界共识的 *Procedural Memory*。AI 立刻能用。
  • 🆕 Aspirations 维度 —— 长期目标/在做的项目/想成为/想学/认知盲区。
  • 🔀 反感的事归位 —— workflow.pet_peeves 数据字段保留(采集稳定),但 HTML 报告里渲染在「💫 性格特征」卡尾部,更符合心理语义。
  • 🆕 主动 Agent Memory —— soul_agent_memory.py 提供:跨会话召回、失败模式预警、行为模式蒸馏。
  • 🆕 主动上下文注入 —— soul_context.py 在对话开始时输出 ≤800 token 的人格摘要,agent 直接拼到 system prompt。
  • 🆕 统一 CLI —— soul.py 路由全部子命令。
  • 🆕 去重合并 —— 写入前用 bigram-Jaccard 相似度(默认阈值 0.85)合并同义条目,避免重复。
  • 🆕 HTML 报告增强 —— 新增"灵魂演变时间线"和"档案冲突"视图。

Overview

Soul Archive 是一个数字人格持久化 + 主动智能体记忆系统。在用户授权或显式触发下,它能:

  • 🗣️ 采集说话习惯 —— 口头禅、句式、用词、幽默风格
  • 🧠 采集知识与观点 —— 关注的话题、立场、信奉的方法论
  • 👤 采集个人信息 —— 身份、经历、生活细节
  • 💫 采集性格特征 —— 决策风格、情绪模式、价值观
  • ⚙️ 采集工作偏好 ⭐ —— 工具/技术栈/硬规则/输出偏好(含反感的事,见性格卡)
  • 🎯 采集理想抱负 ⭐ —— 长期目标、正在做的项目、想学的技能
  • 📝 采集情景记忆 —— 具体事件、人生片段
  • 🤖 服务 AI 自身 —— 跨会话召回过往模式、失败预警、行为模式蒸馏

最终成果:一个数字灵魂副本,能:

1. 生前 —— 以你的风格替你回应;让其他 AI Agent 一秒"懂你"

2. 身后 —— 让所爱之人继续与"你"对话,留住情感连接

Core Principles

🔒 Privacy First

  • 全部数据存在 ~/.skills_data/soul-archive/不上传任何云端
  • v3.0 全部明文 JSON。.gitignore 拦截 VCS 提交。
  • Soul Chat 流向:基于本地档案构建 prompt,是否被外部 LLM 看到,取决于你的 agent/平台配置。
  • 通过 config.json 细粒度控制每个维度的开关。
  • 默认敏感话题(健康、财务、亲密关系)需用户确认。

🤫 Non-intrusive Extraction

  • 不打断对话流,不追问。
  • 通过触发词或 auto_extract: true 自动激活。
  • 只在发现新的、高置信度信息时更新。

> ⚠️ 透明度:开启 auto_extract 意味着 AI 会在对话中提取人格信息。完全控制需 auto_extract: false,并以触发词手动激活("沉淀一下" / "soul extract")。首次使用前请审阅 config.json

📐 High Confidence

  • 每条信息携带置信度。
  • 用户明示 > 推理 > 模糊暗示。
  • 冲突信息会被标记,不会自动覆盖。

---

Architecture: Skill ↔ Data Separation

{SKILL_DIR}/                  ← Skill 引擎
~/.skills_data/soul-archive/  ← 你的灵魂数据(用户主目录)

数据放在用户主目录,所以同机器上任何 IDE / AI 工具 / Workspace 都能访问同一份灵魂。

---

v3.0 Data Directory Structure

~/.skills_data/soul-archive/
├── profile.json                  # 总体完整度、版本号
├── config.json                   # 隐私 / 提取 / Agent 自我改进配置
├── identity/
│   ├── basic_info.json           # 身份 + 生活习惯 + 数字身份
│   └── personality.json          # 性格 + 行为模式 + 社交风格
├── memory/
│   ├── episodic/YYYY-MM-DD.jsonl # 情景记忆
│   ├── semantic/
│   │   ├── topics.json           # 话题兴趣 & 观点地图
│   │   └── knowledge.json        # 专业知识 + belief_frameworks(信奉的方法论)
│   └── emotional/patterns.json   # 12 种情绪触发 + 表达/共情/应对
├── style/
│   ├── language.json             # 语言指纹(口头禅/句式/类比)
│   └── communication.json        # 沟通偏好
├── workflow/                     # ⭐ v3.0 新增
│   └── preferences.json          # 工具/技术栈/硬规则/输出偏好/反感的事(pet_peeves,渲染于性格卡)
├── aspirations.json              # ⭐ v3.0 新增 长期目标 + 在做的项目 + 想学 + 认知盲区
├── agent/                        # AI 自我改进
│   ├── patterns.json             # 行为模式库
│   ├── episodes/YYYY-MM-DD.jsonl # 工作经历
│   ├── corrections.jsonl         # 自我批评日志
│   ├── reflections.jsonl         # 自我反思日志
│   └── distill_log.jsonl         # 模式蒸馏日志
└── soul_changelog.jsonl          # 全局变更日志

---

Six Working Modes

Mode 1: 🔍 Soul Extract — 灵魂沉淀

触发:触发词 / 对话结束自动(若 auto_extract: true

> 触发词:soul extract / soul archive / soul update / 灵魂沉淀 / 灵魂提取 / 沉淀一下…

v3.0 提取维度

| 维度 | 内容 | 权重 |

|---|---|---|

| 👤 Identity | 身份/年龄/职业/所在地/生活习惯/数字身份 | 8% |

| 💫 Personality | MBTI/Big Five/特质/价值观/决策风格 | 18% |

| 🗣️ Language | 口头禅/句式/用词/幽默/语气词/类比 | 20% |

| 🧠 Knowledge & Views | 关注的话题、立场、信奉的方法论框架 | 14% |

| 📝 Memory | 情景记忆 + 情感模式(12 种触发) | 18% |

| ⚙️ Workflow ⭐ | 工具/技术栈/硬规则/输出偏好 | 15% |

| 🎯 Aspirations ⭐ | 长期目标/在做项目/想成为/想学/认知盲区 | 7% |

规则

  • 仅采集高置信度信息(confidence > 0.6)
  • 写入前做相似度去重(默认 ≥0.85 合并而非新增)
  • 冲突标记,不自动覆盖

调用

python3 scripts/soul.py extract --input "<conversation text>"
# 等价:python3 scripts/soul_extract.py --input "..."

Mode 2: 💬 Soul Chat — 灵魂对话

触发:"灵魂对话" / "soul chat" / "let [my clone] talk to me"

加载全部档案 → 构建角色扮演 System Prompt → 让数字克隆体上场。

python3 scripts/soul.py chat --mode prompt   # 输出完整 prompt
python3 scripts/soul.py chat --mode summary  # 一行摘要
python3 scripts/soul.py chat --mode json     # 结构化数据

Mode 3: 📊 Soul Report — 灵魂报告

生成交互式 HTML 人格画像:

  • 7 维雷达图 + MBTI 推断 + 完整度环
  • Big Five / 价值观 / 词云 / 话题热力
  • ⭐ 工作偏好 card / 理想抱负 card
  • ⭐ 灵魂演变时间线(30 天完整度/话题/提取曲线)
  • ⭐ 档案冲突视图(自动检测互相矛盾的条目)
python3 scripts/soul.py report --output ~/soul-report.html

Mode 4: 🎯 Soul Context Inject — 主动上下文注入 ⭐

用途:让任意 AI agent 在对话开始时自动加载你的人格摘要(≤800 token),瞬间懂你。

python3 scripts/soul.py context                   # markdown 输出
python3 scripts/soul.py context --format json     # JSON 输出
python3 scripts/soul.py context --token-budget 1200

输出包含:身份卡 / 性格(含反感的事) / 语言风格 / 典型样本 / 工作偏好(含硬规则、输出偏好) / 当前焦点 / 关注话题 / Top 行为模式 / 回复前自检清单。

Mode 5: 🤖 Agent Memory — 主动智能体记忆 ⭐

用途:AI 在执行任务前主动调用,避免重复犯错。

# 跨会话召回相关 patterns / corrections / reflections
python3 scripts/soul.py recall --task "执行 git rebase 操作"

# 失败模式预警:检测当前任务是否匹配过去某个 correction
python3 scripts/soul.py warn --task "批量删除 Desktop 文件"

# 行为模式蒸馏:积累 5 条以上反思后,让 LLM 提炼成新 pattern
python3 scripts/soul.py distill                       # 预览待蒸馏内容
python3 scripts/soul.py distill --commit '<json>'     # 写回蒸馏结果

# 会话开始综合简报(recall + warn + distill 一次输出)
python3 scripts/soul.py session-start --task "..."

Mode 6: 🔄 AI Self-Improvement — 自我反思

触发:触发词 或 任务完成后自动(auto_reflect: true

| 能力 | 描述 | 触发 |

|---|---|---|

| 🔍 自我反思 | 任务后回顾"做得好/做得不好" | 任务完成自动 |

| ⚡ 自我批评 | 用户纠正时记录失误 | 用户纠正自动 |

| 📚 自我学习 | 从反思/批评抽象行为模式 | 蒸馏阈值触发 |

| 🧹 自我整理 | 合并重复模式,调整置信度 | 内存增长时 |

python3 scripts/soul.py reflect --mode status     # 查看自我改进状态
python3 scripts/soul.py reflect --mode patterns   # 查看行为模式库

---

Quick Start

# 1. 初始化
python3 scripts/soul.py init

# 2. 查看状态
python3 scripts/soul.py status

# 3. 在 AI 对话开始时注入人格摘要(v3.0 ⭐)
python3 scripts/soul.py context

# 4. 任务执行前查相关模式(v3.0 ⭐)
python3 scripts/soul.py recall --task "我现在要做的事"

# 5. 生成报告
python3 scripts/soul.py report --output ~/soul-report.html

> 依赖:仅需 Python 3.10+,零第三方依赖。

---

Soul Completeness Scoring

log10 渐进式饱和曲线,永远趋近 100%,不会在合理使用次数内封顶。

冷启动惩罚:早期次数有效折扣(<30→0.30×, <100→0.45×, <300→0.65×, <1000→0.82×, <3000→0.92×, ≥3000→1.0×)

v3.0 7 维权重

| 维度 | 权重 | 主要饱和阈值 |

|---|---|---|

| 👤 Identity | 8% | log(5000) 提取次数 |

| 💫 Personality | 18% | traits:log(600K), values:log(180K), motivation:log(180K) |

| 🗣️ Language | 20% | catchphrases:log(1.2M), patterns:log(1M), examples:log(4M) |

| 🧠 Knowledge & Views | 14% | topics:log(2M), belief_frameworks:log(100), skills:log(1K) |

| 📝 Memory | 18% | episodic:log(6M) + emotional triggers:log(500) |

| ⚙️ Workflow | 15% | tools:log(200), tech_stack:log(200), hard_rules:log(100) |

| 🎯 Aspirations | 7% | goals:log(50), projects:log(100), gaps:log(100) |

预期:11 次提取 → ~7%, 1K 次 → ~50%, 10K → ~71%, 100K → ~86%, 1M → ~98%

---

Privacy Config (config.json)

{
  "privacy_level": "standard",
  "auto_extract": true,            // 对话结束时自动沉淀
  "auto_reflect": true,            // 任务完成后自动反思
  "auto_context_inject": true,     // 会话开始时自动注入人格摘要
  "extract_dimensions": {
    "identity": true,
    "personality": true,
    "language_style": true,
    "knowledge": true,
    "episodic_memory": true,
    "emotional_patterns": true,
    "workflow": true,              // ⭐ v3.0 新维度
    "aspirations": true            // ⭐ v3.0 新维度
  },
  "agent_self_improvement": {
    "enabled": true,
    "auto_reflect_on_completion": true,
    "auto_critique_on_correction": true,
    "pattern_extraction": true,
    "recall_on_task_start": true,             // ⭐ 任务开始时主动召回
    "warn_on_failure_pattern_match": true,    // ⭐ 失败模式预警
    "auto_distill_threshold": 5               // ⭐ 5 条反思后触发蒸馏
  },
  "deduplication": {
    "enabled": true,
    "similarity_threshold": 0.85
  },
  "sensitive_topics_filter": true,
  "require_confirmation_for": ["health", "finance", "intimate_relationships"],
  "data_retention_days": null
}

---

Best Practices

DO

  • ✅ 自然采集,不打断对话
  • ✅ 仅记录高置信度信息
  • ✅ 让用户裁决冲突
  • ✅ 定期生成报告,让用户复核
  • ✅ 严格遵守隐私配置 —— 关闭的维度绝不采集

DON'T

  • ❌ 在对话中说"我正在记录你的信息"
  • ❌ 编造用户没说过的内容
  • ❌ Soul Chat 模式中虚构档案没有的记忆
  • ❌ 强迫用户分享敏感信息

---

Migrating from v2.x

如果你已有 v2.x 数据:

1. 加密用户:先解密所有文件(用 v2.x 的 soul_init.py --enable-protection 配套脚本,或手动 import soul_crypto.SoulCrypto),再运行 v3.0 的迁移工具

2. 直接迁移:运行下面脚本(仓库 tools/migrate_v2_to_v3.py,自动处理):

  • profile.json 的 dimensions 字段重写为 7 维(去掉 voice / relationships)
  • config.json 的 extract_dimensions 重写
  • 创建空的 workflow/preferences.jsonaspirations.json
  • memory/semantic/knowledge.json 增加 belief_frameworks 字段
  • 删除空的 relationships/,备份 voice/

---

License

MIT License. Soul Archive is yours — code and data both.

建议反馈