ChatGPT历史一键迁移搜索

chatgpt-import

收藏 2.9k
下载 1.3k
版本 v1.0.2

OpenClaw官方数据迁移工具,将ChatGPT对话历史转为可搜索的本地知识库,需上传至OpenAI API生成嵌入向量。

基本信息

  • 技能名称?chatgpt-import
  • 中文名称?ChatGPT历史一键迁移搜索
  • 作者?samdickson22
  • 分类?专业技能
  • 版本?v1.0.2
  • 标签?data-analytics, productivity, automation, api, docs

使用方法

使用说明
核心用法
chatgpt-import 是 OpenClaw 生态专用的 ChatGPT 历史迁移工具,通过三步工作流实现对话数据的结构化导入:首先从 ChatGPT 导出 conversations.json 文件,随后使用 Python 脚本将 JSON 转换为 Markdown 格式(支持 --min-messages 过滤无效对话),最后调用 OpenAI Embedding API 生成向量并写入 SQLite 数据库。完成后的数据库通过 OpenClaw 配置文件的 memorySearch.extraPaths 字段接入,重启网关即可实现历史对话的全文检索。
显著优点
该工具设计简洁且高度透明:纯 Python 标准库实现,零第三方依赖,彻底杜绝供应链攻击风险;代码完全开源可审计,所有文件操作均带安全边界(如禁止覆盖现有数据库);成本控制精准,2400 条对话仅需约 0.15 美元;输出格式为标准 SQLite,便于二次开发与跨平台迁移。文档层面,SKILL.md 对 API 成本、数据上传风险、密钥管理均有明确警示,体现负责任的安全披露态度。
潜在缺点与局限性
核心局限在于 强制依赖 OpenAI 云端服务 :对话内容必须离开本地环境传输至 api.openai.com,对含敏感信息的场景构成合规障碍;无本地嵌入模型替代方案,隐私敏感用户无法完全自主控制数据;缺乏内置的敏感信息扫描机制,需用户手动预处理;批量嵌入过程受限于 OpenAI API 速率限制,大规模历史导入可能耗时较长;此外,嵌入模型选择受限(仅支持 OpenAI 指定模型),无法灵活切换至开源替代方案。
适合的目标群体
OpenClaw 深度用户 :希望统一检索 ChatGPT 历史与新对话的进阶用户
个人知识管理爱好者 :构建可搜索的 AI 对话存档,形成第二大脑
非敏感场景迁移需求 :日常咨询、学习笔记、公开技术讨论等低隐私风险内容
成本敏感型开发者 :需低成本实现对话数据向量化的独立开发者
使用风险

  1. 数据隐私风险 :对话内容上传至 OpenAI,需遵守其数据保留政策,企业机密、医疗记录、金融数据等严禁导入
  2. API 密钥泄露 :密钥通过环境变量或命令行传递,多用户服务器场景存在泄露可能
  3. 嵌入成本累积 :超大规模历史(数万条对话)可能产生意外费用
  4. 服务依赖风险 :OpenAI API 可用性直接影响功能,无离线降级方案
  5. 格式兼容性 :未来 ChatGPT 导出格式变更可能导致脚本失效,需关注上游更新

标签

专业技能

💬 评论 (0)

发表评论

支持 Markdown

📭 还没有评论,快来抢沙发吧!