Commit Graph

2 Commits

Author SHA1 Message Date
panda ea44096b12 feat: batch_chunker.py 支持 --incremental 增量分块
增量模式下自动跳过已处理文件,合并新旧 chunks 和统计报告。
至此分块、向量化、导入三个步骤均支持增量处理。

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-15 11:20:07 +08:00
panda 0787901acc feat: 添加Markdown分块器与统一批量分块入口,支持增量向量化与导入
- 新增 md_chunker.py: Markdown语义分块引擎,支持标题/代码块/表格智能拆分
- 新增 batch_chunker.py: 统一批量分块入口,支持JRXML+Markdown混合处理
- 新增 requirements.txt: 整理项目依赖
- embed_chunks.py: 新增 --incremental 增量模式,追加新向量到已有数据
- import_to_chroma.py: 新增 --incremental 增量模式,不再每次清空数据库
- 更新 README.md 与 docs/file_guide.md 反映最新架构

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
2026-05-15 11:10:25 +08:00