panda
|
687b3a8f90
|
gitignore更新
|
2026-05-15 11:39:14 +08:00 |
|
panda
|
9b913302fd
|
docs: 更新文档,区分首次全量与增量更新两种使用场景
- README.md: 拆分为"首次使用"和"增量更新"两个独立章节
- docs/file_guide.md: 新增三种使用场景 (首次建库/追加模板/换模型)
- 补充三个 --incremental 标志的工作逻辑对比表
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-05-15 11:26:54 +08:00 |
|
panda
|
ea44096b12
|
feat: batch_chunker.py 支持 --incremental 增量分块
增量模式下自动跳过已处理文件,合并新旧 chunks 和统计报告。
至此分块、向量化、导入三个步骤均支持增量处理。
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-05-15 11:20:07 +08:00 |
|
panda
|
0787901acc
|
feat: 添加Markdown分块器与统一批量分块入口,支持增量向量化与导入
- 新增 md_chunker.py: Markdown语义分块引擎,支持标题/代码块/表格智能拆分
- 新增 batch_chunker.py: 统一批量分块入口,支持JRXML+Markdown混合处理
- 新增 requirements.txt: 整理项目依赖
- embed_chunks.py: 新增 --incremental 增量模式,追加新向量到已有数据
- import_to_chroma.py: 新增 --incremental 增量模式,不再每次清空数据库
- 更新 README.md 与 docs/file_guide.md 反映最新架构
Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
|
2026-05-15 11:10:25 +08:00 |
|
panda
|
85bec09857
|
新的README与gitignore
|
2026-05-13 21:14:22 +08:00 |
|
panda
|
9d78a49625
|
refactor: 重构项目配置管理,统一使用.env配置
- 新增config.py统一读取.env配置,移除硬编码路径和参数
- 重构collect_jrxml.py支持命令行参数和环境变量配置源目录
- 新增.env.example示例配置文件,整理所有可配置项
- 重构down_embedding_model.py、import_to_chroma.py等所有脚本使用统一配置
- 新增Windows一键部署脚本setup.bat
- 修正jrxml_banch_chunker.py的文件名拼写错误
|
2026-05-12 08:29:17 +08:00 |
|
panda
|
bd98486de0
|
chore: 初始化JRXML RAG项目,添加基础文件
创建了完整的JRXML语义检索RAG项目,包含:
1. 新增.gitignore忽略项目生成的缓存、依赖目录和本地文件
2. 编写详细的项目README文档
3. 补充文件功能说明文档
4. 实现向量导入、向量化、查询等核心脚本
|
2026-05-12 08:14:55 +08:00 |
|
panda
|
4f475e9e36
|
feat: 添加Qwen3嵌入模型及JRXML报告相关文件
添加Qwen3-4B嵌入模型配置文件及权重文件
添加多个JRXML报告的数据查询和字段定义文件
添加PdfEncryptReport.jrxml示例报告文件
|
2026-05-11 08:34:03 +08:00 |
|