70614dff5e
Major changes: - Streaming: LLM统一 _BaseLLM 接口 (invoke + stream), generate/modify/correct 节点使用 get_stream_writer() 实现逐字输出, UI 节点平铺展开自动折叠 - Prompt外部化: 7个prompt拆分到 prompts/*.md, loader.py 支持热重载 - 错误自增长: backend/error_kb.py — 指纹去重 + ChromaDB持久化, correct_jrxml→validate 通过时自动入库, retrieve同时搜索错误KB - 文件上传: backend/file_parser.py — PDF/DOCX/图片/文本解析, 侧边栏多文件上传, 文本自动注入下一条消息 - A4模板识别: backend/layout_analyzer.py — 三种模式(完整A4/行片段修改/行片段新建), PaddleOCR元素提取 + 行分组 + JRXML section匹配 - 会话历史下载: jrxml_versions版本追踪 + 侧边栏历史版本下载按钮 - 预览修复: route_after_save跳过预览/导出意图的验证循环 - Ctrl+C修复: JS注入拦截Streamlit裸c键清缓存 Docs: CLAUDE.md (完整项目文档), ROADMAP.md (改进路线图) Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
3.7 KiB
3.7 KiB
改进路线图
阶段一:代码质量(低风险,快速交付)
1. Prompt 拆分 ✓
- 创建
prompts/目录 - 7 个 prompt 各拆为独立
.md文件 nodes.py改为从文件加载- 支持热重载(文件变更无需重启)
2. 修复无效代码 ✓
backend/llm.py—get_num_tokens()修复为正确 APIbackend/embeddings.py— 修复 docstring 函数名不一致backend/llm.py— 统一 LLM 接口基类_BaseLLM
阶段二:用户体验(核心改造)
3. 流式输出 + 节点平铺 ✓
backend/llm.py— LLM 工厂支持stream()统一接口agent/nodes.py— generate/modify/correct 节点使用流式 +get_stream_writer()app.py— 使用stream_mode=["updates", "custom"]捕获流式事件- 节点状态平铺(处理过程 expander 逐节点展示)
- 流式完成后节点自动折叠
- 完成后单独展示「总结卡片」
4. 错误自增长知识库 ✓
backend/error_kb.py— ErrorKB 类(ChromaDB 持久化)- 错误指纹去重(标准化 + MD5)
correct_jrxml— 保存修正前状态到last_error_casevalidate— 修正成功时自动记录(仅新错误,自动去重)retrieve— 搜索错误知识库,注入历史修正案例- 记录内容:错误 + 修正前后 JRXML + prompt + 工具链 + 模型
5. 文件上传支持 ✓
backend/file_parser.py— 统一解析接口- 图片 → PIL 元信息 + PaddleOCR(可选安装后自动识别)
- PDF → pdfplumber / PyMuPDF 文本提取
- DOCX → python-docx 文本提取
- 纯文本 (.txt/.csv/.json/.xml) → 直接读取
can_use_vision()— 根据模型名判断是否支持原生多模态app.py— 侧边栏文件上传组件(多文件,可移除)- 上传文本自动注入下一条消息前缀
6. A4 图片模板识别 ✓
backend/layout_analyzer.py— 完整布局分析模块- A4 比例判定:exact(±3%) / close(±8%) / not_a4 三档
- PaddleOCR 布局分析:逐元素提取坐标(x,y,w,h)、字号、文本
- 行分组:Y 轴容差自动聚类
- 结构化输出:
图片模板共 X 行,第 1 行有 Y 个元素,其中元素 a 长...高...字体...内容是... - 检测门槛:≥2 个 OCR 元素 + A4 比例 → 标记为模板
app.py— 上传图片/PDF 时自动触发布局分析,替换为布局描述
7. 会话历史 JRXML 下载 ✓
agent/state.py— 新增jrxml_versions字段agent/nodes.py—finalize节点追加版本记录app.py— 侧边栏"历史版本"折叠区,每版本独立下载按钮
8. 预览功能修复 ✓
- 根因:
preview_report路由到save_session→validate触发不必要的验证修正循环 - 修复:
route_after_save— 预览/导出意图跳过验证直接finalize
阶段三:细节修复
9. Ctrl+C 修复 ✓
app.py— 注入 JS 拦截裸c键,保留 Ctrl+C 复制行为
执行顺序建议
1. Prompt 拆分 ──► 2. 无效代码修复
│
▼
3. 流式输出 + 节点平铺
│
┌─────────────┼─────────────┐
▼ ▼ ▼
4. 错误自增长 5. 文件上传 7. 下载历史
│ │
▼ ▼
6. A4 模板识别 8. 预览修复
│
▼
9. Ctrl+C 修复
阶段一立即可做,无外部依赖。阶段二是主要工作量。阶段三是收尾。