067880bf2e
新增: - backend/logger.py — 集中日志模块 (JSON格式 + trace_id + 独立llm.log) - @log_node / @_log_route 装饰器覆盖17个节点和8个路由 改进: - backend/llm.py — _LLMLoggingWrapper 自动记录LLM输入输出 - backend/llm.py — API Key优先读ANTHROPIC_API_KEY,模型名改为MiniMax-M2.7 - backend/llm.py — get_llm() 新增caller参数标识调用来源 - backend/validation.py — 新增验证结果/连接失败日志 - backend/session.py — 新增会话创建/删除日志 - app.py — 新增用户交互日志 (输入/执行/异常/会话操作) - app.py — 提前导入torchvision抑制transformers懒加载报错 - .env.example — 新增LOG_DIR/LOG_LEVEL/ANTHROPIC_API_KEY等配置项 - .gitignore — 新增logs/和db/忽略规则 文档: - ROADMAP.md — 新增阶段四: 可观测性 - README.md — 补充日志架构/LLM配置/项目结构 - CLAUDE.md — 同步最新配置/日志/MAX_RETRY(3) - CODE_GUIDE.md — 新增第15章日志系统,更新架构图/LLM/配置
66 lines
1.5 KiB
Bash
66 lines
1.5 KiB
Bash
# 大语言模型后端:cloud 或 local
|
||
LLM_BACKEND=cloud
|
||
|
||
# 云端提供商:openai 或 anthropic
|
||
LLM_PROVIDER=openai
|
||
|
||
# 云端配置(OpenAI 兼容)
|
||
OPENAI_API_KEY=sk-xxxx
|
||
OPENAI_BASE_URL=https://api.openai.com/v1
|
||
LLM_MODEL=gpt-4o
|
||
|
||
# 本地大语言模型(Ollama)
|
||
LOCAL_LLM_MODEL=qwen2.5-coder:7b
|
||
|
||
# 嵌入模型后端:local 或 cloud
|
||
EMBED_BACKEND=local
|
||
LOCAL_EMBED_MODEL=Qwen/Qwen3-Embedding-0.6B
|
||
|
||
# 验证服务地址
|
||
VALIDATION_SERVICE_URL=http://localhost:8001/validate
|
||
|
||
# Chroma 持久化目录
|
||
CHROMA_PERSIST_DIR=./db/chroma
|
||
|
||
# ---- RAG / 向量知识库 (rag_jrxml 子模块) ----
|
||
# 嵌入模型
|
||
RAG_EMBED_MODEL=sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
|
||
# JRXML 模板源目录 (rag 子模块内已含 107 个模板)
|
||
RAG_JRXML_SOURCE=./rag/jrxml_source
|
||
# 分块输出目录
|
||
RAG_CHUNKER_OUTPUT=./rag/jrxml_chunker_output
|
||
# 向量输出目录
|
||
RAG_EMBEDDINGS_DIR=./rag/embeddings
|
||
# ChromaDB 知识库路径
|
||
RAG_CHROMA_PATH=./db/chroma
|
||
# ChromaDB 集合名称
|
||
RAG_COLLECTION_NAME=jrxml_chunks
|
||
# GPU 加速
|
||
RAG_USE_GPU=true
|
||
# FP16 半精度
|
||
RAG_USE_FP16=true
|
||
# 向量化批处理大小
|
||
RAG_BATCH_SIZE=64
|
||
|
||
# 最大自动修正尝试次数
|
||
MAX_RETRY=3
|
||
|
||
# 上下文压缩阈值(token 数)
|
||
CONTEXT_MAX_TOKENS=6000
|
||
|
||
# 保留最近 N 轮完整对话
|
||
CONTEXT_KEEP_RECENT=4
|
||
|
||
# 会话持久化目录
|
||
SESSIONS_DIR=./sessions
|
||
|
||
# 日志目录和级别
|
||
LOG_DIR=./logs
|
||
LOG_LEVEL=DEBUG
|
||
|
||
# 状态快照保留数量(用于撤销操作)
|
||
HISTORY_MAX_SNAPSHOTS=10
|
||
|
||
# 意图识别模型(默认使用主 LLM 模型)
|
||
# INTENT_MODEL=gpt-4o-mini
|