# 大语言模型后端:cloud 或 local LLM_BACKEND=cloud # 云端提供商:openai 或 anthropic LLM_PROVIDER=openai # 云端配置(OpenAI 兼容) OPENAI_API_KEY=sk-xxxx OPENAI_BASE_URL=https://api.openai.com/v1 LLM_MODEL=gpt-4o # 本地大语言模型(Ollama) LOCAL_LLM_MODEL=qwen2.5-coder:7b # 嵌入模型后端:local 或 cloud EMBED_BACKEND=local LOCAL_EMBED_MODEL=Qwen/Qwen3-Embedding-0.6B # 验证服务地址 VALIDATION_SERVICE_URL=http://localhost:8001/validate # Chroma 持久化目录 CHROMA_PERSIST_DIR=./db/chroma # ---- RAG / 向量知识库 (rag_jrxml 子模块) ---- # 嵌入模型 RAG_EMBED_MODEL=sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 # JRXML 模板源目录 (rag 子模块内已含 107 个模板) RAG_JRXML_SOURCE=./rag/jrxml_source # 分块输出目录 RAG_CHUNKER_OUTPUT=./rag/jrxml_chunker_output # 向量输出目录 RAG_EMBEDDINGS_DIR=./rag/embeddings # ChromaDB 知识库路径 RAG_CHROMA_PATH=./db/chroma # ChromaDB 集合名称 RAG_COLLECTION_NAME=jrxml_chunks # GPU 加速 RAG_USE_GPU=true # FP16 半精度 RAG_USE_FP16=true # 向量化批处理大小 RAG_BATCH_SIZE=64 # 最大自动修正尝试次数 MAX_RETRY=3 # 上下文压缩阈值(token 数) CONTEXT_MAX_TOKENS=6000 # 保留最近 N 轮完整对话 CONTEXT_KEEP_RECENT=4 # 会话持久化目录 SESSIONS_DIR=./sessions # 日志目录和级别 LOG_DIR=./logs LOG_LEVEL=DEBUG # 状态快照保留数量(用于撤销操作) HISTORY_MAX_SNAPSHOTS=10 # 意图识别模型(默认使用主 LLM 模型) # INTENT_MODEL=gpt-4o-mini # OCR 字段提取配置 # 是否使用 GPU 加速 OCR(需要 CUDA 驱动和 GPU 版 EasyOCR/PaddleOCR) OCR_USE_GPU=false # OCR 文本置信度最低阈值(0-1),低于此值的元素将被忽略 OCR_CONFIDENCE_THRESHOLD=0.5