# ============================================================ # JRXML RAG 项目 - 环境配置文件 # 复制此文件为 .env 并根据需要修改配置 # ============================================================ # -------------------- 嵌入模型配置 -------------------- # 模型名称或路径,支持以下格式: # 1. HuggingFace Hub 模型: Qwen/Qwen3-Embedding-4B # 2. HuggingFace Hub 模型: sentence-transformers/all-MiniLM-L6-v2 # 3. 本地模型路径: models/Qwen3-Embedding-4B EMBEDDING_MODEL_NAME=Qwen/Qwen3-Embedding-4B # 本地模型下载/存放目录(使用 Hub 模型时会自动下载到此目录) EMBEDDING_MODEL_PATH=models/Qwen3-Embedding-4B # HuggingFace 镜像站点(国内用户建议使用镜像加速) HF_ENDPOINT=https://hf-mirror.com # -------------------- 硬件配置 -------------------- # 是否使用 GPU 加速 (true/false) USE_GPU=true # 是否启用 FP16 半精度(可节省约 50% 显存) USE_FP16=true # 向量化批处理大小(根据显存调整,显存不足时减小此值) BATCH_SIZE=64 # -------------------- 目录配置 -------------------- # JRXML 源文件目录 JRXML_SOURCE_DIR=jrxml_source # 分块输出目录 CHUNKER_OUTPUT_DIR=jrxml_chunker_output # 向量输出目录 EMBEDDINGS_DIR=embeddings # Chroma 向量数据库目录 CHROMA_DB_PATH=chroma_db # Chroma 集合名称 CHROMA_COLLECTION_NAME=jrxml_chunks # -------------------- 分块配置 -------------------- # 单个 chunk 最大字符数 MAX_CHUNK_SIZE=2000 # -------------------- 查询配置 -------------------- # 默认返回结果数 DEFAULT_N_RESULTS=5 # 相似度阈值 (0~1,余弦距离,越小越相似) SIMILARITY_THRESHOLD=0.3