Files
agent_jrxml/.env.example
T
panda 21a5fdf930 feat: 后端基础设施 — LLM工厂/Embedding工厂/验证客户端/会话持久化
- backend/llm.py: 支持 OpenAI 兼容 API 与 Ollama 本地模型切换
- backend/embeddings.py: 支持云端与本地嵌入模型(sentence-transformers)
- backend/validation.py: FastAPI 验证服务 HTTP 客户端
- backend/session.py: JSON 文件会话管理(创建/加载/保存/列表/删除)
- .env.example: 完整环境变量模板
- requirements.txt: 所有 Python 依赖声明
2026-05-14 23:20:56 +08:00

39 lines
857 B
Bash
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 大语言模型后端:cloud 或 local
LLM_BACKEND=cloud
# 云端配置(OpenAI 兼容)
OPENAI_API_KEY=sk-xxxx
OPENAI_BASE_URL=https://api.openai.com/v1
LLM_MODEL=gpt-4o
# 本地大语言模型(Ollama
LOCAL_LLM_MODEL=qwen2.5-coder:7b
# 嵌入模型后端:local 或 cloud
EMBED_BACKEND=local
LOCAL_EMBED_MODEL=Qwen/Qwen3-Embedding-0.6B
# 验证服务地址
VALIDATION_SERVICE_URL=http://localhost:8001/validate
# Chroma 持久化目录
CHROMA_PERSIST_DIR=./db/chroma
# 最大自动修正尝试次数
MAX_RETRY=3
# 上下文压缩阈值(token 数)
CONTEXT_MAX_TOKENS=6000
# 保留最近 N 轮完整对话
CONTEXT_KEEP_RECENT=4
# 会话持久化目录
SESSIONS_DIR=./sessions
# 状态快照保留数量(用于撤销操作)
HISTORY_MAX_SNAPSHOTS=10
# 意图识别模型(默认使用主 LLM 模型)
# INTENT_MODEL=gpt-4o-mini