feat: 后端基础设施 — LLM工厂/Embedding工厂/验证客户端/会话持久化
- backend/llm.py: 支持 OpenAI 兼容 API 与 Ollama 本地模型切换 - backend/embeddings.py: 支持云端与本地嵌入模型(sentence-transformers) - backend/validation.py: FastAPI 验证服务 HTTP 客户端 - backend/session.py: JSON 文件会话管理(创建/加载/保存/列表/删除) - .env.example: 完整环境变量模板 - requirements.txt: 所有 Python 依赖声明
This commit is contained in:
@@ -0,0 +1,38 @@
|
||||
# 大语言模型后端:cloud 或 local
|
||||
LLM_BACKEND=cloud
|
||||
|
||||
# 云端配置(OpenAI 兼容)
|
||||
OPENAI_API_KEY=sk-xxxx
|
||||
OPENAI_BASE_URL=https://api.openai.com/v1
|
||||
LLM_MODEL=gpt-4o
|
||||
|
||||
# 本地大语言模型(Ollama)
|
||||
LOCAL_LLM_MODEL=qwen2.5-coder:7b
|
||||
|
||||
# 嵌入模型后端:local 或 cloud
|
||||
EMBED_BACKEND=local
|
||||
LOCAL_EMBED_MODEL=Qwen/Qwen3-Embedding-0.6B
|
||||
|
||||
# 验证服务地址
|
||||
VALIDATION_SERVICE_URL=http://localhost:8001/validate
|
||||
|
||||
# Chroma 持久化目录
|
||||
CHROMA_PERSIST_DIR=./db/chroma
|
||||
|
||||
# 最大自动修正尝试次数
|
||||
MAX_RETRY=3
|
||||
|
||||
# 上下文压缩阈值(token 数)
|
||||
CONTEXT_MAX_TOKENS=6000
|
||||
|
||||
# 保留最近 N 轮完整对话
|
||||
CONTEXT_KEEP_RECENT=4
|
||||
|
||||
# 会话持久化目录
|
||||
SESSIONS_DIR=./sessions
|
||||
|
||||
# 状态快照保留数量(用于撤销操作)
|
||||
HISTORY_MAX_SNAPSHOTS=10
|
||||
|
||||
# 意图识别模型(默认使用主 LLM 模型)
|
||||
# INTENT_MODEL=gpt-4o-mini
|
||||
Reference in New Issue
Block a user