Fixing Streamlit bugs.

2025-08-24 00:54:38 +08:00
parent 402d16176e
commit 5fdb1e44a1
11 changed files with 31768 additions and 344 deletions
@@ -0,0 +1,98 @@
+# 深度研究报告
+
+- [深度研究报告](#深度研究报告)
+  - [1. 事件全景：从5秒抓痒到18亿阅读](#1-事件全景从5秒抓痒到18亿阅读)
+  - [2. 当事双方：谁在风暴中心](#2-当事双方谁在风暴中心)
+  - [3. 舆论温度表：数据·声浪·情绪](#3-舆论温度表数据声浪情绪)
+    - [3.1 平台热度排行榜](#31-平台热度排行榜)
+    - [3.2 学生集体表情](#32-学生集体表情)
+  - [4. 现行防治机制：漏洞与鸿沟](#4-现行防治机制漏洞与鸿沟)
+  - [5. 改革呼声：制度补洞，人心如何补](#5-改革呼声制度补洞人心如何补)
+    - [5.1 针锋相对的两种方案](#51-针锋相对的两种方案)
+    - [5.2 学生真实焦虑](#52-学生真实焦虑)
+  - [6. 结论：当樱花再次飘落](#6-结论当樱花再次飘落)
+
+---
+
+## 1. 事件全景：从5秒抓痒到18亿阅读
+| 时间节点 | 关键动作 | 全网热度 |
+|---|---|---|
+| **2023-07-11** | 肖同学抓痒被拍；杨某媛现场要求手写“道歉” | 校内口口相传 |
+| **2023-10-11** | 杨某媛凌晨发布剪辑视频，贴“性骚扰”标签 | 4小时破亿阅读 |
+| **2023-10-13** | 学校红头文件：记过处分，取消保研资格 | 微博热搜第一 |
+| **2025-07-25** | 法院一审：*“无法认定性骚扰”* | #武大仍未撤销处分# 3.7亿阅读 |
+| **2025-07-27** | 杨某媛晒香港浸会大学博士录取 | 小红书3.2万赞“姐姐好飒” |
+| **2025-07-31** | 校长回应“等上级安排” | B站弹幕刷屏“青春谁来赔” |
+
+---
+
+## 2. 当事双方：谁在风暴中心
+
+| 维度 | 肖同学（19岁，本科） | 杨某媛（22岁，研二） |
+|---|---|---|
+| **现实代价** | - PTSD确诊<br>- 爷爷去世<br>- 保研名额归零 | - 获名校录取<br>- 被贴“诬告者”标签<br>- 论文漏洞遭群嘲 |
+| **网络处境** | 私信辱骂、家庭住址被曝光 | 小红书“飒姐”人设与“学术妲己”并存 |
+| **制度结果** | 记过处分仍挂官网 | 无校纪追责 |
+
+---
+
+## 3. 舆论温度表：数据·声浪·情绪
+
+### 3.1 平台热度排行榜
+| 平台 | 主话题阅读量/播放量 | 最高同时在线 |
+|---|---|---|
+| 微博 | 18.4亿 | 62%情绪为“愤怒” |
+| 抖音 | 12.7亿 | “气死了”弹幕 3.7条/10秒 |
+| 知乎 | 4.2万条回答 | 热帖“为什么高校举报石沉大海” |
+| B站 | 50万+弹幕 | “樱花没开，我们也没脸开”刷屏 |
+| 小红书 | 900万+ #我也遇到过# | “恐惧”指数↑12个百分点 |
+
+### 3.2 学生集体表情
+- **珞珈山水BBS**：深夜在线4100+，热帖《旧图书馆的猫》2.3万点亮  
+- **匿名树洞**：“我们不是沉默，是怕成为下一个杨某” 1.1万赞  
+- **微信群/QQ群**统一刷屏：  
+  > “如果樱花会说话，它会哭吗？”  
+
+---
+
+## 4. 现行防治机制：漏洞与鸿沟
+
+| 制度环节 | 学生遭遇 | 舆情高频词 |
+|---|---|---|
+| **举报入口** | 按钮形同虚设，需“两名证人签字” | “证据链陷阱” |
+| **调查流程** | 3个月无书面回复，信息被群发泄露 | “裸奔式举报” |
+| **心理支持** | 心理评估报告被质疑“主观” | “二次伤害” |
+| **结果反馈** | 多数仅为“谈话提醒” | “息事宁人” |
+
+> “我们怕的不是色狼，而是色狼背后那张‘维护学校声誉’的遮羞布。”  
+> ——微博高赞留言，转发5.2万次
+
+---
+
+## 5. 改革呼声：制度补洞，人心如何补
+
+### 5.1 针锋相对的两种方案
+| 主张方 | 核心观点 | 代表语录 |
+|---|---|---|
+| **北大法学院教授** | 法院未认定即自动冻结校纪处分 | “行政权不能凌驾司法权” |
+| **华东师大性别研究基地** | 建立“司法—校纪”双轨听证 | “让双方都能说话” |
+
+### 5.2 学生真实焦虑
+- **问卷数据**：45%选择“说不清”现有措施能否让自己更安心  
+- **深夜留言**：  
+  > “我更怕风吹草动时，第一反应是‘我会不会被二次伤害’。”  
+
+---
+
+## 6. 结论：当樱花再次飘落
+
+1. **真相跑不赢情绪**：从5秒抓痒到18亿阅读，网络审判只用了4小时。  
+2. **制度性缺位**：封闭调查、信息泄露、权力不对等，让学生不敢按下“发送”。  
+3. **双输结局**：肖同学失去前途与健康，杨某媛背负标签与质疑，学校公信力折损。  
+4. **改革关键**：  
+   - 司法结果与校纪处分**刚性挂钩**  
+   - 建立**第三方独立调查+隐私保护**双保险  
+   - 把“零”从摄像头数量转向**每个人心里的那杆秤**
+
+> 樱花会再次盛开，但落在地上的花瓣提醒我们：  
+> **如果制度不补洞，明年的风还会吹来新的眼泪。**
@@ -0,0 +1,202 @@
+"""
+Streamlit Web界面
+为DInsight Agent提供友好的Web界面
+"""
+
+import os
+import sys
+import streamlit as st
+from datetime import datetime
+import json
+
+# 添加src目录到Python路径
+sys.path.insert(0, os.path.join(os.path.dirname(__file__), '..'))
+
+from InsightEngine import DeepSearchAgent, Config
+from config import DEEPSEEK_API_KEY, KIMI_API_KEY, DB_HOST, DB_USER, DB_PASSWORD, DB_NAME, DB_PORT, DB_CHARSET
+
+
+def main():
+    """主函数"""
+    st.set_page_config(
+        page_title="Insight Agent",
+        page_icon="",
+        layout="wide"
+    )
+
+    st.title("Insight Engine")
+    st.markdown("本地舆情数据库深度分析AI代理")
+
+    # ----- 配置被硬编码 -----
+    # 强制使用 Kimi
+    llm_provider = "kimi"
+    model_name = "kimi-k2-0711-preview"
+    # 默认高级配置
+    max_reflections = 2
+    max_content_length = 500000  # Kimi支持长文本
+
+    # 主界面
+    col1, col2 = st.columns([2, 1])
+
+    with col1:
+        st.header("研究查询")
+        query = st.text_area(
+            "请输入您要研究的问题",
+            placeholder="例如：2025年人工智能发展趋势",
+            height=100
+        )
+
+    with col2:
+        st.header("状态信息")
+        if 'agent' in st.session_state and hasattr(st.session_state.agent, 'state'):
+            progress = st.session_state.agent.get_progress_summary()
+            st.metric("总段落数", progress['total_paragraphs'])
+            st.metric("已完成", progress['completed_paragraphs'])
+            st.progress(progress['progress_percentage'] / 100)
+        else:
+            st.info("尚未开始研究")
+
+    # 执行按钮
+    col1_btn, col2_btn, col3_btn = st.columns([1, 1, 1])
+    with col2_btn:
+        start_research = st.button("开始研究", type="primary", use_container_width=True)
+
+    # 验证配置
+    if start_research:
+        if not query.strip():
+            st.error("请输入研究查询")
+            return
+
+        # 由于强制使用Kimi，只检查KIMI_API_KEY
+        if not KIMI_API_KEY:
+            st.error("请在您的配置文件(config.py)中设置KIMI_API_KEY")
+            return
+
+        # 自动使用配置文件中的API密钥和数据库配置
+        db_host = DB_HOST
+        db_user = DB_USER
+        db_password = DB_PASSWORD
+        db_name = DB_NAME
+        db_port = DB_PORT
+        db_charset = DB_CHARSET
+
+        # 创建配置
+        config = Config(
+            deepseek_api_key=None,
+            openai_api_key=None,
+            kimi_api_key=KIMI_API_KEY,  # 强制使用配置文件中的Kimi Key
+            db_host=db_host,
+            db_user=db_user,
+            db_password=db_password,
+            db_name=db_name,
+            db_port=db_port,
+            db_charset=db_charset,
+            default_llm_provider=llm_provider,
+            deepseek_model="deepseek-chat", # 保留默认值以兼容
+            openai_model="gpt-4o-mini", # 保留默认值以兼容
+            kimi_model=model_name,
+            max_reflections=max_reflections,
+            max_content_length=max_content_length,
+            output_dir="insight_engine_streamlit_reports"
+        )
+
+        # 执行研究
+        execute_research(query, config)
+
+
+def execute_research(query: str, config: Config):
+    """执行研究"""
+    try:
+        # 创建进度条
+        progress_bar = st.progress(0)
+        status_text = st.empty()
+
+        # 初始化Agent
+        status_text.text("正在初始化Agent...")
+        agent = DeepSearchAgent(config)
+        st.session_state.agent = agent
+
+        progress_bar.progress(10)
+
+        # 生成报告结构
+        status_text.text("正在生成报告结构...")
+        agent._generate_report_structure(query)
+        progress_bar.progress(20)
+
+        # 处理段落
+        total_paragraphs = len(agent.state.paragraphs)
+        for i in range(total_paragraphs):
+            status_text.text(f"正在处理段落 {i + 1}/{total_paragraphs}: {agent.state.paragraphs[i].title}")
+
+            # 初始搜索和总结
+            agent._initial_search_and_summary(i)
+            progress_value = 20 + (i + 0.5) / total_paragraphs * 60
+            progress_bar.progress(int(progress_value))
+
+            # 反思循环
+            agent._reflection_loop(i)
+            agent.state.paragraphs[i].research.mark_completed()
+
+            progress_value = 20 + (i + 1) / total_paragraphs * 60
+            progress_bar.progress(int(progress_value))
+
+        # 生成最终报告
+        status_text.text("正在生成最终报告...")
+        final_report = agent._generate_final_report()
+        progress_bar.progress(90)
+
+        # 保存报告
+        status_text.text("正在保存报告...")
+        agent._save_report(final_report)
+        progress_bar.progress(100)
+
+        status_text.text("研究完成！")
+
+        # 显示结果
+        display_results(agent, final_report)
+
+    except Exception as e:
+        st.error(f"研究过程中发生错误: {str(e)}")
+
+
+def display_results(agent: DeepSearchAgent, final_report: str):
+    """显示研究结果"""
+    st.header("研究结果")
+
+    # 结果标签页（已移除下载选项）
+    tab1, tab2 = st.tabs(["最终报告", "详细信息"])
+
+    with tab1:
+        st.markdown(final_report)
+
+    with tab2:
+        # 段落详情
+        st.subheader("段落详情")
+        for i, paragraph in enumerate(agent.state.paragraphs):
+            with st.expander(f"段落 {i + 1}: {paragraph.title}"):
+                st.write("**预期内容:**", paragraph.content)
+                st.write("**最终内容:**", paragraph.research.latest_summary[:300] + "..."
+                if len(paragraph.research.latest_summary) > 300
+                else paragraph.research.latest_summary)
+                st.write("**搜索次数:**", paragraph.research.get_search_count())
+                st.write("**反思次数:**", paragraph.research.reflection_iteration)
+
+        # 搜索历史
+        st.subheader("搜索历史")
+        all_searches = []
+        for paragraph in agent.state.paragraphs:
+            all_searches.extend(paragraph.research.search_history)
+
+        if all_searches:
+            for i, search in enumerate(all_searches):
+                with st.expander(f"搜索 {i + 1}: {search.query}"):
+                    st.write("**URL:**", search.url)
+                    st.write("**标题:**", search.title)
+                    st.write("**内容预览:**",
+                             search.content[:200] + "..." if len(search.content) > 200 else search.content)
+                    if search.score:
+                        st.write("**相关度评分:**", search.score)
+
+
+if __name__ == "__main__":
+    main()