From ad27791e1c98d528d5e4623245b32c124959130f Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E6=88=92=E9=85=92=E7=9A=84=E6=9D=8E=E7=99=BD?=
 <670939375@qq.com>
Date: Tue, 5 Aug 2025 11:40:12 +0800
Subject: [PATCH] Optimize the model loading logic of Qwen3.

---
 WeiboSentiment_SmallQwen/predict_universal.py |  8 +-
 .../qwen3_embedding_universal.py              | 77 +++++++++-------
 .../qwen3_lora_universal.py                   | 91 +++++++++++--------
 3 files changed, 104 insertions(+), 72 deletions(-)

diff --git a/WeiboSentiment_SmallQwen/predict_universal.py b/WeiboSentiment_SmallQwen/predict_universal.py
index 58882df..e473b31 100644
--- a/WeiboSentiment_SmallQwen/predict_universal.py
+++ b/WeiboSentiment_SmallQwen/predict_universal.py
@@ -37,11 +37,14 @@ class Qwen3UniversalPredictor:
             raise ValueError(f"不支持的模型大小: {model_size}")
             
         model_path = MODEL_PATHS[model_type][model_size]
+        model_key = self._get_model_key(model_type, model_size)
+        
+        # 检查训练好的模型文件是否存在
         if not os.path.exists(model_path):
-            print(f"模型文件不存在: {model_path}")
+            print(f"训练好的模型文件不存在: {model_path}")
+            print(f"请先训练 {model_type.upper()}-{model_size} 模型，或检查模型路径配置")
             return
         
-        model_key = self._get_model_key(model_type, model_size)
         print(f"加载 {model_type.upper()}-{model_size} 模型...")
         
         try:
@@ -60,6 +63,7 @@ class Qwen3UniversalPredictor:
             
         except Exception as e:
             print(f"加载 {model_type.upper()}-{model_size} 模型失败: {e}")
+            print(f"这可能是因为基础模型下载失败或训练好的模型文件损坏")
     
     def load_all_models(self, model_dir: str = './models') -> None:
         """加载所有可用的模型"""
diff --git a/WeiboSentiment_SmallQwen/qwen3_embedding_universal.py b/WeiboSentiment_SmallQwen/qwen3_embedding_universal.py
index d776b4d..6b1b368 100644
--- a/WeiboSentiment_SmallQwen/qwen3_embedding_universal.py
+++ b/WeiboSentiment_SmallQwen/qwen3_embedding_universal.py
@@ -103,46 +103,61 @@ class Qwen3EmbeddingUniversal(BaseQwenModel):
         """加载Qwen3 Embedding模型"""
         print(f"加载{self.model_size}模型: {self.model_name_hf}")
         
+        # 第一步：检查当前文件夹的models目录
+        local_model_dir = f"./models/qwen3-embedding-{self.model_size.lower()}"
+        if os.path.exists(local_model_dir) and os.path.exists(os.path.join(local_model_dir, "config.json")):
+            try:
+                print(f"发现本地模型，从本地加载: {local_model_dir}")
+                self.tokenizer = AutoTokenizer.from_pretrained(local_model_dir)
+                self.embedding_model = AutoModel.from_pretrained(local_model_dir).to(self.device)
+                print(f"从本地模型加载{self.model_size}模型成功")
+                return
+                
+            except Exception as e:
+                print(f"本地模型加载失败: {e}")
+        
+        # 第二步：检查HuggingFace缓存
         try:
+            from transformers.utils import default_cache_path
+            cache_path = default_cache_path
+            print(f"检查HuggingFace缓存: {cache_path}")
+            
             self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf)
             self.embedding_model = AutoModel.from_pretrained(self.model_name_hf).to(self.device)
-            print(f"{self.model_size}模型加载完成")
+            print(f"从HuggingFace缓存加载{self.model_size}模型成功")
             
-            # 立即保存到本地缓存
-            cache_dir = f"./models/qwen3-embedding-{self.model_size.lower()}"
-            if not os.path.exists(cache_dir):
-                print(f"保存模型到本地: {cache_dir}")
-                os.makedirs(cache_dir, exist_ok=True)
-                self.tokenizer.save_pretrained(cache_dir)
-                self.embedding_model.save_pretrained(cache_dir)
-                print(f"模型已保存到: {cache_dir}")
+            # 保存到本地models目录
+            print(f"保存模型到本地: {local_model_dir}")
+            os.makedirs(local_model_dir, exist_ok=True)
+            self.tokenizer.save_pretrained(local_model_dir)
+            self.embedding_model.save_pretrained(local_model_dir)
+            print(f"模型已保存到: {local_model_dir}")
             
         except Exception as e:
-            print(f"从Hugging Face加载失败: {e}")
+            print(f"从HuggingFace缓存加载失败: {e}")
             
-            # 尝试从本地缓存加载
-            cache_dir = f"./models/qwen3-embedding-{self.model_size.lower()}"
+            # 第三步：从HuggingFace下载
             try:
-                if os.path.exists(cache_dir):
-                    self.tokenizer = AutoTokenizer.from_pretrained(cache_dir)
-                    self.embedding_model = AutoModel.from_pretrained(cache_dir).to(self.device)
-                    print(f"从本地缓存加载{self.model_size}模型成功")
-                else:
-                    raise FileNotFoundError("本地缓存也不存在")
-                    
+                print(f"正在从HuggingFace下载{self.model_size}模型...")
+                
+                self.tokenizer = AutoTokenizer.from_pretrained(
+                    self.model_name_hf,
+                    force_download=True
+                )
+                self.embedding_model = AutoModel.from_pretrained(
+                    self.model_name_hf,
+                    force_download=True
+                ).to(self.device)
+                
+                # 保存到本地models目录
+                os.makedirs(local_model_dir, exist_ok=True)
+                self.tokenizer.save_pretrained(local_model_dir)
+                self.embedding_model.save_pretrained(local_model_dir)
+                print(f"{self.model_size}模型下载并保存到: {local_model_dir}")
+                
             except Exception as e2:
-                print(f"本地加载也失败: {e2}")
-                print(f"正在下载{self.model_size}模型...")
-                
-                # 创建缓存目录并下载
-                os.makedirs(cache_dir, exist_ok=True)
-                self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf, cache_dir=cache_dir)
-                self.embedding_model = AutoModel.from_pretrained(self.model_name_hf, cache_dir=cache_dir).to(self.device)
-                
-                # 保存到本地
-                self.tokenizer.save_pretrained(cache_dir)
-                self.embedding_model.save_pretrained(cache_dir)
-                print(f"{self.model_size}模型下载并保存到: {cache_dir}")
+                print(f"从HuggingFace下载也失败: {e2}")
+                raise RuntimeError(f"无法加载{self.model_size}模型，所有方法都失败了")
     
     def train(self, train_data: List[Tuple[str, int]], **kwargs) -> None:
         """训练模型"""
diff --git a/WeiboSentiment_SmallQwen/qwen3_lora_universal.py b/WeiboSentiment_SmallQwen/qwen3_lora_universal.py
index 70dc83e..64202e9 100644
--- a/WeiboSentiment_SmallQwen/qwen3_lora_universal.py
+++ b/WeiboSentiment_SmallQwen/qwen3_lora_universal.py
@@ -46,7 +46,35 @@ class Qwen3LoRAUniversal(BaseQwenModel):
         """加载Qwen3基础模型"""
         print(f"加载{self.model_size}基础模型: {self.model_name_hf}")
         
+        # 第一步：检查当前文件夹的models目录
+        local_model_dir = f"./models/qwen3-{self.model_size.lower()}"
+        if os.path.exists(local_model_dir) and os.path.exists(os.path.join(local_model_dir, "config.json")):
+            try:
+                print(f"发现本地模型，从本地加载: {local_model_dir}")
+                self.tokenizer = AutoTokenizer.from_pretrained(local_model_dir)
+                self.base_model = AutoModelForCausalLM.from_pretrained(
+                    local_model_dir,
+                    torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
+                    device_map="auto" if torch.cuda.is_available() else None
+                )
+                
+                # 设置pad_token
+                if self.tokenizer.pad_token is None:
+                    self.tokenizer.pad_token = self.tokenizer.eos_token
+                    self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
+                
+                print(f"从本地模型加载{self.model_size}基础模型成功")
+                return
+                
+            except Exception as e:
+                print(f"本地模型加载失败: {e}")
+        
+        # 第二步：检查HuggingFace缓存
         try:
+            from transformers.utils import default_cache_path
+            cache_path = default_cache_path
+            print(f"检查HuggingFace缓存: {cache_path}")
+            
             self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf)
             self.base_model = AutoModelForCausalLM.from_pretrained(
                 self.model_name_hf,
@@ -59,49 +87,29 @@ class Qwen3LoRAUniversal(BaseQwenModel):
                 self.tokenizer.pad_token = self.tokenizer.eos_token
                 self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
             
-            print(f"{self.model_size}基础模型加载完成")
+            print(f"从HuggingFace缓存加载{self.model_size}基础模型成功")
             
-            # 立即保存到本地缓存
-            cache_dir = f"./models/qwen3-{self.model_size.lower()}"
-            if not os.path.exists(cache_dir):
-                print(f"保存模型到本地: {cache_dir}")
-                os.makedirs(cache_dir, exist_ok=True)
-                self.tokenizer.save_pretrained(cache_dir)
-                self.base_model.save_pretrained(cache_dir)
-                print(f"模型已保存到: {cache_dir}")
+            # 保存到本地models目录
+            print(f"保存模型到本地: {local_model_dir}")
+            os.makedirs(local_model_dir, exist_ok=True)
+            self.tokenizer.save_pretrained(local_model_dir)
+            self.base_model.save_pretrained(local_model_dir)
+            print(f"模型已保存到: {local_model_dir}")
             
         except Exception as e:
-            print(f"从Hugging Face加载失败: {e}")
+            print(f"从HuggingFace缓存加载失败: {e}")
             
-            # 尝试从本地缓存加载
-            cache_dir = f"./models/qwen3-{self.model_size.lower()}"
+            # 第三步：从HuggingFace下载
             try:
-                if os.path.exists(cache_dir):
-                    self.tokenizer = AutoTokenizer.from_pretrained(cache_dir)
-                    self.base_model = AutoModelForCausalLM.from_pretrained(
-                        cache_dir,
-                        torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
-                        device_map="auto" if torch.cuda.is_available() else None
-                    )
-                    
-                    if self.tokenizer.pad_token is None:
-                        self.tokenizer.pad_token = self.tokenizer.eos_token
-                        self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
-                    
-                    print(f"从本地缓存加载{self.model_size}模型成功")
-                else:
-                    raise FileNotFoundError("本地缓存也不存在")
-                    
-            except Exception as e2:
-                print(f"本地加载也失败: {e2}")
-                print(f"正在下载{self.model_size}模型...")
+                print(f"正在从HuggingFace下载{self.model_size}模型...")
                 
-                # 创建缓存目录并下载
-                os.makedirs(cache_dir, exist_ok=True)
-                self.tokenizer = AutoTokenizer.from_pretrained(self.model_name_hf, cache_dir=cache_dir)
+                self.tokenizer = AutoTokenizer.from_pretrained(
+                    self.model_name_hf,
+                    force_download=True
+                )
                 self.base_model = AutoModelForCausalLM.from_pretrained(
                     self.model_name_hf,
-                    cache_dir=cache_dir,
+                    force_download=True,
                     torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
                     device_map="auto" if torch.cuda.is_available() else None
                 )
@@ -110,10 +118,15 @@ class Qwen3LoRAUniversal(BaseQwenModel):
                     self.tokenizer.pad_token = self.tokenizer.eos_token
                     self.tokenizer.pad_token_id = self.tokenizer.eos_token_id
                 
-                # 保存到本地
-                self.tokenizer.save_pretrained(cache_dir)
-                self.base_model.save_pretrained(cache_dir)
-                print(f"{self.model_size}模型下载并保存到: {cache_dir}")
+                # 保存到本地models目录
+                os.makedirs(local_model_dir, exist_ok=True)
+                self.tokenizer.save_pretrained(local_model_dir)
+                self.base_model.save_pretrained(local_model_dir)
+                print(f"{self.model_size}模型下载并保存到: {local_model_dir}")
+                
+            except Exception as e2:
+                print(f"从HuggingFace下载也失败: {e2}")
+                raise RuntimeError(f"无法加载{self.model_size}模型，所有方法都失败了")
     
     def _create_instruction_data(self, data: List[Tuple[str, int]]) -> Dataset:
         """创建指令格式的训练数据"""