Spaces:

Eliot0110
/

Travel_Assistant

Sleeping

App Files Files Community

Eliot0110 commited on Aug 4

Commit

a4da6d3

1 Parent(s): 8bacbbf

fix: 修复缓存权限和根路径404问题

Browse files

Files changed (1) hide show

modules/ai_model.py +44 -14

modules/ai_model.py CHANGED Viewed

@@ -15,6 +15,9 @@ class AIModel:
         self.model_name = model_name
         self.model = None
         self.processor = None
         self._initialize_model()
     def _setup_cache_dirs(self):
@@ -30,43 +33,70 @@ class AIModel:
         log.info(f"设置缓存目录: {cache_dir}")
     def _authenticate_hf(self):
         try:
-            # 从环境变量获取HF token
-            hf_token = os.getenv("Assitant_tocken")
-            if hf_token:
                 cache_dir = "/app/.cache/huggingface"
-                login(token=hf_token, add_to_git_credential=False)
                 log.info("✅ HuggingFace 认证成功")
             else:
-                log.warning("⚠️ 未找到 HuggingFace token，可能无法访问受限模型")
         except Exception as e:
             log.error(f"❌ HuggingFace 认证失败: {e}")
     def _initialize_model(self):
-        """初始化Gemma模型 - 基于官方调用方式"""
         try:
             log.info(f"正在加载模型: {self.model_name}")
-            hf_token = self._authenticate_hf()
             cache_dir = "/app/.cache/huggingface"
             self.model = Gemma3nForConditionalGeneration.from_pretrained(
                 self.model_name,
                 device_map="auto",
                 torch_dtype=torch.bfloat16,
-                cache_dir=cache_dir,
-                trust_remote_code=True
             ).eval()
             self.processor = AutoProcessor.from_pretrained(
                 self.model_name,
                 trust_remote_code=True,
-                cache_dir=cache_dir,
-                tocken=hf_token
             )
             log.info("✅ Gemma AI 模型初始化成功")

         self.model_name = model_name
         self.model = None
         self.processor = None
+        # 设置缓存目录
+        self._setup_cache_dirs()
         self._initialize_model()
     def _setup_cache_dirs(self):
         log.info(f"设置缓存目录: {cache_dir}")
     def _authenticate_hf(self):
+        """HuggingFace认证"""
         try:
+            # 检查所有可能的环境变量
+            assitant_token = os.getenv("Assitant_tocken")
+            hf_token = os.getenv("HUGGINGFACE_HUB_TOKEN")
+            hf_token_alt = os.getenv("HF_TOKEN")
+            log.info("=== 环境变量调试 ===")
+            log.info(f"Assitant_tocken: {'存在' if assitant_token else '不存在'}")
+            log.info(f"HUGGINGFACE_HUB_TOKEN: {'存在' if hf_token else '不存在'}")
+            log.info(f"HF_TOKEN: {'存在' if hf_token_alt else '不存在'}")
+            # 使用找到的token
+            token_to_use = assitant_token or hf_token or hf_token_alt
+            if token_to_use:
+                log.info(f"使用token: {token_to_use[:10]}...")
+                # 设置缓存目录用于认证
                 cache_dir = "/app/.cache/huggingface"
+                login(token=token_to_use, add_to_git_credential=False)
                 log.info("✅ HuggingFace 认证成功")
+                return token_to_use
             else:
+                log.error("❌ 未找到任何有效的 HuggingFace token")
+                return None
         except Exception as e:
             log.error(f"❌ HuggingFace 认证失败: {e}")
+            return None
     def _initialize_model(self):
+        """初始化Gemma模型"""
         try:
             log.info(f"正在加载模型: {self.model_name}")
+            # 先进行认证并获取token
+            token = self._authenticate_hf()
+            if not token:
+                log.error("❌ 无法获取有效token，模型加载失败")
+                self.model = None
+                self.processor = None
+                return
+            # 设置缓存目录
             cache_dir = "/app/.cache/huggingface"
             self.model = Gemma3nForConditionalGeneration.from_pretrained(
                 self.model_name,
                 device_map="auto",
                 torch_dtype=torch.bfloat16,
+                trust_remote_code=True,
+                token=token,
+                cache_dir=cache_dir,  # 明确指定缓存目录
+                use_auth_token=token
             ).eval()
             self.processor = AutoProcessor.from_pretrained(
                 self.model_name,
                 trust_remote_code=True,
+                token=token,
+                cache_dir=cache_dir,  # 明确指定缓存目录
+                use_auth_token=token
             )
             log.info("✅ Gemma AI 模型初始化成功")