Spaces:

X-iZhang
/

CCD

Running

X-iZhang commited on Oct 10

Commit

4717b60

verified ·

1 Parent(s): 01736c5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -61,24 +61,24 @@ def safe_load_pretrained_model(model_path, model_base=None, model_name=None, **k
         model_path, model_base, model_name, **kwargs
     )
-    # # Fix tokenizer pad_token_id if it's None (common issue with Llama 3 models)
-    # if tokenizer.pad_token_id is None:
-    #     if tokenizer.eos_token_id is not None:
-    #         # tokenizer.pad_token_id = tokenizer.eos_token_id
-    #         tokenizer.pad_token_id = 1
-    #         print(f'[INFO] Set pad_token_id to eos_token_id: {tokenizer.eos_token_id}')
-    #     else:
-    #         tokenizer.pad_token_id = 0
-    #         print('[INFO] Set pad_token_id to 0 (default)')
-    # Also ensure pad_token is set (Llama 3 specific) - CRITICAL for output
-    if tokenizer.pad_token is None:
-        if tokenizer.eos_token is not None:
             tokenizer.pad_token_id = 128001
-            print(f'[INFO] Set pad_token to eos_token: {tokenizer.pad_token_id}')
         else:
-            tokenizer.add_special_tokens({'pad_token': '[PAD]'})
-            print('[INFO] Added [PAD] token to tokenizer')
     # Set padding_side to left for Llama 3 (prevents empty generation)
     if hasattr(tokenizer, 'padding_side'):

         model_path, model_base, model_name, **kwargs
     )
+    # Fix tokenizer pad_token_id if it's None (common issue with Llama 3 models)
+    if tokenizer.pad_token_id is None:
+        if tokenizer.eos_token_id is not None:
+            # tokenizer.pad_token_id = tokenizer.eos_token_id
             tokenizer.pad_token_id = 128001
+            print(f'[INFO] Set pad_token_id to eos_token_id: {tokenizer.pad_token_id}')
         else:
+            tokenizer.pad_token_id = 0
+            print('[INFO] Set pad_token_id to 0 (default)')
+    # # Also ensure pad_token is set (Llama 3 specific) - CRITICAL for output
+    # if tokenizer.pad_token is None:
+    #     if tokenizer.eos_token is not None:
+    #         tokenizer.pad_token_id = tokenizer.eos_token
+    #         print(f'[INFO] Set pad_token to eos_token: {tokenizer.pad_token_id}')
+    #     else:
+    #         tokenizer.add_special_tokens({'pad_token': '[PAD]'})
+    #         print('[INFO] Added [PAD] token to tokenizer')
     # Set padding_side to left for Llama 3 (prevents empty generation)
     if hasattr(tokenizer, 'padding_side'):