SmolVLM2

Build error

merve HF Staff commited on Feb 13

Commit

e4e6d49

verified ·

1 Parent(s): de4762a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,7 +4,7 @@ from threading import Thread
 import re
 import time
 import torch
-import spaces
 #import subprocess
 #subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
@@ -16,7 +16,7 @@ model = AutoModelForVision2Seq.from_pretrained("HuggingFaceTB/SmolVLM2-500M-Inst
                                                torch_dtype=torch.bfloat16).to("cuda:0")
-@spaces.GPU
 def model_inference(
     input_dict, history, max_tokens
 ):

 import re
 import time
 import torch
+#import spaces
 #import subprocess
 #subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
                                                torch_dtype=torch.bfloat16).to("cuda:0")
+#@spaces.GPU
 def model_inference(
     input_dict, history, max_tokens
 ):