Spaces:

merve
/

chameleon-7b

Running on Zero

merve HF Staff commited on Jul 19, 2024

Commit

c2c71b6

verified ·

1 Parent(s): 9cd1b54

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-from transformers import ChameleonProcessor, ChameleonForConditionalGeneration, TextIteratorStreamer
 import torch
 from PIL import Image
 import requests
@@ -9,7 +9,14 @@ from gradio import FileData
 import time
 processor = ChameleonProcessor.from_pretrained("facebook/chameleon-30b")
-model = ChameleonForConditionalGeneration.from_pretrained("facebook/chameleon-30b", torch_dtype=torch.float16).to("cuda")
 @spaces.GPU
 def bot_streaming(message, history):

+from transformers import ChameleonProcessor, ChameleonForConditionalGeneration, TextIteratorStreamer, BitsAndBytesConfig
 import torch
 from PIL import Image
 import requests
 import time
 processor = ChameleonProcessor.from_pretrained("facebook/chameleon-30b")
+quantization_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_quant_type="nf4",
+    bnb_4bit_compute_dtype=torch.float16,
+)
+model = ChameleonForConditionalGeneration.from_pretrained("facebook/chameleon-30b", quantization_config=quantization_config).to("cuda")
 @spaces.GPU
 def bot_streaming(message, history):