Spaces:

yentinglin
/

Taiwan-LLaMa2

Running

yentinglin commited on Aug 10, 2023

Commit

ef219f6

1 Parent(s): 8c8e27f

Upload 2 files

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,16 +1,17 @@
-import random
 import time
 import os
 import gradio as gr
 from text_generation import Client
 from conversation import get_default_conv_template
 endpoint_url = os.environ.get("ENDPOINT_URL", "http://127.0.0.1:8080")
 client = Client(endpoint_url, timeout=120)
 eos_token = "</s>"
 with gr.Blocks() as demo:
     chatbot = gr.Chatbot()
@@ -27,6 +28,10 @@ with gr.Blocks() as demo:
             conv.append_message(roles['human'], user)
             conv.append_message(roles["gpt"], bot)
         msg = conv.get_prompt()
         history[-1][1] = ""
         for response in client.generate_stream(

 import time
 import os
 import gradio as gr
 from text_generation import Client
 from conversation import get_default_conv_template
+from transformers import AutoTokenizer
 endpoint_url = os.environ.get("ENDPOINT_URL", "http://127.0.0.1:8080")
 client = Client(endpoint_url, timeout=120)
 eos_token = "</s>"
+max_prompt_length = 4000
+tokenizer = AutoTokenizer.from_pretrained("yentinglin/Taiwan-LLaMa-v1.0")
 with gr.Blocks() as demo:
     chatbot = gr.Chatbot()
             conv.append_message(roles['human'], user)
             conv.append_message(roles["gpt"], bot)
         msg = conv.get_prompt()
+        prompt_tokens = tokenizer.encode(msg)
+        length_of_prompt = len(prompt_tokens)
+        if length_of_prompt > max_prompt_length:
+            msg = tokenizer.decode(prompt_tokens[-max_prompt_length:])
         history[-1][1] = ""
         for response in client.generate_stream(

requirements.txt CHANGED Viewed