Spaces:

Gradio-Blocks
/

poor-mans-duplex

Runtime error

App Files Files Community

versae commited on May 27, 2022

Commit

a4bdb54

1 Parent(s): 1eb7da1

Update duplex.py

Browse files

Files changed (1) hide show

duplex.py +7 -6

duplex.py CHANGED Viewed

@@ -19,6 +19,7 @@ from transformers import pipeline, AutoModelForCTC, Wav2Vec2Processor, Wav2Vec2P
 DEBUG = os.environ.get("DEBUG", "false")[0] in "ty1"
 MAX_LENGTH = int(os.environ.get("MAX_LENGTH", 1024))
 DEFAULT_LANG = os.environ.get("DEFAULT_LANG", "English")
 HEADER = """
 # Poor Man's Duplex
@@ -34,8 +35,8 @@ FOOTER = """
 """.strip()
 asr_model_name_es = "jonatasgrosman/wav2vec2-large-xlsr-53-spanish"
-model_instance_es = AutoModelForCTC.from_pretrained(asr_model_name_es)
-processor_es = Wav2Vec2ProcessorWithLM.from_pretrained(asr_model_name_es)
 asr_es = pipeline(
     "automatic-speech-recognition",
     model=model_instance_es,
@@ -44,7 +45,7 @@ asr_es = pipeline(
     decoder=processor_es.decoder
 )
 tts_model_name = "facebook/tts_transformer-es-css10"
-speak_es = gr.Interface.load(f"huggingface/{tts_model_name}")
 transcribe_es = lambda input_file: asr_es(input_file, chunk_length_s=5, stride_length_s=1)["text"]
 def generate_es(text, **kwargs):
     # max_length=100, top_k=100, top_p=50, temperature=0.95, do_sample=True, do_clean=True
@@ -68,13 +69,13 @@ asr_en = pipeline(
     decoder=processor_en.decoder
 )
 tts_model_name = "facebook/fastspeech2-en-ljspeech"
-speak_en = gr.Interface.load(f"huggingface/{tts_model_name}")
 transcribe_en = lambda input_file: asr_en(input_file, chunk_length_s=5, stride_length_s=1)["text"]
-generate_iface = gr.Interface.load("huggingface/EleutherAI/gpt-j-6B")
 empty_audio = 'empty.flac'
 sf.write(empty_audio, [], 16000)
-deuncase = gr.Interface.load("huggingface/pere/DeUnCaser")
 def generate_en(text, **kwargs):
     response = generate_iface(text)

 DEBUG = os.environ.get("DEBUG", "false")[0] in "ty1"
 MAX_LENGTH = int(os.environ.get("MAX_LENGTH", 1024))
 DEFAULT_LANG = os.environ.get("DEFAULT_LANG", "English")
+HF_AUTH_TOKEN = os.environ.get("HF_AUTH_TOKEN", None)
 HEADER = """
 # Poor Man's Duplex
 """.strip()
 asr_model_name_es = "jonatasgrosman/wav2vec2-large-xlsr-53-spanish"
+model_instance_es = AutoModelForCTC.from_pretrained(asr_model_name_es, use_auth_token=HF_AUTH_TOKEN)
+processor_es = Wav2Vec2ProcessorWithLM.from_pretrained(asr_model_name_es, use_auth_token=HF_AUTH_TOKEN)
 asr_es = pipeline(
     "automatic-speech-recognition",
     model=model_instance_es,
     decoder=processor_es.decoder
 )
 tts_model_name = "facebook/tts_transformer-es-css10"
+speak_es = gr.Interface.load(f"huggingface/{tts_model_name}", api_key=HF_AUTH_TOKEN)
 transcribe_es = lambda input_file: asr_es(input_file, chunk_length_s=5, stride_length_s=1)["text"]
 def generate_es(text, **kwargs):
     # max_length=100, top_k=100, top_p=50, temperature=0.95, do_sample=True, do_clean=True
     decoder=processor_en.decoder
 )
 tts_model_name = "facebook/fastspeech2-en-ljspeech"
+speak_en = gr.Interface.load(f"huggingface/{tts_model_name}", api_key=HF_AUTH_TOKEN)
 transcribe_en = lambda input_file: asr_en(input_file, chunk_length_s=5, stride_length_s=1)["text"]
+generate_iface = gr.Interface.load("huggingface/EleutherAI/gpt-j-6B", api_key=HF_AUTH_TOKEN)
 empty_audio = 'empty.flac'
 sf.write(empty_audio, [], 16000)
+deuncase = gr.Interface.load("huggingface/pere/DeUnCaser", api_key=HF_AUTH_TOKEN)
 def generate_en(text, **kwargs):
     response = generate_iface(text)