generate-subtitles-for-videos

Sleeping

App Files Files Community

csukuangfj commited on Aug 17

Commit

15cb938

1 Parent(s): b41531e

support url

Browse files

Files changed (1) hide show

app.py +61 -0

app.py CHANGED Viewed

@@ -133,6 +133,24 @@ def process_uploaded_audio_file(
     return process(language, repo_id, add_punctuation, in_filename)
 def process(language: str, repo_id: str, add_punctuation: str, in_filename: str):
     logging.info(f"add_punctuation: {add_punctuation}")
     recognizer = get_pretrained_model(repo_id)
@@ -145,6 +163,7 @@ def process(language: str, repo_id: str, add_punctuation: str, in_filename: str)
         or "korean" in repo_id
         or "vosk-model" in repo_id
         or "asr-gigaspeech2-th-zipformer" in repo_id
     ):
         add_punctuation = "No"
@@ -245,6 +264,32 @@ with demo:
                 label="Recognized speech from uploaded audio file (all in one)"
             )
         upload_video_button.click(
             process_uploaded_video_file,
             inputs=[
@@ -278,6 +323,22 @@ with demo:
             ],
         )
     gr.Markdown(description)
 if __name__ == "__main__":

     return process(language, repo_id, add_punctuation, in_filename)
+def process_url(
+    language: str,
+    repo_id: str,
+    add_punctuation: str,
+    url: str,
+):
+    MyPrint(f"Processing URL: {url}")
+    with tempfile.NamedTemporaryFile() as f:
+        urllib.request.urlretrieve(url, f.name)
+        return process(
+            language,
+            repo_id,
+            add_punctuation,
+            in_filename,
+        )
 def process(language: str, repo_id: str, add_punctuation: str, in_filename: str):
     logging.info(f"add_punctuation: {add_punctuation}")
     recognizer = get_pretrained_model(repo_id)
         or "korean" in repo_id
         or "vosk-model" in repo_id
         or "asr-gigaspeech2-th-zipformer" in repo_id
+        or "parakeet-tdt-0.6b-v" in repo_id
     ):
         add_punctuation = "No"
                 label="Recognized speech from uploaded audio file (all in one)"
             )
+        with gr.TabItem("Audio from URL"):
+            url_textbox = gr.Textbox(
+                max_lines=1,
+                placeholder="URL to an audio file",
+                label="URL",
+                interactive=True,
+            )
+            url_button = gr.Button("Submit for recognition")
+            output_srt_file_audio_url = gr.File(
+                label="Generated subtitles", show_label=True
+            )
+            output_srt_file_audio_url = gr.File(
+                label="Generated subtitles", show_label=True
+            )
+            output_info_audio_url = gr.HTML(label="Info")
+            output_textbox_audio_url = gr.Textbox(
+                label="Recognized speech from audio URL (srt format)"
+            )
+            all_output_textbox_audio_url = gr.Textbox(
+                label="Recognized speech from audio URL (all in one)"
+            )
         upload_video_button.click(
             process_uploaded_video_file,
             inputs=[
             ],
         )
+        url_button.click(
+            process_url,
+            inputs=[
+                language_radio,
+                model_dropdown,
+                punct_radio,
+                url_textbox,
+            ],
+            outputs=[
+                output_srt_file_audio_url,
+                output_info_audio_url,
+                output_textbox_audio_url,
+                all_output_textbox_audio_url,
+            ],
+        )
     gr.Markdown(description)
 if __name__ == "__main__":