Spaces:

hf-audio
/

open_asr_leaderboard

Running on CPU Upgrade

App Files Files Community

Steveeeeeeen HF Staff commited on Oct 6

Commit

c0e34fb

verified ·

1 Parent(s): 1e874c9

add longform tab

Browse files

Files changed (1) hide show

init.py +41 -17

init.py CHANGED Viewed

@@ -6,8 +6,10 @@ from huggingface_hub import HfApi, Repository
 TOKEN_HUB = os.environ.get("TOKEN_HUB", None)
 QUEUE_REPO = os.environ.get("QUEUE_REPO", None)
 QUEUE_REPO_MULTI = os.environ.get("QUEUE_REPO_MULTI", None)
 QUEUE_PATH = os.environ.get("QUEUE_PATH", None)
 QUEUE_PATH_MULTI = os.environ.get("QUEUE_PATH_MULTI", None)
 hf_api = HfApi(
     endpoint="https://huggingface.co",
@@ -45,8 +47,11 @@ def load_all_info_from_dataset_hub():
     # Load multilingual data in the same way
     multilingual_csv_results = load_multilingual_data()
-    return eval_queue_repo, requested_models, csv_results, multilingual_csv_results
 def load_multilingual_data():
     """Load multilingual evaluation data from CSV"""
@@ -64,7 +69,7 @@ def load_multilingual_data():
                     repo_type="dataset",
                 )
                 multilingual_repo.git_pull()
-                multilingual_csv = get_multilingual_csv_with_results(multilingual_queue_path)
             except Exception as e:
                 print(f"Failed to pull from multilingual repo: {e}")
                 multilingual_csv = None
@@ -74,13 +79,46 @@ def load_multilingual_data():
         # Fallback to local file
         if multilingual_csv is None:
             print("Using local multilingual CSV file.")
-            multilingual_csv = get_multilingual_csv_with_results(".")
         return multilingual_csv
     except Exception as e:
         print(f"Error loading multilingual data: {e}")
         return None
 def upload_file(requested_model_name, path_or_fileobj):
     dest_repo_file = Path(EVAL_REQUESTS_PATH) / path_or_fileobj.name
@@ -106,20 +144,6 @@ def get_csv_with_results(directory):
         return None
     return latest[0]
-def get_multilingual_csv_with_results(directory):
-    """Get multilingual CSV results file"""
-    directory = Path(directory)
-    multilingual_csv_files = list(directory.glob("multilingual_results_latest.csv"))
-    if len(multilingual_csv_files) != 1:
-        # Try local directory as fallback
-        local_multilingual = Path("multilingual_results_latest.csv")
-        if local_multilingual.exists():
-            return local_multilingual
-        return None
-    return multilingual_csv_files[0]
 def is_model_on_hub(model_name, revision="main") -> bool:
     try:
         model_name = model_name.replace(" ","")

 TOKEN_HUB = os.environ.get("TOKEN_HUB", None)
 QUEUE_REPO = os.environ.get("QUEUE_REPO", None)
 QUEUE_REPO_MULTI = os.environ.get("QUEUE_REPO_MULTI", None)
+QUEUE_REPO_LONGFORM = os.environ.get("QUEUE_REPO_LONGFORM", None)
 QUEUE_PATH = os.environ.get("QUEUE_PATH", None)
 QUEUE_PATH_MULTI = os.environ.get("QUEUE_PATH_MULTI", None)
+QUEUE_PATH_LONGFORM = os.environ.get("QUEUE_PATH_LONGFORM", None)
 hf_api = HfApi(
     endpoint="https://huggingface.co",
     # Load multilingual data in the same way
     multilingual_csv_results = load_multilingual_data()
+    # Load longform data in the same way
+    longform_csv_results = load_longform_data()
+    return eval_queue_repo, requested_models, csv_results, multilingual_csv_results, longform_csv_results
 def load_multilingual_data():
     """Load multilingual evaluation data from CSV"""
                     repo_type="dataset",
                 )
                 multilingual_repo.git_pull()
+                multilingual_csv = get_csv_with_results(multilingual_queue_path)
             except Exception as e:
                 print(f"Failed to pull from multilingual repo: {e}")
                 multilingual_csv = None
         # Fallback to local file
         if multilingual_csv is None:
             print("Using local multilingual CSV file.")
+            multilingual_csv = get_csv_with_results(".")
         return multilingual_csv
     except Exception as e:
         print(f"Error loading multilingual data: {e}")
         return None
+def load_longform_data():
+    """Load longform evaluation data from CSV"""
+    longform_queue_path = QUEUE_PATH_LONGFORM
+    try:
+        # Try to get from dedicated longform HF repo first
+        if TOKEN_HUB is not None:
+            print("Pulling longform evaluation data.")
+            try:
+                longform_repo = Repository(
+                    local_dir=longform_queue_path,
+                    clone_from=QUEUE_REPO_LONGFORM,
+                    use_auth_token=TOKEN_HUB,
+                    repo_type="dataset",
+                )
+                longform_repo.git_pull()
+                longform_csv = get_csv_with_results(longform_queue_path)
+            except Exception as e:
+                print(f"Failed to pull from longform repo: {e}")
+                longform_csv = None
+        else:
+            longform_csv = None
+        # Fallback to local file
+        if longform_csv is None:
+            print("Using local longform CSV file.")
+            longform_csv = get_csv_with_results(".")
+        return longform_csv
+    except Exception as e:
+        print(f"Error loading longform data: {e}")
+        return None
 def upload_file(requested_model_name, path_or_fileobj):
     dest_repo_file = Path(EVAL_REQUESTS_PATH) / path_or_fileobj.name
         return None
     return latest[0]
 def is_model_on_hub(model_name, revision="main") -> bool:
     try:
         model_name = model_name.replace(" ","")