Spaces:

MERaLiON
/

SeaEval_Leaderboard

Running

zhuohan-7 commited on Nov 22, 2024

Commit

ab58981

verified ·

1 Parent(s): aa4435c

Upload folder using huggingface_hub

Files changed (2) hide show

app/draw_diagram.py CHANGED Viewed

@@ -7,20 +7,8 @@ import pandas as pd
 from model_information import get_dataframe
 info_df = get_dataframe()
-# path = "./style/Leaderboard-Rename-SeaEval.csv"
-# info_df = pd.read_csv(path).dropna(axis=0)
-#Model2Detail = {
-#    {'cross_mmlu': 'Cross-MMLU'}
-#}
 def draw(folder_name, category_one, category_two, sort, num_sort, model_size_range):
     folder = f"./results/{folder_name}/"
@@ -77,16 +65,17 @@ def draw(folder_name, category_one, category_two, sort, num_sort, model_size_ran
     max_value = round(max(chart_data.iloc[:, 1]) + 0.1*max(chart_data.iloc[:, 1]), 1)
     display_names = {
-        'cross_mmlu'        : 'Cross-MMLU',
-        'cross_logiqa'      : 'Cross-LogiQA',
-        'cross_xquad'       : 'Cross-XQUAD',
-        'sg_eval'           : 'SG EVAL',
-        'sg_eval_v1_cleaned': 'SG EVAL V1 Cleaned',
-        'sg_eval_v2_mcq'    : 'SG EVAL V2 MCQ',
-        'sg_eval_v2_open'   : 'SG EVAL V2 Open Ended',
-        'us_eval'           : 'US EVAL',
-        'cn_eval'           : 'CN EVAL',
-        'ph_eval'           : 'PH EVAL'
     }
     data_columns = [i for i in chart_data.columns if i not in ['Model', 'model_show']]

 from model_information import get_dataframe
 info_df = get_dataframe()
 def draw(folder_name, category_one, category_two, sort, num_sort, model_size_range):
     folder = f"./results/{folder_name}/"
     max_value = round(max(chart_data.iloc[:, 1]) + 0.1*max(chart_data.iloc[:, 1]), 1)
     display_names = {
+        'cross_mmlu'          : 'Cross-MMLU',
+        'cross_logiqa'        : 'Cross-LogiQA',
+        'cross_xquad'         : 'Cross-XQUAD',
+        'cross_mmlu_no_prompt': 'Cross-MMLU-No-Prompt',
+        'sg_eval'             : 'SG EVAL',
+        'sg_eval_v1_cleaned'  : 'SG EVAL V1 Cleaned',
+        'sg_eval_v2_mcq'      : 'SG EVAL V2 MCQ',
+        'sg_eval_v2_open'     : 'SG EVAL V2 Open Ended',
+        'us_eval'             : 'US EVAL',
+        'cn_eval'             : 'CN EVAL',
+        'ph_eval'             : 'PH EVAL'
     }
     data_columns = [i for i in chart_data.columns if i not in ['Model', 'model_show']]

app/pages.py CHANGED Viewed

@@ -76,7 +76,12 @@ def cross_lingual_consistency():
     st.title("Task: Cross-Lingual Consistency")
     filters_levelone = ['Zero Shot', 'Few Shot']
-    filters_leveltwo = ['Cross-MMLU', 'Cross-XQUAD', 'Cross-LogiQA']
     category_one_dict = {
                         'Zero Shot': 'zero_shot',
@@ -86,7 +91,8 @@ def cross_lingual_consistency():
     category_two_dict = {
                         'Cross-MMLU'  : 'cross_mmlu',
                         'Cross-XQUAD' : 'cross_xquad',
-                        'Cross-LogiQA': 'cross_logiqa'
                          }
     left, center, middle, _, right = st.columns([0.2, 0.2, 0.2, 0.2 ,0.2])

     st.title("Task: Cross-Lingual Consistency")
     filters_levelone = ['Zero Shot', 'Few Shot']
+    filters_leveltwo = [
+                        'Cross-MMLU',
+                        'Cross-XQUAD',
+                        'Cross-LogiQA',
+                        'Cross-MMLU-No-Prompt',
+                        ]
     category_one_dict = {
                         'Zero Shot': 'zero_shot',
     category_two_dict = {
                         'Cross-MMLU'  : 'cross_mmlu',
                         'Cross-XQUAD' : 'cross_xquad',
+                        'Cross-LogiQA': 'cross_logiqa',
+                        'Cross-MMLU-No-Prompt': 'cross_mmlu_no_prompt'
                          }
     left, center, middle, _, right = st.columns([0.2, 0.2, 0.2, 0.2 ,0.2])