H2H-eval-comparator

Sleeping

rohansampath commited on Feb 26

Commit

a38f44d

verified ·

1 Parent(s): 9a32296

Update dataset_previews.py

Files changed (1) hide show

dataset_previews.py CHANGED Viewed

@@ -18,22 +18,21 @@ def calculate_dataset_statistics():
         test_df, val_df = load_mmlu_pro()
         test_df = test_df.sort_values(['category', 'question_id'])
-        print ("QUESTIONS TOT", len(test_df))
         all_subjects = sorted(test_df['category'].unique())
         # Calculate total questions and questions per subject
-        total_questions = 0
         subject_counts = {}
         # Count options per question
         options_counts = []
         for subject in all_subjects:
             test_samples = test_df[test_df['category'] == subject]
             num_questions = len(test_samples)
             subject_counts[subject] = num_questions
-            total_questions += num_questions
             print("Test_samples", test_samples[0], "\t Num Questions:", num_questions)
             # Count options for each question

         test_df, val_df = load_mmlu_pro()
         test_df = test_df.sort_values(['category', 'question_id'])
         all_subjects = sorted(test_df['category'].unique())
         # Calculate total questions and questions per subject
+        total_questions = len(test_df)
         subject_counts = {}
         # Count options per question
         options_counts = []
         for subject in all_subjects:
+            print("Subject", subject)
             test_samples = test_df[test_df['category'] == subject]
             num_questions = len(test_samples)
             subject_counts[subject] = num_questions
             print("Test_samples", test_samples[0], "\t Num Questions:", num_questions)
             # Count options for each question