grady

Sleeping

bstraehle commited on May 28

Commit

8222c81

verified ·

1 Parent(s): 50a639b

Update utils.py

Files changed (1) hide show

utils.py CHANGED Viewed

@@ -1,38 +1,8 @@
 import os
 import pandas as pd
-from datasets import load_dataset
 from docx import Document
-from huggingface_hub import login
 from pptx import Presentation
-def get_questions():
-    token = os.getenv("HF_TOKEN")
-    login(token)
-    dataset = load_dataset("gaia-benchmark/GAIA", "2023_all", split="validation", trust_remote_code=True)
-    df = pd.DataFrame(dataset)
-    result_1=[]
-    result_2=[]
-    result_3=[]
-    for index, row in df.iterrows():
-        if row["Level"] == 1:
-            result_1.append([row["Question"], row["Level"], row["Final answer"], row["file_name"]])
-        if row["Level"] == 2:
-            result_2.append([row["Question"], row["Level"], row["Final answer"], row["file_name"]])
-        if row["Level"] == 3:
-            print(row["Question"])
-            print(row["Level"])
-            print(row["Final answer"])
-            print(row["file_name"])
-            result_3.append([row["Question"], row["Level"], row["Final answer"], row["file_name"]])
-    return result_1, result_2, result_3
-"""
 def get_questions(file_path, level):
     df = pd.read_json(file_path, lines=True)
@@ -45,7 +15,6 @@ def get_questions(file_path, level):
         result.append([row["Question"], row["Level"], row["Final answer"], row["file_name"]])
     return result
-"""
 def is_ext(file_path, ext):
     return os.path.splitext(file_path)[1].lower() == ext.lower()

 import os
 import pandas as pd
 from docx import Document
 from pptx import Presentation
 def get_questions(file_path, level):
     df = pd.read_json(file_path, lines=True)
         result.append([row["Question"], row["Level"], row["Final answer"], row["file_name"]])
     return result
 def is_ext(file_path, ext):
     return os.path.splitext(file_path)[1].lower() == ext.lower()