Spaces:

SWE-Arena
/

SWE-Review

Running

App Files Files Community

zhiminy commited on 7 days ago

Commit

d454e42

1 Parent(s): dcdb282

add

Browse files

Files changed (2) hide show

app.py +205 -8
msr.py +367 -9

app.py CHANGED Viewed

@@ -28,6 +28,7 @@ load_dotenv()
 AGENTS_REPO = "SWE-Arena/swe_agents"  # HuggingFace dataset for agent metadata
 REVIEW_METADATA_REPO = "SWE-Arena/review_metadata"  # HuggingFace dataset for review metadata
 LEADERBOARD_TIME_FRAME_DAYS = 180  # Time frame for constructing leaderboard
 UPDATE_TIME_FRAME_DAYS = 30  # Time frame for mining new reviews
@@ -1694,6 +1695,99 @@ def save_agent_to_hf(data):
         return False
 # =============================================================================
@@ -1709,6 +1803,7 @@ def update_all_agents_incremental():
     2. Fetch new reviews from the last UPDATE_TIME_FRAME_DAYS days
     3. Save all updated/new metadata back to HuggingFace
     4. Reload statistics from updated metadata
     """
     print(f"\n{'='*80}")
     print(f"🕛 Incremental Update started at {datetime.now(timezone.utc).isoformat()}")
@@ -1719,14 +1814,24 @@ def update_all_agents_incremental():
         fetch_and_update_weekly_reviews()
         # Reload statistics from updated metadata
-        print(f"\n📋 Reloading statistics from updated review metadata...")
-        construct_leaderboard_from_metadata()
         print(f"\n{'='*80}")
         print(f"📊 Update Summary:")
         print(f"   ✓ Updated existing review statuses")
         print(f"   ✓ Fetched new reviews from last {UPDATE_TIME_FRAME_DAYS} days")
-        print(f"   ✓ Statistics reloaded")
         print(f"{'='*80}")
         print(f"\n✅ Incremental Update completed at {datetime.now(timezone.utc).isoformat()}")
@@ -1797,7 +1902,36 @@ def create_monthly_metrics_plot(top_n=None):
     Args:
         top_n: If specified, only show metrics for the top N agents by total reviews.
     """
-    metrics = calculate_monthly_metrics_by_agent(top_n=top_n)
     if not metrics['agents'] or not metrics['months']:
         # Return an empty figure with a message
@@ -1919,11 +2053,20 @@ def create_monthly_metrics_plot(top_n=None):
 def get_leaderboard_dataframe():
     """
-    Construct leaderboard from review metadata and convert to pandas DataFrame for display.
     Returns formatted DataFrame sorted by total reviews.
     """
-    # Construct leaderboard from metadata
-    cache_dict = construct_leaderboard_from_metadata()
     print(f"📊 Cache dict size: {len(cache_dict)}")
@@ -2021,6 +2164,16 @@ def submit_agent(identifier, agent_name, developer, website):
     if not save_agent_to_hf(submission):
         return "❌ Failed to save submission", get_leaderboard_dataframe()
     # Return success message - data will be populated by daily incremental updates
     return f"✅ Successfully submitted {agent_name}! Review data will be populated by the next daily incremental update.", get_leaderboard_dataframe()
@@ -2139,10 +2292,54 @@ def fetch_and_update_weekly_reviews():
             continue
 # =============================================================================
 # GRADIO APPLICATION
 # =============================================================================
 # Start APScheduler for incremental updates at 12:00 AM UTC every Monday
 scheduler = BackgroundScheduler(timezone="UTC")
 scheduler.add_job(
@@ -2156,7 +2353,7 @@ scheduler.start()
 print(f"\n{'='*80}")
 print(f"✓ Scheduler initialized successfully")
 print(f"⛏️  Mining schedule: Every Monday at 12:00 AM UTC")
-print(f"📥 On startup: Only loads cached data from HuggingFace (no mining)")
 print(f"{'='*80}\n")
 # Create Gradio interface

 AGENTS_REPO = "SWE-Arena/swe_agents"  # HuggingFace dataset for agent metadata
 REVIEW_METADATA_REPO = "SWE-Arena/review_metadata"  # HuggingFace dataset for review metadata
+LEADERBOARD_REPO = "SWE-Arena/swe_leaderboard"  # HuggingFace dataset for leaderboard data
 LEADERBOARD_TIME_FRAME_DAYS = 180  # Time frame for constructing leaderboard
 UPDATE_TIME_FRAME_DAYS = 30  # Time frame for mining new reviews
         return False
+def save_leaderboard_data_to_hf(leaderboard_dict, monthly_metrics):
+    """
+    Save leaderboard data and monthly metrics to HuggingFace dataset as swe-review.json.
+    Args:
+        leaderboard_dict: Dictionary of agent stats from construct_leaderboard_from_metadata()
+        monthly_metrics: Monthly metrics data from calculate_monthly_metrics_by_agent()
+    Returns:
+        bool: True if successful, False otherwise
+    """
+    try:
+        api = HfApi()
+        token = get_hf_token()
+        if not token:
+            raise Exception("No HuggingFace token found. Please set HF_TOKEN in your Space settings.")
+        filename = "swe-review.json"
+        # Combine leaderboard and monthly metrics
+        combined_data = {
+            'last_updated': datetime.now(timezone.utc).isoformat(),
+            'leaderboard': leaderboard_dict,
+            'monthly_metrics': monthly_metrics,
+            'metadata': {
+                'leaderboard_time_frame_days': LEADERBOARD_TIME_FRAME_DAYS,
+                'update_time_frame_days': UPDATE_TIME_FRAME_DAYS
+            }
+        }
+        # Save locally first
+        with open(filename, 'w') as f:
+            json.dump(combined_data, f, indent=2)
+        try:
+            # Upload to HuggingFace
+            upload_with_retry(
+                api=api,
+                path_or_fileobj=filename,
+                path_in_repo=filename,
+                repo_id=LEADERBOARD_REPO,
+                repo_type="dataset",
+                token=token
+            )
+            print(f"✓ Saved leaderboard data to HuggingFace: {filename}")
+            return True
+        finally:
+            # Always clean up local file, even if upload fails
+            if os.path.exists(filename):
+                os.remove(filename)
+    except Exception as e:
+        print(f"✗ Error saving leaderboard data: {str(e)}")
+        import traceback
+        traceback.print_exc()
+        return False
+def load_leaderboard_data_from_hf():
+    """
+    Load leaderboard data and monthly metrics from HuggingFace dataset.
+    Returns:
+        dict: Dictionary with 'leaderboard', 'monthly_metrics', and 'last_updated' keys
+              Returns None if file doesn't exist or error occurs
+    """
+    try:
+        token = get_hf_token()
+        filename = "swe-review.json"
+        # Download file
+        file_path = hf_hub_download(
+            repo_id=LEADERBOARD_REPO,
+            filename=filename,
+            repo_type="dataset",
+            token=token
+        )
+        # Load JSON data
+        with open(file_path, 'r') as f:
+            data = json.load(f)
+        last_updated = data.get('last_updated', 'Unknown')
+        print(f"✓ Loaded leaderboard data from HuggingFace (last updated: {last_updated})")
+        return data
+    except Exception as e:
+        print(f"⚠️ Could not load leaderboard data from HuggingFace: {str(e)}")
+        return None
 # =============================================================================
     2. Fetch new reviews from the last UPDATE_TIME_FRAME_DAYS days
     3. Save all updated/new metadata back to HuggingFace
     4. Reload statistics from updated metadata
+    5. Save leaderboard and monthly metrics to swe_leaderboard dataset
     """
     print(f"\n{'='*80}")
     print(f"🕛 Incremental Update started at {datetime.now(timezone.utc).isoformat()}")
         fetch_and_update_weekly_reviews()
         # Reload statistics from updated metadata
+        print(f"\n📋 Constructing leaderboard from updated review metadata...")
+        leaderboard_dict = construct_leaderboard_from_metadata()
+        # Calculate monthly metrics
+        print(f"\n📈 Calculating monthly metrics...")
+        monthly_metrics = calculate_monthly_metrics_by_agent()
+        # Save to HuggingFace leaderboard dataset
+        print(f"\n💾 Saving leaderboard data to HuggingFace...")
+        save_leaderboard_data_to_hf(leaderboard_dict, monthly_metrics)
         print(f"\n{'='*80}")
         print(f"📊 Update Summary:")
         print(f"   ✓ Updated existing review statuses")
         print(f"   ✓ Fetched new reviews from last {UPDATE_TIME_FRAME_DAYS} days")
+        print(f"   ✓ Leaderboard constructed with {len(leaderboard_dict)} agents")
+        print(f"   ✓ Monthly metrics calculated")
+        print(f"   ✓ Data saved to {LEADERBOARD_REPO}")
         print(f"{'='*80}")
         print(f"\n✅ Incremental Update completed at {datetime.now(timezone.utc).isoformat()}")
     Args:
         top_n: If specified, only show metrics for the top N agents by total reviews.
     """
+    # Try loading from saved dataset first
+    saved_data = load_leaderboard_data_from_hf()
+    if saved_data and 'monthly_metrics' in saved_data:
+        metrics = saved_data['monthly_metrics']
+        print(f"📈 Loaded monthly metrics from saved dataset")
+        # Apply top_n filter if specified
+        if top_n is not None and top_n > 0 and metrics.get('agents'):
+            # Calculate total reviews for each agent
+            agent_totals = []
+            for agent_name in metrics['agents']:
+                agent_data = metrics['data'].get(agent_name, {})
+                total_reviews = sum(agent_data.get('total_reviews', []))
+                agent_totals.append((agent_name, total_reviews))
+            # Sort by total reviews and take top N
+            agent_totals.sort(key=lambda x: x[1], reverse=True)
+            top_agents = [agent_name for agent_name, _ in agent_totals[:top_n]]
+            # Filter metrics to only include top agents
+            metrics = {
+                'agents': top_agents,
+                'months': metrics['months'],
+                'data': {agent: metrics['data'][agent] for agent in top_agents if agent in metrics['data']}
+            }
+    else:
+        # Fallback: calculate from metadata if saved data doesn't exist
+        print(f"📈 Saved data not available, calculating monthly metrics from metadata...")
+        metrics = calculate_monthly_metrics_by_agent(top_n=top_n)
     if not metrics['agents'] or not metrics['months']:
         # Return an empty figure with a message
 def get_leaderboard_dataframe():
     """
+    Load leaderboard from saved dataset and convert to pandas DataFrame for display.
+    Falls back to constructing from metadata if saved data is not available.
     Returns formatted DataFrame sorted by total reviews.
     """
+    # Try loading from saved dataset first
+    saved_data = load_leaderboard_data_from_hf()
+    if saved_data and 'leaderboard' in saved_data:
+        cache_dict = saved_data['leaderboard']
+        print(f"📊 Loaded leaderboard from saved dataset (last updated: {saved_data.get('last_updated', 'Unknown')})")
+    else:
+        # Fallback: construct from metadata if saved data doesn't exist
+        print(f"📊 Saved data not available, constructing leaderboard from metadata...")
+        cache_dict = construct_leaderboard_from_metadata()
     print(f"📊 Cache dict size: {len(cache_dict)}")
     if not save_agent_to_hf(submission):
         return "❌ Failed to save submission", get_leaderboard_dataframe()
+    # Reconstruct and save leaderboard data with new agent
+    try:
+        print(f"📊 Reconstructing leaderboard with new agent...")
+        leaderboard_dict = construct_leaderboard_from_metadata()
+        monthly_metrics = calculate_monthly_metrics_by_agent()
+        save_leaderboard_data_to_hf(leaderboard_dict, monthly_metrics)
+        print(f"✓ Leaderboard data updated")
+    except Exception as e:
+        print(f"⚠️ Failed to update leaderboard data: {str(e)}")
     # Return success message - data will be populated by daily incremental updates
     return f"✅ Successfully submitted {agent_name}! Review data will be populated by the next daily incremental update.", get_leaderboard_dataframe()
             continue
+# =============================================================================
+# STARTUP & INITIALIZATION
+# =============================================================================
+def initialize_leaderboard_data():
+    """
+    Initialize leaderboard data on startup.
+    If saved data doesn't exist, construct from metadata and save.
+    """
+    print(f"\n{'='*80}")
+    print(f"🚀 Initializing leaderboard data...")
+    print(f"{'='*80}\n")
+    # Try loading from saved dataset
+    saved_data = load_leaderboard_data_from_hf()
+    if saved_data:
+        print(f"✓ Leaderboard data already exists (last updated: {saved_data.get('last_updated', 'Unknown')})")
+    else:
+        print(f"⚠️ No saved leaderboard data found. Constructing from metadata...")
+        try:
+            # Construct leaderboard
+            leaderboard_dict = construct_leaderboard_from_metadata()
+            # Calculate monthly metrics
+            monthly_metrics = calculate_monthly_metrics_by_agent()
+            # Save to HuggingFace
+            save_leaderboard_data_to_hf(leaderboard_dict, monthly_metrics)
+            print(f"✓ Initial leaderboard data created and saved")
+        except Exception as e:
+            print(f"✗ Failed to initialize leaderboard data: {str(e)}")
+            import traceback
+            traceback.print_exc()
+    print(f"\n{'='*80}")
+    print(f"✓ Leaderboard initialization complete")
+    print(f"{'='*80}\n")
 # =============================================================================
 # GRADIO APPLICATION
 # =============================================================================
+# Initialize leaderboard data on startup
+initialize_leaderboard_data()
 # Start APScheduler for incremental updates at 12:00 AM UTC every Monday
 scheduler = BackgroundScheduler(timezone="UTC")
 scheduler.add_job(
 print(f"\n{'='*80}")
 print(f"✓ Scheduler initialized successfully")
 print(f"⛏️  Mining schedule: Every Monday at 12:00 AM UTC")
+print(f"📥 On startup: Loads cached data from {LEADERBOARD_REPO}")
 print(f"{'='*80}\n")
 # Create Gradio interface

msr.py CHANGED Viewed

@@ -21,6 +21,7 @@ load_dotenv()
 AGENTS_REPO = "SWE-Arena/swe_agents"
 REVIEW_METADATA_REPO = "SWE-Arena/review_metadata"
 LEADERBOARD_TIME_FRAME_DAYS = 180  # Time frame for leaderboard
 # =============================================================================
@@ -448,21 +449,21 @@ def save_review_metadata_to_hf(metadata_list, agent_identifier):
 def load_agents_from_hf():
     """
     Load all agent metadata JSON files from HuggingFace dataset.
     The github_identifier is extracted from the filename (e.g., 'agent-name[bot].json' -> 'agent-name[bot]')
     """
     try:
         api = HfApi()
         agents = []
         # List all files in the repository
         files = api.list_repo_files(repo_id=AGENTS_REPO, repo_type="dataset")
         # Filter for JSON files only
         json_files = [f for f in files if f.endswith('.json')]
         print(f"Found {len(json_files)} agent files in {AGENTS_REPO}")
         # Download and parse each JSON file
         for json_file in json_files:
             try:
@@ -471,7 +472,7 @@ def load_agents_from_hf():
                     filename=json_file,
                     repo_type="dataset"
                 )
                 with open(file_path, 'r') as f:
                     agent_data = json.load(f)
@@ -485,19 +486,347 @@ def load_agents_from_hf():
                     agent_data['github_identifier'] = github_identifier
                     agents.append(agent_data)
             except Exception as e:
                 print(f"Warning: Could not load {json_file}: {str(e)}")
                 continue
         print(f"✓ Loaded {len(agents)} agents from HuggingFace")
         return agents
     except Exception as e:
         print(f"Could not load agents from HuggingFace: {str(e)}")
         return []
 # =============================================================================
 # MAIN MINING FUNCTION
 # =============================================================================
@@ -596,6 +925,35 @@ def mine_all_agents():
     print(f"   BigQuery queries executed: 1")
     print(f"{'='*80}\n")
 # =============================================================================
 # ENTRY POINT

 AGENTS_REPO = "SWE-Arena/swe_agents"
 REVIEW_METADATA_REPO = "SWE-Arena/review_metadata"
+LEADERBOARD_REPO = "SWE-Arena/swe_leaderboard"  # HuggingFace dataset for leaderboard data
 LEADERBOARD_TIME_FRAME_DAYS = 180  # Time frame for leaderboard
 # =============================================================================
 def load_agents_from_hf():
     """
     Load all agent metadata JSON files from HuggingFace dataset.
     The github_identifier is extracted from the filename (e.g., 'agent-name[bot].json' -> 'agent-name[bot]')
     """
     try:
         api = HfApi()
         agents = []
         # List all files in the repository
         files = api.list_repo_files(repo_id=AGENTS_REPO, repo_type="dataset")
         # Filter for JSON files only
         json_files = [f for f in files if f.endswith('.json')]
         print(f"Found {len(json_files)} agent files in {AGENTS_REPO}")
         # Download and parse each JSON file
         for json_file in json_files:
             try:
                     filename=json_file,
                     repo_type="dataset"
                 )
                 with open(file_path, 'r') as f:
                     agent_data = json.load(f)
                     agent_data['github_identifier'] = github_identifier
                     agents.append(agent_data)
             except Exception as e:
                 print(f"Warning: Could not load {json_file}: {str(e)}")
                 continue
         print(f"✓ Loaded {len(agents)} agents from HuggingFace")
         return agents
     except Exception as e:
         print(f"Could not load agents from HuggingFace: {str(e)}")
         return []
+def load_review_metadata():
+    """
+    Load all review metadata from HuggingFace dataset within LEADERBOARD_TIME_FRAME_DAYS.
+    Returns:
+        List of dictionaries with 'agent_identifier' added to each review metadata.
+    """
+    # Calculate cutoff date
+    current_time = datetime.now(timezone.utc)
+    cutoff_date = current_time - timedelta(days=LEADERBOARD_TIME_FRAME_DAYS)
+    try:
+        api = HfApi()
+        token = get_hf_token()
+        # List all files in the repository
+        files = api.list_repo_files(repo_id=REVIEW_METADATA_REPO, repo_type="dataset")
+        # Filter for JSONL files matching pattern: [agent_identifier]/YYYY.MM.DD.jsonl
+        time_frame_files = []
+        for f in files:
+            if f.endswith('.jsonl'):
+                parts = f.split('/')
+                if len(parts) == 2:
+                    filename = parts[1]
+                    # Parse date from filename: YYYY.MM.DD.jsonl
+                    try:
+                        date_part = filename.replace('.jsonl', '')
+                        date_components = date_part.split('.')
+                        if len(date_components) == 3:
+                            file_year, file_month, file_day = map(int, date_components)
+                            file_date = datetime(file_year, file_month, file_day, tzinfo=timezone.utc)
+                            # Only include files within time frame
+                            if file_date >= cutoff_date:
+                                time_frame_files.append(f)
+                    except Exception:
+                        continue
+        print(f"📥 Loading review metadata from last {LEADERBOARD_TIME_FRAME_DAYS} days ({len(time_frame_files)} daily files)...")
+        all_metadata = []
+        for filename in time_frame_files:
+            try:
+                # Extract agent_identifier from path
+                parts = filename.split('/')
+                if len(parts) != 2:
+                    continue
+                agent_identifier = parts[0]
+                file_path = hf_hub_download(
+                    repo_id=REVIEW_METADATA_REPO,
+                    filename=filename,
+                    repo_type="dataset",
+                    token=token
+                )
+                day_metadata = load_jsonl(file_path)
+                # Add agent_identifier to each review
+                for review_meta in day_metadata:
+                    review_meta['agent_identifier'] = agent_identifier
+                    all_metadata.append(review_meta)
+            except Exception as e:
+                print(f"   Warning: Could not load {filename}: {str(e)}")
+        print(f"✓ Loaded {len(all_metadata)} total reviews from last {LEADERBOARD_TIME_FRAME_DAYS} days")
+        return all_metadata
+    except Exception as e:
+        print(f"✗ Error loading review metadata: {str(e)}")
+        return []
+def get_pr_status_from_metadata(review_meta):
+    """
+    Derive PR status from merged_at and closed_at fields.
+    Returns:
+        str: 'merged', 'closed', or 'open'
+    """
+    merged_at = review_meta.get('merged_at')
+    closed_at = review_meta.get('closed_at')
+    if merged_at:
+        return 'merged'
+    elif closed_at:
+        return 'closed'
+    else:
+        return 'open'
+def calculate_review_stats_from_metadata(metadata_list):
+    """
+    Calculate statistics from a list of review metadata.
+    Returns:
+        Dictionary with review metrics (total_reviews, merged_prs, acceptance_rate, etc.)
+    """
+    total_reviews = len(metadata_list)
+    # Count merged PRs
+    merged_prs = sum(1 for review_meta in metadata_list
+                      if get_pr_status_from_metadata(review_meta) == 'merged')
+    # Count rejected PRs
+    rejected_prs = sum(1 for review_meta in metadata_list
+                      if get_pr_status_from_metadata(review_meta) == 'closed')
+    # Count pending PRs
+    pending_prs = sum(1 for review_meta in metadata_list
+                     if get_pr_status_from_metadata(review_meta) == 'open')
+    # Calculate acceptance rate (exclude pending PRs)
+    completed_prs = merged_prs + rejected_prs
+    acceptance_rate = (merged_prs / completed_prs * 100) if completed_prs > 0 else 0
+    return {
+        'total_reviews': total_reviews,
+        'merged_prs': merged_prs,
+        'pending_prs': pending_prs,
+        'acceptance_rate': round(acceptance_rate, 2),
+    }
+def calculate_monthly_metrics_by_agent():
+    """
+    Calculate monthly metrics for all agents for visualization.
+    Returns:
+        dict: {
+            'agents': list of agent names,
+            'months': list of month labels (e.g., '2025-01'),
+            'data': {
+                agent_name: {
+                    'acceptance_rates': list of acceptance rates by month,
+                    'total_reviews': list of review counts by month,
+                    'merged_prs': list of merged PR counts by month,
+                }
+            }
+        }
+    """
+    # Load agents
+    agents = load_agents_from_hf()
+    # Create mapping from agent_identifier to agent_name
+    identifier_to_name = {agent.get('github_identifier'): agent.get('name') for agent in agents if agent.get('github_identifier')}
+    # Load all review metadata
+    all_metadata = load_review_metadata()
+    if not all_metadata:
+        return {'agents': [], 'months': [], 'data': {}}
+    # Group by agent and month
+    agent_month_data = defaultdict(lambda: defaultdict(list))
+    for review_meta in all_metadata:
+        agent_identifier = review_meta.get('agent_identifier')
+        reviewed_at = review_meta.get('reviewed_at')
+        if not agent_identifier or not reviewed_at:
+            continue
+        # Get agent_name from identifier
+        agent_name = identifier_to_name.get(agent_identifier, agent_identifier)
+        try:
+            dt = datetime.fromisoformat(reviewed_at.replace('Z', '+00:00'))
+            month_key = f"{dt.year}-{dt.month:02d}"
+            agent_month_data[agent_name][month_key].append(review_meta)
+        except Exception as e:
+            print(f"Warning: Could not parse date '{reviewed_at}': {e}")
+            continue
+    # Get all unique months and sort them
+    all_months = set()
+    for agent_data in agent_month_data.values():
+        all_months.update(agent_data.keys())
+    months = sorted(list(all_months))
+    # Calculate metrics for each agent and month
+    result_data = {}
+    for agent_name, month_dict in agent_month_data.items():
+        acceptance_rates = []
+        total_reviews_list = []
+        merged_prs_list = []
+        for month in months:
+            reviews_in_month = month_dict.get(month, [])
+            # Count merged PRs
+            merged_count = sum(1 for review in reviews_in_month
+                                if get_pr_status_from_metadata(review) == 'merged')
+            # Count rejected PRs
+            rejected_count = sum(1 for review in reviews_in_month
+                                if get_pr_status_from_metadata(review) == 'closed')
+            # Total reviews
+            total_count = len(reviews_in_month)
+            # Calculate acceptance rate (exclude pending PRs)
+            completed_count = merged_count + rejected_count
+            acceptance_rate = (merged_count / completed_count * 100) if completed_count > 0 else None
+            acceptance_rates.append(acceptance_rate)
+            total_reviews_list.append(total_count)
+            merged_prs_list.append(merged_count)
+        result_data[agent_name] = {
+            'acceptance_rates': acceptance_rates,
+            'total_reviews': total_reviews_list,
+            'merged_prs': merged_prs_list,
+        }
+    agents_list = sorted(list(agent_month_data.keys()))
+    return {
+        'agents': agents_list,
+        'months': months,
+        'data': result_data
+    }
+def construct_leaderboard_from_metadata():
+    """
+    Construct leaderboard from stored review metadata.
+    Returns:
+        Dictionary of agent stats.
+    """
+    print("\n📊 Constructing leaderboard from review metadata...")
+    # Load agents
+    agents = load_agents_from_hf()
+    if not agents:
+        print("⚠️ No agents found")
+        return {}
+    print(f"✓ Loaded {len(agents)} agents")
+    # Load all review metadata
+    all_metadata = load_review_metadata()
+    print(f"✓ Loaded {len(all_metadata)} review metadata entries")
+    cache_dict = {}
+    for agent in agents:
+        identifier = agent.get('github_identifier')
+        agent_name = agent.get('name', 'Unknown')
+        # Filter metadata for this agent
+        agent_metadata = [review for review in all_metadata if review.get("agent_identifier") == identifier]
+        # Calculate stats
+        stats = calculate_review_stats_from_metadata(agent_metadata)
+        cache_dict[identifier] = {
+            'agent_name': agent_name,
+            'name': agent_name,
+            'website': agent.get('website', 'N/A'),
+            'github_identifier': identifier,
+            **stats
+        }
+    print(f"✓ Constructed cache with {len(cache_dict)} agent entries")
+    return cache_dict
+def save_leaderboard_data_to_hf(leaderboard_dict, monthly_metrics):
+    """
+    Save leaderboard data and monthly metrics to HuggingFace dataset as swe-review.json.
+    Args:
+        leaderboard_dict: Dictionary of agent stats from construct_leaderboard_from_metadata()
+        monthly_metrics: Monthly metrics data from calculate_monthly_metrics_by_agent()
+    Returns:
+        bool: True if successful, False otherwise
+    """
+    try:
+        token = get_hf_token()
+        if not token:
+            raise Exception("No HuggingFace token found")
+        api = HfApi(token=token)
+        filename = "swe-review.json"
+        # Combine leaderboard and monthly metrics
+        combined_data = {
+            'last_updated': datetime.now(timezone.utc).isoformat(),
+            'leaderboard': leaderboard_dict,
+            'monthly_metrics': monthly_metrics,
+            'metadata': {
+                'leaderboard_time_frame_days': LEADERBOARD_TIME_FRAME_DAYS
+            }
+        }
+        # Save locally first
+        with open(filename, 'w') as f:
+            json.dump(combined_data, f, indent=2)
+        try:
+            # Upload to HuggingFace
+            api.upload_file(
+                path_or_fileobj=filename,
+                path_in_repo=filename,
+                repo_id=LEADERBOARD_REPO,
+                repo_type="dataset"
+            )
+            print(f"✓ Saved leaderboard data to HuggingFace: {filename}")
+            return True
+        finally:
+            # Always clean up local file
+            if os.path.exists(filename):
+                os.remove(filename)
+    except Exception as e:
+        print(f"✗ Error saving leaderboard data: {str(e)}")
+        import traceback
+        traceback.print_exc()
+        return False
 # =============================================================================
 # MAIN MINING FUNCTION
 # =============================================================================
     print(f"   BigQuery queries executed: 1")
     print(f"{'='*80}\n")
+    # Construct and save leaderboard data
+    print(f"\n{'='*80}")
+    print(f"📊 Constructing and saving leaderboard data...")
+    print(f"{'='*80}\n")
+    try:
+        # Construct leaderboard
+        leaderboard_dict = construct_leaderboard_from_metadata()
+        # Calculate monthly metrics
+        print(f"\n📈 Calculating monthly metrics...")
+        monthly_metrics = calculate_monthly_metrics_by_agent()
+        # Save to HuggingFace
+        print(f"\n💾 Saving leaderboard data to HuggingFace...")
+        save_leaderboard_data_to_hf(leaderboard_dict, monthly_metrics)
+        print(f"\n{'='*80}")
+        print(f"✅ Leaderboard data saved successfully!")
+        print(f"   Leaderboard entries: {len(leaderboard_dict)}")
+        print(f"   Monthly data points: {len(monthly_metrics.get('months', []))} months")
+        print(f"   Saved to: {LEADERBOARD_REPO}/swe-review.json")
+        print(f"{'='*80}\n")
+    except Exception as e:
+        print(f"\n✗ Failed to construct/save leaderboard data: {str(e)}")
+        import traceback
+        traceback.print_exc()
 # =============================================================================
 # ENTRY POINT