leaderboard-test

Sleeping

rntc Claude commited on Jul 18

Commit

17f029a

1 Parent(s): 25c6939

Replace hardcoded architecture detection with user selection

🎯 Key Changes:
- Remove hardcoded architecture patterns (future-proof for new models)
- Add model type dropdown to submission form: 🔤 🔽 🔄
- Users now select: Encoder/Decoder/Encoder-Decoder during submission
- Model type stored in request files and displayed in T column

✨ Benefits:
- Works with any new/custom architecture
- User explicitly declares their model type
- No need to maintain hardcoded pattern lists
- Clear UI with emoji + description

🔤 Encoder (BERT-like) < /dev/null | 🔽 Decoder (GPT-like) | 🔄 Encoder-Decoder (T5-like)

🤖 Generated with [Claude Code](https://claude.ai/code)

Co-Authored-By: Claude <[email protected]>

Files changed (4) hide show

app.py +8 -0
src/display/utils.py +61 -8
src/leaderboard/read_evals.py +12 -1
src/submission/submit.py +4 -0

app.py CHANGED Viewed

@@ -159,6 +159,13 @@ with demo:
                         value="float16",
                         interactive=True,
                     )
             submit_button = gr.Button("Soumettre l'évaluation")
             submission_result = gr.Markdown()
@@ -168,6 +175,7 @@ with demo:
                     model_name_textbox,
                     revision_name_textbox,
                     precision,
                 ],
                 submission_result,
             )

                         value="float16",
                         interactive=True,
                     )
+                    model_type = gr.Dropdown(
+                        choices=["🔤 Encoder (BERT-like)", "🔽 Decoder (GPT-like)", "🔄 Encoder-Decoder (T5-like)"],
+                        label="Type d'architecture",
+                        multiselect=False,
+                        value="🔤 Encoder (BERT-like)",
+                        interactive=True,
+                    )
             submit_button = gr.Button("Soumettre l'évaluation")
             submission_result = gr.Markdown()
                     model_name_textbox,
                     revision_name_textbox,
                     precision,
+                    model_type,
                 ],
                 submission_result,
             )

src/display/utils.py CHANGED Viewed

@@ -49,6 +49,7 @@ class EvalQueueColumn:  # Queue column
     model = ColumnContent("model", "markdown", True)
     revision = ColumnContent("revision", "str", True)
     precision = ColumnContent("precision", "str", True)
     status = ColumnContent("status", "str", True)
 ## All the model information that we might need
@@ -60,23 +61,75 @@ class ModelDetails:
 class ModelType(Enum):
-    FT = ModelDetails(name="fine-tuned", symbol="🔶")
-    Unknown = ModelDetails(name="", symbol="?")
     def to_str(self, separator=" "):
         return f"{self.value.symbol}{separator}{self.value.name}"
     @staticmethod
-    def from_str(type):
-        if "fine-tuned" in type or "🔶" in type:
-            return ModelType.FT
         return ModelType.Unknown
     @staticmethod
     def from_config(config):
-        """Determine model type from configuration - for NER models, most will be fine-tuned"""
-        if hasattr(config, 'num_labels') and config.num_labels > 2:
-            return ModelType.FT  # Fine-tuned for NER
         return ModelType.Unknown
 class WeightType(Enum):

     model = ColumnContent("model", "markdown", True)
     revision = ColumnContent("revision", "str", True)
     precision = ColumnContent("precision", "str", True)
+    model_type = ColumnContent("model_type", "str", True)
     status = ColumnContent("status", "str", True)
 ## All the model information that we might need
 class ModelType(Enum):
+    ENCODER = ModelDetails(name="encoder", symbol="🔤")  # BERT-like
+    DECODER = ModelDetails(name="decoder", symbol="🔽")  # GPT-like
+    ENCODER_DECODER = ModelDetails(name="encoder-decoder", symbol="🔄")  # T5-like
+    Unknown = ModelDetails(name="unknown", symbol="?")
     def to_str(self, separator=" "):
         return f"{self.value.symbol}{separator}{self.value.name}"
     @staticmethod
+    def from_str(type_str):
+        if "encoder-decoder" in type_str.lower() or "🔄" in type_str:
+            return ModelType.ENCODER_DECODER
+        elif "encoder" in type_str.lower() or "🔤" in type_str:
+            return ModelType.ENCODER
+        elif "decoder" in type_str.lower() or "🔽" in type_str:
+            return ModelType.DECODER
         return ModelType.Unknown
     @staticmethod
     def from_config(config):
+        """Detect model architecture type from config"""
+        if hasattr(config, 'model_type'):
+            model_type = config.model_type.lower()
+            # Encoder-decoder models
+            if model_type in ['t5', 'bart', 'pegasus', 'mbart', 'blenderbot', 'bigbird_pegasus']:
+                return ModelType.ENCODER_DECODER
+            # Decoder-only models (GPT-like)
+            elif model_type in ['gpt', 'gpt2', 'gpt_neo', 'gpt_neox', 'gptj', 'bloom', 'llama', 'mistral', 'qwen']:
+                return ModelType.DECODER
+            # Encoder-only models (BERT-like)
+            elif model_type in ['bert', 'roberta', 'camembert', 'distilbert', 'electra', 'deberta', 'albert']:
+                return ModelType.ENCODER
+        # Fallback: detect from architecture class name
+        if hasattr(config, 'architectures') and config.architectures:
+            arch_name = config.architectures[0].lower()
+            if any(name in arch_name for name in ['t5', 'bart', 'pegasus', 'mbart', 'blenderbot']):
+                return ModelType.ENCODER_DECODER
+            elif any(name in arch_name for name in ['gpt', 'bloom', 'llama', 'mistral', 'qwen']):
+                return ModelType.DECODER
+            elif any(name in arch_name for name in ['bert', 'roberta', 'camembert', 'distilbert', 'electra', 'deberta', 'albert']):
+                return ModelType.ENCODER
+        return ModelType.Unknown
+    @staticmethod
+    def from_architecture(architecture):
+        """Detect model type from architecture string"""
+        if not architecture or architecture == "?":
+            return ModelType.Unknown
+        arch_lower = architecture.lower()
+        # Encoder-decoder patterns
+        if any(pattern in arch_lower for pattern in ['t5', 'bart', 'pegasus', 'mbart', 'blenderbot']):
+            return ModelType.ENCODER_DECODER
+        # Decoder patterns (GPT-like)
+        elif any(pattern in arch_lower for pattern in ['gpt', 'bloom', 'llama', 'mistral', 'qwen', 'causal']):
+            return ModelType.DECODER
+        # Encoder patterns (BERT-like)
+        elif any(pattern in arch_lower for pattern in ['bert', 'roberta', 'camembert', 'distilbert', 'electra', 'deberta', 'albert', 'formaskedlm', 'fortokenclassification', 'forsequenceclassification']):
+            return ModelType.ENCODER
         return ModelType.Unknown
 class WeightType(Enum):

src/leaderboard/read_evals.py CHANGED Viewed

@@ -114,7 +114,18 @@ class EvalResult:
         try:
             with open(request_file, "r") as f:
                 request = json.load(f)
-            self.model_type = ModelType.from_str(request.get("model_type", ""))
             self.weight_type = WeightType[request.get("weight_type", "Original")]
             self.license = request.get("license", "?")
             self.likes = request.get("likes", 0)

         try:
             with open(request_file, "r") as f:
                 request = json.load(f)
+            # Convert emoji symbol to ModelType
+            model_type_symbol = request.get("model_type", "?")
+            if model_type_symbol == "🔤":
+                self.model_type = ModelType.ENCODER
+            elif model_type_symbol == "🔽":
+                self.model_type = ModelType.DECODER
+            elif model_type_symbol == "🔄":
+                self.model_type = ModelType.ENCODER_DECODER
+            else:
+                self.model_type = ModelType.Unknown
             self.weight_type = WeightType[request.get("weight_type", "Original")]
             self.license = request.get("license", "?")
             self.likes = request.get("likes", 0)

src/submission/submit.py CHANGED Viewed

@@ -18,6 +18,7 @@ def add_new_eval(
     model: str,
     revision: str,
     precision: str,
 ):
     global REQUESTED_MODELS
     global USERS_TO_SUBMISSION_DATES
@@ -31,6 +32,8 @@ def add_new_eval(
         model_path = model.split("/")[1]
     precision = precision.split(" ")[0]
     current_time = datetime.now(timezone.utc).strftime("%Y-%m-%dT%H:%M:%SZ")
     # Does the model actually exist?
@@ -71,6 +74,7 @@ def add_new_eval(
         "model": model,
         "revision": revision,
         "precision": precision,
         "status": "PENDING",
         "submitted_time": current_time,
         "likes": model_info.likes,

     model: str,
     revision: str,
     precision: str,
+    model_type: str,
 ):
     global REQUESTED_MODELS
     global USERS_TO_SUBMISSION_DATES
         model_path = model.split("/")[1]
     precision = precision.split(" ")[0]
+    # Extract just the emoji from model_type (e.g., "🔤 Encoder (BERT-like)" -> "🔤")
+    model_type_symbol = model_type.split(" ")[0] if model_type else "?"
     current_time = datetime.now(timezone.utc).strftime("%Y-%m-%dT%H:%M:%SZ")
     # Does the model actually exist?
         "model": model,
         "revision": revision,
         "precision": precision,
+        "model_type": model_type_symbol,
         "status": "PENDING",
         "submitted_time": current_time,
         "likes": model_info.likes,