utter-project
/

EuroVLM-9B-Preview

text-generation-inference

Model card Files Files and versions

patricksf commited on Jun 9

Commit

a5d5c4a

·

verified ·

1 Parent(s): 0250faa

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -47,14 +47,14 @@ This is the model card for EuroVLM-9B-Preview, a multimodal vision-language mode
 - **Developed by:** Unbabel, Instituto Superior Técnico, Instituto de Telecomunicações, University of Edinburgh, Aveni, University of Paris-Saclay, University of Amsterdam, Naver Labs, Sorbonne Université.
 - **Funded by:** European Union.
-- **Model type:** A 9B parameter multilingual multimodal transformer VLM (Vision-Language Model).
 - **Language(s) (NLP):** Bulgarian, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, German, Greek, Hungarian, Irish, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovenian, Spanish, Swedish, Arabic, Catalan, Chinese, Galician, Hindi, Japanese, Korean, Norwegian, Russian, Turkish, and Ukrainian.
 - **Modalities:** Text and Vision (images).
 - **License:** Apache License 2.0.
 ## Model Details
-EuroVLM-9B is a 9B parameter vision-language model that combines the multilingual capabilities of EuroLLM-9B with vision encoding components.
 EuroVLM-9B was (visually) instruction tuned on a combination of multilingual vision-language datasets, including image captioning, visual question answering, and multimodal reasoning tasks across the supported languages.

 - **Developed by:** Unbabel, Instituto Superior Técnico, Instituto de Telecomunicações, University of Edinburgh, Aveni, University of Paris-Saclay, University of Amsterdam, Naver Labs, Sorbonne Université.
 - **Funded by:** European Union.
+- **Model type:** A 9B+400M parameter multilingual multimodal transformer VLM (Vision-Language Model).
 - **Language(s) (NLP):** Bulgarian, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, German, Greek, Hungarian, Irish, Italian, Latvian, Lithuanian, Maltese, Polish, Portuguese, Romanian, Slovak, Slovenian, Spanish, Swedish, Arabic, Catalan, Chinese, Galician, Hindi, Japanese, Korean, Norwegian, Russian, Turkish, and Ukrainian.
 - **Modalities:** Text and Vision (images).
 - **License:** Apache License 2.0.
 ## Model Details
+EuroVLM-9B is a 9B+400M parameter vision-language model that combines the multilingual capabilities of EuroLLM-9B with vision encoding components.
 EuroVLM-9B was (visually) instruction tuned on a combination of multilingual vision-language datasets, including image captioning, visual question answering, and multimodal reasoning tasks across the supported languages.