lecslab
/

glosslm

michaelginn commited on Nov 4, 2024

Commit

3b35b58

verified ·

1 Parent(s): ee91bc5

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -11,6 +11,37 @@ base_model:
 library_name: transformers
 ---
-Repo: https://github.com/foltaProject/glosslm
-Paper: https://arxiv.org/abs/2403.06399

 library_name: transformers
 ---
+- Repo: https://github.com/foltaProject/glosslm
+- Paper: https://arxiv.org/abs/2403.06399
+Usage:
+```python
+import transformers
+# Your inputs
+transcription = "o sey xtok rixoqiil"
+translation = "O sea busca esposa."
+lang = "Uspanteco"
+metalang = "Spanish"
+is_segmented = False
+prompt = f"""Provide the glosses for the following transcription in {lang}.
+Transcription in {lang}: {transcription}
+Transcription segmented: {is_segmented}
+Translation in {metalang}: {translation}\n
+Glosses:
+"""
+model = transformers.T5ForConditionalGeneration.from_pretrained("lecslab/glosslm")
+tokenizer = transformers.ByT5Tokenizer.from_pretrained(
+    "google/byt5-base", use_fast=False
+)
+inputs = tokenizer(prompt, return_tensors="pt")
+outputs = tokenizer.batch_decode(
+    model.generate(**inputs, max_length=1024), skip_special_tokens=True
+)
+print(outputs[0])
+# o sea COM-buscar E3S-esposa
+```