BOUSLIMI commited on
Commit
44eb837
·
verified ·
1 Parent(s): 8302845

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +8 -12
app.py CHANGED
@@ -5,15 +5,11 @@ import json
5
  # Define tokenizer and model before using them
6
  tokenizer = AutoTokenizer.from_pretrained("t5-base")
7
  model = AutoModelWithLMHead.from_pretrained("t5-base", return_dict=True)
8
- sequence = "La Tunisie est un pays d’Afrique du Nord appartenant auMaghreb. Elle est bordée au nord et à l’est par la merMéditerranée. Sa frontière ouest s’ouvre sur l’Algérie (965 km)et sa frontière sud-est sur la Libye (459 km). Son nom estdérivé de celui de sa capitale, Tunis, située dans le nord dupays.Près de 40 % de la superficie du territoire est occupée par ledésert du Sahara, le reste étant constitué de terres très fertiles.Longtemps appelée Régence de Tunis, notamment sous ladomination ottomane, la Tunisie passe sous protectorat françaisen 1881. Avec l'avènement de l'indépendance, le 20 mars 1956,le pays prend l’appellation officielle de Royaume de Tunisiesous le règne de Lamine Bey, seul souverain tunisien à porterle titre de roi. Avec la proclamation de la république, le 25juillet 1957, c'est le leader nationaliste Habib Bourguiba quidevient le premier président de la République tunisienne etmodernise le pays. Succédédepuis le 7 novembre 1987, parZine el-Abidine Ben Ali quiengage une politique derestructuration sociale etéconomique basée surl’ouverture et la tolérance."
9
-
10
- max_tokens = 512
11
- truncated_sequence = sequence[:max_tokens - len("summarize: ")]
12
- inputs = tokenizer.encode("summarize: " + truncated_sequence, return_tensors='pt', max_length=512, truncation=True)
13
-
14
- max_length = 100
15
- outputs = model.generate(inputs, max_length=max_length, min_length=80, length_penalty=5, num_beams=2)
16
-
17
- summary = tokenizer.batch_decode(outputs, skip_special_tokens=True)
18
-
19
- st.text(summary[0])
 
5
  # Define tokenizer and model before using them
6
  tokenizer = AutoTokenizer.from_pretrained("t5-base")
7
  model = AutoModelWithLMHead.from_pretrained("t5-base", return_dict=True)
8
+ texte = st.text_area("Texte à résumer", height=200)
9
+ bouton_ok = st.button("Résumé")
10
+ if bouton_ok:
11
+ inputs = tokenizer.encode("summarize: " + texte, return_tensors='pt', max_length=512, truncation=True)
12
+ outputs = model.generate(inputs, max_length=150, min_length=80, length_penalty=5, num_beams=2)
13
+ summary = tokenizer.decode(outputs[0])
14
+ st.text("Résumé :")
15
+ st.text(summary)