Spaces:

Sa-m
/

manifesto-explainer

Running

Sa-m commited on Jan 23, 2022

Commit

5f546a1

1 Parent(s): 785f00f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -55,14 +55,18 @@ nltk.download('words')
 """## PARSING FILES"""
 def Parsing(parsed_text):
   parsed_text=parsed_text.name
-  raw_party =parser.from_file(parsed_text)
-  raw_party = raw_party['content']
   return clean(raw_party)
 #Added more stopwords to avoid irrelevant terms
 stop_words = set(stopwords.words('english'))
 stop_words.update('ask','much','thank','etc.', 'e', 'We', 'In', 'ed','pa', 'This','also', 'A', 'fu','To','5','ing', 'er', '2')

 """## PARSING FILES"""
+#def Parsing(parsed_text):
+  #parsed_text=parsed_text.name
+  #raw_party =parser.from_file(parsed_text)
+ # raw_party = raw_party['content']
+#  return clean(raw_party)
 def Parsing(parsed_text):
   parsed_text=parsed_text.name
+  raw_party =textract.process(parsed_text, encoding='ascii',method='pdfminer')
   return clean(raw_party)
 #Added more stopwords to avoid irrelevant terms
 stop_words = set(stopwords.words('english'))
 stop_words.update('ask','much','thank','etc.', 'e', 'We', 'In', 'ed','pa', 'This','also', 'A', 'fu','To','5','ing', 'er', '2')