restapitrial_vectordb

Sleeping

Redmind commited on Feb 14

Commit

46020d8

verified ·

1 Parent(s): 77175c7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 from fastapi import FastAPI
 import os
-import fitz  # PyMuPDF
 from pptx import Presentation
 from sentence_transformers import SentenceTransformer
 import torch
@@ -31,7 +31,7 @@ os.makedirs(IMAGE_FOLDER, exist_ok=True)
 # Extract Text from PDF
 def extract_text_from_pdf(pdf_path):
     try:
-        doc = fitz.open(pdf_path)
         text = " ".join(page.get_text() for page in doc)
         return text.strip() if text else None
     except Exception as e:
@@ -53,7 +53,7 @@ def extract_text_from_pptx(pptx_path):
 # Extract Images from PDF
 def extract_images_from_pdf(pdf_path):
     try:
-        doc = fitz.open(pdf_path)
         images = []
         for i, page in enumerate(doc):
             for img_index, img in enumerate(page.get_images(full=True)):

 from fastapi import FastAPI
 import os
+import pymupdf  # PyMuPDF
 from pptx import Presentation
 from sentence_transformers import SentenceTransformer
 import torch
 # Extract Text from PDF
 def extract_text_from_pdf(pdf_path):
     try:
+        doc = pymupdf.open(pdf_path)
         text = " ".join(page.get_text() for page in doc)
         return text.strip() if text else None
     except Exception as e:
 # Extract Images from PDF
 def extract_images_from_pdf(pdf_path):
     try:
+        doc = pymupdf.open(pdf_path)
         images = []
         for i, page in enumerate(doc):
             for img_index, img in enumerate(page.get_images(full=True)):