Spaces:

terapyon
/

nvdajp-book-qa

Paused

terapyon commited on Jul 30, 2023

Commit

6125df0

1 Parent(s): 9022e07

try to change embedding model

Files changed (3) hide show

app.py CHANGED Viewed

@@ -1,6 +1,9 @@
 import gradio as gr
 from langchain.chains import RetrievalQA
-from langchain.embeddings import OpenAIEmbeddings
 from langchain.llms import OpenAI
 from langchain.chat_models import ChatOpenAI
 from langchain.vectorstores import Qdrant
@@ -16,7 +19,16 @@ PERSIST_DIR_NAME = "nvdajp-book"
 def get_retrieval_qa(model_name: str | None, temperature: int, option: str | None) -> RetrievalQA:
-    embeddings = OpenAIEmbeddings()
     db_url, db_api_key, db_collection_name = DB_CONFIG
     client = QdrantClient(url=db_url, api_key=db_api_key)
     db = Qdrant(client=client, collection_name=db_collection_name, embeddings=embeddings)
@@ -36,7 +48,7 @@ def get_retrieval_qa(model_name: str | None, temperature: int, option: str | Non
                 "filter": {"category": option},
             }
         )
-    return RetrievalQA.from_chain_type(
         llm=ChatOpenAI(
             model=model,
             temperature=temperature
@@ -45,6 +57,7 @@ def get_retrieval_qa(model_name: str | None, temperature: int, option: str | Non
         retriever=retriever,
         return_source_documents=True,
     )
 def get_related_url(metadata):

+from time import time
 import gradio as gr
 from langchain.chains import RetrievalQA
+# from langchain.embeddings import OpenAIEmbeddings
+from langchain.embeddings import HuggingFaceEmbeddings
+from langchain.embeddings import GPT4AllEmbeddings
 from langchain.llms import OpenAI
 from langchain.chat_models import ChatOpenAI
 from langchain.vectorstores import Qdrant
 def get_retrieval_qa(model_name: str | None, temperature: int, option: str | None) -> RetrievalQA:
+    # embeddings = OpenAIEmbeddings()
+    model_name = "sentence-transformers/all-mpnet-base-v2"
+    model_kwargs = {'device': 'cpu'}
+    encode_kwargs = {'normalize_embeddings': False}
+    embeddings = HuggingFaceEmbeddings(
+        model_name=model_name,
+        model_kwargs=model_kwargs,
+        encode_kwargs=encode_kwargs,
+    )
+    # embeddings = GPT4AllEmbeddings()
     db_url, db_api_key, db_collection_name = DB_CONFIG
     client = QdrantClient(url=db_url, api_key=db_api_key)
     db = Qdrant(client=client, collection_name=db_collection_name, embeddings=embeddings)
                 "filter": {"category": option},
             }
         )
+    result = RetrievalQA.from_chain_type(
         llm=ChatOpenAI(
             model=model,
             temperature=temperature
         retriever=retriever,
         return_source_documents=True,
     )
+    return result
 def get_related_url(metadata):

config.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import os
-SAAS = True
 def get_db_config():

 import os
+SAAS = False
 def get_db_config():

store.py CHANGED Viewed

@@ -1,6 +1,8 @@
 from langchain.document_loaders import ReadTheDocsLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
-from langchain.embeddings import OpenAIEmbeddings
 from langchain.vectorstores import Qdrant
 # from qdrant_client import QdrantClient
 from nvda_ug_loader import NVDAUserGuideLoader
@@ -35,7 +37,16 @@ def get_text_chunk(docs):
 def store(texts):
-    embeddings = OpenAIEmbeddings()
     db_url, db_api_key, db_collection_name = DB_CONFIG
     # client = QdrantClient(url=db_url, api_key=db_api_key, prefer_grpc=True)
     _ = Qdrant.from_documents(

 from langchain.document_loaders import ReadTheDocsLoader
 from langchain.text_splitter import RecursiveCharacterTextSplitter
+# from langchain.embeddings import OpenAIEmbeddings
+from langchain.embeddings import HuggingFaceEmbeddings
+from langchain.embeddings import GPT4AllEmbeddings
 from langchain.vectorstores import Qdrant
 # from qdrant_client import QdrantClient
 from nvda_ug_loader import NVDAUserGuideLoader
 def store(texts):
+    # embeddings = OpenAIEmbeddings()
+    model_name = "sentence-transformers/all-mpnet-base-v2"
+    model_kwargs = {'device': 'cuda'}
+    encode_kwargs = {'normalize_embeddings': False}
+    embeddings = HuggingFaceEmbeddings(
+        model_name=model_name,
+        model_kwargs=model_kwargs,
+        encode_kwargs=encode_kwargs,
+    )
+    # embeddings = GPT4AllEmbeddings()
     db_url, db_api_key, db_collection_name = DB_CONFIG
     # client = QdrantClient(url=db_url, api_key=db_api_key, prefer_grpc=True)
     _ = Qdrant.from_documents(