Spaces:

John6666
/

text2tag-llm

Running on Zero

John6666 commited on Oct 25, 2024

Commit

a108184

verified ·

1 Parent(s): fccbd1a

Upload 2 files

Files changed (2) hide show

formatter.py ADDED Viewed

+from llama_cpp_agent.messages_formatter import MessagesFormatter, PromptMarkers, Roles
+mistral_v1_markers = {
+    Roles.system: PromptMarkers(""" [INST]""", """ [/INST] Understood.</s>"""),
+    Roles.user: PromptMarkers(""" [INST]""", """ [/INST]"""),
+    Roles.assistant: PromptMarkers(" ", "</s>"),
+    Roles.tool: PromptMarkers("", ""),
+}
+mistral_v1_formatter = MessagesFormatter(
+    pre_prompt="",
+    prompt_markers=mistral_v1_markers,
+    include_sys_prompt_in_first_user_message=False,
+    default_stop_sequences=["</s>"]
+)
+mistral_v2_markers = {
+    Roles.system: PromptMarkers("""[INST] """, """[/INST] Understood.</s>"""),
+    Roles.user: PromptMarkers("""[INST] """, """[/INST]"""),
+    Roles.assistant: PromptMarkers(" ", "</s>"),
+    Roles.tool: PromptMarkers("", ""),
+}
+mistral_v2_formatter = MessagesFormatter(
+    pre_prompt="",
+    prompt_markers=mistral_v2_markers,
+    include_sys_prompt_in_first_user_message=False,
+    default_stop_sequences=["</s>"]
+)
+mistral_v3_tekken_markers = {
+    Roles.system: PromptMarkers("""[INST]""", """[/INST]Understood.</s>"""),
+    Roles.user: PromptMarkers("""[INST]""", """[/INST]"""),
+    Roles.assistant: PromptMarkers("", "</s>"),
+    Roles.tool: PromptMarkers("", ""),
+}
+mistral_v3_tekken_formatter = MessagesFormatter(
+    pre_prompt="",
+    prompt_markers=mistral_v3_tekken_markers,
+    include_sys_prompt_in_first_user_message=False,
+    default_stop_sequences=["</s>"]
+)

llmdolphin.py CHANGED Viewed

@@ -8,7 +8,7 @@ from llama_cpp_agent.chat_history.messages import Roles
 from ja_to_danbooru.ja_to_danbooru import jatags_to_danbooru_tags
 import wrapt_timeout_decorator
 from pathlib import Path
 llm_models_dir = "./llm_models"
 llm_models = {
@@ -821,6 +821,9 @@ llm_formats = {
     "DeepSeek Coder v2": MessagesFormatterType.DEEP_SEEK_CODER_2,
     "Gemma 2": MessagesFormatterType.ALPACA,
     "Qwen2": MessagesFormatterType.OPEN_CHAT,
 }
 # https://github.com/Maximilian-Winter/llama-cpp-agent
 llm_languages = ["English", "Japanese", "Chinese", "Korean", "Spanish", "Portuguese", "German", "French", "Finnish", "Russian"]

 from ja_to_danbooru.ja_to_danbooru import jatags_to_danbooru_tags
 import wrapt_timeout_decorator
 from pathlib import Path
+from formatter import mistral_v1_formatter, mistral_v2_formatter, mistral_v3_tekken_formatter
 llm_models_dir = "./llm_models"
 llm_models = {
     "DeepSeek Coder v2": MessagesFormatterType.DEEP_SEEK_CODER_2,
     "Gemma 2": MessagesFormatterType.ALPACA,
     "Qwen2": MessagesFormatterType.OPEN_CHAT,
+    "Mistral Tokenizer V1": mistral_v1_formatter,
+    "Mistral Tokenizer V2": mistral_v2_formatter,
+    "Mistral Tokenizer V3 - Tekken": mistral_v3_tekken_formatter,
 }
 # https://github.com/Maximilian-Winter/llama-cpp-agent
 llm_languages = ["English", "Japanese", "Chinese", "Korean", "Spanish", "Portuguese", "German", "French", "Finnish", "Russian"]