File size: 517 Bytes
c69a4d6 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2025/4/24 21:11
# @Author : hukangzhe
# @File : schema.py
# @Description : 不直接处理纯文本字符串. 引入一个标准化的数据结构来承载文本块,既有内容,也有元数据。
from dataclasses import dataclass, field
from typing import Dict, Any
@dataclass
class Document:
text: str
metadata: Dict[str, Any] = field(default_factory=dict)
@dataclass
class Chunk(Document):
parent_id: int = None |