Spaces:

SynaptechX
/

ImgTextParser

Sleeping

ImgTextParser / README.md

nihuajian

Update README.md

e5691d8 verified 3 months ago

1.18 kB

	---
	title: ImgTextParser
	emoji: 🐨
	colorFrom: red
	colorTo: green
	sdk: gradio
	sdk_version: 4.32.2
	app_file: app.py
	pinned: false
	license: mit
	---
	# MiniCPM 多模态内容解析工具

	基于MiniCPM-o多模态模型的智能图片内容解析工具，支持表格、公式、文本三种解析模式。

	## 功能特点

	- 🖼️ 支持多种图片格式（PNG、JPG、JPEG等）
	- 📊 表格解析: 智能识别表格结构并转换为标准Markdown格式
	- 🧮 公式解析: 识别数学公式并输出LaTeX格式
	- 📝 文本解析: 提取图片中的所有文字内容，保持原有格式
	- 🔧 自动清理多余输出，只保留纯净的解析结果
	- ⚡ 支持GPU加速推理
	- 🎛️ 用户友好的Web界面

	## 使用方法

	1. 上传要解析的图片
	2. 选择解析类型（表格/公式/文本）
	3. 点击"开始解析"按钮
	4. 获取清洁的解析结果

	## 技术栈

	- 模型: MiniCPM-o-2.6
	- 框架: Gradio + Transformers
	- 加速: CUDA GPU推理
	- 部署: Hugging Face Spaces

	## 注意事项

	- 确保上传的图片清晰可见
	- 根据图片内容选择合适的解析类型
	- 复杂内容建议使用高分辨率图片