File size: 1,182 Bytes
8b6067a
 
e5691d8
 
 
8b6067a
e5691d8
8b6067a
 
e5691d8
8b6067a
6c053dd
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
0771a78
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
---
title: ImgTextParser
emoji: 🐨
colorFrom: red
colorTo: green
sdk: gradio
sdk_version: 4.32.2
app_file: app.py
pinned: false
license: mit
---
# MiniCPM 多模态内容解析工具

基于MiniCPM-o多模态模型的智能图片内容解析工具,支持表格、公式、文本三种解析模式。

## 功能特点

- 🖼️ 支持多种图片格式(PNG、JPG、JPEG等)
- 📊 **表格解析**: 智能识别表格结构并转换为标准Markdown格式
- 🧮 **公式解析**: 识别数学公式并输出LaTeX格式
- 📝 **文本解析**: 提取图片中的所有文字内容,保持原有格式
- 🔧 自动清理多余输出,只保留纯净的解析结果
- ⚡ 支持GPU加速推理
- 🎛️ 用户友好的Web界面

## 使用方法

1. 上传要解析的图片
2. 选择解析类型(表格/公式/文本)
3. 点击"开始解析"按钮
4. 获取清洁的解析结果

## 技术栈

- **模型**: MiniCPM-o-2.6
- **框架**: Gradio + Transformers
- **加速**: CUDA GPU推理
- **部署**: Hugging Face Spaces

## 注意事项

- 确保上传的图片清晰可见
- 根据图片内容选择合适的解析类型
- 复杂内容建议使用高分辨率图片