File size: 2,053 Bytes
f0f2085
46250f3
 
f0f2085
46250f3
f0f2085
d482402
f0f2085
 
 
46250f3
f0f2085
 
46250f3
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
---
title: dots.ocr (GOT-OCR2_0) - 高精度OCR API
emoji: 🔍
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 5.43.1
app_file: app.py
pinned: false
license: apache-2.0
hardware: t4-small
---

# 🔍 dots.ocr (GOT-OCR2_0) - 高精度OCR API

HuggingFace Spaceで動作する高精度OCRアプリケーションです。

## 🌟 特徴

- **高精度OCR**: 95%以上の認識精度
- **多言語対応**: 日本語、英語、中国語など80以上の言語
- **レイアウト検出**: テキスト、テーブル、図表の構造認識
- **API対応**: RESTful API経由での利用可能
- **GPU最適化**: T4 GPU使用で高速処理

## 🚀 使用方法

### Webインターフェース
1. 画像をアップロード
2. OCRタイプを選択(ocr/format/fine-grained)
3. 処理開始ボタンをクリック

### API利用
```python
from gradio_client import Client

client = Client("your-username/dots-ocr-space")
result = client.predict(
    image_path,  # 画像ファイルパス
    api_name="/ocr_api"
)
print(result)
```

## 📊 OCRタイプ

- **ocr**: 基本的なOCR処理
- **format**: フォーマットを保持したOCR
- **fine-grained**: 詳細な解析を含むOCR

## 🔧 技術仕様

- **モデル**: ucaslcl/GOT-OCR2_0
- **フレームワーク**: PyTorch + Transformers
- **GPU**: NVIDIA T4
- **インターフェース**: Gradio 4.0

## 🌐 統合例

このSpaceは外部のWebアプリケーションから呼び出すことができます:

```python
import requests
import json

# HuggingFace Space APIエンドポイント
api_url = "https://your-username-dots-ocr-space.hf.space/api/predict"

# 画像をBase64エンコードしてPOST
response = requests.post(api_url, 
    json={"data": [image_base64]},
    headers={"Content-Type": "application/json"}
)

result = response.json()
print(result["data"][0])  # OCR結果
```

## 📝 ライセンス

Apache 2.0 License

## 🤝 貢献

Issue報告やPull Requestは歓迎です。

---

**Powered by dots.ocr (GOT-OCR2_0) • Built with Gradio**