The Street View Text(SVT) 数据集¶
数据下载¶
街景文本数据集(SVT)下载链接
请从上述网站下载数据并解压缩文件。解压文件后,数据结构应该是这样的:
svt1
├── img
│ ├── 00_00.jpg
│ ├── 00_01.jpg
│ ├── 00_02.jpg
│ ├── 00_03.jpg
│ ├── ...
├── test.xml
└── train.xml
数据准备¶
识别任务¶
要准备用于文本识别的数据,您可以运行以下命令:
python tools/dataset_converters/convert.py \
--dataset_name svt --task rec \
--image_dir path/to/svt1/ \
--label_dir path/to/svt1/train.xml \
--output_path path/to/svt1/rec_train_gt.txt
运行后,在文件夹 svt1/
下有一个文件夹 cropped_images/
和一个注释文件 rec_train_gt.txt
。