跳转至

MLT-2017 数据集

数据集下载

MLT (Multi-Lingual) 2017 论文 | 下载链接

注意:在下载之前,请先注册一个账号。

MLT 2017 数据集包含两个任务:任务 1 是文本检测 (多语言文本)。 任务2是文本识别。

文本检测

有11个与任务1相关的文件需要下载,它们分别是:

ch8_training_images_x.zip(x from 1 to 8)
ch8_validation_images.zip
ch8_training_localization_transcription_gt_v2.zip
ch8_validation_localization_transcription_gt_v2.zip

测试集不需要下载。

文本识别

有6个与任务2相关的文件需要下载,它们分别是:

 ch8_training_word_images_gt_part_x.zip (x from 1 to 3)
 ch8_validation_word_images_gt.zip
 ch8_training_word_gt_v2.zip
 ch8_validation_word_gt_v2.zip
 ```
</details>


在下载完成后, 将文件放于 `[path-to-data-dir]` 文件夹内,如下所示:
path-to-data-dir/ mlt2017/ # text detection ch8_training_images_1.zip ch8_training_images_2.zip ch8_training_images_3.zip ch8_training_images_4.zip ch8_training_images_5.zip ch8_training_images_6.zip ch8_training_images_7.zip ch8_training_images_8.zip ch8_training_localization_transcription_gt_v2.zip ch8_validation_images.zip ch8_validation_localization_transcription_gt_v2.zip # word recognition ch8_training_word_images_gt_part_1.zip ch8_training_word_images_gt_part_2.zip ch8_training_word_images_gt_part_3.zip ch8_training_word_gt_v2.zip ch8_validation_word_images_gt.zip ch8_validation_word_gt_v2.zip

```

返回dataset converters