跳转至

ICPR MTWI-2018 数据集

数据集下载

LSVT数据集官网 | 下载链接

注意: 在下载之前,请先注册一个账号。

该数据集共分为3个任务:任务1为网页图像的文本行(列)识别, 任务2为网页图像文本检测, 任务3为端到端的网页图像文本检测和识别,这三个任务共享相同的训练数据:mtwi_train.zip;任务1使用mtwi_task1.zip作为测试集, 任务2和3使用mtwi_task2_3.zip作为测试集。这里我们仅下载和使用mtw_train.zip

请从上述网站下载数据并解压缩文件。解压文件后,数据结构应该是这样的:

MTWI-2018
  |--- image_train
  |    |--- <image_name>.jpg
  |    |--- <image_name>.jpg
  |    |--- ...
  |--- txt_train
  |    |--- <image_name>.txt
  |    |--- <image_name>.txt
  |    |--- ...

数据准备

检测任务

要准备用于文本检测的数据,您可以运行以下命令:

python tools/dataset_converters/convert.py \
    --dataset_name mtwi2018 --task det \
    --image_dir path/to/MTWI-2018/image_train/ \
    --label_dir path/to/MTWI-2018/txt_train.json \
    --output_path path/to/MTWI-2018/det_gt.txt

运行后,在文件夹MTWI-2018/下会生成注释文件det_gt.txt

返回dataset converters