资源数据集Visual Question Answering 数据集

Visual Question Answering 数据集

2019-11-05 | |  84 |   0 |   0

VQA is a new dataset containing open-ended questions about images. These questions require an understanding of vision, language and commonsense knowledge to answer.

  • 265,016 images (COCO and abstract scenes)

  • At least 3 questions (5.4 questions on average) per image

  • 10 ground truth answers per question

  • 3 plausible (but likely incorrect) answers per question

  • Automatic evaluation metric


上一篇:纽约市出租车行车位置记录(2013年)

下一篇:JRC Names 实体专有名词库

用户评价
全部评价

热门资源

  • GRAZ 图像分类数据

    GRAZ 图像分类数据

  • MIT Cars 汽车图像...

    MIT Cars 汽车图像数据

  • 凶杀案报告数据

    凶杀案报告数据

  • 猫和狗图像分类数...

    Kaggle 上的竞赛数据,用以区分猫和狗两类对象,...

  • Bosch 流水线降低...

    数据来自产品在Bosch真实生产线上制造过程中的设备...