资源数据集Visual Question Answering V2.0 图像数据

Visual Question Answering V2.0 图像数据

2019-12-18 | |  117 |   0 |   0

VQA is a new dataset containing open-ended questions about images. These questions require an understanding of vision, language and commonsense knowledge to answer.

  • 265,016 images (COCO and abstract scenes)

  • At least 3 questions (5.4 questions on average) per image

  • 10 ground truth answers per question

  • 3 plausible (but likely incorrect) answers per question

  • Automatic evaluation metric



上一篇:WikiText 英语词库数据

下一篇:Retailrocket 电子商务网站行为数据

用户评价
全部评价

热门资源

  • GRAZ 图像分类数据

    GRAZ 图像分类数据

  • MIT Cars 汽车图像...

    MIT Cars 汽车图像数据

  • 凶杀案报告数据

    凶杀案报告数据

  • 猫和狗图像分类数...

    Kaggle 上的竞赛数据,用以区分猫和狗两类对象,...

  • Bosch 流水线降低...

    数据来自产品在Bosch真实生产线上制造过程中的设备...