用于视障人士执行图像字幕任务的数据集
用于视障人士执行图像字幕任务的数据集
数据说明;
总体而言,视觉辅助数据集包含属于21大类的1600幅不同图像。选择这些类别是为了满足视障人士可能寻求援助的基本需要。这个数据集主要集中在几个用例上,以不同的方式帮助他们:人行横道,湿地板标志牌的建筑工程,货币检测,公交车站,楼梯,室外餐厅,按钮,电梯等。
里面不仅仅是行和列。通过描述您是如何获取数据的以及它所代表的时间段,也可以让其他人很容易地开始。
用于视障人士执行图像字幕任务的数据集
数据说明;
总体而言,视觉辅助数据集包含属于21大类的1600幅不同图像。选择这些类别是为了满足视障人士可能寻求援助的基本需要。这个数据集主要集中在几个用例上,以不同的方式帮助他们:人行横道,湿地板标志牌的建筑工程,货币检测,公交车站,楼梯,室外餐厅,按钮,电梯等。
里面不仅仅是行和列。通过描述您是如何获取数据的以及它所代表的时间段,也可以让其他人很容易地开始。