深度学习数据集 自然界物体 红宝石、绿松石、翡翠三类宝石图片数据集,数据集分为三个文件夹训练模型测试模型验证模型验证每个文件夹有六个子文件夹翡翠在火车~ 250 ~ 507图像图像在测试~ 250图像验证假翡翠在火车~ 250 ~ 500图像图像测试验证Ruby ~ 500 ~ 250图片,图片在火车在测试~ 250 ~ 250图像图像验证假Ruby在火车~ 250 ~ 536图像图像测试验证绿松石~ 500 ~ 250图片,图片在训练在测试~ 250 ~ 250图像图像验
文字 深度学习数据集 古波斯语楔形文字字体数据集,选择了开源的Tesseract引擎进行字符的分割、学习和分类。由于铭文中存在噪声(石缝),本文采用了一些图像处理技术来消除噪声。该系统的最终输出包括楔形字体的提取,句子的波斯语和英语的抄写,句子的发音和翻译大量提取的波斯语和英语单词,使我们更好地了解他们在那个时代的说话方式。通过验证和结果切片获得的结果表明,该系统能够较好地处理楔形文字的识别,对测试数据的所有字符进行了较好的分类,准确率约为92%。
文字 深度学习数据集 发票信息识别数据集,数据集由XML文件和图像组成。XML文件包含从发票图像中提取的数据,为了清晰起见,文本和XML文件的名称保持相同。数据集的用户应该提取发票号、发票数据、公司名称(从公司1到公司2的发票)、公司电话号码、地址等实体