马萨诸塞州建筑物数据集
马萨诸塞州建筑物数据集
一、数据集概述
马萨诸塞州建筑物数据集,包含丰富的数据样本,适用于机器学习、数据分析和学术研究。具体内容请参考以下数据详情章节。
二、基本信息
三、数据内容详情
文件夹结构
本数据集包含 2 个子文件夹,共计 604 个文件。 其中:图片 604 张。
文件夹:png
文件夹:tiff
数据统计汇总
文件: label_class_dict.csv
字段说明
数据样本(前3行)
文件: metadata.csv
字段说明
数据样本(前3行)
图像数据
• 图片总数: 约 604 张
• 图片格式: JPG / PNG
• 数据组织方式: 按类别文件夹分类(文件夹名即为类别标签)
数据集示例图片
示例图片 1: 23129125_15.png
示例图片 2: 23578915_15.tiff
四、数据类型与标注情况
五、应用场景
• 数据探索与可视化分析
• 机器学习模型训练与验证
• 统计分析与报告生成
• 学术研究与教学实践
六、使用建议
• 使用前请进行必要的数据清洗和预处理
• 建议在使用前仔细查看数据集原始说明文档
• 图像数据集建议使用数据增强技术以提升模型泛化能力
• 训练前请确认图片分辨率和类别分布是否均衡
• 表格数据请先检查缺失值、异常值等数据质量问题
| 属性 | 值 |
| 数据集名称 | 马萨诸塞州建筑物数据集 |
| 类型 | 数量 / 内容 |
| 文件总数 | 302 个 |
| 图片文件 | 302 张 |
| 包含子文件夹 | test、test_labels、train、train_labels、val、val_labels |
| 类型 | 数量 / 内容 |
| 文件总数 | 302 个 |
| 图片文件 | 302 张 |
| 包含子文件夹 | test、test_labels、train、train_labels、val、val_labels |
| 统计项 | 数值 |
| 子文件夹数 | 2 个 |
| 总文件数 | 604 个 |
| 图片总数 | 604 张 |
| CSV数据总行数 | 153 行 |
| 属性 | 值 |
| 记录数 | 2 行 |
| 字段数 | 4 个 |
| 文件大小 | 50 B |
| 字段名 | 中文含义 | 说明 |
| name | 名称 | |
| r | r | |
| g | g | |
| b | b |
| name | r | g | b |
| background | 0 | 0 | 0 |
| building | 255 | 255 | 255 |
| 属性 | 值 |
| 记录数 | 151 行 |
| 字段数 | 8 个 |
| 文件大小 | 44.09 KB |
| 字段名 | 中文含义 | 说明 |
| image_id | image_id | |
| split | split | |
| image_souce_url | image_souce_url | |
| label_source_url | label_source_url | |
| tiff_image_path | tiff_image_path | |
| tif_label_path | tif_label_path | |
| png_image_path | png_image_path | |
| png_label_path | png_label_path |
| image_id | split | image_souce_url | label_source_url | tiff_image_path | tif_label_path | png_image_path | png_label_path |
| 22678915_15 | train | http://www.cs.toronto.edu/~vmnih/data/mass_buildings/train/sat/22678915_15.tiff | http://www.cs.toronto.edu/~vmnih/data/mass_buildings/train/map/22678915_15.tif | tiff/train/22678915_15.tiff | tiff/train_labels/22678915_15.tif | png/train/22678915_15.png | png/train_labels/22678915_15.png |
| 22678930_15 | train | http://www.cs.toronto.edu/~vmnih/data/mass_buildings/train/sat/22678930_15.tiff | http://www.cs.toronto.edu/~vmnih/data/mass_buildings/train/map/22678930_15.tif | tiff/train/22678930_15.tiff | tiff/train_labels/22678930_15.tif | png/train/22678930_15.png | png/train_labels/22678930_15.png |
| 22678945_15 | train | http://www.cs.toronto.edu/~vmnih/data/mass_buildings/train/sat/22678945_15.tiff | http://www.cs.toronto.edu/~vmnih/data/mass_buildings/train/map/22678945_15.tif | tiff/train/22678945_15.tiff | tiff/train_labels/22678945_15.tif | png/train/22678945_15.png | png/train_labels/22678945_15.png |
| 属性 | 说明 |
| 数据格式 | CSV (逗号分隔值) |
| 数据类型 | 结构化表格数据 |
| 标注情况 | 字段即标签,无额外标注需求 |
| 数据格式 | JPEG / PNG 图像 |
| 数据类型 | 非结构化图像数据 |
| 标注情况 | 文件夹名称即为类别标签(已标注) |
