nih胸部X光数据preprocessingoutput数据集
nih胸部X光数据preprocessingoutput数据集
一、数据集概述
nih胸部X光数据preprocessingoutput数据集,包含丰富的数据样本,适用于机器学习、数据分析和学术研究。具体内容请参考以下数据详情章节。
二、基本信息
三、数据内容详情
文件夹结构
本数据集包含 2 个子文件夹,共计 32,566 个文件。 其中:图片 32,566 张。
文件夹:test_resized
文件夹:train_224
数据统计汇总
文件: filtered_dataset_2class.csv
字段说明
数据样本(前3行)
图像数据
• 图片总数: 约 32,569 张
• 图片格式: JPG / PNG
• 数据组织方式: 按类别文件夹分类(文件夹名即为类别标签)
数据集示例图片
示例图片 1: 00001224_000.png
示例图片 2: 00008062_001.png
四、数据类型与标注情况
五、应用场景
• 数据探索与可视化分析
• 机器学习模型训练与验证
• 统计分析与报告生成
• 学术研究与教学实践
六、使用建议
• 使用前请进行必要的数据清洗和预处理
• 建议在使用前仔细查看数据集原始说明文档
• 图像数据集建议使用数据增强技术以提升模型泛化能力
• 训练前请确认图片分辨率和类别分布是否均衡
• 表格数据请先检查缺失值、异常值等数据质量问题
| 属性 | 值 |
| 数据集名称 | nih胸部X光数据preprocessingoutput数据集 |
| 类型 | 数量 / 内容 |
| 文件总数 | 9,103 个 |
| 图片文件 | 9,103 张 |
| 包含子文件夹 | test |
| 类型 | 数量 / 内容 |
| 文件总数 | 23,463 个 |
| 图片文件 | 23,463 张 |
| 包含子文件夹 | train |
| 统计项 | 数值 |
| 子文件夹数 | 2 个 |
| 总文件数 | 32,566 个 |
| 图片总数 | 32,569 张 |
| CSV数据总行数 | 60,683 行 |
| 属性 | 值 |
| 记录数 | 60,683 行 |
| 字段数 | 14 个 |
| 文件大小 | 9.67 MB |
| 字段名 | 中文含义 | 说明 |
| Image Index | Image Index | |
| Finding Labels | Finding Labels | |
| Follow-up # | Follow-up # | |
| Patient ID | Patient ID | |
| Patient Age | Patient Age | |
| Patient Gender | Patient Gender | |
| View Position | View Position | |
| OriginalImage[Width | OriginalImage[Width | |
| Height] | Height] | |
| OriginalImagePixelSpacing[x | OriginalImagePixelSpacing[x | |
| y] | y] | |
| Unnamed: 11 | Unnamed: 11 | |
| label | 标签 | |
| image_path | image_path |
| Image Index | Finding Labels | Follow-up # | Patient ID | Patient Age | Patient Gender | View Position | OriginalImage[Width |
| 00000002_000.png | No Finding | 0 | 2 | 81 | M | PA | 2500 |
| 00000005_000.png | No Finding | 0 | 5 | 69 | F | PA | 2048 |
| 00000005_001.png | No Finding | 1 | 5 | 69 | F | AP | 2500 |
| 属性 | 说明 |
| 数据格式 | CSV (逗号分隔值) |
| 数据类型 | 结构化表格数据 |
| 标注情况 | 字段即标签,无额外标注需求 |
| 数据格式 | JPEG / PNG 图像 |
| 数据类型 | 非结构化图像数据 |
| 标注情况 | 文件夹名称即为类别标签(已标注) |

