身高体重数据集
一、数据集概述
本数据集包含 25,000 条人体身高与体重的记录数据,来源于 SOCR(Statistics Online Computational Resource)项目。数据以 CSV 格式存储,包含序号、身高(英寸)和体重(磅)三个字段。该数据集适用于统计分析、回归分析、机器学习模型训练(如身高预测体重、体重预测身高等)以及数据可视化等场景。
二、基本信息
| 数据集名称 | 身高体重数据集 |
|---|---|
| 数据格式 | CSV |
| 数据量 | 25,000 条记录 |
| 字段数量 | 3 个字段 |
| 文件大小 | 594.1 KB |
| 更新时间 | 2026年04月16日 |
三、数据内容详情
3.1 字段说明
| 字段名 | 说明 |
|---|---|
| Index | 数据序号(1-25000) |
| Height(Inches) | 身高,单位为英寸(1英寸 = 2.54厘米) |
| Weight(Pounds) | 体重,单位为磅(1磅 = 0.4536公斤) |
3.2 身高统计分析
| 统计项 | 数值 |
|---|---|
| 最小身高 | 60.28 英寸(153.1 厘米) |
| 最大身高 | 75.15 英寸(190.9 厘米) |
| 平均身高 | 67.99 英寸(172.7 厘米) |
| 数据量 | 25,000 条 |
3.3 体重统计分析
| 统计项 | 数值 |
|---|---|
| 最小体重 | 78.01 磅(35.4 公斤) |
| 最大体重 | 170.92 磅(77.5 公斤) |
| 平均体重 | 127.08 磅(57.6 公斤) |
| 数据量 | 25,000 条 |
| 压缩包体积 | 628.2 KB |
四、数据类型与标注情况
本数据集为结构化表格数据,所有字段均为数值类型,无需额外标注。数据质量良好,不存在缺失值。
五、应用场景
• 身高与体重相关性分析与回归建模
• 机器学习入门教学(线性回归、决策树等)
• 数据可视化(散点图、直方图、箱线图等)
• 统计学分析(均值、方差、分布拟合等)
• BMI(身体质量指数)计算与健康分析
六、使用建议
• 使用前注意单位转换:英寸→厘米(×2.54)、磅→公斤(×0.4536)
• 建议先进行数据探索(EDA),了解身高体重的分布特征
• 可用于训练线性回归模型,验证身高与体重之间的线性关系
• 数据集不含缺失值,可直接用于模型训练
• 适合作为数据科学入门练习数据集