IMDb完整数据集合(2025)
IMDb完整数据集合(2025)
一、数据集概述
IMDb完整数据集合(2025),包含丰富的数据样本,适用于机器学习、数据分析和学术研究。具体内容请参考以下数据详情章节。
二、基本信息
三、数据内容详情
文件夹结构
本数据集包含 1 个子文件夹,共计 5 个文件。 其中:CSV 5 个。
文件夹:imdb_datasets
数据统计汇总
文件: name.basics.csv
字段说明
数据样本(前3行)
文件: title.akas.csv
字段说明
数据样本(前3行)
文件: title.basics.csv
字段说明
数据样本(前3行)
四、数据类型与标注情况
五、应用场景
• 数据探索与可视化分析
• 机器学习模型训练与验证
• 统计分析与报告生成
• 学术研究与教学实践
六、使用建议
• 使用前请进行必要的数据清洗和预处理
• 建议在使用前仔细查看数据集原始说明文档
• 表格数据请先检查缺失值、异常值等数据质量问题
| 属性 | 值 |
| 数据集名称 | IMDb完整数据集合(2025) |
| 类型 | 数量 / 内容 |
| 文件总数 | 5 个 |
| CSV文件 | 5 个 |
| 统计项 | 数值 |
| 子文件夹数 | 1 个 |
| 总文件数 | 5 个 |
| CSV数据总行数 | 3,000,000 行 |
| 属性 | 值 |
| 记录数 | 1,000,000 行 |
| 字段数 | 6 个 |
| 文件大小 | 55.84 MB |
| 字段名 | 中文含义 | 说明 |
| nconst | nconst | |
| primaryName | primaryName | |
| birthYear | birthYear | |
| deathYear | deathYear | |
| primaryProfession | primaryProfession | |
| knownForTitles | knownForTitles |
| nconst | primaryName | birthYear | deathYear | primaryProfession | knownForTitles |
| nm15853983 | Madhura Sengupta | ||||
| nm13529507 | Beth Sweatman | ||||
| nm3863177 | Ellis Lin | production_manager | tt6295898 |
| 属性 | 值 |
| 记录数 | 1,000,000 行 |
| 字段数 | 8 个 |
| 文件大小 | 43.93 MB |
| 字段名 | 中文含义 | 说明 |
| titleId | titleId | |
| ordering | ordering | |
| title | title | |
| region | region | |
| language | language | |
| types | types | |
| attributes | attributes | |
| isOriginalTitle | isOriginalTitle |
| titleId | ordering | title | region | language | types | attributes | isOriginalTitle |
| tt2552038 | 1 | Angelina Sets Sail/All Dancers on Deck | original | 1 | |||
| tt0067580 | 1 | Pink Narcissus | original | 1 | |||
| tt18749848 | 6 | Folge #1.16 | DE | de | 0 |
| 属性 | 值 |
| 记录数 | 1,000,000 行 |
| 字段数 | 9 个 |
| 文件大小 | 81.91 MB |
| 字段名 | 中文含义 | 说明 |
| tconst | tconst | |
| titleType | titleType | |
| primaryTitle | primaryTitle | |
| originalTitle | originalTitle | |
| isAdult | isAdult | |
| startYear | startYear | |
| endYear | endYear | |
| runtimeMinutes | runtimeMinutes | |
| genres | genres |
| tconst | titleType | primaryTitle | originalTitle | isAdult | startYear | endYear | runtimeMinutes |
| tt20565428 | short | Vendetta | Vendetta | 0 | 2022.0 | 24 | |
| tt7845914 | short | We Love Her | We Love Her | 0 | 2017.0 | 13 | |
| tt28101923 | tvEpisode | Episode #1.685 | Episode #1.685 | 0 | 2023.0 |
| 属性 | 说明 |
| 数据格式 | CSV (逗号分隔值) |
| 数据类型 | 结构化表格数据 |
| 标注情况 | 字段即标签,无额外标注需求 |
