IMDb完整数据集合(2025)

一、数据集概述

IMDb完整数据集合(2025),包含丰富的数据样本,适用于机器学习、数据分析和学术研究。具体内容请参考以下数据详情章节。

二、基本信息

三、数据内容详情

文件夹结构

本数据集包含 1 个子文件夹,共计 5 个文件。 其中:CSV 5 个。

文件夹:imdb_datasets

数据统计汇总

文件: name.basics.csv

字段说明

数据样本(前3行)

文件: title.akas.csv

字段说明

数据样本(前3行)

文件: title.basics.csv

字段说明

数据样本(前3行)

四、数据类型与标注情况

五、应用场景

• 数据探索与可视化分析

• 机器学习模型训练与验证

• 统计分析与报告生成

• 学术研究与教学实践

六、使用建议

• 使用前请进行必要的数据清洗和预处理

• 建议在使用前仔细查看数据集原始说明文档

• 表格数据请先检查缺失值、异常值等数据质量问题

属性
数据集名称 IMDb完整数据集合(2025)
类型 数量 / 内容
文件总数 5 个
CSV文件 5 个
统计项 数值
子文件夹数 1 个
总文件数 5 个
CSV数据总行数 3,000,000 行
属性
记录数 1,000,000 行
字段数 6 个
文件大小 55.84 MB
字段名 中文含义 说明
nconst nconst
primaryName primaryName
birthYear birthYear
deathYear deathYear
primaryProfession primaryProfession
knownForTitles knownForTitles
nconst primaryName birthYear deathYear primaryProfession knownForTitles
nm15853983 Madhura Sengupta
nm13529507 Beth Sweatman
nm3863177 Ellis Lin production_manager tt6295898
属性
记录数 1,000,000 行
字段数 8 个
文件大小 43.93 MB
字段名 中文含义 说明
titleId titleId
ordering ordering
title title
region region
language language
types types
attributes attributes
isOriginalTitle isOriginalTitle
titleId ordering title region language types attributes isOriginalTitle
tt2552038 1 Angelina Sets Sail/All Dancers on Deck original 1
tt0067580 1 Pink Narcissus original 1
tt18749848 6 Folge #1.16 DE de 0
属性
记录数 1,000,000 行
字段数 9 个
文件大小 81.91 MB
字段名 中文含义 说明
tconst tconst
titleType titleType
primaryTitle primaryTitle
originalTitle originalTitle
isAdult isAdult
startYear startYear
endYear endYear
runtimeMinutes runtimeMinutes
genres genres
tconst titleType primaryTitle originalTitle isAdult startYear endYear runtimeMinutes
tt20565428 short Vendetta Vendetta 0 2022.0 24
tt7845914 short We Love Her We Love Her 0 2017.0 13
tt28101923 tvEpisode Episode #1.685 Episode #1.685 0 2023.0
属性 说明
数据格式 CSV (逗号分隔值)
数据类型 结构化表格数据
标注情况 字段即标签,无额外标注需求
样本图片1
图1:样本图片示例
数据来自网络收集整理,如有侵权请联系网站管理人员,及时删除!
探险家的数据窝 » IMDb完整数据集合(2025)

提供各类遥感影像数据服务

立即查看 了解详情