雅虎答案主题分类数据集
雅虎答案主题分类数据集
数据说明;
雅虎答案主题分类数据集是使用10个最大的主要类别构建的。每个类包含140,000个训练样本和6000个测试样本。因此,该数据集中的训练样本总数为1.400.000,测试样本为6万。从所有的答案和其他元信息中,只使用了最佳答案内容和主要类别信息。
社会与文化
科学与数学
健康
教育与参考
计算机与互联网
运动
商业与金融
娱乐与音乐
家庭与人际关系
政治与政府
雅虎答案主题分类数据集
数据说明;
雅虎答案主题分类数据集是使用10个最大的主要类别构建的。每个类包含140,000个训练样本和6000个测试样本。因此,该数据集中的训练样本总数为1.400.000,测试样本为6万。从所有的答案和其他元信息中,只使用了最佳答案内容和主要类别信息。
社会与文化
科学与数学
健康
教育与参考
计算机与互联网
运动
商业与金融
娱乐与音乐
家庭与人际关系
政治与政府