《人民日报》新闻数据集
《人民日报》新闻数据集
数据说明:
中国著名报纸《人民日报》,2021年01月01日至2023年12月05日消息。对于每个文件名像20210131-02-04,意味着它是2021/01/31的新闻在02页和04段。你可以用这个数据集训练中文文本生成模型,进行聚类以创建新闻的标记,做一些NLP研究。(本数据约有80.8K条新闻)
《人民日报》新闻数据集
数据说明:
中国著名报纸《人民日报》,2021年01月01日至2023年12月05日消息。对于每个文件名像20210131-02-04,意味着它是2021/01/31的新闻在02页和04段。你可以用这个数据集训练中文文本生成模型,进行聚类以创建新闻的标记,做一些NLP研究。(本数据约有80.8K条新闻)