文件描述及提交格式要求:http://www.pkbigdata.com/c/00000000058/data
本次竞赛中,我们将从某高校的某个学院随机抽取一定比例学生,提供这些学生在三个学期的图书馆进出记录、一卡通消费记录、图书馆借阅记录、以及综合成绩的相对排名。这一部分数据将作为训练数据。我们从另外的某学院随机抽取一定比例的学生,然后提供他们在三个学期的图书馆进出记录、一卡通消费记录、图书借阅记录、以及前两个学期的成绩排名。第三学期的成绩排名作为预测目标。
文件描述
训练\成绩.csv。训练集的成绩文件,包含学期、学号、以及相对排名
训练\借书.csv。训练集的图书借阅信息,包含学期、学号、书号、日期
训练\图书门禁.csv。 训练集的图书门禁进入,包含学期、学号、日期、时间
训练\消费.csv。训练集的消费数据,包含学期、学号、地点、日期、时间、金额
测试\成绩.txt。 测试集的成绩文件。字段同上
测试\借书.txt。 测试集的图书借阅信息。字段同上
测试\图书门禁.txt。 测试集的图书门禁进入。字段同上
测试\消费.txt。 测试集的消费数据。字段同上
sample_submission.txt——一个正确格式的样品提交文件
提交文件格式要求:
-
建议提交csv格式文件(txt格式也可以识别, 但需要保证每行两列以“逗号”为分隔符)
-
有且仅有两列,按顺序依次为学号和排名
-
文件必须包含表头,第一列表名为id,第二列表名为rank
-
文件共92行,第一行表头,其余91行数据,每行数据以“回车” 分隔
-
两列数据均为整型
-
两列数据范围均在1-91之间,每一列的91个数据取且取满91 个整数,不可有重复