《新高考》杂志社
首页 > 期刊导读
 
/ / /
 

基于高考数据的分析和预测研究综述

 
来源:新高考 栏目:期刊导读 时间:2021-06-07
 

0 引言

随着信息时代的到来,作为全国参与人数最多和最受社会关注的考试,高考也开始不断推进信息化建设,线上报考、网上评卷、线上填报志愿,高考的整个过程都与现代信息技术紧密联系在一起。高考信息化使得各地教育部门累积了非常多与高考有关的数据,也在不知不觉中使得互联网中蕴藏了海量高考数据。而众所周知,在如今这个数据决定一切的大数据时代中,从海量高考数据中挖掘出对高考有所帮助的知识是教育部门和考生家长共同的迫切需求。目前有许多研究人员从不同角度出发,采用各种技术和方法致力于从高考数据中发现知识和规律,为考生、招生及教育部门在高考过程提供更科学、更合理的指导和服务。

本文对近年来基于高考数据进行的各类分析和预测研究进行概述,将该领域的相关研究按照研究技术和方法简单分为三类:基于统计分析的研究、基于数据挖掘的研究和基于机器学习的研究。

1 基于统计分析的研究

早期的基于高考数据的研究,大多是采用统计分析的方法,使用线性回归、灰色模型等来处理和分析高考数据,这些研究大多围绕如何更好地预测高考分数线这一问题进行。

较早的,韩向峰等人[3]提出了一种基于关键字的Web 数字信息挖掘方法来预测考生的录取概率。该方法首先通过设置关键词爬取Web 页面上的与高考招生相关的信息,然后基于获取的数据采用曲线拟合和多元线性回归对本专科分数线以及院校最低分数线进行预测。

针对采用单一预测模型的实验结果并不理想的问题,周帆[17]提出将Power 模型、Logarithm 模型和Linear模型进行组合,对每一个模型通过最小二乘法求得最佳变权系数,然后建立变权重组合预测模型预测重庆市文科二批次高考分数线。通过与单一模型进行对比,变权重组合模型的准确度得到提高。类似的,李敬文等人[16]也对组合模型预测进行了研究,他们整合了模糊数学理论和灰色GM(1,1)理论模型,在层次指标体系上提出了模糊灰色预测模型。研究结果表明模糊灰色组合预测结果较为准确。

同样基于灰色模型进行预测研究的还有杜轻等人[14]与杨丽娟等人[15]。前者基于2008-2013 年的某高校理工类各专业录取数据建立了GM(1,1)模型,预测了2014 年的各个专业的录取线差,对比预测值与真实值发现,相对误差在5%之内。而后者对现有研究中几种常见的预测方法进行了简单的实验,包括算术平均法、移动平均法、移动加权平均法,指数平滑预测法以及灰色预测GM(1,1)模型,结果表明这些方法在某些年份的预测偏差较大,但在某些年份预测又比较精准。

2 基于数据挖掘的研究

针对基于统计分析的研究存在的实验样本集较小的问题,研究者开始采用数据挖掘技术来进行研究。数据挖掘本身就是一种决策支持过程,这使得基于数据挖掘的研究大多围绕如何向考生和招生部门在高考中提供更好、更科学的决策支持这一问题进行,大多数研究偏向系统的设计与开发。

史贞军[1]以帮助考生及家长合理填报高考志愿为研究目标,提出开发一个高考志愿决策支持系统。其研究的关键技术是OLAP 和数据挖掘技术。他首先使用OLAP 构建高考多维数据集,并进行多维分析;然后采用SSAS 中的多元线性回归算法来预测高考录取分数线,其准确度在60%左右;采用朴素贝叶斯分类算法预测了考生报考专业的录取概率,预测准确率在70%到80%之间,同时还采用Apriori 关联规则算法探究不同专业的报考热度以及报考专业之间的关联度。类似的,徐刚强等人[5]在实现高考辅助决策系统的研究中,也使用了OLAP 和数据挖掘技术。他们在利用OLAP 数据集上使用多元线性回归算法预测新一年的高考录取分数,并用偏差检测方法对反常案例进行检测。

为了对现有志愿填报方式及其改革历程进行评估,曾铮[2]采用了将数据仓库技术、OLAP 联机分析技术和数据挖掘技术相结合的方法来进行研究。他利用OLAP 建立多维数据集,从志愿覆盖率、第一志愿的满额情况、志愿匹配的情况和最低录取分这四个方面对现行的志愿填报方式进行多维分析和评估;并利用SQL Server 提供的Microsoft 决策树算法和关联规则算法在OLAP 数据集上进行数据挖掘研究,重点对三个问题进行了实验研究——预测考生是否被第一志愿录取,挖掘2005 年前后影响考生录取的因素以及预测前三个志愿的录取情况。

以探究高考各科成绩之间的关系为研究目的,曾水光[4]采用关联规则挖掘和聚类分析来深入挖掘高考考生成绩数据。他使用Weka 对高考各科成绩之间的得分关系以及考生成绩和考生属性之间的关系进行了关联规则挖掘,此外,他还采用Weka 中的SimpleKMeans 聚类算法对考生进行了聚类分析,探究同一类别的考生所具有的特征和不同类别考生之间区别。

在志愿填报环节中,为考生推荐合理、合适的院校,从而尽可能的避免考生在收集和分析信息上浪费时间是很有必要的,因此严卫[19]提出采用模糊聚类挖掘技术构建更加科学的院校推荐模型。研究提出了基于减法聚类的模糊聚类算法初始聚类数目上限求解方法和基于有效性批判的最佳聚类数求解方法,并改进了模糊聚类算法的最佳聚类数初始化方法,提出了基于合并聚类中心的初始化方法。研究在英国统计学家 的Iris 数据集上进行了实验,对改进后的算法的有效性进行了验证。除此之外,针对模糊聚类算法没有考虑不同样本特征指标对聚类过程的贡献程度不一致的问题,严卫设计了一种基于特征加权的模糊聚类算法,实验结果表明与改进前的模糊聚类算法相比,基于特征加权的模糊聚类算法的误分率也降低了11.1%。

3 基于机器学习的研究

基于数据挖掘的研究虽然使用大量的数据进行挖掘,但大多数研究停留在使用工具提供的基础挖掘算法进行挖掘,所使用的算法的实验效果并不令人满意。随着近年来人工智能、机器学习的火热发展,有很多研究者开始采用基于机器学习的方法对高考整个过程中的成绩预测、分数线预测、志愿推荐等问题进行研究。

周琦[7]提出一种改进的决策树算法用于根据考生历年的高中成绩来预测其高考成绩。该研究以考生高中成绩作为分析依据,结合考生的个人信息等重要因素,采用C4.5 算法构建决策树;针对C4.5 算法中多次进行对数函数运算导致算法效率较低的缺点,他提出对C4.5 算法中信息熵计算公式进行改进,并用改进的C4.5 算法再次构建决策树。通过对比改进前后的算法构建的决策树,结果表明改进后的C4.5 算法预测有效性达到80%以上,较改进前的决策树算法有所提升。

Rensong Dong 等人[9]提出了一种基于支持向量机学习算法的预测方法来预测根据考生的志愿,该考生最有可能被哪所学校录取。研究基于2009-2010 年云南省的部分学生的高考和排名,大学招生计划数和其他相关数据,提出了包括高考成绩、排名、最低入学率、所有批次的得分线、所有批次高校的入学计划数量和入学率计划等在内的影响录取的14 个特征,采用支持向量机算法训练预测分析模型,实验结果表明预测准确率达到了90%。任建涛[21]采用支持向量回归算法,基于各院校专业过去10 年的录取平均分数线数据,对未来一年的院校专业线进行了预测。

为了研究模拟考试成绩与高考成绩之间的关系,陆丛林[8]基于江苏省海门市四甲中学538 名考生的六次模拟考试成绩,使用SVM 和神经网络两种算法分别进行了考生的高考成绩预测和考生的高考录取批次预测,研究中还进行了混合预测——第一步先依据考生模考成绩得到预测的高考成绩,第二步将模考成绩和第一步得到的高考预测成绩相结合来预测考生的录取批次。实验结果表明,模考成绩与高考成绩存在强关联关系,且支持向量机比神经网络的预测精度更好。

采用机器学习的方法来提升高考分数线预测的准确度是目前这个领域比较热门的研究点。徐宗保[11]在其研究中提出了一种基于神经网络的院校投档分数线预测方法。该方法对粒子群算法相关参数进行了改进,并利用改进后的粒子群算法去优化反向传播神经网络模型,以此来提升预测效果。其实验结果表明,与原始神经网络相比,改进的神经网络预测模型的预测精度有所提高。此外,徐宗保还对C4.5 算法的属性选择进行改进,提出了一种基于改进C4.5 算法的六档专业推荐法。研究表明该方法比传统的线差专业推荐法的准确率要高,且改进后的C4.5 计算时间有一定缩短。

基于神经网络进行研究的还有郭孝文等人[6]和任祥旭[13]。郭孝文等人[6]提出了一种基于改进的反向传播神经网络的分数线预测方法。他们建立了一个使用反向传播算法作为学习算法的自适应神经网络。研究使用近三年西安工业大学的分数线数据对模型的精度进行了验证,与传统分数线预测方法相比,预测准确度提高了20%。任祥旭[13]提出一种基于当前热门的人工神经网络对高校录取分数线进行预测的方法。研究使用了2013 年到2015 年的高校及专业的录取数据,考虑了16 种影响录取分数线预测的特征,使用LSTM 技术搭建神经网络模型,最后使用多种模型性能指标对预测结果进行评估,实验结果表明,模型预测准确率集中在误差5 分以内,但是超过5 分以外的预测结果偏差值较大。

Zhenru Wang 等人[10]针对现有研究中高考省控线的预测误差较大的问题提出了一种基于AdaBoost 算法的省控线预测方法。他们提出了多种影响省控线预测的特征,使用随机森林算法来进行特征选择,并使用PCA 方法处理数据集中的特征值,最终得到5 种特征。研究基于2006 至2015 年四川省高考数据,分别建立了AdaBoost 预测模型和随机森林预测模型。通过实验对比,结果表明,AdaBoost 预测模型在预测高考省控线时准确率超过90%,误差不超过5 分。除了省控线预测研究,王振如[12]采用了深度学习的方法对院校专业录取分数线的预测进行了研究,她基于北京邮电大学在北京地区2006 年到2015 年的高考数据,分别使用人工神经网络和多隐层的多层感知器算法训练预测模型。实验表明,深度学习比人工神经网络的预测准确度更高。

4 结语

通过对近年来该领域论文的总结发现,目前针对高考数据的分析和预测研究已经取得了一定的成果,但还存在一些问题亟需解决。

首先,大部分研究所使用的数据量有限,且部分研究使用从网络上收集的数据,难以避免错误和缺失数据,但是对于这类数据的处理方法在大部分研究中都没有详细研究。其次,现有研究缺乏对影响分数线预测或者其他类型预测的因素的探究,而这一步是提升预测准确度的关键。从早期的统计分析,到数据挖掘,再到如今的机器学习、深度学习,虽然基于的高考数据分析与预测研究所采用的技术在不断进步,但大部分研究只停留在算法应用层面,并没有根据实际应用场景和数据特征对算法进行改进,这也是未来的一个研究方向。

[1]史贞军.高考志愿决策支持系统的设计与实现[D].北京交通大学,2010.

[2]曾铮.基于OLAP 和数据挖掘技术的高考志愿填报方式分析评估方法[D].西南大学,2010.

[3]韩向峰,刘希玉.基于Web 挖掘的高考预测系统的设计与实现[J].计算机应用研究,2004,21(8):160-162.

[4]曾水光.基于数据挖掘的河北省高考数据分析研究[D].河北师范大学,2013.

[5]徐刚强,林燕.基于数据挖掘的招考志愿填报辅助决策支持系统[J].计算技术与自动化,2014,33(4):106-109.

[6]郭孝文,梁向阳.改进的BP 神经网络在分数线预测中的应用[J].西安工业大学学报,2018,v.38;No.205(03):102-108.

[7]周琦.改进的C4.5 决策树算法研究及在高考成绩预测分析中的应用[D].广西大学,2012.

[8]陆丛林.支持向量机在高考成绩预测分析中的应用[D].江苏:苏州大学,2015.

[9]DONG R.,WANG H.,YU Z.The Module of Prediction of College Entrance Examination Aspiration[C]//International Conference on Fuzzy Systems&Knowledge ,2012.

[10]WANG Z.,SHI of the Admission Lines of College Entrance Examination based on Machine Learning[C]//IEEE International Conference on Computer&,2017.

[11]徐宗保.高考志愿填报关键技术研究及系统实现[D].江苏大学,2017.

[12]王振如.基于机器学习的高考分数线预测系统的研究与实现[D].北京邮电大学,2017.

[13]任祥旭.基于人工神经网络的高考分数线预测研究[D].江西财经大学,2018.

[14]杜轻,董金明,韩雪.基于灰色GM(1,1)模型的分数线预测研究[J].信息与电脑:理论版,2015(5):31-32.

[15]杨丽娟,马源,傅梦岩,马丽萍.基于统计分析的高考录取省控线预测——以吉林省为例[J].数学学习与研究:教研版,2018(6):9-9.

[16]李敬文,陈志鹏,李宜义,祁士东.组合预测模型在高考数据预测中的应用研究[J].计算机工程与应用,2014,50(7):259-262.

[17]周帆.变权重组合预测法预测重庆市高考分数线[J].科教文汇,2009(25).

[18]刘晓红.基于偏好函数模型的高考志愿填报[J].西南民族大学学报:自然科学版,2018,v.44;No.188(04):86-92.

[19]严卫.模糊聚类挖掘技术研究及其在高考志愿填报服务中的应用[D].中南大学,2009.

[20]任建涛.推荐算法在高考志愿填报中的应用研究[D].云南财经大学,2018.

[21]CHI L.,LIN of BP Neural Network based on Genetic Algorithms Optimization in Prediction of Postgraduate Entrance Examination[C]//2016 3rd International Conference on Information Science and Control Engineering(ICISCE).IEEE,2016.

范佳琪(1996-),女,陕西汉中人,硕士研究生,研究方向为智慧教育和教育大数据

王慧亚(1996-),女,山东梁山人,硕士研究生,研究方向为人机交互与普适计算

0 引言随着信息时代的到来,作为全国参与人数最多和最受社会关注的考试,高考也开始不断推进信息化建设,线上报考、网上评卷、线上填报志愿,高考的整个过程都与现代信息技术紧密联系在一起。高考信息化使得各地教育部门累积了非常多与高考有关的数据,也在不知不觉中使得互联网中蕴藏了海量高考数据。而众所周知,在如今这个数据决定一切的大数据时代中,从海量高考数据中挖掘出对高考有所帮助的知识是教育部门和考生家长共同的迫切需求。目前有许多研究人员从不同角度出发,采用各种技术和方法致力于从高考数据中发现知识和规律,为考生、招生及教育部门在高考过程提供更科学、更合理的指导和服务。本文对近年来基于高考数据进行的各类分析和预测研究进行概述,将该领域的相关研究按照研究技术和方法简单分为三类:基于统计分析的研究、基于数据挖掘的研究和基于机器学习的研究。1 基于统计分析的研究早期的基于高考数据的研究,大多是采用统计分析的方法,使用线性回归、灰色模型等来处理和分析高考数据,这些研究大多围绕如何更好地预测高考分数线这一问题进行。较早的,韩向峰等人[3]提出了一种基于关键字的Web 数字信息挖掘方法来预测考生的录取概率。该方法首先通过设置关键词爬取Web 页面上的与高考招生相关的信息,然后基于获取的数据采用曲线拟合和多元线性回归对本专科分数线以及院校最低分数线进行预测。针对采用单一预测模型的实验结果并不理想的问题,周帆[17]提出将Power 模型、Logarithm 模型和Linear模型进行组合,对每一个模型通过最小二乘法求得最佳变权系数,然后建立变权重组合预测模型预测重庆市文科二批次高考分数线。通过与单一模型进行对比,变权重组合模型的准确度得到提高。类似的,李敬文等人[16]也对组合模型预测进行了研究,他们整合了模糊数学理论和灰色GM(1,1)理论模型,在层次指标体系上提出了模糊灰色预测模型。研究结果表明模糊灰色组合预测结果较为准确。同样基于灰色模型进行预测研究的还有杜轻等人[14]与杨丽娟等人[15]。前者基于2008-2013 年的某高校理工类各专业录取数据建立了GM(1,1)模型,预测了2014 年的各个专业的录取线差,对比预测值与真实值发现,相对误差在5%之内。而后者对现有研究中几种常见的预测方法进行了简单的实验,包括算术平均法、移动平均法、移动加权平均法,指数平滑预测法以及灰色预测GM(1,1)模型,结果表明这些方法在某些年份的预测偏差较大,但在某些年份预测又比较精准。2 基于数据挖掘的研究针对基于统计分析的研究存在的实验样本集较小的问题,研究者开始采用数据挖掘技术来进行研究。数据挖掘本身就是一种决策支持过程,这使得基于数据挖掘的研究大多围绕如何向考生和招生部门在高考中提供更好、更科学的决策支持这一问题进行,大多数研究偏向系统的设计与开发。史贞军[1]以帮助考生及家长合理填报高考志愿为研究目标,提出开发一个高考志愿决策支持系统。其研究的关键技术是OLAP 和数据挖掘技术。他首先使用OLAP 构建高考多维数据集,并进行多维分析;然后采用SSAS 中的多元线性回归算法来预测高考录取分数线,其准确度在60%左右;采用朴素贝叶斯分类算法预测了考生报考专业的录取概率,预测准确率在70%到80%之间,同时还采用Apriori 关联规则算法探究不同专业的报考热度以及报考专业之间的关联度。类似的,徐刚强等人[5]在实现高考辅助决策系统的研究中,也使用了OLAP 和数据挖掘技术。他们在利用OLAP 数据集上使用多元线性回归算法预测新一年的高考录取分数,并用偏差检测方法对反常案例进行检测。为了对现有志愿填报方式及其改革历程进行评估,曾铮[2]采用了将数据仓库技术、OLAP 联机分析技术和数据挖掘技术相结合的方法来进行研究。他利用OLAP 建立多维数据集,从志愿覆盖率、第一志愿的满额情况、志愿匹配的情况和最低录取分这四个方面对现行的志愿填报方式进行多维分析和评估;并利用SQL Server 提供的Microsoft 决策树算法和关联规则算法在OLAP 数据集上进行数据挖掘研究,重点对三个问题进行了实验研究——预测考生是否被第一志愿录取,挖掘2005 年前后影响考生录取的因素以及预测前三个志愿的录取情况。以探究高考各科成绩之间的关系为研究目的,曾水光[4]采用关联规则挖掘和聚类分析来深入挖掘高考考生成绩数据。他使用Weka 对高考各科成绩之间的得分关系以及考生成绩和考生属性之间的关系进行了关联规则挖掘,此外,他还采用Weka 中的SimpleKMeans 聚类算法对考生进行了聚类分析,探究同一类别的考生所具有的特征和不同类别考生之间区别。在志愿填报环节中,为考生推荐合理、合适的院校,从而尽可能的避免考生在收集和分析信息上浪费时间是很有必要的,因此严卫[19]提出采用模糊聚类挖掘技术构建更加科学的院校推荐模型。研究提出了基于减法聚类的模糊聚类算法初始聚类数目上限求解方法和基于有效性批判的最佳聚类数求解方法,并改进了模糊聚类算法的最佳聚类数初始化方法,提出了基于合并聚类中心的初始化方法。研究在英国统计学家 的Iris 数据集上进行了实验,对改进后的算法的有效性进行了验证。除此之外,针对模糊聚类算法没有考虑不同样本特征指标对聚类过程的贡献程度不一致的问题,严卫设计了一种基于特征加权的模糊聚类算法,实验结果表明与改进前的模糊聚类算法相比,基于特征加权的模糊聚类算法的误分率也降低了11.1%。3 基于机器学习的研究基于数据挖掘的研究虽然使用大量的数据进行挖掘,但大多数研究停留在使用工具提供的基础挖掘算法进行挖掘,所使用的算法的实验效果并不令人满意。随着近年来人工智能、机器学习的火热发展,有很多研究者开始采用基于机器学习的方法对高考整个过程中的成绩预测、分数线预测、志愿推荐等问题进行研究。周琦[7]提出一种改进的决策树算法用于根据考生历年的高中成绩来预测其高考成绩。该研究以考生高中成绩作为分析依据,结合考生的个人信息等重要因素,采用C4.5 算法构建决策树;针对C4.5 算法中多次进行对数函数运算导致算法效率较低的缺点,他提出对C4.5 算法中信息熵计算公式进行改进,并用改进的C4.5 算法再次构建决策树。通过对比改进前后的算法构建的决策树,结果表明改进后的C4.5 算法预测有效性达到80%以上,较改进前的决策树算法有所提升。Rensong Dong 等人[9]提出了一种基于支持向量机学习算法的预测方法来预测根据考生的志愿,该考生最有可能被哪所学校录取。研究基于2009-2010 年云南省的部分学生的高考和排名,大学招生计划数和其他相关数据,提出了包括高考成绩、排名、最低入学率、所有批次的得分线、所有批次高校的入学计划数量和入学率计划等在内的影响录取的14 个特征,采用支持向量机算法训练预测分析模型,实验结果表明预测准确率达到了90%。任建涛[21]采用支持向量回归算法,基于各院校专业过去10 年的录取平均分数线数据,对未来一年的院校专业线进行了预测。为了研究模拟考试成绩与高考成绩之间的关系,陆丛林[8]基于江苏省海门市四甲中学538 名考生的六次模拟考试成绩,使用SVM 和神经网络两种算法分别进行了考生的高考成绩预测和考生的高考录取批次预测,研究中还进行了混合预测——第一步先依据考生模考成绩得到预测的高考成绩,第二步将模考成绩和第一步得到的高考预测成绩相结合来预测考生的录取批次。实验结果表明,模考成绩与高考成绩存在强关联关系,且支持向量机比神经网络的预测精度更好。采用机器学习的方法来提升高考分数线预测的准确度是目前这个领域比较热门的研究点。徐宗保[11]在其研究中提出了一种基于神经网络的院校投档分数线预测方法。该方法对粒子群算法相关参数进行了改进,并利用改进后的粒子群算法去优化反向传播神经网络模型,以此来提升预测效果。其实验结果表明,与原始神经网络相比,改进的神经网络预测模型的预测精度有所提高。此外,徐宗保还对C4.5 算法的属性选择进行改进,提出了一种基于改进C4.5 算法的六档专业推荐法。研究表明该方法比传统的线差专业推荐法的准确率要高,且改进后的C4.5 计算时间有一定缩短。基于神经网络进行研究的还有郭孝文等人[6]和任祥旭[13]。郭孝文等人[6]提出了一种基于改进的反向传播神经网络的分数线预测方法。他们建立了一个使用反向传播算法作为学习算法的自适应神经网络。研究使用近三年西安工业大学的分数线数据对模型的精度进行了验证,与传统分数线预测方法相比,预测准确度提高了20%。任祥旭[13]提出一种基于当前热门的人工神经网络对高校录取分数线进行预测的方法。研究使用了2013 年到2015 年的高校及专业的录取数据,考虑了16 种影响录取分数线预测的特征,使用LSTM 技术搭建神经网络模型,最后使用多种模型性能指标对预测结果进行评估,实验结果表明,模型预测准确率集中在误差5 分以内,但是超过5 分以外的预测结果偏差值较大。Zhenru Wang 等人[10]针对现有研究中高考省控线的预测误差较大的问题提出了一种基于AdaBoost 算法的省控线预测方法。他们提出了多种影响省控线预测的特征,使用随机森林算法来进行特征选择,并使用PCA 方法处理数据集中的特征值,最终得到5 种特征。研究基于2006 至2015 年四川省高考数据,分别建立了AdaBoost 预测模型和随机森林预测模型。通过实验对比,结果表明,AdaBoost 预测模型在预测高考省控线时准确率超过90%,误差不超过5 分。除了省控线预测研究,王振如[12]采用了深度学习的方法对院校专业录取分数线的预测进行了研究,她基于北京邮电大学在北京地区2006 年到2015 年的高考数据,分别使用人工神经网络和多隐层的多层感知器算法训练预测模型。实验表明,深度学习比人工神经网络的预测准确度更高。4 结语通过对近年来该领域论文的总结发现,目前针对高考数据的分析和预测研究已经取得了一定的成果,但还存在一些问题亟需解决。首先,大部分研究所使用的数据量有限,且部分研究使用从网络上收集的数据,难以避免错误和缺失数据,但是对于这类数据的处理方法在大部分研究中都没有详细研究。其次,现有研究缺乏对影响分数线预测或者其他类型预测的因素的探究,而这一步是提升预测准确度的关键。从早期的统计分析,到数据挖掘,再到如今的机器学习、深度学习,虽然基于的高考数据分析与预测研究所采用的技术在不断进步,但大部分研究只停留在算法应用层面,并没有根据实际应用场景和数据特征对算法进行改进,这也是未来的一个研究方向。参考文献:[1]史贞军.高考志愿决策支持系统的设计与实现[D].北京交通大学,2010.[2]曾铮.基于OLAP 和数据挖掘技术的高考志愿填报方式分析评估方法[D].西南大学,2010.[3]韩向峰,刘希玉.基于Web 挖掘的高考预测系统的设计与实现[J].计算机应用研究,2004,21(8):160-162.[4]曾水光.基于数据挖掘的河北省高考数据分析研究[D].河北师范大学,2013.[5]徐刚强,林燕.基于数据挖掘的招考志愿填报辅助决策支持系统[J].计算技术与自动化,2014,33(4):106-109.[6]郭孝文,梁向阳.改进的BP 神经网络在分数线预测中的应用[J].西安工业大学学报,2018,v.38;No.205(03):102-108.[7]周琦.改进的C4.5 决策树算法研究及在高考成绩预测分析中的应用[D].广西大学,2012.[8]陆丛林.支持向量机在高考成绩预测分析中的应用[D].江苏:苏州大学,2015.[9]DONG R.,WANG H.,YU Z.The Module of Prediction of College Entrance Examination Aspiration[C]//International Conference on Fuzzy Systems&Knowledge ,2012.[10]WANG Z.,SHI of the Admission Lines of College Entrance Examination based on Machine Learning[C]//IEEE International Conference on Computer&,2017.[11]徐宗保.高考志愿填报关键技术研究及系统实现[D].江苏大学,2017.[12]王振如.基于机器学习的高考分数线预测系统的研究与实现[D].北京邮电大学,2017.[13]任祥旭.基于人工神经网络的高考分数线预测研究[D].江西财经大学,2018.[14]杜轻,董金明,韩雪.基于灰色GM(1,1)模型的分数线预测研究[J].信息与电脑:理论版,2015(5):31-32.[15]杨丽娟,马源,傅梦岩,马丽萍.基于统计分析的高考录取省控线预测——以吉林省为例[J].数学学习与研究:教研版,2018(6):9-9.[16]李敬文,陈志鹏,李宜义,祁士东.组合预测模型在高考数据预测中的应用研究[J].计算机工程与应用,2014,50(7):259-262.[17]周帆.变权重组合预测法预测重庆市高考分数线[J].科教文汇,2009(25).[18]刘晓红.基于偏好函数模型的高考志愿填报[J].西南民族大学学报:自然科学版,2018,v.44;No.188(04):86-92.[19]严卫.模糊聚类挖掘技术研究及其在高考志愿填报服务中的应用[D].中南大学,2009.[20]任建涛.推荐算法在高考志愿填报中的应用研究[D].云南财经大学,2018.[21]CHI L.,LIN of BP Neural Network based on Genetic Algorithms Optimization in Prediction of Postgraduate Entrance Examination[C]//2016 3rd International Conference on Information Science and Control Engineering(ICISCE).IEEE,2016.

范佳琪(1996-),女,陕西汉中人,硕士研究生,研究方向为智慧教育和教育大数据


文章来源:新高考 网址: http://xgk.400nongye.com/lunwen/itemid-39884.shtml


上一篇: 广东省慈善总会:阳光助学,温暖学子
下一篇: 职业教育论文_教育部:加快建立“职教高考”制度



点击在线投稿

 
/ / /
 
 
 
 

Copyright 2001-2021 400农业期刊网版权所有 做最专业学术期刊论文发表网站
本站不是《新高考杂志社》官网,如果需要联系官方杂志社,请联系客服索取网站或者电话。