欢迎来到中国论文库,分享知识,创造价值。
服务热线:  4000444813
当前位置:首页 > 论文大全 > 基础科学 >

基于遗传算法的组卷算法研究2017-09-21 16:33:51

摘要  随着对计算机辅助教育不断深入地研究,组卷系统越来越受到学者的关注。组卷问题可以看做是一个在一定约束条件下的多参数优化问题,其中的核心是智能组卷框架的设计,对组卷的质量和效率都有着直接的影响。
传统的组卷算法往往具有成功率低、组卷耗时长且试卷质量不高等不足,其生成的试卷通常不能满足需求。针对这个问题,本文在研究大量相关文献的基础上,采用遗传算法建立了一个高效的智能组卷模型。遗传算法通过模拟生物机制,可以实现对复杂的非线性问题的高效搜索。它没有搜索空间限制性的约束,能更好地满足智能组卷的需求。
本文针对传统遗传算法存在的收敛速度慢和容易在全局寻优出现的早熟问题,提出一种改进的遗传算法。改进的遗传算法利用分组自然数编码策略,直接避免了个体解码,大大提高了运行效率,且有较好的鲁棒性。本文建立了基于改进的遗传算法的智能组卷模型。实验结果表明,本文提出的基于遗传算法的组卷模型,在组卷成功率和效率上都有显著的提高,能满足组卷的实际需求。
关键词: 遗传算法  智能组卷 试卷生成


Abstract  With the in-depth research of computer aided education, test paper generation system has obtained the increasing attention of scholars. Test paper generation can be regarded as a multi-parameter optimization problem under a certain constraint condition, and the design of the framework of intelligent-generating test paper is the core,  which has a direct impact on the quality and efficiency of test paper generation.
The traditional methods of test paper generation have the deficiencies of low success rate, time consuming, and the low test paper quality, while the generated test paper cannot meet the demand. To address this problem, based on the research on the large number of related literatures, this thesis employs the genetic algorithm and build an efficient model of intelligent-generating test paper. Genetic algorithm can achieve efficient search of complicated nonlinear problem by simulating biological mechanism. It has no search space restrictive constraints and better meets the needs of intelligent-generating test paper.
Aiming at the existing slow convergence speed and the premature problem in global optimization of traditional genetic algorithm, this thesis proposes an improved genetic algorithm. The improved genetic algorithm adopts the coding strategy of grouping natural number, which can directly avoid the individual decoding, greatly improve the efficiency, and has good robustness. The frame of intelligent-generating test paper based on the improved genetic algorithm is built. The experimental results show that the proposed intelligent-generating test paper model based on the improved genetic algorithm has the significant improvement on the success rate and efficiency and can meet the practical requirements of test paper generation.
Keywords: Genetic Algorithms, Intelligent-generating test paper,  Test paper generation
 
 
 
 
 
 
 
 
 

 
目  录
 
 
摘要 I
ABSTRACT II
目录
1引言 1
1.1课题研究背景及意义 3
1.2国内外研究现状 3
1.3本文组织结构 3
2 基于遗传算法的智能组卷概述 5
2.1 智能组卷的基本原则 7
2.2 智能组卷的指标体系 10
2.3 遗传算法的理论基础和关键技术 10
2.4 本章小结 10
3 基于改进的遗传算法的组卷框架 5
3.1 遗传算法的改进 10
3.1.1 改进遗传算法编码设计 7
3.1.2 种群初始化 10
3.1.3 适应度函数的确定 10
3.1.4 遗传算子的设计 10
3.1.5 算法终止条件 10
3.2 基于改进遗传算法的组卷流程 10
3.3 本章小结 10
4 系统实现和性能分析 5
4.1 智能组卷系统模块设计 10
4.2 智能组卷测试与性能分析 10
4.3 本章小结 10
5 结论 71
参考文献 93
附录 96
致谢 98
 


1 引言
1.1  课题研究背景及意义
随着计算机在各种领域的广泛应用,智能计算机辅助教学己逐渐发展成为一门集教育学、心理学、哲学、学习理论、传播学、信息论、控制理论、系统论、计算机科学、数学、电子等多学科知识于一身的新兴交叉学科,并受到各囡教育界的广泛重视。题库中的智能组卷算法又是智能计算机辅助教学
领域中的一个重要课题,具有极大发展空问和重要的研究价值。智能组卷是考试系统自动化操作的核心目标之一,它是按照教师和教学的要求,由计算机自动从试题库中选择试题,组成符合要求的试卷,它是智能计算机辅助教学的重要组成部分。智能组卷算法是智能计算机辅助教学的一个关键性问题,它是将人工智能技术与教育专家的组卷知识和经验相结合,由计算机来完成试卷内容的设计,并使生成的试卷达到专家级水平的一项顺应智能计算机辅助教学发展的智能组卷实现过程。考试是教学过程中的一个重要环节,是检验学生学习成绩和教学效果的重要手段,同时也为教师改进教学方法、提高教学质量提供了必要的信息。传统考试主要采用纸上做答的形式,教师在教学过程中需要花费大量的时问和精力进行试题收集、试卷编制、批改试卷和考试分析等工作,不但工作量大而且效率低,相比于传统的纸笔考试,智能组卷系统具有如下特点:题库集中管理、共享使用。任课教师根据经验进行试题的添充、更新和修订,由统一的权威机构来进行维护和管理。题库同时具备广泛与普遍的使用价值。具有快速和高效的优点。   
传统考试中,教师要准备一次考试,搜集资料,选考题的工作量十分繁重,而使用了组卷系统,可以大大提高工作效率,缩短考试周期。智能和科学的组卷方式。考试要达到预期的效果,需要有一份高质量的试卷来测试考生。要得到一份满足用户要求的试卷,需要科学的组卷方法。本课题是为了解决现有计算机智能组卷系统难以更好地满足实际考试需求这一问题提出的,设计并实现了一种基于改进遗传算法的智能组卷方法,对智能组卷技术做进一步的研究将对促进智能组卷的实际应用具有非常积极的意义。
1.2 国内外研究现状
美国人于20世纪60年代首先将计算机用于教育测验开始多年来计算机辅助测验系统得到了迅速的发展。在80年代,人们将系统应用于大规模等级考试,形成了计算机等级考试系统,典型的有美国的研究生入学考试、工商管理类研究生入学考试等[1]
在基计算机自适应测试系统中,组卷算法的设计与实现是问题求解的关键,是人工智能最古老、一直吸引国内外专家学者研究的问题。组卷问题涉及算法分析、数学建模、优化控制、人工智能等诸多领域。
近十几年来,为了顺应教育现代化的发展趋势,我国也自主开发研制了一些智能组卷系统,其中具有代表性的有西安交大等联合编制的高等学校工科大学物理课程试题库系统、清华大学等联合编制的高等学校工科高等数学课程试题库系统、山东省高教自考办公室等联合编制的高等数学题库系统以及全国计算机等级考试系统等等。
20年代中后期,荷兰的林顿等人针对组卷问题的特点率先把随机线性规划法引入测验编制领域,经过十几年的发展,产生了多种以线性规划为基础的自动组卷策略。其中具有代表性的有优先权策略、弱并行策略、误差补偿策略、随机抽题法及回溯试探法等。虽然研究出来很多策略,但每种策略又有其不足的地方,不少研究人员这些改进算法在一定程度上提高了组卷算法的效率和组卷结果的有效性,对一些小规模的试题库有着较好的性能,但是这些算法对于大规模题库仍显得力不从心,具有很大的盲目性,缺乏智能性,难以满足组卷需求。人们希望利用计算机的高效而廉价的运算能力求解一些困难的问题。这个问题是从可能的组合和序列中选取一个答案,不过由于现实问题的规模比较大,因此求解这些问题的程序很可能产生组合爆炸的可能性,即使是运算速度很高,内存很大的计算机对这类问题也会显得无能为力,从而导致问题难解。因此,研究者不断地探索求解问题的有效算法。
遗传算法是由美国教授于1975年在他的著作《自然系统和人工系统的适配>进化论和传学说的自适应随机全局优化算法。认为每一物种在不断的发展进程中都是越来越适应环境。遗传学认为每个细胞中封装有一种指令遗传码,以基因的形式包含在染色体中,每个基因有特殊的位置并控制着某种特殊的性质。每个基因产生的个体对环境有一定的适应性,基因杂交和基因突变可能产生对环境适应性强的后代,通过优胜劣汰的自然选择,适应值高的基因结构就保存下来。从整体上讲,遗传算法是进化算法中产生最早、影响最大、应用也比较广泛的一个研究方向和领域,它不仅包含了进化算法的基本形式和全部优点,同时还具备若干独特的性能,遗传算法的主要优点在于:对可行解表示的广泛性。遗传算法的处理对象不是参数本身,而是针对那些通过参数集进行编码得到的基因个体。这一特点使得遗传算法具有广泛的应用领域。
许多传统的搜索方法都是单点搜索,这种点对点的搜索方法,对于多峰分布的搜索空间常常会陷于局部的某个单峰的极值点。相反,遗传算法采用的是同时处理群体中多个个体的方法,即同时对搜索空间中的多个解进行评估。这一特点使遗传算法具有较好的全局搜索性能,也使得遗传算法本身易于并行化。纠错能力强,算法通过选择、交叉、变异操作能迅速排除与最优解相差极大的个体,本身可看作是一个并行滤波机制。不需要辅助信息。遗传算法仅用适应度函数值来评估基凶个体,并在此基础上进行遗传操作。更重要的是,遗传算法的适应度函数不仅不受连续可微的约束,而且其定义域可以任意设定。对适应度的唯一要求足,编码必须与可行解空问对应,不能有死码。由于限制条件的缩小,使得遗传算法的应用范围大大扩展。随机搜索特性。遗传算法不是采用确定性规则,而是采用概率的变迁规则来指导它的搜索方向。概率仅仅是作为一种工具来引导其搜索过程朝着上它有明确的搜索方向,具有内在的并行搜索机制。在所求解问题为非连续、多峰以及有噪声的情况下,能够以很大的概率收敛到最优解或满意解,因而具有较好的全局最优解求解能力。适应于其他问题,或者加入特定问题的领域知识,或者与已有算法相结合,能够较好地解决一类复杂问题,因而具有较好的普适性和易扩充性。
遗传算法具有固有的并行性和并行计算的能力。正是由于这些特点使得遗传算法广泛应用于计算机科学、神经网络、系统辨识、控制器设计、组合优化、机器学习、模式识别、工程式设计、信号处理、自适应控制和人工生命、经济管理和社会科学等领域,它也成为了21智能计算中的关键技术之一。将遗传算法应用于组卷问题仍处于研究阶段,针对遗传算法自身存在着不足以及组卷问题的特点,需要探索出更加符合组卷问题特点并能够克服遗传算法缺陷的改进算法。
1.2 本文组织结构
第l章引言,首先介绍了智能组卷的研究背景和意义,并对智能组卷的研究现状进行了介绍和分析。
第2章描述智能组卷的相关理论,主要介绍了智能组卷的基本原则,指标体系和常用的数学模型。
第3章系统地介绍了遗传算法。主要介绍了遗传算法有效性的理论依据和关键技术。
第4章研究并建立了基于改进遗传算法的智能组卷框架。基于传统遗传算法,对其编码方法、适应度函数、遗传算子都进行了研究和改进,并设计了改进遗传算法智能组卷的流程。
第5章实现基于改进遗传算法的智能组卷系统,并用测试数据对其进行了性能分析与评价。
2 智能组卷的相关理论
2.1  智能组卷的基本原则
组卷问题的基本原则包括6个方面[2]
组卷的依据为考试大纲,生成的试卷需要全面反映大纲的深度以及广度,试题数量要足够多,覆盖面要广。考题不仅需要反映考生对基本知识和技能的掌握程度,还要考查考生运用所学知识去解决问题的能力。
组卷不仅要考核考生知识掌握状况,并且需要促进其智力发展和提高。试题类型需要多样化,能从不同的方面考查考生的能力。因此,组卷时需要考虑试题功能及类型,选择最佳的组合方式。
组卷要有难度台阶,可以在考试分数上拉开距离。难度过小无法考查出考生的真实水平;而单独过大,超出考生的能力范围,则会导致考生失去信心。组卷基于大多数中等水平考生,形成一定的区分度和难度台阶,这样才会使考生的成绩具有差距和梯度。
组卷要发挥试题对考生的引导作用。考生通常都非常重视考试,容易受到考试这个指挥棒的影响。因此,可以通过组卷来引导学生正确地学习。
考试不能刻意地去出偏题,怪题,但需要有一定的广度和深度,要能考查出考生的知识水平和能力。
试题的表达要清晰准确,确保考试的可信度。根据制定命题计划和要求编制试题,并给出答案。同时需要对编出的试题进一步审查和筛选,并注明各试题的难度、区分度、所属章节及评分标准。
2.2  智能组卷的指标体系
智能组卷的指标体系是指试题参数,是对试题的内在属性、外在特征及其在考试系统中的功能进行定性的或定量的描述;它是建立试题库管理系统,实现计算机智能组卷的关键。试题的指标体系越丰富,组卷的质量越高。通常智能组卷的指标体系包含这些,当然根据不同需求可能会有所不同:
题型:试题的类型有多种划分形式,我们将试题类型划分为六种题型:填空题、选题题、判断题、概念与简答题、计算分析题、综合题五种。
所属章节:试题库中的试题均与课程的章节相对应。知识点:又称考核点,是试题内容所属的知识层次范围。
难度系数[3]:在试卷命题过程中,针对不同的考试对象、不同教学阶段的考试,试题的命题难度也不同,根据成卷要求,对难度系数进行搜索,以求出符合考核难度要求的试卷。
试卷的效度是衡量一项考试实现其既定目标的成功程度的指标,它反映了试卷内容与教学大纲或考试大纲的吻合程度。效度高的试卷,能够较准确地测试出学生掌握和运用所学知识的真实度。根据教学大纲或考试大纲进行命题,且各单元试题分数分配与学时数分配基本保持一致,下比关系,这是保证试卷效度的基础。
使用率是指题目的已出题次数和上次使用时问两个参数可以用来控制题目的使用率。为了试卷的保密性、公平性和安全性,在抽取试题进行组卷时,通过客观测试后由课题组成员根据教学经验加以调整。
 
 
 
参考文献 
[1]漆书青,戴海崎,丁树良.现代教育与心理测量学原理[M].北京:高等教育出版社,2002:245-246.
[2]宋兆鸿,刘世表,张才美,etal.现代教育测量[M].北京:教育科学出版社,1986
[3]杨峰.基于遗传算法的试题库管理及自动组卷系统的研究[D].[硕士学位论文].山东山东农业大学,2008

更多论文发表、期刊杂志投稿联系方式
联系QQ:862351366
联系电话:18161268802
投稿邮箱:862351366@qq.com
 
免费热线   4000444813
公司座机   028-65876501
全国咨询   13018295905
陈编辑 点击这里给我发消息  862351366   13018295905
刘编辑 点击这里给我发消息 1581273019   13018295905
 
服务邮箱   bianshen@vip.163.com

  • 杜 若-中电联官网-2017电力大数据应用创新大会
  • 吴锋-《现代传播》-美国新闻传播教育的最新进展与改革
  • 戴盛欧-《建筑工程技术与设计》-建筑设计过程中图示思维的意义和作
  • 张俊-《中国农业信息》-浅谈泰兴市农业信息化的现状与建议
  • 唐黎卿-《吉林省教育学院学报(下旬)》-高职商务英语专业基础课教学新思路
  • 高婵娟-《才智》-创新实践:浅析实拍影像与动画的异
  • 吴菲菲-《科技进步与对策》-专利质量综合评价指数--以我国生物
  • 宋生彪-《油气田地面工程》-从经营管理者入手强化油田公司内部
  • 乔慧娟-《商业时代》-论我国境外经贸合作区的风险防范问
  • 杨爱军-《读写算(教育教学研究)》-把握课标精髓促进读写结合--谈小学

关于我们 联系方式 评审要求 招聘信息 付款方式 媒体发布 英文期刊 论文转让 客户评价 网站地图 信誉说明

全国免费服务热线 4000444813  办公电话028-65876501 
企业QQ 800071531(猛戳我)投稿邮箱 bianshen@vip.163.com
联系地址:成都市武侯区川大学术交流中心  
ICP备案号:蜀ICP备1402865
本站所合作期刊,均为国家新闻出版总署:http://www.gapp.gov.cn 批准的、正规、合法、双刊号期刊。