2015年9月 中国管理信息化 China Management Informationization Sep.,2015 第l8卷第17期 VoI_l8.No.17 基于Apriori算法的数据关联规则在教务管理中研究 朱艳鹏.王晓权 (合肥工业大学(宣城校区)商学系,安徽宣城242000) [摘要]当今时代,数据已经渗透到各行各业,是真正有价值的资产。如何从海量的数据中提取有用信息。成为人们关注 的焦点。数据挖掘为人们提供了一种处理数据的智能技术 本文简述了关联规则挖掘的发展历程.并对数据挖掘中经典的 Apfiofi算法进行改进,来分析某些大学课程间的关联关系,旨在帮助高校更好地安排教学课程和计划。 [关键词]数据挖掘;关联规则;Apfiori算法;成绩分析 doi:10.3969/i.issn.1673—0194.2015.17.126 [中国分类号】G64;C939 [文献标识码】A [文章编号】1673—0194(2015)17—0244-O3 O 引 言 征,如何从这些海量的数据中挖掘出有用的信息以指导决策显 云时代来临,大数据也引起了越来越多的关注。大数据具有 得至关重要。目前,我国各高校普遍采用教务管理系统对学生成 Volume(:: ̄:2)、Variety(多样)、Velocity(高速)、Value(值)的特 绩等信息进行管理。对于动辄上万人的高等院校来说。随着时间 的积累,教务管理系统中必然存在着大量的数据.遗憾的是。这 [收稿日期]2015—06—05 的支持体系.在三者的共同作用下更好地促进了大学生创业的 本,形成创业集群效应,降低创业风险。创业孵化器是提高大学 成功率。特别是社会投资,在发达国家社会投资是大学生创业体 生自主创业成功率的有效平台.应鼓励社会多方力量积极 系建设的重要力量.是大学生创业资本的主要来源之一 借鉴德 参与大学生自主创业孵化器的建设.充分整合各类资源,依托各 国的经验,我国也可以由、高校和民间组织共同作用,打造 地区适合大学生创业项目集中孵化的特色工业园区、大学科技 一个由、高校、银行、中介机构、民间组织等多组织部门协同 园、jj ̄-r贸易梯度转移产业基地等场所.建立大学生自主创业孵 大学生创业企业入驻 作用的。高效的创业支持平台。通过该平台整合各方的资源,真 化基地,并积极引导社会力量参与提供咨询、物业等服务.吸引 正起到促进大学生自主创业的作用.提高大学生自主创业的意 愿.扩大大创项目的宣传和影响力。并动员社会更多的企业单 8 设计合理的创业评估机制 位、社会团体以及个人参与对大学生自主创业的支持.特别是鼓 创业扶持体系 7 加强创业信息平台和大学生自主创业孵化器建设 为了保障大学生自主创业项目的有效实施.应该设计合理 察,包括对创业教育、创业财政金融等各方面的评估: 励有雄厚资金实力、有丰富投资经验的风投基金等,参与大学生 的评估机制。①对所制定的创业要进行全面广泛的考 ②要对大学生自主创业项目的内容进行合理评估.比如在创业 在高速发展的信息社会.特别在当前利用互物网或物联网 预备和创业实施阶段.要确定创业项目的收益水平和受益程度. 进行全民创业的时代.创业信息平台的建设对大学生自主创业 要测度实施的效用程度和实施的自身成本等;③对项 有重要的促进作用 建议部门重视对大学生创业信息平台 目的评估应该贯穿于创业活动的整个过程.初期要对项目的策 的建设。大力打造集专业服务、管理决策、成果转化等多项功能 划书、项目组核心成员、项目前景、成本以及受益进行评估.中期 于一体的创业信息平台.重点引导和培育效益高、示范作用强的 要对项目实施过程、项目管理、市场开拓,以及项目负责人的能 大学生创业服务中心 力进行客观评估。后期是要对项目的整体效益进行测评。为了使 一个完备的创业服务中心.笔者建议其具体功能应包括以 项目评估更加科学.还应该引进社会第三方评价主体.比如咨询 下几方面:①要建立大学生创业者信息管理服务系统,就大学生 公司、第三方评估机构等。 创业所面临的问题提供及时有效的后续服务和跟踪指导;②要 建立创业项目资源库,构建创业信息、发布平台.实现区域 联网和资源同步共享.重视创业项目库的动态维护,力求做到信 我国大学生就业支持供需分析[J].中国青年研究,2014(6). 息对称,降低创业成本,提高项目成功率;③要完善项目开发、征 [1]靳敏.2014年中国大学生就业报告[M].北京:社会科学文献 集、论证、展示和推荐的工作机制,确立大学生创业服务的规范, [2]麦可思研究院.出版社.2014. 面向大学生创业者公布各项行政审批、核准、备案事项和办事指 主要参考文献 南.并为创业者提供项目信息、咨询、小额贷款、代办手续等 [3]赵建国,么晓敏.大学生就业扶持的有效性分析及改进:基于 “~站式”服务.提高创业服务的效率 此外.要加强大学生自主创业孵化器建设。具体而言.应当 DEA方法的实证分析[J].数学的实践与认识,2013(6). [4]周海涛,董志霞.美国大学生创业支持及其启示[J].高等教育研 究,2014(6). 加强我国创业基地、科技孵化器等创业集群建设。集聚社会资 244|CHINAMANAGEMENT FoRMATloNlzATloN 教育教学研究 3 关联规则在成绩分析中的应用 行转换.课程名称由中文名称转换为英文替换代码(如运筹学转 化为Course3),学生成绩由百分制转换为等级制,[100,9o]转化 3.1数据准备 本文选择安徽省某高校商学系教务管理系统中学生成绩作 为A,[90,80]转化为B,以此类推,60分以下记为E。特别地,补 为研究对象.时间跨度为2012年9月一2014年6月。从中选取 考通过记为D.补考未通过记为E。iofi算法及生成关联规则 概率论与数理统计、线性代数、运筹学、统计学原理、计量经济 33应用Apf学、财务管理、投资学原理等经管类核心课程成绩,将该系102 依据改进后的数据挖掘流程.对经过预处理的数据应用 Apfiofi算法生成侯选集.然后基于侯选集。根据给定的最小支持 度判断并确定频繁项集。同时从频繁项集产生简单关联规则,然 名学生上述7门成绩作为关联规则挖掘的原始数据信息 3.2数据预处理 数据预处理包括数据清理、数据集成、数据变换、数据消减 后根据指定的最小置信度阈值选出强关联规则.对这些关联规 进而对过滤出的规则进行分析。 等过程。教务管理系统中成绩数据主要问题在于存在缺失值。以 则只选取提升度大于1的规则.及补考成绩只记为通过或者不通过。针对上述情况.采用忽略元 本文中最小支持度为0.1。最小置信度定为0.8。 组的方法进行数据预处理 同时出于方便数据挖掘之目的.对学生成绩和课程名称进 表1生成关联规则表 本例中.所得结果见表1。 规则ID 1 前项 Course4=A Course1--A Course2=A 后项 Course7=A 实例 l3 支持度/% 12.7 置信度/% 100 提升度 5.1 2 Course3=A 3 4 5 Course1--A Course4=B 12 Course1 A Course3=A Coumel=A Course3=A Course7=A Coume2=A Course2=A Course7=A l1 12 l1 l1 1O.8 l1.8 10.8 10.8 l0o 92 91 91 5.1 2.83 2.81 4.64 3.4数据挖掘结果分析 依据数据挖掘产生的结果.结合选定各门课程的性质进行 分析。可以得到如下结论: (3)从教务管理部门角度,教务管理部门应该合理控制、安 排基础课程和专业课程的开课顺序、间隔时间等,同时不能够一 味压缩专业课程或基础课程的课时量.致使课堂教学学时不足、 (1)数学基础课程成绩关联密切,可以根据规则8看出,“概 学生掌握知识深度不够.给后续学习造成不便。 率论与数理统计”成绩为“优”与“线性代数”成绩为“优”关系支 4 结束语 持度和置信度高.且提升度也较高.因此根据数据挖掘结果可以 得出数学基础课程关联较为紧密 (2)数学基础课程成绩优异是统计学和投资学成绩优异的基 本文由当前高校教务管理中广泛遇到的数据得不到有效利 用,无法为师生、教学管理服务的问题出发,建立关联规则数据 挖掘流程.对选定的数据进行关联规则挖掘.并对结果进行分析 础。根据规则2、规则5可以得出,对于统计学、投资学这两门需 及提出相应的对策 要较多数算的学科.数学基础课程的学习和运算能力对学 习这两门专业课产生重要影响 本文主要完善了关联规则数据挖掘流程.特别是将提升度 加入模式识别.使其区别于以往Apriori算法中“支持度一置信 (3)运筹学和财务管理这两门管理类学科需要较好的数学 度”的框架.剔除无趣的关联规则,使结果更为可靠。最后根据挖 基础 从规则4中.可以看出基础课程较好的学生在这两门课中 表现优异.反之亦然 掘结果从不同角度提出相应的建议和对策。 3.5数据挖掘结果启示 主要参考文献 (1)从学生角度.商学系学生如果希望能够在专业课程中有 较为出色的表现。必须掌握数学基础课程,夯实数学基础,进而 具备在专业课表现优秀乃至继续深造的可能性 (2)从教师角度.数学基础教师应该在严格要求学生学好基 [1]Jiawei Han,Micheline Kamber.Data Mining:C0nc pts and Techniques [M].北京:机械工业出版社,2012:157—183. [2]Xindong Wu,Vipin Kumar.rI’lIe Top Ten Algorithms in Data Mining[M]. 北京:清华大学出版社,2013:56—72. r3 1Efraim Turban l ̄Lmesh Shards Dursun Delen.Business Intelligence-A 础课程的同时.将专业课中案例等与基础课程相结合,使其认识 到基础课程的重要性并感受到基础课程的魅力。而专业课老师 则应该在教学过程中适当补充相应的数学基础知识.而不是默 认学生们都已学过相关课程而不再讲解 managetical approach[M].北京:机械工业出版社,2012:128—130. 『4]姜晚云.关联规则在成绩分析中应用研究[D].合肥:合肥工业大学, 2oo6. 246,CHINA MANAGEMENTINFORMlA丁JONL乙ATION