基于DIKW知识图谱的排序学习路径推荐算法
--反馈
1、研究背景
该选题旨在实现一个基于DIKW知识图谱的排序学习路径推荐算法,在结合知识图谱的基础上,了解学习者的学习方向与目标,根据学习者预计要付出的学习时间与学习精力,根据其擅长与不擅长的领域,按照学习者的学习状况进一步给出一条合适且高效学习路径,帮助其更为全面且快速地掌握知识点。
在信息技术高速发展的今天,人们的学习方式在不断的发生变化,通过互联网来了解和学习新事物已成为人们日常生活中不可缺少的一部分。随着知识经济的发展,人工智能的不断进步,人们可以通过互联网轻而易举地获取所需要的信息,同时也可以快速地传递信息,方便的进行信息的交换与流通。与此同时,在线网络学习也在快速地的发展着,并得到了广泛的推广和应用;现如今,学习者可以通过慕课、网易云课堂等许许多多的网络学习平台学习自己想要学习的知识。不难想象,在未来,通过互联网来学习知识必然会成为人们学习的主要方式。
而在互联网未普及的时候,学习者的学习方式大多数是依靠书本来完成,学习者要想学习自己想要获取的知识点,便只能按部就班的按照书本的编排来实现,这一方式较为繁琐并且耗时较长。但是在互联网高速发展的今天,学习者通过网络学习平台学习知识点,然而在学习过程中,学习者往往会因为网络上的数据庞杂,无法找到自己所需要的知识点,同时也无法学习全部知识点,因此产生“学习迷航”和“认知过载”的问题。随着互联网的不断发展,网络上的信息资源呈现指数形式增长,因此,学习者便会面临的问题便是学习者本身吸收知识的容量是有限度的,而网络学习平台资源是无限的,因此,为保证学习者的学习进展顺利,如何选择知识点进行学习便成为一个重要的课题。
段玉聪老师在[1,2]中针对学习者在学习过程中出现的认知过载和学习迷航问题,提出了具体的解决办法,基于知识图谱进行学习路径排序,具体就是需要帮助学习者辨识出学习资源中有哪些知识占有较大的比重,并依据大数据得出学习者群体学习目标知识点所需要的时间和花费精力的平均水平,即学习投入,用于衡量目标知识点整个在知识体系中的地位,给予学习者以参考;并设计学习者能力调查问卷,在学习者进行学习之前,提醒学习者进行测试,并依据测试结果,初步预估学习者的学习效率;同时构建目标知识点所对应的习题测试库,在学习者学习结束后,提示学习者进行习题测试,依据习题测试结果,初步获取学习者对目标知识点的掌握情况;将学习者学习能力平均水平与学习者个体进行对比分析,比较其差异,对学习者划分能力等级,最终根据学习者已学习知识点和目标知识点,遍历知识体系图谱,为学习者推荐合适的学习路径。
图1 体系结构
通过此体系结构,指引学习者学习方向,优化学习路径,帮助学习者进行高效的学习,有效使用学习资源,提高学习资源的使用效率。
知识图谱是以科学知识为对象.显示学科的发展进程与结构关系的一种图形,具有“图”和“谱”的双重性质与特征。作为对科学知识及其间的关系可视化所得出的结果.具有较为直观、定量、简单与客观等诸多优点,被广泛应用并取得较可靠的结论。目前成为科学计量学、管理学、科学学和情报学等领域的研宄热点.
知识图谱的起源最早可追溯到文献计量学和科学计量学的诞生时期.1938年Bernal制作了早期学科图谱:1948年Kllingham手工绘制了图表.形象地展示自然科学和技术分支学科间的关系同年.普赖斯用简单的曲线可视化科学知识指数增长规律,到20世纪50年代.加菲尔德创制《科学引文索引》.并以编年体形式手工绘制引文网络图谱:随后“文献耦合”、“科学引文网络”、“同被引”、“共词”、“引文可视化”等相继被提出.科学知识可视化成为专门研宄领域。从20世纪末开始,随着计算机网络技术的迅猛发展.特别是信息可视化技术的突破.复杂网络系统和社会网络分析方法的引入.科学技术研宄受到各国普遍重视,知识的数量、种类和结构呈快速变化.受到基因图谱、信息可视化、GIS和超文本可视化发展的影响而正式提出知识图谱.应用分析是知识图谱研宄的重要部分.是其理论、方法与工具研宄的目的.受到国外众多学者关注。
知识图谱2012年加入Google搜索,2012年5月16日正式发布,首先可在美国使用。知识图谱除了显示其他网站的链接列表,还提供结构化及详细的关于主题的信息。其目标是,用户将能够使用此功能提供的信息来解决他们查询的问题,而不必导航到其他网站并自己汇总信息。
知识点作为本文构建知识图谱的基本元素,因此必须对知识点的概念、关联关系以及其性质有清楚的认识,下面分别对其进行介绍。
知识点是学习活动中传递知识信息的基本单元,单独的知识点应能体现知识内容本身的拒不完整性,知识点的集合能保证专业知识体系的全局完整性知识点之间的关系是连接知识点的纽带,使分散的知识点形成相互关联的知识结构。
依据专业课程的组织划分为基础,将知识点划分为元知识、章知识和篇知识,元知识是知识体系中相对独立、不能再分割的基本知识点章知识是由相关元知识关联组合得到的,表达一定范围内比较完整的知识篇知识是对章知识进一步的分类和总结得到的。
同一课程的不同知识点间具有一定的关联关系,因此对知识点进行建模时,需要考虑知识点之间的关联关系。在教育领域一般认为知识点的关联关系分为以下几种语义关系。
1. 先序关系:必须先学习知识点A才能学习知识点B,即学习知识点A需要知识点B的支持。先序关系具有传递性,包括直接先序关系和间接先序关系。
(1)直接先序关系
如果学习知识点A后可以直接学习知识点B,则两者满足直接先序关系。
图2 直接先序关系
(2)间接先序关系
如果学习知识点A后还需要学习其他知识点才能学习知识点B,则两者满足间接先序关系。
图3 间接先序关系
2. 涵盖关系:结点A包含的知识点涵盖了结点B,学了结点A可以不用再去学习结点B。
图4 涵盖关系
3.或关系:对于最终学习目标,学习知识点A和知识点B都可以达成学习目标C。
图5 或关系
4. 与关系:平行关系即结点间是独立的,具有与关系的知识点在学习过程中不存在先后顺序。
图6 与关系
5.必要结点:对于最终学习目标,一定要去学习的知识点。
6.游离结点:对于某个知识体系来讲,游离结点是对这个知识体系无用的知识点。
3、研究内容和研究方法
(1)研究内容如下:
为了防止学习者在学习过程中出现认知过载和学习迷航问题,就需要辨识出学习资源中有哪些知识占有较大的比重,并根据大数据训练得出学习者群体学习各个知识点所需要的时间和精力的平均水平,即学习投入,以衡量该知识点在知识体系中的地位,给予学习者以参考,并且在学习过程中,构建该知识点相对应的习题测试库,根据习题测试结果,初步获取学习者对知识点的掌握情况,对完成的试题进行分析,可以清楚了解每个学习者对知识点的掌握情况,帮助学习者完善对知识点的掌握。通过完成由知识点改编的试题来检验学习者是否真正掌握知识点的有效方法。同时,以问卷的形式对学习者进行学习能力调查,学习能力调查是学习者检测自己学习能力的重要法宝。
结合知识图谱,了解学习者的学习目标,结合所付出精力时间与学习能力,了解其精通与有缺陷的领域,因材施教,按其学习状况从而给出进一步的学习路径推荐,帮助其完成学习目标。
(2)研究方法如下:
通过查阅文献,获取与知识图谱以及学习路径推荐相关的文献资料并加以调查,从而全面地、正确地了解掌握所要研究的问题并且充分地了解国内外在该领域的发展历程和研究现状,以便于后续的研究开展。
2、设计方案
步骤一:构建有向的学习点的知识图谱,以“软件工程专业”为案例,初步构建了知识体系图谱。
图7 知识体系图谱
步骤二:通过大数据得出学习者在学习某知识点所需要花费的时间和精力的平均值,也就是对此知识点的学习投入,以此得出权值从而在知识体系图谱上做出标记;方案:以某高校“软件工程专业”为例,通过对课程的课程时长以及学生的成绩,以学生成绩来借代投入精力,将测试结果成绩90至100分为表现优秀,成绩80至90分为表现较好,成绩70至80分为表现一般,成绩60至70分为表现及格,成绩在60以下则为不通过。从而得出较为粗略的学习投入。
图8 个体课程学习情况
步骤三:构建习题测试库,对每个课程构建相应的习题测试,并在学习者学习完相应知识点并对其测试,根据测试结果,可以初步得出学习者对于此知识点的掌握情况,并根据学习情况,构建学习者资源子模型,学习者资源子模型分为三个模块,分别为已学习知识点、未学习知识点和目标知识点。以“软件工程专业”为例,将已学习知识点标记为红色,将未学习知识点标记为绿色,将目标知识点标记为黑色。
图9 学习者资源子模型
步骤四:设计能力调查问卷,在学习者学习前进行问卷测试,根据问卷调查结果将学习者能力水平分为“上”“中”“下”三等,初步得出学习者学习知识点的效率。下图即为学习者能力调查问卷。
学习者自主学习能力调查问卷 | |||||
非常符合 | 符合 | 一般 | 不符合 | 非常不符合 | |
学习中,如产生焦虑,烦躁会停下来做别的事进行调解 | |||||
通常会给自己设定近期目标和长远目标 | |||||
经常对一个时期的学习进行总结 | |||||
除自己本专业,也会对其他学科感兴趣并了解 | |||||
对自己的学习过程及结果能够有科学的评价 | |||||
坚持不懈地学习,直到达到目标 | |||||
能主动掌握适合自己的学习方法 | |||||
善于运用网络资源和平台 | |||||
与老师沟通交流,阐述自己的想法 | |||||
能够主动的对学习内容进行科学的取舍 | |||||
快速准确地搜集到适合自己的学习资料 | |||||
对你而言,移动设备是很好的学习工具并且运用自如 | |||||
能够跟进时代步伐,掌握专业发展方向 | |||||
灵活地运用网络技术和碎片化时间进行学习 | |||||
小组合作中,能合理分配任务并有质量地完成 | |||||
时常与大家分享知识和学习心得 | |||||
充分利用课堂学习资源,自如调控自己的学习 遇到问题会找同学老师讨论 | |||||
把目前的学习与近期学习目标进行比较,考察学习进展情况 | |||||
闲暇时,主动选择学习场所,学习资源进行学习 | |||||
对自己的学习时间安排具有合理性和科学性 | |||||
学习中遇到难题时,利用图书馆和网络资源寻求帮助 | |||||
对一段时间的学习进行科学评价,调整学习计划,改变学习方法 |
图10 能力调查问卷
步骤五:将大数据得出学习者的学习能力同个体进行对比分析,比较其差异,划分学习者的能力等级。
步骤六:获取学习者的学习目标以及学习该知识点的学习投入,根据公式计算确定具体目标类型。根据得到的目标类型,确定在哪一层资源处理框架上进行遍历,若学习者学习目标比较简单,预期学习投入较少,学习能力较弱,则在数据图谱上基于元知识向学习者推荐学习点和学习路径若学习者学习目标难度一般,预期学习投入一般,学习能力一般,则在信息图谱上基于章知识向学习者推荐学习点和学习路径若学习者学习目标难度较大,预期学习投入多,学习能力较强,则在知识图谱上基于篇知识向学习者推荐学习点和学习路径。以“软件工程专业”为例,算法中的哈希算法、快速反应算法、首次适应算法和最佳适应算法都属于元知识,在操作系统中的连续分配知识则需要算法中的哈希算法、快速反应算法、首次适应算法和最佳适应算法等元知识以及程序的装入与链接构成章知识,整个操作系统学习需要学习算法、数据结构等构成篇知识。
步骤七:标记学习者已学习知识和目标学习知识点,根据得出的结果,遍历知识体系图谱找出目标学习知识点的所有先序结点,也就是未学习知识点,并按照学习投入,也就是所需权重进行排序,从而进行学习。其中,对于存在涵盖关系的结点,假定某学习目标A涵盖学习目标B和学习目标C,判断学习目标B和学习目标C是否都是学习者能够达成目标学习知识,若能够达成,分析学习目标A和同时学习学习目标B和学习目标C所需的学习投入,若不能,选择学习投入较少的学习目标添加到学习路径中。
步骤八:基于产生的结果,将其它必要学习目标和并行学习目标添加至学习路径中,从而得出完整的学习路径,推荐给学习者。以”Web开发与实践”为目标学习知识点,则有两条路径可以选择,一条便是学习“Java编程语言”,另一条则是同时学习“数据库原理与实践”和“静态网站开发技术与实践”;假设上一条学习路径的学习投入较少,则推荐上一条学习路径。
图11 学习路径推荐
步骤九:在学习者学习过程中,不断获取学习者的反馈,并监测外部学习环境的变化。
3、拟解决的问题
(1)构建相应学科的知识体系图谱
(2)构建学习者能力模型,较为清楚的划分学习者能力等级
(3)在获取学习者的反馈时,如何有效监测外部学习环境的变化。
4、创新点
(1)合理配置和有效使用学习资源,提高学习资源的使用效率,也正是因为网络上的学习资源虽然丰富,但是良莠不齐,因此基于知识图谱的排序学习路径推荐算法帮助学习者按需学习,不需要花费大量时间在海量资源中寻找自己需要的学习资源。
(2)指引学习者学习方向,避免学习者出现知识迷航的现象,同时,优化学习路径,是学习者在学习时有高效的学习策略,建立合适的学习体系,有效使用学习资源,提高学习资源的使用效率。
(3)对不同学习能力的学习者进行分析,建立相应的学习者模型,有效针对学习者的学习情况。
(4)依据外界学习环境变化,使知识点分布和学习路径能够动态调整。
论文结构安排
知识图谱初步构建