中国人民大学继续教育学院顾宗连教授主持完成的国家社会科学基金项目《基于语义网的远程教学资源管理及个性化知识服务模型研究》(项目批准号为06叠罢蚕016),最终成果为研究报告、软件:基于语义网的远程教学资源管理及个性化知识服务模型研究报告;基于飞别产的本体构建和管理平台;社会化本体构建系统平台;语义网本体的远程教育个性化教学系统。课题组成员有:宋继华、缪代文、冯霞、孙新、张媛等
一、研究价值和研究背景
广义上,语义网可以认为是能将当前的网络信息理解为一种带有语法、句法的网。狭义上,语义网更接近本体含义,理论上被认为是一种能对知识进行描述的网,因而能最完善地解决计算机信息,特别是知识类信息智能化问题的方法。因此,语义网研究的蓬勃发展为我国知识资源服务系统,特别是数字化图书馆知识整合、智能化服务和知识共享等的发展带来了新的机遇。这项成果研究目的就是探索网络信息时代知识型数字图书馆的语义网知识资源服务体系的构成和创建模式,以及如何为网络教育提供个性化知识传递和个性化教学服务。成果属于语义网研究领域中的数字图书馆与网络教育教学领域结合的基础性与应用性研究课题,也可看作是网络时代数字化图书馆知识整合与知识共享中的一个分支问题。对这种属于不同学科领域的交叉研究,无论是国内还是国外均很少见到。
业内人士公认,目前,语义网本体开发和建设面临两个非常巨大的困难,一个是随着系统规则变化越来越多,语义完成所需要的推论时间急剧增加,给搜索带来困难。解决这个问题需要计算机硬件和软件专家的相互配合,这项成果对该问题未做深入讨论。此外,语义本体的创建工作量巨大,计算机专家、学科领域专家和相关研究领域专家都一直在研究本体构建自动和半自动的方法,成果对此进行了尝试性技术研究。
二、主要研究内容和研究结论
成果首先对以本体语义网为知识结构的数字图书馆不同知识资源的关系、构成与建设模式进行了分析;之后,对语义网知识资源与网络教育资源建设和教学活动的关系进行了梳理,建立了网络信息时代学习者需要的智能型数字资源之间的关系模型。在此基础上,又从网络教育实践者的角度,比较系统地开展了语义网本体资源构建的研究和基于语义网的知识资源和学习活动资源对网络教育个性化服务的研究。
成果在技术方法上重点关注了提高语义网本体工程建设效率的两种构建方法——自然语言处理技术自动化本体构建和社会化本体构建;在网络教育个性化服务中,主要研究了本体语义资源的检索技术和个性化学习内容推送技术等。
(一)学科知识的结构、本体语义网与语义网知识型数字图书馆的关系
通过对学科知识结构和本体层次关系进行对比研究后认为:第一,学科知识,其表现为学科现象、学科假说、学科理论和学科方法论与本体的四个层次,即应用本体、任务本体、领域本体、顶级本体间存在着对应关系,这种对应关系是我们建立不同类型、不同层次知识本体的基础。第二,学科方法论是本体论本身难以归纳描述的一类知识,因此在本体类知识型数字图书馆知识构建中,对这类知识进行本体化描述,其准确度将会受到影响。第叁,知识型数字图书馆的学科知识是那些具有概括性的、规律性知识,并不包含偶然的现象和信息。如果使用本体描述这类信息和现象,则准确度将大大下降。
在深入理解语义网、本体和知识等概念关系的基础上,通过文献调研,成果对信息时代语义网知识型数字图书馆的理论构想、技术途径、服务模式以及需要解决的问题进行了梳理后,得出叁个主要结论:第一,虽然语义网本体的建设工程非常巨大,但我国已经成熟的图书分类法为构建语义网格奠定了重要的理论基础,因此,数字图书馆具备采用网格、本体语义网,逐步构建、形成以本体内容表达为主要形式的知识语义网的条件。第二,基于语义网的知识型数字图书馆不但能更广泛地发挥传统图书馆的作用,而且还可在更广、更深的层次上发挥数字资源特有的知识服务、特别是远程服务的功能。在远程教育及逐步发展而来的社会化学习、终身学习社会中,具有语义的知识型数字图书馆将发挥出不可替代的重要作用。第叁,从语义网知识型数字图书馆的理论模型我们可以看出,无论从技术到人力,创建语义网知识型数字图书馆都是一项巨大的工程,需要各个领域、各个不同知识背景的专家们共同规划、统一协调,克服技术和管理的难关,才能使这一理想从理论走向现实。
(二)提高知识本体创建准确性和效率的方法
这项成果对目前本体构建方法和本体构建工具进行了较为充分的研究,发现目前这些方法均局限在专家个人创建领域本体的范围,没有涉及多专业集体协同工作完成本体创建的问题,并且,不同层次的本体创建均需要进行先期的技术处理,以降低工作难度,提高准确度和工作效率。基于以上认识,成果对社会化本体构建模式和社会化本体构建平台进行了一定的研究,并以此开发了包括本体创建、管理、评价和生长的软件平台,该平台采用了更广泛的用户共同对初始本体进行评价和贡献本体,比较科学地完成了社会化本体的构建、评价和自动演化生长。
语义网研究人员一直在努力寻找,在满足应用需要前提下,高效创建本体的工作方法。面对这一问题,成果首先使用了自然语言处理技术,基于分词算法的概念抽取技术,对来自于网络课程教学内容和该课程所属专业词典的术语进行了初步处理,但试验结果未能达到授课教师能够对术语做进一步处理的要求。之后,研究人员使用全自动化方式进行了本体构建,包括本体概念、实例的自动抽取、关系的自动构建试验研究。研究认为,使用自然语言处理技术进行计算机辅助构建本体,全自动化构建本体的出发点是正确的,但应用是否有效取决于两个条件:一个是领域本体要求的精确度。这项研究面对的教育领域、学术研究领域是属于对知识的精确度要求较高的领域;另一个是领域知识可结构化的程度。研究中参考样例“西方经济学”知识本体是一门偏重经验类的应用学科,若使用先期处理方法,其结构化程度不能很好满足教学本体建设的需要。为了保证本体能够符合教学和科研需要,这项研究参照了《本体工程论》中论述的本体创建方法,开发了比较适合教学和教师使用的本体创建工具,由西方经济学课程专家完成了课程知识领域初始本体的构建工作,包括100多个类、40多个属性、700多个个体。该本体创建系统包含有:类管理、属性管理、个体管理、查询功能、图形可视化功能和导出辞飞濒本体文件等功能。
(叁)网络学习领域本体构建和个性化学习服务
课题组经过文献调研和分析认为,由于前面提到的本体语义网在知识表达方面的固有缺陷,应用于计算机网络远程学习的智能化资源不应该只含有语义网,而需要多种类、多层次资源的组合。研究认为,基于语义网的个性化教学资源服务模型包括四个层次,分别是信息资源层、静态知识层、动态知识层、智能服务层。这样,在固化语义关联的静态知识基础上,知识服务在使用过程中能不断演化和改进,确保了知识服务的灵活性、动态性和智能性。这项研究针对非本体类学习资源,利用本体标注工具,进行了知识标注,使这些网页具有语义性质,成为计算机可理解的知识,为智能检索、智能答疑、个性化知识推送等智能教学打下了基础。
这项成果还认为,一个完整的、以语义网为基础的个性化智能教学系统,领域本体不能仅限于课程知识领域和相关学科知识领域本体,还需要包括教学策略领域本体、学生学习模型领域本体、学习诊断模型领域本体等。为了实施个性化学习服务,课题组对远程教学理论和适应成人学习者的远程学习模型进行了研究,对未来网络学习的发展趋势——社会化协作学习模式进行了研究。采用了北京师范大学远程教育研究所开发的“中国远程学习者学习风格量表”,并将该学习风格分析结果与跟踪记录学习者学习行为系统相结合,建立了学习者动态学习模型。在分析了学习目标和学习者学习特征基础上,课题组采用了探究、协作和任务驱动的学习策略,对课程学习系统进行了详细的设计,包括知识导航、交流环境、学习模块、学习跟踪及反馈、教师操作功能等。其中基于本体知识的图形导航、课程叠濒辞驳和学习者个人叠濒辞驳相结合的交流环境、记录学习者浏览资源等的电子学档、个性化学习建议等功能可以为学习者提供较为完整的个性化学习服务,具有较好的应用价值。
在个性化学习服务技术研究方面,这项成果基于本体的智能检索和个性化学习内容推送两个方面开展了研究,实现了基于本体的智能查询;实现了基于学习背景的学习建议内容推送、基于关键字查询的内容推送、基于学习进度的内容推送、基于课程&苍产蝉辫;叠濒辞驳的内容推送、基于学习者学习评价的内容推送和基于知识结构的内容推送等。研究认为,首先,个性化智能服务是一个多学科综合问题,另外,目前语义智能检索系统本身也存在诸多问题,如对信息资源的自动标注问题,检索结果的排序问题等,这些问题将直接影响到检索的效率。因此,这些方面还需要研究者们进行更深入的探索。
(责编:陈叶军)