MOOC平台的系统使用性和社交性对学习者流失率的影响


 

MOOC平台的系统使用性和社交性对学习者流失率的影响

 

复旦大学管理学院 张成洪 彭志伟 陈弘 张意成

 

  【摘要】近年来,互联网和云计算的飞速发展促使了大型开放式网络课程(MOOC)的激增,然而,学习者坚持率偏低却是MOOC不可回避的问题。区别于传统的线下教学,人机交互(HCI)使得学习者在观看线上视频时能随意的做出暂停,加速等动作,而人与人的交互则主要靠在论坛中交流互动得以实现。这两种线上的交互方式弥补了线上教育互动的缺乏,但是对学习者的坚持率的影响却截然不同。本研究结合Coursera平台上一门课程的用户点击数据及论坛交流数据进行分析,结果发现人机交互赋予学习者更大的自由性有可能使得学习者更容易中途退出。而论坛交流实现的人与人的交互,却使得学习者对课程的粘性增加。其中,相比于与同学的交互,与教师的交互作用更为显著。除此之外,我们还发现,对于视频操作较多的学习者,论坛参与对于他们存在一个调节效应,即随着论坛交流的次数增多,视频点击行为的影响越小。更进一步的,对于越快寻求论坛交流的用户,学习者流失的可能性较小。

1 引言

  MOOC的大规模和破坏性的潜力已经使它成为崭露头角的一场教育革命(Christensen et al. 2013)。然而,线上学习者坚持率低下的问题,却是这场革命的阻碍。根据Coursera 网站上MOOC课程的完成率罕有超过15%。而edX 的最新数据也表明,在线学习者中途退出的比率几乎和最初的注册率一样高的惊人(Steve Kolowich 2012)。

  与传统的教育模式不同,人机交互方式的MOOC给予了学习者前所未有的自由,使他们得以自主安排自己学习的时间及方式;同时MOOC平台上的论坛,也给予了学习者与教师或其他学习者交流和讨论的场所。因此,一个重要的研究问题就是,在线交互的这两种模式,是否对学习者的坚持率产生了影响?如果是,它们分别产生了什么样的影响?

  致力于对该问题提供解答,本研究收集了Coursera平台上一门课程的数据,并对其进行了分析。我们的数据包括该课程超过2万名用户观看视频,浏览网页的点击数据,也包括用户在论坛中浏览和交流的数据。

  论文内容安排如下:第二部分,我们将回顾在线教育,人机交互和社会化媒体作用的相关文献,并提出我们的假设。第三部分,我们将介绍模型与变量。第四部门,我们基于数据集对模型进行回归,并阐述回归结果。最后,第五部分,我们将讨论本文的贡献及管理启示,对不足的地方做一个总结。

2 文献回顾

  2.1.关于在线学习者的流失率

  在线学习者的高流失率并不只是MOOC才有的问题。研究表明,在数字化学习平台(e-learning)的应用领域,也存在学习者流失率高的问题。一般来说,造成在线学习者流失,主要有平台外部与内部两方面的因素。内部因素,比如说虚拟学习环境的可靠性(Packham et al. 2004), 数字化学习平台平台上应用的适用性(Ardito et al. 2006)。此外,互动性教育视频也可以增加学习者的学习效率(Zhang et al. 2006),减少在线学习者的流失 (Packham et al. 2004)。这些影响流失率的内部因素可以通过改善平台的设计结构,功能,灵活性等得到控制(Packham et al. 2004)。

  然而,另一方面,影响流失率的,是与学习者本身有关的外部因素,比如说教育程度,家庭状况,工作及情况及可用来学习的时间(Packham et al. 2004)。这些是难以通过数字化学习平台平台本身的设计来改善的。这种情况下,类似于发邮件给学习者的干预方式,有可能起到一定的挽留作用(Simpson 2004)。

  随着信息和通信科技的发展,大部分数字化学习平台的系统开始在课程中添加社区的功能来增强学习者的粘性。在社区中,在线学习者得以与教师及同学进行沟通,寻求学习上的帮助,分享知识并相互鼓励。参与社区很大程度上减弱了虚拟学习环境中学习者的孤独感,很多研究也表明,讨论社区对于减弱在线网络课程学生的流失率,有积极的作用。(Fisher&Baird 2006; Miller& Lu 2003).

  从数字化学习平台到MOOC, 由于网络视频大规模和开放的特性,学习者流失率的问题好像变得更加严重了。然而,对于MOOC上学习者流失的研究却非常有限。Adamopoulos (2013)使用了一组现实世界的数据集,结合线上用户自发填写的采访数据,说明了在线学习者,在线课程,以及课程平台本身的特性对学生流失率的影响。他们发现,比起线上课程,学习者更愿意在传统教育环境中接受较难课程的教育(Jaggars2012),此外,人口特征变量并不能预测用户中途退出在线课程的行为(Willgingand Johnson 2004).

  这些之前的研究对于比如课程及学习者本身的这些静态的稳定的特性对学习者流失率的影响比较关注,却忽略了学习者在学习这个过程中的动态的变化及影响。当学生开始学习MOOC的时候,他们也开始了与人机交互,人与人交互的过程。而这些过程的体验可能渐渐的塑造学生对此课程的态度,然后影响他们的行为。

  因此,本研究将采取一个不同的视角,并试图探寻不同学习者在学习MOOC过程中,人机交互及人与人之间的交互程度的不同是如何最终影响他们对在线课程的完成度的。

  2.2 .MOOC的使用性

  我们所提到的MOOC人机交互的特性,在人机交互领域中,属于系统使用性(Usability)的一部分(Hornbæk2006)。系统使用性(Usability),指的是系统可被用户用来完成任务的方便性及效率性(Shackel1991),此外,也包括促进用户接受程度的系统的质量。 (Holzinger2005)。根据这些定义,我们总结MOOC的系统使用性主要包括自由性和稳定性两个方面:首先,自由性代表在网络课程平台中,播放教育视频的方便性及效率性。其次,系统的(质量)稳定性,指的是视频播放过程中的出错的概率。

  区别于传统的教育模式,在线课程的学习者可以自由,轻易地在课程中间采取一些行动。比如说,他们可以暂停视频去做其他的事情,加快视频的速度来快速浏览课程的内容,或者随意的拖动进度条跳到视频的任意位置。这些动作都是系统自由性的体现,在我们的研究中,通过加总学习者这三个方面的动作次数,来衡量学习者对系统自由性的使用程度。

  以往的文献通常认为,系统的使用性可以增加系统的使用 (Lecerofand Paterno 1998; Phang et al. 2009). 然而,对MOOC平台来说,可能并非如此。基于对学习本身需要沉浸,和集中注意力的考虑,我们猜想,在线学习者滥用系统的自由性,可能是学习过程中分心或者遇到困难的讯号,从而会导致流失率增高的结果。

  因此,我们提出本文的第一个假设:

  假设1 对系统自由性的使用程度越高的学习者,越有可能流失。

  此外,除去系统的自由性,我们同样也关注系统的稳定性。通过加总系统在播放视频时出现错误的次数,我们得到系统不稳定性的度量,并提出以下假设:

  假设 2 遇到系统不稳定的程度越高的学习者,越有可能流失。

  2.3 .MOOC的社交性

  MOOC人机交互的特征,主要指的是系统的使用性(Löwgren 2002), 而人与人的交互,在网络中,即网络平台的社交性,主要指的是学习者在网络社群中的交流(Preece2001)。MOOC的社交性主要是靠MOOC平台上支持学习者和其他学生,教师,助教交流的论坛得以实现。由于MOOC本身的开放性及大规模性,数百万的在线学习者都存在交流,交换意见,解答疑惑,交友的需求。很多研究也表明,社交性对于在线的社群来说是非常重要的部分。 (Preece 2000; Phang et al. 2009).
结合交流社群的传统教育模式,已经被发现能够促进学生的坚持率 (Fisher & Baird 2005; Mak et al. 2010). 对于大型开放式网络教学来说,情况可能更是如此。

  在线学习者通过在社群中的交流,可以减少学习过程中的孤单感,增强满意度,从而减少流失率。(Fisher & Baird 2005).而对比5种建立社群的社交工具,研究发现,在MOOC平台中,在线论坛是接受度最高,影响最为有效的一种(Alario-Hoyos et al. 2013)。

  在在线论坛中发言较多的学习者,通常学习表现更好,课程参与度也更高,(Huang et al.2014),不仅如此,他们的发言对于促进论坛的讨论也有正面的作用,使得浏览论坛的人也从中受益。(Wong et al. 2015)

  基于此,本文提出以下假设:

  假设 3::在论坛中和他人交互次数越多的学习者,越有可能坚持。

  除去论坛本身促进学习者坚持率的作用,在线论坛创建的社群也能给那些学习或者交流有困难的参与者一个增强情感和价值归属的途径,从而挽留那些可能要退出的学习者(Shedroff N.2009)。

  基于以上把滥用HCI自由度及遇到系统错误视作主动与被动的遇到问题的表现,本文认为:

  假设4:论坛交互对于滥用系统使用程度造成的学习者流失,具有调节作用。

  更进一步的,由于大部分中途退出的学习者表明,最主要的学习困难在于缺乏监督及教师的帮助(Mackness et al.2010),我们把论坛中的交互拆分成“和教师交互”,以及“和同学交互”两个维度,并提出假设:

  假设 5:对比于与同学交互,与教师交互对于提高学习者的坚持率效果更显著,而且与教师交互对于滥用系统使用程度造成的学习者流失,具有的调节作用更明显。

  更进一步的,我们假设:

  假设6:学习中主动遇到问题(滥用系统使用程度)的学习者,越快寻求论坛的帮助,越有可能继续坚持课程。

3 变量与模型

  3.1.模型

  基于以上分析和假设,可构建本文的研究模型:


图1:研究模型


图2:研究模型(补充)

  3.2.变量

  我们的数据来源于Coursera平台上一门关于大数据的开放式网络课程。我们的数据集为大数据课程两万名左右学习者的个人层面的数据,主要由三部分组成:在线作业的数据,系统记录用户点击浏览的日志文件以及论坛记录的用户交流互动的行为数据。

  在Coursera平台上,学习者注册参加大数据课程的学习之后,可以观看该课程的视频,参与讨论,同时完成作业。观看视频的过程中,无论是学习者对系统的自由性的依赖程度(视频播放中暂停,加速,拖动进度条的次数),还是系统不稳定的程度(观看视频中系统出错的概率)都已经被系统日志自动的记录保存。而学习者在论坛中的交流数据,也被记录在论坛数据中。结合这两种数据来源,以学习者完成作业的总量作为坚持率的度量,我们得到本文回归模型的核心变量:

   核心变量

   学习者坚持率(Num_of_assignments):每个学习者完成作业的数量。在我们的研究中,在线学习者总共有10次作业。只有完成一定数量的作业之后,学习者的学习目标才能达成,才能从Coursera平台得到认可。因此,完成作业的数量一定程度上衡量了学习者对该课程的坚持意愿。

  学习者对系统自由性的使用程度(Operation_times):每个学习者在视频播放过程中暂停,加速,拖动进度条的总次数。总次数越多,我们认为该学习者对系统自由性的使用程度越高。

  系统不稳定性(System_Instability):每个学习者在视频播放过程中,遇到的视频出错及下载数据有问题的事件总次数。

  学习者在论坛的交互程度(Interaction):每个学习者在论坛中发言及收到回复的次数加总。进一步的,我们将学习在论坛中与人的交互根据对象不同,拆分成:学习者与教师的交互程度(IntwithT),学习者与其他同学的交互程度(IntwithS)。

  学习者遇到问题到寻求论坛帮助之间的距离(Distance):基于本文以过度的暂停,拖动进度条,加速的操作次数来衡量学习者滥用系统自由度的程度,我们可以衡量这些动作的发生到该学习者之后第一次访问论坛动作之间的距离。

  距离越短,说明学习者遇到问题之后寻求论坛帮助的可能性越大,从而越有可能减少学习者的流失率。

  除去核心变量之外,我们同时在模型中引入以下控制变量,使得结果更加合理,可信。

  控制变量

  学习者认证情况(In signature track):该变量为虚拟变量,对于那些付费购买Cousera平台及课程提供学校颁发的认证证书的学习者,Insignature_track=1,对于没有付费购买认证证书的学习者,Insignature_track=0。显然付费购买证书的学习者学习意愿更强烈,所以添加该变量可以排除学习者自身的特质差异。

  学习者的持续时间(log_duration):学习者参与Coursera平台的时间,由最近登录时间及注册时间之差决定。在模型中,我们对该时间取对数形式,作为学习者本身差异的控制变量之一。

  学习者看视频的总数(lecture_times):每个学习者观看视频课程的总数。学习者观看视频总数显然和学习者坚持率,以及暂停,加速,拖动进度条总数有正相关关系,因此必须加入模型,作为控制变量。

  基于以上概念模型和变量构建,我们建立以下回归模型

  其中,学习者在论坛的交互程度将分别被替代成“总交互程度”,“与教师交互程度”,“与同学交互程度”进行不同的回归。

4 数据与分析

  我们的回归是基于学习者个人层面的。根据系统日志文件,该课程共有27343个注册用户,然而,由于大型开放课程本身具有自由和低门槛的特性,用户注册并不代表他们有认真的学习意愿。为排除这部分用户带来的干扰,我们选取至少完成过一次作业的1112名注册用户作为研究对象,并假设他们存在初始的学习意愿。

  从表1中可知,1112名学习者平均的作业完成量为5.82 (标准差=3.87)。而且,平均来说,每个学习者遇到系统出现错误的次数为11.42 (标准差=20.48) ,遇到系统数据下载失败的总次数为30.92 (标准差=76.00) 。在观看视频的过程中,平均每个学习者点击暂停键的次数77.42 (标准差=121.13).。此外,选择加速的次数平均为22.97 (标准差=67.54) ,拖动进度条的平均次数为90.96 (标准差=230.44)。

  对于论坛的交流次数,平均每个人有包括发言和收到回复之内的3.21次和他人的交互 (标准差=13.45),其中和教师的平均交流程度0.48次(标准差=1.91),与其他同学的平均交流次数2.72次(标准差=11.88)。在1112名用户中,有689名学习者在视频操作之后寻求了论坛的帮助,他们这两个动作之间的平均距离为11.79(标准差=11.99)。

表1.变量的描述性分析

<td valign="top" width="12%" style="border-bottom: #f0f0f0 1pt inset; border-left: #ece9d8; padding-bottom: 0

变量名

观察值

平均值

标准差

极小值

极大值

数据来源

学习者坚持率

1112

5.82

3.87

1

10

在线作业的数据

学习者看视频的总数

1112

434.43

603.11

0

8024

点击日志文件

学习者认证情况

1112

0.09

0.28

0

1

在线作业的数据

学习者的持续时间

1112

15.42

1.15

3.40

16.56

在线作业的数据

系统不稳定性

1112

42.34

87.02

0

988

点击日志文件

视频出错次数

1112

11.42

20.48

0

296

点击日志文件

下载数据出错次数

1112

30.92

76.00

0

944

点击日志文件

系统自由性的使用程度

1112

191.35

336.91

0

5392

点击日志文件

暂停操作次数

1112

77.42

121.13

0

1830

点击日志文件

拖动进度条操作次数

1112

90.96

230.44

0

4118

点击日志文件

加速操作次数

1112

22.97

67.54

0

836

点击日志文件

在论坛的总交互程度

1112

3.21

13.45

0

353

论坛数据

与教师交互程度

1112

0.49