数据肖像:“大数据”对高校学生思想的精准描绘
作者:王莎 赵兰亭
来源:《大学教育科学》2017年第05期
摘要: 大数据时代为高校学生思想进行“数据肖像”的精准描绘,具有丰富的内涵与重要意义。行为与思想具有高度相关性,这是绘制“数据肖像”的逻辑前提;将思想与行为通过大数据科学联结,在调研并建立高校学生思想的“七观”刻画标准、搭建学生“六维”行为大数据平台的基础上,构建高校学生数据肖像层次结构模型,可以实现为学生思想特征的“画像”。为高校学生思想进行数据肖像精准描绘是一个系统工程,需要教育行政主管部门的保障与规范、高校管理层面的支持与引导、思想政治教育队伍的改变与适应以及高校学生的配合与参与。 关键词:大数据;数据化;数据肖像;学生管理;思想政治教育;“三观”教育 中图分类号:G641;G649.21 文献标识码:A
文章编号:1672-0717(2017)05-0102-06
“人類正从IT(Information Technology)时代走向DT(Data Technology)时代”。大数据时代,“一切皆可精确化”。维克托·迈尔·舍恩伯格通过分析马修·方丹·莫里(Matthew Fontainc Maury)和越水重臣(Shigeomi Koshimizu)教授所做的研究,将这种转变称为“数据化”——指一种把现象转变为可制表分析的量化形式的过程,它直接触摸到了人的关系、经历和情感。这标志着人类在寻求精细化和认识世界的道路上前进了一大步,过去不可计量、存储、分析和共享的很多事物都可以被数据化[1]。伴随着大数据应用的实践与创新,“个性化”成为核心价值所在。相比传统方法对于教育对象的调研分析,大数据第一次使得教育者能够通过互联网便利地获取教育对象更为广泛的反馈信息,为进一步精准、快速地分析教育对象思想特点、行为习惯等重要信息提供了足够的数据基础。伴随着对人的了解逐步深入,一个概念悄然而生:“数据肖像”,即抽象出一个教育对象的教育信息概貌。这可以看作教育者应用大数据的重要技术进步[2]。
一、“数据肖像”对高校学生思想精准描绘的内涵与意义 (一)“数据肖像”对高校学生思想精准描绘的内涵
“交互设计之父”Alan Cooper最早提出了persona(人物角色)的概念。它是建立在一系列真实数据之上的目标用户模型。通过调研去了解用户,根据他们的目标、行为和观点的差异,
龙源期刊网 http://www.qikan.com.cn
将他们区分为不同的类型,然后在每种类型中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,就形成了一个人物原型(personas)[3]。伴随着互联网的高速发展而出生的“95后”“00后”已成长为新一代的高校学生群体,作为“触网一代”,互联网的使用已融进他们生活的每个部分。在大数据的时代背景下,“雁过留痕”,通过爬虫技术等现代科技手段,可以获得海量网络系统的用户行为信息。通过相关关系的发现、因果关系的分析,可以发现隐藏在巨量信息后的真实数据价值,提取信息中的共性特征,给学生的人物角色(persona)“贴标签”。这一个个“标签”,就是学生的一个个特征,如同绘画中的笔触,可以精准描绘并定位学生的特点、研判学生的所想、所思,即用“大数据”为高校学生思想精准描绘“数据肖像”。 大数据作为“数据肖像”的技术根基,它完美地抽象出一个用户的信息概貌,为进一步精准、快速地分析用户思想特征、行为习惯等重要信息提供了足够的数据基础,奠定了大数据时代的基石。“数据肖像”对学生思想精准描绘即是将学生相关信息“标签化”、“形象化”、“可视化”。教育研究者基于高校学生海量互联网行为数据基础,采集教育对象社会属性、生活习惯、学习行为等主要信息的数据,通过构建“思想—行为”关联模型,遴选出可以反映学生思想的行为维度“标签”;再依托大数据分析处理技术,通过聚类模型将所有用户的“标签”综合起来并进行结构化整理,就能形成“属性”标签,并以“贴标签”的方式完美地抽象出一个教育对象的数据信息全貌。“数据肖像”为教育者提供了把握学生思想状况的便捷手段,能够帮助教育者洞察和预测学生的思想,实现教育内容与方法的个性化,提升教育效果。
“数据肖像”描绘的核心工作是还原学生信息,给学生“贴标签”,把学生思想状况“数据化”、“形象化”。“贴标签”的重要目的,是为了让人能够迅速理解并且方便计算机处理。“数据肖像”描绘的关键因素有两个:素材与方法。“数据肖像”描绘的素材来源于所有学生相关的行为数据,主要包括静态信息数据和动态信息数据。静态信息数据是指学生相对稳定的信息,主要指学生的性别、入学时间、家庭基本情况等不随时间变化的基本数据,由学生入学时录入信息系统。这类信息自成标签,如果学校有真实信息则无需过多建模预测,更多的是数据整理、清洗工作。动态信息数据是指学生随时发生、不断变化的行为信息。网络的全覆盖,使每一个人的行为时刻被互联网这张无形的“天网”监控。从广义上讲,一个学生浏览网页、网上购物、进出寝室楼道门的时间、在图书馆的借阅记录等诸多用户行为,均是动态信息数据来源。 “数据肖像”的描绘方法,取决于大数据技术与相关算法。通过数据采集、数据处理以及相关算法,并根据学生行为构建模型产出标签与权重,是决定刻画是否科学精准的关键因素。大数据技术可以把分布在多个存储资源库的数据整合起来,在标签模型上构建大数据画像类的交互式分析应用,让教育者可以自由灵活地分析这些对象各种属性与行为之间的关联性。“数据肖像”描绘要经过对行为大数据的处理,同时离不开计算机相关算法的运算,使得计算机能够程序化处理与人相关的信息,通过算法、模型给人“贴标签”,让程序与计算机尝试“理解”人的行为与思想[4]。
(二)“数据肖像”对高校学生思想精准描绘的意义
龙源期刊网 http://www.qikan.com.cn
新形势下高校思想政治教育针对性、实效性不强是困扰业界多年的难题。在日益复杂的国际国内环境下,要解决这个问题显得更为紧迫。2017年4月,由中共中央、国务院印发的《中长期青年发展规划(2016~2025)》明确提出,“青年思想教育的时代性、实效性有待增强。”习近平总书记强调,高校肩负着培养中国特色社会主义事业建设者和接班人的重大任务。为谁培养人?培养什么人?是高校办学治校的首要问题,也是办好中国特色社会主义大学的关键所在。推动思想政治教育工作同当代数字信息技术融合,为促进人的全面发展、培养德智体美全面发展的社会主义事业建设者和接班人、办好中国特色社会主义高校保驾护航,其意义极为重大[5]。
做好教育对象分析是提升教育针对性的前提,也是促进“因材施教”的重要途径。为高校学生思想进行精准画像,通过大数据技术分析学生思想动态特点与需求,可以方便地将学生分类,贴上“积极上进”、“表现一般”、“重点关注”等不同类型的标签。在“类标签”的基础上,可以根据学生“类群”特点与存在的问题,在其偏好、所需的内容、方法与渠道上实现交互,促成需求。“类群”是生物学中的概念,是指具有某些共同特性的动植物群体,多指同一物种中再细分的不同种类。相应地,教育者根据多维“类群”标签,可以重新布局教育资源分配,创新分配、组合模式,不再一定要按照行政年级、班级来安排课堂,针对学生类群之间的差异性来进行教育教学管理。在教育资源有限的情况下,实现“类群”的针对性教育,也是思想政治教育领域的一个重大进步。
“数据肖像”对高校学生思想的精准描绘是在价值观多元环境下,帮助学生“扣好人生第一粒扣子”的有效途径。追求个性与自我是当代高校学生的突出特点,其价值观的形成很大程度上受到网络价值观的影响,许多不切实际、甚至错误的想法在互联网的作用下更加膨胀。与此同时,高校学生更是现实中的人,其肩负着“社会主义合格建设者与可靠接班人”的历史使命,决定了其更需要清楚地了解自我,顺利完成人的社会化过程,从而实现人的全面自由发展。要完成这个任务,高校学生就必须在步入社会前建立好自己的价值体系,给自己的人生定好位。“数据肖像”对高校学生思想精准描绘,有助于学生了解自己的所缺、所需,明白自己与“人生楷模”的差距,让“成为更好的自己”变成一种内驱力,从而使“要我受教育”转变成“我要受教育”,进而有助于高校学生思想政治教育工作的开展。 二、“数据肖像”对高校学生思想精准描绘:原理与设计
如何有效构建能够精准描绘学生思想的“数据肖像”呢?其基本原理是:通过调查分析,获得大学生思想情况;通过抽取学生在校期间行为的大数据,获得学生们的现实表现情况;通过构建数据肖像的“层次结构模型”,运用大数据平台将思想、行为信息集中,建立行为表征和思想状态之间的相关性网络;通过关联模型和聚类模型的应用,为思想特征相似的个体贴上个性标签,针对不同标签的群体实现“个性化”教育引导的目的。
(一)行为与思想具有高度相关性:“数据肖像”精准描绘学生思想的逻辑前提
龙源期刊网 http://www.qikan.com.cn
要想准确把握学生内心深处的“思想”,可以通过观察其外在的“行为”获得信息。行为表征和思想状况之间具有错综复杂的相关性,且一些相关性较隐蔽,传统的分析手段难以直观地发现。若想了解一个人,不仅要看他怎么说,还要看他怎么做。行为和思想的关系,不会无缘无故地突然就展现出来,“是一个长期的、无声的成长结果,是一个长期积聚力量的隐藏过程的最终结局”。人的思想及教育效果,归根到底还是通过人的行为表现出来。“行为反映思想”,改变行为可以改善思想。思想和行为的关系本质上是认识和实践的关系。“数据肖像”的研究是将高校学生在校期间思想状况落实在每一個具体行动上,以“行为”作为判断、预测“思想”的客观指标。高校学生数据肖像的建立,一方面在于对行为的分析、分解,另一方面要传承传统方法中对于“思想”的考察。通过研究分析,改善“行为”的情况,预测“思想”的可能与未来;通过考察“思想”的情况,检验评估教育效果,有目的地进行反馈。二者相辅相成,缺一不可。 (二)将思想与行为通过大数据科学联结:“数据肖像”精准描绘学生思想的基本思路 “数据肖像”对高校学生思想的精准描绘需要从思想状况的刻画、行为大数据的收集模型、行为与思想的联结等角度开展工作。首先,要寻找衡量思想的“尺”。可以通过调研获得学生个体的思想动态结果,并采用大数据统计工具在行为表征和思想动态之间挖掘出传统方法中不能发现的相关关系,找到能够体现、反映思想动态的行为因子及相关权重。其次,要抓取学生的行为数据。通过一体化、共享化的数据平台,获取学生的各种行为数据,包含静态数据和动态数据。静态数据是指学生的性别、入学时间、家庭情况等不随时间变化的基本信息数据,由学生入学时录入信息系统;动态数据是指学生校园卡消费、图书借阅记录、各学期成绩等随着时间流而不断更新的具有时效性的数据。动态数据需通过监测学生的系统操作记录、上网浏览痕迹、网站停留时间等来获取。通过数据平台之间的数据共享,可以实现平台间的信息整合或跨平台抓取信息,使数据交流更加通畅。动态数据的获取和分析是行为表征层的关键。动态数据不仅能反映“状态”,更能反映“变化”,这些“变化”常常由学生的某些思想或基本情况变化而引致。通过获取动态数据并实时监测数据的变化,将有助于实现快速直观地了解学生的思想状态并及时做出反应。随着教学和各综合服务平台的网络化进程加快,动态数据的获取在未来将拥有更加广阔的发展空间。
(三)思想状况层调研分析:建立思想的“七观”描绘标准
采用科学规范的心理测量工具科学编制高校学生思想调研问卷,对学生思想状况进行分解、分层,为科学刻画学生思想建立衡量标准。世界观、人生观和价值观教育是高校思想政治教育内容体系中的主体、核心内容。研究高校学生的世界观、人生观和价值观的现状就是研究高校学生思想状况的主要视角。价值观是“三观”中的决定性方面,是“三观”教育的重点,也是思想政治教育的重点。从当今社会转型期凸显的社会矛盾、社会乱象来看,价值观教育显得更具有现实意义。了解高校学生的价值观状况是调研高校学生思想动态的重中之重。通过对高校学生的深度访谈,结合社会热点、舆情焦点和学生日常生活所面临的问题,充分考虑到研究的客观性与青年思想的时代性与复杂性,本文中的“价值观”指的是高校学生对事物(包括人)有无价值及价值大小的根本观点和评价标准。我们将以下七个维度作为考量高校学生思想状况的主要方面:人生观、政治观、道德观、学习观、消费观、交际观、就业与发展观。“七观”是马
龙源期刊网 http://www.qikan.com.cn
克思主义世界观、人生观与价值观在当代高校学生中的具体反映,能够基本体现当代学生的思想状况。
(四)行为表征层信息采集:搭建学生“六维”行为大数据平台
高校学生的行为数据是制作其思想动态“数据肖像”的技术基础。为了获得学生行为的大数据,我们必须搭建行之有效的采集平台。学生在校期间的行为千差万别,并不容易标准化与系统化,有必要对其进行科学的分类,同时也要运用大数据技术归集并处理数据。首先,要进行行为体系搭建与行为构成分析。高校学生行为研究在实践层面是以国家教育主管部门从1989年~2017年先后五次颁布的《高校学生行为准则》与《高校学生管理规定》为行为分类与规范指南,结合运用心理学、管理学、教育学、社会学等多学科理论对学生行为的研究分析,作为划分与衡量行为的“维度”。行为维度研究应包括“两准则”与“三规定”涉及的思想政治行为、道德行为、学习行为、社交行为、经济行为五个方面,加上可以检验高校人才培养质量、体现高校学生思想状况的求职行为。再通过行为科学研究成果,将对应的“六维度行为”进行分解与剖析,获得相应的三级指标,作为数据采集的依据。其次,要通过以下四个途径进行“六维度行为”数据采集:一是业务系统数据,主要指学生管理服务数据;二是机器数据,主要指学生行为数据;三是互联网数据,主要指学生言论、社会服务平台行为数据,通过商业信息购买、相关研究信息曝露获取的社会主要社交、消费平台数据等;四是辅以专题问卷调查获得的数据信息,获取行为研究数据资源。通过构建“六维度行为”数据平台,树立“数据意识”,实现数据的共享和交换,为模型构建奠定坚实基础。
(五)数据肖像层次结构模型:实现为学生思想的“画像”
取得学生“六维”行为大数据后,基于学生思想动态的“七观”标准,我们可以将二者建立网状相关联系。发现和挖掘其中的相关关系是思想观念层的重点,在此基础上构建数据肖像层次结构模型(见图1)。模型运算的结果可以用来对学生思想特征“画像”(即贴标签),对学生的思想特征进行“类群”划分。通过对行为表征层进一步聚类分析,提炼出典型行为特征作为描绘高校学生思想肖像的标签,同类聚合,将相似度高的样本划归为同一类,进行针对性的思想政治教育。高校学生行为特征的聚类和“标签化”是肖像描绘层的核心。当今高校学生个性独立,无论从行为还是思想的角度都各具特点。传统教育模式下,教育者对学生的教育方法往往一概而论,思想状态良好的学生受到重复的教育,而思想状态较差的学生由于教育不足,其思想状态并未得到显著改变。通过肖像描绘层的聚类和“贴标签”工作,将思想状态相似或具有同一重要行为特征的学生划分为一类,有助于教育者采用不同的教育方法,对学生因材施教,因势利导。
三、“数据肖像”对高校学生思想精准描绘:政策与保障
“数据肖像”对高校学生思想的精准描绘,是大数据时代提高思想政治教育实效性的科学抓手,是一项系统工程,从“概念”到“现实”难以一蹴而就,需要教育管理部门、高校管理者、思政教育队伍和学生的积极参与、协同配合。
龙源期刊网 http://www.qikan.com.cn
(一)教育管理部门:保障与规范
国家“十三五”规划纲要提出,要实施国家大数据战略,加快政府数据开放共享。政策力挺、互联网企业积极布局,大数据生活令人憧憬,大数据日益成为推动各个领域变革的强劲力量[6]。大数据的应用在行业内处于起步阶段,伴生一系列关系到高校切身利益的重要问题。数据肖像在高校领域的率先应用得益于高校信息化建设的成果,既有“领头羊”的功能,又是襁褓中的婴儿,亟需相关教育管理部门的规范与保障。国务院于2017年7月印发《新一代人工智能发展规划》,提出“构建泛在安全高效的智能化基础设施体系,加强网络、大数据、高效能计算等基础设施的建设升级”,并要求从法律法规、伦理规范、重点政策、知识产权与标准、安全监管与评估、劳动力培训、科学普及等方面提出相关保障措施[7]。这为高校信息化建设、大数据应用提供了政策性的保障。教育管理部门应该加快制定涉及个人隐私、商业秘密和政府保密数据采集使用和保护的相关规定,确保合法合规地获取数据、分析数据和应用数据,使大数据应用发挥积极作用。 (二)高校管理层面:支持与引导
高校肩负着学习研究宣传马克思主义、培养中国特色社会主义事业建设者和接班人的重大任务。“思想这个阵地,你不去占领别人就会去占领”。而当前,大数据在高校思想教育引导领域的应用还十分薄弱。高校教育管理者首先要接纳、支持研究大数据时代下思想政治教育的新特点与规律,鼓励教育者运用多学科交叉研究形成相关理论,鼓励思想政治教育工作者主动应对因大数据技术而产生的观念和方法的变革,从而为社会主义办学方向保驾护航。其次,高校管理者应该趁势而为,加强校园信息化建设,积极引导大数据技术在高校层面的应用。信息化建设是“数据肖像”对高校学生思想进行精准描绘的物质基础与前提,没有网络化覆盖的校园信息环境,为学生进行数据画像就无从谈起。只有高校管理者层面达成共识,积极力行,才能实现校园信息资源的整合与集成,构建高校内以及高校之间基于统一标准、各类数据充分共享和流通的统一的数据平台。通过对数字的整合与对数据的分析和应用,实现“由数据向信息,由信息向知识,由知识向智慧”的转变,为高校教书育人提供坚实的技术支撑与物质保障[8]。 (三)思想政治教育队伍:改变与适应
大数据时代背景下,思想政治教育队伍必须主动适应大数据时代,从教育理念、教育模式、教学方法、信息素养、专业素养、文化素养和团队合作等方面积极地调整与改变。首先,思想政治教育队伍要突破理念上的束缚,不能再认为大数据与思想政治教育“不搭界”。近年来,中共中央国务院、教育主管部门下发的一系列关于高校宣传思想工作的文件中都提出要“坚持改革创新”、“推进理念思路、内容形式、方法手段创新”,从而更好地增强新时期下思想政治教育工作的时代感和实效性。要充分利用新一代科学技术革命实现思想政治教育方法上的突破。思想政治教育工作者只有拆掉原本“思维里的墙”,才能正确面对大数据带来的机遇。其次,传统的社会科学研究范式大多以理论思维和实验思维为主,而计算仅仅作为理论猜想的辅助论证手段。在大数据时代,每个个体都是一个行动着的“数据综合体”,计算思维的重要性日益凸显。由大数据技术支撑的海量数据运算,在高校学生“数据肖像”的精准描绘过程中占主
龙源期刊网 http://www.qikan.com.cn
导、决定性作用。由此,思想政治教育不再只有传统的“千篇一律”的模式,教育者应充分运用为教育对象精准“画像”这一重大的技术突破,创新教育模式、载体与方法,适时改变。再次,大数据变革要求不断加强学习和培训,改进工作方法,建立一支“1+X”的专业团队。在这支“1+X”的团队里,“X”指的是不同的思想政治教育队伍,他们充当研究者、“翻译官”,提供相应的研究思路与素材;“1”是指大数据专业人才,他们提供相关数据挖掘技术和算法,二者通力配合实现目标。思想政治教育队伍中有许多具有统计、计算机学科背景的相关专业人才,要给予他们培训、学习的机会,充实大数据专业队伍。 (四)高校学生:配合与参与
“数字化生存”为学生个体信息的采集打造立体平台,这一趋势不可避免。高校学生应该以理性的心态配合与参与其中。首先,转变心态,配合变革。大数据不是限制个人自由,而是更好地帮助个人实现全面自由发展。当各方面管理数据的丰富度和系统化水平达到一定程度后,海量数据之间的相互关联将生成以即时分析和动态预测为基本功能的数据肖像系统[9],直接受益者将是学生。“数据肖像”的实现,为学生群体自我教育、自我管理、自我服务提供空前便利,可以帮助学生个体更好地完成社会化的过程,“个性化”不再是愿景。其次,要积极参与学校运用“数据肖像”进行思想政治教育的相关管理、评价,积极进行自身行为矫正,促进自我全面发展。 参考文献
[1] 王莎,杨扬,杨航.大数据思想政治教育研究述评[J].大学教育科学,2015(03):112. [2] 郭志金.用戶画像数据建模方法[EB/OL].http://mp.weixin.qq.2014-09-24. [3] IT168软件专区.用户画像&移动统计为开发者插上双翅[EB/OL].http://software.it16.2016-01-08.
[4] 余孟杰.产品研发中用户画像的数据建模——从具象到抽象[J].设计艺术研究,2014(06):60.
[5] 王莎.思想政治教育的大数据评价[N].光明日报,2017-01-30(03). [6] 高亢,赵晓辉,许晟.大数据:融入生活 改变产业 [EB/OL].新华网.http://news.xinhuanet.com/2016-03/12/c_1118312594.htm.2016年03月12日 22:21:40. [7] 新一代人工智能发展规划[N].人民日报海外版,2017-07-21(01).
[8] 徐建军,王莎.运用大数据增强高校思想政治教育实效性研究[J].思想理论教育,2016(09):89.
龙源期刊网 http://www.qikan.com.cn
[9] 陈璞.大数据推动高等教育变革[J].中国高等教育,2015(18):63.
因篇幅问题不能全部显示,请点此查看更多更全内容