中国教育网络舆情发展报告2017

一、教育网络舆情大数据平台的概念与特征

字体:16+-

(一)教育网络舆情大数据平台的概念

教育网络舆情大数据平台是针对教育网络舆情实现数据采集、加工、分析、可视化输出等功能,服务于教育领域的大数据平台。对于教育网络舆情大数据平台的概念,可以从用户需求、技术架构和价值实现三个方面做进一步分析。

1.教育网络舆情大数据平台是适用于教育网络舆情分析的专业软件平台

教育网络舆情由于其舆情主体、客体的特殊性,作为影响全社会的民生大事,具有一些区别于其他类舆情的特殊性。教育网络舆情的主体范围极广,面向正在接受或曾接受过教育的广大社会群体,素质普遍偏高,且在不同渠道的舆情表达机制中,教育舆情的表达主体也展现出不同的叙述框架和话语体系,而叙述框架的差异性对舆情信息收集和分析有较大的影响[1],需要考虑其特殊性而进行专门的数据收集与分析。通过对教育舆情分布较为集中的若干平台,例如微博、教育板块网民留言以及其他各类教育服务平台中的舆情数据进行收集与分析,针对拥有不同使用需求的用户群体实现多样化的功能满足,直观且专业化的舆情分析报告可为教育部门进行决策提供数据支持;同时满足个人用户使用需求,弥补当前市场上对于教育网络舆情分析服务的空缺,改善教育行业发展现状。

2.教育网络舆情大数据平台利用大数据技术来实现教育网络舆情数据的采集和分析

教育网络舆情来源于多个时间节点的多个平台和多个用户,具有海量性、多元性、时延性,普通计算机的简单算法难以有效完成大量舆情数据统计、特征提取、信息分类等研究的必要步骤。2011年5月,美国麦肯锡公司(Mckensey & Company)在第11届EMC World大会上做报告[2],首次定义大数据是“大量的可以被捕获、表达、汇总、存储和分析的数据”。大数据技术一般包含分布式文件系统、批处理技术、分布式数据库、并行式数据处理等,并且能在此基础上产生开源数据处理平台[3],完成数据采集、数据处理与集成以及数据分析统计的基本流程。目前,教育网络舆情领域大数据的特征开始出现,我们可以应用大数据技术对教育网络舆情数据进行有效的采集和分析。

3.教育网络舆情大数据平台通过精准数据分析为教育领域各方提供决策支持

总量大、高价值的精准数据是实现科学决策的基础,专门服务于教育领域的教育网络舆情大数据平台,其主要功能是为了满足教育领域各类用户的使用需求。通过对全网教育舆情较为集中的、最具代表性的若干平台的教育舆情进行数据收集,在确保数据的完整性前提下尽可能地提高其准确度。

教育网络舆情大数据平台所面对的用户群体极其广泛,不同需求的使用者可从中挖掘不同的数据价值以支持自身决策,其核心用户群体是与教育领域相关的使用者,教育行业管理者可以通过此平台监测重大教育政策发布后的舆情走向,不断调整宣传策略,提高教育政策的民众接受度;高校教师也可通过这个平台及时了解有关教育事件的社会思想动态,调整教学方式,以获得更好的教学效果;同时学生群体也可通过此平台了解相关政策信息,为自身未来发展提供选择依据。从长远角度来看,教育网络舆情大数据平台通过精准的数据收集与分析,有望为社会教育制度的制定与推广提供可靠的数据支持,从而推进教育制度改革进程。

(二)教育网络舆情大数据平台的特征

教育网络舆情大数据平台服务于教育领域,采用大数据技术实现教育网络舆情的自动采集和智能分析,兼具适用于教育领域、实时更新、层级化和联动化的特征。

1.数据来源和数据处理方式要符合教育领域的特点

教育行业的自身属性决定了教育网络舆情具有某些特殊性。一方面,作为民生行业,其本身就具有极高的话题讨论度,极易演变成关注度较高的舆情事件,且如前文所言,教育网络舆情事件主、客体特殊,具有多样化的叙述框架;另一方面,教育网络舆情内容分散多元,各大新闻网站、论坛以及社交平台上均有分布,内容也涉及较广,如教育政策、教育问题、师生权益以及学生安全问题等。综上,教育网络舆情事件主、客体的多元性与分散性也决定了教育网络舆情大数据平台具有其适用于教育领域的特殊性。

一方面,教育网络舆情虽然呈现分散分布,但仍然有规律可循,主要集中分布在微博、微信、各大新闻网站的教育板块以及教育论坛等,教育网络舆情大数据平台可对以上特定平台的网络舆情数据进行搜集,既保证了数据来源的准确性与全面性,同时还节约了大量运算时间,提高了运行效率;另一方面,从教育网络舆情的发酵过程中不难看出,其舆情的高涨与衰退受意见领袖以及官方发声影响较大,教育网络舆情大数据平台根据搜集来的大数据进行数据分析并生成数据分析报告,总结舆情发展规律,为决策提供数据支持。

2.教育网络舆情监测数据要实时更新

一方面,教育网络舆情大数据平台实现对数据的实时监测,达到数据呈现与真实舆情的即时连接。与其他各类事件的网络舆情一样,教育网络舆情也具有传播的及时性、信息的爆发性与易逝性,但数据总量庞大加上变动速度极快,为其数据的实时更新增添了难度,也使得实时跟进舆情更新进度的价值得以凸显。该平台利用大数据技术,对事件关键词进行全网搜索、实时记录和特征分析,能尽可能还原舆情事件的潜伏期、发酵期、爆发期、衰退期等多个阶段,便于从业人员及时且有针对性应对。

另一方面,教育网络舆情大数据平台实现实时舆情危机预警,对于还未发生但有可能发生的舆情事件进行事前预判,对于已发生并且正在不断发酵的舆情事件进行严重系数评级。在这里,我们可将未发生却即将有可能发生的舆情事件分为可预见的教育网络舆情与突发性教育网络舆情两类。例如,重大教育政策的发布或教育事件中当事人或管理者的公开发言必将引起舆论的高度关注,此类舆情归为前者的可预见之类,而作为基于大数据技术的舆情监测平台应加强对于后者的预测能力,实时监测网络舆情动向,准确预判危机,达到最佳的舆情处置效果。

3.教育网络舆情大数据平台功能实现层级化和联动化

层级化即指将教育网络舆情大数据平台根据注册用户身份对使用者进行需求分类,面向教育领域各方开放不同层次的权限层级,为不同需求用户呈现侧重点不同的功能实现,实现数据与不用需求用户的有效匹配,最大限度上实现关系数据的分类与融合,提高数据使用效率。例如,面对学生用户,则为其开放层级较低的舆情走势、网民情感特征等功能权限,面对教育部门管理者,除了一般性的基本功能外,还对其开放层级较高的舆情危机预警权限以及可能的舆情对策方案,如此多样化、多层级的功能呈现可以在满足用户个性化需求的同时,也使得数据价值得到最大程度的利用。

同时,联动化也是教育网络舆情大数据平台功能实现的重要特征。大数据平台具有极强的外部性[4],数据的价值也并非独立封闭的,在教育网络舆情大数据平台中,所搜集来的大数据并非只为教育领域所独用,可实现多部门领域内的无缝衔接、快速传递。除教育部门外,政府机关、媒体、司法部门以及其他社会部门都可以共用此平台,获取最大化的数据价值。