2023年如何利用大数据分析财务工作总结和计划(3篇)
时间过得真快,总在不经意间流逝,我们又将续写新的诗篇,展开新的旅程,该为自己下阶段的学习制定一个计划了。那关于计划格式是怎样的呢?而个人计划又该怎么写呢?下面是我给大家整理的计划范文,欢迎大家阅读分享借鉴,希望对大家能够有所帮助。
如何利用大数据分析财务工作总结和计划篇一
随着税收管理信息化建设的深入,税收数据实现了省局大集中,这为税源管理、税收分析决策提供了一个良好的应用平台。如何通过税收数据分析应用促进提高税收管理的整体水平,是当前需要研究的重要课题。随着税收信息化建设的不断推进,以及其它税收业务应用系统的推行、完善和拓展,加上内联网络各系统的应用,使各类涉税数据信息日益丰富,为信息资源在税收工作中的广泛应用提供了广阔的空间。如何盘活海量数据信息,进一步加强数据信息资源的开发和利用,让它们发挥应有的效果,实现信息管税新跨越,为领导决策提供依据,已成为目前亟待解决的一个问题。
税收信息数据是税收管理的基础。这些数据是全省地税系统的宝贵资源,通过适当的加工处理和提炼分析,不仅可以强化税源管理,提高日常工作效率,而且还能够提高地税部门对经济税源的分析能力和监控水平,为各级领导决策提供科学、合理的依据,更好地指导税收征管工作。
从全市地税系统来看,2008年临川区地税局在本局的行政办公软件中加一个“旅店式”税源管理,后来随着个体户变化逐渐增大,管理员没有及时进行登记或变更,就逐渐没有进行运用。到现在为此,此软件已没有运行了。只保留了2008年的有关数据。
乐安县地税局开发了可视化税源管理软件,目前已经在全市范围内推广使用。
广昌县地税局曾在2006年自主开发建筑及房地产业税源监控软件,采用sqlserver+aspx架构。该软件对税收管理员进行建筑、房地产行业税源监控起了很大帮助,能有效、直观地分析各个工程项目的开发情况。但与省局软件并未接轨。因总局目前推广相关软件,已基本停用。
基层税务部门没有建立健全适应信息管税的管理体系,县局、分局、税收管理职能部门、税收管理员实施信息管税没有明确的管理分工和管理责任,影响着信息管税的质效。
一些基层县、分局(所)税收管理员不知道征管系统提供了哪些数据,不会查询数据或由于存在技术困难无法实现数据应用的需求。
很多领导没有打开机器自己动手查询的意识和习惯;业务职能部门没有熟练掌握数据查询的操作技能,统计数据仍然习惯于向基层索要然后汇总的传统方式。
充分应用数据指导税收征管的意识不够,靠数据分析、决策、处理问题意识不强。各数据管理部门联系不紧密,各自为政,单打独斗,缺乏统
对税收征管数据的利用仅仅局限于基本汇总、分类、简单计算基础之上的对原始税收数据的“复制式”展现和对税收现象的“陈列式”描述,应用仅限于报表浏览、简单查询、数据比对、简单的收入分析等,数据应用的范围不广,利用程度不高,服务于征管的作用没有得到很好发挥。
分析应用只满足于单一的业务需要,而不能够通过数据分析有效监控管理行为和执法行为,不能从区域、行业等深层次对区域间的税源进行动态分析和对比,不能对纳税人的税源变化进行综合的、动态的分析监控,没有把“静态数据”没有变成“动态信息”,为领导提供决策的作用不明显。
虽然一些报表在征管数据系统中都能生成,但上级局各有部门仍然需要基层手工报送各类报表,加重了基层税务部门向上级税务机关报送大量报表的负担。
很多人只把征管软件成功上线作为一项艰巨工作的结束,而没有意识到这仅仅是另一项更为艰巨繁杂工作的开始。不了解运维人员整天在做什么,不了解运行维护组织的工作职责;没有意识到上线是一部分精英、集中时间的短期攻歼,而运行维护和应用则是需要全民参与、长抓不懈的持久战,上线只是“万里长征第一步”。部分领导也存在模糊认识,在日常各项工作中,没有将其放在应有的位置上。
数据管理的主要目标是通过各项管理措施提高数据质量,为数据应用打好基础。离开了数据质量,数据分析应用就成了无本之木,无水之源。抓好数据质量就是把住数据进入系统的各个入口,从税务登记的一个项目,从申报表的一行数据开始,一丝不苟、严肃认真地对待每一项业务,认真核实、修改数据监控系统发现的每一笔错误,这决非一朝一夕就能做好、见效的事情;数据分析应用工作也是一项系统工程,受制于人员素质、数据质量、外部数据采集等诸多因素,无法一蹴而就,需要长期的努力和坚持,不是短期行为。
认为一个系统会解决所有的问题,通过数据分析能够查找所有的管理漏洞,通过数据监控可以发现所有的薄弱环节。对系统的严密性和数据分析应用的期望值过高,导致一旦出现一些问题后不能正确认识,甚至把一些人为操作的因素也归结为系统问题,“怨天尤人”,抹杀了众多普通工作者的辛勤劳动成果,给数据管理和分析应用带来负面影响。
表面上看,我们的人员素质不低,如某县大专以上学历占全部在职人员的85%;计算机普及应用程度也不低,很多人都取得了相关计算机等级证书。但是由于学历教育和各种达标考试中均存在一定的“水份”,再加上知识更新等因素,实际能够胜任本职工作的不多。一个能够胜任本职工作的基层操作人员,需要熟悉本岗位所负担的工作,又熟悉系统的操作要求,这样的人在一个单位中达到30%已属不易;如果开展数据应用和数据分析,除了要对税收管理各项业务熟悉外,还要掌握相当的数理统计知识、数据库理论和操作技能,这样的复合型人才在一个单位中少之又少,培养的周期也很长。所以在一个县区局,可供在数据管理和数据分析应用中发挥作用的人其实很少。
由于没有一套涵盖税收所有业务的涉税信息指标体系和数据采集标准,采集录入数据信息随意性较大,质量不高,与纳税有关的第三方信息采集渠道不畅,采集的信息深度和广度不够,数据信息质量影响着涉
税信息分析的应有价值和对税源的有效监控。由于开展数据分析应用,是一种谋划工作的主动意识,无形的工作,上级局没有严格的指标考核,部分人就不会利用系统数据查找管理漏洞、有效监控日常管理工作、提升管理水平,被误认为一种“可做可不做”工作。
数据分析的结果虽然在一定程度上促进了税收管理工作提升,取得了成效。但由于信息化应用一定程度上超越了当前的税收管理水平,征管软件上线后,多次进行的数据清理核查发现的错误数据,反映了我们现有的管理手段、管理水平的粗放落后,与系统要求科学严密的业务流程存在着一定差距,征管系统的全面应用某种程度上超越了当前的税收管理水平,或者说部分地区的管理水平、管理手段与系统所要求的严密的工作流程不适应。
信息管税,既是税务部门落实科学发展观的长远性基础工作,也是解决当前税收征管问题的有效措施。因此,各级税务机关要牢固树立信息管税的思路和理念,充分利用江西地税管理信息系统数据,来破解征纳双方信息不对称的问题;以涉税信息的采集、分析、利用为主线,树立税收风险管理理念;以健全税源管理体系为手段,加强业务与技术的融合,进而提高税收征管水平。
优质的数据有利于促进管理,优质的管理有利于促进收入,是多年实践验证的真谛。要进一步抓好数据信息采集、加强对数据信息整理与存储、分析与运用、加工与管理,紧紧抓住信息管税的核心,通过完善制度建设,依靠先进的管理和技术手段,制定规范的数据管理办法,确保数据采集的真实、准确、全面。对税务登记、纳税申报、发票管理等基础信息资料,采集录入时,要做到完整性、真实性、及时性、准确性,杜绝虚假数据的录入,提高基础数据质量。
数据采集途径包括人工录入、电子申报、数据交换、外部导入,目前征管软件数据来源主要是以人工录入数据为主。人工录入数据一方面造成基层工作人员压力大,另一方面数据质量也难以保证。因此,要大力推行多元化电子申报,加快推进与税务部门以外的相关部门的数据交换,研究实现数据外部导入,进一步提高数据质量和采集效率。建议对现有软件进行完善,提供录入数据错误提示功能,把好数据“入口关”。通过建章立制规范数据信息的录入操作标准,从源头上控制初始数据的录入质量,确保数据信息真实、准确、全面、及时、可用。要统一录入标准,统筹信息录入,对于同类涉税信息做到一次性采集,各系统共享,多层次应用。
建立“三级审核”机制,加大信息审核力度,办税服务大厅对纳税人报送的各类申报资料和信息采集表进行逻辑性初审;管理分局应结合日常管理情况对纳税人各类申报信息和财务信息进行复审;业务部门参照第三方信息与纳税人相关信息进行终审比对。三级审核层层相扣,确保通过每一个岗位,每一笔数据录入,每一天的数据零差错,实现每个基层单位录入数据的零差错目标。通过对税务基础信息库进行定期或不定期更新和抽查,通报数据维护准确率,落实过错责任追究等手段,保证基础数据维护的及时性、准确性、全面性。
税收数据分析利用是落实信息管税的核心,也是信息管税工作的难点所在。要在提高对数据分析利用的重视程度的同时,应着力提升信息应用深度,拓展应用广度,提高应用效率,注重应用实效。
一建立信息分析应用机制。建立健全涉税信息分析应用和定期通报制度,紧紧围绕征管主题,利用存量信息资源,定期展开综合分析,定期发布分析指标,全面掌握税源真实情况,及时发现征管薄弱环节,堵塞征管漏洞。二创新信息分析应用方法。在分析内容方面,要通过开展税收宏观分析、区域分析和税收征管状况分析,及时了解本地税源分布情况、税源质量状况和税收征管现状,掌握税收和经济的运行规律。通过开展重点税源分析、行业分析和具体纳税人的分析,建立重点税源行业征管信息数据库,抓住重点税源和行业管理关键指标,建立预警评估体系,提升重点税源和行业管理水平。在分析手段方面,要创新分析方法,完善分析指标体系,健全税收分析模型,应用差异分析、逻辑关系稽核分析、趋势分析、波动分析和相关性分析等分析方法,加强纵横向比较,为税收管理决策提供参考。三加强对信息分析结果的运用。按照“人机结合”的要求,充分利用信息分析成果,设定科学合理预警指标,实行风险等级管理。对低风险信息纳入正常管理,做好税收政策的宣传和辅导及有针对性的约谈,让纳税人就信息分析中发现的疑点问题做出说明解释;中级风险信息采用实地核查或评估,对风险分析发现的较大疑点问题进行现场核实;对高风险信息进行全面评估,对纳税人生产经营和财务核算进行深入检查,发现有偷税嫌疑和其他违法行为的,移交稽查部门查处。根据纳税人风险级别的高低,有针对性的进行管理,提高信息资源应用的有效性。四完善信息分析应用评估考核机制。建立涉税信息分析应用质量反馈体系,衡量和评价数据信息应用成效,促进信息分析应用质量的反馈和改进。围绕数据信息分析应用对税收征管质量的贡献度和税收收入增值作用等关键指标,建立标准化税收分析应用考核指标体系,加大信息分析应用利用效率和利用成效的考核力度,切实提高数据信息分析应用水平。
开展税收数据分析利用,数据是手段,管理是关键,税收是目标。要建立适应信息管税要求的管理体系,让基层税收管理员,中间的管理层、上面的决策层按照不同的管理职能,调整角色,形成纵向上下之间、横向部门之间,职能配置、协调配合机制。
局领导要根据上级要求和本地税收管理实际制定征管措施,要利用数据管理平台,对税收计划执行情况、分区域、分行业税收经济运行情况等进行分析,用数据揭示经济发展、产业结构、行业税收征管状况之间的内在联系,实现对税收管理的科学决策。在税收管理中发挥“指挥中枢”的作用。
具有税收管理职能的税政、征管、计会等部门负责对决策层制定的工作规划、举措进行具体的组织实施。管理人员利用数据管理平台提供的数据模型,根据决策层的要求采取有效措施进行组织落实,并根据业务需求,采取关联分析法,从宏观上针对不同地域、产业、行业和注册类型等制定切实可行的管理办法,指导分局和税收管理员强化税收征管,并要进行多角度、多层次、分类别的分析评估,从微观上对单个纳税人进行“一户式”查询分析,提高管理的针对性。
税收管理员负责对纳税人进行日常监管、对管理层制定的各种管理办法进行具体的贯彻执行。利用数据管理平台提供的分析和监控功能,对本辖区纳税人征管情况进行分析评估,有针对性地加强管理。监控功能主要包括对非正常户、临时户、注销户、停业户、零申报户等异常户申报征收情况的监控,对所有纳税业户申报情况的多角度分析监控,对纳税户税负变化情况的监控,对纳税户发票使用、缴销情况的监控等。
建议省级应逐步设立征管数据分析利用处理中心,负责全省征管数据分析和处理,研究和制定数据分析利用处理机制,统一业务流程和分析指标,建立数据分析利用考核体系,防止业务部门之间或业务部门与信息技术部门之间不协调、不适应,导致工作中推诿或“踢皮球”,同时,市县一级要落实机构和人员从事征管数据分析应用专(兼)职工作,负责全市、县级数据分析应用工作安排部署,发布市县级征管数据分析指标,指导督促数据采集、录入、分析、应用等工作,汇总和上报《征管数据分析应用报告》。各基层税务所要做好征管数据采集、录入工作,保障数据质量和时限要求,结合辖区实际,抓好纳税户基本数据统计查询和数据比对工作,提出一定的税收管理性建议和措施。基于此,上级局应正式发文,明确市、县局成立独立的运行维护组织,选派业务素质、技术素质较高的人员充实到运维队伍中来,担当起数据管理与应用的重任。县局应以文件形式明确承担运行维护工作的部门、人员,这是开展工作的基本保障。
提升征管数据分析利用水平的关键在人,目前数据分析利用专业人员队伍尚未形成,为此,要加大综合培训力度,提高征管数据分析人员业务素质。比如对市、县两级领导班子可以重点培训系统查询、通用报表、数据监控等内容;对市、县局业务股室人员重点培训系统查询、业务操作,增强各业务部门互相配合、协同作战的能力;对税务分局(所)、办税服务厅、稽查局人员重点培训各岗位的操作技能、系统查询等,讲求实效,注重实用;遇有业务升级应及时通知相关人员,涉及重大业务事项调整变化的升级文件,要组织相关人员集中进行培训,如果时间来不及可以在短期内进行补充培训,解决目前的“先上岗后培训”甚至不培训就上岗所带来的各种隐患;省局应制定相关的培训计划,分期分批地组织有关人员进行层次较高的培训,培养高素质人才、带动当地工作。要多深入基层调查研究,拓展数据源,围绕纳税人的生产经营情况开展专题分析,通过实战分析演练,为各级税务机关提高税收管理能力提供依据,进一步推进征管数据分析应用工作向深度发展,努力造就一支高素质的征管数据分析应用队伍。
各部门齐抓共管,形成合力,共同做好数据质量和数据分析应用。征管信息系统涵盖了税务登记、发票管理、待批文书、稽查法制等全部业务流程,涉及税政、征管、稽查、法规、办税服务厅、税务分局(所)等诸多部门。要想对各个环节、各个部门进入系统的数据进行有效监控,提高数据质量,要想从各个部门的业务需求出发开展数据应用分析,单纯依靠某个部门的力量无法完成。简言之,征管系统是整个税务局的系统,不是哪个部门的系统。但是由于目前各项工作在机构、人员、业务分工上的相对独立,在工作的安排部署中的部门负责意识愈加突出,因此加强部门配合、协调联动就显得尤为重要。
如何利用大数据分析财务工作总结和计划篇二
大数据模式下的精准营销
于大部份营销者来说,网站再定向(onsite retargeting)是其中一个最重要的营销手段,所谓网站再定向的意思是对曾访问您网站的用户进行宣传,在他们浏览网络时向其展示广告。此手段之所以重要是因为在第一次接触中真正转化为购买的只占2%,而没有产生购买就离开网站的人群体高达98%。网站再定向的威力在于它能够帮助你吸引很多的潜在客户,由于这些用户之前已经访问了您的网站一次,这意味着他们确实对您的产品和服务感兴趣。当你不断向这些用户显示相关的广告,将能够吸引他们回访并完成购买。理论上,网站再定向技术听起来完美,但执行起来,却可能让很多广告主走入死胡同,因为它只能够覆盖到旧有的访客,而无法接触新访客。对于广告主来说,网站再定向是一把双刃刀,它虽然能带来绝佳的roi,却由于覆盖度不足,会在无形中扼杀销售机会。
其实无论是广告数据或购买行为数据,网络都能记录下来,而网络的实时记录特性,让它成为当下广告主实现定位营销的不二之选。随着技术不断革新,广告主精细化定位的需求也不断得到满足。在随后的篇幅中,我们会简单地对比几大定位技术,并通过电商案例分析来讨论如何让这些数据技术协同起来,促成客户从浏览广告到掏钱购买的转化,实现广告主的收益最大化。
网络营销的精细化定位潜力只有在大数据的支持下才能完全发挥出来。图中的数据金字塔划分出了数据的四个层级。最底层是广告表现数据,是关于广告位置和其表现的信息。具体而言,就是广告位的尺寸、在网页的位置、以往的点击率、可见曝光(viewable impreion)等指标。
再上一层就是受众分类数据。如今,市场上的数据提供商可以通过用户的线上和线下的行为,来收集到广告受众的兴趣、需求等数据。这些不会涉及个人真实身份的信息会被分析,并划分为不同的群組,例如性价比追求者、网购达人等。有了受众分类数据,广告主可以在互联网上按自己的需求和品牌的特性来投放。受众分类数据的针对性更强,也能带来比单纯依赖广告表现数据更好的点击率与转换率,因为它提供了消费者行为和偏好等宝贵信息。
第三层是搜索动机数据。搜索再定向是个用于发掘新客户的技术。它的出现让我们能够发掘出那些很可能会购物的用户,因为他们已经开始搜索与广告主产品相关的信息了。那些具有高商业价值的数据可以进一步被筛选出来,广告主可以将具有高购买意愿的人们再定向到自己的产品信息上来。
而位居数据金字塔顶端的是站内客户数据,这指的是用户在广告主网站上的用户行为数据,包括了用户浏览的页面,下载的信息,以及加入购物车的商品等数据。网站用户通常是那些已经了解过品牌并且对公司也熟悉的一群人。
对于广告主来说,金字塔四层的数据都独具价值。举例而言,广告表现数据是每个广告主都首先会关注的信息,因为这些信息在大多数广告管理平台和广告交易平台都能轻易获得的。同时,那些与用户需求和偏好相关的数据,能够助力广告主更好地实现精细化营销。因此,要想针对性地影响消费者购买路径的每个过程,我们就需要把这四层的数据分析整合,才能制定一个更全面的营销方案。
以下,我们将分享一个真实的案例,让广告主明白应当如何打通各层数据,制定覆盖消费者购买路径的精准定位的营销方案。
案例分享
背景:爱点击的客户,国内最知名的电子商务网站之一,希望能提高roi(投资回报率)和线上交易数量
挑战:客户已经使用了网站再定向技术来实现一个较好的roi,但是,从再站内定向所带动的交易数量开始有下降的趋势。
优化策略︰利用多重数据的整合,提升转化漏斗每一阶段的人群数目,以提升总转化量
第一步:网站再定向
广告主会发现网站内再定向带来的购买转化量有限,这是因为大部份广告主只会再定向曾经将商品加入购物车的访客。要想提升网站再定向的效果,最优的方法是根据用户浏览过的页面进行属性分类,并呈现具有针对性的内容。具体参考下图:
有了全面的追踪和分类,再定向受众数量的基数大幅增加。在短短两个星期内,交易数量显着提升,尤其是来自老访客的成交量更是大幅提升44%。
第二步:搜索再定向(search retargeting)及购买第三方受众分类数据
一方面,再定向可以有效地召回老访客,增大重复进入网站及购买的可能性。但同时,广告主还应该考虑怎么能增加新访客,以保证转化漏斗有足够的新增流量。
首先,我们利用搜索关键词捕捉有兴趣的用户,然后储存有关的用户数据,最后,在交易平台上将合适的广告呈现给该用户。此外,我们还会关注第三方受众分类数据中那些有着同样行为特征的用户信息,整合在一起进行精准投放。
在进行搜索再定向及购买受众数据后,新客户所带来的成交大幅度上升254%,广告效果花费cpa下降29%,同时增加该网站整体的浏览量。
第三步:利用机器学习(machine learning)进一步扩大客户的数量
用户来进行定位广告投放。xmo的算法可以对比客户的crm消费者数据与第三方受众数据,并预测出哪些网络用户会有特定的购买倾向。在这个案例中,xmo能通过机器学习来不断产生新的受众,平均每周能够细分出一个有着230万样本的人群。通过将广告投放到我们已有的目标受众群和由机器学习锁定的新目标受众,我们可以看到非常喜人的广告效果,虽然cpa轻微上升14%,但新客户成交量大幅增长26%说明了机器学习能有效地为广告主发掘新客户。
什么是机器学习(machine learning)? (摘自维基百科wikipedia) 机器学习是人工智能的核心,根据数据或以往的经验,通过设计算法来模拟背后机制和预测行为,并获取新的数据。这是一个重新组织已有的知识结构使之不断改善自身性能的过程。研究者可以
通过机器学习来抓取现有数据的特征来预测未知的概率分布,找到新的具有相同特征的数据并加入库中。机器学习中最关键的就是开发出能智能识别复杂模式并能智能化决策的算法。
观点总结
多渠道数据的整合可以在两方面帮助广告主提高广告表现。
首先,此举可以增加广告受众总数,并会为广告主赢得源源不断的访问量。第二,多渠道数据整合后的定向还能促进消费者购买漏斗的每一个过程,广告主通常利用网站再定向技术来召回“购物车放弃者”或者流失的老客户,但实际上,广告主应该把注意力放在现有客户和新客户的比例。 总而言之,从搜索动机数据,到受眾分类数据,到最终的机器学习,都能促进购买漏斗的顶端访客数量的增加。结合上创意的策略定制、精准的位置选择,客户的转化率将会提高,广告主也将挖掘出更多的商机。
如何利用大数据分析财务工作总结和计划篇三
高校教育大数据的分析挖掘与利用
摘 要,本文从高校教育大数据的汇聚融合与挖掘应用的角度,分析了如何运用教育大数据技术推动大学管理和人才培养的创新改革的思路和方法。首先,分析了教育大数据对高校现代化、精细化、规范化管理的4个价值,其次,给出了高等教育大数据技术平台的基本技术架构,第三,结合教育大数据实际应用,介绍了陕西省高等教育质量监管大数据中心、mooc中国、西安交通大学教学质量综合监控与评价三个典型案例,最后,提出了教育大数据分析挖掘中的3项基础性关键技术
关键词,高等教育,大数据,分析,挖掘
高校大数据分析挖掘至少有四个典型价值, 一是使得大学的管理更加精准高效,可以朝着智慧治理、分类管理、过程监控、趋势预测、风险预警的方向发展,真正实现基于大数据分析规律的精准治理,改变管理的模糊性, 二是可以更加准确地分析评价课堂教学的质量,过去我们对课堂、对老师的评价是定性和模糊的,而在大数据智慧课堂的模式下,可以真正实现采集样本的持久化,采集方式
的多元化,挖掘手段的多样化,分析技术多维度,通过这些方式可以提高课堂教学的质量, 三是使得教和学更加智慧,更加有效。对学生来说,老师可以了解学生学习的进展情况,发现学习兴趣点,以及对老师讲的哪些内容理解或者不理解,学习路径分析及课程推荐等等。对教师而言,不仅可以跨校跨地域分享他人的优秀课程,而且可以对学习者进行精准分类,进行个性化指导, 四是资源服务的个性化、精准化推荐与服务,学习绩效的个性化评价,以及个性化教学管理,个性化手机内容推送等等,这些功能将有效提升教与学的效率和质量
首先,我们对高等教育大数据技术平台有一个总体的顶层设计,如图1所示。这不仅是学校自己要有一个大数据的管理平台或者是数据中心,而且也是面向区域乃至全国的平台。教育部评估中心正在努力建立国家级高等教育教学质量监控大数据中心,陕西省也是这样考虑的。数据来自高校、教育管理部门以及行业、第三方、企业用人单位等等各方面采集的数据,该数据平台既有大学的业务数据、课程资源,也有政府部门的统计数据,还有学生网上学习的日志数据,用户产生的ugc数据,比如微信、微博、论坛等等的数据,基于大数据平台,开展面向学习者、面向高等教育管理机构、教师、高校等提供服务,并和教育部评估中心、主管部门等
进行数据交换与对接
显然,这样一个大数据平台必须是一个高性能的计算平台,没有这样的基础设施一切无从谈起,所以去年我们学校花了很大的力气做了两件事,一个是把校内二级单位原来小的集群计算进行整合,形成学校统一的高性能云计算平台,既面向校内的科学研究、人才培养提供服务,其实也可以为社会提供合作共建共享模式。目前,我们已建立了一种自我造血机制,四两拨千斤,以这个平台吸引更多的外部资源,努力扩展平台的性能和应用
目前,我校的高性能平台除了应用于材料、航天、能动、信息等大型科学计算之外,还开展了以下三项典型的大数据应用
案例1,陕西省高等教育质量监控与评估大数据应用
图2所示的是陕西省高等教育的整体架构。其数据基础是来自陕西省100多所高校的各种办学状态数据,有将近700个表格,以及陕西省教育厅各个职能部处的各种各样的管理数据,此外还有行业第三方提供的数据,包括招生、就业数据等等,这个平台上我们开展预测预警、查询在线分析、信息发布、统计决策等等,主要是为省级教育管理部门、评估机构、教育管理机构提供各种各样的办学状况的分析、统计、关联分析
建设全省高等教育大数据服务平台,实时采集各高校的办学状态数据,其根本目的是为了汇聚全省各高校的办学状态数据,打破数据孤岛,融合各方数据,实现横向关联比较、纵向历史分析,提供精准服务,支持科学决策
首先,该平台面向省教育厅提供了11项功能,从根本上解决了原来各处室间的数据孤岛的问题,实现了数据融合,横向关联,纵向融通,这个数据和各个高校是实时融通的,为省教育厅领导和职能部处提供了领导仪表盘、各职能处室的专项服务、81张高基表及年报年鉴表格的自动生成、绩效分析、招生就业及办学指标计算、教育评估等功能,从根本上解决了数据碎片化及其治理问题
其次,面向全省高校辅助决策,为高校领导以及校内各个职能部处提供了系列功能,包括办学情况综合分析和在线查询,专业结构分析比较,校级的教学质量监控评测体系,教师管理等等,这些功能非常实用,这是大学实现精细化、规范化、现代化管理的必备基础。以我校为例,我们过去教师的数据可能在人事处、教务处、科研院等学校的职能部门,采取本平台以后,把教师有关的所有数据都进行了融合,打通了所有原来割裂的数据。从去年开始,我们学校的职称评聘,年度考核全部基于这一平台,全部在大数据里,建立健全了基于数据驱动的精准化服务,解决了数据碎片化历史遗留问题,实现了从管理信息化向服务信息化的根本转变
第三,为本科教育教学评估及专业认证提供技术支撑。鉴于本平台能提供比较全面的高校办学状态数据,便于专家在进校之前全面系统地掌握学校办学的情况,找到问题,精准查看验证,提高效率,给高等教育评估提供了重要支持。基于本平台,我们成立了中国西部高等教育评估中心,接受陕西省教育厅指派的省属本科高校的审核评估和专业论证。如果没有这一高等教育大数据平台的支撑,工作量和难度是极其巨大的,甚至难以实现
案例2,mooc中国技术平台
mooc中国成立于2015年1月,到目前为止已经有121所高校加入,理事单位40家,会员单位80家。该平台的宗旨是,做政府想做的,做社会愿意做的,做单一高校做不了的事情。例如,真正解决校际资源共享、学分互认等,开拓远程教育国际化等未来发展的难题。 图3给出了mooc中国的技术框架。其核心是互联网+教育,实现互联网教育从1.0到2.0的升级。基于这一平台,既要开展网络教育业务的国际化,比如我们牵头成立的“丝路大学联盟”,其目的之一是借助mooc中国平台,实现网络教育业务的国际化,通过mooc中国平台,面向“一带一路”国家开展开放教育和技能培训
到目前为止,mooc中国已经有了9911门课程,用户将近600万,其中光it培训的有500多万,学历教育在读
学生50多万
案例3,西安交大教育教学大数据分析挖掘与应用
学校非常重视教育信息化技术融入和应用到教育教学之中,去年一次性建成了80个智能教室,把物联网技术、云计算技术应用于智能教室和教学一线,基于物联网技术实现教室设备的集中管理、智能控制,同时,将互联网技术深度融入到教室的管理当中,除了多媒体的直播录制功能以外,还提供了学生考勤和专家的精准督导,通过云平台来集中管理各个教室,比如说开投影机、关电源、关多媒体设备等等,都可以通过后端的云平台集中管控,真正实现教室管理的数字化、智能化、精细化,提升了教学保障的能力,也大大提高了教室管理的效率。更重要的是,这些教学的过程数据可以全程采集下来,获得数据,有了这些数据,就可以做精准化分析服务,建立西安交大教学质量大数据监测中心 目前,我校的教学大数据主要包括两大部分,一是教师在授课过程中的全程录制的课堂实况,二是学生在学习过程中产生的大量日志数据。基于这个平台,我们可以开展教育教学的大数据关联分析,开展课堂教学质量的综合评价,实现正面激励、负面惩戒、精准督导,实现教学评价从模糊宏观到量化精准、从每学期制到持续常态、从部分随机到全面覆盖、从事后评价到实时动态的根本转变。通过评价激励老师敬畏课堂,评选精品课堂、示范课堂,在全校内进行正面
表彰,另外也作为教学质量评价的重要依据,包括教师的职称晋升,评选最喜爱的老师等等
此外,本系统还为学院领导和管理部门提供了针对性的信息服务与决策支持,以数据说话,量化分析,改变了以前我们的模糊评价,采取多维度、全覆盖、持续化、精细化的过程评价与监控
首先,介绍一下大数据人工智能的基本原理。前段时间,alphago战胜世界围棋冠军这一故事炒得很热。这对我们的教育科研工作者提出了一个重要的课题,到底人工智能会不会战胜人类的智能,将来教师存在的主要价值是否还有必要,863计划正在研究一个项目,到2020年,人工智能软件参加高考得分要超过一本线,这就是说,计算机教出来的机器软件参加高考都能达到一本线以上。这就引起我们的思考,这是一个深层次的方向性问题。当然我们今天不是谈这个问题,而是我们要看看alphago的原理,其核心是价值计算函数,用收益函数来判断围棋下一步该落子到哪里其收益是最大的,其中采用了人工智能深度学习方法。alphago并非天生聪明,其实他的智慧是分三步完成的, 第一步,给alphago输入了3000万个人类围棋高手的棋谱和走法,任何一个人是不可能记住3000万个棋局的,只有人工智能才能记住 第二步,alphago自己和自己对弈,在对弈过程中找到自己的薄弱点,进而改进和完善,这其实和人的学习原理类似
第三步,才是人机对弈,从职业选手到世界围棋冠军,通过这样不断的对弈完善算法,校正学习,使得alphago具有强大的智能计算能力。alphago的难点在哪,其关键在于在一个巨大的落子空间选一个最大的收益点,或者落子点,称之为movepicker,,函数,这个空间很大,有10170次方,在如此庞大的计算空间中选择最优函数,只能依靠高性能计算平台
alphago为我们研究大数据问题提供了思路和启发。我们在研究教育大数据问题中需要着力攻克以下理论与技术难题
第一,大数据造成了严重的认知碎片化问题。比如,大家在百度搜糖尿病会检索出4440万个数据源,谁也看不过来,并且里面还有一大堆真假难辩的数据。所以,碎片化知识的聚合是一个非常基础的难题,高度的碎片化降低了知识的可用性,造成了分布性、动态化、低质化、无序化等典型的问题
一方面是知识的碎片化,另一方面是每个人的兴趣和需求还不一样。所以,资源的碎片化整合以及个性化推荐是今后人工智能中的关键问题。我们的思路是,一方面,我们要
从资源的角度把无序、分散、低质的资源进一步重组以后形成知识点,形成有序的知识地图,另一方面,要对学习过程进行跟踪,实现兴趣、个性、情感等方面的动态分析与挖掘,两者结合起来,建立基于用户兴趣和个性的资源推荐,最后实现个性化精准过滤,通过知识地图面向用户提供导航学习,从而缓碎片化知识的问题。开展这一研究也要建立庞大的基础数据,就像刚才讲的alphago,光靠智能软件肯定不可能那么聪明,需要建立庞大的知识地图、知识图谱,并将其放到了国际开源社区和开放数据平台之上 第二,碎片化知识的聚合问题。其目的是解决“既见树木,又见森林”的问题,破解“学习迷航”、“认知过载”的问题。我们正在承担国家自然科学基金重点项目,研究如何将多源、片面、无序的碎片化知识聚合成符合人类认知的知识森林,找出主题与主题之间的认知关系,最后形成一个知识森林,其中需要解决主题分面树的生成、碎片化知识的装配、知识森林生成、学习路径选择与导航等有关知识地图、知识图谱构建与应用等许多基础性关键技术
第三,学习行为的分析和挖掘技术。网上学习最大的好处我们可以把教师和学生所有的教与学的行为记录下来,讨论、作业、习题、笔记及进度记录下来,有了这些数据,我们可以进行后续分析,开展学习行为的特征识别和规律发现等等,既可以跟踪挖掘某个个体的学习规律,也可以找出一
个群体、一个小组的特征和规律。针对不同的课程,开展课程点击率、学习人群、知识关注点、学习时间等的分析与跟踪,刻画一个学生学习的过程,从时间、空间和课程知识导航的角度,甚至围绕某个知识点,研究学习者的特征、行为、交互等相互之间的关系,为老师深化课程改革、探索以学生为中心的教学设计具有非常重要的意义
教育是全人类、全社会发展的基础性事业,随着互联网+技术全面渗透和深度融入教育教学,不仅产生了大量的课程资源和学习内容,而且还产生了巨量的教育教学管理数据、行为数据、服务数据,蕴藏着巨大的价值,亟需我们开展深入研究,可谓前景广阔,挑战巨大,
,编辑,王晓明,