加入收藏 | 设为首页 | 会员中心 | 我要投稿 源码门户网 (https://www.92codes.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

我国大数据发展指数构建及实践应用——从政务数据与社会数据融合的视角

发布时间:2022-11-19 03:03:26 所属栏目:大数据 来源:未知
导读: 0 引言指数是客观反映事物发展水平的有效工具之一。随着大数据的快速发展,大数据指数研究成为学术界的重点议题,成为客观反映中国大数据发展现状的重要手段,有助于政府、企业、社会了解大

0 引言指数是客观反映事物发展水平的有效工具之一。随着大数据的快速发展,大数据指数研究成为学术界的重点议题,成为客观反映中国大数据发展现状的重要手段,有助于政府、企业、社会了解大数据领域的发展状况,为相关决策的制定提供参考。近年来,随着我国大数据战略的持续推进,如何对大数据发展水平进行量化评估,为政府科学决策、精准施策提供客观数据支撑大数据指数,成为众多研究机构的一项重要任务。许多学者围绕大数据指数进行了深入研究,形成了丰富的指数类研究成果。但受限于数据的可获得性,目前大数据指数领域研究利用的数据或者仅涉及经济或民生等某一具体领域,或者仅使用政府统计类小数据或互联网大数据,数据种类及数量不足,难以真正实现“统筹规划政务数据资源和社会数据资源”的目标。这成为我国大数据指数研究的重要瓶颈,亟待突破。本文以2019年贵阳数博会发布的《中国大数据发展指数报告(2018年)》提出的大数据发展指数(2018)为例,充分融合政务数据和社会数据资源,为我国大数据指数研究探索新的路径。1 已有工作在国外,大数据指数研究首先在预测流行病的发生概率方面取得了显著成效[1],随后,大数据方法逐步被拓展到经济学领域[2],许多学者围绕个人消费行为[3]、失业率预测[4-5]、劳动供需分析[6]、就业歧视[7]等进行了大数据指数监测预测研究。

近年来,采用综合集成方法,融合多视角、多层面、多利益方,把各方面构成要素有机融合,成为大数据治理体系框架构建的基本思路[8]。在国内,大数据指数研究的力度逐渐加强,形成了两种主要类型,第一类是以高校为代表的学术类研究,第二类是权威信息化机构发布的评估类研究报告。1.1 学术类大数据指数研究国内学术类大数据指数研究主要由高校牵头,往往聚焦某个特定领域。比如,一些学者围绕消费[9]、交通[10]、就业[11]、融资[12]、生活质量[13]等民生领域,编制了大数据指数进行预测分析研究;也有学者聚焦经济领域,通过形成电力大数据指数[14]、金融风险指数[15]、制造业指数[16]、实体经济指数[17]等,对经济发展趋势进行监测预测研究;还有一些学者关注政府治理[18]、互联网舆情[19]、居民情绪[20]、社会信用[21]、城市发展[22]等社会治理领域,开发了相关的大数据指数。1.2 评估类大数据指数研究评估类大数据指数研究主要由国家信息中心、中国信息通信研究院(以下简称中国信通院)、中国电子信息产业发展研究院(以下简称赛迪研究院)等国家级信息化机构编制,从国家层面、区域层面、省级层面、产业层面等对我国大数据的发展情况进行评估排名,阿里巴巴集团、南方基金管理股份有限公司、新浪财经等企业也基于自身数据资源优势,针对某个领域开展大数据指数评估。

大数据100指数成份股_大数据指数_大数据房价指数

根据数据源及分析方法的不同,评估类研究又可分为互联网大数据分析与统计数据分析两种情况。互联网大数据分析的典型代表是国家信息中心编写的《中国大数据发展报告(2017)》,该报告基于40多亿条互联网数据,应用大数据分析技术,从政策环境、人才状况、投资热度、创新创业、产业发展、网民信心等方面,对全国各省大数据的发展情况进行评估。阿里研究院2017年发布的《品质消费指数报告》[23]从全网采集数据,使用大数据技术分析了我国居民消费的升级趋势。南方新浪大数据指数则在利用上市公司数据的基础上,将互联网大数据引入指数编制中,利用大数据对市场主体的情绪进行刻画和量化。这类评估的好处在于,基于海量的互联网数据、使用大数据技术进行的分析评估,其数据样本很大,有的指数涵盖数十亿甚至数百亿条数据,且很多数据能够实时动态更新,同时使用了数据挖掘、文本分析、语义分析等大数据技术,是真正意义上的大数据分析。不足之处在于,由于数据采自互联网,容易被认为是网络舆情分析或不能直接反映现实情况。统计数据分析的典型案例是中国信通院发布的《中国大数据发展调查报告(2018年)》,其主要通过现场访问、电话采访、在线调研和专家访谈等方式获取数据。

赛迪研究院发布的《中国大数据发展指数报告(2018年)》也主要以统计数据为基础,对我国31个省、自治区、直辖市的大数据发展环境、大数据产业、大数据应用、技术研发创新及数据共享开放情况进行评估。这类评估主要基于官方统计数据或调查研究数据,使用传统数据分析方法进行分析评估,好处是数据相对权威,不足之处在于这类评估并非真正意义上的大数据分析,而是基于传统统计方法开展的小样本数据分析。从以上分析可以看出,无论是学术类大数据指数研究还是评估类大数据指数研究,虽然都可以在一定程度上进行大数据预测或反映大数据的发展水平,但也存在一些不足。学术类大数据指数研究由于缺少海量数据支撑,即便拥有较好的分析技术方法,往往也只能对某一领域进行研究,分析对象无法覆盖各个省市。权威机构发布的评估类指数也存在一定缺陷,从数据源来看,该类评估仅仅基于互联网大数据或统计小数据,不能体现多源数据广泛代表性的优势,同时由于数据获取困难,评估对象只能覆盖到省级地区,无法延伸到地市层面。2 数据来源及加工处理为了弥补上述两类方法的不足,国家信息中心联合相关单位,探索将政府部门数据、政府网站数据、统计数据等政务数据与互联网大数据、企业数据等社会数据进行对接融合,构建了大数据发展指数(2018),使用大数据方法对全国及各省市大数据发展情况进行评估,从而既体现政务数据的直接性和权威性,也保证互联网等社会数据的鲜活性和大样本量。

大数据房价指数_大数据100指数成份股_大数据指数

一是数据层面,拓展多源数据。“指标好编、数据难得”是评估工作中普遍存在的问题,是否拥有广泛的数据源和足够的数据量,直接关系到定量评估的效果的好坏。本文通过大数据评估解决了数据源问题:一是通过搭建大数据指标监测系统,抓取互联网中与大数据评估相关的指标,包括政府大数据规划及政策、企业注册数据、专利数据、招聘数据、经济金融产业中间投入及数量等数据;二是采集国家统计局、工信部、知识产权局发布的相关政务数据;三是参考借鉴现有研究成果,包括财新BBD(成都数联铭品科技有限公司)数字经济指数中的产业指数、新华三数字经济指数和国家行政学院电子政务研究中心提出的政务应用指数等。通过互联网数据与政务数据融合分析,保证多源数据的代表性,同时也兼顾了数据的权威性。相关数据见表1。二是对象层面,覆盖所有城市。此前的评估主要针对国家层面、区域层面及省级层面,缺少全方位对城市层面进行的专门评估。本文将评估对象下沉到城市级,获取全国各个城市的多源异构数据,对各城市的大数据发展进行全景式分析,力求展现各城市的大数据发展水平。三是技术层面,使用先进技术。传统的统计分析仅能处理小样本数据,而对于数十亿甚至数百亿条的数据,往往束手无策。

更重要的是,对于互联网上的大量非结构化数据,只能通过大数据手段,才能进行有效的分析挖掘。大数据发展指数(2018)的数据加工处理综合使用了文本挖掘、语义分析、情感分析、机器学习等先进技术手段,体现了应用大数据技术开展大数据评估的特点。3 指数构建3.1 构建原则为了确保评价指标的有效性,准确、全面地衡量我国大数据的发展水平,本文在设计大数据发展指标时坚持以下4项原则。一是完备性。指标体系中的指标能够全面地反映评估对象的发展情况,确保不遗漏重要指标项。本评估指标体系包含了基础能力、创新应用、综合保障三大方面,从50个维度评估省市的大数据发展情况。二是客观性。在指标选取及整个指标体系的确立中,每个环节均选取客观、可量化的指标,除了能够在网上直接采集的客观数据,也采用了政府部门及相关机构发布的客观统计数据,并借鉴了已有研究成果,尽可能规避主观因素带来的干扰。三是导向性。整个指标设计突出了应用导向,将“创新应用”指标作为最重要的指标,并赋予最大的权重,重点评估各个省市在政务、经济及民生三大领域的应用成效。四是易操作性。所有指标的数据均能获取,有些数据甚至可以做到实时获取。评价方法采用专家赋权法,该方法具有很强的操作性。

同时,专业分析人员及大数据分析平台保证了整个评估工作的易操作性。表1???大数据发展指数的政务数据与社会数据使用情况数据类别数据级别具体来源政务数据国家级工信部、商务部、国家市场监督管理总局、国家统计局、知识产权局、国家行政学院、国家互联网应急中心、中国互联网络信息中心、国家信息中心地区级省市政府门户网站、各地统计年鉴社会数据企业数据BBD大数据、全国中小企业股权交易中心、私募通数据库、新华三集团第三方机构数据中国电子信息产业统计年鉴互联网数据互联网各大招聘网站新窗口打开|?下载CSV3.2 指标体系大数据发展指数(2018)以“应用”为核心,围绕“能力-成效-保障”3个方面,构建了由基础能力、创新应用、综合保障构成的一级指标。按照每个一级指标包含的核心要素,设置了9个二级指标,同时,根据数据的可获得性以及为了充分体现政务数据与社会数据的融合,构建了50个三级指标,形成了我国大数据发展指数。大数据发展指数属于大数据指数范畴,两者在数据采集汇聚、加工处理以及编制思路等方面基本相似,只是大数据发展指数更加强调发展应用,“能力-成效-保障”3个维度更加突出发展的导向。(1)基础能力指标基础能力指标主要衡量地区的大数据基础,包括数据、算力、算法3个二级指标和20个三级指标,见表2。(2)创新应用指标创新应用指标包括政务应用、经济应用和民生应用3个二级指标和24个三级指标,体现大数据在政府治理、产业发展和便民服务领域的应用,见表3。(3)综合保障指标综合保障指标包含政策保障、合作保障和安全保障

(编辑:源码门户网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!