导航
  • 报考
  • 备考
  • 政策

报考

备考

复习资料

政策

行业动态

人口大数据发展受限的原因是什么?大数据工程师一定要搞懂

环球网校·2020-06-18 11:26:05浏览25 收藏2

请输入下面的图形验证码

提交验证

预约成功

我知道了
摘要 总的来说,这与我国大数据开放的现状、人口研究的方向和人口学家的培养有关,这就需要我们知道人口大数据发展受限的原因是什么?大数据工程师一定要搞,这也反映出大数据重要,现在就告诉你人口大数据发展受限的原因是什么?大数据工程师一定要搞。

人口大数据发展受限的原因是什

总的来说,这与我国大数据开放的现状、人口研究的方向和人口学家的培养有关。

1、人口大数据发展受限的原因是什么——人口统计学研究强调数量的准确性

但能够提供这种准确性的大数据却很少。用南佛罗里达国际大学的赖青博士的话说,人口统计学是“定量的”,而不是像社会学那样“定量的”。至于中国的生育水平,20多年来一直是人口统计学家争论的话题,目的是确定中国总生育率的具体比例在1到2之间。

2、人口大数据发展受限的原因是什么——在过去的十年里,越来越多的信息是电子的

甚至是定量的,但是开放获取公共部门持有的个人微观数据的可能性,如人口普查数据、户籍数据、婚姻登记数据、出生数据、教育状况数据,以及医疗保险、交通运输,劳动保险、房地产、银行等公共部门仍然很低。已经开放的数据往往只是一些互联网企业限制开放或可以公开爬行的不规则数据或零碎、不系统的文本、图片、视频数据。这些数据往往缺乏基本的社会人口学变量,大多无法解决样本表示和测量精度的问题,也无法对人口学关注的数量、结构和过程做出准确估计。因此,人口统计学家往往不敢使用这些数据。

3、人口大数据发展受限的原因是什么——人口统计学家并不擅长使用这些新数据

人口学擅长年龄和队列分析,往往需要年龄组或5岁组的统计指标,这就要求所有年龄组都具有独立的代表性,样本量很大。长期以来,人口学者主要依靠汇总数据或大规模抽样数据(包括人口普查和小人口普查的抽样数据、人口变动的抽样调查数据、卫生计生委组织的流动人口动态监测调查数据,权威部门(统计局、卫生计生委)发布的计划生育服务和生育状况调查数据,以及各单位组织的少量微样本数据和各类教育、卫生、户籍、人口汇总数据或小样本调查数据。人口统计学家之所以玩弄数据,是因为他们善于开发和使用聚合数据,而且他们使用计算机更早地处理微观数据,而且他们可能已经处理了大规模数据(如人口普查数据)。这些数据结构通常很简单,变量也不多。然而,收集和处理异常数据(如访谈文本)的经验较少,比社会学家更具选择性,更依赖公共部门。此外,真正掌握大规模原始商业数据(如户籍数据、人口监测数据、样本量在1000万以上的学生状况数据)的并不多,很多还需要依靠控制这些数据的业务人员进行查询和汇总。可以说,面对新的大数据和异常数据,国内人口学者的实际处理能力有待提高。例如,在新的大数据中,空间信息和社会网络信息越来越多。国内人口学者对这些新信息的理解和处理能力仍然有限,相当一部分研究主要是由地理老师贡献的。

一句话,不能用、不敢用、不肯用,阻碍了人口学家对大数据的探索和言说,他们比较擅长用量化的方法。虽然大数据的口号在社会上已经喊了很长时间,但我国基本公共数据的缺乏并没有发生明显变化,这使得即使是讨论也容易成为纸上谈兵,吹牛也不符合人口学家的形象。

以上就是对于《人口大数据发展受限的原因是什么?大数据工程师一定要搞》的详细分析,从文字大家可以看到,总的来说,这与我国大数据开放的现状、人口研究的方向和人口学家的培养有关,如果你想知道更多大数据的相关知识,可以点击下方资料下载链接。

展开剩余
资料下载
历年真题
精选课程
老师直播

注册电脑版

版权所有©环球网校All Rights Reserved