导航
  • 报考
  • 备考
  • 政策

报考

备考

复习资料

政策

行业动态

滥用大数据产生了哪些问题?大数据工程师别再做这些事了

环球网校·2020-06-22 14:50:35浏览282 收藏56

请输入下面的图形验证码

提交验证

预约成功

我知道了
摘要 基于一个假设,我认为大数据是不可能站在人类行为领域的。研究文本或死物的历史和语言学是可能的。那么滥用大数据产生了哪些问题?大数据工程师别再做这些事了,小编为大家讲解滥用大数据产生了哪些问题?大数据工程师别再做这些事了。

一、滥用大数据产生了哪些问题——无意义意义

没有理论的大数据是皮毛,只看到显著的相关性,但没有检验和理论,这种相关性是无意义的或虚假的。关键是:对于大数据来说,数据点太多,在计算中很容易找到两个向量之间的显著关系,但由于数据量大,使得虚假关系的控制更加困难,这是一个两难的选择。我有一篇文章,匿名评论说:样本量大,当然可以找到显著的相关性,但看不到意义。

二、滥用大数据产生了哪些问题——抽样方法

统计师方凯萨总结了一个现象,即谷歌、Facebook等网络收集的数据往往不同质。它们在不同的时间由不同的资源收集,然后将整个数据组合起来。结果,大数据中的许多部分数据根本不是用同一种方法采集的,推翻了统计抽样的基本假设是的。而且线上数据和线下数据的内容不一样,比如《华尔街日报》的电子版和纸质版不一样,用户可以自定义内容。

三、滥用大数据产生了哪些问题——不稳定的机器语言

谷歌首先使用关键词来预测寒冷的疫区,这种预测起初比疾控中心的预测更准确,但后来变得越来越不准确。有人认为谷歌的搜索算法在不断改进,所以自动数据采集并不稳定。此外,如果机器语言被误导,就会变得越来越错误。例如,Google翻译是根据真实的文章进行总结的,但是一些网络的“真实”翻译实际上是Google翻译,所以Google会根据这些“真实”的文章进行自己的翻译。

归根结底,以上就是人与机的矛盾:数据必须由理论来指导和收集,否则就会出现错误。这些都是可以避免或改进的,但这些原因足以使大数据在短期内难以立足于社会科学领域。另外,我也有自己的想法。基于一个假设,我认为大数据是不可能站在人类行为领域的。研究文本或死物的历史和语言学是可能的,但社会学、犯罪学和人类学可能非常困难。

以上就是《有哪些未来的大数据趋势?大数据工程师一定要抓住》的全部内容,从文字中我们可以看到,基于一个假设,我认为大数据是不可能站在人类行为领域的。研究文本或死物的历史和语言学是可能的,如果你想避免滥用大数据,小编建议大家点击下方资料下载链接

资料下载
历年真题
精选课程
老师直播

注册电脑版

版权所有©环球网校All Rights Reserved