导航
  • 报考
  • 备考
  • 政策

报考

备考

复习资料

政策

行业动态

常见的机器学习挑战有哪些?这才是人工智能行业的“三座大山”

环球网校·2020-06-11 13:11:43浏览55 收藏11

请输入下面的图形验证码

提交验证

预约成功

我知道了
摘要 机器学习一旦被使用,就面临着关键的数据挑战,今天就来带大家看常见的机器学习挑战有哪些?这才是人工智能行业的“三座大山”,所以让我们来具体看看《常见的机器学习挑战有哪些?这才是人工智能行业的“三座大山”》的全部内容。希望本文对您有所帮助。

众所周知,数据对机器学习非常重要。了解数据访问模式将有助于数据科学家为他们的项目确定正确的存储基础结构。数据基础设施使机器学习成为可能。然而,机器学习一旦被使用,就面临着关键的数据挑战,这需要首先解决:质量、稀疏性、完整性,接下来,让我们深入研究每一个问题,以便您了解如何克服机器学习的这些挑战:

一、常见的机器学习挑战有哪些——质量

许多数据科学家希望使用外部来源的数据。然而,对于如何捕获原始数据,通常没有质量控制或保证。

你相信外部数据的准确性吗?

这是一个很好的例子。浮标上的传感器收集海洋温度的数据。但是,当传感器无法收集温度时,它将记录999。此外,2000年以前,这一年只记录了两个数字。但在2000年之后,记录的数字变成了4。

所以我们需要了解数据的质量以及如何准备数据。在这种情况下,分析浮标数据的科学家可以使用平均值、平均值、最小值和最大值来可视化原始数据,捕获这些数据库错误并进行相应的清理。

二、常见的机器学习挑战有哪些——稀疏性

在这种情况下,稀疏性适用于元数据。一般来说,元数据字段是不完整的,有些字段是填写的,有些字段是留空的。如果数据是从单一来源产生的,可能是由于缺乏人类规范或知识。但是,如果数据来自不同的源,并且没有元数据的标准定义,则每个数据集可能具有完全不同的字段。因此,当它们组合在一起时,完成的字段可能不对应。

目前,还没有捕获哪些元数据的行业标准。然而,元数据和数据本身一样重要。当用不同的元数据字段填充相同类型的数据时,如何关联和筛选数据?

以浮标为例,初始数据传感器每10分钟收集一次水温,而更新的浮标每3分钟收集一次水温。关联数据的唯一方法是在捕获时通过元数据公开它。当科学家进行历史分析时,他们需要元数据来相应地调整他们的模型。

三、常见的机器学习挑战有哪些——完整性

数据完整性是数据准确性和一致性的保证。数据保管链对于证明数据在管道和位置中移动时不会损坏至关重要。当控制数据的捕获和摄取时,可以相对容易地验证其完整性。然而,在与他人合作时很难核实。生成数据时,没有外部数据的安全证书。您无法确保数据记录与预期完全一致,或者接收到的数据与原始记录完全相同。

物联网数据和区块链有一些有趣的概念,但在这一概念被广泛采用之前,数据完整性取决于安全技术和策略的结合。例如,由于数据在静态或传输过程中可能受到威胁,通过网络传输的数据应使用HTTPS并在静态期间加密。另一方面,访问控制应该是策略驱动的,以避免人为错误。

以上就是《常见的机器学习挑战有哪些?这才是人工智能行业的“三座大山”》的全部内容,我们通常都知道人工智能就像互联网一样,是一把双刃剑。它只是一种工具和技术,环球网校小编提醒您,如果你想知道更多人工智能知识,可以点击下方资料下载链接。

展开剩余
资料下载
历年真题
精选课程
老师直播

注册电脑版

版权所有©环球网校All Rights Reserved