导航
  • 报考
  • 备考
  • 政策

报考

备考

复习资料

政策

行业动态

转行机器学习的技能有哪些?想做好人工智能就要掌握这些内容

环球网校·2020-06-18 13:53:18浏览47 收藏14

请输入下面的图形验证码

提交验证

预约成功

我知道了
摘要 如果你问任何数据科学家他们的主要工作是什么,他们会告诉你90%的工作是数据处理,今天就来带大家看转行机器学习的技能有哪些?想做好人工智能就要掌握这些内容,所以让我们来具体看看《转行机器学习的技能有哪些?想做好人工智能就要掌握这些内容》的全部内容。

转行机器学习的技能有哪些

一、转行机器学习的技能有哪些——统计

为了深入理解机器学习,我们必须具备扎实的统计学基础知识,这涉及到几个方面:

衡量模型成功的各种方法(准确性、召回率、ROC曲线下面积等)。损失函数和评估指标**的选择与模型**的输出有何偏差。

如何理解**过拟合**和**欠拟合**和**偏差/方差权衡**。

你对模型的结果有什么信心。

二、转行机器学习的技能有哪些——机器学习理论

训练神经网络时,实际发生了什么?什么使一些任务可行而另一些任务不行?要找出这些问题,最好的方法不是深入学习理论知识,而是尝试通过图形和实例来理解机器学习。

要理解的概念范围包括:不同损耗函数的工作原理是什么,反向传播为什么有用,以及计算图是什么。如何建立一个功能模型,以及如何与团队中的其他人进行有效沟通,都需要深入了解。

另一项基本技能是阅读、理解和执行论文的能力。一开始可能很难做到这一点,所以最好的方法是阅读附带代码的论文(例如,研究关于gitxiv的论文),并尝试理解它是如何实现的。

三、转行机器学习的技能有哪些——数据处理

如果你问任何数据科学家他们的主要工作是什么,他们会告诉你90%的工作是数据处理。这与应用人工智能同样重要,因为模型的成功与数据的质量(和数量)密切相关。数据工作包括许多方面,但可以归纳为以下几类:

数据采集(包括:寻找好的数据源,准确测量数据的**质量**和**分类**,获取和推断标签)

数据预处理(**缺失数据**填充,**功能工程**,数据**增强**,数据**标准化**,交叉验证和分割)

数据后处理(提供模型输出、清洗、处理**特殊情况**和**异常值**)

熟悉数据处理的最好方法是获取数据集并尝试使用它。有许多在线数据集,以及许多提供api的社交媒体和新闻媒体网站。基于以上步骤,我们可以了解到:

获取一个开源数据集并检查它。它有多大(点和特征的数量),数据分布如何,是否有缺失或异常值?

构建将原始数据转换为可用数据的转换过程。如何填写缺失值?如何正确处理异常值?如何标准化数据?是否可以创建更多的性能特征?

检查转换的数据集。如果一起看起来很正常,请继续下一章!

四、转行机器学习的技能有哪些——调试或调整模型

调试机器学习算法(无法收敛,或结果不合理)与调试普通代码有很大不同。同时,要找到合适的体系结构和超级参数,需要有坚实的理论基础和完整的基础设施,才能对不同的配置进行全面的测试。

由于机器学习的快速发展,调试模型的方法也在不断发展。下面是从我们对部署模型的讨论和经验中总结出来的“合理性检查”列表,它在某种程度上也反映了许多软件工程师熟悉的kiss原则。

从一个简单的模型开始,它已经被证明可以与类似的数据集一起工作,以尽快获得基线版本。经典的统计学习模型(线性回归、最近邻等)或简单的启发式算法或规则通常可以帮助你解决80%的问题,并更快地达到要求。一开始,这是解决问题的最简单的方法(见谷歌机器学习规则的前几点)。

如果决定训练更复杂的模型以改进基线版本,则可以使用数据集的一小部分进行训练并实现过度拟合。这确保了模型至少有学习的能力。迭代模型,直到5%的数据被过度拟合。

一旦更多的数据用于训练,超级参数将发挥更大的作用。您需要了解这些参数所涉及的理论,以便找到合理的值。

请采用有针对性的方法对模型进行优化。简要记录您使用的所有配置及其结果。在理想情况下,可以使用自动超参数搜索策略。一开始,随机搜索就足够了。

开发能力越强,实现这些步骤的速度就越快,反之亦然。

五、转行机器学习的技能有哪些——软件工程

许多应用程序机器学习允许您充分发挥您在软件工程方面的技能,尽管有时会有一些变化。这些技能包括:

测试管道的所有方面(数据预处理和增强、输入和输出排序、模型推理时间)。

基于**模块化**和可重用性原则构建代码。

在培训过程中的不同点备份模型(**set checkpoint**)。

配置**分布式基础设施**,以便更有效地训练、搜索或推断参数。

以上就是《转行机器学习的技能有哪些?想做好人工智能就要掌握这些内容》的全部内容,从文字我们能看到,如果你问任何数据科学家他们的主要工作是什么,他们会告诉你90%的工作是数据处理,环球网校小编提醒您,如果你想知道更多人工智能知识,可以点击下方资料下载链接。

展开剩余
资料下载
历年真题
精选课程
老师直播

注册电脑版

版权所有©环球网校All Rights Reserved