4000-9696-28

转行人工智能之前,你需要掌握这 5 项技能!

2019年07月03日 11:30供稿中心:北大青鸟市场部

摘要: 转行人工智能之前,你需要掌握这 5 项技能!

最近,人工智能很火,所以导致很多人都在转行人工智能,可有很多人都不知道人工智能都做什么的,应该掌握什么技能?今天,小编秒速时时彩官网之前,你需要掌握的 5 项技能,希望能够帮助到大家!

1562124507(1).jpg

1—统计学

为了理解机器学习,坚实的统计学基础知识是必须的。这包含了以下方面:

评估模型成功的不同方法(精确度、召回率(recall)、特征曲线下的面积等)。你选择的损失函数和度量是如何测量你的模型输出的偏差的。

如何理解过拟合和欠拟合,以及偏差/变量的平衡。

模型的结果与置信度之间存在什么联系。

2—机器学习理论

当你在训练神经网络时,实际上发生了什么?是什么使这些任务可行而其它的不行呢?对待该问题的好方法是,在深入理解理论之前,首先通过图片和范例理解机器学习。

需要理解的概念,从不同的损失函数工作的方法,到反向传播有用的原因,最后要明白计算图究竟是什么。深入理解构建函数模型并且与团队中其他人有效地对其进行沟通非常关键。

3—数据纠纷

问任何一个数据科学家,他们会告诉你其 90% 的工作是数据再加工(data munging)。它对于应用人工智能的重要性就如同你的模型的成功与你的数据的质量(和数量)高度相关一般。数据在许多方面起作用,可分为以下几个类别:

获得数据(找到好的数据源,正确的测定数据的质量和分类,获得并推测标签)

数据预处理(补全缺失值(missing data),特征工程,数据增强,数据归一化,拆分交叉检验)

数据后处理(使模型的输出有用,去除人为数据,处理特殊情况和异常值)

熟悉数据纠纷(data wrangling)最好的方法是掌握混乱的数据集,并尝试使用它。网上有很多的数据集并且许多社交媒体和新闻媒体网站都有着很好的应用程序接口。

遵循以下步骤是一个不错的学习方法:

掌握一个开源的数据集并对其进行检测。它有多大(观测值和特征值的数量)?数据是如何分布的?是否有缺失值或者不含异常值?

开始在原始数据和有用数据之间构建一条转换的通道。回填是如何丢失值的呢?处理异常值最合适的方法是什么?你如何归一化数据?你可以创造更多的具有表现力的特征吗

测试你的转换数据集。

4—调试/调节模型

对一些不收敛或包含与调试代码非常不同的过程但是给出合理结果的机器学习算法进行调试。同样地,找到正确的架构和超参数需要坚实的理论基础,良好的基础工作可以测试不同的配置。

由于该领域在向前发展,调试模型的方法也在不断进化。以下是从我们的讨论和部署反映了 KISS 理论和软件工程师之间的熟悉度的模型的经验中得来的「合理性检查(sanity checks)」。

尽快从已经被证明可以在类似数据集上工作的简单模型入手,掌握基准线。古典统计学习模型(线性回归、最近邻等)或者简单的启发式方法或规则会让你明白 80% 的方法并且更快地进行实现。入门的时候,以最简单的方法去解决问题(查看谷歌机器学习规则的第一点)。

如果你决定训练一个更加复杂的模型以在基线上有所提升,不妨从你的数据集的一个小部分入手,在分数据集上训练模型使其过拟合。这保证了你的模型最起码的学习能力。不断地在模型上迭代直到你可以过拟合 5% 的数据。

一旦你开始在更多的数据上训练,超参数就开始变的更重要了。理解这些参数背后的理论从而去理解什么是要探索的合理值。

使用理论方法调节你的模型。写下你使用的最低限度的配置并对其结果进行总结。理想情况下,使用自动超参数搜索策略。在最开始,随机搜寻可能就足够了。尽可能地去探索更多理论方法吧。

5—软件工程

许多应用机器学习允许你充分利用软件工程技巧,有时会有小小的转弯。这些技巧包括:

测试转换线路的不同方面(数据预处理和增强、输入和输出清除、模型推理时间)构建模块化的代码和可重复的实验加速方法在训练的不同阶段备份模型(检查点)建立一个分布式基础架构来运行训练、超参数搜索或者使其更有效地推理

以上的资源帮助你处理切实的机器学习问题。但是应用秒速时时彩官网领域变化的特别快,学习的最好方式是动手实践并且真正地尝试构建一个完整的解决方案去解决一个实际的问题。

版权说明:部分内容来源于网络,如有侵权,请联系小编进行删除!

关于我们
公司简介
发展历程
青鸟荣誉
联系我们
加入我们
青鸟课程
ACCP
学士后Java
BENET
启蒙星IT工程师基础课程
学习客户端下载
青鸟优师
青鸟微讯
回顶部 秒速时时彩官网 秒速时时彩官网
官方新版意见收集

*

官方新版意见收集

提交成功,感谢您的反馈。

我们会认真阅读和考虑每个用户的反馈。