Coursera 上斯坦福大学机器学习在线课程回顾

注册人数超过 2.6 万(截至 2019 年 4.9 月),目前的平均用户评分为 5/XNUMX,是最受欢迎的数据科学大规模开放在线课程 (MOOC) 之一。 不可否认的是 机器学习在线课程 斯坦福大学 在 Coursera 上 取得了巨大的成功。 这无疑是由于 Andrew Ng 将机器学习的一些更复杂的方面简化为直观且易于学习的概念的出色能力。 但是,当我第一次开始这门课程时,我对这门课程有两个保留意见:

  • 既然它是在 2011 年创建的,那么本课程中的所有内容是否仍然相关?
  • 我会简单地重复我已经知道的吗?

就后者而言,我很幸运地获得了赞助,然后获得了一份数据科学家的工作,研究我的雇主一直在从事的一项大型合同(手动,与一大群人一起)研究用于自动化的自然语言处理几乎三年。 这是一个绝佳的机会,本文将讨论我对 Coursera 上斯坦福大学的机器学习在线课程. 如果你不熟悉 Coursera 的联合创始人兼创始人 Andrew Ng 深度学习,这是最受欢迎的游戏之一 机器学习在线课程.

这门课程是初学者的最佳选择,我稍后会解释,但我们世界上的一切都有缺点。 我试图找出其中的一些并提供资源链接,之后您应该对机器学习和数据科学有更好的理解。

Coursera 上斯坦福大学机器学习在线课程回顾

机器学习在线课程概述

本课程涵盖机器学习的基础知识。 您将对广泛的主题有透彻的了解,包括逻辑回归、支持向量机、神经网络和聚类算法等等。 您还将学习一些用于调试模型的有用技术,这些技术在 ML 中可能很困难,并且在大多数其他 ML 课程中经常被忽视。 许多核心算法将由您实现。 在现实世界中,您将能够通过您最喜欢的库直接使用这些功能,但是通过手动实施过程将使您的理解达到一个全新的水平。

文本理解(网络搜索、反垃圾邮件)、计算机视觉、 医生 将涵盖信息学、音频、数据库挖掘和其他主题。 准备复习你的数学技能,特别是线性代数、微积分、统计学和概率论。 不过,不要让这阻止你; 随着时间的推移,数学会变得更加清晰。 我将在本节简要总结每周的内容。 以下截图和说明均取自讲座。

第 1 周——线性回归

本周,我们将研究如何教计算机从数据中学习概念,而无需对其进行显式编程。 我们将从查看具有单个变量的线性回归开始。 基于输入值,线性回归预测实值输出。 讨论了线性回归在房价预测、成本函数概念和梯度下降学习方法中的应用。 我们还将提供有关线性代数概念的可选课程,以刷新您的记忆。 在课程的其余部分,需要对线性代数有基本的了解,尤其是当我们开始涵盖具有多个变量的模型时。

第 2 周——多变量线性回归

本周,我们将研究多变量线性回归。 我们将展示如何使用线性回归来适应多个输入特征。 我们还讨论了使用线性回归的最佳实践。 我们还将讨论如何使用 Octave。 您将完成编程练习,以帮助您了解如何将学习算法付诸实践。

第 3 周 - 逻辑回归

本周我们将讨论逻辑回归。 一种将数据分类为离散结果的方法是逻辑回归。 我们可能会使用逻辑回归来将电子邮件分类为垃圾邮件或非垃圾邮件。 分类的概念,成本函数 物流 回归,以及逻辑回归在多类分类中的应用都包含在这个模块中。 我们还将讨论正则化。 机器学习模型必须能够很好地泛化到以前从未见过的新示例。 将引入正则化,以防止模型过度拟合训练数据。

第 4 周 - 神经网络:表示

本周的主题是神经网络。 神经网络是一种基于大脑功能的模型。 如今,神经网络广泛用于各种应用:当您的手机解释和理解您的语音命令时,可能涉及到神经网络; 当您兑现支票时,自动读取数字的机器也使用神经网络。

第 5 周——神经网络:学习

您将在第 5 周学习如何训练神经网络。神经网络是最强大的学习算法之一(我通常在线性分类器失败时使用它),本周的视频解释了如何使用“反向传播”训练这些模型' 算法。 在本周的编程作业中,您将实现这个算法并看到它的实际效果。

还可以检出:  2022 年 XNUMX 门带证书的采矿和油气运营免费在线课程

第 6 周——应用机器学习的建议

在第 6 周,您将学习如何系统地改进您的学习算法。 本周的视频将教您如何识别学习算法何时表现不佳,并描述“调试”和提高学习算法性能的“最佳实践”。 我们还将讨论如何设计机器学习系统。 要改进机器学习算法,您必须首先确定可以进行最多改进的领域。

我们将讨论如何理解具有多个部分的机器学习系统的性能以及如何处理偏斜 data 在这些课程中。 在将机器学习应用于实际问题时,对本周内容的深入理解将轻松为您节省大量时间。

第 7 周——支持向量机

本周将介绍支持向量机 (SVM) 算法。 由于精心选择的优化目标,SVM 被广泛认为是最强大的“黑盒”学习算法和当今使用最广泛的学习算法之一。

第 8 周——无监督学习

本周你将学习无监督学习。 无监督学习算法只需要输入,而监督学习算法需要标记示例 (x,y) (x)。 您将了解集群,它用于各种应用程序,例如市场细分和文本摘要。 我们还将介绍主成分分析,这是一种加速学习算法的技术,对于可视化和理解数据非常有用。

第 9 周 - 异常检测

当您在线购买商品时,大多数网站会自动推荐您可能喜欢的其他商品。 推荐系统查看不同用户和产品之间的活动模式以做出这些推荐。 协同过滤算法和低秩矩阵分解是本模块中介绍的推荐算法的示例。

第 10 周——大规模机器学习

本周我们将讨论大规模机器学习。 当有大量数据用于训练时,机器学习效果最好。 鉴于当今许多网站/公司收集的数据量,知道如何处理“大数据”是硅谷最受欢迎的技能之一。

第 11 周 – 应用示例:照片 OCR

本周,我们将带您了解一个涉及 Photo OCR 的复杂的端到端机器学习应用程序。 识别和识别图像中的对象、单词和数字是一项艰巨的任务。 我们将讨论如何构建一个管道来解决这个问题,并分析和改进这样一个系统的性能。

讲师

Andrew Ng 是 DeepLearning.AI 的创始人,AI Fund 的普通合伙人,董事长兼联合创始人。 Coursera和斯坦福大学兼职教授。 作为机器学习和在线教育的先驱,吴博士在人工智能领域的工作改变了无数人的生活,在机器学习、机器人技术和相关领域撰写或共同撰写了 100 多篇研究论文。 曾任百度首席科学家、全球最大慕课平台Coursera联合创始人、谷歌大脑团队创始负责人。

Ng 博士现在将大部分时间投入到他的创业努力中,寻找最有效的方法来加速全球经济中负责任的人工智能实践。 不可否认,吴恩达很有魅力,尤其是在教学方面。 他能够以耐心、清晰、一致和结构​​呈现材料。

机器学习在线课程定价

费用取决于您是否需要结业证书。 更具体地说,课程定价如下:

  • 没有证书,它是免费的。
  • 如果你有证书,79 美元

关于在线学习平台证书是否有价值存在很多争论。 诚然,在筛选应聘者时,大多数雇主并不太关注此类证书。 尽管如此,因为这 Coursera 上斯坦福大学的机器学习在线课程 如此受欢迎,许多技术人员会接受它。 他们会知道你读过的材料。 因此,升级到付费版本可能是有意义的。 无论如何,拥有知识比拥有证书更有价值。

有什么缺点?

尽管它很有吸引力,但这门课程已经过时了。 这不是课程缺陷,但已经快 11 年了! (该课程于 2011 年发布)。 在此期间,发生了很多变化。 此外,如果该课程是关于深度学习(或其他快速发展的领域),那将是无关紧要的。 但是,由于本课程是关于基础知识的,因此其中几乎所有内容仍然相关。 除了关于机器学习应用程序的故事,现在看起来有点有趣。

此时,可用于完成实际任务的工具已经大不相同。 所有这一切都是因为最重要的进步 一台 视觉和自然语言处理发生在 2011 年之后。(主要课程示例是自动驾驶汽车和垃圾邮件分类器)。 这是一个完全正常的情况——一切都是先进的,现代课程将在十年内过时。 本课程涵盖了永远不会改变的基础知识(至少,我们是这么认为的),但重要的是要记住,实际任务的方法和工具是不断发展的。

还可以检出:  带证书的 10 大免费在线补充健康课程 | 2022

对于一些人来说,这可能是不言而喻的,但对于另一些人来说,这可能是令人困惑的。 技术方面是声音质量有时可能不一致。 但是,如果您在安静的环境中使用耳机学习,您将能够清楚地听到所有内容。 也有字幕。

机器学习在线课程将涵盖哪些内容?

该课程涵盖了很多内容,并且设法将大量信息塞进了看似很短的时间内。 并不是说它缺乏深度; 事实上,我相信材料的深度是课程的最强套装。 线性和逻辑回归、向量化、正则化、神经网络、前馈和反向传播(优秀)、成本函数、网络初始化、SVM、降维、监督/无监督学习、主成分分析(PCA)、K-Means 聚类、异常检测, 推荐系统等等都将被覆盖。

还有很多关于使用机器学习的建议,例如诊断偏差与方差误差、实施训练-验证-测试集、测量模型性能(准确度、精度、召回率和 F1 分数),哪些算法与大量数据与少量数据,以及如何调整所述算法以更好地适应我们的需求和/或情况。

优点

尽管有这些缺点,这 机器学习 在线课程 斯坦福大学在 Coursera 上 仍然是开始学习数据科学和人工智能的最有效方式。 本课程的好处多于缺点,以下是一些优点:

  1. 涵盖了广泛的机器学习技术。
  2. 由于吴恩达的才华和教学经验,他可以简单地解释复杂的概念。 Andrew Ng 是一位优秀的直觉老师,并且不怕处理数学问题。 尤其是本课程,是我见过的关于内核技巧和模型选择(防止欠拟合/过拟合)的最佳解释。
  3. 本课程的很大一部分致力于神经网络的基础知识。
  4. 详细介绍了大多数 ML 工程师的常见陷阱以及如何实际应用方法。
  5. 有十多种语言的字幕。 这使您可以随时随地学习,即使您的英语不是很好。
  6. 请记住,课程材料是免费的,您只需支付证书费用(标准 Coursera 费用约为 80 美元)。
  7. 您可以使用 Python 完成课程作业,但不能直接使用。

缺点

现在,虽然我强烈建议您参加该课程,但它确实有一些缺点。 在本节中,我收集了关于缺点的各种观点。 让我们仔细看看它们。

1. 编程语言和工具

本课程使用 Octave 编写,这是一种类似于 MATLAB 的科学计算编程语言。 Andrew Ng 解释说,他选择 Octave 是因为它的简单性,它可​​以让学生专注于逻辑和算法,而不是被复杂的环境设置分心。 不过,如果他更新材料(我听说他可能很快会这样做),我相信他这次会使用 Python。 Python 在数据科学和机器学习中变得过于流行。 设置环境并使用 NumPy 进行一些矩阵计算变得非常流行和简单。

不过,请记住,编程语言对于这门课程并不重要。 此外,一开始你会花很多时间用笔和纸来计算矩阵乘法的维数。 在大多数情况下,编程语言是无关紧要的。 要使用 Python 完成本课程,请转到以下内容 链接.

2. 有很多助手代码

在许多编程作业中,您不会从头开始编写代码。 通常,您必须用缺失的代码块填充代码骨架。 在某些情况下,填空太简单了。 代码中的注释几乎可以告诉您需要编写什么。 在这种情况下,尽管学生对主题缺乏了解,但通过作业相对容易。 然而,如果你选择简单的路线,你几乎肯定需要回去复习这些材料,作为未来作业的一部分。

3. 神经网络还不够

有些人抱怨互联网上没有足够的关于人工神经网络 (ANN) 的信息。 这是一个仅会讨论几周的主题。 尽管如此,我相信这门课程涵盖了最重要的基础要素。 请记住,神经网络和深度学习本身就是广泛的学科,这就是为什么我建议在完成深度学习专业后立即开始 Coursera 上斯坦福大学的机器学习在线课程.

还可以检出:  15项物流与供应链管理免费在线课程

4. 数学太多/不够

令人惊讶的是,一些学生认为这门课程涵盖的数学太少。 其他人则认为,某些内容过于数学化,使其变得困难且不切实际。 我想这取决于学生的背景。 然而,这是我不同意的观点之一。 正如我之前提到的,吴恩达在实践和理论之间取得了完美的平衡,确保你有足够的数学背景,至少对一个概念有更高层次的理解。 在大多数情况下,您还将获得指向外部资源的附加链接,这些资源可以更详细地解释数学理论。

5. 完成时间

根据课程主页,学生将需要大约 60 小时才能完成。 我相信,这是一个相当准确的估计。 根据我的个人经验,我在不到 3 个月的时间内完成了它,每周花费 5-7 小时。

你不会从机器学习在线课程中学到什么

机器学习的许多方面都被故意排除在课程之外。 我使用“有意识地”这个词是因为我相信 Andrew Ng 和课程设计团队精通下面列出的所有概念。 这样做是为了让初学者更容易理解课程。 尽管如此,我认为为那些有兴趣了解更多数据科学的人提供一些额外的材料是至关重要的。 这里有一些例子可以帮助你更好地理解机器学习和 数据科学. 我不会提及 CNN、RNN 或深度学习的其他方面,因为它处于如此高的水平。 但是,我相信这份清单可以帮助您更好地理解数据科学的含义。

1. 集成学习

该课程没有提到诸如 bagging、随机森林、boosting、stacking 等集成学习方法。在我看来,这是最重要的遗漏,因为课程中的神经网络被视为“整体”而不是弱分类器的集合。

2. 分类变量

尽管特征工程是数据科学工作的重要组成部分,但对分类变量和其他类型的变量只字未提。

3. 聚类

只有 K-Means 聚类算法被认为是聚类算法。

4. 降维

PCA 是唯一考虑的降维技术。 更不用说有许多方法这一事实,您可能会在课程结束时认为使用 PCA 进行数据可视化是一个好主意。

5.异常检测

Andrew Ng 在课程中谈到了异常检测,但他真正的意思是新奇检测,这是一个略有不同的任务。 在课程中,这个问题是使用密度估计的方法来解决的,其他的方法根本没有考虑。

备忘单

您还可以将我的备忘单文章用作数据科学概念列表,以更好地了解如何解决每项任务:

结论

我希望你喜欢这篇评论 斯坦福大学在 Coursera 上的机器学习在线课程。 总的来说,我相信在课程结束时可以在较小的部分进行更具挑战性和深度的作业,但除此之外,我非常喜欢这门课程,并相信我从中获得了很多价值。 如果您想潜入数据科学世界很长时间但又不敢,那么现在是注册该课程并获得独特体验的最佳时机。

常见问题解答 

机器学习是一个可行的职业选择吗?

如果你问机器学习的职业是否是一个不错的选择,那么显而易见的答案是肯定的。 所以,如果你对数据、自动化和算法感兴趣,那么机器学习对你来说是一条很好的职业道路。 您的一天将充满分析大量数据并实施和自动化它。

Coursera 上的机器学习课程难吗?

该课程涵盖了很多领域,但有些杂乱无章。 这里有很多数学,所以如果你不熟悉线性代数,你可能会遇到困难。

斯坦福机器学习课程是免费的吗?

Coursera 上的这门机器学习课程的标题是“机器学习”,完全免费。 只有在完成后想要获得 Coursera 可共享的机器学习认证时,您才需要付费(尽管这可能会吸引潜在的雇主)。

斯坦福的机器学习 Coursera 值得你花时间吗?

不可否认,通过 Coursera 获得的斯坦福大学机器学习认证取得了巨大的成功。 这无疑是由于 Andrew Ng 将机器学习的一些更复杂的方面简化为直观且易于学习的概念的出色能力。

还请阅读: 成人免费在线认证高中文凭

版权警告! 未经适当许可或确认,不得全部或部分重新发布、复制、重新分发本网站上的内容。 所有内容均受 DMCA 保护。

本网站上的内容是出于善意发布的。 如果您拥有此内容并认为您的版权受到侵犯或侵犯,请务必通过 [xscholarshipc(@)gmail(dot)com] 与我们联系,我们将立即采取行动。

作者照片

马丁·乌瓦奎(Martin Uwakwe)

作为拥有 7 年以上经验的 SEO 策略师、网络分析专家和内容开发人员,我热衷于利用数据驱动的见解来优化在线可见性、推动自然流量并提高搜索排名。 我的业绩记录包括成功优化和分析数百个电子商务网站、管理数百万美元的营销预算以实现最大投资回报率,以及制作能引起受众共鸣的引人入胜的内容。 凭借精通 SEO、数据分析、网络优化工具和内容创建,我致力于帮助企业在数字领域蓬勃发展。