Обзор онлайн-курса Стэнфордского университета по машинному обучению на Coursera

С более чем 2.6 миллионами зарегистрированных (по состоянию на ноябрь 2019 г.) и текущим средним рейтингом пользователей 4.9/5, это один из самых популярных массовых открытых онлайн-курсов (МООК) по науке о данных. Нельзя отрицать, что Онлайн-курс по машинному обучению Стэнфордский университет на Курсере имел огромный успех. Это, несомненно, связано с превосходной способностью Эндрю Нг упростить некоторые из более сложных аспектов машинного обучения до интуитивно понятных и простых в освоении концепций. Тем не менее, у меня было две оговорки по поводу этого курса, когда я впервые начал его:

Все ли в этом курсе все еще актуально сейчас, когда он был создан в 2011 году?
Буду ли я просто повторять то, что уже знаю?

Что касается последнего, мне посчастливилось получить спонсорство, за которым последовала работа специалиста по данным, исследующего обработку естественного языка для автоматизации в рамках крупного контракта, над которым мой работодатель работал (вручную, с большой командой людей) почти три года. Это была фантастическая возможность, и в этой статье будут обсуждаться мои мысли о Онлайн-курс по машинному обучению Стэнфордского университета на Coursera. Если вы не знакомы с Эндрю Нг, соучредителем Coursera и основателем глубокое обучение.ai, это один из самых популярных Онлайн-курсы по машинному обучению.

Этот курс — лучший выбор для новичков, как я объясню позже, но у всего в нашем мире есть недостатки. Я попытался определить некоторые из них и предоставить ссылки на источники, после чего вы должны лучше понять машинное обучение и науку о данных.

Обзор онлайн-курса по машинному обучению

Этот курс охватывает основы машинного обучения. Вы получите глубокое понимание широкого круга тем, включая логистическую регрессию, машины опорных векторов, нейронные сети и алгоритмы кластеризации, и это лишь некоторые из них. Вы также узнаете о некоторых полезных методах отладки моделей, которые могут быть сложными в ML и часто упускаются из виду в большинстве других курсов ML. Многие основные алгоритмы будут реализованы вами. В реальном мире вы сможете использовать эти функции прямо из коробки с вашей любимой библиотекой, но процесс внедрения вручную поднимет ваше понимание на совершенно новый уровень.

Понимание текста (веб-поиск, защита от спама), компьютерное зрение, основным медицинским будут затронуты информатика, аудио, интеллектуальный анализ баз данных и другие темы. Приготовьтесь освежить свои математические навыки, особенно линейную алгебру, исчисление, статистику и теорию вероятностей. Тем не менее, не позволяйте этому удерживать вас; математика станет яснее со временем. В этом разделе я кратко подытожу содержание каждой недели. Скриншоты и описания, которые следуют, взяты из лекций.

Неделя 1 — линейная регрессия

На этой неделе мы рассмотрим, как научить компьютер извлекать понятия из данных без явного программирования. Мы начнем с рассмотрения линейной регрессии с одной переменной. Основываясь на входном значении, линейная регрессия предсказывает действительный результат. Обсуждаются применение линейной регрессии к прогнозированию цен на жилье, концепция функции стоимости и метод обучения с помощью градиентного спуска. У нас также будут дополнительные уроки по концепциям линейной алгебры, чтобы освежить вашу память. Для остальной части курса требуется базовое понимание линейной алгебры, особенно когда мы начинаем рассматривать модели с несколькими переменными.

Неделя 2 — линейная регрессия с несколькими переменными

На этой неделе мы рассмотрим линейную регрессию с несколькими переменными. Мы покажем, как использовать линейную регрессию для размещения нескольких входных функций. Мы также рассмотрим лучшие практики использования линейной регрессии. Мы также рассмотрим, как работать с Octave. Вы выполните упражнения по программированию, которые помогут вам понять, как применять алгоритмы обучения на практике.

Неделя 3 — Логистическая регрессия

На этой неделе мы поговорим о логистической регрессии. Методом классификации данных по дискретным результатам является логистическая регрессия. Мы можем использовать логистическую регрессию, чтобы классифицировать электронное письмо как спам или не спам. Понятие классификации, функция стоимости для логистический регрессия и применение логистической регрессии к многоклассовой классификации рассматриваются в этом модуле. Мы также поговорим о регуляризации. Модели машинного обучения должны иметь возможность хорошо обобщать новые примеры, которых раньше не было. Будет введена регуляризация, которая предотвращает переоснащение моделей обучающими данными.

Неделя 4 – Нейронные сети: представление

Тема этой недели — нейронные сети. Нейронные сети — это модель, основанная на том, как функционирует мозг. Сегодня нейронные сети широко используются в различных приложениях: когда ваш телефон интерпретирует и понимает ваши голосовые команды, скорее всего, задействована нейронная сеть; когда вы обналичиваете чек, машины, которые автоматически считывают цифры, также используют нейронные сети.

Неделя 5 – Нейронные сети: обучение

Вы узнаете, как обучать нейронные сети на неделе 5. Нейронная сеть — один из самых мощных алгоритмов обучения (я обычно использую его, когда линейный классификатор терпит неудачу), и видео на этой неделе объясняют, как обучать эти модели с помощью «обратного распространения». алгоритм. В задании по программированию на этой неделе вы сможете реализовать этот алгоритм и увидеть его в действии.

ТАКЖЕ ПРОВЕРИТЬ: 20 лучших онлайн-курсов по управлению персоналом в 2021-2022 гг.

Неделя 6 — Советы по применению машинного обучения

На неделе 6 вы узнаете, как систематически улучшать алгоритм обучения. Видео этой недели научат вас, как распознавать, когда алгоритм обучения работает плохо, и опишу «лучшие методы» для «отладки» и улучшения производительности вашего алгоритма обучения. Мы также поговорим о том, как спроектировать систему машинного обучения. Чтобы улучшить алгоритм машинного обучения, вы должны сначала определить области, в которых можно сделать больше всего улучшений.

Мы рассмотрим, как понять производительность системы машинного обучения, состоящей из нескольких частей, и как справиться с перекосами. данным на этих уроках. Четкое понимание содержания этой недели легко сэкономит вам много времени при применении машинного обучения к реальным проблемам.

Неделя 7 — машины опорных векторов

Алгоритм метода опорных векторов (SVM) будет рассмотрен на этой неделе. SVM широко известны как самый мощный алгоритм обучения «черный ящик» и один из наиболее широко используемых алгоритмов обучения сегодня благодаря правильно выбранной цели оптимизации.

Неделя 8 – Обучение без учителя

На этой неделе вы узнаете о неконтролируемом обучении. Алгоритмы обучения без учителя требуют только ввода, тогда как алгоритмы обучения с учителем требуют помеченных примеров (x, y) (x). Вы узнаете о кластеризации, которая используется в различных приложениях, таких как сегментация рынка и суммирование текста. Мы также рассмотрим анализ основных компонентов, который представляет собой метод ускорения алгоритмов обучения и может быть чрезвычайно полезен для визуализации и понимания данных.

Неделя 9 – Обнаружение аномалий

Когда вы покупаете что-то в Интернете, большинство веб-сайтов автоматически предлагают другие товары, которые могут вам понравиться. Рекомендательные системы изучают шаблоны действий между разными пользователями и продуктами, чтобы дать эти рекомендации. Алгоритм совместной фильтрации и факторизация матриц низкого ранга являются примерами рекомендательных алгоритмов, рассматриваемых в этом модуле.

Неделя 10. Крупномасштабное машинное обучение

На этой неделе мы поговорим о крупномасштабном машинном обучении. Когда есть много данных для обучения, лучше всего работает машинное обучение. Знание того, как обращаться с «большими данными», является одним из самых востребованных навыков в Силиконовой долине, учитывая объем данных, которые сегодня собирают многие веб-сайты/компании.

Неделя 11 — Пример приложения: распознавание фотографий

На этой неделе мы познакомим вас со сложным комплексным приложением машинного обучения, включающим распознавание фотографий. Распознавание и идентификация объектов, слов и цифр на изображении — сложная задача. Мы рассмотрим, как построить конвейер для решения этой проблемы, а также проанализируем и улучшим производительность такой системы.

Инструктор

Эндрю Нг — основатель DeepLearning.AI, генеральный партнер AI Fund, председатель и соучредитель Courseraи адъюнкт-профессор Стэнфордского университета. Работа доктора Нг в области искусственного интеллекта изменила бесчисленное количество жизней. Он стал пионером как в машинном обучении, так и в онлайн-образовании. Он является автором или соавтором более 100 исследовательских работ в области машинного обучения, робототехники и смежных областей. Ранее он был главным научным сотрудником Baidu, соучредителем Coursera, крупнейшей в мире платформы MOOC, и руководителем-основателем команды Google Brain.

В настоящее время доктор Нг посвящает большую часть своего времени своей предпринимательской деятельности, поиску наиболее эффективных способов ускорения внедрения ответственного ИИ в глобальной экономике. Эндрю Нг, несомненно, харизматичен, особенно когда дело доходит до преподавания. Умеет излагать материал терпеливо, ясно, последовательно и структурированно.

Стоимость онлайн-курса по машинному обучению

Стоимость определяется тем, хотите ли вы сертификат об окончании. Если быть более точным, стоимость курса выглядит следующим образом:

Без сертификата это бесплатно.
$79, если у вас есть сертификат

Существует много споров о том, ценен ли сертификат платформы онлайн-обучения. Действительно, при отборе кандидатов большинство работодателей не обращают особого внимания на такие сертификаты. Тем не менее, поскольку это Онлайн-курс по машинному обучению Стэнфордского университета на Coursera настолько популярен, что многие технические ребята взяли бы его. Они будут в курсе материалов, которые вы прочитали. Так что есть смысл перейти на платную версию. В любом случае, иметь знания более ценно, чем иметь сертификат.

Каковы некоторые из минусов?

Несмотря на свою привлекательность, этот курс устарел. Это не недостаток курса, но прошло почти 11 лет! (курс выпущен в 2011 году). За это время многое изменилось. Кроме того, было бы неуместно, если бы курс был посвящен глубокому обучению (или другим быстро развивающимся областям). Однако, поскольку этот курс посвящен основам, почти все в нем по-прежнему актуально. За исключением, пожалуй, историй о приложениях для машинного обучения, которые сейчас кажутся немного забавными.

В настоящее время инструменты, доступные для выполнения практических задач, сильно различаются. Все это потому, что самые значительные достижения в компьютер зрение и обработка естественного языка произошли после 2011 г. (и основными примерами являются беспилотные автомобили и классификаторы спама в электронной почте). Это совершенно нормальная ситуация — все продвинуто, а современные курсы устареют через десять лет. Этот курс охватывает основы, которые никогда не изменятся (по крайней мере, мы так думаем), но важно помнить, что подходы и инструменты для практических задач постоянно развиваются.

ТАКЖЕ ПРОВЕРИТЬ: 10 лучших бесплатных онлайн-курсов по консультированию с сертификатами в 2022 году

Для кого-то это может быть самоочевидным, а для кого-то может вызывать недоумение. Технический аспект заключается в том, что качество звука иногда может быть непостоянным. Однако, если вы будете заниматься в наушниках в тихой обстановке, вы сможете все четко слышать. Также доступны субтитры.

Что будет рассмотрено в онлайн-курсе по машинному обучению?

Курс охватывает многое, и ему удается втиснуть удивительное количество информации в то, что кажется коротким периодом времени. Не то чтобы ему не хватало глубины; на самом деле, я считаю, что глубина материала — самая сильная сторона курса. Линейная и логистическая регрессия, векторизация, регуляризация, нейронные сети, прямое и обратное распространение (отлично), функции стоимости, инициализация сети, SVM, уменьшение размерности, контролируемое/неконтролируемое обучение, анализ основных компонентов (PCA), кластеризация K-средних, обнаружение аномалий , рекомендательные системы и многое другое.

Существует также много советов по использованию машинного обучения, таких как диагностика смещения по сравнению с ошибкой дисперсии, реализация наборов тестов для проверки обучения, измерение производительности модели (точность, точность, полнота и баллы F1), какие алгоритмы лучше работают с много данных против небольшого количества данных, и как настроить указанные алгоритмы в соответствии с нашими потребностями и / или ситуацией.

Плюсы

Несмотря на эти недостатки, это Машинное обучение Интернет курс Стэнфордский университет на Coursera остается наиболее эффективным способом начать изучение науки о данных и искусственного интеллекта. Преимуществ у этого курса больше, чем недостатков, и вот некоторые преимущества:

Охватывает широкий спектр методов машинного обучения.
Благодаря таланту и опыту преподавания Эндрю Нг может объяснить сложные понятия простыми словами. Эндрю Нг — отличный учитель интуиции и не боится браться за математику. Этот курс, в частности, является лучшим объяснением того, что я видел, по поводу трюка с ядром и выбора модели (предотвращение недообучения/переобучения).
Значительная часть курса посвящена основам нейронных сетей.
Подробно рассматриваются распространенные ловушки большинства инженеров машинного обучения и то, как на самом деле применять методы.
Субтитры доступны более чем на десяти языках. Это позволяет вам учиться в любое время и в любом месте, даже если ваш английский не очень хорош.
Помните, что материалы курса бесплатны, и вам нужно заплатить только за сертификат (стандартная плата Coursera составляет около 80 долларов США).
Вы можете использовать Python для выполнения заданий курса, хотя и не напрямую.

Недостатки

Теперь, хотя я настоятельно рекомендую вам пройти этот курс, у него есть некоторые недостатки. В этом разделе я собрал различные точки зрения на недостатки. Давайте рассмотрим их поближе.

1. Язык программирования и инструменты

Курс написан на языке программирования Octave, похожем на MATLAB. Эндрю Нг объясняет, что он выбрал Octave из-за его простоты, которая позволяет учащимся сосредоточиться на логике и алгоритмах, а не отвлекаться на сложную настройку среды. Тем не менее, я уверен, что на этот раз он будет использовать Python, если обновит материал (что, как я слышал, он может сделать в ближайшее время). Python стал слишком популярен в науке о данных и машинном обучении. Стало довольно популярно и просто настраивать среду и использовать NumPy для некоторых матричных вычислений.

Тем не менее, имейте в виду, что язык программирования не имеет большого значения для этого курса. Кроме того, сначала вы потратите много времени с ручкой и бумагой, выясняя размерность умножения матриц. В большинстве случаев язык программирования не имеет значения. Чтобы закончить этот курс с использованием Python, перейдите к следующему ссылке.

2. Много вспомогательного кода

Вы не начинаете писать код с нуля во многих заданиях по программированию. Обычно существует скелет кода, который вы должны заполнить недостающими блоками кода. Бывают случаи, когда заполнение пробелов слишком просто. Комментарии в коде в значительной степени говорят вам, что вам нужно написать. В таких случаях студент относительно легко сдает задание, несмотря на непонимание предмета. Однако, если вы выберете легкий путь, вам почти наверняка придется вернуться и просмотреть материал в рамках будущих заданий.

3. Нейронных сетей недостаточно

Некоторые люди жалуются, что в Интернете недостаточно информации об искусственных нейронных сетях (ИНС). Это тема, которая будет освещаться всего несколько недель. Тем не менее, я считаю, что курс охватывает наиболее важные основополагающие элементы. Имейте в виду, что нейронные сети и глубокое обучение сами по себе являются обширными предметами, поэтому я рекомендую начать специализацию по глубокому обучению сразу после окончания курса. Онлайн-курс по машинному обучению Стэнфордского университета на Coursera.

ТАКЖЕ ПРОВЕРИТЬ: Топ-20 лучших онлайн-школ K-12 Free в 2022 году

4. Слишком много/недостаточно математики

Удивительно, но некоторые студенты считают, что в курсе слишком мало математики. Другие утверждают, что некоторый контент слишком перегружен математикой, что делает его сложным и непрактичным. Я полагаю, это зависит от подготовки студентов. Однако это один из моментов, с которым я не согласен. Как я упоминал ранее, Эндрю Нг обеспечивает идеальный баланс между практикой и теорией, гарантируя, что у вас будет достаточно математической подготовки, по крайней мере, для понимания концепции на высоком уровне. В большинстве случаев вам также будут предоставлены дополнительные ссылки на внешние ресурсы, которые более подробно объясняют математическую теорию.

5. Время заканчивать

Согласно домашней странице курса, студентам потребуется около 60 часов, чтобы пройти его. Думаю, это достаточно точная оценка. Я завершил его менее чем за 3 месяца, тратя 5-7 часов в неделю, исходя из моего личного опыта.

Чему вы не научитесь из онлайн-курса по машинному обучению

Многие аспекты машинного обучения намеренно исключены из курса. Я использую слово «сознательно», потому что уверен, что Эндрю Нг и команда разработчиков курса хорошо разбираются во всех концепциях, перечисленных ниже. Это было сделано специально для того, чтобы курс был более понятным для новичков. Тем не менее, я считаю крайне важным предоставить некоторые дополнительные материалы для тех, кто хочет больше узнать о науке о данных. Вот несколько примеров, которые помогут вам лучше понять машинное обучение и Наука данных. Я не буду упоминать CNN, RNN или другие аспекты глубокого обучения, потому что они находятся на таком высоком уровне. Однако я считаю, что этот список может помочь вам лучше понять, что влечет за собой наука о данных.

1. Ансамблевое обучение

В курсе не упоминаются ансамблевые методы обучения, такие как бэггинг, случайный лес, бустинг, стекирование и т.д. Это, на мой взгляд, самое существенное упущение, потому что нейронная сеть в курсе рассматривается «в целом», а не как набор слабых классификаторов.

2. Категориальные переменные

Хотя проектирование признаков является важной частью работы по науке о данных, ничего не говорится о категориальных и других типах переменных.

3. Кластеризация

Только алгоритм кластеризации K-средних считается алгоритмом кластеризации.

4. Уменьшение размерности

PCA является единственным рассматриваемым методом уменьшения размерности. Не говоря уже о том, что существует множество подходов, у вас может сложиться впечатление, что использование PCA для визуализации данных — хорошая идея.

5. Обнаружение аномалий

Эндрю Нг говорит в курсе об обнаружении аномалий, но на самом деле он имеет в виду обнаружение новшеств, что является немного другой задачей. В курсе эта задача решается с использованием подхода оценки плотности, а другие подходы вообще не рассматриваются.

Шпаргалки

Вы также можете использовать мои статьи-шпаргалки в качестве списков концепций науки о данных, чтобы лучше понять, как решать каждую задачу:

Заключение

Надеюсь, вам понравился этот обзор на Онлайн-курс по машинному обучению Стэнфордского университета на Coursera. В целом, я считаю, что более сложные и подробные задания можно было бы дать ближе к концу курса по небольшим разделам, но помимо этого, мне очень понравился курс, и я считаю, что я получил от него большую пользу. Если вы давно хотели окунуться в мир науки о данных, но не решались, сейчас самое время записаться на курс и получить уникальный опыт.

Часто задаваемые вопросы

Является ли машинное обучение жизнеспособным вариантом карьеры?

Если вы спрашиваете, является ли карьера в области машинного обучения хорошим выбором, то очевидный ответ — да. Итак, если вас интересуют данные, автоматизация и алгоритмы, машинное обучение — отличный карьерный путь для вас. Ваш день будет заполнен анализом больших объемов данных, их внедрением и автоматизацией.

Сложен ли курс машинного обучения на Coursera?

Курс охватывает много земли, но несколько дезорганизован. Здесь много математики, так что вам может быть сложно, если вы не знакомы с линейной алгеброй.

Является ли Stanford Coursera по машинному обучению бесплатным?

Этот курс по машинному обучению на Coursera называется просто «Машинное обучение», и его можно пройти совершенно бесплатно. Вам нужно будет заплатить только в том случае, если вы хотите получить общедоступный сертификат машинного обучения Coursera, когда вы закончите (хотя это может понравиться потенциальным работодателям).

Стоит ли Стэнфордское машинное обучение Coursera вашего времени?

Нельзя отрицать, что сертификация машинного обучения Стэнфордского университета, доступная через Coursera, имела огромный успех. Это, несомненно, связано с превосходной способностью Эндрю Нг упростить некоторые из более сложных аспектов машинного обучения до интуитивно понятных и простых в освоении концепций.

АВТОРСКИЕ ПРАВА ВНИМАНИЕ! Содержание этого веб-сайта не может быть переиздано, воспроизведено, распространено полностью или частично без надлежащего разрешения или подтверждения. Все содержимое защищено DMCA.

Контент на этом сайте размещен с добрыми намерениями. Если вы являетесь владельцем этого контента и считаете, что ваши авторские права были нарушены или нарушены, обязательно свяжитесь с нами по адресу [xscholarshipc (@) gmail (dot) com], и действия будут предприняты немедленно.