Revisión del curso en línea de aprendizaje automático de la Universidad de Stanford en Coursera

Con más de 2.6 millones de inscritos (a partir de noviembre de 2019) y una calificación de usuario promedio actual de 4.9/5, este es uno de los cursos masivos abiertos en línea (MOOC) más populares para la ciencia de datos. No se puede negar que el Curso en línea de aprendizaje automático por Universidad de Stanford en Coursera ha sido un gran éxito. Sin duda, esto se debe a la excelente capacidad de Andrew Ng para simplificar algunos de los aspectos más complejos del aprendizaje automático en conceptos intuitivos y fáciles de aprender. Sin embargo, tenía dos reservas sobre este curso cuando lo comencé:

¿Todo en este curso sigue siendo relevante ahora que se creó en 2011?
¿Simplemente repetiré lo que ya sé?

En términos de esto último, tuve la suerte de obtener un patrocinio seguido de un trabajo como científico de datos que investigaba el procesamiento del lenguaje natural para la automatización en un gran contrato en el que mi empleador había estado trabajando (manualmente, con un gran equipo de personas) durante casi tres años. Fue una oportunidad fantástica, y este artículo discutirá mis pensamientos sobre la Curso en línea de aprendizaje automático de la Universidad de Stanford en Coursera. Si no está familiarizado con Andrew Ng, cofundador de Coursera y fundador de aprendizajeprofundo.ai, este es uno de los más populares Cursos en línea de aprendizaje automático.

Este curso es la mejor opción para principiantes, como explicaré más adelante, pero todo en nuestro mundo tiene inconvenientes. Intenté identificar algunos de ellos y proporcionar enlaces a las fuentes, después de lo cual debería comprender mejor el aprendizaje automático y la ciencia de datos.

Revisión del curso en línea de aprendizaje automático de la Universidad de Stanford en Coursera

Descripción general del curso en línea de aprendizaje automático

Este curso cubre los fundamentos del aprendizaje automático. Obtendrá una comprensión profunda de una amplia gama de temas, incluida la regresión logística, las máquinas de vectores de soporte, las redes neuronales y los algoritmos de agrupamiento, por nombrar algunos. También aprenderá algunas técnicas útiles para depurar sus modelos, lo que puede ser difícil en ML y con frecuencia se pasa por alto en la mayoría de los otros cursos de ML. Usted implementará muchos de los algoritmos principales. En el mundo real, podrá usar estas funciones de inmediato con su biblioteca favorita, pero pasar por el proceso de implementación manual llevará su comprensión a un nivel completamente nuevo.

Comprensión de texto (búsqueda web, antispam), visión artificial, servicios Se cubrirán la informática, el audio, la extracción de bases de datos y otros temas. Prepárese para repasar sus habilidades matemáticas, particularmente Álgebra Lineal, Cálculo, Estadística y Teoría de la Probabilidad. Aún así, no dejes que esto te desanime; las matemáticas se volverán más claras a medida que pase el tiempo. Resumiré brevemente el contenido de cada semana en esta sección. Las capturas de pantalla y las descripciones que siguen están tomadas de las conferencias.

Semana 1 - Regresión lineal

Esta semana, veremos cómo enseñar a una computadora a aprender conceptos a partir de datos sin tener que programarla explícitamente. Comenzaremos observando la regresión lineal con una sola variable. En función de un valor de entrada, la regresión lineal predice una salida de valor real. Se discuten la aplicación de la regresión lineal a la predicción del precio de la vivienda, el concepto de función de costo y el método de aprendizaje de gradiente descendente. También tendremos lecciones opcionales sobre conceptos de álgebra lineal para refrescar su memoria. Para el resto del curso, se requiere una comprensión básica de álgebra lineal, especialmente cuando comenzamos a cubrir modelos con múltiples variables.

Semana 2: regresión lineal con múltiples variables

Esta semana, veremos la regresión lineal de múltiples variables. Mostraremos cómo usar la regresión lineal para acomodar múltiples características de entrada. También repasamos las mejores prácticas para usar la regresión lineal. También repasaremos cómo trabajar con Octave. Completarás ejercicios de programación que te ayudarán a entender cómo poner en práctica los algoritmos de aprendizaje.

Semana 3 - Regresión logística

Hablaremos de regresión logística esta semana. Un método para clasificar datos en resultados discretos es la regresión logística. Podríamos usar la regresión logística para clasificar un correo electrónico como spam o no spam. El concepto de clasificación, la función de costo para logístico la regresión y la aplicación de la regresión logística a la clasificación multiclase se tratan en este módulo. También hablaremos de la regularización. Los modelos de aprendizaje automático deben poder generalizar bien a nuevos ejemplos que no se han visto antes. Se introducirá la regularización, lo que evita que los modelos sobreajusten los datos de entrenamiento.

Semana 4 – Redes Neuronales: Representación

El tema de esta semana son las redes neuronales. Las redes neuronales son un modelo que se basa en cómo funciona el cerebro. Hoy en día, las redes neuronales se utilizan ampliamente en diversas aplicaciones: cuando su teléfono interpreta y comprende sus comandos de voz, es probable que se trate de una red neuronal; cuando cobra un cheque, las máquinas que leen automáticamente los dígitos también usan redes neuronales.

Semana 5 – Redes Neuronales: Aprendizaje

Aprenderá cómo entrenar redes neuronales en la semana 5. La red neuronal es uno de los algoritmos de aprendizaje más poderosos (generalmente lo uso cuando falla un clasificador lineal), y los videos de esta semana explican cómo entrenar estos modelos usando la 'propagación hacia atrás'. algoritmo. En la tarea de programación de esta semana, podrá implementar este algoritmo y verlo en acción.

VER TAMBIÉN: Los 20 mejores cursos de recursos humanos en línea en 2021-2022

Semana 6: consejos para aplicar el aprendizaje automático

En la Semana 6, aprenderá cómo mejorar sistemáticamente su algoritmo de aprendizaje. Los videos de esta semana le enseñarán cómo reconocer cuando un algoritmo de aprendizaje está funcionando mal y describirán las "mejores prácticas" para "depurar" y mejorar el rendimiento de su algoritmo de aprendizaje. También hablaremos sobre cómo diseñar un sistema de aprendizaje automático. Para mejorar un algoritmo de aprendizaje automático, primero debe identificar las áreas en las que se pueden realizar la mayoría de las mejoras.

Repasaremos cómo comprender el rendimiento de un sistema de aprendizaje automático con múltiples partes y cómo lidiar con sesgados datos en estas lecciones. Una sólida comprensión del contenido de esta semana le ahorrará mucho tiempo al aplicar el aprendizaje automático a problemas del mundo real.

Semana 7 - Máquinas de vectores de soporte

El algoritmo de la máquina de vectores de soporte (SVM) se tratará esta semana. Los SVM son ampliamente considerados como el algoritmo de aprendizaje de "caja negra" más poderoso y uno de los algoritmos de aprendizaje más utilizados en la actualidad, gracias a un objetivo de optimización bien elegido.

Semana 8 – Aprendizaje no supervisado

Esta semana aprenderá sobre el aprendizaje no supervisado. Los algoritmos de aprendizaje no supervisado requieren solo la entrada, mientras que los algoritmos de aprendizaje supervisado requieren ejemplos etiquetados (x,y) (x). Aprenderá sobre la agrupación en clústeres, que se utiliza en una variedad de aplicaciones, como la segmentación del mercado y el resumen de texto. También repasaremos el análisis de componentes principales, que es una técnica para acelerar el aprendizaje de algoritmos y puede ser extremadamente útil para visualizar y comprender datos.

Semana 9 – Detección de anomalías

Cuando compra algo en línea, la mayoría de los sitios web le sugerirán automáticamente otros artículos que le podrían gustar. Los sistemas de recomendación analizan los patrones de actividad entre diferentes usuarios y productos para hacer estas recomendaciones. El algoritmo de filtrado colaborativo y la factorización de matriz de rango bajo son ejemplos de algoritmos de recomendación que se tratan en este módulo.

Semana 10: aprendizaje automático a gran escala

Hablaremos sobre el aprendizaje automático a gran escala esta semana. Cuando hay una gran cantidad de datos para usar en el entrenamiento, el aprendizaje automático funciona mejor. Saber cómo manejar 'big data' es una de las habilidades más buscadas en Silicon Valley, dada la cantidad de datos que recopilan muchos sitios web/empresas en la actualidad.

Semana 11 – Ejemplo de aplicación: Photo OCR

Esta semana lo guiaremos a través de una aplicación de aprendizaje automático compleja e integral que involucra Photo OCR. Reconocer e identificar objetos, palabras y dígitos en una imagen es una tarea difícil. Revisamos cómo construir una canalización para resolver este problema y analizar y mejorar el rendimiento de dicho sistema.

El instructor

Andrew Ng es el fundador de DeepLearning.AI, socio general de AI Fund, presidente y cofundador de Coursera, y profesor adjunto de la Universidad de Stanford. El trabajo del Dr. Ng en IA ha cambiado innumerables vidas como pionero tanto en el aprendizaje automático como en la educación en línea, siendo autor o coautor de más de 100 artículos de investigación en aprendizaje automático, robótica y campos relacionados. Anteriormente fue científico jefe de Baidu, cofundador de Coursera, la plataforma MOOC más grande del mundo, y líder fundador del equipo de Google Brain.

El Dr. Ng ahora dedica la mayor parte de su tiempo a sus esfuerzos empresariales, buscando las formas más efectivas de acelerar las prácticas responsables de IA en la economía global. Andrew Ng es innegablemente carismático, especialmente cuando se trata de enseñar. Es capaz de presentar el material con paciencia, claridad, consistencia y estructura.

Precios del curso en línea de aprendizaje automático

El costo está determinado por si desea o no un certificado de finalización. Para ser más específicos, el precio del curso es el siguiente:

Sin un Certificado, es gratis.
$ 79 si tiene un certificado

Hay mucho debate sobre si un certificado de plataforma de aprendizaje en línea es valioso o no. Es cierto que, al evaluar a un candidato, la mayoría de los empleadores no prestan mucha atención a dichos certificados. No obstante, porque esto Curso en línea de aprendizaje automático de la Universidad de Stanford en Coursera es tan popular que muchos técnicos lo habrían tomado. Estarán al tanto de los materiales que has leído. Por lo tanto, podría tener sentido actualizar a la versión paga. En cualquier caso, tener conocimientos es más valioso que tener un certificado.

¿Cuáles son algunos de los contras?

A pesar de su atractivo, este curso está desactualizado. Esto no es un defecto del curso, ¡pero han pasado casi 11 años! (el curso fue lanzado en 2011). Durante este tiempo, muchas cosas han cambiado. Además, sería irrelevante si el curso fuera sobre aprendizaje profundo (u otros campos en rápido desarrollo). Sin embargo, debido a que este curso trata sobre los fundamentos, casi todo lo que contiene sigue siendo relevante. Excepto quizás por las historias sobre aplicaciones de aprendizaje automático, que ahora parecen un poco divertidas.

En este momento, las herramientas disponibles para completar tareas prácticas son muy diferentes. Todo esto se debe a que los avances más significativos en computadora el procesamiento de la visión y el lenguaje natural ocurrió después de 2011 (y los principales ejemplos son los autos sin conductor y los clasificadores de correo electrónico no deseado). Esta es una situación perfectamente normal: todo está avanzado y los cursos modernos quedarán obsoletos en diez años. Este curso cubre los fundamentos que nunca cambiarán (al menos, eso es lo que pensamos), pero es importante recordar que los enfoques y las herramientas para tareas prácticas están en constante evolución.

VER TAMBIÉN: Los 10 mejores cursos gratuitos en línea de asesoramiento con certificados en 2022

Para algunos, puede ser evidente, pero para otros, puede ser desconcertante. El aspecto técnico es que la calidad del sonido puede ser inconsistente a veces. Sin embargo, si estudias con auriculares en un ambiente tranquilo, podrás escuchar todo con claridad. Los subtítulos también están disponibles.

¿Qué se cubrirá en el curso en línea de aprendizaje automático?

El curso cubre mucho y logra incluir una cantidad sorprendente de información en lo que parece ser un corto período de tiempo. No es que le falte profundidad; de hecho, creo que la profundidad del material es el punto fuerte del curso. Regresión lineal y logística, vectorización, regularización, redes neuronales, feedforward y retropropagación (excelente), funciones de costo, inicialización de red, SVM, reducción de dimensionalidad, aprendizaje supervisado/no supervisado, análisis de componentes principales (PCA), agrupamiento de K-Means, detección de anomalías , Sistemas de recomendación y mucho más, todo será cubierto.

También hay muchos consejos para usar el aprendizaje automático, como diagnosticar sesgo frente a error de varianza, implementar conjuntos de pruebas de validación de trenes, medir el rendimiento del modelo (exactitud, precisión, recuperación y puntajes F1), qué algoritmos funcionan mejor con un muchos datos vs. pocos datos, y cómo ajustar dichos algoritmos para que se adapten mejor a nuestras necesidades y/o situación.

Para Agencias y Operadores

A pesar de estos inconvenientes, este Aprendizaje automático (Machine learning & LLM) Curso por Internet por la Universidad de Stanford en Coursera sigue siendo la forma más efectiva de comenzar a aprender Data Science e IA. Los beneficios de este curso superan en número a los inconvenientes, y las siguientes son algunas ventajas:

Cubre una amplia gama de técnicas de aprendizaje automático.
Debido al talento y la experiencia docente de Andrew Ng, puede explicar conceptos complicados en términos simples. Andrew Ng es un excelente profesor de intuiciones y no tiene miedo de abordar las matemáticas. Este curso, en particular, es la mejor explicación que he visto del truco del núcleo y la selección del modelo (prevención de ajuste insuficiente/sobreajuste).
Una parte significativa del curso está dedicada a los fundamentos de las redes neuronales.
Las trampas comunes de la mayoría de los ingenieros de ML y cómo aplicar realmente los métodos se tratan en detalle.
Hay subtítulos disponibles en más de diez idiomas. Esto te permite aprender cuando y donde quieras, incluso si tu inglés no es muy bueno.
Recuerda que los materiales del curso son gratuitos y solo tienes que pagar el certificado (la tarifa estándar de Coursera es de alrededor de $ 80 USD).
Puede usar Python para completar las tareas del curso, aunque no directamente.

Los inconvenientes

Ahora bien, aunque le recomiendo encarecidamente que tome el curso, tiene algunas desventajas. En esta sección, he reunido una variedad de puntos de vista sobre las desventajas. Echemos un vistazo más de cerca a ellos.

1. El lenguaje de programación y las herramientas

El curso está escrito en Octave, un lenguaje de programación de computación científica similar a MATLAB. Andrew Ng explica que eligió Octave por su simplicidad, que permite a los estudiantes concentrarse en la lógica y los algoritmos en lugar de distraerse con una configuración de entorno complicada. Aún así, estoy seguro de que usará Python esta vez si actualiza el material (lo que escuché que podría hacer pronto). Python se ha vuelto demasiado popular en la ciencia de datos y el aprendizaje automático. Se ha vuelto bastante popular y simple configurar el entorno y usar NumPy para algunos cálculos de matriz.

Aún así, tenga en cuenta que el lenguaje de programación no importa demasiado para este curso. Además, al principio pasarás mucho tiempo con lápiz y papel, averiguando las dimensiones de las multiplicaciones de matrices. En la mayoría de los casos, el lenguaje de programación será irrelevante. Para terminar este curso usando Python, vaya a la siguiente liga.

2. Hay mucho código auxiliar

No comienzas a escribir código desde cero en muchas de las asignaciones de programación. Por lo general, hay un esqueleto de código que debe completar con los bloques de código que faltan. Hay algunos casos en los que llenar los espacios en blanco es demasiado simple. Los comentarios en el código prácticamente te dicen lo que necesitas escribir. En tales casos, es relativamente fácil para el estudiante aprobar la tarea a pesar de la falta de comprensión del tema. Sin embargo, si elige el camino fácil, es casi seguro que tendrá que regresar y revisar el material como parte de tareas futuras.

3. No hay suficiente en las redes neuronales

Algunas personas se quejan de que no hay suficiente información sobre las redes neuronales artificiales en Internet (ANN). Este es un tema que se tratará solo por unas pocas semanas. No obstante, creo que el curso cubre los elementos fundamentales más importantes. Tenga en cuenta que las redes neuronales y el aprendizaje profundo son temas amplios en sí mismos, por lo que recomiendo comenzar la especialización en aprendizaje profundo inmediatamente después de terminar la Curso en línea de aprendizaje automático de la Universidad de Stanford en Coursera.

VER TAMBIÉN: Las 20 mejores escuelas en línea K-12 gratis en 2022

4. Demasiadas/No Suficientes Matemáticas

Sorprendentemente, algunos estudiantes creen que el curso cubre muy pocas matemáticas. Otros argumentan que parte del contenido es demasiado matemático, lo que lo hace difícil y poco práctico. Supongo que depende de los antecedentes de los estudiantes. Este, sin embargo, es uno de los puntos en los que no estoy de acuerdo. Como mencioné anteriormente, Andrew Ng logra el equilibrio perfecto entre la práctica y la teoría, asegurándose de que tenga suficiente experiencia en matemáticas, al menos para una comprensión de alto nivel de un concepto. En la mayoría de los casos, también se le proporcionarán enlaces adicionales a recursos externos que explican la teoría matemática con más detalle.

5. Hora de terminar

Según la página de inicio del curso, los estudiantes necesitarán alrededor de 60 horas para completarlo. Eso, creo, es una estimación bastante precisa. Lo completé en menos de 3 meses, dedicando de 5 a 7 horas por semana, según mi experiencia personal.

Lo que no aprenderá del curso en línea de aprendizaje automático

Muchos aspectos del aprendizaje automático se dejan fuera del curso a propósito. Utilizo la palabra “conscientemente” porque confío en que Andrew Ng y el equipo de diseño del curso conocen bien todos los conceptos que se enumeran a continuación. Esto se hizo específicamente para que el curso fuera más fácil de entender para los principiantes. No obstante, creo que es fundamental proporcionar algunos materiales adicionales para aquellos interesados en aprender más sobre Data Science. Estos son algunos ejemplos para ayudarlo a comprender mejor el aprendizaje automático y Data science. No voy a mencionar CNN, RNN u otros aspectos del aprendizaje profundo porque se encuentra en un nivel muy alto. Sin embargo, creo que esta lista puede ayudarlo a comprender mejor lo que implica la ciencia de datos.

1. Aprendizaje en conjunto

El curso no menciona métodos de aprendizaje en conjunto como bagging, random forest, boosting, stacking, etc. Esta, en mi opinión, es la omisión más importante porque la red neuronal en el curso se ve "como un todo" y no como un conjunto. colección de clasificadores débiles.

2. Variables Categóricas

Aunque la ingeniería de características es una parte importante del trabajo de ciencia de datos, no se dice nada sobre las variables categóricas y de otro tipo.

3. Agrupación

Solo el algoritmo de agrupamiento K-Means se considera un algoritmo de agrupamiento.

4. Reducción de dimensionalidad

PCA es la única técnica de reducción de dimensionalidad que se considera. Sin mencionar el hecho de que existen numerosos enfoques, es posible que termine el curso con la impresión de que usar PCA para la visualización de datos es una buena idea.

5. Detección de anomalías

Andrew Ng habla sobre la detección de anomalías en el curso, pero en realidad se refiere a la detección de novedades, que es una tarea ligeramente diferente. En el curso, este problema se resuelve utilizando un enfoque de estimación de densidad y no se consideran otros enfoques en absoluto.

Hojas de trucos

También puede usar los artículos de mi hoja de trucos como listas de conceptos de ciencia de datos para comprender mejor cómo resolver cada tarea:

Conclusión

Espero que hayas disfrutado de esta revisión en el Curso en línea de aprendizaje automático de la Universidad de Stanford en Coursera. En general, creo que se podrían haber dado tareas más desafiantes y profundas hacia el final del curso en las secciones más pequeñas, pero aparte de eso, disfruté mucho el curso y creo que obtuve mucho valor de él. Si hace tiempo que quieres sumergirte en el mundo de la ciencia de datos pero no te has atrevido, ahora es el mejor momento para inscribirte en el curso y vivir una experiencia única.

Preguntas frecuentes

¿Es el aprendizaje automático una opción profesional viable?

Si se pregunta si una carrera en aprendizaje automático es una buena opción, entonces la respuesta obvia es sí. Por lo tanto, si le interesan los datos, la automatización y los algoritmos, el aprendizaje automático es una excelente carrera profesional para usted. Su día estará ocupado analizando grandes cantidades de datos e implementándolos y automatizándolos.

¿Es difícil el curso de Machine Learning en Coursera?

El curso cubre mucho terreno pero está algo desorganizado. Aquí hay muchas matemáticas, por lo que es posible que tenga dificultades si no está familiarizado con el álgebra lineal.

¿Es gratuito el Stanford Coursera sobre aprendizaje automático?

Este curso de aprendizaje automático en Coursera se titula simplemente "Aprendizaje automático" y es completamente gratuito. Solo tendrá que pagar si desea una certificación de aprendizaje automático compartible de Coursera cuando haya terminado (aunque esto puede ser atractivo para posibles empleadores).

¿Vale la pena el aprendizaje automático Coursera de Stanford?

No se puede negar que la certificación de aprendizaje automático de la Universidad de Stanford, disponible a través de Coursera, ha sido un gran éxito. Sin duda, esto se debe a la excelente capacidad de Andrew Ng para simplificar algunos de los aspectos más complejos del aprendizaje automático en conceptos intuitivos y fáciles de aprender.

LEA TAMBIÉN: Diploma de escuela secundaria acreditada gratis en línea para adultos

ADVERTENCIA DE DERECHOS DE AUTOR! El contenido de este sitio web no puede ser republicado, reproducido, redistribuido total o parcialmente sin el debido permiso o reconocimiento. Todos los contenidos están protegidos por DMCA.

El contenido de este sitio se publica con buenas intenciones. Si posee este contenido y cree que se violaron o infringieron sus derechos de autor, asegúrese de comunicarse con nosotros en [xscholarshipc (@) gmail (dot) com] y se tomarán medidas de inmediato.