Examen du cours en ligne d'apprentissage automatique par l'Université de Stanford sur Coursera

Avec plus de 2.6 millions d'inscrits (en novembre 2019) et une note moyenne actuelle des utilisateurs de 4.9/5, il s'agit de l'un des cours en ligne ouverts et massifs (MOOC) les plus populaires pour la science des données. Il est indéniable que le Cours en ligne sur l'apprentissage automatique par L'Université de Stanford sur Coursera a été un immense succès. Cela est sans aucun doute dû à l'excellente capacité d'Andrew Ng à simplifier certains des aspects les plus complexes de l'apprentissage automatique en concepts intuitifs et faciles à apprendre. Cependant, j'avais deux réserves à propos de ce cours lorsque je l'ai commencé:

Est-ce que tout dans ce cours est toujours d'actualité maintenant qu'il a été créé en 2011 ?
Vais-je simplement répéter ce que je sais déjà ?

En ce qui concerne ce dernier, j'ai eu la chance de décrocher un parrainage suivi d'un emploi en tant que Data Scientist recherchant le traitement du langage naturel pour l'automatisation sur un gros contrat sur lequel mon employeur travaillait (manuellement, avec une grande équipe de personnes) depuis presque trois ans. C'était une opportunité fantastique, et cet article discutera de mes réflexions sur le Cours en ligne d'apprentissage automatique par l'Université de Stanford sur Coursera. Si vous ne connaissez pas Andrew Ng, co-fondateur de Coursera et fondateur de deeplearning.ai, c'est l'un des plus populaires Cours en ligne sur l'apprentissage automatique.

Ce cours est le meilleur choix pour les débutants, comme je l'expliquerai plus tard, mais tout dans notre monde a des inconvénients. J'ai tenté d'en identifier quelques-uns et de fournir des liens vers des sources, après quoi vous devriez avoir une meilleure compréhension de l'apprentissage automatique et de la science des données.

Examen du cours en ligne sur l'apprentissage automatique par l'Université de Stanford sur Coursera

Présentation du cours en ligne sur l'apprentissage automatique

Ce cours couvre les bases de l'apprentissage automatique. Vous acquerrez une compréhension approfondie d'un large éventail de sujets, y compris la régression logistique, les machines à vecteurs de support, les réseaux de neurones et les algorithmes de clustering, pour n'en nommer que quelques-uns. Vous apprendrez également quelques techniques utiles pour déboguer vos modèles, ce qui peut être difficile en ML et est souvent négligé dans la plupart des autres cours de ML. De nombreux algorithmes de base seront implémentés par vous. Dans le monde réel, vous pourrez utiliser ces fonctionnalités dès la sortie de la boîte avec votre bibliothèque préférée, mais passer par le processus de mise en œuvre manuelle amènera votre compréhension à un tout autre niveau.

Compréhension de texte (recherche web, anti-spam), vision par ordinateur, médical l'informatique, l'audio, l'exploration de bases de données et d'autres sujets seront abordés. Préparez-vous à parfaire vos compétences en mathématiques, en particulier l'algèbre linéaire, le calcul, les statistiques et la théorie des probabilités. Pourtant, ne laissez pas cela vous décourager; le calcul deviendra plus clair au fil du temps. Je résumerai brièvement le contenu de chaque semaine dans cette section. Les captures d'écran et les descriptions qui suivent sont toutes tirées des conférences.

Semaine 1 – Régression linéaire

Cette semaine, nous verrons comment apprendre à un ordinateur à apprendre des concepts à partir de données sans avoir à le programmer explicitement. Nous allons commencer par examiner la régression linéaire avec une seule variable. Sur la base d'une valeur d'entrée, la régression linéaire prédit une sortie à valeur réelle. L'application de la régression linéaire à la prévision des prix du logement, le concept de fonction de coût et la méthode d'apprentissage par descente de gradient sont discutés. Nous aurons également des cours optionnels sur les concepts d'algèbre linéaire pour vous rafraîchir la mémoire. Pour le reste du cours, une compréhension de base de l'algèbre linéaire est requise, d'autant plus que nous commençons à couvrir les modèles à variables multiples.

Semaine 2 - Régression linéaire avec plusieurs variables

Cette semaine, nous examinerons la régression linéaire à plusieurs variables. Nous montrerons comment utiliser la régression linéaire pour prendre en charge plusieurs entités en entrée. Nous passons également en revue les meilleures pratiques pour utiliser la régression linéaire. Nous verrons également comment travailler avec Octave. Vous effectuerez des exercices de programmation pour vous aider à comprendre comment mettre en pratique les algorithmes d'apprentissage.

Semaine 3 – Régression logistique

On parlera de régression logistique cette semaine. Une méthode de classification des données en résultats discrets est la régression logistique. Nous pouvons utiliser la régression logistique pour classer un e-mail comme spam ou non spam. Le concept de classification, la fonction de coût pour logistique la régression et l'application de la régression logistique à la classification multi-classes sont toutes couvertes dans ce module. On parlera aussi de régularisation. Les modèles d'apprentissage automatique doivent pouvoir bien se généraliser à de nouveaux exemples qui n'ont jamais été vus auparavant. Une régularisation sera introduite, ce qui empêchera les modèles de sur-ajuster les données d'apprentissage.

Semaine 4 – Réseaux de neurones : représentation

Le sujet de cette semaine est les réseaux de neurones. Les réseaux de neurones sont un modèle basé sur le fonctionnement du cerveau. Aujourd'hui, les réseaux de neurones sont largement utilisés dans diverses applications : lorsque votre téléphone interprète et comprend vos commandes vocales, un réseau de neurones est probablement impliqué ; lorsque vous encaissez un chèque, les machines qui lisent automatiquement les chiffres utilisent également des réseaux de neurones.

Semaine 5 – Réseaux de neurones : Apprentissage

Vous apprendrez à former des réseaux de neurones au cours de la semaine 5. Le réseau de neurones est l'un des algorithmes d'apprentissage les plus puissants (je l'utilise généralement lorsqu'un classificateur linéaire échoue), et les vidéos de cette semaine expliquent comment former ces modèles à l'aide de la "rétropropagation". ' algorithme. Dans le devoir de programmation de cette semaine, vous pourrez implémenter cet algorithme et le voir en action.

VÉRIFIEZ ÉGALEMENT: Dix cours en ligne gratuits sur les opérations minières et pétrolières et gazières avec certificats en 2022

Semaine 6 - Conseils pour appliquer l'apprentissage automatique

Au cours de la semaine 6, vous apprendrez à améliorer systématiquement votre algorithme d'apprentissage. Les vidéos de cette semaine vous apprendront à reconnaître quand un algorithme d'apprentissage fonctionne mal et décriront les "meilleures pratiques" pour le "débogage" et l'amélioration des performances de votre algorithme d'apprentissage. Nous parlerons également de la conception d'un système d'apprentissage automatique. Pour améliorer un algorithme d'apprentissage automatique, vous devez d'abord identifier les domaines où le plus d'améliorations peuvent être apportées.

Nous verrons comment comprendre les performances d'un système d'apprentissage automatique composé de plusieurs parties et comment gérer les données dans ces leçons. Une solide compréhension du contenu de cette semaine vous fera facilement gagner beaucoup de temps lors de l'application de l'apprentissage automatique à des problèmes du monde réel.

Semaine 7 – Machines vectorielles de support

L'algorithme de la machine à vecteurs de support (SVM) sera couvert cette semaine. Les SVM sont largement considérés comme l'algorithme d'apprentissage «boîte noire» le plus puissant et l'un des algorithmes d'apprentissage les plus largement utilisés aujourd'hui, grâce à un objectif d'optimisation bien choisi.

Semaine 8 – Apprentissage non supervisé

Vous découvrirez l'apprentissage non supervisé cette semaine. Les algorithmes d'apprentissage non supervisé ne nécessitent que l'entrée, tandis que les algorithmes d'apprentissage supervisé nécessitent des exemples étiquetés (x, y) (x). Vous découvrirez le clustering, qui est utilisé dans diverses applications telles que la segmentation du marché et la synthèse de texte. Nous passerons également en revue l'analyse en composantes principales, qui est une technique pour accélérer l'apprentissage des algorithmes et peut être extrêmement utile pour visualiser et comprendre les données.

Semaine 9 – Détection d'anomalies

Lorsque vous achetez quelque chose en ligne, la plupart des sites Web vous proposent automatiquement d'autres articles susceptibles de vous plaire. Les systèmes de recommandation examinent les modèles d'activité entre différents utilisateurs et produits pour faire ces recommandations. L'algorithme de filtrage collaboratif et la factorisation matricielle de rang inférieur sont des exemples d'algorithmes de recommandation abordés dans ce module.

Semaine 10 - Apprentissage automatique à grande échelle

Nous parlerons d'apprentissage automatique à grande échelle cette semaine. Lorsqu'il y a beaucoup de données à utiliser pour la formation, l'apprentissage automatique fonctionne mieux. Savoir gérer le « big data » est l'une des compétences les plus recherchées dans la Silicon Valley, compte tenu de la quantité de données que de nombreux sites Web/entreprises collectent aujourd'hui.

Semaine 11 – Exemple d'application : Photo OCR

Nous vous présenterons cette semaine une application d'apprentissage automatique complexe et de bout en bout impliquant Photo OCR. Reconnaître et identifier des objets, des mots et des chiffres dans une image est une tâche difficile. Nous allons voir comment construire un pipeline pour résoudre ce problème et analyser et améliorer les performances d'un tel système.

L'instructeur

Andrew Ng est le fondateur de DeepLearning.AI, associé général d'AI Fund, président et cofondateur de Coursera, et professeur adjoint à l'Université de Stanford. Les travaux du Dr Ng dans le domaine de l'IA ont changé d'innombrables vies en tant que pionnier de l'apprentissage automatique et de l'éducation en ligne, auteur ou co-auteur de plus de 100 articles de recherche sur l'apprentissage automatique, la robotique et les domaines connexes. Il était auparavant le scientifique en chef de Baidu, le co-fondateur de Coursera, la plus grande plate-forme MOOC au monde, et le responsable fondateur de l'équipe Google Brain.

Le Dr Ng consacre désormais la majeure partie de son temps à ses efforts entrepreneuriaux, à la recherche des moyens les plus efficaces d'accélérer les pratiques d'IA responsables dans l'économie mondiale. Andrew Ng est indéniablement charismatique, surtout en matière d'enseignement. Il est capable de présenter le matériel avec patience, clarté, cohérence et structure.

Tarification des cours en ligne d'apprentissage automatique

Le coût est déterminé selon que vous souhaitez ou non un certificat d'achèvement. Pour être plus précis, le prix du cours est le suivant :

Sans certificat, c'est gratuit.
79 $ si vous avez un certificat

Il y a beaucoup de débats sur la valeur ou non d'un certificat de plateforme d'apprentissage en ligne. Il est vrai que, lors de la présélection d'un candidat, la plupart des employeurs ne prêtent pas beaucoup d'attention à ces certificats. Néanmoins, parce que cela Cours en ligne d'apprentissage automatique par l'Université de Stanford sur Coursera est si populaire que beaucoup de techniciens l'auraient pris. Ils seront au courant des documents que vous avez lus. Il peut donc être judicieux de passer à la version payante. Dans tous les cas, avoir des connaissances est plus précieux qu'avoir un certificat.

Quels sont certains des inconvénients ?

Malgré son attrait, ce parcours est dépassé. Ce n'est pas un défaut de parcours, mais cela fait presque 11 ans ! (le cours est sorti en 2011). Pendant ce temps, beaucoup de choses ont changé. De plus, il ne serait pas pertinent que le cours porte sur l'apprentissage en profondeur (ou d'autres domaines en développement rapide). Cependant, comme ce cours porte sur les fondamentaux, presque tout ce qu'il contient est toujours pertinent. À l'exception peut-être des histoires sur les applications d'apprentissage automatique, qui semblent maintenant un peu amusantes.

À l'heure actuelle, les outils disponibles pour effectuer des tâches pratiques sont très différents. Tout cela parce que les progrès les plus significatifs dans ordinateur la vision et le traitement du langage naturel ont eu lieu après 2011. (et les principaux exemples de cours sont les voitures autonomes et les classificateurs de spam par e-mail). C'est une situation tout à fait normale, tout est avancé et les cours modernes seront obsolètes dans dix ans. Ce cours couvre les fondamentaux qui ne changeront jamais (du moins, c'est ce que nous pensons), mais il est important de se rappeler que les approches et les outils pour les tâches pratiques évoluent constamment.

VÉRIFIEZ ÉGALEMENT: Top 10 des cours en ligne gratuits en santé complémentaire avec certificats | 2022

Pour certains, cela peut être évident, mais pour d'autres, cela peut être déroutant. L'aspect technique est que la qualité sonore peut parfois être incohérente. Cependant, si vous étudiez avec des écouteurs dans un environnement calme, vous pourrez tout entendre clairement. Des sous-titres sont également disponibles.

Qu'est-ce qui sera couvert dans le cours en ligne sur l'apprentissage automatique ?

Le cours couvre beaucoup de choses et parvient à entasser une quantité surprenante d'informations dans ce qui semble être un court laps de temps. Non pas qu'il manque de profondeur; en fait, je crois que la profondeur de la matière est le point fort du cours. Régression linéaire et logistique, vectorisation, régularisation, réseaux de neurones, feedforward et rétro-propagation (excellent), fonctions de coût, initialisation du réseau, SVM, réduction de la dimensionnalité, apprentissage supervisé/non supervisé, analyse en composantes principales (ACP), clustering K-Means, détection d'anomalies , les systèmes de recommandation et bien plus encore seront couverts.

Il existe également de nombreux conseils pour utiliser l'apprentissage automatique, tels que le diagnostic du biais par rapport à l'erreur de variance, la mise en œuvre d'ensembles de tests de validation de train, la mesure des performances du modèle (exactitude, précision, rappel et scores F1), quels algorithmes fonctionnent mieux avec un beaucoup de données contre peu de données, et comment ajuster lesdits algorithmes pour mieux répondre à nos besoins et/ou à notre situation.

Avantages

Malgré ces inconvénients, ce Machine Learning Cours en ligne par l'Université de Stanford sur Coursera reste le moyen le plus efficace pour commencer à apprendre la science des données et l'IA. Les avantages de ce cours sont plus nombreux que les inconvénients, et voici quelques avantages :

Couvre un large éventail de techniques d'apprentissage automatique.
Grâce au talent et à l'expérience d'enseignement d'Andrew Ng, il peut expliquer des concepts complexes en termes simples. Andrew Ng est un excellent professeur d'intuitions et n'a pas peur d'aborder les mathématiques. Ce cours, en particulier, est la meilleure explication que j'ai vue de l'astuce du noyau et de la sélection du modèle (prévention du sous-ajustement / du surajustement).
Une partie importante du cours est consacrée aux fondamentaux des réseaux de neurones.
Les pièges courants de la plupart des ingénieurs ML et la manière d'appliquer réellement les méthodes sont traités en détail.
Des sous-titres sont disponibles dans plus de dix langues. Cela vous permet d'apprendre quand et où vous voulez, même si votre anglais n'est pas très bon.
N'oubliez pas que le matériel de cours est gratuit et que vous n'avez qu'à payer pour le certificat (les frais standard de Coursera sont d'environ 80 USD).
Vous pouvez utiliser Python pour effectuer les devoirs du cours, mais pas directement.

Les inconvénients

Bien que je vous encourage fortement à suivre le cours, il présente certains inconvénients. Dans cette section, j'ai rassemblé une variété de points de vue sur les inconvénients. Regardons-les de plus près.

1. Le langage de programmation et les outils

Le cours est écrit en Octave, un langage de programmation informatique scientifique similaire à MATLAB. Andrew Ng explique qu'il a choisi Octave en raison de sa simplicité, qui permet aux étudiants de se concentrer sur la logique et les algorithmes plutôt que d'être distraits par une configuration d'environnement compliquée. Pourtant, je suis convaincu qu'il utilisera Python cette fois s'il met à jour le matériel (ce que j'entends qu'il pourrait faire bientôt). Python est devenu beaucoup trop populaire dans la science des données et l'apprentissage automatique. Il est devenu assez populaire et simple de configurer l'environnement et d'utiliser NumPy pour certains calculs matriciels.

Cependant, gardez à l'esprit que le langage de programmation n'a pas beaucoup d'importance pour ce cours. De plus, vous passerez d'abord beaucoup de temps avec un stylo et du papier à déterminer les dimensions des multiplications matricielles. Dans la plupart des cas, le langage de programmation n'aura aucune importance. Pour terminer ce cours en utilisant Python, passez à ce qui suit lien.

2. Il y a beaucoup de code d'assistance

Vous ne commencez pas à écrire du code à partir de zéro dans de nombreuses tâches de programmation. Habituellement, il y a un squelette de code que vous devez remplir avec des blocs de code manquants. Il y a des cas où remplir les blancs est beaucoup trop simple. Les commentaires dans le code vous disent à peu près ce que vous devez écrire. Dans de tels cas, il est relativement facile pour l'étudiant de réussir le devoir malgré un manque de compréhension de la matière. Cependant, si vous optez pour la facilité, vous devrez presque certainement revenir en arrière et revoir le matériel dans le cadre de futures missions.

3. Il n'y a pas assez de réseaux de neurones

Certaines personnes se plaignent du manque d'informations sur les réseaux de neurones artificiels sur Internet (ANN). C'est un sujet qui ne sera traité que pendant quelques semaines. Néanmoins, je crois que le cours couvre les éléments fondamentaux les plus importants. Gardez à l'esprit que les réseaux de neurones et l'apprentissage en profondeur sont de vastes sujets en eux-mêmes, c'est pourquoi je recommande de commencer la spécialisation en apprentissage en profondeur immédiatement après avoir terminé le Cours en ligne d'apprentissage automatique par l'Université de Stanford sur Coursera.

VÉRIFIEZ ÉGALEMENT: 15 cours en ligne gratuits sur la logistique et la gestion de la chaîne d'approvisionnement

4. Trop/pas assez de maths

Étonnamment, certains étudiants pensent que le cours couvre trop peu de mathématiques. D'autres soutiennent qu'une partie du contenu est beaucoup trop mathématique, ce qui le rend difficile et peu pratique. Je suppose que cela dépend du parcours des élèves. C'est pourtant un des points sur lesquels je ne suis pas d'accord. Comme je l'ai mentionné plus tôt, Andrew Ng trouve l'équilibre parfait entre la pratique et la théorie, s'assurant que vous avez suffisamment de connaissances en mathématiques, au moins pour une compréhension de haut niveau d'un concept. Dans la plupart des cas, vous recevrez également des liens supplémentaires vers des ressources externes qui expliquent la théorie mathématique plus en détail.

5. Il est temps de finir

Selon la page d'accueil du cours, les étudiants auront besoin d'environ 60 heures pour le terminer. C'est, je crois, une estimation assez précise. Je l'ai terminé en moins de 3 mois, en y consacrant 5 à 7 heures par semaine, selon mon expérience personnelle.

Ce que vous n'apprendrez pas du cours en ligne sur l'apprentissage automatique

De nombreux aspects de l'apprentissage automatique sont délibérément laissés de côté dans le cours. J'utilise le mot "consciemment" parce que je suis convaincu qu'Andrew Ng et l'équipe de conception du cours connaissent bien tous les concepts énumérés ci-dessous. Cela a été fait spécifiquement pour rendre le cours plus facile à comprendre pour les débutants. Néanmoins, je pense qu'il est essentiel de fournir du matériel supplémentaire à ceux qui souhaitent en savoir plus sur la science des données. Voici quelques exemples pour vous aider à mieux comprendre le Machine Learning et Sciences des données. Je ne vais pas mentionner les CNN, les RNN ou d'autres aspects de l'apprentissage en profondeur, car c'est à un niveau si élevé. Cependant, je pense que cette liste peut vous aider à mieux comprendre ce qu'implique la science des données.

1. Apprentissage d'ensemble

Le cours ne mentionne pas les méthodes d'apprentissage d'ensemble telles que le bagging, la forêt aléatoire, le boosting, l'empilement, etc. C'est, à mon avis, l'omission la plus importante car le réseau de neurones dans le cours est considéré « dans son ensemble » plutôt que comme un ensemble. collection de classificateurs faibles.

2. Variables catégorielles

Bien que l'ingénierie des fonctionnalités soit une partie importante du travail de science des données, rien n'est dit sur les variables catégorielles et autres types de variables.

3. Regroupement

Seul l'algorithme de clustering K-Means est considéré comme un algorithme de clustering.

4. Réduction de la dimensionnalité

L'ACP est la seule technique de réduction de dimensionnalité considérée. Sans parler du fait qu'il existe de nombreuses approches, vous pouvez sortir du cours avec l'impression que l'utilisation de l'ACP pour la visualisation des données est une bonne idée.

5. Détection d'anomalies

Andrew Ng parle de détection d'anomalies dans le cours, mais il parle en fait de détection de nouveauté, qui est une tâche légèrement différente. Dans le cours, ce problème est résolu en utilisant une approche d'estimation de la densité, et les autres approches ne sont pas du tout considérées.

Cheatsheets

Vous pouvez également utiliser mes articles de feuille de triche comme listes de concepts de science des données pour mieux comprendre comment résoudre chaque tâche :

Conclusion

J'espère que vous avez apprécié cette revue sur le Cours en ligne d'apprentissage automatique par l'Université de Stanford sur Coursera. Dans l'ensemble, je pense que des devoirs plus stimulants et approfondis auraient pu être donnés vers la fin du cours sur les sections plus petites, mais à part cela, j'ai vraiment apprécié le cours et je pense que j'en ai tiré beaucoup de valeur. Si vous souhaitez plonger dans le monde de la science des données depuis longtemps mais que vous n'avez pas osé, c'est le meilleur moment pour vous inscrire au cours et vivre une expérience unique.

Foire aux Questions

L'apprentissage automatique est-il une option de carrière viable ?

Si vous vous demandez si une carrière dans l'apprentissage automatique est un bon choix, la réponse évidente est oui. Donc, si vous êtes intéressé par les données, l'automatisation et les algorithmes, l'apprentissage automatique est un excellent cheminement de carrière pour vous. Votre journée sera consacrée à l'analyse de grandes quantités de données, à leur mise en œuvre et à leur automatisation.

Le cours Machine Learning sur Coursera est-il difficile ?

Le parcours couvre beaucoup de terrain mais est quelque peu désorganisé. Il y a beaucoup de mathématiques ici, donc vous pourriez avoir du mal si vous n'êtes pas familier avec l'algèbre linéaire.

Le Stanford Coursera sur l'apprentissage automatique est-il gratuit ?

Ce cours d'apprentissage automatique sur Coursera s'intitule simplement "Apprentissage automatique" et est entièrement gratuit. Vous n'aurez à payer que si vous souhaitez une certification d'apprentissage automatique partageable Coursera lorsque vous avez terminé (bien que cela puisse être attrayant pour les employeurs potentiels).

L'apprentissage automatique Coursera de Stanford vaut-il votre temps ?

Il est indéniable que la certification Machine Learning de l'Université de Stanford, disponible via Coursera, a été un énorme succès. Cela est sans aucun doute dû à l'excellente capacité d'Andrew Ng à simplifier certains des aspects les plus complexes de l'apprentissage automatique en concepts intuitifs et faciles à apprendre.

AVERTISSEMENT DE COPYRIGHT! Le contenu de ce site Web ne peut être republié, reproduit, redistribué en tout ou en partie sans l'autorisation ou la reconnaissance requise. Tous les contenus sont protégés par DMCA.

Le contenu de ce site est posté avec de bonnes intentions. Si vous possédez ce contenu et pensez que vos droits d'auteur ont été violés ou enfreints, assurez-vous de nous contacter à l'adresse [xscholarshipc(@)gmail(dot)com] et des mesures seront prises immédiatement.