Revisão do Curso Online de Aprendizado de Máquina da Universidade de Stanford no Coursera

Com mais de 2.6 milhões de inscritos (em novembro de 2019) e uma classificação média atual de usuários de 4.9/5, este é um dos cursos online abertos massivos (MOOC) mais populares para ciência de dados. Não há como negar que o Curso Online de Aprendizado de Máquina por Universidade de Stanford no Coursera tem sido um grande sucesso. Isso se deve, sem dúvida, à excelente capacidade de Andrew Ng de simplificar alguns dos aspectos mais complexos do aprendizado de máquina em conceitos intuitivos e fáceis de aprender. No entanto, eu tinha duas reservas sobre este curso quando comecei:

Tudo neste curso ainda é relevante agora que foi criado em 2011?
Vou simplesmente repetir o que já sei?

Em termos deste último, tive a sorte de conseguir um patrocínio seguido de um emprego como Cientista de Dados pesquisando processamento de linguagem natural para automação em um grande contrato no qual meu empregador estava trabalhando (manualmente, com uma grande equipe de pessoas) por quase três anos. Foi uma oportunidade fantástica, e este artigo irá discutir meus pensamentos sobre o Curso Online de Aprendizado de Máquina pela Universidade de Stanford no Coursera. Se você não conhece Andrew Ng, cofundador do Coursera e fundador da aprendizagem profunda.ai, este é um dos mais populares Cursos on-line de aprendizado de máquina.

Este curso é a melhor escolha para iniciantes, como explicarei mais adiante, mas tudo em nosso mundo tem desvantagens. Tentei identificar alguns deles e fornecer links para fontes, após o qual você deve ter uma melhor compreensão de Machine Learning e Data Science.

Revisão do curso on-line de aprendizado de máquina da Universidade de Stanford no Coursera

Visão geral do curso online de aprendizado de máquina

Este curso aborda os fundamentos do aprendizado de máquina. Você obterá uma compreensão completa de uma ampla variedade de tópicos, incluindo regressão logística, máquinas de vetor de suporte, redes neurais e algoritmos de cluster, para citar alguns. Você também aprenderá algumas técnicas úteis para depurar seus modelos, o que pode ser difícil no ML e é frequentemente negligenciado na maioria dos outros cursos de ML. Muitos dos algoritmos principais serão implementados por você. No mundo real, você poderá usar esses recursos imediatamente com sua biblioteca favorita, mas passar pelo processo de implementação manual levará sua compreensão a um nível totalmente novo.

Compreensão de texto (pesquisa na web, anti-spam), visão computacional, médico informática, áudio, mineração de banco de dados e outros tópicos serão abordados. Prepare-se para aprimorar suas habilidades matemáticas, particularmente Álgebra Linear, Cálculo, Estatística e Teoria das Probabilidades. Ainda assim, não deixe que isso o detenha; a matemática ficará mais clara com o passar do tempo. Vou resumir brevemente o conteúdo de cada semana nesta seção. As capturas de tela e descrições a seguir são todas tiradas das palestras.

Semana 1 - Regressão Linear

Nesta semana, veremos como ensinar um computador a aprender conceitos de dados sem ter que programá-lo explicitamente. Começaremos analisando a regressão linear com uma única variável. Com base em um valor de entrada, a regressão linear prevê uma saída de valor real. A aplicação da regressão linear para a previsão de preços de habitação, o conceito de função de custo e o método de aprendizagem de gradiente descendente são discutidos. Também teremos aulas opcionais sobre conceitos de álgebra linear para refrescar sua memória. Para o resto do curso, é necessária uma compreensão básica de álgebra linear, especialmente quando começamos a cobrir modelos com múltiplas variáveis.

Semana 2 - Regressão Linear com Múltiplas Variáveis

Esta semana, veremos a regressão linear de múltiplas variáveis. Mostraremos como usar a regressão linear para acomodar vários recursos de entrada. Também analisamos as melhores práticas para usar a regressão linear. Também veremos como trabalhar com o Octave. Você concluirá exercícios de programação para ajudá-lo a entender como colocar os algoritmos de aprendizado em prática.

Semana 3 - Regressão Logística

Falaremos sobre regressão logística esta semana. Um método para classificar dados em resultados discretos é a regressão logística. Podemos usar a regressão logística para classificar um e-mail como spam ou não spam. O conceito de classificação, a função de custo para logística regressão e a aplicação da regressão logística à classificação multiclasse são todos abordados neste módulo. Também falaremos sobre regularização. Os modelos de aprendizado de máquina devem ser capazes de generalizar bem para novos exemplos que não foram vistos antes. A regularização será introduzida, o que evita que os modelos sobreajustem os dados de treinamento.

Semana 4 – Redes Neurais: Representação

O tema desta semana são as redes neurais. As redes neurais são um modelo baseado em como o cérebro funciona. Hoje, as redes neurais são amplamente utilizadas em várias aplicações: quando seu telefone interpreta e entende seus comandos de voz, uma rede neural provavelmente está envolvida; quando você desconta um cheque, as máquinas que lêem automaticamente os dígitos também usam redes neurais.

Semana 5 – Redes Neurais: Aprendizagem

Você aprenderá como treinar Redes Neurais na Semana 5. A Rede Neural é um dos algoritmos de aprendizado mais poderosos (eu costumo usá-lo quando um classificador linear falha), e os vídeos desta semana explicam como treinar esses modelos usando o 'backpropagation ' algoritmo. Na tarefa de programação desta semana, você implementará esse algoritmo e o verá em ação.

TAMBÉM VERIFIQUE: Os 20 melhores cursos online de recursos humanos em 2021-2022

Semana 6 - Conselhos para aplicar o aprendizado de máquina

Na Semana 6, você aprenderá como melhorar sistematicamente seu algoritmo de aprendizado. Os vídeos desta semana ensinarão você a reconhecer quando um algoritmo de aprendizado está tendo um desempenho ruim e descrever as 'práticas recomendadas' para 'depuração' e como melhorar o desempenho do algoritmo de aprendizado. Também falaremos sobre como projetar um sistema de aprendizado de máquina. Para melhorar um algoritmo de aprendizado de máquina, você deve primeiro identificar as áreas onde mais melhorias podem ser feitas.

Veremos como entender o desempenho de um sistema de aprendizado de máquina com várias partes e como lidar com dados, nestas aulas. Uma compreensão sólida do conteúdo desta semana economizará muito tempo ao aplicar o aprendizado de máquina a problemas do mundo real.

Semana 7 - Suporte a Máquinas de Vetor

O algoritmo de máquina de vetor de suporte (SVM) será abordado esta semana. Os SVMs são amplamente considerados como o algoritmo de aprendizado de 'caixa preta' mais poderoso e um dos algoritmos de aprendizado mais usados atualmente, graças a um objetivo de otimização bem escolhido.

Semana 8 - Aprendizado não supervisionado

Você aprenderá sobre aprendizado não supervisionado esta semana. Os algoritmos de aprendizado não supervisionado requerem apenas a entrada, enquanto os algoritmos de aprendizado supervisionado requerem exemplos rotulados (x,y) (x). Você aprenderá sobre clustering, que é usado em uma variedade de aplicativos, como segmentação de mercado e resumo de texto. Também abordaremos a Análise de Componentes Principais, que é uma técnica para acelerar o aprendizado de algoritmos e pode ser extremamente útil para visualizar e entender dados.

Semana 9 - Detecção de Anomalias

Quando você compra algo online, a maioria dos sites sugere automaticamente outros itens que você pode gostar. Os sistemas de recomendação analisam os padrões de atividade entre diferentes usuários e produtos para fazer essas recomendações. O algoritmo de filtragem colaborativa e a fatoração de matrizes de baixa classificação são exemplos de algoritmos de recomendação abordados neste módulo.

Semana 10 - Aprendizado de Máquina em Grande Escala

Falaremos sobre aprendizado de máquina em larga escala esta semana. Quando há muitos dados a serem usados para treinamento, o aprendizado de máquina funciona melhor. Saber lidar com 'big data' é uma das habilidades mais procuradas no Vale do Silício, dada a quantidade de dados que muitos sites/empresas coletam hoje.

Semana 11 - Exemplo de Aplicação: Photo OCR

Vamos levá-lo através de um aplicativo de aprendizado de máquina complexo e completo envolvendo Photo OCR esta semana. Reconhecer e identificar objetos, palavras e dígitos em uma imagem é uma tarefa difícil. Examinamos como construir um pipeline para resolver esse problema e analisar e melhorar o desempenho de tal sistema.

O instrutor

Andrew Ng é o fundador da DeepLearning.AI, sócio geral da AI Fund, presidente e cofundador da Coursera, e Professor Adjunto da Universidade de Stanford. O trabalho do Dr. Ng em IA mudou inúmeras vidas como pioneiro em aprendizado de máquina e educação online, sendo autor ou coautor de mais de 100 trabalhos de pesquisa em aprendizado de máquina, robótica e áreas relacionadas. Anteriormente, ele foi o cientista-chefe do Baidu, cofundador do Coursera, a maior plataforma MOOC do mundo, e líder fundador da equipe do Google Brain.

O Dr. Ng agora dedica a maior parte de seu tempo a seus empreendimentos, buscando as formas mais eficazes de acelerar as práticas responsáveis de IA na economia global. Andrew Ng é inegavelmente carismático, especialmente quando se trata de ensinar. Ele é capaz de apresentar o material com paciência, clareza, consistência e estrutura.

Preços do curso on-line de aprendizado de máquina

O custo é determinado se você deseja ou não um certificado de conclusão. Para ser mais específico, o preço do curso é o seguinte:

Sem um certificado, é grátis.
$ 79 se você tiver um certificado

Há muito debate sobre se um certificado de plataforma de aprendizado online é valioso ou não. É verdade que, ao selecionar um candidato, a maioria dos empregadores não presta muita atenção a esses certificados. Mesmo assim, porque esta Curso Online de Aprendizado de Máquina pela Universidade de Stanford no Coursera é tão popular, muitos técnicos teriam aceitado. Eles estarão cientes dos materiais que você leu. Portanto, pode fazer sentido atualizar para a versão paga. De qualquer forma, ter conhecimento é mais valioso do que ter um certificado.

Quais são alguns dos contras?

Apesar de seu fascínio, este curso está desatualizado. Isso não é uma falha de curso, mas já se passaram quase 11 anos! (o curso foi lançado em 2011). Durante este tempo, muita coisa mudou. Além disso, seria irrelevante se o curso fosse sobre aprendizado profundo (ou outros campos em rápido desenvolvimento). No entanto, como este curso é sobre os fundamentos, quase tudo nele ainda é relevante. Exceto talvez por histórias sobre aplicativos de aprendizado de máquina, que agora parecem um pouco divertidas.

Neste momento, as ferramentas disponíveis para completar tarefas práticas são muito diferentes. Tudo isso porque os avanços mais significativos na computador processamento de visão e linguagem natural ocorreu após 2011. (e exemplos de pratos principais são carros autônomos e classificadores de spam de e-mail). Esta é uma situação perfeitamente normal - tudo é avançado e os cursos modernos ficarão obsoletos em dez anos. Este curso aborda os fundamentos que nunca mudarão (pelo menos é o que pensamos), mas é importante lembrar que as abordagens e ferramentas para tarefas práticas estão em constante evolução.

TAMBÉM VERIFIQUE: Os 10 melhores cursos online gratuitos em aconselhamento com certificados em 2022

Para alguns, pode ser evidente, mas para outros, pode ser desconcertante. O aspecto técnico é que a qualidade do som pode ser inconsistente às vezes. No entanto, se você estudar com fones de ouvido em um ambiente silencioso, poderá ouvir tudo com clareza. Legendas também estão disponíveis.

O que será abordado no curso online de aprendizado de máquina?

O curso cobre muito e consegue acumular uma quantidade surpreendente de informações no que parece ser um curto período de tempo. Não que lhe falte profundidade; aliás, acredito que a profundidade do material é o ponto forte do curso. Regressão Linear e Logística, Vetorização, Regularização, Redes Neurais, Propagação Feedforward e Back (excelente), Funções de Custo, Inicialização de Rede, SVMs, Redução de Dimensionalidade, Aprendizado Supervisionado/Não Supervisionado, Análise de Componentes Principais (PCA), K-Means Clustering, Detecção de Anomalias , Sistemas de Recomendação e muito mais serão abordados.

Há também muitos conselhos para usar o aprendizado de máquina, como diagnosticar viés versus erro de variância, implementar conjuntos de teste de validação de trem, medir o desempenho do modelo (precisão, precisão, recall e pontuações F1), cujos algoritmos funcionam melhor com um muitos dados versus poucos dados e como ajustar esses algoritmos para atender melhor às nossas necessidades e/ou situação.

Prós

Apesar destes inconvenientes, esta Machine Learning Curso Online pela Universidade de Stanford no Coursera continua sendo a maneira mais eficaz de começar a aprender Data Science e IA. Os benefícios deste curso superam as desvantagens, e a seguir estão algumas vantagens:

Abrange uma ampla gama de técnicas de aprendizado de máquina.
Devido ao talento e experiência de ensino de Andrew Ng, ele pode explicar conceitos complicados em termos simples. Andrew Ng é um excelente professor de intuições e não tem medo de abordar a matemática. Este curso, em particular, é a melhor explicação que já vi sobre o truque do kernel e a seleção de modelos (prevenção de underfitting/overfitting).
Uma parte significativa do curso é dedicada aos fundamentos das redes neurais.
A maioria das armadilhas comuns dos engenheiros de ML e como realmente aplicar os métodos são abordados em detalhes.
Há legendas disponíveis em mais de dez idiomas. Isso permite que você aprenda quando e onde quiser, mesmo que seu inglês não seja muito bom.
Lembre-se de que os materiais do curso são gratuitos e você só precisa pagar pelo certificado (a taxa padrão do Coursera é de cerca de US$ 80).
Você pode usar o Python para concluir as tarefas do curso, embora não diretamente.

Os inconvenientes

Agora, embora eu o encoraje fortemente a fazer o curso, ele tem algumas desvantagens. Nesta seção, reuni uma variedade de pontos de vista sobre as desvantagens. Vamos dar uma olhada neles mais de perto.

1. A linguagem de programação e ferramentas

O curso é escrito em Octave, uma linguagem de programação de computação científica semelhante ao MATLAB. Andrew Ng explica que escolheu o Octave por causa de sua simplicidade, que permite que os alunos se concentrem em lógica e algoritmos em vez de se distrair com uma configuração de ambiente complicada. Ainda assim, estou confiante de que ele usará Python desta vez se atualizar o material (o que ouvi dizer que ele poderá fazer em breve). Python se tornou muito popular em ciência de dados e aprendizado de máquina. Tornou-se bastante popular e simples configurar o ambiente e usar o NumPy para alguns cálculos de matriz.

Ainda assim, tenha em mente que a linguagem de programação não importa muito para este curso. Além disso, você gastará muito tempo no início com caneta e papel, descobrindo as dimensões das multiplicações de matrizes. Na maioria dos casos, a linguagem de programação será irrelevante. Para terminar este curso usando Python, vá para o seguinte link.

2. Há muito código auxiliar

Você não começa a escrever código do zero em muitas das atribuições de programação. Normalmente, há um esqueleto de código que você deve preencher com blocos de código ausentes. Há alguns casos em que preencher os espaços em branco é muito simples. Os comentários no código praticamente dizem o que você precisa escrever. Nesses casos, é relativamente fácil para o aluno passar na tarefa, apesar da falta de compreensão do assunto. No entanto, se você seguir o caminho mais fácil, quase certamente precisará voltar e revisar o material como parte de tarefas futuras.

3. Não há o suficiente em redes neurais

Algumas pessoas reclamam que não há informações suficientes sobre Redes Neurais Artificiais na internet (RNAs). Este é um tópico que será abordado por apenas algumas semanas. No entanto, acredito que o curso abrange os elementos fundamentais mais importantes. Tenha em mente que Redes Neurais e Aprendizado Profundo são assuntos vastos em si mesmos, e é por isso que eu recomendo iniciar a Especialização em Aprendizado Profundo imediatamente após terminar o Curso Online de Aprendizado de Máquina pela Universidade de Stanford no Coursera.

TAMBÉM VERIFIQUE: As 20 melhores escolas online de ensino fundamental e médio gratuito em 12

4. Matemática demais/insuficiente

Surpreendentemente, alguns alunos acreditam que o curso cobre muito pouca matemática. Outros argumentam que parte do conteúdo é muito pesado em matemática, tornando-o difícil e impraticável. Acho que depende da formação dos alunos. Este, porém, é um dos pontos em que discordo. Como mencionei anteriormente, Andrew Ng atinge o equilíbrio perfeito entre prática e teoria, garantindo que você tenha conhecimento matemático suficiente, pelo menos para uma compreensão de alto nível de um conceito. Na maioria dos casos, você também receberá links adicionais para recursos externos que explicam a teoria matemática com mais detalhes.

5. Tempo para terminar

De acordo com a página inicial do curso, os alunos precisarão de cerca de 60 horas para concluí-lo. Isso, acredito, é uma estimativa bastante precisa. Eu o completei em menos de 3 meses, gastando de 5 a 7 horas por semana, com base na minha experiência pessoal.

O que você não aprenderá com o curso online de aprendizado de máquina

Muitos aspectos do aprendizado de máquina são propositadamente deixados de fora do curso. Eu uso a palavra “conscientemente” porque tenho certeza de que Andrew Ng e a equipe de design do curso são bem versados em todos os conceitos listados abaixo. Isso foi feito especificamente para tornar o curso mais fácil de entender para iniciantes. No entanto, acredito ser fundamental fornecer alguns materiais adicionais para os interessados em aprender mais sobre Data Science. Aqui estão alguns exemplos para ajudá-lo a entender melhor o Machine Learning e Ciência dados. Não vou mencionar CNNs, RNNs ou outros aspectos do aprendizado profundo porque está em um nível muito alto. No entanto, acredito que esta lista pode ajudá-lo a entender melhor o que a Ciência de Dados envolve.

1. Aprendizagem em conjunto

O curso não menciona métodos de aprendizagem em conjunto, como bagging, random forest, boosting, stacking, etc. Esta, na minha opinião, é a omissão mais significativa porque a rede neural no curso é vista “como um todo” e não como uma coleção de classificadores fracos.

2. Variáveis Categóricas

Embora a engenharia de recursos seja uma parte importante do trabalho de ciência de dados, nada é dito sobre variáveis categóricas e outros tipos.

3. Agrupamento

Apenas o algoritmo de agrupamento K-Means é considerado um algoritmo de agrupamento.

4. Redução de Dimensionalidade

PCA é a única técnica de redução de dimensionalidade que é considerada. Sem mencionar o fato de que existem inúmeras abordagens, você pode sair do curso com a impressão de que usar o PCA para visualização de dados é uma boa ideia.

5. Detecção de Anomalias

Andrew Ng fala sobre detecção de anomalias no curso, mas ele realmente quer dizer detecção de novidades, que é uma tarefa um pouco diferente. No curso, esse problema é resolvido usando uma abordagem de estimativa de densidade, e outras abordagens não são consideradas.

Cheatsheets

Você também pode usar meus artigos da folha de dicas como listas de conceitos de ciência de dados para entender melhor como resolver cada tarefa:

Conclusão

Espero que tenham gostado desta resenha sobre o Curso Online de Aprendizado de Máquina pela Universidade de Stanford no Coursera. No geral, acredito que tarefas mais desafiadoras e aprofundadas poderiam ter sido dadas no final do curso nas seções menores, mas, além disso, gostei muito do curso e acredito que ganhei muito valor com ele. Se você queria mergulhar no mundo da ciência de dados há muito tempo, mas não se atreveu, agora é o melhor momento para se matricular no curso e ganhar uma experiência única.

Perguntas Frequentes

O aprendizado de máquina é uma opção de carreira viável?

Se você está perguntando se uma carreira em Machine Learning é uma boa escolha, a resposta óbvia é sim. Portanto, se você estiver interessado em dados, automação e algoritmos, o aprendizado de máquina é uma ótima carreira para você. Seu dia será preenchido com a análise de grandes quantidades de dados e sua implementação e automatização.

O curso de Machine Learning no Coursera é difícil?

O curso cobre muito terreno, mas é um pouco desorganizado. Há muita matemática aqui, então você pode ter dificuldades se não estiver familiarizado com álgebra linear.

O Stanford Coursera sobre aprendizado de máquina é gratuito?

Este curso de Machine Learning no Coursera é intitulado simplesmente “Machine Learning” e é totalmente gratuito. Você só terá que pagar se quiser uma certificação de aprendizado de máquina compartilhável do Coursera quando terminar (embora isso possa ser atraente para potenciais empregadores).

O aprendizado de máquina de Stanford Coursera vale o seu tempo?

Não há como negar que a certificação de Machine Learning da Stanford University, disponível no Coursera, foi um grande sucesso. Isso se deve, sem dúvida, à excelente capacidade de Andrew Ng de simplificar alguns dos aspectos mais complexos do aprendizado de máquina em conceitos intuitivos e fáceis de aprender.

AVISO DE DIREITOS AUTORAIS! O conteúdo deste site não pode ser republicado, reproduzido ou redistribuído no todo ou em parte sem a devida permissão ou reconhecimento. Todos os conteúdos são protegidos por DMCA.

O conteúdo deste site é postado com boas intenções. Se você possui este conteúdo e acredita que seus direitos autorais foram violados ou infringidos, certifique-se de entrar em contato conosco em [xscholarshipc (@) gmail (ponto) com] e ações serão tomadas imediatamente.