Como praticar Hadoop online: 11 etapas (com imagens)

Índice:

Como praticar Hadoop online: 11 etapas (com imagens)
Como praticar Hadoop online: 11 etapas (com imagens)

Vídeo: Como praticar Hadoop online: 11 etapas (com imagens)

Vídeo: Como praticar Hadoop online: 11 etapas (com imagens)
Vídeo: Como Criar uma SIMPLES CALCULADORA com HTML, CSS e JAVASCRIPT 2024, Abril
Anonim

Como uma das estruturas de programação de código aberto mais poderosas, o Hadoop é uma ferramenta importante para quem deseja encontrar um trabalho de big data. Se você deseja aprimorar suas habilidades em Hadoop ou aprender a dominá-las, sua melhor opção é fazer um curso online. Se isso não estiver disponível para você, assista a tutoriais online gratuitos e use materiais de referência para solucionar problemas específicos. Depois de aprender o básico, pratique em pequenos conjuntos de dados do mundo real para melhorar suas habilidades.

Passos

Método 1 de 2: fazendo cursos e usando tutoriais

Pratique Hadoop Online Etapa 1
Pratique Hadoop Online Etapa 1

Etapa 1. Inscreva-se no Cloudera para um curso de 6 partes e tutoriais interativos

O Cloudera oferece exemplos do mundo real para praticar em um ambiente somente leitura, para que você não precise se preocupar em cometer grandes erros. Eles também oferecem ferramentas analíticas para ajudá-lo a experimentar dados de consulta, bem como uma demonstração ao vivo gratuita chamada Cloudera Live para ajudá-lo a aprender o ambiente Hadoop.

Embora o curso completo e aprofundado com certificação custe US $ 295, com certeza valerá a pena se você estiver usando essas habilidades para o seu trabalho. Usar o curso Cloudera ajudará você a detectar erros e economizar tempo, o que fará com que ele se pague rapidamente

Pratique Hadoop Online Etapa 2
Pratique Hadoop Online Etapa 2

Etapa 2. Experimente os cursos online gratuitos do Cloudera se você já conhece o básico

Se você tem experiência com o Hadoop e deseja apenas uma atualização, talvez não precise desembolsar dinheiro para o curso de 6 partes. Em vez disso, verifique os cursos online gratuitos no site da Cloudera University.

Existem recursos para administradores, desenvolvedores e analistas de dados, portanto, não importa qual seja sua função, você deve conseguir encontrar um curso apropriado

Pratique Hadoop Online Etapa 3
Pratique Hadoop Online Etapa 3

Etapa 3. Faça um curso de nível universitário no Coursera se quiser mais teoria

Coursera é uma fonte bem conhecida e respeitada de cursos de programação. Embora as instruções sejam geralmente mais teóricas e não incluam tantos exemplos de execução, você pode praticar junto com o tutorial e usar os projetos do curso para ganhar experiência prática.

  • Você pode encontrar este curso online em
  • O custo varia entre os cursos, mas o Coursera também oferece uma opção de auxílio financeiro para aqueles que se qualificam.
Pratique Hadoop Online Etapa 4
Pratique Hadoop Online Etapa 4

Etapa 4. Siga um curso gratuito na Big Data University para uma opção econômica

Se você não quer pagar por um curso online, Big Data University é uma ótima opção. Eles têm um curso de 2 partes, que se concentra primeiro nos fundamentos do Hadoop e, em seguida, na programação com o Hadoop, e o formato online torna mais fácil seguir seu próprio ritmo.

  • Você pode encontrar esses cursos em
  • Eles oferecem muitos tutoriais em inglês, além de japonês, espanhol, português e russo.
Pratique Hadoop Online Etapa 5
Pratique Hadoop Online Etapa 5

Etapa 5. Procure orientações no YouTube se precisar de um treinamento específico gratuito

Existem milhares de vídeos feitos para explicar o Hadoop e como utilizá-lo. A ampla variedade de vídeos oferece flexibilidade, além de ser gratuito. Se você se deparar com um problema específico, pesquise no YouTube por um vídeo que o conduza durante o processo.

Os tutoriais do Hadoop também devem ser bastante fáceis de encontrar, uma vez que “hadoop” é um termo de pesquisa exclusivo

Pratique Hadoop Online Etapa 6
Pratique Hadoop Online Etapa 6

Etapa 6. Use os tutoriais gratuitos do Yahoo se quiser praticar com um exemplo virtual

Esses tutoriais são divididos em 7 módulos e instruem você sobre a instalação e operação do Hadoop desde o início. Esta é uma ótima opção para aprimorar habilidades específicas se elas estiverem um pouco enferrujadas.

Pratique Hadoop Online Etapa 7
Pratique Hadoop Online Etapa 7

Etapa 7. Consulte o documento IBM Open Source para obter instruções detalhadas e gratuitas

Este é um documento PDF incrivelmente completo e de código aberto criado por uma iniciativa de treinamento da IBM. Ele percorre o Hadoop cuidadosamente, passo a passo, e fornece instruções claras por escrito.

Essas instruções também funcionam bem quando combinadas com uma demonstração ao vivo como o Cloudera

Método 2 de 2: fazendo a transição para um aplicativo do mundo real

Pratique Hadoop Online Etapa 8
Pratique Hadoop Online Etapa 8

Etapa 1. Pergunte se você pode implementar o Hadoop no trabalho para praticar com dados reais

Faça uma solicitação ao seu chefe ou supervisor, ou converse com eles individualmente sobre como trazer essas novas habilidades para o local de trabalho. Isso é especialmente importante se sua empresa pagou por algum treinamento ou cursos online.

Quanto mais cedo você começar a implementar as habilidades que aprendeu, mais cedo poderá dominá-las

Pratique Hadoop Online Etapa 9
Pratique Hadoop Online Etapa 9

Etapa 2. Procure projetos simples para praticar suas habilidades

Escolha projetos que sejam relativamente simples e de baixo risco, como contar e classificar o número de interações por agente do cliente, como e-mails e sessões de bate-papo.

  • Alguns outros aplicativos de dados reais incluem a varredura de weblogs em busca de erros ou o monitoramento de canais de mídia social quanto ao sentimento da marca.
  • Você também pode praticar com dados de amostra de sites como https://www.kaggle.com/datasets ou
Pratique Hadoop Online Etapa 10
Pratique Hadoop Online Etapa 10

Etapa 3. Verifique regularmente seu código com pequenos subconjuntos para resolver quaisquer bugs

Antes de executar todo o conjunto de dados, pegue um conjunto de dados de teste menor em sua máquina local e execute-o em vários modos diferentes. Por exemplo, você pode executá-lo iterativamente por meio do Modo Jobrunner Local, do Modo Pseudo-Distribuído e do Modo Totalmente Distribuído.

  • Isso permitirá que você reconheça quaisquer falhas ou bugs antes que sejam amplificados no conjunto de dados completo.
  • O modo Jobrunner local permite que você teste e depure localmente seu código Map and Reduce, o modo pseudo-distribuído imita o ambiente de produção e o modo totalmente distribuído analisa seu cluster de produção real.
Pratique Hadoop Online Etapa 11
Pratique Hadoop Online Etapa 11

Etapa 4. Use uma avaliação gratuita de 1 ano para praticar em um ambiente de máquina virtual

Empresas como Amazon e Microsoft oferecem assinaturas pagas para seus serviços de prática Hadoop. A máquina virtual da Amazon é chamada Amazon Web Service (AWS) e o serviço da Microsoft é chamado Microsoft Azure. Para ambos os serviços, o primeiro ano é gratuito quando você insere as informações do cartão de crédito.

Não se esqueça de cancelar a assinatura após 1 ano para evitar cobranças

Pontas

  • Lembre-se de que o Hadoop é uma linguagem de programação mais especializada e de uso restrito. Isso certamente lhe dará uma vantagem no mundo do big data, mas nem sempre é necessário se tornar um programador.
  • Você também pode ler livros e artigos sobre Hadoop, como Hadoop: The Definitive Guide, 3rd Edition de Tom White.

Recomendado: