Como uma das estruturas de programação de código aberto mais poderosas, o Hadoop é uma ferramenta importante para quem deseja encontrar um trabalho de big data. Se você deseja aprimorar suas habilidades em Hadoop ou aprender a dominá-las, sua melhor opção é fazer um curso online. Se isso não estiver disponível para você, assista a tutoriais online gratuitos e use materiais de referência para solucionar problemas específicos. Depois de aprender o básico, pratique em pequenos conjuntos de dados do mundo real para melhorar suas habilidades.
Passos
Método 1 de 2: fazendo cursos e usando tutoriais
Etapa 1. Inscreva-se no Cloudera para um curso de 6 partes e tutoriais interativos
O Cloudera oferece exemplos do mundo real para praticar em um ambiente somente leitura, para que você não precise se preocupar em cometer grandes erros. Eles também oferecem ferramentas analíticas para ajudá-lo a experimentar dados de consulta, bem como uma demonstração ao vivo gratuita chamada Cloudera Live para ajudá-lo a aprender o ambiente Hadoop.
Embora o curso completo e aprofundado com certificação custe US $ 295, com certeza valerá a pena se você estiver usando essas habilidades para o seu trabalho. Usar o curso Cloudera ajudará você a detectar erros e economizar tempo, o que fará com que ele se pague rapidamente
Etapa 2. Experimente os cursos online gratuitos do Cloudera se você já conhece o básico
Se você tem experiência com o Hadoop e deseja apenas uma atualização, talvez não precise desembolsar dinheiro para o curso de 6 partes. Em vez disso, verifique os cursos online gratuitos no site da Cloudera University.
Existem recursos para administradores, desenvolvedores e analistas de dados, portanto, não importa qual seja sua função, você deve conseguir encontrar um curso apropriado
Etapa 3. Faça um curso de nível universitário no Coursera se quiser mais teoria
Coursera é uma fonte bem conhecida e respeitada de cursos de programação. Embora as instruções sejam geralmente mais teóricas e não incluam tantos exemplos de execução, você pode praticar junto com o tutorial e usar os projetos do curso para ganhar experiência prática.
- Você pode encontrar este curso online em
- O custo varia entre os cursos, mas o Coursera também oferece uma opção de auxílio financeiro para aqueles que se qualificam.
Etapa 4. Siga um curso gratuito na Big Data University para uma opção econômica
Se você não quer pagar por um curso online, Big Data University é uma ótima opção. Eles têm um curso de 2 partes, que se concentra primeiro nos fundamentos do Hadoop e, em seguida, na programação com o Hadoop, e o formato online torna mais fácil seguir seu próprio ritmo.
- Você pode encontrar esses cursos em
- Eles oferecem muitos tutoriais em inglês, além de japonês, espanhol, português e russo.
Etapa 5. Procure orientações no YouTube se precisar de um treinamento específico gratuito
Existem milhares de vídeos feitos para explicar o Hadoop e como utilizá-lo. A ampla variedade de vídeos oferece flexibilidade, além de ser gratuito. Se você se deparar com um problema específico, pesquise no YouTube por um vídeo que o conduza durante o processo.
Os tutoriais do Hadoop também devem ser bastante fáceis de encontrar, uma vez que “hadoop” é um termo de pesquisa exclusivo
Etapa 6. Use os tutoriais gratuitos do Yahoo se quiser praticar com um exemplo virtual
Esses tutoriais são divididos em 7 módulos e instruem você sobre a instalação e operação do Hadoop desde o início. Esta é uma ótima opção para aprimorar habilidades específicas se elas estiverem um pouco enferrujadas.
Etapa 7. Consulte o documento IBM Open Source para obter instruções detalhadas e gratuitas
Este é um documento PDF incrivelmente completo e de código aberto criado por uma iniciativa de treinamento da IBM. Ele percorre o Hadoop cuidadosamente, passo a passo, e fornece instruções claras por escrito.
Essas instruções também funcionam bem quando combinadas com uma demonstração ao vivo como o Cloudera
Método 2 de 2: fazendo a transição para um aplicativo do mundo real
Etapa 1. Pergunte se você pode implementar o Hadoop no trabalho para praticar com dados reais
Faça uma solicitação ao seu chefe ou supervisor, ou converse com eles individualmente sobre como trazer essas novas habilidades para o local de trabalho. Isso é especialmente importante se sua empresa pagou por algum treinamento ou cursos online.
Quanto mais cedo você começar a implementar as habilidades que aprendeu, mais cedo poderá dominá-las
Etapa 2. Procure projetos simples para praticar suas habilidades
Escolha projetos que sejam relativamente simples e de baixo risco, como contar e classificar o número de interações por agente do cliente, como e-mails e sessões de bate-papo.
- Alguns outros aplicativos de dados reais incluem a varredura de weblogs em busca de erros ou o monitoramento de canais de mídia social quanto ao sentimento da marca.
- Você também pode praticar com dados de amostra de sites como https://www.kaggle.com/datasets ou
Etapa 3. Verifique regularmente seu código com pequenos subconjuntos para resolver quaisquer bugs
Antes de executar todo o conjunto de dados, pegue um conjunto de dados de teste menor em sua máquina local e execute-o em vários modos diferentes. Por exemplo, você pode executá-lo iterativamente por meio do Modo Jobrunner Local, do Modo Pseudo-Distribuído e do Modo Totalmente Distribuído.
- Isso permitirá que você reconheça quaisquer falhas ou bugs antes que sejam amplificados no conjunto de dados completo.
- O modo Jobrunner local permite que você teste e depure localmente seu código Map and Reduce, o modo pseudo-distribuído imita o ambiente de produção e o modo totalmente distribuído analisa seu cluster de produção real.
Etapa 4. Use uma avaliação gratuita de 1 ano para praticar em um ambiente de máquina virtual
Empresas como Amazon e Microsoft oferecem assinaturas pagas para seus serviços de prática Hadoop. A máquina virtual da Amazon é chamada Amazon Web Service (AWS) e o serviço da Microsoft é chamado Microsoft Azure. Para ambos os serviços, o primeiro ano é gratuito quando você insere as informações do cartão de crédito.
Não se esqueça de cancelar a assinatura após 1 ano para evitar cobranças
Pontas
- Lembre-se de que o Hadoop é uma linguagem de programação mais especializada e de uso restrito. Isso certamente lhe dará uma vantagem no mundo do big data, mas nem sempre é necessário se tornar um programador.
- Você também pode ler livros e artigos sobre Hadoop, como Hadoop: The Definitive Guide, 3rd Edition de Tom White.