Como uno de los marcos de programación de código abierto más potentes, Hadoop es una herramienta importante para cualquier persona que desee encontrar un trabajo de big data. Si desea repasar sus habilidades de Hadoop o aprender a dominarlo, su mejor opción es tomar un curso en línea. Si no está disponible para usted, mire tutoriales gratuitos en línea y use materiales de referencia para solucionar problemas específicos. Una vez que tenga lo básico, practique en pequeños conjuntos de datos del mundo real para mejorar sus habilidades.

Método uno de dos:
Toma de cursos y uso de tutoriales

  1. 1 Regístrese en Cloudera para obtener un curso de 6 partes y tutoriales interactivos. Cloudera te ofrece ejemplos del mundo real para practicar en un entorno de solo lectura, por lo que no tienes que preocuparte por cometer grandes errores. También ofrecen herramientas analíticas para ayudarlo a experimentar datos de consulta, así como una demostración en vivo gratuita llamada Cloudera Live para ayudarlo a aprender sobre el entorno de Hadoop.[1]
    • Aunque el curso completo y exhaustivo con certificación le costará $ 295, definitivamente valdrá la pena si usa estas habilidades para su trabajo. Usar el curso Cloudera lo ayudará a detectar errores y ahorrar tiempo, lo que hará que se pague rápidamente.[2]
  2. 2 Pruebe cursos en línea gratuitos a través de Cloudera si ya conoce los conceptos básicos. Si tiene experiencia con Hadoop y solo quiere un repaso, puede que no necesite desembolsar el dinero para el curso de 6 partes. En su lugar, consulte los cursos gratuitos en línea en el sitio web de la Universidad Cloudera.[3]
    • Existen recursos para administradores, desarrolladores y analistas de datos, por lo que no importa cuál sea su función, debería poder encontrar un curso apropiado.
  3. 3 Tome un curso de nivel universitario en Coursera si quiere más teoría. Coursera es una fuente reconocida y respetada de cursos de programación. Aunque las instrucciones son generalmente más teóricas y no incluyen tantos ejemplos de ejecución, puede practicar junto con el tutorial y utilizar los proyectos del curso para obtener experiencia práctica.[4]
    • Puede encontrar este curso en línea en https://www.coursera.org/specializations/big-data.
    • El costo varía entre los cursos, pero Coursera también ofrece una opción de ayuda financiera a aquellos que califiquen.
  4. 4 Siga un curso gratuito en Big Data University para obtener una opción económica. Si no desea pagar un curso en línea, Big Data University es una gran opción. Tienen un curso de dos partes, que se enfoca primero en los conceptos básicos de Hadoop, luego en la programación con Hadoop, y el formato en línea lo hace fácil de seguir a su propio ritmo.[5]
    • Puede encontrar estos cursos en https://cognitiveclass.ai.
    • Ofrecen muchos tutoriales en inglés, así como en japonés, español, portugués y ruso.
  5. 5 Busque recorridos en YouTube si necesita capacitación gratuita y específica. Hay miles de videos creados para explicar Hadoop y cómo utilizarlos. La amplia gama de videos le brinda flexibilidad, además de que es gratis. Si se encuentra con un problema específico, busque en YouTube un video que lo guíe a través del proceso.[6]
    • Los tutoriales de Hadoop también deberían ser bastante fáciles de encontrar, ya que "hadoop" es un término de búsqueda único.[7]
  6. 6 Utilice los tutoriales gratuitos de Yahoo si desea practicar con un ejemplo virtual. Estos tutoriales se dividen en 7 módulos y le informan sobre la instalación y el funcionamiento de Hadoop desde el principio. Esta es una gran opción para repasar habilidades específicas si están un poco oxidadas.[8]
    • Puede encontrar estos tutoriales disponibles de forma gratuita en https://developer.yahoo.com/hadoop/tutorial/.
  7. 7 Consulte el documento de IBM Open Source para obtener instrucciones detalladas y gratuitas. Este es un documento PDF de código abierto increíblemente exhaustivo creado por una iniciativa de capacitación de IBM. Lo guiará a través de Hadoop cuidadosamente, paso a paso, y le dará instrucciones claras por escrito.
    • Puede encontrar este PDF en https://www.ibm.com/developerworks/data/library/techarticle/dm-1209hadoopbigdata/.
    • Estas instrucciones también funcionan bien cuando se combinan con una demostración en vivo como Cloudera.[9]

Método dos de dos:
Transición a la aplicación en el mundo real

  1. 1 Pregunte si puede implementar Hadoop en el trabajo para practicar con datos reales. Haga una solicitud a su jefe o supervisor, o hable con ellos uno a uno sobre cómo llevar estas nuevas habilidades al lugar de trabajo. Esto es especialmente importante si su empresa pagó por cualquier capacitación o curso en línea.[10]
    • ¡Cuanto antes empiece a implementar las habilidades que ha aprendido, más pronto podrá dominarlas!
  2. 2 Busque proyectos simples para practicar sus habilidades. Elija proyectos que sean relativamente simples y de bajo riesgo, como contar y clasificar el número de interacciones por agente del cliente, como correos electrónicos y sesiones de chat.[11]
    • Algunas otras aplicaciones de datos reales incluyen el escaneo a través de weblogs en busca de errores o la supervisión de los canales de redes sociales en busca del sentimiento de marca.
    • También puede practicar con datos de muestra de sitios como https://www.kaggle.com/datasets o https://aws.amazon.com/datasets/.
  3. 3 Revise regularmente su código con subconjuntos pequeños para resolver cualquier error. Antes de ejecutar todo el conjunto de datos, tome un conjunto de datos de prueba más pequeño en su máquina local y ejecútelo en varios modos diferentes. Por ejemplo, puede ejecutarlo iterativamente a través del modo local Jobrunner, luego del modo pseudo-distribuido y luego del modo totalmente distribuido.[12]
    • Esto le permitirá reconocer cualquier defecto o error antes de que se amplifique en el conjunto de datos completo.
    • El modo Local Jobrunner le permite probar y depurar localmente su código Map and Reduce, el modo Pseudo-Distributed imita el entorno de producción y el modo Fully-Distributed analiza su clúster de producción real.
  4. 4 Utilice una versión de prueba gratuita de 1 año para practicar en un entorno de máquina virtual. Las empresas como Amazon y Microsoft ofrecen suscripciones pagas para sus servicios de práctica de Hadoop.La máquina virtual de Amazon se llama Amazon Web Service (AWS) y el servicio de Microsoft se llama Microsoft Azure. Para ambos servicios, su primer año es gratis cuando ingresa la información de su tarjeta de crédito.[13]
    • No olvide cancelar la suscripción después de 1 año para evitar que se le cobre.