Primer Job #MapReduce: WordCount (contar palabras)

Primer Job MapReduce: WordCount (contar palabras)

Ahora que tenemos el emulador HDInsight configurado en la máquina virtual, podremos ejecutar un Job MapReduce para probar la instalación.

Primero subiremos algunos archivos de datos para HDFS y ejecutaremos un Job MapReduce para contar la frecuencia de palabras específicas en esos archivos.

El Job MapReduce ha sido empaquetado en el archivo:
hadoop-mapreduce-examples-2.4.0.2.1.3.0-1981.jar.

Seguir leyendo «Primer Job #MapReduce: WordCount (contar palabras)»

#HDInsight en tu Equipo

HDInsight permite trabajar con grandes volúmenes de datos en Azure, para lo cual proporciona los clústeres de Hadoop y HBase en la nube. Pero si queremos empezar a familiarizarnos con HDInsight, intentar hacerlo en Azure puede llegar a resultarnos algo costoso. Para facilitarnos el proceso de aprendizaje, #Microsoft ha dispuesto un Emulador de HDInsight para que podamos hacer nuestro primer acercamiento sin que ello nos genere algún tipo de gasto, más allá de lo que sería nuestra inversión de tiempo.

Emulador

Seguir leyendo «#HDInsight en tu Equipo»