Que más puedo decir más allá del hecho de que me emociona profundamente que en la empresa donde trabajo estén evaluando seriamente comenzar a trabajar con la tecnología de IBM Bluemix.
No es que tenga algo en contra del Microsoft Azure, pero…
Consultor IT Agilista (XP, Scrum, DevOps) con más de 20 años de experiencia profesional facilitando la Transformación Digital.
Que más puedo decir más allá del hecho de que me emociona profundamente que en la empresa donde trabajo estén evaluando seriamente comenzar a trabajar con la tecnología de IBM Bluemix.
No es que tenga algo en contra del Microsoft Azure, pero…
Hace tan solo un par de días expiró el soporte técnico para la versión de HDInsight 3.5 y se aproxima la fecha para que Microsoft deje definitivamente fuera de circulación la plataforma de HDInsight sobre OS Windows y únicamente dispongamos de su solución de Big Data sobre Linux.
Quizás no es lo mejor, pero al menos es un gran avance.
Seguir leyendo «Expira soporte técnico para #Microsoft #HDInsight 3.5»
Para realizar labores de testing Apache Hadoop nos provee de MiniCluster (https://github.com/sakserv/hadoop-mini-clusters), sin embargo el problema es que aún no hay mucha documentación acerca de este.
Quizás alguno que otro post como el que nos comparten en este blog:
Seguir leyendo «Fixing problem test #Apache #Hadoop using MiniCluster on #Microsoft #Windows»
Hemos estado escuchando de fuentes oficiales de Microsoft la inminente expiración de las versiones HDInsight 3.2 y 3.3 en favor de la versión de HDInsight 3.4
https://azure.microsoft.com/en-us/documentation/articles/hdinsight-component-versioning/
Ahora que tenemos el emulador HDInsight configurado en la máquina virtual, podremos ejecutar un Job MapReduce para probar la instalación.
Primero subiremos algunos archivos de datos para HDFS y ejecutaremos un Job MapReduce para contar la frecuencia de palabras específicas en esos archivos.
El Job MapReduce ha sido empaquetado en el archivo:
hadoop-mapreduce-examples-2.4.0.2.1.3.0-1981.jar.
Seguir leyendo «Primer Job #MapReduce: WordCount (contar palabras)»
HDInsight permite trabajar con grandes volúmenes de datos en Azure, para lo cual proporciona los clústeres de Hadoop y HBase en la nube. Pero si queremos empezar a familiarizarnos con HDInsight, intentar hacerlo en Azure puede llegar a resultarnos algo costoso. Para facilitarnos el proceso de aprendizaje, #Microsoft ha dispuesto un Emulador de HDInsight para que podamos hacer nuestro primer acercamiento sin que ello nos genere algún tipo de gasto, más allá de lo que sería nuestra inversión de tiempo.
HDInsight soporta múltiples versiones de clúster Hadoop que se pueden desplegar en cualquier momento. Cada versión elegida provee una versión específica de la distribución de la Plataforma de Datos Hortonworks (HDP) y un conjunto de componentes que están contenidos dentro de esa distribución.
Seguir leyendo «Conociendo el Ecosistema #HDInsight – Parte II»
HDInsight es la solución Hadoop en Azure y ofrece implementaciones de Storm, HBase, Pig, Hive, Sqoop, Oozie, Ambari, y así sucesivamente.
HDInsight también se integra con herramientas de inteligencia de negocios (BI) como Excel, SQL Server Analysis Services y SQL Server Reporting Services. Seguir leyendo «Conociendo el Ecosistema #HDInsight»
Aprenda a crear y construir una aplicación Apache HBase en Java utilizando Gradle. A continuación, utilice la aplicación con Azure HDInsight (Hadoop). Si aún no conoce de Azure HDInsight (Hadoop), puede descargar el eBook: Introducing Microsoft Azure HDInsight Technical Overview. #Microsoft Press.
Debe estar conectado para enviar un comentario.