Conociendo el Ecosistema #HDInsight

HDInsight

HDInsight es la solución Hadoop en Azure y ofrece implementaciones de  Storm, HBase, Pig, Hive, Sqoop, Oozie, Ambariy así sucesivamente.

HDInsight también se integra con herramientas de inteligencia de negocios (BI) como Excel, SQL Server Analysis Services y SQL Server Reporting Services.

Azure HDInsight despliega y aprovisiona cluster Apache Hadoop en la nube, proporcionando un marco de software diseñado para gestionar, analizar e informar sobre Big Data. El núcleo Hadoop proporciona almacenamiento de datos fiables con el Sistema de Hadoop Distributed File (HDFS), y un sencillo modelo de programación MapReduce para procesar y analizar, de forma paralela, los datos almacenados en este sistema distribuido.

Ecosistema HDInsight

Tecnologías Hadoop en HDInsight:

  • Ambari: Cluster provisioning, management, and monitoring
  • Avro (Microsoft .NET Library for Avro): Data serialization for the Microsoft .NET environment
  • HBase: Non-relational database for very large tables
  • HDFS: Hadoop Distributed File System
  • Hive: SQL-like querying
  • Mahout: Machine learning
  • MapReduce and YARN: Distributed processing and resource management
  • Oozie: Workflow management
  • Pig: Simpler scripting for MapReduce transformations
  • Sqoop: Data import and export
  • Storm: Real-time processing of fast, large data streams
  • Zookeeper: Coordinates processes in distributed systems

Referencias:

Anuncios

Responder

Por favor, inicia sesión con uno de estos métodos para publicar tu comentario:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s