
Apache Hadoop

Detalles de precios
Gratuito y de código abierto. Los costos están relacionados con la infraestructura y los servicios gestionados en plataformas en la nube.Características
Sistema de Archivos Distribuido (HDFS); Procesamiento paralelo (MapReduce); Gestión de recursos del cluster (YARN); Escalabilidad; Tolerancia a fallos; Rentabilidad; Flexibilidad; Replicación de datos; Localidad de datos; Código abierto; Ecosistema de herramientas relacionadas.Integraciones
Integración con herramientas del ecosistema Hadoop (Spark, Hive, Pig, Impala, Kafka, etc.); Compatibilidad con plataformas en la nube (AWS S3, Azure Blob Storage, Google Cloud Storage); Integración con bases de datos (HBase, Cassandra); Soporte para varios formatos de datos; APIs para varios lenguajes de programación.Vista previa
Apache Hadoop es un framework fundamental de código abierto para trabajar con big data. Proporciona un sistema de archivos distribuido (HDFS) para el almacenamiento fiable de conjuntos de datos muy grandes en clusters de servidores básicos y un modelo de procesamiento de datos paralelo (MapReduce), así como un gestor de recursos de cluster (YARN) para la asignación eficiente de tareas y recursos. Aunque Hadoop en sí mismo no incluye algoritmos de inteligencia artificial, es una base críticamente importante para ejecutar cargas de trabajo de aprendizaje automático y análisis de datos a gran escala. Hadoop permite almacenar y procesar petabytes de datos, poniéndolos a disposición de motores analíticos y bibliotecas de aprendizaje automático como Apache Spark (con MLlib), Apache Hive, Apache Pig y otras herramientas en el ecosistema de Hadoop. Se aplica ampliamente en diversas industrias, incluyendo finanzas (análisis de riesgos, detección de fraude), atención médica (procesamiento de registros médicos), comercio minorista (análisis de comportamiento del cliente) y telecomunicaciones (gestión de tráfico). Hadoop se caracteriza por su alta escalabilidad, tolerancia a fallos y rentabilidad mediante el uso de hardware estándar. El proyecto es desarrollado activamente y cuenta con el apoyo de una gran comunidad.