Apache Hadoop

Description

Noveno Cloud Computing Mind Map on Apache Hadoop, created by JAMESON SLEYDER TIERRADENTRO GARZON on 31/08/2022.
JAMESON SLEYDER TIERRADENTRO GARZON
Mind Map by JAMESON SLEYDER TIERRADENTRO GARZON, updated more than 1 year ago
JAMESON SLEYDER TIERRADENTRO GARZON
Created by JAMESON SLEYDER TIERRADENTRO GARZON over 1 year ago
28
0

Resource summary

Apache Hadoop
  1. Framework de código abierto
    1. Procesa gran volumen de datos distribuidos
    2. Arquitectura
      1. NameNode (master)
        1. Controla el acceso de clientes a la información
          1. Secundary NameNode
            1. Copia el namespace, en caso de reinicio de sistema a causa de fallos en el NameNode
          2. DataNodes
            1. Almacenamiento de bloques de datos
              1. Entregar información
                1. Reporte de metadatos
                2. HDFS
                  1. Utiliza múltiples computadoras genéricas en clústers
                  2. JobTracker
                    1. Crea tareas MapReduce
                      1. Comprobar tareas fallidas
                        1. Puede re-programar en caso de fallos
                        2. TraskTracker
                          1. Corre MapReduce
                            1. Paralelizar procesos en dos fases
                              1. Mapeo: Escaner de datos y generar listas clave-valor
                                1. Reduce: Procesa y genera resultados
                          2. Modos de funcionamiento
                            1. Local pseudo-distribuido
                              1. Nodo único en un solo proceso Java
                              2. Local
                                1. Nodo único pero en procesos Java diferente
                                2. Distribuido
                                  1. Múltiples nodos distribuidos
                                3. Entorno
                                  1. Únicamente en entorno Linux y tener instalado Java
                                  2. Instalación
                                    1. Descargar desde la Web Oficial
                                      1. Crear usuario para administrar Hadoop
                                        1. Logeo y agragar variables de entorno
                                          1. Ejecutar 'source.bashrd'
                                      2. Configurar SSH
                                        1. Configurar el protocolo
                                          1. $ sudo apt-get install ssh | $ ssh-keygen -t rsa -f ~/.ssh/id_rsa | $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
                                            1. Otorgar permisos
                                              1. Comprobar conexión
                                                1. $ ssh localhost
                                                  1. Desactivar protocolo IPv6
                                                    1. $ net.ipv6.conf.all.disable_ipv6 = 1 $ net.ipv6.conf.default.disable_ipv6 = 1 $ net.ipv6.conf.lo.disable_ipv6 = 1
                                                  2. $ sudo chmod go-w $HOME $HOME/.ssh $ sudo chmod 600 $HOME/.ssh/authorized_keys $ sudo chown `whoami` $HOME/.ssh/authorized_keys
                                                2. Configurar HDFS
                                                  1. ‘/usr/local/hadoop/etc/hadoop’
                                                    1. core-site.xml
                                                      1. Configurar el directorio HDFS por defecto en el localhost
                                                      2. hdfs-site.xml
                                                        1. Informa como Hadoop almacenará la información
                                                        2. mapred-site.xml
                                                          1. Especifica quien realiza el MapReduce y donde se lleva a cabo
                                                          2. yarn-site.xml
                                                            1. Configurar el YARN

                                                    Media attachments

                                                    Show full summary Hide full summary

                                                    Similar

                                                    CLOUD COMPUTING
                                                    carolinesca86
                                                    CLOUD COMPUTING
                                                    Cynthia Eduarte
                                                    Cloud Computing
                                                    proyectoFinla 43GRU
                                                    Aprendizaje y enseñanza de los contenidos escolares 1: Datos y Conceptos
                                                    maya velasquez
                                                    TECNICAS DE RECOLECCION DE DATOS
                                                    Francisco Gómez
                                                    DIAPOSITIVAS DEFINITIVAS
                                                    galle1221j
                                                    Grafos
                                                    hor_dan
                                                    Características y Perspectivas de la Web 3.0
                                                    Paúl Baldeón
                                                    IDENTIFICACIÓN DE PROCESOS PARA EL MANEJO DE DATOS
                                                    sephirothblackfi
                                                    Periodismo de datos
                                                    luisguet
                                                    Desarrollo web
                                                    William Valdez