EL BIG DATA

Description

Mind Map on EL BIG DATA, created by Marcelo Gabriel Ochoa Jaramillo on 30/04/2022.
Marcelo Gabriel Ochoa Jaramillo
Mind Map by Marcelo Gabriel Ochoa Jaramillo, updated more than 1 year ago
Marcelo Gabriel Ochoa Jaramillo
Created by Marcelo Gabriel Ochoa Jaramillo over 3 years ago
15
0

Resource summary

EL BIG DATA
  1. ¿Qué es?
    1. Según ZDNet.com
      1. Información que no puede ser procesada
        1. Información que no puede ser analizada por medio de procesos tradicionales
        2. Para Thinkupapp.com
          1. Cantidades masivas de datos que se acumulan con el tiempo
            1. Difíciles de analizar y manejar
              1. Mediante herramientas comunes
          2. Según E. Dans
            1. Tratamiento y análisis de enormes repositorios
              1. Resulta imposible tratarlos con bases de datos convencionales
          3. Dimensiones
            1. Volumen
              1. Es el aumento significativo de datos creados por personas o máquinas
                1. Terabytes, Petabytes, Exabytes
              2. Velocidad
                1. Velocidad con la que se crean los datos
                  1. El aumento de productos desarrollados por sofware
                    1. Páginas web, foros, redes sociales
                2. Variedad
                  1. Va de la mano con el volumen
                    1. DIferentes formas de respresentar los datos
                      1. Datos estructurados
                        1. Hojas de cálculo
                          1. Formularios web
                            1. Encuestas a usuarios de un servicio
                            2. Datos no estructurados
                              1. Páginas Web
                                1. Foros
                                  1. Archivos de búsqueda
                                    1. Redes sociales
                              2. Tecnologías de Big Data
                                1. Apache Hadoop
                                  1. Sofware de código abierto
                                    1. Creado por Doug Cutting
                                      1. Utilizado para su trabajo en Nutch
                                        1. Web de motor de búsqueda
                                      2. Puede almacenar
                                        1. Datos estructurados
                                          1. Datos semiestructurados
                                            1. Datos no estructurados
                                            2. Características
                                              1. Diseñado para ejecutarse en clúster robustos
                                                1. Grupos grandes de hardware
                                                2. Es robusto
                                                  1. Puede soportar cualquier inconveniente de hardware con facilidad
                                                  2. Puede ser escalable
                                                    1. Permite agregar nodos al clúster con facilidad
                                                    2. Es simple
                                                      1. Permite escribir códigos con eficiencia
                                                  3. Bases de datos NoSQL
                                                    1. Creado por Carlo Strozzi
                                                      1. No tienen esquemas
                                                        1. No usan SQL
                                                          1. No almacenan datos en tablas de filas y columnas
                                                            1. Usa la memoria principal del computador
                                                              1. Permite gestionar grandes volúmenes de información
                                                                1. Características
                                                                  1. Datos distribuidos en varias máquinas
                                                                    1. Permite obtener datoas con mayor velocidad
                                                                    2. Voldemort
                                                                      1. Creada por linkkedIn
                                                                        1. Para solucionar problemas de escalabilidad
                                                                        2. almacena datos en forma clave-valor
                                                                          1. Es de ambiente distribuido
                                                                          2. HBase
                                                                            1. De tipo código abierto
                                                                              1. Almacena datos de tipo clave-valor
                                                                                1. Almacena y repcupera daots de forma aleatoria
                                                                                2. Riak
                                                                                  1. Almacena datos de tipo clave-valor
                                                                                    1. Es de ambiente distribuido
                                                                                      1. Tolerante a fallos
                                                                                        1. Elimina errores y sus efectos antes de que ocurra la falla
                                                                                          1. Utiliza JavaScript Object Notation (JSON)
                                                                                          2. CouchDB
                                                                                            1. Creado por Damien Katz en 2005
                                                                                              1. Servidor de bases de datos documental
                                                                                              2. MongoDB
                                                                                                1. Orientada a documentos
                                                                                                  1. De código abierto
                                                                                                    1. Versátil, potente y de fácil usabilidad
                                                                                                2. Modelos de datos
                                                                                                  1. Estructurados
                                                                                                    1. Aquellos de mayor facilidad de acceder
                                                                                                      1. Tienen una estructura bien definida
                                                                                                        1. Pueden ser
                                                                                                          1. Estáticos
                                                                                                            1. Aray
                                                                                                              1. Son datos homogéneos y ordenados por un índice
                                                                                                                1. Facilita la administración de datos
                                                                                                                  1. Ejemplo: Campo Fecha DD/MM/AA
                                                                                                                  2. Cadena de caracteres
                                                                                                                    1. Registros
                                                                                                                    2. Dinámicos
                                                                                                                      1. Listas
                                                                                                                        1. Pilas
                                                                                                                          1. Colas
                                                                                                                            1. Árboles
                                                                                                                              1. Archivos
                                                                                                                          2. Semiestructurados
                                                                                                                            1. No tienen formato definido
                                                                                                                              1. Tienen etiquetas que separan un dato de otro
                                                                                                                                1. Se leen por medio de reglas de cierto nivel de complejidad
                                                                                                                                2. No estructurados
                                                                                                                                  1. No pueden ser normalizados
                                                                                                                                    1. No tienen tipos definidos
                                                                                                                                      1. No están organizados bajo ninún patrón
                                                                                                                                        1. No tienen un formato normalizado determinado
                                                                                                                                      Show full summary Hide full summary

                                                                                                                                      Similar