YANIRA MORA

Description

TRABAJO DE BASE DE DATOS
ANGELLY ARAUJO
Flashcards by ANGELLY ARAUJO, updated more than 1 year ago
ANGELLY ARAUJO
Created by ANGELLY ARAUJO over 6 years ago
7
0

Resource summary

Question Answer
¿Qué es Big Data? conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales.
como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles. Aunque el tamaño utilizado para determinar si un conjunto de datos determinado se considera Big Data no está firmemente definido y sigue cambiando con el tiempo, la mayoría de los analistas y profesionales actualmente se refieren a conjuntos de datos que van desde 30-50 Terabytes a varios Petabytes.
¿Por qué el Big Data es tan importante? Lo que hace que Big Data sea tan útil para muchas empresas es el hecho de que proporciona respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían.
Proporciona un punto de referencia. Con una cantidad tan grande de información, los datos pueden ser moldeados o probados de cualquier manera que la empresa considere adecuada. Al hacerlo, las organizaciones son capaces de identificar los problemas de una forma más comprensible. La recopilación de grandes cantidades de datos y la búsqueda de tendencias dentro de los datos permiten que las empresas se muevan mucho más rápidamente, sin problemas y de manera eficiente. También les permite eliminar las áreas problemáticas antes de que los problemas acaben con sus beneficios o su reputación.
El análisis de Big Data ayuda a las organizaciones a aprovechar sus datos y utilizarlos para identificar nuevas oportunidades. Desafíos de la calidad de datos en Big Data
Las especiales características del Big Data hacen que su calidad de datos se enfrente a múltiples desafíos. Se trata de las conocidas como 5 Vs: Volumen, Velocidad, Variedad, Veracidad y Valor, que definen la problemática del Big Data. Estas 5 características del big data provocan que las empresas tengan problemas para extraer datos reales y de alta calidad, de conjuntos de datos tan masivos, cambiantes y complicados.
Fuentes de datos de big data son: Datos de internet y móviles. Datos de Internet de las Cosas. Datos sectoriales recopilados por empresas especializadas. Datos experimentales. Tipos de datos: Tipos de datos no estructurados: documentos, vídeos, audios, etc. Tipos de datos semi-estructurados: software, hojas de cálculo, informes. Tipos de datos estructurados
Es difícil recolectar, limpiar, integrar y obtener datos de alta calidad de forma rápida. Se necesita mucho tiempo para transformar los tipos no estructurados en tipos estructurados y procesar esos datos. Los datos cambian rápidamente y eso hace que tengan una validez muy corta. Para solucionarlo necesitamos un poder de procesamiento muy alto.
Si no lo hacemos bien, el procesamiento y análisis basado en estos datos puede producir conclusiones erróneas, que pueden llevar a cometer errores en la toma de decisiones. Estas normas necesitan madurar y perfeccionarse. Además, la investigación sobre la calidad de datos de big data ha comenzado hace poco y no hay apenas resultados.
La calidad de datos de big data es clave, no solo para poder obtener ventajas competitivas sino también impedir que incurramos en graves errores estratégicos y operacionales basándonos en datos erróneos con consecuencias que pueden llegar a ser muy graves. Esto no parece un equilibrio fácil de conseguir, sobre todo cuando la realidad de dónde y cómo los datos se alojan y procesan está en constante movimiento.
En este trabajo se estudia la creciente importancia del preprocesamiento de datos en Big Data. Se presenta una revisión de las tecnologías de Big Data, herramientas de analítica de datos y técnicas y algoritmos disponibles para el preprocesamiento de datos masivos. La gobernabilidad no ocurre sin una seguridad en el punto final de la cadena. Es importante construir un buen perímetro y colocar un cortafuegos alrededor de los datos, integrados con los sistemas y estándares de autenticación existentes.
Show full summary Hide full summary

Similar

CPU and Memory
LunaLovegood
Meriya Pinales & Malika Hurt
hurtmalika
unit 1 f321 chemistry ocr
methmip
Biology- Genes and Variation
Laura Perry
USA and Vietnam (1964 - 1975) Part 2
Lewis Appleton-Jones
Sociology - Crime and Deviance - Feminists
josaul1996
Simple Present Tense (Test)
Onur Kalafat
NSI Test First day
brahim matrix
TOK mindmap “Without application in the world, the value of knowledge is greatly diminished.”
Gabriela Serpa
CHEMISTRY TEST
kingi kigongo
BM 13 - COMENIUS, HERBART, DEWEY, HÖNIGSWALD
christoph wimmer