PREPROCESAMIENTO Y CALIDAD DE DATOS

Description

BIG DATA
LINA CHAVARRO GUTIERREZ
Flashcards by LINA CHAVARRO GUTIERREZ, updated more than 1 year ago
LINA CHAVARRO GUTIERREZ
Created by LINA CHAVARRO GUTIERREZ over 6 years ago
9
0

Resource summary

Question Answer
PREPROCESAMIENTO Y CALIDAD DE DATOS Tecnologías como Internet generan datos a un ritmo exponencial gracias abaramiento y gran desarrollo del almacenamiento y los recursos de red. ASPECTOS IMPORTANTES Se caracteriza los datos masivos son la veracidad de los datos y el valor intrínseco del conocimiento extraído.
CARACTERÍSTICAS La veracidad y el valor de los datos y cuyo objetivo es filtrar el ruido y mantener los datos valiosos que pueden ser utilizados para la toma de decisiones inteligentes. PREPROCESAMIENTO DE DATOS Es una etapa esencial del proceso de descubrimiento de información. -Se encarga de la limpieza de datos, su integración, transformación y reducción para la siguiente fase de minería de datos.
LA PREPARACIÓN DE LOS DATOS El sistema prepara las bases de los datos que serán utilizados durante todo el ciclo del proceso en sus diferentes etapas. BIG DATA La necesidad de procesar y extraer conocimiento valioso de tal inmensidad de datos se ha considerado en un desafió considerable para científicos de datos y expertos en la materia.
SPARK es perfecto para procesos iterativos donde un mismo dato es reutilizado varias veces para el procesamiento de algoritmos sobre grafos, etc. ALGORITMOS PREPROCESAMIENTO DE DATOS MASIVOS En esta subseccion mostramos brevemente los algoritmos de preprocesamiento disponibles en las herramientas de analítica de datos previamente descritas.
REDUNDANCIA ACUMULADA Desarrolla una aproximación voraz al problema de calculo de importancia de atributos. REUTILIZACION DE CÁLCULOS PREVIOS Almacena para su reutilizacion algunos datos importantes cuando son calculados por primera vez.
PROCESAMIENTO POR COLUMNAS Normalmente formando una lista de filas son transformados a unas lista de columnas de manera que los cálculos entre atributos se tornan mas sencillos de realizar. CONCLUSIONES Este trabajo se estudia la creciente importancia del preprocesamiento de datos en Big Data. Se presenta una revisión de las tecnologías de Big Data herramientas analíticas de datos y técnicas y algoritmos disponibles para el preprocesamiento de datos masivos.
Show full summary Hide full summary

Similar

Capitulo 6
Pau Eliza
Tips for IB History Paper 1
enyarko
situation ethics
96arthur.g
English Techniques
shenaii matlock
Global History Regents Review Notes (Europe)
Jen Molte
Tess of the D'Urbevilles critical quotes
Magdalena Kolodziej
Core HR Knowledge
jkim05
Unit 1: Business Studies GCSE
Libby Rose
Physics P2
Emmakatewilsonx
OCR GCSE History-Paper Two: The Liberal Reforms 1906-14 Poverty to Welfare State NEW FOR 2015!!!
I Turner
Geometry Vocabulary
patticlj