calidad de datos marina

Description

etiquetas
ANGELLY ARAUJO
Flashcards by ANGELLY ARAUJO, updated more than 1 year ago
ANGELLY ARAUJO
Created by ANGELLY ARAUJO over 6 years ago
6
0

Resource summary

Question Answer
BIG DATA: PROCESAMIENTO Y CALIDAD DE DATOS Gracias al desarrollo del Internet ;nuestros datos tienen mayor volumen , velocidad y variedad. Una baja calidad de datos, puede causar una mala calidad del conocimiento extraído,algunos factores pueden ser: ruido, valores perdidos,inconsistencias y un tamaño demasiado grande.
smart data: gira alrededor de dos im- portantes características, la veracidad y el valor de los datos, cuyo objetivo es filtrar el ruido y mantener los datos valiosos.los cuales son necesarios para la toma de decisiones importantes. El uso de los datos: a) los datos deben ser lo que se dice, es importante la calidad de datos; b) los datos deben ser escalables para su procesamiento; c) los datos deben estar disponibles y preparados para adaptarse;estas son características para datos exactos procesables y ágiles. El objetivo de este trabajo es presentar la importancia del pre procesamiento de datos en Big Data,también , estudiar las herramientas y técnicas de análisis de datos que soportan la tarea del pre procesamiento de datos masivos.
BIG DATA: *volumen *variedad *veracidad *valor *velocidad PROCESAMIENTO DE DATOS Esta etapa es esencial y se encarga de la limpieza de datos, su integración, transformación y reducción para la siguiente fase de minería de datos .
“La preparación de datos está formada por una serie de técnicas que tienen el objetivo de inicializar correctamente los datos que servirán de entrada para los algoritmos de minería de datos” El valor del conocimiento extraído es uno de los aspectos esenciales de Big Data.
Algunos nuevos escenarios nuevos con presencia de datos masivos son : las redes sociales, el Internet de las cosas y las industrias.
La necesidad de procesar y extraer conocimiento valioso de tal inmensidad de datos se ha convertido en un desafío considerable para científicos de datos y expertos en la materia. Google diseñó MapReduce en 2003 [8] que es considerada como la plataforma pionera para el procesamiento de datos masivos.
Una contribución reseñable para el preprocesamiento de datos masivos, y en particular, para selección de atributos, es el algoritmo fast-mRMR . Son necesarios nuevos algoritmos que deben centrarse en problemas tales como la selección de instancias o el tratamiento de datos imperfectos (ruido y valores perdidos).
Smart Data son datos de calidad, prestos para ser utilizados en la extracción de conocimiento y la toma de decisiones inteligente basada en datos. CONCLUSIÓN: ¡Decisiones de calidad deben estar soportadas por datos de calidad!
Show full summary Hide full summary

Similar

20 Frases de Motivación para Estudiantes
maya velasquez
Frases comunes en inglés
Laura -
FRASES sobre EDUCACIÓN ...
Ulises Yo
Mapa mental: Novela actual
daniela99.po
Japonés
GokaiPink neko
Saludar en portugués
Juan Zegarra
FRASES HECHAS de la A- a la Z-...
Ulises Yo
Frases sintaxis
Carla Coba
Seguridad y salud en el trabajo
nenatin-15
Frases para argumentar y debatir en inglés-español
Maite Doménech
EL PRINCIPITO
Ulises Yo