Big data es un término que describe el gran
volumen de datos – estructurados y no
estructurados – que inundan una empresa todos
los días.
¿Por qué son importante el big data?
La importancia del big data no gira en torno a la cantidad de datos que tienes, sino en lo que haces
con ellos. Puedes tomar datos de cualquier fuente y analizarlos para encontrar respuestas que
permitan 1) reducir los costos, 2) reducir el tiempo, 3) desarrollar nuevos productos y optimizar las
ofertas, y 4) tomar decisiones inteligentes. Cuando se combinan grandes datos con análisis de alta
potencia, se pueden realizar tareas relacionadas con los negocios como
Para que sirve
El big data permite recopilar información de las
visitas de la página web, redes sociales,
registros de llamadas y otros orígenes de datos
para perfeccionar la experiencia de interacción,
así como optimizar el valor que se ofrece.
Reducir las tasas de abandono de los visitantes,
gestionar incidencias de forma proactiva
El deep learning anhela el big data
porque es necesaria para aislar
patrones ocultos y para encontrar
respuestas sin sobrecargar los datos.
Con el deep learning, cuantos más
datos de buena calidad tenga,
mejores serán los resultados.
Determinar las causas de origen de fallos, problemas y defectos casi en tiempo real. Generar
cupones en el punto de venta basados en los hábitos de compra del cliente. Recalcular
portafolios de riesgo completos en minutos. Detecte el comportamiento fraudulento antes de
que afecte a su organización.
DEFINICIÓN
big data" se refiere a los datos que son tan grandes, rápidos o
complejos que es difícil o imposible procesarlos con los métodos
tradicionales. El acto de acceder y almacenar grandes cantidades
de información para la analítica ha existido desde hace mucho
tiempo. Pero el concepto de big data cobró impulso a principios
de la década de 2000 cuando el analista de la industria, Doug
Laney, articuló la definición actual de grandes datos como las tres
V
Bid Data, datos masivos o macrodatos son tres maneras en que nos referimos a un
mismo concepto que aún no podemos definir con exactitud. Lo mas evidente es que el
volumen de un conjunto de datos masivos estan grande, que las capacidades de
memoria de muchas computadoras son insuficientes y las herramientas tradicionales
de análisis son inadecuadas
SAS Variabilidad y veracidad
Variabilidad: Además de las
crecientes velocidades y
variedades de datos, los flujos de
datos son impredecibles, cambian
a menudo y varían mucho. Es un
reto, pero las empresas necesitan
saber cuándo algo está de moda
en los medios sociales, y cómo
gestionar los picos de carga de
datos diarios, estacionales y
desencadenados por eventos.
Veracidad: La veracidad se refiere a la calidad de los
datos. Debido a que los datos provienen de tantas
fuentes diferentes, es difícil vincular, comparar,
limpiar y transformar los datos a través de los
sistemas. Las empresas necesitan conectar y
correlacionar las relaciones, las jerarquías y los
múltiples vínculos de datos. De lo contrario, sus
datos pueden salirse de control rápidamente