Conceptos de Big Data

Description

Conceptos de Big Data como Datos estructurados; datos no estructurados; datos semiestructurados; modelación; Cloud computing; Web and Social Media;
Juan Garcia
Flashcards by Juan Garcia, updated more than 1 year ago
Juan Garcia
Created by Juan Garcia over 7 years ago
52
0

Resource summary

Question Answer
Datos estructurados Aquellos que tienen longitud y formato (por ejemplo fechas) y que pueden ser almacenados en tablas (como las bases de datos relacionales). En esta categoría entran los que se compilan en los censos de población, los diferentes tipos de encuestas, los datos de transacciones bancarias, las compras en tiendas online, etc.
Datos no estructurados Son los que carecen de un formato determinado y no pueden ser almacenados en una tabla. Pueden ser de tipo texto (los que generan los usuarios de foros, redes sociales, documentos de Word), y los de tipo no-texto (cualquier fichero de imagen, audio, vídeo).
Datos semiestructurados Son los que no pertenecen a bases de datos relacionales ya que no se limitan a campos determinados, aunque poseen organización interna o marcadores que facilita el tratamiento de sus elementos; estaríamos hablando de documentos XML, HTML o los datos almacenados en bases de datos NoSQL.
Real Time o Fast Data Este concepto suena constantemente en las empresas, tener los datos en Real Time, Near Real Time, streaming, batch… Hay que especificar qué información es crítica para tener al milisegundo, segundo, minutos, días… y saber qué tecnologías se necesitan para procesarla.
Bases de datos NoSQL Ha surgido una gran variedad de bases de datos específicas para ciertas funciones. Es un complejo ecosistema donde es importante conocer las diferencias y usos de estas bases de datos. También se habla de información semiestructurada y no estructurada. Hay que distinguir las dos clases de información y que herramientas hay para tratar cada una. Esta información luego se almacena en las bases de datos.
Modelación Las tecnologías Big Data están preparadas para tratar grandes volúmenes de información, con una gran variedad, y a una gran velocidad. Para entender, resumir y extraer insights de la información procesada se necesitan herramientas estadísticas. Hay una gran variedad de ellas y de algoritmos para extraer información. Saber qué clase de modelos, para qué sirven, y con qué herramientas es labor del personal de Big Data en la empresa. Insights son los aprendizajes que se obtienen de los datos y que son relevantes para el negocio.
Cloud computing Si no se dispone de una plataforma con Big Data en la empresa, se puede disponer de la alternativa del cloud computing para procesar grandes volúmenes de información y con gran rendimiento sin necesidad de tener hardware en tu propia empresa, sino alquilando software en la nube.
Web and Social Media Incluye contenido web e información que es obtenida de las redes sociales como Facebook, Twitter, LinkedIn, etc, blogs.
Machine-to-Machine (M2M) M2M se refiere a las tecnologías que permiten conectarse a otros dispositivos. M2M utiliza dispositivos como sensores o medidores que capturan algún evento en particular (velocidad, temperatura, presión, variables meteorológicas, variables químicas como la salinidad, etc.) los cuales transmiten a través de redes alámbricas, inalámbricas o híbridas a otras aplicaciones que traducen estos eventos en información significativa.
Big Transaction Data Incluye registros de facturación, en telecomunicaciones registros detallados de las llamadas (CDR), etc. Estos datos transaccionales están disponibles en formatos tanto semiestructurados como no estructurados.
Biometrics Información biométrica en la que se incluye huellas digitales, escaneo de la retina, reconocimiento facial, genética, etc. En el área de seguridad e inteligencia, los datos biométricos han sido información importante para las agencias de investigación.
Human Generated Las personas generamos diversas cantidades de datos como la información que guarda un call center al establecer una llamada telefónica, notas de voz, correos electrónicos, documentos electrónicos, estudios médicos, etc.
Show full summary Hide full summary

Similar

10 Study Techniques
PatrickNoonan
Electromagnetism: Magnetic Flux Density & Magnetic Flux 2
tatemae.honne
Hitler's Chancellorship
c7jeremy
IGCSE Physics formulas
Imani :D
The Anatomy of the Heart
Shannan Muskopf
Business Studies Unit 1
emily.mckechnie
All AS Maths Equations/Calculations and Questions
natashaaaa
GCSE Maths Quiz: Ratio, Proportion & Measures
Andrea Leyden
The Rise of the Nazis
shann.w
GCSE Maths: Understanding Pythagoras' Theorem
Micheal Heffernan
Specific topic 7.7 Timber (tools/equipment/processes)
T Andrews