Spark

Description

Big data Flashcards on Spark, created by Primo Deckers on 01/03/2017.
Primo Deckers
Flashcards by Primo Deckers, updated more than 1 year ago
Primo Deckers
Created by Primo Deckers about 7 years ago
20
1

Resource summary

Question Answer
Engine de execução generalista ? Spark
Sua exeção é baseada em Resilient Distributed Datasets? RDD
Outros Frameworks especializam O Spark generaliza
RDDs São coleções particionadas de dados; Criados por operações determinísticas (Transformações) em outro RDD ou arquivo; O usuário define o particionamento (otimizações de localidade) e armazenamento (RAM, disco).
É uma Engine de execução generalista Seu processamento é: Iterativo; em Batch; Streaming(simulado)
O Spark possui? Armazenamento Temporario em Ram ou disco; Leitura e escrita em diversos formatos: CVS; Json; Parquet; Arquivos de texto simples; Leitura escrita de diversas fontes: Arquivos locais; HDFS; S3; JDBC/ODBC;
O Spark possui? Mais de 80 operadores, intercambiaveis com consultas SQL: Map; reduceByKey; Filter; SortByKey; Três APIs principais de uso: RDDs; Datarames; Datasets (experimental)
Linguagens: Scala (principal); Java; Python; R;
O spark é executado em varios ambientes Standalone; Hadoop Yarn (gerenciador de recursos e tarefas do hadoop); Mesos;
Sub-projetos SPARK Spark Streaming (simula operações em tempo real utilizando mini batch); Spark SQL; MLLib (Aprendizado de maquina); GraphX (processamento de grafos com suporte a Pregel)
Comparativo com outros frameworks
Show full summary Hide full summary

Similar

Big Data
djalma.melo
BIG DATA
Eduardo Diniz
011 - Conceito - Big Data Analytics
Projetos Casal2004
Memory Key words
Sammy :P
AP Chemistry
Cathal Darby
Biology Unit 1
hannahsanderson1
CHEMISTRY C1 7
x_clairey_x
AQA GCSE Biology B1 unit 1
Olivia Phillips
B2, C2, P2
George Moores
What You Can Do Using GoConqr
Micheal Heffernan
SFDC App Builder 1 (1-25)
Connie Woolard