Spark

Beschreibung

Big data Karteikarten am Spark, erstellt von Primo Deckers am 01/03/2017.
Primo Deckers
Karteikarten von Primo Deckers, aktualisiert more than 1 year ago
Primo Deckers
Erstellt von Primo Deckers vor etwa 7 Jahre
20
1

Zusammenfassung der Ressource

Frage Antworten
Engine de execução generalista ? Spark
Sua exeção é baseada em Resilient Distributed Datasets? RDD
Outros Frameworks especializam O Spark generaliza
RDDs São coleções particionadas de dados; Criados por operações determinísticas (Transformações) em outro RDD ou arquivo; O usuário define o particionamento (otimizações de localidade) e armazenamento (RAM, disco).
É uma Engine de execução generalista Seu processamento é: Iterativo; em Batch; Streaming(simulado)
O Spark possui? Armazenamento Temporario em Ram ou disco; Leitura e escrita em diversos formatos: CVS; Json; Parquet; Arquivos de texto simples; Leitura escrita de diversas fontes: Arquivos locais; HDFS; S3; JDBC/ODBC;
O Spark possui? Mais de 80 operadores, intercambiaveis com consultas SQL: Map; reduceByKey; Filter; SortByKey; Três APIs principais de uso: RDDs; Datarames; Datasets (experimental)
Linguagens: Scala (principal); Java; Python; R;
O spark é executado em varios ambientes Standalone; Hadoop Yarn (gerenciador de recursos e tarefas do hadoop); Mesos;
Sub-projetos SPARK Spark Streaming (simula operações em tempo real utilizando mini batch); Spark SQL; MLLib (Aprendizado de maquina); GraphX (processamento de grafos com suporte a Pregel)
Comparativo com outros frameworks
Zusammenfassung anzeigen Zusammenfassung ausblenden

ähnlicher Inhalt

Big Data
djalma.melo
BIG DATA
Eduardo Diniz
011 - Conceito - Big Data Analytics
Projetos Casal2004
DNA - Struktur
Lisa10a
Réclamation - Phrases - Chapitre 6
Gaelle Bourgeois
BAS1 - Bau und Funktion des Bewegungsapparates (1)
susi.spakowski08
AOW-Verständnisfragen
Lisa-Maria Hauschild
KORRE - Megaprüfungsfragen
Martina Brunner
Projektmanagement Uni Due
Awash Kaul
Vetie: Geflügelkrankheiten 2018
Johanna Tr