null
US
Iniciar Sesión
Regístrate Gratis
Registro
Hemos detectado que no tienes habilitado Javascript en tu navegador. La naturaleza dinámica de nuestro sitio requiere que Javascript esté habilitado para un funcionamiento adecuado. Por favor lee nuestros
términos y condiciones
para más información.
Siguiente
Copiar y Editar
¡Debes iniciar sesión para completar esta acción!
Regístrate gratis
6705445
SPARK
Descripción
Mapa Mental sobre SPARK, creado por BOGDAN SHEVCHENKO el 18/10/2016.
Mapa Mental por
BOGDAN SHEVCHENKO
, actualizado hace más de 1 año
Más
Menos
Creado por
BOGDAN SHEVCHENKO
hace más de 9 años
15
0
0
Resumen del Recurso
SPARK
RDD
Действия
Set
Intersection(otherSet)
union(otherSet)
cartesian(otherSet)
Functional
filter(func)
map(func)
distinct
Трансформации
saveAsTextFile(path)
array
collect()
take(n)
count
drop(n)
reduce(function)
Nota:
функция должна быть коммутативной и ассоциативной
MapReduce
WorkFlow
SparkContext
pyspark.sql.SparkSession (sparkContext)
pyspark.sql.SparkSession (sparkContext)
Modules
pyspark.sql
Nota:
http://spark.apache.org/docs/latest/api/python/pyspark.sql.html
functions
udf
pyspark.streaming
pyspark.ml
pyspark.mllib
Nota:
https://habrahabr.ru/company/mlclass/blog/251471/
linalg
Vectors
dense
sparse
stat
Statistics
colStats
mean
numNonzeros
variance
corr
feature
StandardScaler
Nota:
scaler = StandardScaler(withMean=True, withStd=True).fit(features) scaler.transform (features.map(lambda x:x.toArray()))
classification
LogisticRegressionWithSGD
RidgeRegressionWithSGD
NaiveBayes
tree
DecisionTree
RandomForest
clustering
KMeans
recommendation
ALS
Nota:
Коллаборативная фильтрация
Shuffle
Nota:
https://0x0fff.com/spark-architecture-shuffle/
Mostrar resumen completo
Ocultar resumen completo
¿Quieres crear tus propios
Mapas Mentales
gratis
con GoConqr?
Más información
.
Similar
WordCount
Nilesh Patel
Filter and Map
Nilesh Patel
Joins
Nilesh Patel
Setup spark scala in windows
Nilesh Patel
Test
Maciek Brynski
Explorar la Librería