Contenido principal

Esta página se ha traducido mediante traducción automática. Haga clic aquí para ver la última versión en inglés.

Arreglos altos y mapreduce

Analice conjuntos de big data en paralelo utilizando arreglos altos y almacenes de datos de MATLAB® o mapreduce en Spark™ y Hadoop® clústeres y grupos paralelos

Puede utilizar Parallel Computing Toolbox™ para evaluar expresiones de arreglo alta en paralelo utilizando un grupo paralelo en su escritorio. El uso de arreglos altos le permite ejecutar aplicaciones de big data que no caben en la memoria de su máquina. También puede utilizar Parallel Computing Toolbox para ampliar el procesamiento de matrices altas conectándose a un grupo paralelo que se ejecuta en un clúster MATLAB Parallel Server™_. Alternativamente, puede utilizar un clúster Hadoop habilitado para Spark que ejecute MATLAB Parallel Server. Para obtener más información, consulte Big Data Workflow Using Tall Arrays and Datastores.

Funciones

expandir todo

tallCreate tall array
datastoreCreate datastore for large collections of data
mapreduceProgramming technique for analyzing data sets that do not fit in memory
mapreducerDefine parallel execution environment for mapreduce and tall arrays
partitionPartition a datastore
numpartitionsNumber of datastore partitions

Clases

expandir todo

parallel.PoolParallel pool of workers
parallel.cluster.HadoopHadoop cluster for mapreducer, mapreduce and tall arrays
parallel.cluster.SparkSpark cluster for mapreducer, mapreduce and tall arrays (Desde R2022b)

Ejemplos y procedimientos

Conceptos

Ejemplos destacados