Main Content

MapReduce

Tecnica di programmazione per l'analisi di insiemi di dati che non trovano spazio in memoria

mapreduce è una tecnica di programmazione adatta all'analisi di grandi insiemi di dati che altrimenti non potrebbero essere contenuti nella memoria del computer. Utilizzare un datastore per elaborare i dati in piccole parti: la tecnica è composta da una fase Map, che formatta i dati o esegue un calcolo preliminare, e da una fase Reduce, che aggrega tutti i risultati della fase Map. Per maggiori informazioni, vedere Getting Started with MapReduce.

Per informazioni sull'uso di altri prodotti con mapreduce, vedere Speed Up and Deploy MapReduce Using Other Products.

Funzioni

espandi tutto

mapreduceProgramming technique for analyzing data sets that do not fit in memory
datastoreCreate datastore for large collections of data
addAdd single key-value pair to KeyValueStore
addmultiAdd multiple key-value pairs to KeyValueStore
hasnextDetermine if ValueIterator has one or more values available
getnextGet next value from ValueIterator
mapreducerDefine execution environment for mapreduce or tall arrays
gcmrGet current mapreducer configuration

Oggetti

KeyValueStoreStore key-value pairs for use with mapreduce
ValueIteratorAn iterator over intermediate values for use with mapreduce

Argomenti

Risoluzione dei problemi

Debug MapReduce Algorithms

This example shows how to debug mapreduce algorithms in MATLAB®. Debugging enables you to follow the movement of data between the different phases of mapreduce execution and inspect the state of all intermediate variables.