Main Content

La traduzione di questa pagina non è aggiornata. Fai clic qui per vedere l'ultima versione in inglese.

Datastore

Leggere grandi raccolte di dati

La funzione datastore crea un datastore, che è un deposito per le raccolte di dati troppo grandi per essere inserite nella memoria. Un datastore consente di leggere ed elaborare i dati memorizzati in più file su un disco, in una posizione remota o in un database come un'unica entità. Se i dati sono troppo grandi per essere contenuti nella memoria, è possibile gestire l'importazione incrementale dei dati, creare un array tall per lavorare con i dati o utilizzare il datastore come input per mapreduce per un’ulteriore elaborazione. Per maggiori informazioni, vedere Getting Started with Datastore.

Funzioni

espandi tutto

datastoreCreate datastore for large collections of data
tabularTextDatastoreDatastore for tabular text files
spreadsheetDatastoreDatastore for spreadsheet files
imageDatastoreDatastore for image data
parquetDatastoreDatastore for collection of Parquet files
fileDatastoreDatastore with custom file reader
arrayDatastoreDatastore for in-memory data (Da R2020b)
readRead data in datastore
readallRead all data in datastore
previewPreview subset of data in datastore
hasdataDetermine if data is available to read
resetReset datastore to initial state
writeallWrite datastore to files (Da R2020a)
subsetCreate subset of datastore or FileSet
isSubsettableDetermine whether datastore is subsettable (Da R2022b)
shuffleShuffle all data in datastore
isShuffleableDetermine whether datastore is shuffleable (Da R2020a)
numpartitionsNumber of datastore partitions
partitionPartition a datastore
isPartitionableDetermine whether datastore is partitionable (Da R2020a)

Funzioni

combineCombine data from multiple datastores
transformTransform datastore

Oggetti

CombinedDatastoreDatastore to combine data read from multiple underlying datastores
SequentialDatastoreSequentially read data from multiple underlying datastores (Da R2022b)
TransformedDatastoreDatastore to transform underlying datastore
KeyValueDatastoreDatastore for key-value pair data for use with mapreduce
TallDatastoreDatastore for checkpointing tall arrays

Classi

espandi tutto

matlab.io.Datastore Base datastore class
matlab.io.datastore.PartitionableAdd parallelization support to datastore
matlab.io.datastore.SubsettableAdd subset and fine-grained parallelization support to datastore (Da R2022b)
matlab.io.datastore.HadoopLocationBased Add Hadoop support to datastore
matlab.io.datastore.ShuffleableAdd shuffling support to datastore
matlab.io.datastore.DsFileSet File-set object for collection of files in datastore
matlab.io.datastore.DsFileReader File-reader object for files in a datastore
matlab.io.datastore.FileWritableAdd file writing support to datastore (Da R2020a)
matlab.io.datastore.FoldersPropertyProviderAdd Folder property support to datastore (Da R2020a)
matlab.io.datastore.FileSet File-set for collection of files in datastore (Da R2020a)
matlab.io.datastore.BlockedFileSet Blocked file-set for collection of blocks within file (Da R2020a)

Argomenti