Il machine learning è una tecnica di analisi di dati che insegna ai computer a svolgere un’attività naturale per l’uomo e gli animali: imparare dall’esperienza. Gli algoritmi di machine learning usano metodi computazionali per “apprendere” le informazioni direttamente dai dati senza basarsi su un’equazione predeterminata come modello. Essi possono migliorare in modo adattivo le loro prestazioni man mano che aumenta il numero di campioni disponibili per l’apprendimento.
Come funziona il machine learning
Vengono utilizzate due tipi di tecniche: l’apprendimento con supervisione, che addestra un modello in base a dati di input e output noti per consentirgli di prevedere output futuri, e l’apprendimento senza supervisione, che individua pattern nascosti o strutture intrinseche nei dati di input.
Figura 1: Le tecniche di machine learning includono l’apprendimento con supervisione e senza supervisione.
Apprendimento con supervisione
Il machine learning con supervisione costruisce un modello in grado di effettuare previsioni sulla base di prove attendibili in caso di incertezza. Un algoritmo di apprendimento con supervisione utilizza un set conosciuto di dati di input e risposte note ai dati (output) e addestra un modello per generare previsioni accettabili in risposta ai nuovi dati. L’utilizzo dell’apprendimento con supervisione è consigliato se si dispone di dati noti per l’output che si desidera prevedere.
L’apprendimento con supervisione utilizza le tecniche di classificazione e regressione per sviluppare modelli predittivi.
Le tecniche di classificazione prevedono risposte discrete: per esempio, se un’e-mail è autentica o spam, oppure se un tumore è maligno o benigno. I modelli di classificazione raggruppano i dati di input in categorie. Tra le applicazioni più comuni figurano l’imaging medicale, il riconoscimento vocale e la valutazione del rischio di credito.
Usa la classificazione se i tuoi dati possono essere etichettati, categorizzati o suddivisi in classi o categorie specifiche. Per esempio, le applicazioni per il riconoscimento della scrittura a mano utilizzano la classificazione per riconoscere lettere e numeri. Nell’elaborazione di immagini e nella visione artificiale, le tecniche di Pattern Recognition senza supervisione vengono utilizzate per la rilevazione di oggetti e la segmentazione di immagini.
Le tecniche di regressione prevedono risposte continue: per esempio, variazioni della temperatura o fluttuazioni della domanda di energia. Le applicazioni tipiche includono la previsione del carico elettrico e il trading algoritmico.
Utilizza le tecniche di regressione se lavori con un intervallo di dati o se la natura della tua risposta è un numero reale, per esempio la temperatura o il tempo rimanente al verificarsi di un guasto di un’attrezzatura.
Apprendimento senza supervisione
L’apprendimento senza supervisione individua pattern nascosti o strutture intrinseche nei dati. Viene utilizzato per fare deduzioni da set di dati che includono dati di input senza risposte etichettate.
Il clustering è la tecnica di apprendimento senza supervisione più comune. Viene utilizzata nell’analisi esplorativa di dati per individuare pattern nascosti o raggruppamenti nei dati. Tra le applicazioni dell’analisi cluster figurano l’analisi della sequenza genetica, le ricerche di mercato e il riconoscimento di oggetti.
Per esempio, se una società di telefonia cellulare desidera ottimizzare le posizioni di installazione delle sue antenne, può utilizzare il machine learning per stimare il numero di cluster di persone che si collegano alle sue antenne. Un telefono può collegarsi con una sola antenna alla volta, per cui il team utilizza gli algoritmi di clustering per progettare la migliore posizione delle antenne per cellulari in modo da ottimizzare la ricezione del segnale per gruppi, o cluster, di clienti.
Figura 2: Il clustering individua i pattern nascosti nei dati.
Come decidere quale algoritmo utilizzare?
La scelta dell’algoritmo giusto può sembrare un arduo compito, dal momento che esistono decine di algoritmi di machine learning con e senza supervisione e ognuno di essi utilizza un diverso approccio di apprendimento.
Non esiste un metodo migliore, né un metodo che valga per tutti. In parte, la ricerca del giusto algoritmo viene fatta per tentativi ed errori; neppure i data scientist più esperti sono in grado di dire se un algoritmo possa funzionare o meno senza averlo testato. Ma la scelta dell’algoritmo dipende anche dal formato e dal tipo di dati utilizzati, dalle informazioni che si desidera ottenere dai dati e da come queste informazioni verranno utilizzate.
Figura 3. Tecniche di machine learning.
Ecco alcune linee guida per la scelta tra l'approccio con supervisione e senza supervisione:
- Scegli l’apprendimento con supervisione se desideri addestrare un modello per fare una previsione (per esempio, il valore futuro di una variabile continua, come la temperatura o il prezzo di un’azione) o una classificazione (per esempio, identificare la marca di un’automobile dal filmato di una webcam).
- Scegli l’apprendimento senza supervisione se desideri analizzare i tuoi dati e addestrare un modello per trovare una buona rappresentazione interna, per esempio suddividendo i dati in cluster.
Keep Exploring This Topic
Perché il machine learning è importante
Con l’aumento dei big data, l'apprendimento automatico è diventato una tecnica fondamentale per la risoluzione di problemi in diversi settori, tra cui:
Automobilistico
Aerospazio e difesa
Automazione industriale e macchinari
Dispositivi medicali
Elaborazione di segnali
Più dati, più domande, migliori risposte
Gli algoritmi di machine learning individuano nei dati i pattern naturali da cui estrarre informazioni ed effettuare migliori previsioni. Essi vengono utilizzati quotidianamente per prendere decisioni importanti nelle diagnosi mediche, nel mercato azionario, nella previsione del carico energetico e altro ancora. Per esempio, i siti multimediali si basano sul machine learning per esaminare milioni di opzioni e fornire agli utenti consigli su canzoni o film. I venditori al dettaglio utilizzano questo approccio per analizzare il comportamento di acquisto dei clienti.
Quando è necessario utilizzare il machine learning?
L’uso dell'apprendimento automatico è consigliato in caso di attività o problemi complessi che implicano l’utilizzo di una grande quantità di dati e molte variabili e se non si dispone di formule o equazioni. Per esempio, questa tecnica è una buona opzione per gestire situazioni come queste:
What's the Difference Between Machine Learning and Deep Learning?
Deep learning is a specialized form of machine learning. A machine learning workflow starts with relevant features being manually extracted from images. The features are then used to create a model that categorizes the objects in the image. With a deep learning workflow, relevant features are automatically extracted from images. In addition, deep learning performs “end-to-end learning” – where a network is given raw data and a task to perform, such as classification, and it learns how to do this automatically.
Figure 4. Comparing approaches to categorizing vehicles using machine learning (left) and deep learning (right).
In machine learning, you manually choose features and a classifier to sort images. With deep learning, feature extraction and modeling steps are automatic.
Choosing Between Machine Learning and Deep Learning
Machine learning offers a variety of techniques and models you can choose based on your application, the size of data you're processing, and the type of problem you want to solve. A successful deep learning application requires a very large amount of data (thousands of images) to train the model, as well as GPUs, or graphics processing units, to rapidly process your data.
When choosing between machine learning and deep learning, consider whether you have a high-performance GPU and lots of labeled data. If you don’t have either of those things, it may make more sense to use machine learning instead of deep learning. Deep learning is generally more complex, so you’ll need at least a few thousand images to get reliable results.
If you choose machine learning, you have the option to train your model on many different classifiers. You may also know which features to extract that will produce the best results. Plus, you also have the flexibility to choose a combination of approaches, use different classifiers and features to see which arrangement works best for your data.
Keep Exploring This Topic
Machine Learning con MATLAB
Come si può sfruttare l’efficienza del machine learning per utilizzare i dati e prendere decisioni migliori? Grazie agli strumenti e alle funzioni per la gestione dei big data, MATLAB è un ambiente ideale per l’applicazione del machine learning all’analisi dei dati.
MATLAB garantisce a progettisti e data scientist l’accesso immediato a funzioni predefinite, a un’ampia scelta di toolbox e app specializzate per la classificazione, la regressione e il clustering.
MATLAB consente di:
- Confrontare approcci quali la regressione logistica, gli alberi di classificazione, le support vector machine, i metodi di ensemble e il deep learning.
- Utilizzare le tecniche di affinamento e riduzione dei modelli per creare un modello preciso in grado di sfruttare al meglio il potere predittivo dei tuoi dati.
- Integrare i modelli di machine learning nei sistemi enterprise, nei cluster e nei cloud, e utilizzare i modelli per hardware embedded in real time.
- Eseguire la generazione di codice automatica per l’analisi di sensori embedded.
- Supportare i flussi di lavoro integrati, dall’analisi dei dati alla distribuzione.
Keep Exploring This Topic
MATLAB per il Machine Learning
Learn about MATLAB support for machine learning.
Tutorial ed esempi
Get started with MATLAB for machine learning.
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list:
How to Get Best Site Performance
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Americas
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)
Asia Pacific
- Australia (English)
- India (English)
- New Zealand (English)
- 中国
- 日本Japanese (日本語)
- 한국Korean (한국어)