Un algoritmo di machine learning è un insieme di regole o processi utilizzati da un sistema AI per eseguire compiti: il più delle volte per riconoscere nuovi insight e schemi nei dati o per prevedere valori di output da un determinato insieme di variabili di input. Gli algoritmi consentono al machine learning (ML) di apprendere.
Gli analisti del settore concordano sull'importanza del machine learning e degli algoritmi sottostanti. Secondo Forrester, "i progressi negli algoritmi di machine learning apportano precisione e profondità all'analisi dei dati di marketing che aiutano gli esperti a capire in che modo i dettagli di marketing (come la piattaforma, la creatività, l'invito all'azione o la messaggistica) influiscono sulle prestazioni di marketing".1 Mentre Gartner afferma che "il machine learning è al centro di molte applicazioni di AI di successo, alimentandone l’enorme trazione nel mercato".2
Molto spesso, l'addestramento degli algoritmi di machine learning (ML) su un maggior numero di dati fornisce risposte più accurate rispetto all'addestramento su un numero di dati inferiore. Utilizzando metodi statistici, gli algoritmi vengono addestrati a determinare classificazioni o fare previsioni e a rilevare insight fondamentali nei progetti di data mining. Questi insight possono successivamente migliorare il processo decisionale per aumentare le metriche di crescita chiave.
I casi d'uso degli algoritmi di machine learning includono la capacità di analizzare i dati per identificare tendenze e prevedere i problemi prima che si verifichino.3 Un'AI più avanzata può consentire un supporto più personalizzato, ridurre i tempi di risposta, fornire funzionalità di riconoscimento vocale e migliorare la soddisfazione dei clienti. I settori che traggono particolare vantaggio dagli algoritmi di machine learning per creare nuovi contenuti da grandi quantità di dati includono il supply chain management, i trasporti e la logistica, il retail e la produzione4; tutti adottano l'AI generativa, con la sua capacità di automatizzare i compiti, migliorare l'efficienza e fornire insight preziosi, anche ai principianti.
Il deep learning è un'applicazione specifica delle funzioni avanzate fornite dagli algoritmi di machine learning. La differenza è nel modo in cui ogni algoritmo apprende. I modelli di machine learning "profondo" possono utilizzare i set di dati etichettati, noti anche come apprendimento supervisionato, per informarne l'algoritmo, ma non richiedono necessariamente dati etichettati. Il deep learning può acquisire dati non strutturati nella loro forma non elaborata (come testo o immagini) e può determinare automaticamente l'insieme di funzioni che distinguono le diverse categorie di dati l'una dall'altra. Ciò elimina parte dell’intervento umano richiesto e consente l’uso di set di dati più grandi.
Il modo più semplice di comprendere l'intelligenza artificiale, il machine learning, il deep learning e le reti neurali è pensarli come una serie di sistemi di AI dal più grande al più piccolo, ognuno dei quali comprende il successivo. L’intelligenza artificiale (AI) è il sistema generale. Il machine learning è un sottoinsieme dell'AI. Il deep learning è un sottocampo del machine learning e le reti neurali costituiscono la spina dorsale degli algoritmi di deep learning. È il numero di livelli di nodi, o profondità, delle reti neurali a distinguere una singola rete neurale da un algoritmo di deep learning, che deve averne più di tre.
Un documento della UC Berkeley suddivide il sistema di apprendimento di un algoritmo di machine learning in tre parti principali.5
3. Un processo di ottimizzazione del modello: se il modello può adattarsi meglio ai punti dati nel set di addestramento, i pesi vengono regolati per ridurre la discrepanza tra l'esempio noto e la stima del modello. L'algoritmo ripeterà questo processo di "valutazione e ottimizzazione", aggiornando autonomamente i pesi fino al raggiungimento di una soglia di accuratezza.
L'apprendimento supervisionato, in particolare, utilizza un set di addestramento per insegnare ai modelli a produrre l'output desiderato. Questo set di dati di addestramento include input e output corretti, che consentono al modello di apprendere nel tempo. L'algoritmo misura la sua precisione attraverso la funzione di perdita, regolandosi fino a quando l'errore non è stato sufficientemente ridotto.
Esistono quattro tipi di algoritmi di machine learning: supervisionati, non supervisionati, semi-supervisionati e di rinforzo. A seconda del budget, della velocità e della precisione richieste, ogni tipo e variante presenta i propri vantaggi. Gli algoritmi avanzati di machine learning richiedono più tecnologie, tra cui il deep learning, le reti neurali e l'elaborazione del linguaggio naturale, e sono in grado di utilizzare sia l'apprendimento non supervisionato che quello supervisionato.6 Di seguito sono riportati gli algoritmi più diffusi e comunemente usati.
L'apprendimento supervisionato può essere suddiviso in due tipi di problemi durante il data mining: classificazione e regressione.
Vari algoritmi e tecniche di calcolo sono utilizzati nei processi di machine learning supervisionato, spesso calcolati attraverso l'uso di programmi come Python. Gli algoritmi di apprendimento supervisionati includono:
A differenza dell'apprendimento supervisionato, l'apprendimento non supervisionato utilizza dati non etichettati. Da questi dati, l'algoritmo riconosce schemi che aiutano a risolvere problemi di clustering o associazione. Ciò è particolarmente utile quando gli esperti del settore non sono sicuri delle proprietà comuni all'interno di un set di dati. Gli algoritmi di clustering più comuni sono quelli gerarchici, K-means, Gaussian Mixture Models e i metodi di riduzione della dimensionalità come PCA e t-SNE.
Algoritmi di apprendimento semi-supervisionati
In questo caso, l'apprendimento avviene quando solo una parte dei dati di input è stata etichettata, dando all'algoritmo un po' di "vantaggio". Questo approccio può combinare il meglio di entrambi i mondi10: una maggiore precisione associata al machine learning supervisionato e la capacità di utilizzare dati non etichettati a costi contenuti, come nel caso del machine learning non supervisionato.
Algoritmi di rinforzo
In questo caso, gli algoritmi vengono addestrati proprio come gli esseri umani - attraverso ricompense e penalità - che vengono misurate e monitorate da un agente di apprendimento perrinforzo11 che ha una comprensione generale della probabilità di far salire o scendere il punteggio. Attraverso tentativi ed errori, l'agente impara a intraprendere azioni che portano ai risultati più favorevoli nel tempo. L'apprendimento per rinforzo è spesso utilizzato12 nella gestione delle risorse, nella robotica e nei videogiochi.