Che cos'è un algoritmo di machine learning?

Che cos'è un algoritmo di machine learning?

Un algoritmo di machine learning è un insieme di regole o processi utilizzati da un sistema AI per eseguire compiti: il più delle volte per riconoscere nuovi insight e schemi nei dati o per prevedere valori di output da un determinato insieme di variabili di input. Gli algoritmi consentono al machine learning (ML) di apprendere.

Gli analisti del settore concordano sull'importanza del machine learning e degli algoritmi sottostanti. Secondo Forrester, "i progressi negli algoritmi di machine learning apportano precisione e profondità all'analisi dei dati di marketing che aiutano gli esperti a capire in che modo i dettagli di marketing (come la piattaforma, la creatività, l'invito all'azione o la messaggistica) influiscono sulle prestazioni di marketing".1 Mentre Gartner afferma che "il machine learning è al centro di molte applicazioni di AI di successo, alimentandone l’enorme trazione nel mercato".2

Molto spesso, l'addestramento degli algoritmi di machine learning (ML) su un maggior numero di dati fornisce risposte più accurate rispetto all'addestramento su un numero di dati inferiore. Utilizzando metodi statistici, gli algoritmi vengono addestrati a determinare classificazioni o fare previsioni e a rilevare insight fondamentali nei progetti di data mining. Questi insight possono successivamente migliorare il processo decisionale per aumentare le metriche di crescita chiave.

I casi d'uso degli algoritmi di machine learning includono la capacità di analizzare i dati per identificare tendenze e prevedere i problemi prima che si verifichino.3 Un'AI più avanzata può consentire un supporto più personalizzato, ridurre i tempi di risposta, fornire funzionalità di riconoscimento vocale e migliorare la soddisfazione dei clienti. I settori che traggono particolare vantaggio dagli algoritmi di machine learning per creare nuovi contenuti da grandi quantità di dati includono il supply chain management, i trasporti e la logistica, il retail e la produzione4; tutti adottano l'AI generativa, con la sua capacità di automatizzare i compiti, migliorare l'efficienza e fornire insight preziosi, anche ai principianti.

Design 3D di palline che rotolano su una pista

Le ultime notizie e insight sull'AI


Scopri notizie e insight selezionati da esperti in materia di AI, cloud e molto altro nella newsletter settimanale Think. 

Deep Learning

Il deep learning è un'applicazione specifica delle funzioni avanzate fornite dagli algoritmi di machine learning. La differenza è nel modo in cui ogni algoritmo apprende. I modelli di machine learning "profondo" possono utilizzare i set di dati etichettati, noti anche come apprendimento supervisionato, per informarne l'algoritmo, ma non richiedono necessariamente dati etichettati. Il deep learning può acquisire dati non strutturati nella loro forma non elaborata (come testo o immagini) e può determinare automaticamente l'insieme di funzioni che distinguono le diverse categorie di dati l'una dall'altra. Ciò elimina parte dell’intervento umano richiesto e consente l’uso di set di dati più grandi.

Il modo più semplice di comprendere l'intelligenza artificiale, il machine learning, il deep learning e le reti neurali è pensarli come una serie di sistemi di AI dal più grande al più piccolo, ognuno dei quali comprende il successivo. L’intelligenza artificiale (AI) è il sistema generale. Il machine learning è un sottoinsieme dell'AI. Il deep learning è un sottocampo del machine learning e le reti neurali costituiscono la spina dorsale degli algoritmi di deep learning. È il numero di livelli di nodi, o profondità, delle reti neurali a distinguere una singola rete neurale da un algoritmo di deep learning, che deve averne più di tre.

Mixture of Experts | 25 aprile, episodio 52

Decoding AI: Weekly News Roundup

Unisciti al nostro gruppo di livello mondiale di ingegneri, ricercatori, leader di prodotto e molti altri mentre si fanno strada nell'enorme quantità di informazioni sull'AI per darti le ultime notizie e gli ultimi insight sull'argomento.

Come funzionano gli algoritmi di machine learning

Un documento della UC Berkeley suddivide il sistema di apprendimento di un algoritmo di machine learning in tre parti principali.5

  1. Un processo decisionale: in generale, gli algoritmi di machine learning vengono utilizzati per fare previsioni o classificazioni. In base ad alcuni dati di input, che possono essere etichettati o non etichettati, l'algoritmo produrrà una stima di un modello nei dati.

  2. Una funzione di errore: una funzione di errore valuta la previsione del modello. Se ci sono esempi noti, una funzione di errore può effettuare un confronto per valutare l'accuratezza del modello.

3.   Un processo di ottimizzazione del modello: se il modello può adattarsi meglio ai punti dati nel set di addestramento, i pesi vengono regolati per ridurre la discrepanza tra l'esempio noto e la stima del modello. L'algoritmo ripeterà questo processo di "valutazione e ottimizzazione", aggiornando autonomamente i pesi fino al raggiungimento di una soglia di accuratezza.

L'apprendimento supervisionato, in particolare, utilizza un set di addestramento per insegnare ai modelli a produrre l'output desiderato. Questo set di dati di addestramento include input e output corretti, che consentono al modello di apprendere nel tempo. L'algoritmo misura la sua precisione attraverso la funzione di perdita, regolandosi fino a quando l'errore non è stato sufficientemente ridotto.

Tipi di algoritmi di machine learning

Esistono quattro tipi di algoritmi di machine learning: supervisionati, non supervisionati, semi-supervisionati e di rinforzo. A seconda del budget, della velocità e della precisione richieste, ogni tipo e variante presenta i propri vantaggi. Gli algoritmi avanzati di machine learning richiedono più tecnologie, tra cui il deep learning, le reti neurali e l'elaborazione del linguaggio naturale, e sono in grado di utilizzare sia l'apprendimento non supervisionato che quello supervisionato.6 Di seguito sono riportati gli algoritmi più diffusi e comunemente usati.

Algoritmi di apprendimento supervisionati

L'apprendimento supervisionato può essere suddiviso in due tipi di problemi durante il data mining: classificazione e regressione.

  • La classificazione utilizza un algoritmo per assegnare con precisione i dati dei test in categorie specifiche. Riconosce entità specifiche all'interno del set di dati e tenta di trarre alcune conclusioni su come tali entità devono essere etichettate o definite. Gli algoritmi di classificazione comuni sono classificatori lineari, macchine a vettori di supporto (SVM), alberi decisionali, K-nearest neighbor e foresta casuale, descritti in dettaglio di seguito.
  • La regressione viene utilizzata per comprendere la relazione tra variabili dipendenti e indipendenti. Viene comunemente utilizzata per elaborare proiezioni, ad esempio i ricavi delle vendite per una determinata azienda. La regressione lineare, la regressione logistica e la regressione polinomiale sono algoritmi di regressione diffusi.

Vari algoritmi e tecniche di calcolo sono utilizzati nei processi di machine learning supervisionato, spesso calcolati attraverso l'uso di programmi come Python. Gli algoritmi di apprendimento supervisionati includono:

  • AdaBoost o gradient boosting: chiamato anche adaptive boosting7, questa tecnica potenzia un algoritmo di regressione poco performante combinandolo con alcuni più deboli per creare un algoritmo più potente che produca meno errori. Il boosting combina il potere di previsione di diversi stimatori di base.
  • Reti neurali artificiali: note anche come ANN, reti neurali o reti neurali simulate (SNN), sono un sottoinsieme di tecniche di machine learning e sono al centro degli algoritmi di deep learning. L’algoritmo di apprendimento riconosce schemi nei dati di input utilizzando elementi costitutivi chiamati neuroni, simili ai neuroni del cervello umano, che vengono addestrati e modificati nel tempo. (Maggiori informazioni in "reti neurali".)
  • Algoritmi ad albero decisionale: utilizzati sia per prevedere valori numerici (problemi di regressione) che per classificare i dati in categorie, gli alberi decisionali utilizzano una sequenza di ramificazione di decisioni collegate che possono essere rappresentate con un diagramma ad albero. Uno dei vantaggi degli alberi decisionali è che sono facili da convalidare e verificare, a differenza della black box di una rete neurale.
  • Riduzione della dimensionalità: quando un set di dati selezionato ha un numero elevato di funzioni7 , ha un'elevata dimensionalità. La riduzione della dimensionalità riduce quindi il numero di funzioni, lasciando solo gli insight o le informazioni più significative. Un esempio è l'analisi delle componenti principali.
  • K-nearest neighbor: noto anche come KNN, questo algoritmo non parametrico classifica i punti dati in base alla loro prossimità e associazione ad altri dati disponibili. Presuppone che punti dati simili possano essere trovati uno vicino all'altro. Di conseguenza, cerca di calcolare la distanza tra i punti dati, solitamente attraverso la distanza euclidea, e quindi assegna una categoria in base alla categoria o alla media più frequente.
  • Regressione lineare: la regressione lineare viene utilizzata per identificare la relazione tra una variabile dipendente e una o più variabili indipendenti ed è generalmente utilizzata per fare previsioni sui risultati futuri. Quando c'è una sola variabile indipendente e una sola variabile dipendente, si parla di regressione lineare semplice.
  • Regressione logistica: sebbene la regressione lineare sia impiegata quando le variabili dipendenti sono continue, la regressione logistica viene selezionata quando la variabile dipendente è categorica, il che significa che ci sono output binari, come "true" e "false" o "yes" e "no". Mentre entrambi i modelli di regressione cercano di comprendere le relazioni tra gli input di dati, la regressione logistica viene utilizzata principalmente per risolvere problemi di classificazione binaria, ad esempio l'identificazione dello spam.
  • Reti neurali: utilizzate principalmente per algoritmi di deep learning, le reti neurali elaborano i dati di addestramento di input imitando l'interconnessione del cervello umano attraverso strati di nodi. Ciascun nodo è costituito da input, pesi, distorsioni (soglia) e output. Se il valore di output supera una determinata soglia, "innesca" o attiva il nodo, passando i dati al livello successivo della rete. Le reti neurali imparano dalle regolazioni in base alla funzione di perdita attraverso il processo di discesa del gradiente. Quando la funzione di costo è pari o prossima allo zero, puoi avere la certezza della precisione del modello.
  • Naïve Bayes: questo approccio adotta il principio dell'indipendenza condizionale di classe del teorema di Bayes. Ciò significa che la presenza di una caratteristica non influisce sulla presenza di un'altra nella probabilità di un determinato risultato e ogni predittore ha un effetto uguale su quel risultato. Esistono tre tipi di classificatori Naïve Bayes: Naïve Bayes Multinomiale, Naïve Bayes Bernoulli e Naïve Bayes Gaussiano. Questa tecnica viene utilizzata principalmente nella classificazione dei testi, nell'identificazione dello spam e nei sistemi di raccomandazione.
  • Foreste casuali: in una foresta casuale, l'algoritmo di machine learning prevede un valore o una categoria combinando i risultati da una serie di alberi decisionali. La "foresta" si riferisce ad alberi decisionali non correlati, che vengono assemblati per ridurre la varianza e consentire previsioni più accurate.
  • Macchine a vettori di supporto (SVM): questo algoritmo può essere utilizzato sia per la classificazione dei dati che per la regressione, ma solitamente viene utilizzato per problemi di classificazione, creando un piano ipertestuale in cui la distanza tra due classi di punti dati è al massimo. Questo iperpiano è noto come confine decisionale, che separa le classi di punti dati (come arance e mele) su entrambi i lati del piano.

Algoritmi di apprendimento non supervisionati

A differenza dell'apprendimento supervisionato, l'apprendimento non supervisionato utilizza dati non etichettati. Da questi dati, l'algoritmo riconosce schemi che aiutano a risolvere problemi di clustering o associazione. Ciò è particolarmente utile quando gli esperti del settore non sono sicuri delle proprietà comuni all'interno di un set di dati. Gli algoritmi di clustering più comuni sono quelli gerarchici, K-means, Gaussian Mixture Models e i metodi di riduzione della dimensionalità come PCA e t-SNE.

  • Clustering: questi algoritmi possono riconoscere schemi nei dati in modo che possano essere raggruppati. Gli algoritmi possono aiutare i data scientist identificando le differenze tra gli elementi di dati che gli esseri umani hanno trascurato.
  • Clustering gerarchico: consente di raggruppare i dati in un albero di cluster8. Il clustering gerarchico inizia considerando ogni punto dati come un cluster separato. Quindi, esegue ripetutamente questi passaggi: 1) identifica i due cluster che possono essere più vicini tra loro e 2) unisce i due cluster più simili tra loro. Questi passaggi continuano fino a quando tutti i cluster non vengono uniti.
  • K-means clustering: identifica i gruppi all'interno dei dati senza etichette in cluster diversi trovando gruppi di dati simili l'uno all'altro. Il nome "K-means" deriva dai centroidi utilizzati per definire i cluster. Un punto viene assegnato a un cluster specifico se è più vicino al centroide di quel cluster rispetto a qualsiasi altro centroide.

Algoritmi di apprendimento semi-supervisionati

In questo caso, l'apprendimento avviene quando solo una parte dei dati di input è stata etichettata, dando all'algoritmo un po' di "vantaggio". Questo approccio può combinare il meglio di entrambi i mondi10: una maggiore precisione associata al machine learning supervisionato e la capacità di utilizzare dati non etichettati a costi contenuti, come nel caso del machine learning non supervisionato.

Algoritmi di rinforzo

In questo caso, gli algoritmi vengono addestrati proprio come gli esseri umani - attraverso ricompense e penalità - che vengono misurate e monitorate da un agente di apprendimento perrinforzo11 che ha una comprensione generale della probabilità di far salire o scendere il punteggio. Attraverso tentativi ed errori, l'agente impara a intraprendere azioni che portano ai risultati più favorevoli nel tempo. L'apprendimento per rinforzo è spesso utilizzato12  nella gestione delle risorse, nella robotica e nei videogiochi.

Soluzioni correlate
IBM watsonx.ai

Addestra, convalida, adatta e implementa le funzionalità di AI generativa, foundation model e machine learning con IBM watsonx.ai, uno studio aziendale di nuova generazione per builder AI. Crea applicazioni AI in tempi ridotti e una minima quantità di dati.

Scopri watsonx.ai
Soluzioni di intelligenza artificiale

Metti l'AI al servizio della tua azienda con l'esperienza leader di settore e il portfolio di soluzioni di IBM nel campo dell'AI.

Esplora le soluzioni AI
Consulenza e servizi sull'AI

Reinventa i flussi di lavoro e le operazioni critiche aggiungendo l'AI per massimizzare le esperienze, il processo decisionale in tempo reale e il valore di business.

Esplora i servizi AI
Fai il passo successivo

Ottieni l'accesso completo a funzionalità che coprono l'intero ciclo di vita dello sviluppo dell'AI. Crea soluzioni AI all'avanguardia con interfacce intuitive, workflow e accesso alle API e agli SDK standard di settore.

Esplora watsonx.ai Prenota una demo live
  翻译: