Deep learning
Il deep machine learning, o più brevemente deep learning, è il futuro dell’intelligenza artificiale usata nelle macchine che affrontano problemi tipici dell’intelligenza umana, come pianificare, comprendere linguaggi verbali, riconoscere immagini e suoni, apprendere, definire e risolvere problemi. Il deep learning scende in profondità per emulare i meccanismi di apprendimento degli umani, automatizzando analisi e previsioni.
Il machine learning, di cui fa parte il deep learning, si serve delle reti neurali per analizzare grandi quantità di dati, semplificarli, apprendere dalle decisioni sbagliate, che riconosce e corregge man mano che lavora, tratta sempre più dati, acquisisce più esempi ed esamina più casi. Il deep learning, formato da un insieme di hardware e software, addestra automaticamente le reti neurali e le rende capaci di imparare a gestire gli input, a costruire modelli via via più complessi, a fare previsioni sempre più accurate, e infine a risolvere problemi con maggiore efficienza.
Una rete neurale analizza le informazioni che riceve, le aggrega in pacchetti, ne estrae le proprietà che le permettono di apprendere, e che finora erano selezionate e proposte come modelli da interventi umani. Il deep learning rimuove l’intervento umano e rende le reti neurali più generaliste e meno mirate, e quindi più capaci di adattarsi a problemi nuovi.
L’apprendimento strutturato profondo, o apprendimento gerarchico, usa algoritmi di assimilazione e rappresentazione dei dati, invece degli algoritmi che eseguono compiti assegnati. La capacità di pensare e apprendere aumenta con la quantità crescente di dati e algoritmi che si accumula nel tempo, e le reti neurali diventano sempre più abili nell’autoaddestrarsi e apprendere in modo indipendente.
Con il termine profondo (deep) si intende una struttura di apprendimento a più livelli, dalle informazioni brute e particolari fino ai concetti più alti e generali. I livelli intermedi sono nascosti, e possono essere anche più di cento. I nodi delle reti neurali sono disposti su diversi livelli di profondità, in cui i neuroni dei livelli inferiori contribuiscono alla formazione di nuove rappresentazioni di dati più precise e complesse nei livelli superiori. Gli output dei livelli intermedi sono ignoti, e servono solo come input per i livelli superiori, fino ad arrivare agli output finali, che costituiscono i risultati del processo di problem solving richiesto alla macchina.
La struttura è piramidale, perché da una larga base di dati si restringe fino ad arrivare a poche risposte. L’elaborazione non è lineare, ma si articola a cascata lungo gli strati i cui output fanno da input agli strati successivi, classifica dati in entrata e in uscita, estrae quelli che servono e scarta gli altri, li miscela e li trasforma, apprende e perfeziona funzionalità sempre più complesse.
Per esempio, nel riconoscimento visivo dei pattern, i neuroni del primo strato possono imparare a riconoscere i bordi, i neuroni nel secondo strato possono imparare a riconoscere forme forti come triangoli o rettangoli, e gli strati successivi possono riconoscere forme sempre più articolate e complesse, fino alle forme frattali e fluide. Ad ogni livello intermedio si aggiungono informazioni e analisi utili a fornire un output affidabile. Più sono i livelli di astrazione, più la macchina ha una grande capacità di apprendimento. La macchina non viene più programmata a svolgere compiti, ma addestrata ad apprendere e risolvere problemi.
Il deep learning impara con l’enorme mole di dati fornita dai sensori dell’IoT (internet of things), che a loro volta sono controllati da dispositivi di intelligenza artificiale, in un circolo virtuoso che sta cambiando il nostro mondo, per rendere più semplice e intuitiva l’interazione umana con la realtà che lo circonda.
Il deep learning serve a riconoscere immagini e suoni, e quindi alla guida automatica di veicoli, alla diagnostica medica, al controllo di qualità nelle catene di montaggio, all’analisi dei flussi comunicativi dei social network, al riconoscimento delle lingue parlate e delle voci, alla microbioinformatica.