Passa ai contenuti principali

Ottimizzazione e reti neurali

Le reti neurali sono diventate uno degli strumenti più usati ed inflazionati per risolvere una grande varietà di problemi che ricadono sotto l’etichetta generalista machine learning.
Una grande varietà di supporti tecnologici sono stati sviluppati per garantire l’adozione delle reti neurali in contesti sempre più ampi. Senza nulla togliere agli altri, le prime due tecnologie che mi vengono in mente sono TensorFlow e le TPU.

Senza andare nello specifico, voglio far notare che alla base di ogni modello di rete neurale esiste un processo di addestramento. Questo ha lo scopo di determinare i pesi migliori dei neuroni della rete da addestrare mediante l’analisi di un numero potenzialmente grande di “scenari d’esempio”. 
Questi processi di addestramento non sono altro che modelli di ottimizzazione, disegnati per trovare i pesi dei neuroni che minimizzano la distanza tra l’output complessivo della rete e il risultato atteso, per tutti gli scenari d’esempio.

E’ per questo motivo che si stanno formano figure professionali specifiche e specializzate in optimization for machine learning

Ad esempio, la struttura dei problemi da ottimizzare è detta sparsa, perché ogni variabile di input e in relazione con poche altre variabili di input. Inoltre il concetto di vicinanza tra l’output ottenuto e quello atteso si esprime con metriche articolate, in due o più variabili, formando le così dette funzioni multi-obiettivo. Infine, agli scenari d’esempio è possibili attribuire una probabilità di accadimento, portando alla formulazione di problemi di ottimizzazione stocastica.

Commenti

Post popolari in questo blog

Digital Twin – Il caso Hyperloop

  Con il termine  hyperloop  si identificano una serie di tecnologie che promettono di rivoluzionare il trasporto di persone e cose. L’idea di base è molto semplice: far viaggiare all’interno di tubi, dove viene creato il vuoto, delle capsule ad alta velocità con binari a levitazione magnetica.   Credits: Virgin Hyperloop on instagram.com/p/CRHEB9ctQ6u/   Qualche tempo fa, mi è capitato di leggere un interessante articolo su come la progettazione della soluzione guidata dal gruppo Virgin, sia stata affiancata da analisi svolte mediante un sistema di ottimizzazione matematica. Come meglio descritto nel seguito, un digital twin, completamente basato su un modello matematico di ottimizzazione, permette di valutare le migliori scelte progettuali tenendo in considerazione i vari obiettivi di progetto.   La necessità di avere un digital twin nasce probabilmente dal fatto che le tecnologie  hyperloop  non hanno una base di partenza già esistente. No...

La programmazione dichiarativa come sistema di intelligenza artificiale

Sull'intelligenza artificiale si è creato un grosso equivoco, che vale la pena risolvere. https://www.instagram.com/p/BwyfskdnV7a/ Senza voler essere formali, l’accezione comune di intelligenza artificiale è usata per identificare un sistema informatico basato su reti neurali usato per risolvere problemi di  difficile formalizzazione . Ad esempio, le auto a guida autonoma, i sistemi di traduzione in tempo reale, la previsione dei prezzi dell’energia. Per  difficile formalizzazione  intendo un concetto molto sottile. Scrivere un algoritmo che sia in grado di riconoscere l’immagine di un gattino è molto difficile se non impossibile. Mentre, in maniera paradossale, è più semplice scrivere un algoritmo che  impari  a riconoscere gattini perché è stato addestrato con le immagini di mille diversi gattini. Cablare ed addestrare una rete neurale che riconosca gattini è un esempio di  meta-programmazione , proprio perché non si scrive un algoritmo che ca...

PuLP – Un valido strumento per la didattica

L'insegnamento dei concetti di base della ricerca operativa, ovvero la programmazione lineare, ha trovato nel corso degli ultimi anni diversi strumenti di supporto. Sono ormai parecchi i software gratuiti e open source che permettono agli studenti e agli insegnanti di toccare con mano le nozioni e i concetti spiegati e studiati sui banchi. Ricordiamo, ad esempio, glpk che con il suoi linguaggio di modellazione MathProg permettete di scrivere e risolvere anche complessi modelli di programmazione lineare intera. Oppure citiamo anche lp_solve che con il suo ambiente impropriamente chiamato lp_solve IDE permette di scrivere e risolvere modelli di programmazione lineare direttamente nella formulazione matematica. A mio avviso però le proposte appena citate sono limitate nella potenza espressiva e nelle capacità di integrarsi con altri software o moduli esterni. Queste limitazioni sono egregiamente risolte da PuLP : un modellatore di problemi di programmazione lineare intera basato ...