Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Machine learning: a cosa servono

74 views

Published on

I campi di utilizzo delle machine learning

Published in: Education
  • Be the first to comment

  • Be the first to like this

Machine learning: a cosa servono

  1. 1. Machine Learning: a cosa servono?
  2. 2. A cosa servono le Machine Learning? mario.gentili@mariogentili.it 2 analisi automatica di BIG DATA Esistono solo cinque domande a cui l’analisi scientifica dei dati risponde: 1. È A o B? 2. È strano? 3. In che quantità o in che numero? 4. In che modo sono organizzati i dati? 5. Qual è il prossimo passo da compiere? La risposta a ciascuna di queste domande viene fornita da una particolare famiglia o tipologie di reti artificiali o algoritmi. È utile pensare a un algoritmo come una ricetta e ai dati come gli ingredienti. Un algoritmo specifica come combinare e mettere insieme i dati per ottenere una risposta. I computer sono simili ai frullatori. Svolgono la maggior parte del lavoro più impegnativo dell’algoritmo per l’utente e lo fanno in modo molto veloce.
  3. 3. A o B (o C)? mario.gentili@mariogentili.it 3 Questa famiglia di algoritmi viene detta classificazione a due classi. È utile per qualsiasi domanda che può avere solo due risposte possibili. Ad esempio: • sarà possibile percorrere i prossimi 1.000 km con questi pneumatici: Sì o No? • cosa porta più clienti: un buono sconto da 5 € o uno sconto del 25% sul prodotto? Questa domanda può anche essere riformulata per includere più di due opzioni: È A o B o C o D e così via? Si tratta in questo caso della classificazione multiclasse ed è utile quando sono possibili più risposte o diverse migliaia di risposte.
  4. 4. È strano? mario.gentili@mariogentili.it 4 A questa domanda risponde una famiglia di algoritmi detta rilevamento delle anomalie. Ad esempio, una banca che rilascia una carta di credito analizza i modelli di acquisto, in modo tale da avvisare gli utenti di possibili episodi di frodi. Addebiti "strani" potrebbero essere acquisti presso un negozio in cui non si effettuano compere abitualmente o acquisti di articoli eccezionalmente costosi. Questa domanda può essere utile in molti modi. Ad esempio: • se si guida un’auto con manometri, ci si potrebbe chiedere: Questo manometro funziona normalmente? • se si tiene sotto controllo Internet ci si potrebbe chiedere: Questo messaggio è tipico di Internet? Il rilevamento delle anomalie segnala eventi o comportamenti imprevisti o insoliti.
  5. 5. Quanto? mario.gentili@mariogentili.it 5 La famiglia di algoritmi che risponde a questa domanda è detta regressione. Gli algoritmi di regressione effettuano previsioni numeriche, ad esempio: • Quale sarà la temperatura martedì prossimo? • Come andrà il quarto trimestre di vendite? Aiutano a rispondere a qualsiasi domanda che richiede informazioni numeriche.
  6. 6. In che modo sono organizzati i dati? mario.gentili@mariogentili.it 6 Per questa domanda, non ci sono esempi per cui si conoscono già i risultati. Esistono diversi modi per comprendere la struttura dei dati. Un approccio è il clustering. Separa i dati in "gruppi" naturali per un’interpretazione più semplice. Con il clustering non vi è un’unica risposta corretta. Esempi comuni di domande di clustering sono: • a quali spettatori piacciono gli stessi tipi di film? • quali modelli di stampanti condividono lo stesso malfunzionamento? Riuscendo a capire come sono organizzati i dati, è possibile comprendere meglio, e prevedere, comportamenti ed eventi.
  7. 7. Quali sono i prossimi passi da compiere? mario.gentili@mariogentili.it 7 Si usa una famiglia di algoritmi detta apprendimento per rinforzo (Paplov). L’apprendimento per rinforzo è stato ispirato dal modo in cui il cervello di topi ed esseri umani risponde alle punizioni e alle ricompense. Questi algoritmi apprendono dai risultati e stabiliscono l’azione successiva. In genere, l’apprendimento per rinforzo è una buona scelta per i sistemi automatizzati che devono prendere tante piccole decisioni senza la guida umana. Le domande a cui risponde riguardano sempre l’azione da intraprendere, di solito da una macchina o un robot. Alcuni esempi: • per un sistema di controllo della temperatura per un’abitazione: regolare la temperatura o lasciarla invariata? • per un’automobile senza pilota: In caso di semaforo giallo, frenare o accelerare? Gli algoritmi di apprendimento per rinforzo raccolgono i dati durante i processi, imparando dai tentativi e dagli errori.
  8. 8. Il processo di analisi dei dati delle ML mario.gentili@mariogentili.it 8 Ogni analisi dati basata su ML si basa sulle fasi seguenti: 1. Definizione dell’ambito di ricerca: un’analisi dati nasce sempre da una domanda fondamentale a cui si vuole dare una risposta. 2. Ricerca dei dati e delle fonti e loro raccolta: assessment possibili fonti e scelta delle più adatte. 3. Preparazione dei dati o pre-processing: la qualità di un progetto basato su ML si basa anche sulla qualità dei dati immessi. 4. Modelling: analisi esplorative dei nostri dati. 5. Training e validazione del modello di analisi: per ottenere dei risultati adeguati, avremo bisogno di selezionare e testare l’algoritmo scelto. Potrà capitare di mettere a confronto più algoritmi per verificare quale sia più adeguato per uno specifico disegno di ricerca. 6. Interpretazione dei dati: generazione di grafici, report, etc. CRISP-DM è un progetto finanziato dalla UE il cui obiettivo è quello di definire uno standard ai progetti di Data Mining
  9. 9. • pattern da classificare provenienti da un database di neuroimaging (obiettivo), • Informazioni :stimoli uditivi alla corteccia cerebrale con frequenza variabile (variabili), • 6 soggetti presi in considerazione,una volta con stimoli molto percepiti(big) e una volta con stimoli poco percepiti(small) per un totale di 12 dataset (osservazioni), • 49 osservazioni temporali (pattern) per soggetto; • 2 classi (labels): un passaggio in frequenza da 500 a 100Hz e uno in senso decrescente ; • features estratte :circa 1000 voxel provenienti dalle aree della corteccia cerebrale uditiva destra e sinistra; Esempio Contesto mario.gentili@mariogentili.it 9
  10. 10. Il problema della classificazione si presenta quindi formalmente nelle seguenti fasi: • selezione delle caratteristiche (features) salienti; • classificazione; • presentazione dei risultati ed eventuali confronti tra tecniche differenti. Esempio: descrizione del problema mario.gentili@mariogentili.it 10
  11. 11. Dall’Intelligenza Artificiale all’Intelligenza Collettiva mario.gentili@mariogentili.it 11 Le ML, attraverso il computer si possono considerare come una psico-tecnologia, che estende la mente così come altre tecnologie “fisiche”, come la macchina o la bicicletta, estendono il corpo… attraverso il computer possiamo penetrare nello schermo e accedere ad un mondo che è come un immaginario oggettivo. La Rete si può considerare come una psico-tecnologia che estende l’individuo a favore dell’Intelligenza Collettiva. Nella Rete si definisce l’ambiente cognitivo, l’augmented mind, fatto da elementi individuali che confluiscono continuamente in ambienti collettivi. Tesi sostenuta in un’intervista del 1998 da Derrick De Kerckhove, filosofo, sociologo e futurologo, e allievo di Marshall McLuhan. fu rilasciata a Bologna per RAI-MediaMente.
  12. 12. I sistemi ad agenti mario.gentili@mariogentili.it 12 L’uomo non è solo, è soprattutto relazione con il modo esterno e, in particolare, con i suoi simili. È questo il principio ispiratore che ha permesso allo studioso francese Pierre Lévy di introdurre il concetto di Intelligenza Collettiva. Secondo il filosofo francese, la diffusione delle tecniche di comunicazione su supporto digitale ha permesso la nascita di nuove modalità di legame sociale, non più fondate su appartenenze territoriali, relazioni istituzionali, o rapporti di potere, ma sul radunarsi intorno a centri d'interesse comuni, sul gioco, sulla condivisione del sapere, sull'apprendimento cooperativo, su processi aperti di collaborazione. … dalle machine learning ai sistemi ad agenti
  13. 13. I sistemi ad agenti mario.gentili@mariogentili.it 13 Un agente è un sistema computazionale che può vivere in ambienti dinamici e complessi; ha dei sensi che gli permettono di percepire l’ambiente e, in particolare, di interagire con i suoi simili e con gli umani; agisce autonomamente soddisfacendo i suoi obiettivi e eseguendo i compiti per cui è stato progettato. Un sistema computazionale per essere considerato un agente deve avere le seguenti proprietà: • Autonomia • Reattività • Intraprendenza • Abilità sociale • Adattabilità • Mobilità
  14. 14. I sistemi ad agenti mario.gentili@mariogentili.it 14 Esempi:

×