Pages: [1]   Go Down
Print
Author Topic: Soluzione esame 10/02/2011  (Read 1174 times)
0 Members e 1 Utente non registrato stanno visualizzando questa discussione.
TuTToWeB
Apprendista Forumista
**
Offline Offline

Posts: 102


« on: 14-02-2011, 20:36:07 »

ciao a tutti,
per chi lo volesse, ho la soluzione del compito dell'ultimo appello. Contattatemi alla mia email e ve la darò subito: valerio.giuffrida88@gmail.com
Lo faccio nel ringraziare tutti coloro che mi hanno messo a disposizione tutto quel blocco di registrazioni + testi in latex + soluzioni di vecchi esami.
Di seguito c'è il testo,a ma vi servirà un file excel a parte per fare l'esercizio. Buona fortuna a tutti
Ps.: durante l'esame si è discusso della "distanza interquartile". Non avendo seguito le lezioni, la cosa mia aveva un po' spiazato e credevo qualcosa che mi ero perso proprio per questo motivo. Invece, il prof non l'ha detta a lezione, ma cmq è una cosa molto banale che si fa con una chiamata di funzione su matlab.
Teoricamente, la distanza interquarile non è altro la distanza la differenza tra il 3° quartile e il 1°. Prendendo l'istogramma comulativo, il primo quartile è il valore dell'istogramma al 25%, il secondo quartile il valore a l 50% e così via.
Per farla breve, chiamate la funziome iqr (interquartile range) e avete fatto.

----------------------------------------------

Laboratorio Pattern Recognition Febbraio 2011

Si ottengano dal docente i dati “studenti olandesi” in formato foglio elettronico.
Essi rappresentano le misure della ampiezza e della lunghezza della mano di 253 studenti, maschi (label 1) e femmine (label 2).

Si richiede, utilizzando il software che uno preferisce di eseguire le seguenti elaborazioni.

a) statistiche descrittive sull'intero data set. In particolare si richiede: media, deviazione standard, distanze interquartili per ciascuna delle due feature osservate, istogramma, scatter plot (con punti colorati in due colori distinti per le due classi).

b) statistiche descrittive dei dati relativi agli studenti maschi.

c) statistiche descrittive dei dati relativi alle studentesse femmine.

d) si assuma che la feature lunghezza della mano (la prima) abbia andamento gaussiano sia per la intera popolazione che per le popolazioni maschili e femminili. Stimati i parametri delle gaussiane interessate con media aritmetica e varianza si costruisca un classificatore MAP dei dati disponibili. Si fornisca la matrice di confusione risultante dalla applicazione di questo classificatore sui dati di training.

e) Procedendo con scarti di 2 millimetri si proponga un albero decisionale binario di profondità due, dove a ciascun nodo i dati vengono divisi osservando il valore della feature1 oppure della feature2 rispetto ad una soglia asegnata. Sia la feature da considerare che il valore di soglia siano scelti in modo da ottimizzare la misura di impurezza di Gini.
Quale è il grado di impurezza di ciascuna foglia finale dell'albero?
Logged
Giovanni Gallo
Moderator
Forumista
*****
Offline Offline

Gender: Male
Posts: 509


WWW
« Reply #1 on: 15-02-2011, 10:01:47 »

anche io ho una soluzione completa.... chiedetemela!
Logged

---
Pages: [1]   Go Up
Print
Jump to: