Dataset Iris

Questa voce sull'argomento informatica è solo un abbozzo.

Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento.

Il dataset Iris è un dataset multivariato introdotto da Ronald Fisher nel 1936. Consiste in 150 istanze di Iris misurate da Edgar Anderson e classificate secondo tre specie: Iris setosa, Iris virginica e Iris versicolor. Le quattro variabili considerate sono la lunghezza e la larghezza del sepalo e del petalo. A causa di errori, esistono diverse versioni del dataset utilizzate nella letteratura scientifica.^[1]

Il dataset Iris viene utilizzato nell'ambito dell'apprendimento automatico come esempio di classificazione statistica.^[2]^[3]

Note

^ (EN) Bezdek, J.C., Keller, J.M.; Krishnapuram, R.; Kuncheva, L.I.; Pal, N.R., Will the real iris data please stand up?, in IEEE Transactions on Fuzzy Systems, vol. 7, n. 3, IEEE, 1999, pp. 368-369, DOI:10.1109/91.771092, ISSN 1063-6706 (WC · ACNP).
^ (EN) An introduction to machine learning with scikit-learn, su scikit-learn.
^ (EN) Yanchang Zhao, R and Data Mining: Examples and Case Studies (PDF), 26 aprile 2013.

Bibliografia

(EN) R. A. Fisher, The use of multiple measurements in taxonomic problems, in Annual Eugenics, vol. 7, n. 2, 1936, pp. 179-188, DOI:10.1111/j.1469-1809.1936.tb02137.x.
Edgar Anderson, The species problem in Iris, in Annals of the Missouri Botanical Garden, vol. 23, n. 3, 1936, pp. 457-509.

Collegamenti esterni

(EN) Iris Data Set, su UC Irvine Machine Learning Repository.

V · D · M Apprendimento automatico
Problemi	Teoria dell'apprendimento statistico · Classificazione · Regressione · Regole di associazione · Apprendimento non supervisionato · Apprendimento supervisionato · Apprendimento per rinforzo · Apprendimento profondo
Apprendimento non supervisionato	Clustering · Clustering gerarchico · K-means · Algoritmo EM · DBSCAN · Mean shift · Rete generativa avversaria (cGAN · VAE-GAN · cycleGAN)
Apprendimento supervisionato	Albero di decisione · Foresta casuale · Conditional random fields CRF · Modello di Markov nascosto · K-nearest neighbors · Classificatore bayesiano · Rete neurale artificiale · Regressione lineare · Regressione logistica · Modelli grafici · Macchine a vettori di supporto
Apprendimento per rinforzo	Q-learning · SARSA · TD
Riduzione della dimensionalità	Analisi fattoriale · Analisi della correlazione canonica (CCA) · Analisi delle componenti indipendenti (ICA) · Analisi discriminante lineare (LDA) · Analisi delle componenti principali (PCA) · Selezione delle caratteristiche · Estrazione di caratteristiche · t-distributed stochastic neighbor embedding (t-SNE)
Reti neurali artificiali	Percettrone · Rete neurale a base radiale · Rete bayesiana · Rete neurale feed-forward · Rete di Hopfield · Percettrone multistrato · Rete neurale ricorrente (LSTM) · Macchina di Boltzmann ristretta · Mappa auto-organizzata · Rete neurale convoluzionale · Rete neurale a ritardo · Rete neurale spiking · Trasformatore
Software	Keras · Microsoft Cognitive Toolkit · Scikit-learn · TensorFlow · Theano · Torch · Weka
Altro	Algoritmo genetico · Particle Swarm Optimization · Caratteristica · Compromesso bias-varianza · Minimizzazione del rischio empirico