Tags
Language
Tags
April 2024
Su Mo Tu We Th Fr Sa
31 1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 1 2 3 4

Introduzione al machine learning con R

Posted By: AlenMiler
Introduzione al machine learning con R

Introduzione al machine learning con R di Valentina Porcu
Italiano | 11 ottobre 2016 | ASIN: B01MDKU6M0 | 380 Pagine | AZW3/MOBI/EPUB/PDF (conv) | 16.09 MB

In questo libro ci occuperemo delle tecniche di machine learning in particolare utilizzando il linguaggio di programmazione e analisi R. Questo testo presuppone una conoscenza almeno basilare del linguaggio R. Nello specifico ci occuperemo:

Nella parte introduttiva presenteremo in generale le tecniche di machine learning e le fasi del processo di analisi. Vedremo come scegliere una tecnica di analisi e parleremo delle performance degli algoritmi di machine learning, dei modelli di ricerca, e dei tipi di dati più comuni nel machine learning.

Nel Capitolo 1 parliamo dei problemi che possono interessare i nostri dati e i modelli che costruiremo e della pulizia dei nostri dati in vista dell’analisi.

Nel Capitolo 2 cominciamo a vedere i primi modelli predittivi basati in particolare sulla regressione lineare e multipla.

Capitolo 3: in questo capitolo cominciamo a parliamo dei sistemi di apprendimento automatico di tipo supervisionato, ossia gli algoritmi che partono da un dataset etichettato, ossia nel quale è presente una colonna che ci dice già com’è il nostro dataset, ad esempio se vogliamo etichettare dello spam, nella colonna avremo degli item etichettati come spam e altri come non spam. A partire da questi dataset etichettati, creiamo tipicamente un modello per classificare dei dati in cui l’etichetta non è presente. In questo capitolo parliamo di metodi supervisionati, come knn, SVM, alberi di decisione, Naïve Bayes e network neurali.

All’interno del Capitolo 4 parliamo dei metodi non supervisionati, in particolare di clustering e di analisi delle associazioni, e di riduzione della dimensionalità dei dati.

Il Capitolo 5 tratta fondamentalmente dei principali metodi ensemble quali bagging, boosting e random forest.

Nel Capitolo 6 parliamo di alcuni metodi semi-supervisionati, come l'allocazione latente di Dirichlet e i topic models.

Nel Capitolo 7 trattiamo alcuni metodi di imputazione dei dati mancanti, tra gli altri tramite regressione, knn e hot deck.

Nel Capitolo 8 parliamo di come misurare e verificare le performance degli algoritmi per migliorare i risultati delle nostre analisi.

Infine, nel capitolo dedicato alle Conclusioni, faremo un riepilogo dei pacchetti utilizzati nel corso del libro per il machine learning, e delle fonti di dati reperibili online per i test.