I 5 libri che un Data Scientist deve leggere assolutamente
Approcciarsi al mondo del Machine Learning e dei Big Data è sicuramente una sfida interessante, e per facilitare e velocizzare la corsa ecco 5 libri che bisogna assolutamente leggere!
1.Machine learning con Python. Costruire algoritmi per generare conoscenza
Elaborare il magma di dati oggi disponibile è una sfida affascinante e imprescindibile per il mondo contemporaneo dove la conoscenza e l’informazione sono il primo valore.
Questo libro accompagna nel mondo del machine learning e mostra come Python sia il linguaggio di programmazione ideale per costruire algoritmi sofisticati in grado di interrogare i dati nel modo migliore e recuperare preziosi insight.
In questo volume viene spiegato l’utilizzo di librerie Python dedicate – tra cui scikit-learn, Theano e Keras – applicate in ambiti come la selezione e la compressione dei dati, l’analisi del linguaggio naturale, l’elaborazione di previsioni, il riconoscimento delle immagini.L’approccio didattico è pragmatico: tutti i concetti sono accompagnati da esempi pratici di codice.
La lettura è consigliata a chi ha già alle spalle qualche studio teorico nel campo del machine learning oltre a una buona conoscenza di programmazione in Python.
2. Big Data Analytics: Il manuale del data scientist
Questo volume si propone come una guida completa sia per chi intenda intraprendere questa professione emergente, sia per chi, già esperto, desideri approfondire alcune tematiche. L’autore illustra le principali conoscenze relative alla gestione e all’analisi avanzata dei dati; descrive i big data e gli strumenti e le architetture che permettono di gestirli (Hadoop in particolare) e presenta i temi della data ingestion e dell’elaborazione con alcuni tool di analisi (Hive, Pig, Spark e R) le cui funzionalità sono illustrate anche tramite esempi commentati. Una parte è dedicata alla predictive analytics e mostra le tecniche per la creazione di modelli predittivi: dalla preparazione dei dati, alla scelta dell’algoritmo più adatto, alla valutazione delle performance. Il testo è un valido supporto per la comprensione dei concetti relativi all’analisi dei dati (big data o dati tradizionali), anche da parte del management aziendale che, dall’analisi avanzata, può trarre le informazioni utili ad assumere decisioni, a valutare rischi e disegnare strategie.
3. Data science. Guida ai principi e alle tecniche base della scienza dei dati
Questo libro si rivolge ai programmatori che vogliono entrare nel mondo della scienza dei dati scoprendo come unire competenze che spaziano dalla matematica alle analisi di business attraverso – naturalmente – la programmazione. Lo scopo è insegnare come affrontare dati eterogenei trasformandoli in idee e insight. Nel corso dei vari capitoli vengono presentati gli elementi che un data scientist deve padroneggiare: la definizione del dominio di analisi, il recupero e la pulizia di dati grezzi, il calcolo delle probabilità, i modelli statistici, fino all’applicazione di algoritmi di machine learning. Non mancano approfondimenti su come normalizzare e preparare i dati prima di un’analisi, oltre a suggerimenti su come presentare e comunicare i risultati in modo efficace. Tutti i passaggi chiave sono corredati da esempi di pseudocodice per illustrare al meglio gli algoritmi in uso mentre gli esempi di codice utilizzano prevalentemente il linguaggio Python.
4. Data scientist. Tra competitività e innovazione
Di fronte all’affermarsi della Algorithm Economy e dei Big Data, per le organizzazioni diventa sempre più necessaria una figura professionale capace di dialogare e collaborare con COBOT e macchine intelligenti: il Data Scientist. Rispondendo a questa esigenza, il volume fornisce indicazioni pratiche sia a coloro che vogliono intraprendere e sviluppare ai massimi livelli la carriera di Data Scientist sia alle aziende che desiderano accogliere questa figura per migliorare capacità decisionale e competitività. . Il testo è arricchito inoltre da contributi di personaggi di rilievo del mondo dell’innovazione, che propongono un punto di vista alternativo e libero, e da testimonianze e Case histories che aiutano a chiarire i contenuti esposti.
5. Intelligenza artificiale, protezione dei dati personali e regolazione
Questo volume è innanzitutto una sfida. Mentre entra in attuazione il nuovo Regolamento europeo per la protezione dei dati personali, che ha come obbiettivo alzare la tutela per aumentare la fiducia nella circolazione dei dati e nell’economia digitale, qui si cerca già di andare oltre. Il GDPR è uno sforzo enorme per passare dalla concezione statica del dato come proprietà della persona, a quella dinamica che vede il dato, anche personale, come linfa vitale della quarta rivoluzione industriale. Siamo ormai nel tempo dell’intelligenza artificiale, delle macchine intelligenti, dell’internet delle cose. E possibile che il GDPR possa rafforzare la fiducia delle persone proteggendo i loro dati anche nel nuovo mondo della IA?
Fonte: Amazon.it