I 5 libri che un Data Scientist deve leggere assolutamente

Approcciarsi al mondo del Machine Learning e dei Big Data è sicuramente una sfida interessante, e per facilitare e velocizzare la corsa ecco 5 libri che bisogna assolutamente leggere!

1.Machine learning con Python. Costruire algoritmi per generare conoscenza

Elaborare il magma di dati oggi disponibile è una sfida affascinante e imprescindibile per il mondo contemporaneo dove la conoscenza e l’informazione sono il primo valore.
Questo libro accompagna nel mondo del machine learning e mostra come Python sia il linguaggio di programmazione ideale per costruire algoritmi sofisticati in grado di interrogare i dati nel modo migliore e recuperare preziosi insight.
In questo volume viene spiegato l’utilizzo di librerie Python dedicate – tra cui scikit-learn, Theano e Keras – applicate in ambiti come la selezione e la compressione dei dati, l’analisi del linguaggio naturale, l’elaborazione di previsioni, il riconoscimento delle immagini.L’approccio didattico è pragmatico: tutti i concetti sono accompagnati da esempi pratici di codice.

La lettura è consigliata a chi ha già alle spalle qualche studio teorico nel campo del machine learning oltre a una buona conoscenza di programmazione in Python.

2. Big Data Analytics: Il manuale del data scientist

 

Questo volume si propone come una guida completa 
sia per chi intenda intraprendere questa professione emergente, sia per chi, già esperto, desideri approfondire alcune tematiche. L’autore illustra le principali conoscenze relative 
alla gestione e all’analisi avanzata dei dati; descrive i big data e gli strumenti e le architetture che permettono 
di gestirli (Hadoop in particolare) e presenta i temi 
della data ingestion e dell’elaborazione con alcuni tool di analisi (Hive, Pig, Spark e R) le cui funzionalità sono illustrate anche tramite esempi commentati. 
Una parte è dedicata alla predictive analytics e mostra le tecniche per la creazione di modelli predittivi: dalla preparazione dei dati, alla scelta dell’algoritmo più adatto, alla valutazione delle performance. Il testo è un valido supporto per la comprensione 
dei concetti relativi all’analisi dei dati (big data o dati tradizionali), anche da parte del management aziendale che, dall’analisi avanzata, può trarre le informazioni utili 
ad assumere decisioni, a valutare rischi e disegnare strategie.

3. Data science. Guida ai principi e alle tecniche base della scienza dei dati

Questo libro si rivolge ai programmatori che vogliono entrare nel mondo della scienza dei dati scoprendo come unire competenze che spaziano dalla matematica alle analisi di business attraverso – naturalmente – la programmazione. Lo scopo è insegnare come affrontare dati eterogenei trasformandoli in idee e insight. Nel corso dei vari capitoli vengono presentati gli elementi che un data scientist deve padroneggiare: la definizione del dominio di analisi, il recupero e la pulizia di dati grezzi, il calcolo delle probabilità, i modelli statistici, fino all’applicazione di algoritmi di machine learning. Non mancano approfondimenti su come normalizzare e preparare i dati prima di un’analisi, oltre a suggerimenti su come presentare e comunicare i risultati in modo efficace. Tutti i passaggi chiave sono corredati da esempi di pseudocodice per illustrare al meglio gli algoritmi in uso mentre gli esempi di codice utilizzano prevalentemente il linguaggio Python.

 

4. Data scientist. Tra competitività e innovazione

Di fronte all’affermarsi della Algorithm Economy e dei Big Data, per le organizzazioni diventa sempre più necessaria una figura professionale capace di dialogare e collaborare con COBOT e macchine intelligenti: il Data Scientist. Rispondendo a questa esigenza, il volume fornisce indicazioni pratiche sia a coloro che vogliono intraprendere e sviluppare ai massimi livelli la carriera di Data Scientist sia alle aziende che desiderano accogliere questa figura per migliorare capacità decisionale e competitività. . Il testo è arricchito inoltre da contributi di personaggi di rilievo del mondo dell’innovazione, che propongono un punto di vista alternativo e libero, e da testimonianze e Case histories che aiutano a chiarire i contenuti esposti.

5. Intelligenza artificiale, protezione dei dati personali e regolazione

Questo volume è innanzitutto una sfida. Mentre entra in attuazione il nuovo Regolamento europeo per la protezione dei dati personali, che ha come obbiettivo alzare la tutela per aumentare la fiducia nella circolazione dei dati e nell’economia digitale, qui si cerca già di andare oltre. Il GDPR è uno sforzo enorme per passare dalla concezione statica del dato come proprietà della persona, a quella dinamica che vede il dato, anche personale, come linfa vitale della quarta rivoluzione industriale. Siamo ormai nel tempo dell’intelligenza artificiale, delle macchine intelligenti, dell’internet delle cose. E possibile che il GDPR possa rafforzare la fiducia delle persone proteggendo i loro dati anche nel nuovo mondo della IA? 

 

 

Fonte: Amazon.it