Big data et machine learning : les concepts et les outils de la data science

Enregistré dans:
Détails bibliographiques
Auteur principal: Lemberger, Pirmin.
Autres auteurs: Batty, Marc., Morel, Médéric., Raffaëlli, Jean-Luc., Géron, Aurélien.
Support: Livre
Langue: Français
Publié: Malakoff : Dunod, DL 2016.
Édition: 2e édition.
Collection: InfoPro. Management des systèmes d'information
Sujets:
Autres localisations: Voir dans le Sudoc
Résumé: Guide pour comprendre les enjeux d'un projet big data. Combine la présentation des concepts théoriques tels que le traitement statistique des données, le calcul distribué, la description des outils comme Hadoop, Storm, Elastic search, etc., et des retours d'expérience. Avec des ajouts sur le deep learning et les réseaux de neurones, des mises à jour sur les moteur de recommandations et Spark. ↑Electre 2017
LEADER 06197nam a22003857a 4500
001 350036
008 161010t20162016xxe ||| |||| 00| 0 fre d
020 |a 9782100754632 (br.) :  |c 29,90 EUR 
024 |a 9782100754632 
041 0 |a fre 
082 |a 006.31  |z fre 
082 |a 658.05 
082 |a 658.403 8 
100 1 |a Lemberger, Pirmin. 
245 1 0 |a Big data et machine learning :  |b les concepts et les outils de la data science   |c Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.] ; préface d'Aurélien Géron. 
250 |a 2e édition. 
260 |a Malakoff :  |b Dunod,  |c DL 2016. 
300 |a 1 vol. (XVI-255 p.) :  |b ill., couv. ill. en coul. ;  |c 25 cm. 
490 0 |a InfoPro. Management des systèmes d'information 
500 |a Autre contribution : Jean-Luc Raffaëlli (auteur) 
504 |a Notes bibliogr. et webogr. Index 
505 0 |a P. III -- Préface -- P. XV -- Avant-propos -- Première partie - Les fondements du Big Data -- P. 3 -- Chapitre 1 - Les origines du Big Data -- P. 3 -- 1.1 La perception de la donnée dans le grand public -- P. 5 -- 1.2 Des causes économiques et technologiques -- P. 8 -- 1.3 La donnée et l'information -- P. 9 -- 1.4 La valeur -- P. 10 -- 1.5 Les ressources nécessaires -- P. 11 -- 1.6 De grandes opportunités -- P. 13 -- Chapitre 2 - Le Big Data dans les organisations -- P. 13 -- 2.1 La recherche de l'Eldorado -- P. 14 -- 2.2 L'avancée par le cloud -- P. 15 -- 2.3 La création de la valeur -- P. 15 -- 2.4 Les 3V du Big Data -- P. 17 -- 2.5 Un champ immense d'applications -- P. 19 -- 2.6 Exemples de compétences à acquérir -- P. 22 -- 2.7 Des impacts à tous les niveaux -- P. 26 -- 2.8 B comme Big Data ou Big Brother ? -- P. 29 -- Chapitre 3 - Le mouvement NoSQL -- P. 29 -- 3.1 Bases relationnelles, les raisons d'une domination -- P. 34 -- 3.2 Le dogme remis en question -- P. 40 -- 3.3 Les différentes catégories de solutions -- P. 50 -- 3.4 Le NoSQL est-il l'avenir des bases de données ? -- P. 53 -- Chapitre 4 - L'algorithme MapReduce et le framework Hadoop -- P. 53 -- 4.1 Automatiser le calcul parallèle -- P. 54 -- 4.2 Le pattern MapReduce -- P. 58 -- 4.3 Des exemples d'usage de MapReduce -- P. 63 -- 4.4 Le framework Hadoop -- P. 68 -- 4.5 Au-delà de MapReduce -- Deuxième partie - Le métier de data scientist -- P. 73 -- Chapitre 5 - Le quotidien du data scientist -- P. 73 -- 5.1 Data scientist : licorne ou réalité ? -- P. 80 -- 5.2 Le data scientist dans l'organisation -- P. 82 -- 5.3 Le workflow du data scientist -- P. 91 -- Chapitre 6 - Exploitation et préparation de données -- P. 91 -- 6.1 Le déluge des données -- P. 96 -- 6.2 L'exploitation de données -- P. 101 -- 6.3 La préparation de données -- P. 106 -- 6.4 Les outils de préparation de données -- P. 109 -- Chapitre 7 - Le Machine Learning -- P. 109 -- 7.1 Qu'est-ce que Le Machine Learning ? -- P. 119 -- 7.2 Les différents types de Machine Learning -- P. 122 -- 7.3 Les principaux algorithmes -- P. 136 -- 7.4 Réseaux de neurones et Deep Learning -- P. 152 -- 7.5 Illustrations numériques -- P. 163 -- 7.6 Systèmes de recommandation -- P. 173 -- Chapitre 8 - La visualisation des données -- P. 173 -- 8.1 Pourquoi visualiser l'information ? -- P. 177 -- 8.2 Quels graphes pour quels usages ? -- P. 184 -- 8.3 Représentation de donnée complexes -- Troisième partie - Les outils du Big Data -- P. 193 -- Chapitre 9 - L'écosystème Hadoop -- P. 194 -- 9.1 La jungle de l'éléphant -- P. 196 -- 9.2 Les composants d'Apache Hadoop -- P. 203 -- 9.3 Les principales distributions Hadoop -- P. 206 -- 9.4 Spark ou la promesse du traitement Big Data in-memory -- P. 212 -- 9.5 Les briques analytiques à venir -- P. 214 -- 9.6 Les librairies de calcul -- P. 219 -- Chapitre 10 - Analyse de logs avec Pig et Hive -- P. 219 -- 10.1 Pourquoi analyser des logs ? -- P. 220 -- 10.2 Pourquoi choisir Pig ou Hive ? -- P. 221 -- 10.3 La préparation des données -- P. 226 -- 10.4 L'analyse des parcours clients -- P. 229 -- Chapitre 11 - Les architectures gamma -- P. 229 -- 11.1 Les enjeux du temps réel -- P. 231 -- 11.2 Rappels sur MapReduce et Hadoop -- P. 231 -- 11.3 Les architectures gamma -- P. 239 -- Chapitre 12 - Apache Storm -- P. 239 -- 12.1 Qu'est-ce que Storm ? -- P. 240 -- 12.2 Positionnement et intérêt dans les architectures gamma -- P. 241 -- 12.3 Principes de fonctionnement -- P. 244 -- 12.4 Un exemple très simple -- P. 247 -- Conclusion -- P. 251 -- Index 
520 |a Guide pour comprendre les enjeux d'un projet big data. Combine la présentation des concepts théoriques tels que le traitement statistique des données, le calcul distribué, la description des outils comme Hadoop, Storm, Elastic search, etc., et des retours d'expérience. Avec des ajouts sur le deep learning et les réseaux de neurones, des mises à jour sur les moteur de recommandations et Spark. ↑Electre 2017 
520 |a 4e de couv. : " Cet ouvrage s adresse à tous ceux qui réfléchissent à la meilleure utilisation possible des données au sein de l entreprise, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l exploitation de leurs données clients, fournisseurs, produits, processus, machines, etc. Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ? Ce livre est un guide pour comprendre les enjeux d un projet Big Data, en appréhender les concepts sous-jacents (en particulier le machine learning) et acquérir les compétences nécessaires à la mise en place d un data lab... Cette deuxième édition est complétée et enrichie par des mises à jour sur les réseaux de neurones et sur le Deep Learning ainsi que sur Spark." 
650 |a Données massives 
650 |a Apprentissage automatique 
650 |a Exploration de données 
700 1 |a Batty, Marc.  |4 aut 
700 1 |a Morel, Médéric.  |4 aut 
700 1 |a Raffaëlli, Jean-Luc.  |4 aut 
700 1 |a Géron, Aurélien.  |4 aui 
993 |a Livre 
994 |a EX 
995 |a 195624653 
997 |0 350036