Big data et machine learning : les concepts et les outils de la data science

Salvato in:
Dettagli Bibliografici
Autore principale: Lemberger, Pirmin.
Altri autori: Batty, Marc., Morel, Médéric., Raffaëlli, Jean-Luc.
Natura: Livre
Lingua: Français
Pubblicazione: Malakoff : Dunod, DL 2019.
Edizione: 3e édition.
Serie: InfoPro. Management des systèmes d'information
Soggetti:
Autres localisations: Voir dans le Sudoc
Riassunto: La 4e de couv. indique : "Cet ouvrage s adresse à tous ceux qui cherchent à tirer parti de l énorme potentiel des technologies Big Data, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l exploitation de leurs données clients, fournisseurs, produits, processus, etc. Il a en outre permis l'émergence des techniques d'apprentissage automatique (Machine Learning, Deep Learning) qui ont relancé le domaine de l'intelligence artificielle. Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ? Ce livre est un guide pour comprendre les enjeux d un projet Big Data, en appréhender les concepts sous-jacents et acquérir les compétences nécessaires à la mise en place d une architecture d'entreprise adaptée. Il combine la présentation : de notions théoriques (traitement statistique des données, calcul distribué...) ; des outils les plus répandus ; d exemples d applications, notamment en NLP (Natural Language Processing) ; d une organisation typique d un projet de data science."
LEADER 05326nam a22003497a 4500
001 364738
008 190827t20192019xxe ||| |||| 00| 0 fre d
020 |a 9782100790371 (br.) :  |c 29,90 EUR 
024 |a 9782100790371 
041 0 |a fre 
082 |a 658.403 8011  |z fre 
084 |a 650 
100 1 |a Lemberger, Pirmin. 
245 1 0 |a Big data et machine learning :  |b les concepts et les outils de la data science   |c Pirmin Lemberger,... Marc Batty,... Médéric Morel,... [et al.]. 
250 |a 3e édition. 
260 |a Malakoff :  |b Dunod,  |c DL 2019. 
300 |a 1 vol. (X-256 p.) :  |b ill., couv. ill. en coul. ;  |c 25 cm. 
490 0 |a InfoPro. Management des systèmes d'information 
500 |a Autre contribution : Jean-Luc Raffaëlli (auteur) 
504 |a Notes bibliogr. et webogr. Index 
505 0 |a Avant-propos -- Première partie - Les fondements du Big Data -- Chapitre 1 - Les origines du Big Data -- 1.1 La perception de la donnée dans le grand public -- 1.2 Des causes économiques et technologiques -- 1.3 La donnée et l'information -- 1.4 La valeur -- 1.5 Les ressources nécessaires -- 1.6 De grandes opportunités -- Chapitre 2 - Le Big Data dans les organisations -- 2.1 La recherche de l'Eldorado -- 2.2 L'avancée par le cloud -- 2.3 La création de la valeur -- 2.4 Les 3V du Big Data -- 2.5 Un champ immense d'applications -- 2.6 Exemples de compétences à acquérir -- 2.7 Des impacts à tous les niveaux -- 2.8 Une nécessaire vision d'architecture d'entreprise -- 2.9 B Comme Big Data ou Big Brother ? -- Chapitre 3 - Le mouvement NoSQL -- 3.1 Bases relationnelles, les raisons d'une domination -- 3.2 Le dogme remis en question -- 3.3 Les différentes catégories de solutions -- 3.4 Le NoSQL est-il l'avenir des bases de données ? -- Chapitre 4 - L'algorithme MapReduce et le framework Hadoop -- 4.1 Automatiser le calcul parallèle -- 4.2 Le pattern MapReduce -- 4.3 Des exemples d'usage de MapReduce -- 4.4 Le framework Hadoop -- 4.5 Au-delà de MapReduce -- Deuxième partie - Le métier de data scientist -- Chapitre 5 - Le quotidien du data scientist -- 5.1 Data scientist : licorne ou réalité ? -- 5.2 Le data scientist dans l'organisation -- 5.3 Le workflow du data scientist -- Chapitre 6 - Exploitation et préparation de données -- 6.1 Le déluge des données -- 6.2 L'exploration de données -- 6.3 La préparation de données -- 6.4 Les outils de préparation de données -- Chapitre 7 - Le Machine Learning -- 7.1 Qu'est-ce que Le Machine Learning ? -- 7.2 Les différents types de Machine Learning -- 7.3 Les principaux algorithmes -- 7.4 Réseaux de neurones et Deep Learning -- 7.5 Illustrations numériques -- 7.6 Systèmes de recommandation -- Chapitre 8 - La visualisation des données -- 8.1 Pourquoi visualiser l'information ? -- 8.2 Quels graphes pour quels usages ? -- 8.3 Représentation de donnée complexes -- Troisième partie - Les outils du Big Data -- Chapitre 9 - L'écosystème Hadoop -- 9.1 La jungle de l'éléphant -- 9.2 Les composants d'Apache Hadoop -- 9.3 Les principales distributions Hadoop -- 9.4 Spark ou la promesse du traitement Big Data in-memory -- 9.5 Les briques analytiques à venir -- 9.6 Les librairies de calcul -- Chapitre 10 - Analyse de logs avec Pig et Hive -- 10.1 Pourquoi analyser des logs ? -- 10.2 Pourquoi choisir Pig ou Hive ? -- 10.3 La préparation des données -- 10.4 L'analyse des parcours clients -- Chapitre 11 - Les architectures Lambda -- 11.1 Les enjeux du temps réel -- 11.2 Rappels sur MapReduce et Hadoop -- 11.3 Les architectures Lambda -- Chapitre 12 - Apache Storm -- 12.1 Qu'est-ce que Storm ? -- 12.2 Positionnement et intérêt dans les architectures Lambda -- 12.3 Principes de fonctionnement -- 12.4 Un exemple très simple -- Conclusion -- Index 
520 |a La 4e de couv. indique : "Cet ouvrage s adresse à tous ceux qui cherchent à tirer parti de l énorme potentiel des technologies Big Data, qu ils soient data scientists, DSI, chefs de projets ou spécialistes métier. Le Big Data s est imposé comme une innovation majeure pour toutes les entreprises qui cherchent à construire un avantage concurrentiel grâce à l exploitation de leurs données clients, fournisseurs, produits, processus, etc. Il a en outre permis l'émergence des techniques d'apprentissage automatique (Machine Learning, Deep Learning) qui ont relancé le domaine de l'intelligence artificielle. Mais quelle solution technique choisir ? Quelles compétences métier développer au sein de la DSI ? Ce livre est un guide pour comprendre les enjeux d un projet Big Data, en appréhender les concepts sous-jacents et acquérir les compétences nécessaires à la mise en place d une architecture d'entreprise adaptée. Il combine la présentation : de notions théoriques (traitement statistique des données, calcul distribué...) ; des outils les plus répandus ; d exemples d applications, notamment en NLP (Natural Language Processing) ; d une organisation typique d un projet de data science." 
650 |a Apprentissage automatique 
650 |a Exploration de données 
650 |a Données massives 
650 |a Analyse des données 
700 1 |a Batty, Marc.  |4 aut 
700 1 |a Morel, Médéric.  |4 aut 
700 1 |a Raffaëlli, Jean-Luc.  |4 aut 
993 |a Livre 
995 |a 237530228 
997 |0 364738