Data scientist et langage R : guide d'autoformation à l'exploitation des big data

Enregistré dans:
Détails bibliographiques
Auteur principal: Laude, Henri.
Support: Livre
Langue: Français
Publié: St Herblain : Éditions ENI, cop. 2016.
Collection: Epsilon
Sujets:
Autres localisations: Voir dans le Sudoc
Résumé: Un parcours didactique et professionnalisant permettant de s'intégrer à une équipe de data scientists, d'aborder des articles de recherche en langage R, ou de manager une équipe projet comprenant des data scientists. L'auteur aborde notamment des sujets comme le traitement du langage naturel, les séries temporelles, la logique floue ou encore la manipulation des images. ↑Electre 2017
LEADER 05821nam a22003257a 4500
001 346083
008 160322t20162016xxe ||| |||| 00| 0 fre d
020 |a 9782409000430 (br.) :  |c 54 EUR 
024 |a 9782409000430 
041 0 |a fre 
082 |a 005.74  |z fre 
100 1 |a Laude, Henri. 
245 1 0 |a Data scientist et langage R :  |b guide d'autoformation à l'exploitation des big data   |c [Henri Laude]. 
260 |a St Herblain :  |b Éditions ENI,  |c cop. 2016. 
300 |a 1 vol. (663 p.) :  |b ill., couv. ill. en coul. ;  |c 22 cm. 
490 1 |a Epsilon  |x 1960-3444 
500 |a En annexe, choix de documents 
504 |a Index 
505 0 |a Chapitre 1 Introduction -- P. 15 -- 1. Data scientist, un métier à la mode -- P. 16 -- 2. Les data-sciences -- P. 17 -- 3. Le Big Data -- P. 18 -- 4. La dynamique de cet ouvrage -- P. 24 -- 5. Petit bestiaire des data-services -- P. 70 -- 6. Informatique professionnelle et data-sciences -- P. 76 -- 7. Notations -- P. 81 -- 8. À vous de jouer ! -- Chapitre 2 Premiers pas avec R -- P. 83 -- 1. Installation des composants -- P. 90 -- 2. Prise en main de R -- P. 179 -- 3. Manipulation des données -- Chapitre 3 Maîtriser les bases -- P. 215 -- 1. Se mettre en harmonie avec les données -- P. 249 -- 2. Matrices et vecteurs -- P. 279 -- 3. Estimations -- P. 302 -- 4. Mise en pratique : apprentissage supervisé -- Chapitre 4 Techniques et algorithmes incontournables -- P. 325 -- 1. Constituer sa boîte à outils -- P. 326 -- 2. Représentation graphique des données -- P. 346 -- 3. Machine learning : pratiques courantes -- P. 393 -- 4. Où en sommes-nous dans notre apprentissage ? -- Chapitre 5 Cadre méthodologique du data scientist -- P. 395 -- 1. Le problème méthodologique au niveau du projet -- P. 399 -- 2. Le cycle interne des data-sciences -- P. 411 -- 3. Compléments méthodologiques -- Chapitre 6 Traitement du langage naturel -- P. 415 -- 1. Positionnement du problème -- P. 416 -- 2. Analyse sémantique latente et SVD -- Chapitre 7 Graphes et réseaux -- P. 431 -- 1. Introduction -- P. 431 -- 2. Premiers pas -- P. 449 -- 3. Graphes et réseaux (sociaux) -- Chapitre 8 Autres problèmes, autres solutions -- P. 465 -- 1. Séries temporelles -- P. 499 -- 2. Systèmes flous -- P. 509 -- 3. Essaim (swarm) -- Chapitre 9 Feature Engineering -- P. 517 -- 1. Feature Engineering, les bases -- P. 541 -- 2. PCA classique, éléments mathématiques -- P. 544 -- 3. Réduction des données (data reduction) -- P. 545 -- 4. Réduction de la dimensionnalité et entropie -- Chapitre 10 Compléments utiles -- P. 557 -- 1. GAM : généralisation de LMGLM -- P. 559 -- 2. Manipulation d'images -- P. 575 -- 3. Comment créer un échantillon : LHS (hypercube latin) -- P. 577 -- 4. Travailler sur des données spatiales -- P. 590 -- 5. Savoir-faire utiles -- P. 598 -- 6. Gradients Boosting et Generalized Boosted Regression -- Annexes -- P. 605 -- 1. De l'utilité de ces annexes -- P. 605 -- 2. Formulas -- P. 607 -- 3. Stratégies suivant la nature des données -- P. 611 -- 4. Filtres (sur images) -- P. 614 -- 5. Distances -- P. 618 -- 6. Astuces et petits conseils -- P. 620 -- 7. Packages et thèmes à étudier -- P. 622 -- 8. Vocabulaire et tricks of the trade -- P. 626 -- 9. Algorithmes à étudier -- P. 627 -- 10. Quelques formulations d'algèbre linéaire -- P. 629 -- Conclusion -- P. 631 -- Index 
520 |a Un parcours didactique et professionnalisant permettant de s'intégrer à une équipe de data scientists, d'aborder des articles de recherche en langage R, ou de manager une équipe projet comprenant des data scientists. L'auteur aborde notamment des sujets comme le traitement du langage naturel, les séries temporelles, la logique floue ou encore la manipulation des images. ↑Electre 2017 
520 |a La quatrième de couverture indique : "Tous les experts s'accordent à dire que 90% des usages du Big Data proviennent de l'utilisation des data sciences. L'objectif de ce livre est de proposer une formation complète et opérationnelle sur les data-sciences qui permet de délivrer des solutions via l'usage du langage R. Ainsi, l'auteur propose un parcours didactique et professionnalisant qui, sans autre pré-requis qu'un niveau Bac en mathématiques et une grande curiosité, permet aux lecteurs : - de s'intégrer à une équipe de data-scientists, - d'aborder des articles de recherche possédant une haute teneur en mathématiques, - le cas échéant de développer en langage R, y compris des algorithmes nouveaux et de beaux graphiques, - ou tout simplement de manager une équipe projet comprenant des data scientists, en étant à même de dialoguer avec eux de façon efficace. L'ouvrage ne se cantonne pas aux algorithmes du "machine learning", il aborde divers sujets importants comme le traitement du langage naturel, les séries temporelles, la logique floue, la manipulation des images. La dynamique de l'ouvrage soutient le lecteur pas à pas dans sa découverte des data sciences, l'évolution de ses compétences théoriques et pratiques. Le praticien en exercice y découvrira également de nombreux savoir-faire à acquérir et le manager pourra surfer sur l'ouvrage après avoir lu attentivement le bestiaire des data-sciences de l'introduction, qui sans inexactitude ou vulgarisation excessive aborde le thème en faisant l'économie de mathématiques ou de formalismes dissuasifs. L'ensemble du code de tous les exemples de l'ouvrage et toutes les données traitées dans le code sont en téléchargement sur le site www.editions-eni.fr." 
650 |a Données massives 
650 |a Apprentissage automatique 
650 |a Exploration de données 
650 |a Programmation (informatique)  |x  
650 |a R (logiciel) 
993 |a Livre 
994 |a PS 
995 |a 192085727 
997 |0 346083