|
|
|
|
LEADER |
05821nam a22003257a 4500 |
001 |
346083 |
008 |
160322t20162016xxe ||| |||| 00| 0 fre d |
020 |
|
|
|a 9782409000430 (br.) :
|c 54 EUR
|
024 |
|
|
|a 9782409000430
|
041 |
0 |
|
|a fre
|
082 |
|
|
|a 005.74
|z fre
|
100 |
1 |
|
|a Laude, Henri.
|
245 |
1 |
0 |
|a Data scientist et langage R :
|b guide d'autoformation à l'exploitation des big data
|c [Henri Laude].
|
260 |
|
|
|a St Herblain :
|b Éditions ENI,
|c cop. 2016.
|
300 |
|
|
|a 1 vol. (663 p.) :
|b ill., couv. ill. en coul. ;
|c 22 cm.
|
490 |
1 |
|
|a Epsilon
|x 1960-3444
|
500 |
|
|
|a En annexe, choix de documents
|
504 |
|
|
|a Index
|
505 |
0 |
|
|a Chapitre 1 Introduction -- P. 15 -- 1. Data scientist, un métier à la mode -- P. 16 -- 2. Les data-sciences -- P. 17 -- 3. Le Big Data -- P. 18 -- 4. La dynamique de cet ouvrage -- P. 24 -- 5. Petit bestiaire des data-services -- P. 70 -- 6. Informatique professionnelle et data-sciences -- P. 76 -- 7. Notations -- P. 81 -- 8. À vous de jouer ! -- Chapitre 2 Premiers pas avec R -- P. 83 -- 1. Installation des composants -- P. 90 -- 2. Prise en main de R -- P. 179 -- 3. Manipulation des données -- Chapitre 3 Maîtriser les bases -- P. 215 -- 1. Se mettre en harmonie avec les données -- P. 249 -- 2. Matrices et vecteurs -- P. 279 -- 3. Estimations -- P. 302 -- 4. Mise en pratique : apprentissage supervisé -- Chapitre 4 Techniques et algorithmes incontournables -- P. 325 -- 1. Constituer sa boîte à outils -- P. 326 -- 2. Représentation graphique des données -- P. 346 -- 3. Machine learning : pratiques courantes -- P. 393 -- 4. Où en sommes-nous dans notre apprentissage ? -- Chapitre 5 Cadre méthodologique du data scientist -- P. 395 -- 1. Le problème méthodologique au niveau du projet -- P. 399 -- 2. Le cycle interne des data-sciences -- P. 411 -- 3. Compléments méthodologiques -- Chapitre 6 Traitement du langage naturel -- P. 415 -- 1. Positionnement du problème -- P. 416 -- 2. Analyse sémantique latente et SVD -- Chapitre 7 Graphes et réseaux -- P. 431 -- 1. Introduction -- P. 431 -- 2. Premiers pas -- P. 449 -- 3. Graphes et réseaux (sociaux) -- Chapitre 8 Autres problèmes, autres solutions -- P. 465 -- 1. Séries temporelles -- P. 499 -- 2. Systèmes flous -- P. 509 -- 3. Essaim (swarm) -- Chapitre 9 Feature Engineering -- P. 517 -- 1. Feature Engineering, les bases -- P. 541 -- 2. PCA classique, éléments mathématiques -- P. 544 -- 3. Réduction des données (data reduction) -- P. 545 -- 4. Réduction de la dimensionnalité et entropie -- Chapitre 10 Compléments utiles -- P. 557 -- 1. GAM : généralisation de LMGLM -- P. 559 -- 2. Manipulation d'images -- P. 575 -- 3. Comment créer un échantillon : LHS (hypercube latin) -- P. 577 -- 4. Travailler sur des données spatiales -- P. 590 -- 5. Savoir-faire utiles -- P. 598 -- 6. Gradients Boosting et Generalized Boosted Regression -- Annexes -- P. 605 -- 1. De l'utilité de ces annexes -- P. 605 -- 2. Formulas -- P. 607 -- 3. Stratégies suivant la nature des données -- P. 611 -- 4. Filtres (sur images) -- P. 614 -- 5. Distances -- P. 618 -- 6. Astuces et petits conseils -- P. 620 -- 7. Packages et thèmes à étudier -- P. 622 -- 8. Vocabulaire et tricks of the trade -- P. 626 -- 9. Algorithmes à étudier -- P. 627 -- 10. Quelques formulations d'algèbre linéaire -- P. 629 -- Conclusion -- P. 631 -- Index
|
520 |
|
|
|a Un parcours didactique et professionnalisant permettant de s'intégrer à une équipe de data scientists, d'aborder des articles de recherche en langage R, ou de manager une équipe projet comprenant des data scientists. L'auteur aborde notamment des sujets comme le traitement du langage naturel, les séries temporelles, la logique floue ou encore la manipulation des images. ↑Electre 2017
|
520 |
|
|
|a La quatrième de couverture indique : "Tous les experts s'accordent à dire que 90% des usages du Big Data proviennent de l'utilisation des data sciences. L'objectif de ce livre est de proposer une formation complète et opérationnelle sur les data-sciences qui permet de délivrer des solutions via l'usage du langage R. Ainsi, l'auteur propose un parcours didactique et professionnalisant qui, sans autre pré-requis qu'un niveau Bac en mathématiques et une grande curiosité, permet aux lecteurs : - de s'intégrer à une équipe de data-scientists, - d'aborder des articles de recherche possédant une haute teneur en mathématiques, - le cas échéant de développer en langage R, y compris des algorithmes nouveaux et de beaux graphiques, - ou tout simplement de manager une équipe projet comprenant des data scientists, en étant à même de dialoguer avec eux de façon efficace. L'ouvrage ne se cantonne pas aux algorithmes du "machine learning", il aborde divers sujets importants comme le traitement du langage naturel, les séries temporelles, la logique floue, la manipulation des images. La dynamique de l'ouvrage soutient le lecteur pas à pas dans sa découverte des data sciences, l'évolution de ses compétences théoriques et pratiques. Le praticien en exercice y découvrira également de nombreux savoir-faire à acquérir et le manager pourra surfer sur l'ouvrage après avoir lu attentivement le bestiaire des data-sciences de l'introduction, qui sans inexactitude ou vulgarisation excessive aborde le thème en faisant l'économie de mathématiques ou de formalismes dissuasifs. L'ensemble du code de tous les exemples de l'ouvrage et toutes les données traitées dans le code sont en téléchargement sur le site www.editions-eni.fr."
|
650 |
|
|
|a Données massives
|
650 |
|
|
|a Apprentissage automatique
|
650 |
|
|
|a Exploration de données
|
650 |
|
|
|a Programmation (informatique)
|x
|
650 |
|
|
|a R (logiciel)
|
993 |
|
|
|a Livre
|
994 |
|
|
|a PS
|
995 |
|
|
|a 192085727
|
997 |
|
|
|0 346083
|