Data scientist et langage R : guide d'autoformation à l'exploitation des big data
Enregistré dans:
Auteur principal: | |
---|---|
Support: | Livre |
Langue: | Français |
Publié: |
St Herblain :
Éditions ENI,
cop. 2016.
|
Collection: | Epsilon
|
Sujets: | |
Autres localisations: | Voir dans le Sudoc |
Résumé: | Un parcours didactique et professionnalisant permettant de s'intégrer à une équipe de data scientists, d'aborder des articles de recherche en langage R, ou de manager une équipe projet comprenant des data scientists. L'auteur aborde notamment des sujets comme le traitement du langage naturel, les séries temporelles, la logique floue ou encore la manipulation des images. ↑Electre 2017 |
Table des matières:
- Chapitre 1 Introduction
- P. 15
- 1. Data scientist, un métier à la mode
- P. 16
- 2. Les data-sciences
- P. 17
- 3. Le Big Data
- P. 18
- 4. La dynamique de cet ouvrage
- P. 24
- 5. Petit bestiaire des data-services
- P. 70
- 6. Informatique professionnelle et data-sciences
- P. 76
- 7. Notations
- P. 81
- 8. À vous de jouer !
- Chapitre 2 Premiers pas avec R
- P. 83
- 1. Installation des composants
- P. 90
- 2. Prise en main de R
- P. 179
- 3. Manipulation des données
- Chapitre 3 Maîtriser les bases
- P. 215
- 1. Se mettre en harmonie avec les données
- P. 249
- 2. Matrices et vecteurs
- P. 279
- 3. Estimations
- P. 302
- 4. Mise en pratique : apprentissage supervisé
- Chapitre 4 Techniques et algorithmes incontournables
- P. 325
- 1. Constituer sa boîte à outils
- P. 326
- 2. Représentation graphique des données
- P. 346
- 3. Machine learning : pratiques courantes
- P. 393
- 4. Où en sommes-nous dans notre apprentissage ?
- Chapitre 5 Cadre méthodologique du data scientist
- P. 395
- 1. Le problème méthodologique au niveau du projet
- P. 399
- 2. Le cycle interne des data-sciences
- P. 411
- 3. Compléments méthodologiques
- Chapitre 6 Traitement du langage naturel
- P. 415
- 1. Positionnement du problème
- P. 416
- 2. Analyse sémantique latente et SVD
- Chapitre 7 Graphes et réseaux
- P. 431
- 1. Introduction
- P. 431
- 2. Premiers pas
- P. 449
- 3. Graphes et réseaux (sociaux)
- Chapitre 8 Autres problèmes, autres solutions
- P. 465
- 1. Séries temporelles
- P. 499
- 2. Systèmes flous
- P. 509
- 3. Essaim (swarm)
- Chapitre 9 Feature Engineering
- P. 517
- 1. Feature Engineering, les bases
- P. 541
- 2. PCA classique, éléments mathématiques
- P. 544
- 3. Réduction des données (data reduction)
- P. 545
- 4. Réduction de la dimensionnalité et entropie
- Chapitre 10 Compléments utiles
- P. 557
- 1. GAM : généralisation de LMGLM
- P. 559
- 2. Manipulation d'images
- P. 575
- 3. Comment créer un échantillon : LHS (hypercube latin)
- P. 577
- 4. Travailler sur des données spatiales
- P. 590
- 5. Savoir-faire utiles
- P. 598
- 6. Gradients Boosting et Generalized Boosted Regression
- Annexes
- P. 605
- 1. De l'utilité de ces annexes
- P. 605
- 2. Formulas
- P. 607
- 3. Stratégies suivant la nature des données
- P. 611
- 4. Filtres (sur images)
- P. 614
- 5. Distances
- P. 618
- 6. Astuces et petits conseils
- P. 620
- 7. Packages et thèmes à étudier
- P. 622
- 8. Vocabulaire et tricks of the trade
- P. 626
- 9. Algorithmes à étudier
- P. 627
- 10. Quelques formulations d'algèbre linéaire
- P. 629
- Conclusion
- P. 631
- Index