La science des données est un domaine interdisciplinaire qui utilise des méthodes, des algorithmes, des processus et des systèmes pour extraire des connaissances et des conclusions à partir de données structurées et non structurées. Elle combine des éléments de statistiques, d'informatique, de mathématiques et de techniques analytiques pour résoudre des problèmes, faire des prédictions et valoriser les données. Elle exploite le Big Data pour révéler des modèles, des tendances et des relations utiles à la prise de décision dans divers secteurs. Elle constitue un support important pour l'intelligence artificielle. La science des données utilise deux types de techniques : l'apprentissage supervisé, qui entraîne un modèle avec des données d'entrée et de sortie connues pour prédire les résultats futurs, et l'apprentissage non supervisé, qui découvre des modèles cachés ou des structures intrinsèques dans les données d'entrée. La plupart de ces techniques d'apprentissage non supervisé sont développées dans cet ouvrage d'un point de vue méthodologique et pratique, avec des applications à travers le logiciel Python. Les techniques suivantes sont abordées : réduction de dimension, analyse en composantes principales, analyse factorielle, analyse des correspondances simples, analyse des correspondances multiples, mise à l'échelle multidimensionnelle, réseaux neuronaux (SOM Kohonen, etc.), reconnaissance de formes, détection d'anomalies, auto-encodeurs, traitement d'images et réseaux neuronaux convolutifs (CNN).
Dieser Download kann aus rechtlichen Gründen nur mit Rechnungsadresse in A, B, CY, CZ, D, DK, EW, E, FIN, F, GR, H, IRL, I, LT, L, LR, M, NL, PL, P, R, S, SLO, SK ausgeliefert werden.