Section courante

A propos

Section administrative du site

Introduction

La Data science, aussi nommé science des données, se situe à l'intersection de l'informatique, des statistiques et des domaines d'application de fond. De l'informatique naissent l'apprentissage automatique (ML) et les technologies de calcul haute performance pour gérer l'échelle. Les statistiques découlent d'une longue tradition d'analyse exploratoire des données, de tests de signification et de visualisation. Des domaines d'application dans les affaires et les sciences viennent des défis dignes de bataille et des normes d'évaluation pour évaluer quand ils ont été correctement conquis.

Elle propose principalement de résoudre les problèmes suivants :

Liste des solutions

Voici la liste des solutions pour les plus communes pour la Data Science :

Catégorie Produits
Logiciel de bureautique Excel
Logiciel avec interface graphique SAS, SPSS, Tanagra, Statistica, RapidMiner,...
Logiciel en ligne de commandes Matlab, GNU Octave, Python (SciPy, NumPy, scikit-learn,...), R,...
Logiciel avec base de données SQL (Oracle SQL Developer, PL/SQL Developer,...), Hadoop (Hive, Pig,...), D3JS,...

Liste des sources de données

Voici la liste des sources de données sur laquelle on peut basé des travaux scientifiques de données :

Catégorie Produits Type Date de création
Fournisseur d'ensembles de données Bright Data Commercial 2014
Fournisseur d'ensembles de données Oxylabs Commercial 2015


Dernière mise à jour : Lundi, le 12 août 2019