Introduction
La Data science, aussi nommé science des données, se situe à l'intersection de l'informatique, des statistiques et des domaines d'application de fond. De l'informatique naissent l'apprentissage automatique (ML) et les technologies de calcul haute performance pour gérer l'échelle. Les statistiques découlent d'une longue tradition d'analyse exploratoire des données, de tests de signification et de visualisation. Des domaines d'application dans les affaires et les sciences viennent des défis dignes de bataille et des normes d'évaluation pour évaluer quand ils ont été correctement conquis.
Elle propose principalement de résoudre les problèmes suivants :
- Elle permet de capturer, d'annoter et d'entreposer de grandes quantités de données de médias sociaux, de journalisation et de capteurs. Après avoir rassemblé toutes ces données, elle commence à demander ce qu'on peut en faire.
- Elle permet d'analyser les données de manière innovante et à des échelles toujours plus nombreuses. Les architectures d'infonuagiques donnent même aux plus petits accès à une puissance considérable lorsqu'ils en ont besoin. Les nouvelles approches de l'apprentissage automatique ont conduit à des progrès incroyables dans des problèmes de longue date, tels que la vision par ordinateur (CV) et le traitement du langage naturel.
Liste des solutions
Voici la liste des solutions pour les plus communes pour la Data Science :
Catégorie | Produits |
---|---|
Logiciel de bureautique | Excel |
Logiciel avec interface graphique | SAS, SPSS, Tanagra, Statistica, RapidMiner,... |
Logiciel en ligne de commandes | Matlab, GNU Octave, Python (SciPy, NumPy, scikit-learn,...), R,... |
Logiciel avec base de données | SQL (Oracle SQL Developer, PL/SQL Developer,...), Hadoop (Hive, Pig,...), D3JS,... |
Liste des sources de données
Voici la liste des sources de données sur laquelle on peut basé des travaux scientifiques de données :
Catégorie | Produits | Type | Date de création |
---|---|---|---|
Fournisseur d'ensembles de données | Bright Data | Commercial | 2014 |
Fournisseur d'ensembles de données | Oxylabs | Commercial | 2015 |