Infrastructure de pointe
La DataBank regroupe des ensembles de données riches et diversifiés provenant de différentes sources et classés par des analystes. S’appuyant sur la puissance de Microsoft Azure et d’Azure Data Factory, la DataBank permet l’ingestion et l’extraction de données tirées de milliers de référentiels publics, et ce, de manière transparente.
Les données sont recueillies sous divers formats, y compris sous forme structurée (bases de données CSV, JSON et SQL, interfaces de programmation d’applications et fichiers Parquet) ou non structurée (documents PDF). Elles sont ensuite intégrées à l’aide des connecteurs d’Azure Data Factory. Une fois traitées, les données sont stockées dans Azure selon une structure à niveaux multiples en fonction de l’étape de traitement.
Les données de la DataBank sont classées selon trois étapes :
Bronze
Données brutes
Argent
Données soumises au processus d’extraction, de transformation et de chargement des données
Or
Données enrichies grâce à l’apprentissage automatique
La majorité des données de la DataBank se trouvent à l’étape Argent et peuvent être soumises à des analyses descriptives ou en temps réel. Quelques ensembles de données se situent à l’étape Bronze. Les ensembles de données traités grâce à l’apprentissage automatique à la demande de clients seront classés Or.
Ce que nous faisons
- Ingestion de données transparente
Misez sur la puissance de Microsoft Azure afin d’extraire facilement des données de milliers de sources publiques. Nos pipelines dans Azure Data Factory permettent de traiter facilement de grands volumes de données diversifiées. - Traitement avancé des données
Utilisez le vaste écosystème de données de Python pour une visualisation, des manipulations et des analyses approfondies. Nos outils comblent l’écart entre les données brutes et la science des données avancée. - Intégration de l’IA
Lorsque vos données ont été enrichies, vous pouvez les intégrer à Azure Machine Learning ou à Azure AI Studio afin d’ouvrir la voie à l’innovation et au progrès.