De quel département êtes-vous ?

Vos informations générales

Quel est votre objectif ?

Quel est le nombre d'utilisateurs
pour votre projet ?

A quelle étape vous trouvez-vous actuellement ?

Quel est le délais de mise en place que vous souhaitez ?

Précédent

Déclenchez le signal !
Nous sommes les héros de Tableau Software, Microsoft Power BI et Alteryx ? Découvrez quelques unes de nos réalisations Let's rock ! Led Zeppelin et le basketball français en statistiques.

Maîtrisez votre temps !
Nous travaillons avec les outils Snowflake, Gathering Tools et Alteryx. Découvrez le retour de nos clientsOney Data et Keolis

Votre futur vous attend !

Découvrez notre Data Driven Journey et la solution Alteryx.

Rassemblons vos forces !

Découvrez notre Data Driven Journey et notre communauté. Renseignez-vous sur nos formation au Data-Universe.

Drive your insights!

Découvrez notre Communauté et nos réalisations Let's rock ! Led Zeppelin et la gestion d'une équipe de basketball en statistiques.

Évoluez à l'infini et au-delà !

Découvrez notre méthode exclusive : Data Driven Journey. Accédez à notre panel de formations.

17 Mar 2020.

Episode 3 / Azure COSMO DB

Episode 3 / Azure COSMO DB

Dans la série AZURE DATA PLATFORM, nous allons vous présenter dans cet article le service COSMO DB que propose AZURE.

AZURE COSMO DB est un service Azure permettant la réplication des données en temps réel dans les différents data center Azure de la planète. C’est un service de base de données multi-modèle qui peut être dimensionné facilement et rapidement grâce au portail Azure et/ou aux API disponibles.

 


Présentation d’Azure Cosmo DB

 

Ce service bénéficie également de la force des infrastructures Azure pour proposer un service en haute disponibilité à 99,999% pour les lectures et écritures.

Cosmo DB est une base de données NoSQL (Not Only SQL) distribuée à l’échelle mondiale. Dans un monde où les données évoluent sans cesse, où toutes les informations doivent être accessibles quasi instantanément, le stockage des données NoSQL est devenu incontournable. En effet, les bases de données « classiques » relationnelles connaissent leurs limites quand il s’agit de traiter de grosses volumétries de données.

Azure Cosmo DB offre des capacités d’évolution, de réplication et de partitionnement horizontal pour un débit élevé, une faible latence (les données se trouvent au plus proches des utilisateurs), et une haute disponibilité.

Migration des données
dans Cosmo DB

 

Azure propose un outil de migration des données dans Azure COSMO DB. Voici les différentes sources de données :

  • Fichiers JSON
  • Fichiers CSV
  • MS SQL Server
  • MongoDB
  • Fichier d’exportation MongoDB
  • Stockage Table Azure
  • Amazon DynamoDB
  • Objets BLOB
  • Conteneurs Cosmos Azure
  • HBase

 

Utilisez l’outil de migration de données pour migrer vos données vers Azure COSMO DB

 

API et Développement

 

Azure COSMO DB est accessible via plusieurs interfaces. Les développeurs pourront interagir avec les données grâce à :

  • SQL API
  • API Mongo DB
  • API Cassandra
  • API Gemlin
  • Azure Table Storage

 

POWER BI, connecter
des outils décisionnels :

 

Pour pouvoir utiliser ses données dans un outil décisionnel comme Power BI, Microsoft propose un connecteur Azure Cosmo DB natif.

 


Accès à Azure Cosmo DB

 

Mais il est également possible d’utiliser un driver ODBC pour se connecter avec un autre outil

 

Les données dans Azure Cosmos DB étant dé-normalisées, le driver ODBC vous permettra de normaliser vos données dans des tables ou des vues en fonction de vos besoins d’analyses.

 

Tarification

 

Le service Azure Cosmo DB est facturé en fonction du stockage et du débit provisionné. Le stockage est facturé à l’heure pour chaque Go consommé et chaque région. Le débit est mesuré en unité de requête (RU) par seconde.

 


Schéma de la répartition des Request Unit en fonction du stockage

 

Pour estimer le nombre de Request Units à provisionner, il faut prendre en compte la taille d’un élément, la complexité des requêtes, les index, le nombre de propriétés d’un élément …

À titre d’exemple pour une volumétrie estimée à 100 Go, les données répliquées dans 3 régions Azure et 200 RU/s et pour 3 régions, le coût mensuel associé du service Cosmo DB est estimé à 350$.

 


exemple de tarification

 

Tarification Azure COSMOS DB

Un outil Azure pour estimer le coût du service

 

Cas d’usages

 

Cosmo DB est fait pour tous les usages qui nécessitent un temps d’accès à faible latence et haute disponibilité, voici quelques cas d’usages pour exemple :

  • Applications distribuées à l’échelle mondiale
  • IT, télémétrie, ingestion d’énormes volumes de données provenant de sources/d’appareils différents
  • Plateforme e-commerce, avoir les données au plus près de ses clients pour des performances optimales
  • Journalisation, analyse opérationnelle. Applications qui stockent et analysent d’énormes volumes de données de log.
  • Jeux/Réseaux Sociaux. Applications qui doivent gérer des pics d’utilisations et proposer aux utilisateurs un temps de latence très faible pour une expérience optimale

 

Azure Synapse Analytics
(évolution de SQL Datawarehouse) :

 

Un nouveau service azure est né fin 2019 pour venir compléter les services azure autour de la donnée. Ce service nommé Azure Synapse Analytics vient remplacer Azure SQL Datawarehouse, et propose l’entreposage de données, mais également de l’analyse Big Data.

 


mapping Azure Synapse Analytics

 

Ce nouveau service permet la gestion de données relationnelles et non relationnelles, dans un environnement unifié pour l’ingestion, la préparation et la distribution des données.

Vous souhaitez en savoir plus sur Azure Cosmo DB ?
Contactez-nous !

A propos de l’auteur

Julien Larcher / Senior Analytics Consultant Actinvision