Fermer

    De quel département êtes-vous ?

    Vos informations générales

    Quel est votre objectif ?

    Quel est le nombre d'utilisateurs
    pour votre projet ?

    A quelle étape vous trouvez-vous actuellement ?

    Quel est le délais de mise en place que vous souhaitez ?

    Précédent

    Déclenchez le signal !
    Nous sommes les héros de Tableau Software, Microsoft Power BI et Alteryx ? Découvrez quelques unes de nos réalisations Let's rock ! Led Zeppelin et le basketball français en statistiques.

    Maîtrisez votre temps !
    Nous travaillons avec les outils Snowflake, Gathering Tools et Alteryx. Découvrez le retour de nos clientsOney Data et Keolis

    Votre futur vous attend !

    Découvrez notre Data Driven Journey et la solution Alteryx.

    Rassemblons vos forces !

    Découvrez notre Data Driven Journey et notre communauté. Renseignez-vous sur nos formation au Data-Universe.

    Drive your insights!

    Découvrez notre Communauté et nos réalisations Let's rock ! Led Zeppelin et la gestion d'une équipe de basketball en statistiques.

    Évoluez à l'infini et au-delà !

    Découvrez notre méthode exclusive : Data Driven Journey. Accédez à notre panel de formations.

    Episode 3
    Azure COSMO DB

     

    Dans la série AZURE DATA PLATFORM, nous allons vous présenter dans cet article le service COSMO DB que propose AZURE.

    AZURE COSMO DB est un service Azure permettant la réplication des données en temps réel dans les différents data center Azure de la planète. C’est un service de base de données multi-modèle qui peut être dimensionné facilement et rapidement grâce au portail Azure et/ou aux API disponibles.

    Ce service bénéficie également de la force des infrastructures Azure pour proposer un service en haute disponibilité à 99,999% pour les lectures et écritures.

    Cosmo DB est une base de données NoSQL (Not Only SQL) distribuée à l’échelle mondiale. Dans un monde où les données évoluent sans cesse, où toutes les informations doivent être accessibles quasi instantanément, le stockage des données NoSQL est devenu incontournable. En effet, les bases de données « classiques » relationnelles connaissent leurs limites quand il s’agit de traiter de grosses volumétries de données.

    Azure Cosmo DB offre des capacités d’évolution, de réplication et de partitionnement horizontal pour un débit élevé, une faible latence (les données se trouvent au plus proches des utilisateurs), et une haute disponibilité.

    Migration des données dans Cosmo DB

    Azure propose un outil de migration des données dans Azure COSMO DB. Voici les différentes sources de données :

    • Fichiers JSON
    • Fichiers CSV
    • MS SQL Server
    • MongoDB
    • Fichier d’exportation MongoDB
    • Stockage Table Azure
    • Amazon DynamoDB
    • Objets BLOB
    • Conteneurs Cosmos Azure
    • HBase

    Utilisez l’outil de migration de données pour migrer vos données vers Azure COSMO DB

    API et Développement

    Azure COSMO DB est accessible via plusieurs interfaces. Les développeurs pourront interagir avec les données grâce à :

    • SQL API
    • API Mongo DB
    • API Cassandra
    • API Gemlin
    • Azure Table Storage
    POWER BI, connecter des outils décisionnels 

     

    Pour pouvoir utiliser ses données dans un outil décisionnel comme Power BI, Microsoft propose un connecteur Azure Cosmo DB natif.

    Mais il est également possible d’utiliser un driver ODBC pour se connecter avec un autre outil

    Les données dans Azure Cosmos DB étant dé-normalisées, le driver ODBC vous permettra de normaliser vos données dans des tables ou des vues en fonction de vos besoins d’analyses.

    Tarification

     

    Le service Azure Cosmo DB est facturé en fonction du stockage et du débit provisionné. Le stockage est facturé à l’heure pour chaque Go consommé et chaque région. Le débit est mesuré en unité de requête (RU) par seconde.

    Pour estimer le nombre de Request Units à provisionner, il faut prendre en compte la taille d’un élément, la complexité des requêtes, les index, le nombre de propriétés d’un élément …

    À titre d’exemple pour une volumétrie estimée à 100 Go, les données répliquées dans 3 régions Azure et 200 RU/s et pour 3 régions, le coût mensuel associé du service Cosmo DB est estimé à 350$.

    Tarification Azure COSMOS DB

    Un outil Azure pour estimer le coût du service

    Cas d’usages

     

    Cosmo DB est fait pour tous les usages qui nécessitent un temps d’accès à faible latence et haute disponibilité, voici quelques cas d’usages pour exemple :

    • Applications distribuées à l’échelle mondiale
    • IT, télémétrie, ingestion d’énormes volumes de données provenant de sources/d’appareils différents
    • Plateforme e-commerce, avoir les données au plus près de ses clients pour des performances optimales
    • Journalisation, analyse opérationnelle. Applications qui stockent et analysent d’énormes volumes de données de log.
    • Jeux/Réseaux Sociaux. Applications qui doivent gérer des pics d’utilisations et proposer aux utilisateurs un temps de latence très faible pour une expérience optimale
    Azure Synapse Analytics (évolution de SQL Datawarehouse) 

     

    Un nouveau service azure est né fin 2019 pour venir compléter les services azure autour de la donnée. Ce service nommé Azure Synapse Analytics vient remplacer Azure SQL Datawarehouse, et propose l’entreposage de données, mais également de l’analyse Big Data.

     

    Ce nouveau service permet la gestion de données relationnelles et non relationnelles, dans un environnement unifié pour l’ingestion, la préparation et la distribution des données.

    Vous souhaitez en savoir plus sur Azure Cosmo DB ?
    Contactez-nous !
    A propos de l’auteur

    Julien Larcher / Senior Analytics Consultant Actinvision