Comment normaliser les données dans Google Sheets

Comment normaliser les données dans Google Sheets

Si vous travaillez avec des ensembles de données plus importants dans Google Sheets, la comparaison des valeurs variables peut être un processus fastidieux. Heureusement, la normalisation est une méthode statistique qui vous aidera à trier les valeurs compliquées en ensembles de données faciles à comparer.

Cet article expliquera ce qu'est la normalisation et comment vous pouvez normaliser les données dans Google Sheets pour les avantages statistiques.

Comment normaliser les données dans Google Sheets

Supposons que nous ayons des valeurs numériques dans des cellules allant de l'A2 à A50. Pour normaliser cette plage en valeurs entre X et Y, voici ce que vous devez faire:

  1. Si votre premier point de données est dans A2, la première valeur normalisée peut être trouvée en utilisant cette formule:
    (Y-x) * ((A2-min ($ a 2 $: $ a 50 $)) / (Max ($ a 2 $: $ a 50 $) -Min ($ a 2 $: $ a 50 $))) + y
    Utilisez directement les valeurs numériques pour X et Y.

  2. Une fois que vous avez mis la formule pour le premier numéro, déplacez le curseur de la souris au bas de la cellule jusqu'à ce qu'il devienne un croisement. Ensuite, appuyez et faites glisser le curseur vers le bas pour remplir les lignes restantes avec la formule. Google Sheets remplacera automatiquement A2 par le numéro de ligne correspondant pour les cellules restantes, tandis que tout ce qui derrière $ Symboles ne changera pas.

  3. Si vous souhaitez vous référer aux valeurs de X et Y des autres cellules dans les feuilles, vous devez mettre $ S avant la ligne et la colonne des cellules dans lesquelles les valeurs sont dans (par exemple, $ d 5 $), ou copiant la formule pourrait vous donner une erreur d'analyse ou des résultats mauvais.

  4. Vos données seront désormais normalisées entre les valeurs X et Y.

La normalisation de vos données est un excellent moyen d'évaluer les différences entre deux ensembles de données avec des valeurs minimales et maximales différentes.

Comment utiliser Google Sheets comme base de données

Chaque base de données est essentiellement une grande table (ou de nombreuses tables connectées), régie par un système de gestion de base de données. Si vous travaillez avec un ensemble de données relativement petit qui n'a pas besoin de trop évoluer, Google Sheets peut être utilisé comme base de données.

Si vous souhaitez commencer à utiliser Google Sheets comme base de données, vous devrez avoir une formation en programmation de base. Vous aurez également besoin d'une API pour rendre la feuille compatible avec SQL et Python. Bien que Google offre une API complète pour ses services, il pourrait être un peu trop à gérer. Par conséquent, nous recommandons Sheet2API ou AutoCODE pour résoudre le besoin de l'API. Les services API fourniront la connexion et les authentifications nécessaires pour connecter vos feuilles Google en tant que base de données et offrir des points de terminaison suffisants pour permettre un flux de travail de base de données approprié.

Le principal avantage de l'utilisation de Google Sheets comme base de données est que vous pouvez toujours avoir un aperçu visuel de toutes les données. Étant donné que Google Sheets est disponible en tant qu'application pour les appareils mobiles et est compatible avec la plupart des navigateurs et des systèmes d'exploitation, votre base de données est accessible de n'importe où dans le monde. Vous pouvez également visiter directement et modifier les données dans la feuille elle-même, plutôt que d'utiliser du code pour exécuter une requête via la base de données pour apporter des modifications.

Cependant, Google Sheets a ses limites à la gestion des bases de données. D'une part, il y a un manque distinct de fonctions relationnelles. Les bases de données sont généralement composées de nombreuses tables utilisant des clés étrangères pour communiquer entre elles, un processus qui n'existe tout simplement pas dans une seule feuille de calcul.

Si vous souhaitez jeter un œil à un exemple, considérez les départements de votre entreprise. Dans une feuille de calcul, celles-ci ne seraient généralement que des chaînes dactylographiées. Cependant, c'est imprudent pour un ensemble de données plus important. Dans les bases de données, vous auriez un tableau séparé pour les départements de l'entreprise, chaque département numéroté en conséquence. Vous référeriez ensuite le numéro du ministère dans les données sur un employé, en utilisant une clé étrangère. Le fait d'avoir un tableau de département séparé vous permet d'apporter des modifications directes aux départements eux-mêmes sans exécuter les modifications dans l'ensemble de la base de données.

De plus, Google Sheets ne peut stocker que cinq millions de cellules à la fois. Bien que cela puisse sembler un grand nombre, même les entreprises de taille moyenne peuvent avoir des bases de données qui dépassent bien cette limite. De plus, vous atteignez les problèmes de performances beaucoup plus rapidement avant d'atteindre la limite de cellule. Avec une mise à l'échelle apparemment linéaire entre le nombre de cellules et les performances, vous aurez des retards importants lorsque vous travaillez avec une base de données contenant 100 000 cellules.

FAQ supplémentaire

Pouvez-vous insérer des données dans Google Sheets?

L'API incorporée de Google vous permet d'insérer un tableau directement à partir des fichiers. L'outil d'importation de fichiers prend en charge les extensions suivantes:

• .xls

• .xlsx

• .xlsm

• .xlt

• .xltx

• .xltm

• .ODS

• .CSV

• .SMS

• .TSV

• .languette

De plus, les logiciels tiers ont généralement des intégrations avec Google Sheets. Sheets2API et Autocode, dont nous avons déjà discuté, ont tous deux des solutions API pour fournir l'insertion de données dans les tables existantes.

Vous pouvez également utiliser la fonction Importrange pour insérer les données d'une feuille Google à une autre.

Google a également des instructions de script pour écrire du contenu dans une feuille de calcul.

Si vous parvenez à trouver une solution API qui fonctionne pour vous, vous pouvez facilement insérer des données dans Google Sheets une fois que vous l'avez connecté à votre plateforme.

Comment nettoyer les données dans Google Sheets?

Google Sheets propose plusieurs solutions pour nettoyer et trier les données.

Si vous utilisez Google Forms pour collecter les résultats de l'enquête, vous pouvez configurer des formulaires pour coller automatiquement les réponses dans une feuille de calcul, plutôt que de coller les données manuellement.

Google Sheets a également une fonctionnalité de validation des données. Si vous accédez aux données> validation des données, vous pouvez configurer des fonctionnalités de validation pour éviter des valeurs incorrectes. Par exemple, vous pouvez faire une liste d'éléments qui peuvent être placés dans une colonne particulière, et essayer d'insérer quoi que ce soit d'autre, une erreur.

Google Sheets propose également des options de «supprimer des doublons» et de «tricot Whitespace». Cela supprimera toutes les valeurs supplémentaires et les espaces blancs de vos lignes et cellules.

Si vous souhaitez coller des données plus organisées à partir de pages en ligne, utilisez Importhtml ou ImportXML pour obtenir les informations dont vous avez besoin à partir d'une page Web, sans l'encombrement supplémentaire.

Qu'est-ce que cela signifie pour normaliser les données?

Dans les statistiques, la normalisation des données vous permettra de rendre les ensembles de données variés plus comparables.

Lorsque vous normalisez les données, vous pouvez modifier la plage de valeur numérique d'origine dans une plage de votre choix. Par exemple, vous pouvez normaliser différentes méthodes de notation dans la même plage de valeur pour les comparer les unes aux autres.

La normalisation d'une valeur x provenant d'une plage (y, z) à une plage (a, b) se fait par la formule suivante:

X_ormalized = (b - a) * ((x - y) / (z - y)) + a

La normalisation des données est utile lorsque vos ensembles de données d'origine n'ont pas de valeurs propres. Par exemple, la normalisation des gammes à (0,100) peut aider à fournir un aperçu rapide des scores indépendants de la valeur maximale des scores eux-mêmes.

Une méthode statistique supplémentaire dans l'évaluation des données est la normalisation. Cela place les valeurs numériques d'origine pour avoir une moyenne de 0 et un écart-type de 1. Les valeurs standardisées sont souvent appelées scores z.

Google Sheets a une fonction qui vous permet de standardiser un ensemble de données. La fonction standardisée (x, moyenne, standard_dev) mettra la valeur numérique, x, sous sa forme standardisée. Vous pouvez utiliser la fonction moyenne (plage) pour obtenir la valeur moyenne de vos données dans le tableau et utiliser la fonction ST_DEV (plage) pour calculer l'écart type de l'ensemble de données.

L'interprétation des données standardisées est un peu différente. Par exemple, un nombre standardisé de -1.5 signifie que la valeur d'origine est inférieure à la moyenne de 1.5 fois l'écart type de l'ensemble.

La normalisation peut être utile pour comparer les valeurs de différents ensembles de données avec différentes attentes et moyens. Puisqu'une normalisation met toujours la moyenne à 0 et un écart à 1, les valeurs réelles présentées dans l'ensemble de données n'interfèrent pas avec la comparaison.

L'analyse statistique peut également transformer un ensemble de données en fonction d'une distribution particulière, mais c'est une caractéristique statistique avancée qui ne sera pas couverte dans ce guide.

NOUVELLE NORMAL

La normalisation des ensembles de données est un outil incroyablement utile dans l'analyse des données, et Google Sheets offre une solution rapide pour normaliser les données numériques. De plus, vous pouvez utiliser Google Sheets comme petite base de données, si vous ne travaillez pas avec des quantités extraordinaires d'ensembles de données pour votre travail. Les intégrations Google Sheets ont avec des logiciels tiers le rendent adapté à un large éventail d'industries. Cependant, les bases de données appropriées seront beaucoup plus évolutives.

Quel type d'informations normalisez-vous généralement dans les feuilles Google? Utilisez-vous Google Sheets pour votre base de données? Faites-nous savoir dans la section commentaires ci-dessous.