lundi 13 avril 2009

Variable sur SPSS : Numérique ou Chaîne ?

Pour définir une variable sur SPSS, il vous faut aller dans la fenêtre « Éditeur de variable » et saisir son nom dans la première colonne qui se présente. Par défaut, SPSS, attribue à cette variable un ensemble de caractéristiques dont le type s’affiche comme « Numérique » (« Numeric » en anglais). Il vous convient par la suite de changer ce type en fonction de la nature de la variable qui se présente à vous. Usuellement vous aurez affaire à trois types différents : « Numérique » , « Chaîne » (« String » en anglais » et « Date » (« Date » en anglais).
Numérique ou Chaîne, quand faudra-t-il choisir l’une ou l’autre qualification de variable ? Simple diriez-vous… ! Définir « Numérique » toute variable quantitative (exemple : âge, taille, poids) et « Chaîne » toute variable qualitative (exemple : sexe). Seulement, belle fut-elle cette réponse, l’apparence reste pourtant trompeuse. En réalité, il y a une légère confusion dans la corrélation « Numérique » et Quantitatif d’une part et « Chaîne » et Qualitatif dans l’esprit de plusieurs utilisateurs de SPSS. J’espère que ce n’est pas le cas pour le votre, mais je vous explique tout de même.
Reprenons un peu de statistiques, voulez vous bien ?
Quantitatif et Qualitatif caractérisent la nature d’une variable, et c’est-ce que la plus part d’entre nous savent bien. Ces deux termes sont des qualifications statistiques de la variable.
Par contre « Numérique » et « Chaîne » sont tout simplement une allusion à la manière de saisir les données dans SPSS. C’est-à-dire à notre façon d’entrer les données. Ils n’ont rien à voir avec la nature statistique de la variable.
Si pour une variable (quelle soit quantitative ou qualitative) nous devons saisir dans SPSS des chiffres et uniquement des chiffres, alors elle doit être définie comme « Numérique ». En voici deux exemples : - La variable âge est une variable quantitative. Les différentes données sont saisies sous la forme de nombres, et donc, l’âge doit être définit comme « Numérique » dans SPSS.- La variable sexe est belle et bien une variable qualitative à deux modalités : homme ou femme (à moins que vous connaissez un autre genre humain !). Mais, vous le savez, sûrement bien, qu’avant de saisir cette variable qualitative, nous procédons à son codage. Disons 1 pour homme et 2 pour femme. Ces chiffres sont les données que vous aller saisir dans SPSS. Alors et dans ce cas, la variable sexe doit être définie comme « Numérique ». Curieux, non ? Pourtant c’est vrai !

Lorsque nous saisissons des chiffres sur SPSS, la variable est définie comme « Numérique » et ce quelque soit sa nature : Quantitative ou Qualitative ! Par contre lorsque vous vous trouvez dans la situation ou vous devez entrer des lettres (avec ou sans nombres), comme dans le cas des classifications des maladies, vous êtes obligés alors, dans ce cas, de saisir les données en tant que variable « Chaîne ». Autrement SPSS ne pourra pas vous autoriser à taper des lettres.
Il s’agit donc de faire la distinction entre Quantitatif et Qualitatif d’une part, et Numérique et Chaîne d’autre part ! C’est très simple comme vous le voyez, et avec un peu d’exercice, vous vous rendrez compte de l’importance de cette nuance. Le type « Chaîne » ne permet pas à SPSS de réaliser certains tests statistiques, qui pourtant vous seraient indispensables. Je cite par exemple : la procédure ANOVA.

Aucun commentaire:

Enregistrer un commentaire