Comment lire la sortie de SPSS K-Means

L'analyse de clustering est une technique statistique utilisée pour organiser les cas en catégories de sorte que les cas de chaque catégorie soient similaires les uns aux autres et différents des cas des autres catégories. Chaque catégorie est un cluster. Les sociologues utilisent SPSS (Statistical Package for the Social Sciences) pour effectuer des analyses de grappes. Dans le clustering K-Means, le chercheur désigne le nombre de clusters souhaité. K est le nombre de grappes que les chercheurs indiquent vouloir. Le clustering K-Means permet aux chercheurs de regrouper de très grands ensembles de données.

Analyser les données

Étape 1

Cliquez sur "Analyser" en haut de l'écran SPSS. Sélectionnez "Classifier" dans le menu déroulant et "K-Means Cluster".

Étape 2

Sélectionnez un échantillon de cas. Dans la boîte de dialogue, cliquez sur "Variables" et mettez en surbrillance les variables que vous souhaitez utiliser dans l'analyse K-Means initiale. Cliquez sur la flèche gauche pour déplacer les variables dans la boîte. Définissez le nombre de clusters, généralement 5 dans un ensemble de données de taille moyenne, dans la case "Nombre de clusters". Le nombre de grappes doit être supérieur à deux et pas supérieur au nombre de cas. Cliquez sur « Itérer et classer » dans la boîte de dialogue pour obtenir les centres de cluster. Cliquez sur "Ecrire la finale".

Incluez l'intégralité du fichier de données pour l'analyse K-Means finale. Cliquez sur "Analyser" en haut de l'écran SPSS. Sélectionnez "Classifier" dans le menu déroulant et "K-Means Cluster". Dans la boîte de dialogue, sélectionnez "Variables" et mettez en surbrillance les variables que vous souhaitez utiliser. Cliquez sur la flèche gauche. Définissez le nombre de clusters à 5 dans la case "Nombre de clusters". Cliquez sur "Classifier" dans la boîte de dialogue. Choisissez "Read Initial" pour obtenir les centres de cluster de l'échantillon à l'étape 2. Cliquez sur "Enregistrer". Cliquez sur « Adhésion au cluster ». Cliquez sur "Continuer".

Lire la sortie

Étape 1

Passez en revue le premier tableau de la sortie, intitulé "Centres de cluster final". Le haut du tableau comporte les numéros 1 à 5, indiquant chacun des 5 groupes. La colonne de gauche répertorie le « score du facteur REGR » (score du facteur de régression ou dans quelle mesure chaque variable prédit le score) pour chacune des analyses. Si vous suivez la ligne à côté du score 1 pour l'analyse 1 vers la droite, cela vous donnera le score factoriel pour chaque cluster.

Étape 2

Lisez le tableau suivant dans le résultat intitulé « Nombre de cas dans chaque cluster ». La case à gauche répertorie les grappes par numéro, de 1 à 5. Suivez le numéro de grappe à droite et vous trouverez le nombre de cas dans cette grappe.

Examinez le dernier tableau de la sortie, « appartenance au cluster », qui indique les cas qui se trouvent dans chaque cluster. Les cas sont répertoriés dans la colonne de gauche et le numéro de cluster se trouve dans la colonne à l'extrême droite.