-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathCLUSTER JERARQUICO
198 lines (171 loc) · 5.02 KB
/
CLUSTER JERARQUICO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
cluster jerarquico
*1. ABRIMOS BASE DE DATOS CLUSTERS.
GET
FILE='C:\Users\Adrian\Documents\UMSS\Seminario de estadistica\bases de datos cluster\cluster.sav '.
*Medida de asociacion
* METODOS JERARQUICOS: para formar un clusters separan los cluster que ya existen y minimizan las distancias
asocioan
disocian
METODOS NO JERARQUICOS clasificar a los inidviduos en k grupos, elige la mejor parcicion
no aplicable a la poblacion (solo para unn grupo)
*2.Analisis Exploratorio (busqueda de datos atipicos)
EXAMINE VARIABLES=V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21
/ID=V1
/PLOT BOXPLOT STEMLEAF HISTOGRAM NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
*dendograma
metodo: enlace entre grupos
CLUSTER V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21
/METHOD BAVERAGE
/MEASURE=SEUCLID
/ID=V1
/PRINT SCHEDULE
/PLOT DENDROGRAM VICICLE.
*puntuaiones z
DATASET DECLARE D0.2206322691698983.
PROXIMITIES V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21
/MATRIX OUT(D0.2206322691698983)
/VIEW=CASE
/MEASURE=SEUCLID
/PRINT NONE
/ID=V1
/STANDARDIZE=VARIABLE Z.
CLUSTER
/MATRIX IN(D0.2206322691698983)
/METHOD BAVERAGE
/ID=V1
/PRINT SCHEDULE
/PLOT DENDROGRAM VICICLE.
Dataset Close D0.2206322691698983.
*dentro grupos.
DATASET DECLARE D0.9294952277493658.
PROXIMITIES V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21
/MATRIX OUT(D0.9294952277493658)
/VIEW=CASE
/MEASURE=SEUCLID
/PRINT NONE
/ID=V1
/STANDARDIZE=VARIABLE Z.
CLUSTER
/MATRIX IN(D0.9294952277493658)
/METHOD WAVERAGE
/ID=V1
/PRINT SCHEDULE
/PLOT DENDROGRAM VICICLE.
Dataset Close D0.9294952277493658.
*vecino más cercano.
DATASET DECLARE D0.611599186463565.
PROXIMITIES V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21
/MATRIX OUT(D0.611599186463565)
/VIEW=CASE
/MEASURE=SEUCLID
/PRINT NONE
/ID=V1
/STANDARDIZE=VARIABLE Z.
CLUSTER
/MATRIX IN(D0.611599186463565)
/METHOD SINGLE
/ID=V1
/PRINT SCHEDULE
/PLOT DENDROGRAM VICICLE.
Dataset Close D0.611599186463565.
*vecino más lejano.
DATASET DECLARE D0.24288768870097277.
PROXIMITIES V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21
/MATRIX OUT(D0.24288768870097277)
/VIEW=CASE
/MEASURE=SEUCLID
/PRINT NONE
/ID=V1
/STANDARDIZE=VARIABLE Z.
CLUSTER
/MATRIX IN(D0.24288768870097277)
/METHOD COMPLETE
/ID=V1
/PRINT SCHEDULE
/PLOT DENDROGRAM VICICLE.
Dataset Close D0.24288768870097277.
*Datos de intervalo:::::medida: d euclidia //al cuadrado
datos de frecuencia:::::medida chi cuadrado/ phi cuadrado
datos binarios:::::::::::D. euclidea al cuadrado, dif de tamaño, dif de configuracion, arianza, dispercion (..)
*Historial de conglomeracion: como los grupos se conformaron en cada eteapa
*solucion unica (3)
veciino más cercano
DATASET DECLARE D0.4906208559693894.
PROXIMITIES V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21
/MATRIX OUT(D0.4906208559693894)
/VIEW=CASE
/MEASURE=SEUCLID
/PRINT NONE
/ID=V1
/STANDARDIZE=VARIABLE Z.
CLUSTER
/MATRIX IN(D0.4906208559693894)
/METHOD SINGLE
/ID=V1
/PRINT SCHEDULE
/PLOT DENDROGRAM VICICLE
/SAVE CLUSTER(3).
Dataset Close D0.4906208559693894.
*wARD.
DATASET DECLARE D0.6195007235656518.
PROXIMITIES V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21
/MATRIX OUT(D0.6195007235656518)
/VIEW=CASE
/MEASURE=SEUCLID
/PRINT NONE
/ID=V1
/STANDARDIZE=VARIABLE Z.
CLUSTER
/MATRIX IN(D0.6195007235656518)
/METHOD WARD
/ID=V1
/PRINT SCHEDULE
/PLOT DENDROGRAM VICICLE
/SAVE CLUSTER(4).
Dataset Close D0.6195007235656518.
*matriz de proximidades.
DATASET DECLARE D0.6345362390119496.
PROXIMITIES V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18 V19 V20 V21
/MATRIX OUT(D0.6345362390119496)
/VIEW=CASE
/MEASURE=SEUCLID
/PRINT NONE
/ID=V1
/STANDARDIZE=VARIABLE Z.
CLUSTER
/MATRIX IN(D0.6345362390119496)
/METHOD WARD
/ID=V1
/PRINT SCHEDULE
/PRINT DISTANCE
/PLOT DENDROGRAM VICICLE
/SAVE CLUSTER(4).
Dataset Close D0.6345362390119496.
*_________________________________________________
*1. ABRIMOS BASE DE DATOS CLUSTERS.
GET
FILE='C:\Users\Adrian\Documents\UMSS\Seminario de estadistica\bases de datos cluster\cluster2.sav '.
DATASET DECLARE D0.4740015866373679.
PROXIMITIES PIB_habitante Tasa_crecimiento_PIB Productividad_laboral Productividad_laboral_Hora
Tasa_crecimiento_laboral Tasa_crecimiento_lab_femenino Tasa_crecimeitno_lab_masc Tasa_Inflaccion
coste_cecimeitno_laboral consolidacion_deuda_publica Deficit_publico
/MATRIX OUT(D0.4740015866373679)
/VIEW=CASE
/MEASURE=SEUCLID
/PRINT NONE
/ID=pais
/STANDARDIZE=VARIABLE Z.
CLUSTER
/MATRIX IN(D0.4740015866373679)
/METHOD BAVERAGE
/ID=pais
/PRINT SCHEDULE CLUSTER(5)
/PRINT DISTANCE
/PLOT DENDROGRAM VICICLE
/SAVE CLUSTER(5).
Dataset Close D0.4740015866373679.