Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin
[11] 295
se presentan los procedimientos de estadstica descriptiva,
que si bien escapan a nuestros objetivos, seguramente para
muchos usuarios sern de utilidad.
Se usan otras bases de datos que corresponden con la prime-
ra publicacin para ilustrar los tpicos de pruebas de hip-
tesis, asociaciones, correlacin y regresin.
Figura 6.1
Ventanas de aplicacin, de edicin de datos y de salida
Ventana de aplicacin
Ventana de datos
Ventana de variables
Ventana de salida
296
Ventana de Aplicaciones: Contiene la barra de mens con
las distintas opciones del programa.
Men principal
297
Data: Contiene opciones para hacer cambios que afec-
tan a todo el archivo de datos (unir archivos, transponer va-
riables y casos, crear subconjuntos de casos, etc.). Estos cam-
bios son temporales mientras no se guarde explcitamente el
archivo.
298
Seeccionar el
Crear la base Seleccionar a
procedimiento Resultados
de datos variable
estadstico
file/
new/
data/
Aparece la hoja de datos en blanco, donde cada fila es para un
caso o individuo y cada columna es para una variable.
Variable view: permite definir las variables.
File/
Open/
Data/
Nombre del archivo/ Podemos seleccionar un archivo de la lista
o especificar una ruta y extensin de inters.
Abrir.
NO NUMRICAS
299
NUMERICAS
VARIABLE VIEW: permite definir las variables
NAME: INTELIGENCIA
TYPE: NUMERICA
WIDTH: 8
DECIMALS: 0
LABEL: COEFICIENTE DE INTELIGENCIA
DATA VIEW: se procede a declarar los datos
GUARDAR UN ARCHIVO
FILE/
SAVE AS/
NOMBRE DEL ARCHIVO: DATOS1-maestra
GUARDAR
Figura 6.2
Relacin de archivos creados, entre ellos DATOS10-maestra
300
variable Figura 6.3
unidad Variables creadas en el archivo DATOS10-maestra
Vista de datos
Vista de variables
Procedimientos estadsticos
301
Figura 6.4
Relacin de procedimientos estadsticos
Elegir el
procedimiento
Figura 6.5
Seleccionar el procedimiento estadstico
302
Figura 6.6
Relacin de variables variable
variable
Figura 6.7
Resultados(output) del procedimiento tabla de frecuencias
303
caso de grficos interactivos podemos modificar directamente,
sin necesidad de volver a generar otra vez el grfico.
Tabla 6.1
Medio de transporte para ir a la universidad
Se nos muestra:
304
valid percent: las frecuencias relativas multiplicadas por el
100%, eliminando de la muestra los valores
perdidos.
cumulate percent: las frecuencias relativas acumuladas multi-
plicadas por el 100%.
Variables discretas
305
Variables continuas
Tabla 6.2
Tabla de frecuencias para la variable coeficiente de inteligencia
Inteligencia
306
a) Se establece previamente los limites de los intervalos, para
lo cual se obtiene el valor mximo: 120, el valor mnimo: 93,
el rango: 27 y la amplitud de cada intervalo: 4. As, si selec-
cionamos los intervalos semiabiertos como ya fue sealado
en el captulo 2, los lmites de los intervalos son:
[92 - 96]
[96 - 100]
[100 - 104]
[104 - 108]
[108 - 112]
[112 - 116]
[116 - 120]
307
Figura 6.7
Comando Recode para recodificar inteligencia en INTELI1
308
Tabla 6.3
Distribucin de frecuencias de la variable ficticia
INTELI
309
Tabla 6.4
Distribucin de frecuencias de la variable coeficiente de inteligencia
Figura 6.8
Grfico de barras para la variable sexo de los estudiantes
50
40
30
Count
20
10
0
femenino masculino
sexo de los estudiantes
310
b) Para construir una grfico de SECTORES seleccionar los
siguientes comandos:
GRAPHS/ INTERACTIVE/ PIE/ SIMPLE / en el cuadro de
dilogo colocar en DEFINE SLICES BY la variable SEXO/ acti-
var PIES/ seleccionar PERCENT/ ACEPTAR.
Figura 6. 9
Grfico de sectores de la variable sexo de los estudiantes
Figura 6.10
Histograma de la variable coeficiente de inteligencia
20
15
Frequency
10
Mean = 101.77
5
Std. Dev. = 6.294
N = 70
0
95 100 105 110 115 120
inteligencia
311
Otra alternativa es usando los siguientes comandos:
GRAPHS/INTERACTIVE/HISTOGRAM/presionar ASIGN
VARIABLES y colocar COUNT e INTELI1/ en HISTOGRAM ele-
gir 7 intervalos/ si desea coloca el ttulo/ para ejecutar elegir
ACEPTAR.
Figura 2.5
Histograma de frecuencias absoutas para los coeficientes de inteligencia
20
15
Count
10
0
2.00 3.00 4.00 5.00 6.00
Inteli 1
Figura
30
Percent
20
10
0
2.00 3.00 4.00 5.00 6.00
Inteli 1
312
Para frecuencias acumuladas:
GRAPHS/INTERACTIVE/HISTOGRAM/CUMULATIVE
HISTOGRAM/ presionar ASIGN VARIABLES y colocar COUNT
e INTELI1/ en HISTOGRAM elegir 7 intervalos/ si desea coloca
el ttulo/ para ejecutar elegir ACEPTAR. Para hacer el grfico de
frecuencias relativas cambiar COUNT por PERCENTS.
Figura
60
40
Court
20
0
2.00 3.00 4.00 5.00 6.00
Inteli 1
Figura
60
40
Court
20
0
2.00 3.00 4.00 5.00 6.00
Inteli 1
313
Medidas de tendencia central y de dispersin
Tabla 6.5
Medidas de tendencia central, dispersin y forma de la
variable coeficiente de inteligencia
Statistics
inteligencia
N Valid 70
Missing 0
Mean 101.79
Median 100.00
Mode 100
Std. Deviation 6.282
Variance 39.464
Skewness 1.301
Std. Error of Skewness .287
Kurtosis 1.558
Std. Error of Kurtosis .566
Range 27
Minimum 93
Maximum 120
Sum 7125
Sum 95.37
Percentiles 10 95.37
20 96.97
314
donde para cualquier variable cuantitativa:
mean: media aritmtica,
median: mediana,
mode: moda,
sum: suma de todos los valores,
std deviation: desviacin estndar,
variante: varianza,
minimum: valor ms pequeo,
mximun: valor ms grande,
range: rango,
std. Error of mean: error estndar de la media aritmtica,
kurtosis: curtosis,
skewness: sesgo.
a ) Coeficiente PHI
315
ANALYZE/ DESCRIPTIVE STATISTICS/CROSSTABS. Apa-
recer el cuadro de dilogo en el que deber colocar en ROWS la
variable ESTADO CIVIL, y en COLUMNS colocar la variable
DESERCION. Continuar con los comandos FORMAT/DESCEN-
DING/ STATISTICS/PHI/ CONTINUE y se ejecuta el procedi-
miento con OK.
En el OUTPUT aparece:
0 1
DESERCION 1 2 4 6
0 8 1 9
Total 10 5 15
Symmetric Measures
Value
Nominal by
Nominal Phi .577
b) Coeficiente BISERAL-PUNTUAL
316
Se crea otra variable ficticia donde se guardan las estaturas
de los estudiantes del sexo masculino. Esa variable se denomina
X1, de la que necesitamos tambin su media aritmtica.
De la variable estatura, sin diferenciar el sexo, necesitamos
la desviacin estndar.
Abrir la base DATOS9-biseral y ejecutar los siguientes co-
mandos:
a) TRANSFORM/COMPUTE en target colocar XO/ en expre-
sin numrica colocar ESTATURA/ IF/ activar INCLUDE
IF CASE SATISFIES CONDITION SEXO=0/ CONTINUE /
OK. Se ha creado la variable X0.
b) TRANSFORM/COMPUTE en target colocar X1/ en expresin
numrica colocar ESTATURA/ IF/ activar INCLUDE IF
CASE SATISFIES CONDITION SEXO=1/ CONTINUE /OK.
c) ANALYZE/ DESCRIPTIVE STATISTICS/ DESCRIPTIVES/
seleccionar las variables ESTATURA XO X1/ OK.
Descriptive Statistics
estatura de los
estudiantes 15 55 73 64.13 4.749
Xo 7 55.00 67.00 61.1429 3.62531
x1 8 62.00 73.00 66.7500 4.13176
Valid N (listwise) 0
X 1
= 66.75 X 0
= 61.14 n
1
=8 n 0
=7 S x
= 4.749
66.75 61.14 8 x7
r bp
4.749 15 x14
0.61
c) Coeficiente TETRACRICO
317
las variables notas en el curso de estadstica (dicotomizada: apro-
b o desaprob) y las notas en el curso de metodologa de la in-
vestigacin tambin dicotomizada. Las dos variables son de na-
turaleza cuantitativa. Para obtener la tabla de doble entrada se
procede de la siguiente manera:
ANALYZE/ DESCRIPTIVE STATISTICS/CROSSTABS. Apa-
recer el cuadro de dilogo en el que deber colocar en ROWS la
variable NOTAS EN ESTADSTICA, y en COLUMNS colocar la
variable NOTAS EN METODOLOGA. Continuar con los coman-
dos FORMAT/DESCENDING/ CONTINUE y se ejecuta el pro-
cedimiento con OK.
En el output aparecen las frecuencias conjuntas
Count
notas de metodologa
de la investigacin Total
desaprob aprob
b c 36(34)
con las que se calcula el cociente = = 6.18 . En la
ad 11(18)
tabla H d el valor de dicho cociente se encuentra en el intervalo
6.044 y 6.288 por lo que el valor del coeficiente de correlacin
tetracrico es 0.62.
d ) Coeficiente BISERAL
318
biseral donde la variable nota del estudiante se ha dicotomizado la
habilidad del estudiante y asignado 1 si aprob y 0 si desaprob.
Se crea una variable ficticia donde se guardan los tiempos
que demoran en resolver el problema los estudiantes que des-
aprueban o no tienen habilidad. Dicha variable se denomina X0,
de la que necesitamos su media aritmtica.
Se crea otra variable ficticia donde se guardan los tiempos
que demoran en resolver los estudiantes que aprueban o que tie-
nen habilidad para resolver el problema. Dicha variable se deno-
mina X1, de la que necesitamos tambin su media aritmtica.
De la variable tiempo, sin diferenciar si el estudiante fue hbil
o no, se necesita la desviacin estndar.
Abrir la base DATOS11-biseral y ejecutar los siguientes co-
mandos:
Descriptive Statistics
N Mean Std.
Deviation
tiempo para
resolver 99 63.54 10.168
x0 52 63.0113 10.58776
x1 47 64.1310 9.76176
319
e) Coeficiente de SPEARMAN
Correlations
RANGO A RANGO A
LAS NOTAS LAS NOTAS
DEL JURADO DEL JURADO
1 2
f) Coeficiente de CONTINGENCIA
Es til cuando las dos variables son cualitativas como en los ejem-
plos 4.2 y 4.3.
Para el ejemplo 4.2 se us la base DATOS2-matemticas y se
construy la tabla de doble entrada para el sexo y la escuela pro-
fesional a la que pertenece el estudiante. Esta vez, adems del
cuadro se obtiene el coeficiente de contingencia. Los comandos
son los siguientes:
ANALYZE/ DESCRIPTIVE STATISTICS/CROSSTABS/ co-
locar en ROWS la variable SEXO y en COLUMNS colocar ES-
CUELA PROFESIONAL/ pulsar STATISTICS/ activar CONTIN-
GENCY COEFFICIENT/ CONTINUE/ ejecutar con OK.
El output del SPSS adems de la tabla bidimensional incluye
el siguiente cuadro:
320
Symmetric Measures
Value
a ) Diagrama de dispersin
Entrar en
GRAPH/SCATTER / del cuadro de dilogo que aparece se
selecciona las opciones SIMPLE DEFINE/ colocar la variable PRO-
MEDIO como variable dependiente en el eje de las Y/ colocar la
variable LGEBRA como variable independiente en el eje de las
X/ dejar el resto de opciones por defecto y ejecutar el procedi-
miento con OK.
16
14
Notas prmedio
12
10
8
8 10 12 14
Notas de lgebra
321
Se observa en el grfico una relacin lineal razonablemente
alta entre la nota promedio de los estudiantes y la nota de lge-
bra. Para cuantificar dicha relacin debe calcularse el coeficien-
te de correlacin de Pearson.
Correlations
NOTAS NOTAS DE
PROMEDIO ALGEBRA
NOTAS Pearson
PROMEDIO Correlation 1 .925
NOTAS DE Pearson
LGEBRA Correlation .925 1
.000 .
322
Correlations
323
Correlations
e) Scatterplot
e1) Simple
324
GRAPHS/ SCATTER/ SIMPLE/ DEFINE. En Y entramos la
variable PROMEDIO y en X la variable ALGEBRA. En SET MAR-
KERS BY la variable SEXO. Dejar el resto de opciones por defec-
to. Pulsar OK y se obtiene la siguiente figura.
El grfico nos muestra los puntos, separados para los distin-
tos subgrupos de la variable en SET MARKERS BY, en nuestro
caso la variable SEXO.
Sexo de los
participantes
16,0000
Femenino
Masculino
14,0000
Notas promedio
12,0000
10,000
8,0000
325
Model Summmary
ANOVAb
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
326
14 Linear
Notas promedio = 3.85 + 0.71 * lgebra Regression
R-Square = 0.86
13
Notas promedio
12
11
10
8 10 12 14
Notas de lgebra
Model Summmaryb
ANOVAb
327
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
328
MATLAB tiene las operaciones aritmticas conocidas: suma
(+), resta (-), multiplicacin (*), divisin (/) y potencia (^) y se
operan de la manera que usted acostumbra.
Cuando se activa, en el pront aparece el smbolo >>.
Ejemplo
>> 2+pi ans =5.1416
>> 1/9 ans = 0.1111
>> 2^3 ans = 8
Ejemplo
" abs(1+i) ans = 1.4142
" exp(0) ans = 1
" exp(1) ans = 2.7183
Ejemplo
" a=13 a = 13
" b=a+a/pi b = 17.1380
Ejemplo
" pi ans = 3.1416
" ans/2 ans = 1.5708
329
brayado. Puede contener hasta 19 caracteres. MATLAB es sensi-
ble a las maysculas: a y A son variables diferentes.
Declaracin de vectores y matrices
Los escalares, los vectores y las matrices, se ejecuta en MAT-
LAB sin ninguna declaracin especial. Los vectores pueden ser
considerados como matrices de una sola columna o de una sola
fila, as tambin los escalares pueden ser considerados como
matrices de orden uno. Existen varias formas de escribir matri-
ces en MATLAB, consideremos algunas de las ms sencillas:
330
Para escribir vectores podemos usar dos puntos, (:) de la si-
guiente manera:
vector = primer elemento: incremento: ltimo elemento.
Ejemplo
>> v1=1:5:39 v1 = 16 11 16 21 26 31 36
Al ser el incremento igual a 5, el siguiente de 36 sera 41 que
rebasa la cota superior de 39.
Puede considerarse fracciones como incremento:
331
" iden = eye(4), cero = zeros(3,5), uno = ones(2,4).
iden = cero = uno =
1 0 0 0 0 0 0 0 0 1 1 1 1 1
0 1 0 0 0 0 0 0 0 1 1 1 1 1
0 0 1 0 0 0 0 0 0
0 0 0 1
332
" B=[A, zeros(3); zeros(3), ones(3)]
B=
1 2 3 0 0 0
4 5 6 0 0 0
7 8 9 0 0 0
0 0 0 1 1 1
0 0 0 1 1 1
0 0 0 1 1 1
Ejemplo
" a = 4: 9 a=4 5 6 7 8 9
" b = 9: -1: 4 b = 9 8 7 6 5 4
" c = ones(2) c = 1 1
1 1
" d1=[a b] d1 = 45 6 7 8 9
9 8 7 6 5 4
" d2=[a; b] d2 = 45 6 7 8 9
9 8 7 6 5 4
" d3=[d2, c] d3 = 4 5 6 7
8 9 1 1
9 8 7 6 5 4
1 1
" d4=[c; d2] d4 = 1 1 4 5 6
7 8 9
1 1 9 8 7 6
5 4
333
En el caso de vectores basta con dar la componente del vec-
tor, la primera componente es d1(1), y as para todos los vecto-
res, no existe para matlab una componente de ndice cero, igual
con las matrices, el elemento de la primera fila y primera colum-
na es A(1, 1), no existe A(0, 0).
Podemos redefinir una matriz modificando algn elemento,
por ejemplo:
" A(3,2)=17
A= A=
1 2 3 1 2 3
4 5 6 4 5 6
7 8 9 7 17 9
Ejemplo
" d1 d1 = 45 6 7 8 9 9 8
7 6 5 4
" d1(10) ans = 6
" d1(10)=d1(1)+d1(10) d1 = 4 5 6 7
8 9 9 8 7 10 5 4
" A (:, 1)
ans =
1
4
7
334
para la tercera fila:
" A(3,:) ans = 7 17 9
"B
B=
1 2 3 0 0 0
4 5 6 0 0 0
7 8 9 0 0 0
0 0 0 1 1 1
0 0 0 1 1 1
0 0 0 1 1 1
" B1=B(2:4,:)
Escribimos el dos para la fila inicial, el cuatro para la final, si
no se escribe el incremento, MATLAB asume que es uno.
B1 =
4 5 6 0 0 0
7 8 9 0 0 0
0 0 0 1 1 1
335
" B2=B(:,1:2:6)
B2 =
1 3 0
4 6 0
7 9 0
0 0 1
0 0 1
0 0 1
336
Operaciones con matrices y vectores
" B=A'
B=
1 4 7
2 5 8
3 6 9
Ejemplo
A=[1 2 3;4 5 6;7 8 9], B=A'.
A= B=
1 2 3 1 4 7
4 5 6 2 5 8
7 8 9 3 6 9
" C = A+B
C=
2 6 10
6 10 14
10 14 18
" a =4: 9 a= 4 5 6 7 8 9
" b =9: -1: 4 b= 9 8 7 6 5 4
"c=a+b c= 13 13 13 13 13 13
" d1= 3*a-2*b d1 = -6 -1 4 9 14 19
" [1 1 1]/3 ans = 0,3333 0,3333 0,3333
337
" D=A*B
D=
14 32 50
32 77 122
50 122194
Anlisis de datos
338
en matrices orientada por columnas, cada columna representa una
variable diferente y cada fila representa a un individuo.
Al digitar help datafun, matlab le muestra una lista de las
funcionres estadsticas que podra Ud. necesitar, algunas de es-
tas es mostrada en la siguiente tabla:
Ejemplo
Supongamos que la siguiente matriz represente a cuatro
variables (columnas) y 3 individuos (filas).
A=[
2 7 4 7
6 4 6 1
4 0 7 4]
339
sort(A)
ans =
2 0 4 1
4 4 6 4
6 7 7 7
>> cov(A) proporciona la matriz de covarianzas de las tres
variables
ans =
4.0000 -3.0000 2.0000 - 6.0000
-3.0000 12.3333 -5.1667 4.5000
2.0000 -5.1667 2.3333 -3.0000
-6.0000 4.5000 -3.0000 9.0000
Nmeros aleatorios
340
Ejemplo
y=randn(1500,1); % genera 1500 nmeros aleatorios con dis-
tribucin normal de media
cero y varianza 1.
hist(y) % dibuja un histograma de 10 barras para los datos
del vector y.
Ejemplo
x=-2.9:0.1:2.9
y=randn(1000,1),
hist(y, x);
50
45
40
35
30
25
20
15
10
5
0
-3 -2 -1 0 1 2 3
341
escribimos help +, matlab nos muestra todo acerca de las opera-
ciones aritmticas y otras relaciones ms; en cambio help help
nos explica que es lo que hace help.
El comando intro
El comando %
342
Archivos M
343
Al que llamar ventana del archivo.m, en sta ventana po-
demos empezar digitando, en la primera linea:
function y = nombre_archivo( x)
X fi Fi
0 2 2
1 11 13
2 11 24
4 3 27
5 3 30
file clic
new clic
M-file clic
344
En la ventana que se muestra digitar:
function f=esklra(x);
% funcin escalera en un intervalo desde 0 hasta M dimen-
sin del vector de frecuencias a,
%donde para cada subintervalo de longitud uno, se asocia
una componente del vector a, por
%decir para x entre 0 y 1 se asocia 2, entre 1 y 2 el 13, etc.
a= [2 13 24 24 27 30];%a es un vector de fre-
cuencias
M=length(a);
for k=1:M-1,
aa=k-1;bb=k;
set=find( aa <= x )&find( x < bb);
f(set)=a(k);
if isempty(f) == 0;
break,
end,
end,
if isempty(f) == 1;
f(1)=a(6);
end
345
Cada vez que modificamos (corregimos) un archivo.m te-
nemos que avisar a matlab, guardando este archivo del modo
siguiente, con el ratn:
file clic
save clic
Nuevamente ya est listo para su ejecucin
346
j=j+1;
end
hold on
plot(xxx,www)
clear xxx www;
end
hold on;
x=[1 2 4 5];
a= [2 13 24 27];
plot(x,a,'o');
x=[0 1 2 4 5];
a=[2 13 24 27 30];
plot(x,a,'.')
axis([0 6 0 35])
hold off;
35
30
25
20
15
10
0
0 1 2 3 4 5 6
347
Ejemplo. Hacer el grfico de una distribucin de frecuen-
cias acumuladas de una variable continua, como la siguiente:
Intervalos fi Fi
174 -196 2 2
196 - 218 7 9
218 - 240 10 19
240 - 262 23 42
262 - 284 38 80
284 - 306 11 91
306 -328 5 96
328 -350 4 100
100
96
91
80
42
19
9
2
196 219 240 262 284 306 328 360
348
Ejemplo. Para la misma tabla de frecuencias, hacer el grfi-
co del un polgono de frecuencias absolutas.
clear,clf,
X1=[174 196 196 218 218 240 240 262 262 284 284 306 306
328 328 350];
for k=1:2:15
pt_me((k+1)/2)=(X1(k)+X1(k+1))/2;
end
Y3=[0 2 7 10 23 38 11 5 4 0];
pt_me=[163,pt_me,361];
plot(pt_me,Y3)
hold on
plot(pt_me,Y3,'.')
hold off
X=[163 174 196 218 240 262 284 306 328 350 361];
set(gca,'xtick',X)
40
35
30
25
20
15
10
0
163 174 196 218 240 262 284 306 328 350 361
349