Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de La Información
Análisis de La Información
Serie
APRENDER A INVESTIGAR
Mdulo 4
ANLISIS DE LA INFORMACIN
1
1
2
2
3
Edicin: 1987
Reimpresin: 1988
Reimpresin: 1991
Edicin: 1995
Reimpresin: 1998
Edicin: (corregida y aumentada) 1999
ICFES
Calle 17 N 3-40 A.A. 6319
Telfono: 2819311 - 2834027 - 2834067 - 2435129
Fax: 2845309 - 2834047 - 2845980
Santa Fe de Bogot
Serie:
APRENDER A INVESTIGAR
Mdulos:
1.
2.
3.
4.
5.
La serie APRENDER A INVESTIGAR ha sido realizada por el ICFES. Para las ediciones anteriores se cont
con el siguiente grupo de autores:
CARLOS ESCALANTE A.
Profesor Universidad Nacional de Colombia
HUMBERTO RODRGUEZ M.
Profesor Universidad Nacional de Colombia
ALBERTO MAYOR M.
Profesor Universidad Nacional de Colombia
EDUARDO VLEZ B.
Investigador Instituto SER de Investigaciones
NGEL FACUNDO D.
Exjefe Divisin de Fomento
Investigativo ICFES
El proyecto de actualizacin y revisin de la presente edicin de la serie APRENDER A INVESTIGAR fue realizado por el ICFES, para lo cual se conform el siguiente grupo de autores:
Mdulo 1:
LUIS JAVIER JARAMILLO
Mdulos 3 y 4:
ADONAY MORENO
YOLANDA GALLARDO DE PARADA
Mdulos 2 y 5:
MARIO TAMAYO Y TAMAYO
EAFIT - Medelln
Contenido
SERIE APRENDER A INVESTIGAR
Presentacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Propsito, poblacin y objetivos de la serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Estructura de aprendizaje de la serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La organizacin de la serie: los mdulos, y material audiovisual . . . . . . . . . . . . . . .
Descripcin sinttica de los mdulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La asesora de tutores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
9
11
13
17
19
23
25
1.
NATURALEZA DE LA ESTADSTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
2.
DIVISIN DE LA ESTADSTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 Estadstica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Descripcin de datos, tcnicas de representacin grfica . . . . . . . . . .
2.1.2 Distribucin de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.3 Elaboracin de una tabla de frecuencias . . . . . . . . . . . . . . . . . . . . . . .
2.1.4 Presentacin grfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.4.1 Histogramas y polgonos de frecuencias . . . . . . . . . . . . . . . .
2.1.4.2 Grficas de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.4.3 Grficas lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.4.4 Grficas circulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
27
29
31
31
33
34
35
36
37
3.
41
41
41
42
44
46
47
47
48
50
50
51
51
53
4.
60
60
62
62
64
64
66
66
67
70
70
76
5.
ESTADSTICA INFERENCIAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 La prueba de hiptesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Pruebas de significancia de muestras nicas o simples . . . . . . . . . . . . . . . . .
5.2.1 Prueba Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.2 Distribucin t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.3 Distribucin Chi cuadrado: 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
81
86
86
87
92
6.
REGRESIN Y CORRELACIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1 Introduccin a la bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Ajuste de una recta de regresin rectilnea simple . . . . . . . . . . . . . . . . . . . . .
6.3 Correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4 Coeficiente de correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
98
98
101
104
107
7.
ANLISIS DE LA VARIANZA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
111
8.
117
117
119
120
120
121
9.
STATGRAPHICS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1 Grupo I: Data handling and system utilities . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Grupo II: Plotting and descriptive statistics . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3 Grupo III: Anova and regression analysis . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4 Grupo IV: Time series procedures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5 Grupo V: Advanced procedures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.6 Grupo VI: Mathematical procedures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.7 Requerimientos fsicos para la instalacin de Statgraphics . . . . . . . . . . . . . .
125
125
125
126
126
126
126
127
145
151
157
BIBLIOGRAFA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
165
137
Presentacin
El Instituto Colombiano para el Fomento de la Educacin ICFES, ha venido desarrollando proyectos que propenden por el mejoramiento de la calidad de la educacin
superior y la formacin del talento humano que sea capaz de asumir el reto que nos
impone la educacin del siglo XXI.
Dentro de este marco de referencia, la formacin de directivos, docentes e investigadores en el tema de la investigacin ha sido prioritaria para el ICFES, razn por la
cual ha continuado impulsando la divulgacin de materiales de gran utilidad para
incentivar la prctica investigativa en la educacin superior.
La SERIE APRENDER A INVESTIGAR es un material autoinstructivo que ofrece
los conceptos, las herramientas y los mtodos necesarios para la formulacin, perfeccionamiento y diseo de proyectos de investigacin.
A las puertas del nuevo milenio, estamos entregando a la comunidad acadmica
una nueva edicin actualizada y complementada de la SERIE APRENDER A INVESTIGAR, la cual contribuir a generar la cultura investigativa, que constituye la
base de la educacin, la ciencia y la tecnologa del pas.
Introduccin
a la serie
El presente programa autoinstruccional denominado APRENDER A INVESTIGAR, contiene algunos de los principales elementos, tericos y prcticos, sobre conceptos, mtodos y tcnicas usualmente empleados en el trabajo de investigacin cientfica.
Aprender a Investigar es un proceso largo y complejo, que comprende diversas
dimensiones y etapas formativas, algunas de las cuales comienzan, o deben comenzar
a desarrollarse, desde los primeros aos de vida. Para el grupo de autores del programa, Aprender a Investigar no se reduce al estudio y dominio de la metodologa general de la investigacin cientfica. Aprender a Investigar implica, entre otras cosas, el
desarrollo de diversas dimensiones, tales como:
a) Un espritu de permanente observacin, curiosidad, indagacin y crtica de
la realidad, el cual nos permite preguntarnos si aquello que se conoce sobre algo
es realmente un conocimiento o si acaso ofrece una mejor explicacin del fenmeno o del objeto de estudio. Este espritu de observacin, crtica y creatividad se
desarrolla desde los primeros aos de vida.
b) Una slida formacin general y un creciente dominio de los conocimientos
sobre un rea especfica de la realidad, pues stos son la base y el punto de
partida para poder aportar nuevos conocimientos. Como el cmulo de informacin
cientfica es hoy en da tan grande y se encuentra en constante aumento, se hace
necesario concentrar la atencin en tpicos especficos, pues cada vez es ms
difcil seguir de cerca y estar al da sobre diversas temticas y mtodos de conocimiento. La formacin general y la concentracin del inters y aprendizaje permanentes en aspectos particulares de la realidad se ha venido efectuando a travs de
los diferentes niveles educativos hasta llegar a centrar el inters en un rea especfica del conocimiento. Esta segunda dimensin, unida al dominio de la metodolo-
10
11
Propsito, poblacin
y objetivos de la serie
El propsito del programa, serie APRENDER A INVESTIGAR, es familiarizar al
estudiante con los elementos conceptuales y algunas tcnicas bsicas que le permitan,
en su rea de estudio, comenzar a resolver problemas de conocimiento, aplicando la
lgica del proceso investigativo utilizando determinados instrumentos bsicos. No se
trata de proporcionar una informacin para memorizar sino que sta debe servir para
orientar la prctica investigativa del estudiante, dentro de la disciplina cientfica en
la cual se prepara como profesional e investigador.
En este sentido, la serie APRENDER A INVESTIGAR ha sido diseada para
una poblacin de estudiantes de educacin superior que se ha iniciado en el conocimiento de los contenidos y mtodos bsicos de una disciplina cientfica determinada y
que, por tanto, comienza a plantearse y a enfrentar algunos problemas de investigacin.
En la situacin corriente de nuestras instituciones de educacin superior, la poblacin objetivo de esta serie son estudiantes que estn cursando aproximadamente el
quinto semestre de carrera, y que van a tener su primera aproximacin a la metodologa general de investigacin cientfica.
El objetivo terminal de toda la serie o del curso completo consiste en lo siguiente:
Al finalizar el proceso instructivo, el estudiante deber estar en condicin de disear y emprender un proyecto de investigacin dentro de su disciplina acadmica, aplicando tanto los contenidos adquiridos con las asignaturas propias de su carrera, como
los elementos conceptuales y tcnicos adquiridos con el estudio de esta serie. Esto lo
12
capacitar para enfrentar y tratar de resolver problemas de su rea de estudio siguiendo la metodologa de la investigacin cientfica.
Para cumplir estos propsitos y estos objetivos, se supone que los usuarios de este
curso (estudiantes que estn en la mitad de una carrera de educacin superior), han
desarrollado los siguientes aprendizajes:
13
Estructura
de aprendizaje
de la serie
La serie APRENDER A INVESTIGAR consta de los siguientes elementos:
*
*
*
14
Mdulo 2
Mdulo 3
Mdulo 4
Mdulo 5
Videocasetes
*Ciencia y tecnologa:
desarrollo del hombre
15
LA INVESTIGACIN
*El conocimiento cientfico
*Tipos de investigacin
*Modelos y diseos de investigacin
*La interdisciplinariedad
*Tipos de investigacin
cientfica
*El experimento
15
15
RECOLECCIN DE LA INFORMACIN
*Conceptos bsicos de medicin
*Informacin primaria y secundaria
*Unidades variables y valores
*Tcnicas para el registro
de informacin secundaria
*Tcnicas para la recoleccin
de informacin primaria
*La encuesta
*Informacin primaria
y secundaria
*La observacin
*La encuesta
*La entrevista
15
15
15
15
ANLISIS DE LA INFORMACIn
*Descripcin de datos - Tcnicas
de representacin grfica
*Distribucin de datos - Tcnicas
numricas
*Introduccin a las probabilidades
*La prueba de hiptesis
*Regresin y varianza
*Anlisis y muestra
*Universo y muestra
*Estudio de factibilidad
de software estadstico
*La medicin
y las ciencias
*La curva normal
*La muestra
15
15
15
EL PROYECTO DE INVESTIGACIN
*Elementos del proceso investigativo
*Administracin del proyecto
*Evaluacin del proyecto
*El informe investigativo
15
15
Nota: En los mdulos escritos se incluye una gua didctica para utilizacin de los videocasetes.
15
16
17
La organizacin de la serie:
los mdulos
y material audiovisual
Un mdulo consta de unidades de aprendizaje, que son consideradas como etapas que hay que recorrer, siguiendo una ruta estratgicamente diseada, para lograr un
objetivo propuesto.
Dentro de cada mdulo y antes de empezar cada Unidad se explicitan cules son
los objetivos especficos de aprendizaje que se persiguen.
En la tcnica de estudio independiente o de autoinstruccin, usted debe ser muy
consciente, antes de entrar a trabajar, de qu es lo que va a hacer. Esto le ayudar en
el aprendizaje. Una vez usted haya estudiado un contenido de acuerdo con su ritmo
propio de trabajo, al final de cada unidad encontrar unas preguntas sobre los contenidos que trata el mdulo que le permitirn autoevaluarse, conocer si usted domina esos
contenidos y, por tanto, decidir en forma personal y responsable si puede continuar
avanzando.
Recuerde y tenga siempre en cuenta que no todas las partes del proceso investigativo
presentadas en el modelo aparecen desarrolladas en el texto escrito, algunas han sido
desarrolladas en los videocasetes, por lo cual, cuando as se le indique, usted deber
recurrir al beta o VHS y seguir la gua de utilizacin de videos.
La serie est diseada de tal forma que es bsicamente usted quien juega el rol
principal, quien estudia y quien debe decidir si ha alcanzado los objetivos previstos. Se
han hecho grandes esfuerzos para organizar los diferentes materiales en funcin de un
aprendizaje a partir de un estudio independiente.
18
19
Descripcin sinttica
de los mdulos
El mdulo 1
Hemos denominado al mdulo 1: Ciencia, tecnologa, sociedad y desarrollo
El mdulo 2
Hemos denominado el mdulo 2: La investigacin
20
El mdulo 3
Hemos denominado al mdulo 3: Recoleccin de la informacin
El mdulo 4
Hemos denominado al mdulo 4: Anlisis de la informacin
Este mdulo se complementa con tres videocasettes: 1-. La medicin y las ciencias, l 5. 2-. La curva normal, I 5. 3-. La muestra, 15.
El mdulo 5
Hemos denominado el mdulo 5: El proyecto de investigacin
21
El propsito de este mdulo es lograr que el estudiante retome e integre los conceptos y los procesos de la metodologa de investigacin cientfica y pueda formular un proyecto de investigacin en su respectiva rea de estudio.
Presentar elementos bsicos para el desarrollo del proyecto de investigacin relacionados con el proceso de investigacin: la administracin del proyecto; la evaluacin del proyecto y el informe investigativo.
Este mdulo se complementa con tres videocasettes. 1-. Cmo utilizar las fuentes
de informacin, 15. 2-. De dnde surgen los problemas de investigacin, 15. 3-.
Vamos a elaborar un proyecto, 15.
Consideramos que este mdulo es de vital importancia y tanto los videos como los
otros mdulos convergen a ste. Es decir que el mdulo 5 es el centro de la serie
APRENDER A INVESTIGAR.
Como objetivos especficos del mdulo, tenemos:
Capacitar al estudiante para que pueda formular hiptesis para la solucin de los
problemas y sealarle algunos de los pasos que generalmente se siguen para poner
a prueba las hiptesis de investigacin.
Sealar las diferencias que existen entre las actividades cientifico-tcnicas, con la
finalidad de que pueda comprender la peculiaridad de una de ellas: la investigacin.
22
23
La asesora de tutores
Aunque los mdulos han sido diseados para que puedan utilizarse en estudio independiente o en forma auto-instructiva, es conveniente valerse de la asesora de tutores, profesores o expertos investigadores.
El trabajo tutorial es conveniente para:
Orientar los ejemplos, ejercicios y prcticas hacia los temas y problemas propios
de la disciplina que estudie cada participante.
24
25
Mdulo 4
Anlisis
de la informacin
El anlisis de la informacin en el proceso investigativo, depende del
enfoque y del tipo de investigacin que se haya seleccionado, como tambin de los objetivos que se hayan planteado.
La estadstica se constituye en una herramienta fundamental para el
anlisis de la informacin. Sin embargo es necesario precisar y seleccionar el tratamiento estadstico dependiendo del enfoque cuantitativo o cualitativo, de la escala de medicin de las variables, de las hiptesis y de los
objetivos.
La estadstica es fundamental para resolver problemas de descripcin
de datos, anlisis de muestras, contrastacin de hiptesis, medicin de
relaciones y predicciones.
1. NATURALEZA DE LA ESTADSTICA
La estadstica es una rama de la ciencia, encargada del diseo y aplicacin de mtodos para recolectar, organizar, analizar y hacer deducciones a partir de ellos.
Aunque los orgenes de la estadstica se remontan a los estudios de
los juegos de azar del siglo XVIII, slo en los ltimos 60 aos se han desa-
26
27
2. DIVISIN DE LA ESTADSTICA
La estadstica se divide en dos grandes ramas, dependiendo del mtodo empleado para manejar la informacin y hacer que tenga sentido: estadstica descriptiva y estadstica inferencial.
Poblacin
Muestra
Estadstica
descriptiva
Estadstica inferencial
Grfica 1.
28
TABLAS DE FRECUENCIAS
TABULACIN
TABLAS DE CONTINGENCIA
GRFICAS O
DIAGRAMAS
PUNTOS
LNEAS
BARRAS
CRCULO
CAJA
MEDIDAS DE
TENDENCIA
CENTRAL
MEDIDAS
DE
RESUMEN
MEDIDAS DE
DISPERSIN
MEDIDAS DE
UBICACIN
HISTOGRAMAS
MEDIA
MEDIANA
MODA
MEDIA GEOMTRICA
RANGO
DESVIACIN ESTNDAR
VARIANZA
NDICE DE DISPERSIN
CATEGRICO
CUARTILES
QUINTILES
DECILES
PERCENTILES
29
Tipo de productor
Frecuencia
Pequeo
Mediano
Grande
7
12
9
Total
28
En el cuadro slo se ha agrupado el nmero de agricultores pertenecientes a cada categora. El nmero de agricultores se denomina observaciones o frecuencia (f).
Para el caso de variables medidas a nivel intervalo o de razn, podemos hacer exactamente el mismo ejercicio.
Si se tiene, por ejemplo, la informacin acerca del nmero de cajas de
madera que construyen al da unos carpinteros en un taller, podramos
clasificarlos por su productividad.
30
Carpinteros
N de cajas
construidas
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
11
10
8
12
12
10
7
8
10
11
10
9
9
10
11
N de cajas
construidas
N de carpinteros
que construyen X
N de cajas
II
II
11
III
12
II
10
Hasta ahora los ordenamientos que se han hecho son bastante simples,
pero en la vida real muchas veces la informacin analizada es ms compleja
y la distribucin de frecuencias debe ser construida a partir de un mayor
nmero de puntajes.
31
X5 = 69
X6 = 61
X7 = 71
X8 = 79
X9 = 47
X10 = 85
X11 = 82
X12 = 55
X13 = 65
X14 = 88
X15 = 52
X16 = 58
X17 = 76
X18 = 57
X19 = 72
X20 = 66
32
C=
Xmax. - Xmin.
o sea
rango
C=
m
33
C=
de donde
C=
47
= 9.4
5
Frecuencias (f)
Frecuencia Relativa Fr
46 - 55
56 - 65
66 - 75
76 - 85
86 - 95
Total
3
4
7
4
2
20
f
__
n
34
zontal, se colocan los distintos valores de las frecuencias absolutas o relativas. Si la representacin se refiere a las frecuencias absolutas o relativas
acumuladas se denomina: Diagrama de frecuencias acumuladas, colocndose los valores de la variable en el eje horizontal y las frecuencias Fr, en el
vertical.
Grfica 1.
Peso en kilos de 20 alumnos de un colegio
35
As por ejemplo en el grfico 1 podemos trazar el polgono de frecuencias, uniendo los puntos medios del histograma de frecuencias.
Edad
1 5 -1 9
2 0 -2 4
h o m b re s
2 5 -2 9
m u je re s
3 0 -3 4
10
20
30
40
N m e ro d e E s tu d ia n te s
b. Grficas de barras agrupadas. En esta grfica, se presentan los mismos datos de estudiantes, excepto que los componentes por sexo se
muestran separadamente as:
36
1 5 -1 9
Edad
2 0 -2 4
m u je r e s
h o m b re s
2 5 -2 9
3 0 -3 4
10
15
20
25
30
N m e r o d e E s tu d ia n te s
c. Grficas de barras bidireccionales. Cuando se desea graficar cantidades positivas y negativas, tales como prdidas y ganancias en la produccin de una empresa, por tipo de producto. As, en la grfica de
produccin de la empresa X, se tiene que las prdidas y ganancias por
tipo de producto son:
utilidad o
prdida
Enfriadores
Planchas
-40
-20
20
40
60
Produccin
37
Nmero de Estudiante
Hom bres
M ujeres
Total
90
91
92
93
94
95
96
97
98
Aos
n
F1
5
25
80
15
N = 125
125
5
38
X = 360 x 5
125
Luego
En el siguiente ejemplo, se muestra la distribucin porcentual del nmero de estudiantes matriculados en 5 facultades de una universidad X,
en los aos de 1990 y 1998.
c
13%
d
27%
e
23%
a
15%
b
18%
b
14%
a
31%
e
15%
d
36%
c
8%
39
N de alumnos
78
77
76
75
74
73
72
71
70
69
68
67
66
65
64
63
62
61
1
1
0
2
1
0
2
2
4
5
3
0
3
2
0
1
2
1
1. d
2. No
3. Grfico
4. No
5. Rango = 17; nmero de intervalos = 6; amplitud de intervalo = 3
Calificaciones
Frecuencia
Relativa %
61-63
64-66
67-69
70-72
73-75
76-78
4
5
8
8
3
30
13.3
16.7
26.7
26.7
10.0
100.0
Graficar
RESPUESTAS A LA AUTOEVALUACIN N 1
40
41
42
Frecuencias
30 - 32
33 - 35
36 - 38
39 - 41
42 - 44
45 - 47
48 - 50
51 - 53
54 - 56
57 - 59
4
4
5
7
12
7
4
3
2
2
Total
50
43
Intervalos
Frecuencias
acumuladas
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
4
7
8
6
5
4
11
19
25
30
Total
30
Encuentro el valor del lmite real inferior del intervalo donde est n
2
44
n _ Fa
2
Mediana = Li +
C
Fn
2
donde Li
n
2
2
= Amplitud del intervalo.
En el ejemplo
est dada por:
n
2
30
= 15
2
Li = 39.5
Fn
= 8
2
Fa = 11
C=5
n
2
n
2
Luego:
Mediana = 39.5 +
(15 - 11)
x 5
8
Mediana = 42
3.1.3 La media aritmtica
Es la medida de tendencia central ms conocida, es fcil de calcular, de
gran estabilidad en el muestreo, sus frmulas permiten tratamiento algebraico.
45
xi
n
Para las distribuciones con datos agregados, existe una frmula, aunque un poco ms complicada, es bastante fcil de aplicar.
media =
fx
n
Intervalos
x
Marca de clase
f
Frecuencias
fx
30-34
35-39
40-44
45-49
50-54
32
37
42
47
52
4
7
8
6
5
128
259
336
282
260
Total
30
1265
46
X =
30 + 34
64
=
= 32
2
2
Grupo B
80
80
75
83
82
81
82
75
79
7
97
95
70
72
73
96
80
72
71
71
795
797
47
XA = 79.5
XB = 79.7
La media aritmtica de ambas series es prcticamente igual (79.5 en
el grupo A y 79.7 en el grupo B). Un anlisis de las cifras individuales
revelan un gran contraste. En el grupo A hubo muy poca variacin entre
las notas, siendo la ms alta 83 y la ms baja 75. En el grupo B, se nota
mayor variacin, en este grupo la mayor nota fue 97 y la menor 71. Como
conclusin se podra decir que en el grupo B hubo notas muy altas y muy
bajas. En el grupo A las notas tuvieron una mayor concentracin alrededor del promedio.
Para establecer esta caracterstica se utilizan las medidas de variacin o dispersin, entre las cuales las ms utilizadas son el rango, la
varianza y la desviacin estndar.
3.2.1 El rango
La medida ms simple de dispersin es el rango. Este identifica la
distancia entre el valor mayor y el valor menor de la distribucin. Ms
especficamente, se define como la diferencia entre el mayor valor y el
menor valor. Se simboliza por r.
Ejemplo, el rango de la siguiente distribucin es:
25, 36, 64, 20, 48, 59.
r = 64 - 20 = 44
El rango es sencillo de calcular pero tiene la desventaja de que es
sensible a los valores extremos.
3.2.2 Percentiles
Los percentiles son usados para calcular una segunda medida de dispersin. El P-simo percentil de un conjunto de mediciones ordenadas
segn su magnitud, es el valor que tiene P% de las mediciones por debajo
de l y (100 P%) por encima.
Se utilizan muy frecuentemente para describir los resultados de pruebas
de conocimiento, como los del Sistema Nacional de Pruebas y en la clasificacin de personas en forma comparativa. Entre los percentiles de ms
inters estn el 25, el 50 y el 75, frecuentemente denominados como el
menor cuartil Q1, el cuartil mediano (mediana) Q2 y el cuartil superior, Q3.
48
3.2.3 Varianza
De todas las medidas de dispersin, la ms importante, ms conocida
y usada es la varianza. Se define como la media aritmtica de los cuadrados de las desviaciones, respecto a su media. Se simboliza por S 2.
Su frmula es:
S2 =
(x - media)
S2 =
f (X - media)
datos agrupados
5 + 3 + 1 + 6 + 10
25
=
= 5
5
5
S2 =
S2 =
0 + 4 + 16 + 1 + 25
46
=
= 9.2
5
5
49
Pesos
Marca de
clase X
X-X
(X - X)2
Frecuencias f
f (X - X)2
60-62
63-65
66-68
69-71
72-74
61
64
67
70
73
-6.45
-3.45
-0.45
2.55
5.55
41.60
11.90
0.20
6.50
30.80
5
18
42
27
8
208.0
214.2
8.4
175.5
246.4
100 = n
852.51
Total
X = 67.45
f (x - x)
S2 =
S2 =
852.5
donde
X es la marca de clase
X la media aritmtica
f la frecuencia de cada intervalo
= 8.52
100
Propiedades de la varianza
a. La varianza siempre debe ser un valor positivo S 2> 0
b. La varianza de una constante es 0, es decir: si Xi = C para todo i,
entonces S 2 = 0
c. La varianza de una constante ms una variable, es igual a la varianza
de la variable.
S2
(k + X)
: = S 2k + S 2x = 0 + S 2x = S 2x
(k + X)
: = S2k + S 2x = 0 - S 2x = S 2x
50
S2
Para el caso del peso de los 100 estudiantes del colegio la desviacin
estndar es:
S=
8.52 = 2.92
S
X
100
El coeficiente de variacin sirve para determinar el grado de homogeneidad de la informacin. Si el valor del coeficiente de variacin es pequeo
indica que la informacin tiene un alto grado de homogeneidad y si el coeficiente de variacin es grande es porque la informacin es heterognea.
Ejemplo: al hallar el coeficiente de variacin de 6, 3, 4, 7, 8
X =
28
= 5.6
5
S = 1.85
Cv =
1.85
= 0.3304 = 33.04%
5.6
51
3.3 Asimetra
Una distribucin es simtrica si se tiene que: la media es igual diana e
igual al modo (X = Md = Mo); pero si la distribucin se vuelve asimtrica
las tres medidas se separan y entonces el valor promedio ar ser mayor
que la mediana, que a su vez ser mayor que el modo, deducindose que
la distribucin es asimtrica positiva. Si la media aritmtica es menor que
la mediana y sta menor que el modo, se dice que la distribucin es
asimtrica negativa. En la distribucin asimtrica positiva, la curva presenta un alargamiento a la derecha; en la negativa el alargamiento presenta hacia la izquierda. Vase grficas 4.
Grfica 4. Asimetra
As =
X - Mo
s
=
3(X - Md)
s
3.4 Kurtosis
Una caracterstica importante de la variacin de algunas distribuciones es su grado de agudeza en la cima de la curva que las representa
agudeza que se observa en la regin del modo, comparada con las condiciones halladas para el mismo sitio en la curva normal, es lo que
Kurtosis.
52
a4 =
m4
s4
m4
m 22
K =
Q
P90 - P10
K =
Q
P90 - P10
Se tiene Q =
K =
en donde Q =
1
2
1
2
(Q3-Q1) reemplazando
(90.75 - 68.25) =
11.25
101.00 - 58.12
11.25
42.88
(22.5) = 11.25
= 0.262
53
CLASIFICACIN DE
LA JORNADA
nica
Maana
Tarde
Total
NMERO DE ALUMNOS
COLEGIOS
OFICIALES
COLEGIOS
PRIVADOS
TOTAL
230
583
418
840
614
234
1070
1197
652
1231
1688
2919
54
Clasificacin
COLEGIOS OFICIALES
COLEGIOS PRIVADOS
de la jornada
Hombres
Hombres
Mujeres
Mujeres
10-15
15-20
nica
52
80
22
76
132
180
423
105
Maana
121
47
168
247
241
132
86
155
Tarde
123
154
49
92
76
51
47
60
296
281
239
415
449
363
5561
320
Subtotal
TOTAL
1231
1688
D =
K(N2 - f2)
N2(K - 1)
Donde K
es el nmero de categoras de la variable.
f2 es la suma de las frecuencias al cuadrado
N = nmero de casos (tamao de la muestra)
Por ejemplo:
Si tenemos la siguiente clasificacin de 15 estudiantes por preferencias deportivas:
55
DEPORTES
ALUMNOS
f2
8
2
5
64
4
25
FTBOL
VOLEIBOL
BASKET
TOTAL
15
D =
3(225 - 93)
225(3 - 1)
396
= 0.88
450
Lo cual indica que los datos presentan una dispersin del 88%.
56
Edad
No. de estudiantes
f
30-34
35-39
40-44
45-49
50-54
5
6
8
7
4
Total
30
57
__________________
__________________
__________________
RESPUESTA A LA AUTOEVALUACIN N 2
b) No hay
c) 22 y 43
4. a. X = 4.18
b. Mediana = 42
c. moda= 8
3. 5
2. Media, mediana y moda
1. No
58
Taller de estadstica N 1
Se realiz un experimento para evaluar el efecto de la edad en la frecuencia cardaca, cuando se somete una persona a un grado especfico
de ejercicios. Se seleccionaron al azar hombres de cuatro grupos de edades, 10-19, 20-39, 40-59, 60-69. Cada individuo recorri la banda sin fin a
una velocidad especfica durante 12 minutos y se registr el aumento de
la frecuencia cardaca, la diferencia antes y despus del ejercicio, (en latidos por minuto)
Qu puede usted concluir, si los siguientes datos son el resultado del
procesamiento de la informacin apoyada en el computador.
VARIABLE
Talla
Promedio
Mediana
Moda
Varianza
Desviacin estndar
Mnimo
Mximo
Rango
Quartil inferior
Quartil superior
Rango interquartil
Skewness
Kurtosis
Coeficiente de variacin
Suma
GRUPO 1
GRUPO 2
GRUPO 3
GRUPO 4
15
30.1333
30
22
24.8381
4.98378
22
39
17
26
34
8
-0.0873053
-0.612727
16.5391
452
10
27.5
27.5
24
23.8333
4.88194
21
34
13
24
32
8
-0.0716212
-1.59948
17.7525
275
12
29.5
29
33
19.1818
4.37971
22
37
1.5
26.5
33
6.5
0.0311649
-0.726827
14.8465
354
12
38.3333
37.5
36
50.6061
7.11379
28
54
26
34.5
42
7.5
0.668752
1.02909
18.5577
460
Preguntas
1.
2.
3.
4.
5.
6.
59
Respuestas
1.
2.
3.
4.
5.
6.
60
cara 56 veces;
56/100;
p = 56% (xito);
sello 44 veces
44/100
q = 44% (fracaso)
61
b. Mtodo emprico o prctico. Considera la probabilidad de un suceso, como aquel nmero al cual se aproxima cada vez la frecuencia relativa de la ocurrencia de un suceso, cuando las veces que se repite el
experimento que origina ese suceso es bastante grande. Este concepto
tiene algo que ver con el experimento de Quetelet, en donde la probabilidad de un suceso tiende a estabilizarse en un punto, cuando el nmero de
experimentos se va haciendo cada vez ms grande.
c. Mtodo clsico. Considera la probabilidad como el cuociente de
dividir los casos favorables, que pueden ocurrir en un suceso, por el total
de casos posibles.
Nmero de casos favorables
p = __________________________
Nmero de casos posibles
Ejemplos:
En el lanzamiento de una moneda hay:
2 posibilidades
N Combinaciones
C
S
(C)
(S)
Probabilidades
1/2 = 0.5
1/2 = 0.5
1 = 1.0
N Combinaciones
(C,C)
(C, S)
(S,S)
Probabilidades
1
(S, C) 2
1
1/4 = 0.25
2/4 = 0.50
1/4 = 0.25
1 = 1.00
N Combinaciones
(C, C, C)
(C, C, S) (C, S, C) (S, C, C)
(S,S,C)(S,C,S)(C,S,S)
(S, S, S)
Probabilidades
1
3
3
1
1/8 = 0.125
3/8 = 0.375
3/8 = 0.375
1/8 = 0.125
1 = 1.000
62
2n
2 = casos posibles en una moneda
n = nmero de lanzamientos
En un dado sera: 6n
61 = 6
62 = 36
4.2 Esperanza
Si p es la posibilidad de xito en un suceso, en un solo ensayo, el
nmero de sucesos o esperanzas de ese suceso en n ensayos, estar
dado por el producto de n y la probabilidad de xito p.
E=np
Ejemplo:
En el lanzamiento 900 veces de dos dados, cul es la esperanza de
que la suma de sus caras sea un valor menor a 6?
Primero obtenemos la probabilidad de xito del suceso en un solo
ensayo.
(1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (3,1) (3,2) (4,1) = 10
Como se lanzan 900 veces, en dos dados, se tiene:
E = np = 900
10
36
900
36
= 250
63
4
40
1
(As)
10
P2 =
4
40
1
(Rey)
10
P = P1+P2 =
1
1
+
10
10
2
10
1
5
4
4
x
40
40
16
1
=
1600
100
64
Ejemplo:
La probabilidad de obtener tres ases, sacando sucesivamente tres
cartas de una baraja espaola, sin volverlas a incluir (sin reposicin)
en el montn.
P1 =
P =
P=
4
40
P2 =
4
3
40
39
3
39
2
38
P3 =
2
38
24
59280
1
2470
65
ABCD
ABDC
ACBD
ADBC
ADCB
ACDB
BACD
BADC
BCDA
BDAC
BDCA
BCAD
CABD
CADB
CBAD
CDAB
CDBA
CBDA
DABC
DACB
DBAC
DCBA
DCAB
DBCA
Otro ejemplo:
Cuntos nmeros diferentes de 9 cifras se pueden formar con los dgitos
del cero al 9, usndolos una sola vez?
P10,= 10! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 3.628.800
8!
2!3!2!
8x7x6x5x4x3x2x1
2x1x3x2x1x2x1
P8(r:2,3,2,1)=1680
La formula ser
Ejemplo:
n!
r1!r2!
7!
3!4!
P7(r: 3,4) = 35
7x6x5x4x3x2x1
3x2x1x4x3x2x1
66
Otro ejemplo:
Cuntos grupos de 2 letras se pueden formar con las letras de la palabra
amigas.
P6(r: 2) =
6!
= 360
2!
4.4.2 Variaciones
Las variaciones corresponden a aquellas permutaciones donde los elementos no se toman en su totalidad.
Dado un conjunto de n elementos diferentes, se denominar permutacin
parcial o variaciones, de subconjunto de r elementos (r<n) pertenecientes al
conjunto dado.
La frmula es: Vrn =
n!
(n - r)!
4!
(4 - 2)!
4x3x2x1
2x1
AB
AC
AD
BA
BC
BD
= 12
CA
CB
CD
DA
DB
DC
Ejemplo:
Cuntas cifras diferentes de 4 dgitos se pueden formar con los dgitos
del 0 al 9, usndolos una vez?
V10
4 =
10!
(10 - 4)!
10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1
6x5x4x3x2x1
= 5.040
4.4.3 Combinaciones
Son aquellas en las que no interesa el orden de la aparicin de elementos del conjunto. Ser lo mismo AB que BA.
67
BC
BD
CD
La frmula ser:
(nr ) = Cnr =
n!
r!(n - r)!
4!
4!(4 - 4)!
4x3x2x1
4x3x2x1x1
= 1
4!
2!(4 - 2)!
4x3x2x1
2x1x2x1
= 6
Ejemplo:
A)
P(B
P(A)
68
Propietario de vivienda
No propietario de vivienda
P(B/A) =
Total
0.12
0.06
0.18
0.08
0.74
0.82
Total
0.20
0.80
1.00
0.12
0.18
= 0.66
69
RESPUESTAS A LA AUTOEVALUACIN N 3
5 . C82 = 28
4 . $500
3 . 40.320
2 . 1/3
1. S.
70
P = C
1
2
P = 6
1
16
4
2
4-2
1
2
=
4!
=
2!2!
6
16
1
2
1
2
4.3.2.1
2.1.2.1
1
4
1
4
= 0.375 = 37.5%
71
72
Y=
z2
e2G
G 2
donde: n
G
e
nmero de datos
desviacin estndar de la distribucin binomial = npq
base de los logaritmos naturales = 2.71828
3.1416
media de la distribucin nominal = np
73
n=9
p=
q=
= np = 9 () = 4.5
G = npq = 9 () () = 1.5
p = (3.5 < x <6.5)
x = 4,5 y 6 caras
Grfica 6.
x
G
entonces z =
3.5 - 4.5
= 0.67
1.5
74
Z=
6.5 - 4.5
= 1.33
1.5
p (-14<z<1.5) = 0.4332+0.4192
p 0.8524 = 85.24%
Grfica 7.
75
Grfica 8.
c) P (z>1.5)
0.5000 - 0.4332 = 0.0668 =6.68%
Grfica 9.
76
0.4772
0.0215
Grfica 10.
xe-
X!
donde e = 2.71828
77
= np
x = nmero de casos favorables
Ejemplo:
a) Si el 1 % de las bombillas fabricadas por una compaa son defectuosas,
hallar la probabilidad de que en una muestra de 100 bombillas 3 sean
defectuosas.
= 100 x 0.01 = 1
X=3
P =
13 - e-1
3!
1 (0.36788)
= 0.06131
3.2.1
25 (0.13534)
5.4.3.2.1
P = 0.03609 = 3.61 %
P (x = 5) = 3.61 %
32(0.13534)
120
4.33088
120
78
_________________
_________________
c. Es simtrica
_________________
_________________
_________________
No _____
_________________
_________________
79
_____________
b. 7.70
_____________
c. 2.74
_____________
d. 5.48
_____________
_____________
No _____
No _____
RESPUESTAS A LA AUTOEVALUACIN N 3
c)21.14%;
b)13.65;
2=a-,
1 =d;
6=c)2.74;
3=S;
7=S;
4=49.38%;
8=No
5=a)43.32%;
80
5. ESTADSTICA INFERENCIAL
Ayuda a determinar la confiabilidad de la inferencia de que los fenmenos observados en la muestra ocurrirn tambin en la poblacin de donde
se seleccion la muestra. Es decir, sirve para estimar la eficacia del razonamiento inductivo con el cual se infiere que lo que se observa en una
parte se observar en el grupo entero.
El objeto de la estadstica es el de hacer inferencias (predecir, decidir)
sobre algunas caractersticas de la poblacin con base en la informacin
contenida en una muestra.
Por lo tanto, se puede afirmar que el empleo de la estadstica inferencial
presume el dominio de la estadstica descriptiva. Sin embargo se debe
tener presente que al predecir un resultado o tomar una decisin se est
sujeto a una incertidumbre o margen de error, bien sea por la tcnica de
muestreo o por la seleccin del estadstico de prueba.
Es importante resaltar que se debe diferenciar entre las tcnicas que
son vlidas para el anlisis de los datos cualitativos y de los datos cuantitativos.
En el caso de la estadstica inferencial el investigador se encuentra
con dos tipos de tcnicas. Por un lado las tcnicas paramtricas que
suponen una serie de supuestos acerca de la naturaleza de la poblacin
de la que se extrajo la muestra de estudio. Por otro lado, las tcnicas no
paramtricas, que no requieren supuestos sobre las caractersticas de la
poblacin y que se facilitan ms para el anlisis de datos nominales y
ordinales.
Las ventajas de las tcnicas paramtricas es que son ms potentes
que las no paramtricas y por consiguiente las inferencias que se realizan
son ms fiables. El inconveniente es que el investigador no siempre puede cumplir con los requisitos y supuestos que exige el enfoque paramtrico,
sobre todo en investigaciones educativas y sociales.
La ventaja de las tcnicas no paramtricas es que son fciles de utilizar y algunas son tan potentes como las paramtricas.
El anlisis de datos cualitativos ha generado tcnicas propias, que actualmente constituyen toda una metodologa especfica que viene marcada
por la propia idiosincrasia cualitativa y que toma determinadas opciones en
relacin a las unidades de registro de los datos y la forma de tratarlos.
81
82
83
Punto 1
El paso uno se define en el enunciado del problema. Para que sea verificada HI, el proceso a seguir es contradecir a H0, es decir, hay que contradecir
que la media aritmtica es igual o menor a 519.
Entonces las dos hiptesis se representan as:
H1: X > 519
H0: X < 519
Con lo anterior, lo que se est diciendo es que, si encontramos que el
promedio de produccin por fanegada es de 519 arrobas o menos, tendremos que concluir que nuestra hiptesis inicial H1, tendr que ser modificada y
por lo tanto, la nueva semilla, por lo menos en cuanto a su productividad, no
es competitiva con las tradicionalmente utilizadas.
Punto 2
Una vez aclaradas las suposiciones del punto 1, acerca de H1 y H0, por
medio de un razonamiento matemtico podemos obtener la distribucin de
muestreo, o sea, la distribucin de todos los posibles valores que una estadstica puede tener, con base en un muestreo probabilstico de un universo.
Esta distribucin nos dice, entonces, qu probabilidad hay de obtener cada
uno de los resultados.
Dependiendo del tamao de las muestras, las distribuciones de muestreo
tienden a tomar una distribucin normal y por ello no es necesario calcularlas.
Un teorema importante, que es una aplicacin de la distribucin normal,
conocido como el teorema del Lmite Central, dice que si en una poblacin
de tamao N, con una media de y una varianza de S2 se obtienen muestras al azar, la distribucin de las medias de las muestras seleccionadas
ser normal -y ms lo ser en la medida en que se incremento el nmero de
muestras seleccionadas- y tendr una media de Y y varianza S2/N.
El teorema garantiza que la media de una muestra puede estar muy cercana al de la poblacin, en la medida en que tenga un tamao n grande, ya
que la varianza de la distribucin de las medias muestrales S2/N, se hace
ms pequea en la medida en que aumenta el tamao n.
La desviacin estndar de la distribucin de las medias de la muestra se
denomina como el error estndar: S/ /N
84
Punto 3
A partir de la informacin obtenida, el investigador puede escoger resultados que permitan aceptar o rechazar sus supuestos. Posteriormente, los resultados identificados para rechazar la suposicin se llaman de regin crtica,
dividiendo as los resultados en los que sirven para rechazar y los que sirven
para aceptar la hiptesis nula, sabiendo que estos sectores estn relacionados con errores de tipo y .
Una vez aclaradas la H1 y H0, obtenemos aleatoriamente una muestra de
la produccin por fanegada de la semilla probada en la regin.
Calculamos la media aritmtica y la desviacin estndar de los datos de la
muestra, informacin sta que nos permite hacer la prueba estadstica.
Si calculamos x, sabemos que la distribucin de muestreo de x, suponiendo que H0 es cierto, es bastante aproximada a una distribucin normal
con un = 519.
Valores de x, que contradicen H0 y por lo tanto validan a H1, sern aquellos que se encuentran en la regin de la cola derecha de la distribucin,
como lo seala la figura 11. Estos valores contradictorios generan la regin de rechazo, es decir, si el valor observado de x cae en la regin de
rechazo, descartamos H0 y aprobamos H1. Observemos que se verifica H1
contradiciendo H0. Por lo tanto si x cae en la regin de aceptacin de la
figura 11, aceptamos H0 y no podemos verificar H1. Esta es la etapa de
comparacin con la regin de rechazo.
Grfica 11. Suponiendo que H0 es verdadera, los valores
contradictorios de X estn en la cola superior.
85
Punto 4
Supongamos que en la figura 11 la regin rayada sea la equivalente a la
de un = 0,025. Para calcular el punto de rechazo, se tiene que calcular el
valor de Z, que tiene un rea de 0.025 a su derecha. En la tabla de reas
bajo la curva normal vemos que el valor correspondiente es de 1.96, por lo
que lo designaremos como el lmite para la regin de rechazo y si el valor
observado de x es mayor que 1.96, desviaciones estndar arriba de = 159,
se rechaza la hiptesis nula.
86
x-
S
N
573 - 519
124
36
54
20.67
= 2.61
Punto 5
El ltimo paso es comparar el valor obtenido con el dispuesto como
rechazo, ya que x encontrado est a ms de 1.96 unidades de desviacin
estndar arriba del = 519, rechazamos H0 en favor de H1 y concluimos
que la productividad de la nueva variedad de semilla es significativamente
mayor que 519.
5.2 Pruebas de significancia de muestras nicas o simples
Cuando se quiere probar hiptesis a partir de una muestra nica, se
pueden utilizar varias pruebas de significancia de hiptesis. En estudios
en ciencias naturales y ciencias sociales es muy frecuente este tipo de
situaciones y las tcnicas utilizadas ms frecuentemente son la prueba Z,
y la prueba t frecuentemente llamada t de Student.
5.2.1 Prueba Z
Normalmente se utiliza cuando se conoce el parmetro de la poblacin. Ilustremos su uso con el siguiente ejemplo hipottico:
En una institucin de enseanza media se presenta una desercin que
los directores consideran muy alta y pensaron que con un programa de
consejera, podran controlarla, con la hiptesis de que cuanta ms gua
personal, mayor sera la probabilidad de continuar exitosamente en la
institucin. Se gener una consejera y al cabo de un ao se recopil informacin sobre el nmero de veces que cada estudiante tuvo contacto formal con un consejero.
La media aritmtica para el total de estudiantes fue de 12.1 visitas al
ao, con una desviacin estndar de 3.21.
Meses despus se hizo una muestra aleatoria simple de 40 estudiantes desertores y a partir de los datos obtenidos con la recopilacin de informacin, se les calcul una media aritmtica de 9.11. Al ver que era ms
baja que el resto de la poblacin, los directores se hicieron la siguiente pre-
87
Z =
x-
S
N
9.11 - 12.1
3.21
40
-2.99
3.21
6.32
= -5.86
s,
Siendo,
88
s^ =
(x - x)
s^ =
(x - x)
n
n-1
s^ =
(x - x)
n-1
En la distribucin de t Student, se considera que las curvas son simtricas, pero algo ms achatadas y ms abiertas en los extremos, los cuales corresponden a regiones crticas. A medida en que el tamao de la
muestra se hace ms grande, ms se acerca a la normal.
La funcin dada para este tipo de distribucin es:
Y = C 1+
t
v
v+1
2
89
x-
s^
n-1
x-
n
donde
s= s^
n-1
s=
(x - x)
n-1
(X - Y)2 (x - y)
sx-y
siendo
s2=
(X - X)
+ (Y - Y)2
n1+n2-2
2
sx-y = sn
1
s2
n2
90
Grfica 12.
c.
s^ = 8
s= 8
t =
25
= 8(1.021) = 8.17
25 - 1
42 - 46
8.17
25
t =
-4
1.63
= -2.45
91
26
28
25
25
22
29
23
26
sx-y
c)
=1
Siendo:
s=
(X - X)
+ (Y - Y)2
n1+n2-2
2
sx-y = sn
1
s2
n2
x-x
24
26
25
22
23
27
28
25
29
26
0
2
1
-2
-1
120
135
(x - x)2
y-y
(y - y)2
0
4
1
4
1
0
1
-2
2
-1
0
1
4
4
1
10
10
92
X =
120
= 24
5
s=
10 + 10
=
5+5-2
s = 1.6
sx-y =
Y =
20
=
8
135
= 27
5
2.5
s2 = 2.5
2.5
2.5
+
=
5
5
1 =1
d) t = (24 - 27) - 0 = 3 = 3
1
1
e) v = n1 + n2-2
v=5+5-2
v=8
Grfica 13.
f) Los resultados anteriores sealan que existe una diferencia significativa en el contenido medio de nicotina en ambas marcas. Vase grfica
13.
5.2.3 Distribucin Chi Cuadrado: 2
La distribucin normal se utiliza en todos aquellos casos que ofrecen
dos resultados posibles; cuando se presentan ms de dos resultados posibles, debe aplicarse la prueba chi cuadrado que se simboliza as: 2. Un
ejemplo tpico de distribucin lo constituye el lanzamiento de una moneda
con posibilidades de que aparezca cara o sello. Uno de 2 consiste en el
lanzamiento de un dado con seis caras posibles, numeradas del 1 al 6.
93
2
(ni - n*)
i
n*i
ni
ni*
n i - n i*
(ni - n i*)2
2
(ni - n*)
i
n*i
1
2
3
4
5
6
7
14
8
5
16
10
10
10
10
10
10
10
-3
4
-2
-5
6
0
9
16
4
25
36
0
0.9
1.6
0.4
2.5
3.6
0
60
60
9.0
94
n*i= np1= 60
( )
1
60
=
=10
6
6
ricas.
Se realiza la prueba teniendo en cuenta los siguientes pasos:
1) HI: ni K n*i
H I: ni K n*i
2) = 0.05
2
3) =
(ni - n*i)2
n*i
= 9.0
Grfica 14.
95
No _____
____
____
No _____
Por qu?
___________________________________________________
___________________________________________________
4. El nivel de significancia es:
a. Lo mismo que el nivel de precisin
_____
_____
c. Una probabilidad
_____
d. El error alfa
_____
96
_____
_____
_____
_____
No _____
8. Los salarios diarios de una industria estn distribuidos normalmente con una media de $132 y una desviacin estndar de $25.
Si una empresa de dicha industria, que cuenta con 40 obreros
paga en promedio $122, puede acusarse a esta compaa de
pagar salarios inferiores al nivel de significancia del 1%?
S _____
No _____
Desarrollo: _________________________________________
___________________________________________________
___________________________________________________
9. Una hiptesis dice que el estudiante promedio de la universidad
colombiana tiene un coeficiente de inteligencia mayor que el resto
de la poblacin. Escriba una hiptesis de investigacin y una
hiptesis nula, con un coeficiente de inteligencia que al estandarizarse tiene una X = 100
Hiptesis de investigacin: ______________________________
Hiptesis nula: ________________________________________
10. Un fabricante de ciertas piezas de proyectiles sostiene que en
condiciones normales de reparacin, tienen una duracin media
=320 horas. Probar esta afirmacin frente a la alternativa
K320, si 16 piezas duran un promedio de 308 horas, con una
desviacin de 29 horas. Utilizar un nivel de significancia del 5%.
1. No, es lo contrario.
2. b
3. No. La distribucin de una muestra son las caractersticas que
tienen los datos a partir de una muestra.
La distribucin de un muestreo es la distribucin de una muestra de medias a partir de muestras.
4. c
5. 1.96
6. d
7. S
122 132
8. Z =
= 2.53 cae en la regin de rechazo. Se puede
25
40
acusar a la compaa de pagar salarios inferiores al nivel del 1%
9. Hiptesis de investigacin: H 1= x >100 Hiptesis nula: H0=x100
10. t =
308 320
29
15
la duracin promedio es de 320, a un nivel significativo del 5%.
11. S, porque 2 = 4.518 y cae en la zona de aceptacin y se puede
considerar el dado perfecto.
RESPUESTAS A LA AUTOEVALUACIN N 5
Explique.
S _____
No _____
1
12
2
17
3
20
4
22
5
13
6
16
97
98
6. REGRESIN Y CORRELACIN
6.1 Introduccin a la bidimensional
En esta parte examinaremos la relacin entre variables, medidas en escalas de intervalo o de razn. Pero ya no slo queremos comparar, ahora
queremos entender qu tipo de conexin hay entre las variables, por intermedio de la relacin que existe entre ellas, e ir ms all entendiendo la
naturaleza de la relacin entre las variables.
En las distribuciones bidimensionales se consideran dos variables en
forma simultnea, determinndose si tienen alguna relacin funcional entre
s; an ms, cuantificando dicha relacin. Estas variables pueden ser ambas discretas, ambas continuas, o una discreta y otra continua.
Llamaremos Xi a la primera variable, donde i toma todos los valores
desde 1 hasta n. As tendremos X1, X2, X3, ... Xn; Yi se considerar como la
segunda variable, donde i toma los valores desde 1 hasta n. Se tendrn
tantos valores de X como valores de Y, es decir, se tomarn siempre pares
de observaciones.
Tabla. Valores de X y Y
Xi
Yi
Xi
Yi
Xi2
Yi2
X1
X2
X3
X4
Y1
Y2
Y3
Y4
6
10
14
20
27
33
3
4
8
12
18
25
36
100
196
400
729
1.089
9
16
64
144
324
625
18
40
112
240
486
825
Xn
Yn
110
70
2.550
1.182
1.721
XY
Xi
Y =
Yi
110
6
70
6
= 18.33
= 11.67
99
S2x =
X2i
S2y =
Y2i
X2 =
Y2 =
2.550
5
1.182
6
(18.33)2 = 89.01
(11.66)2 = 61.04
Sy=
Sy2
89.01
= 9.44
Sy=
Sy2
61.04
= 7.81
mxy =
XY
n
X Y
1.721
6
= (18.33)(11.67)
100
101
X = a + by
b) a=0
c) a<0
Grfica 16.
102
a) b>0
b) b<0
c) b<0
103
2.626
= 0.82
3.200
70 90.2
6
a = -3.37
Reemplazando en la ecuacin general de la recta, Y = a + bx, se tiene:
Y = 3.37 + 0.82x
cuando se quiere estimar X en funcin de Y, se procede de la siguiente
forma:
X = a + by
104
2.626
= 1.20
2.192
100 84
6
100 84
6
105
106
Los dos ltimos grficos E y F sirven para ilustrar una situacin que
suele presentarse durante una investigacin.
En el caso E, vemos que la mayora de los elementos analizados, parecen indicar la no existencia de relacin entre las dos variables, pero hay
unos pocos casos donde altos valores de X tienen a los valores de Y.
En el caso F, se presenta lo contrario, la mayora de las observaciones
analizadas indican una relacin positiva entre X y Y, pero unos pocos casos la distorsionan, ya que rompen la tendencia.
Estos ejemplos, muestran la utilidad de hacer uso de histogramas y de
las distribuciones de las frecuencias obtenidas, para no cometer errores.
Por ejemplo, concluir que no hay relacin en el caso del grfico D, cuando
107
en realidad hay una no lineal; o decir que hay relacin positiva en el grfico
E, o que no existe relacin en el grfico D, cuando en realidad es lo contrario.
En estos dos ltimos casos, lo recomendable es retirar los elementos
distorsionadores, o completar una mayor informacin, por si en realidad lo
sugerido por los casos extremos es la tendencia real, o por ltimo, revisar
los procesos de recoleccin, codificacin o sistematizacin de la informacin, donde se pudo haber cometido algn error.
6.4 Coeficiente de correlacin
Nos permite cuantificar el grado de correlacin existente entre las variables X y Y.
Hay dos maneras de calcular el coeficiente de correlacin, una aritmtica y otra por medio de lgebra de matrices.
Hagamos un ejercicio aritmtico:
Supongamos que queremos medir la asociacin que existe entre innovacin tecnolgica y produccin, en 11 empresas que elaboraron un mismo producto. En la tabla 12 se presenta la informacin obtenida en visitas
realizadas a 11 industrias.
Y2
XY
tecnolgico X
Produccin
y
1
2
3
4
5
6
7
8
9
10
11
44
62
30
50
28
34
49
54
72
66
27
20
19
15
21
13
15
17
17
22
21
14
1.936
3.844
900
2.500
784
1.156
2.401
2.916
5.184
4.356
729
400
361
225
441
169
225
289
289
484
441
196
880
1.178
450
1.050
364
510
833
918
1.584
1.386
378
N=11
X=516
Y=194
X2= 26.706
Y2=3.520
XY = 9.531
Empresa
Nivel
108
r =
N XY ( X)( Y)
N X ( X)2 N Y2 ( Y)2
2
Sustituyendo tenemos:
(11)(9.531) (516)(194)
r =
11(26.706)(516)2 11(3.520)(194)2
r =
4.737
29.820.840
r = 0,867
Como correlaciones cercanas a 1 son altas e indican una asociacin
positiva, concluimos que hay una alta asociacin entre la tecnologa utilizada y la produccin en el tipo de industria estudiadas.
El grado de correlacin lo podemos clasificar evitando un tanto la rigidez de sus lmites:
a. Correlacin perfecta, cuando r=1 (o menos de 1).
b. Correlacin excelente, cuando r es mayor que 0.90 y menor que 1,
(-1<Y<-0.90).
c. Correlacin aceptable, cuando r se encuentra entre 0.80 y 0.90
(-090<r<-080).
d. Correlacin regular, cuando r se encuentra entre
0.60 y 0.80 (-080<r<-0.60).
e. Correlacin mnima, cuando r se encuentra entre 0.30 y 0.60
(-0.60<r<-0.30).
f.
No _____
109
1. S. Variable independiente.
2. Coeficiente de posicin.
3. Coeficiente angular.
4. Y = -180.4 + 15.7x
5. r = 0.60
RESPUESTAS A LA AUTOEVALUACIN N 6
110
111
7. ANLISIS DE LA VARIANZA
Del anlisis de varianza, podemos decir que esta tcnica estadstica,
normalmente es utilizada para analizar resultados en la investigacin con
diseos experimentales y cuasi experimentales. Muchas veces necesitamos comparar dos o ms distribuciones, que corresponden a variaciones
de una misma variable dependiente, afectada por una o ms variables
independientes.
Las variables independientes pueden ser medidas en cualquier tipo de
escala, pero la variable dependiente debe ser medida, al menos, al nivel
intervalo. Si las variables independientes son medidas al nivel intervalo o
de razn, tendramos un tpico caso de anlisis de regresin mltiple.
Si queremos medir la importancia relativa de tres procesos en la calidad de un producto final utilizamos el anlisis de varianza (ANOVA).
En la tabla 13 tomamos unos datos hipotticos para ilustrar su caso. Tenemos tres grupos de 5 productos, seleccionados independientemente,
al azar, con sus respectivos puntajes, en cuanto a su calidad; sta, que
es la variable dependiente, se midi por medio de una escala intervalo.
Tabla 13. Datos para ilustrar el uso de Anova
Mtodo 1
Mtodo2
Mtodo 3
Total
X2
X2
X2
6
10
9
11
12
36
100
81
121
144
9
7
8
8
5
81
49
64
64
25
4
6
9
4
3
16
36
81
16
9
48
482
37
283
26
158
111
x 9.6
7.4
5.2
7.4
N 5
1.5
112
hay diferencias en las medias aritmticas de los tres grupos. Supongamos que queremos analizar las observaciones a un nivel de significancia
del 0.05 y ver si hay diferencias en la calidad por el mtodo empleado. El
clculo de F, contra cuya distribucin de muestreo se comparan los resultados, es el procedimiento a seguir.
1 Suma total de los cuadrados de los puntajes de los tres grupos as:
(X X) = X
2
( X)2
N
(111)2
15
Mtodo 1 = 482
Mtodo 2 = 283
Mtodo 3 = 158
(48)2
5
(37)2
5
(26)2
5
= 158 135.2 =
Total
22.8
53.2
113
= n-1
= 15-1=14
Suma dentro
Suma entre
= K-1
= 3-1
=2
Estimacin
de la varianza
Total
101.6
14
Entre columnas
48.4
24.20
Dentro de las
columnas
53.2
12
4.43
5.46
Varianza entre
48.4
2
= 24.2
F =
Varianza dentro =
53.2
12
= 4.43
24.2
4.43
= 5.46
114
6 Decisin
En la tabla de distribucin F vemos que con un nivel de significancia
del 0.05 y con 2 y 12 grados de libertad, necesitamos un valor igual o mayor a 3.88 para poder rechazar H0. Como en efecto obtuvimos uno de 5.46,
rechazamos H0 y concluimos que los mtodos utilizados s producen una
diferencia significativa en la calidad del producto.
27
36
34
32
41
33
25
19
28
22
25
14
22
27
16
14
23
21
29
20
28
27
17
12
40
28
18
21
Falso _____
1.309.4
Mtodo 2 =
675.5
Mtodo 3 =
715.4
Total
2.700.3
= 42-1 =41
Suma dentro
= 3(14 - 1)39
Suma entre
= 3-1 =2
5. Clculo F
Sumade
cuadrados
Grados de
libertad
Varianza
Total
5.112.40
41
Entre
2.412.10
1.206.10
Dentro
2.700.30
39
69.24
17.42
RESPUESTA A LA AUTOEVALUACIN N 7
MDULO 4: ANLISIS DE LA INFORMACIN
115
Si se prueba con significancia del 0.01, esto implica que necesitamos un F al menos de 5.3, para rechazar H0 y aceptar que los
mtodos s tienen efecto en el rendimiento acadmico de los estudiantes y como se obtiene un F=17.42, concluimos que s tiene
efectos.
2. Falso, es la distribucin F.
Comente los resultados de los 2 problemas.
116
117
STAT
Provee herramientas para el anlisis estadstico avanzado. Sirve para
administrar la informacin como:
Almacenamiento y recuperacin de informacin.
Programacin y modificacin de datos.
Reportes.
Anlisis estadstico.
118
SAS/STAR PROCEDURES
Regression
NLIN
Analysis
Of Variance
Multivariante
Survial
Clustering
CANCORR
Analysis
ACLACUS
FACTOR
LIFEREG
CLUSTER-
REG-RSREG
PLANTTEST
Categorical
Discriminant
CADMOD
CANDISC
SCORE
ANOVAORTHOREG
Scoring
PRINCOMP
FREQ
FASTCLUS
GLM
DISCRIM
STEPDISC
TREE-
NESTEDVARCOMP
VARCLUS
FSP**
Sirve para construir y manipular conjuntos de datos. Este mdulo facilita
la captura de datos, validacin, verificacin en tablas, edicin y consulta.
AF**
Sirve para crear mens y para encadenar los diversos mdulos.
ETS*
Provee herramientas para realizar proyecciones en modelos economtricos. Puede realizar reportes como tablas de amortizacin y tablas de
depreciacin.
OR
Provee una herramienta para investigacin de operaciones.
QC*
Es una aplicacin para estadsticas en control de calidad.
GRAPH
Es el mdulo que posee el SAS
Convenciones:
* No es necesario.
** Para realizar aplicaciones bajo ambientes SAS.
119
SHARE
Permite el acceso concurrente de varios usuarios a archivos comunes
SAS. Este mdulo garantiza la integridad y la seguridad de la informacin.
ACCES
Este mdulo sirve para realizar las interfaces en los manejadores de
bases de datos.
8.2 SPSS
BASE
Contiene estadsticas bsicas, grficos de alta resolucin y un paquete completo de listado. Con el SPSS BASE 6.0 bajo Windows se producir un anlisis y resultados de alta calidad.
Estadsticas profesionales
Medidas de similariedad y diferencias en sus datos, provee tcnicas
de clasificacin. En este procedimiento incluye Anlisis Cluster, Anlisis
Discriminante, Anlisis Factor, Anlisis Multidimensional, Anlisis Proximidades, Mnimos Cuadrados con Ponderacin y Mnimos Cuadrados con
dos fases.
Estadsticas avanzadas
Incluye sofisticadas tcnicas como: Regresin Decox, Estimacin
Kalpian Meier, Regresin Logstica, Anlisis Lineal Logartmico, Anlisis
de Varianza Multivariado, Regresin No-Lineal de Vida (Tabla vida).
Tablas
Crea una variedad de cuadros tabulares, incluyendo tablas complejas
(mltiple respuesta).
Tendencias
Ejecuta pronsticos y anlisis de series de tiempo, modelos de suavizacin y mtodos para estimacin autorregresin.
120
Categoras
Ejecuta anlisis conjunto y procedimientos de optimizacin, incluyendo anlisis de correspondencia.
Chaid
Desarrolla modelos predictivos, produce variables predictorias.
Lissrel
Relaciona un anlisis estructural lineal y modelos de ecuaciones simultneas.
8.3 Requerimientos mnimos para la instalacin del Software SAS
1. Procesador 486 o superior.
2. Memoria RAM 32 Mb o superior.
3. 20 Mb de espacio en el disco duro.
4. Cualquiera de las siguientes opciones
121
122
123
124
aplicaciones u otras agrupaciones diferentes. Estas agrupaciones visuales se pueden adaptar dinmicamente a las necesidades del desarrollador.
La galera de componentes incluye tambin las Visual Foxpro Foundation Classes. Son un conjunto de clases para mejorar las aplicaciones,
reutilizando cdigo probado y optimizado.
Estas clases pueden incluirse en nuestros proyectos directamente o
crear subciases para adaptarlas a las distintas aplicaciones.
Aplicacin de cobertura y control de rendimiento de cdigo
La aplicacin de cobertura genera informacin de las lneas que fueron
ejecutadas en un determinado fichero. Por otro lado se puede configurar
el control que se realiza sobre las lneas de cdigo ejecutadas, cuntas
veces se ejecutan, duracin y muchos otros aspectos.
Acceso por programa al proyecto
En versiones anteriores de Visual Foxpro, el nico acceso a los proyectos se realizaba de forma directa, abriendo la tabla pix a travs del
gestor de proyectos. Ahora se ha implementado un objeto proyecto para
poder manipularlo por programa. El objeto proyecto acta de intermedio
entre un proyecto abierto y el desarrollador que puede interactuar directamente con el proyecto.
125
9. STATGRAPHICS
Software para el anlisis de datos cuantitativos y cualitativos cuya estructura est sobre la base de mens. Existen versiones para trabajar bajo
DOS y bajo Windows.
El men principal de Statgraphics permite entrar a cualquiera de las 22
secciones divididas en seis grupos.
9.1 Grupo I: Data handling and system utilities
A. DATA MANAGEMENT. Men para entrada de datos, definicin de variables, importacin y exportacin de datos.
B. SYSTEM ENVIROMANT. Acceso a requerimientos y configuracin del
sistema.
C. REPORT WRITER AND GRAPHICS REPLAY. Configuracin de impresoras.
D. PLOTTER INTERFACE. Interfase para plotter.
9.2 Grupo II: Plotting and descriptiva statistics
E. PLOTTING FUNCTIONS. Elaboracin de grficas estadsticas en dos
y tres dimensiones.
F. DESCRIPTIVE METHODS. Resume datos, realiza distribuciones de
frecuencia, obtiene estadsticas bsicas.
G. ESTIMATION AND TEST. Elabora intervalos de confianza y pruebas de
hiptesis para una o dos muestras. Permite hacer pruebas de bondad
de ajuste.
H. DISTRIBUTION FUNCTIONS. Genera nmeros aleatorios. Permite hacer clculos con las principales funciones de probabilidad continuas y
discretas.
I.
126
127
128
Tablas
reas bajo la curva normal
Fraccin del rea total (10.000) bajo la curva normal, correspondiente a distancias entre la media y las ordenadas situadas a z unidades de desviacin
estndar de la media.
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
Nmeros aleatorios
129
130
Distribucin de t
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
Distribucin de X2
131
132
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
133
Serie
APRENDER A INVESTIGAR
ANEXO
Mdulo 4
Instructivo para el uso del video
ESTELA URIBE VLEZ
136
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
137
138
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
139
140
b. Flexibilidad de utilizacin: La flexibilidad supone para el profesor el tratamiento de dicho mensaje desde enfoques diversos:
a. La audiencia: Debe conocer muy bien a su audiencia y tener claras sus
necesidades.
b. Contemplar la necesidad de utilizacin en situaciones didcticas que
no sean solamente grupales.
c. Utilizacin integrada en el contexto educativo: El profesor debe presentar contenidos que se integren en el medio afectivo, social y cultural del
alumno destinatario.
Funcin de recapitulador
Este es otro posible uso del video en la situacin interactiva de clase, el
empleo de las secuencias ms significativas del tema expuesto, dndole un
tratamiento diferente, ms gil, ms breve, puede permitir que todo el tema se
resuma en unos pocos minutos, de manera que quede claro cules son las
ideas y los conceptos fundamentales del mismo.
Las funciones anteriores van interrelacionadas y le corresponde al profesor desarrollarlas de tal forma que se adecuen a sus propsitos; por lo tanto el
profesor debe, con anterioridad a la utilizacin del video en el aula, visionar
repetidamente el mismo, analizarlo y decidir cules son los puntos esenciales
del tema, desarrollando seguidamente los materiales complementarios para
los estudiantes.
El video como medio de expresin y de comunicacin
Si concebimos el video como un medio que une la comunicacin didctica, es obvio que, adems de transmitir informacin externa ms o menos
modificada o manipulada por el profesor, debe servir de medio de expresin
de las propias ideas y experiencias para los protagonistas del proceso enseanza-aprendizaje profesor y alumnos.
El video, por su propia naturaleza, resulta un medio apropiado en una comunicacin bidireccional multidireccional en el aula. Su desarrollo como tal, exige, no obstante, un cambio radical en algunas concepciones ancladas en el
sistema educativo y, especialmente, aquellas relacionadas con la facultad y la
libertad para comunicar.
Es necesaria la participacin libre y consciente por parte del alumno en el
proceso comunicativo.
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
141
142
143
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
QU HACER
5. Hacer una pausa para evitar la fatiga, hacer preguntas o aclaraciones sobre el tema si es del caso.
144
10. Al terminar de ver un video se deben hacer preguntas, aclaraciones, verificar si se cumpli el objetivo propuesto.
Bibliografa
MARTNEZ SNCHEZ, Francisco. La educacin ante las nuevas tecnologas de la
Educacin: Configuracin de los videos didcticos. Anales de la Pedagoga N 8,
1990, pgs. 159-180.
COLOM CAELLAS, Antonio J., SUREDA NEGRE, Jaume, SALINAS IBEZ, Jess.
Tecnologas y medios didcticos. De Cincel S.A., Madrid, 1988.
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
145
2. VIDEOS
2.1 VIDEO: LA MEDICIN Y LAS CIENCIAS
Introduccin
El propsito de este video es mostrar qu es la medicin, sus diferentes procesos para recolectar la informacin.
El material audiovisual cumple la funcin de complemento o refuerzo al
material escrito, est concebido como un material autoinstructivo elaborado
como imgenes sencillas y de una forma coloquial.
La informacin consignada en cada uno de los videos es autosuficiente,
es decir, que en forma independiente comunica una informacin completa
sobre un determinado tema. Sin embargo, no debe perder de vista que cada
uno de ellos es parte integrante de una unidad global que es todo el curso.
Para complementar el Mdulo 4, Anlisis de la informacin, se ha elaborado el video La medicin y las ciencias, el cual le dar una visin panormica y al mismo tiempo ser un complemento al tema que usted ha estudiado.
Recomendaciones
Antes de ver este video le recomendamos haber estudiado el Mdulo 4,
Anlisis de la informacin, y estar familiarizado con las tcnicas bsicas para
recolectar la informacin,
Recuerde que el ideo es una ayuda complementaria, que pretende reforzar el contenido que usted ya estudio, adems debe tener en cuenta:
146
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
147
148
que desea investigar y el nivel que escoja le estar sealando la tcnica estadstica que debe utilizar para analizar los fenmenos.
Adems de la escogencia adecuada de los niveles de medicin que el
investigador necesita, en cada caso debe tener bien claros los factores que
tomar como constantes y los que tendr como variables. Generalmente se
designan los factores constantes con las primeras letras del alfabeto castellano o del griego, y las variables con las ltimas letras de nuestro alfabeto, a las
que se puede aadir distintivos numricos. Por ltimo, las variables pueden
tomar slo cierto nmero de valores y entonces son variables discretas, como
cuando damos un valor unitario a cada respuesta acertada de un alumno, o
pueden ser variables que tomen un nmero infinito de valores y entonces son
variables continuas como en el sistema mtrico decimal.
Volvamos sobre la posibilidad de error que siempre acecha al investigador
y que es ms preocupante segn sea la necesidad de precisin y el instrumento que utiliza. Los errores pueden obedecer a falla personal, como por
ejemplo: un defecto de la vista en el investigador, o a defectos sistemticos
surgidos de fallas intencionadas o fortuitas de los aparatos de medicin. Y
finalmente se dan los errores aleatorios, que corresponden al mismo proceso
de medicin, ya que por ejemplo: la ms precisa de las balanzas no nos da
siempre la misma medida, aunque es imposible cerrar el paso a toda posibilidad de error. El cientfico tiene que cuidar que su investigacin sea siempre
confiable, vlida y representativa.
La calidad interna radica en la representatividad o capacidad de ser generalizada que tenga la investigacin en los resultados que exhibe. La confiabilidad
de una medicin es la consistencia que muestra al ser realizada varias veces,
o sea se refiere a la ausencia de errores que aparece en pruebas diferentes.
La validez de una medicin es el grado con que sta representa una medida de lo que realmente se quiere medir, o sea de aquello que en etapa anterior
se ha aclarado conceptualmente como objeto de la investigacin o de la medicin especfica; con lo que ya se est diciendo que es ms importante asegurarse de la validez de la medicin que de su confiabilidad. Aunque no es
posible establecer directamente la validez de una medicin, la prctica cientfica ha consagrado varias maneras indirectas, ya sea para mediciones hechas en el campo de las ciencias naturales o exactas, o ya sea en el de las
ciencias sociales.
Por ltimo la representatividad o generalidad de una medicin tiene que
ver con el grado en que sus resultados surgidos a partir de una muestra pueden ser atribuidos a la poblacin general; porque si la medicin no est
bien hecha pierde representatividad as se haya escogido cuidadosamente la
muestra.
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
Autoevaluacin
Apoyndose en el contenido del Mdulo 4 y del video que acaba de ver,
conteste o complete si es del caso las siguientes preguntas:
1. Qu debe considerar el investigador para que el proceso de medicin tenga efecto?
2. Cmo pueden ser los niveles de medicin?
3. Para qu sirve el nivel nominal?
4. Para qu sirve el nivel ordinal?
5. En qu consiste el nivel de razn o radial en la medicin?
6. Qu determina la tcnica estadstica que el investigador debe utilizar para analizar los fenmenos?
7. Qu otros factores debe considerar el investigador adems de la
escogencia de los niveles de medicin?
8. Cmo pueden ser las variables?
9. Qu diferencia hay entre estas variables?
10. A qu puede obedecer la posibilidad de error en la medicin que
realiza el investigador?
11. De qu depende la calidad interna de un proceso de investigacin?
12. En qu radica la calidad externa de los procesos de investigacin?
13. En qu consiste la confiabilidad de una medicin?
14. Qu es la validez de una medicin?
149
Despus de haber realizado la autoevaluacin puede comparar sus respuestas con el guin de contenido.
1. Clarificacin y clasificacin de los conceptos que utiliza, para lograr
acuerdos acerca de lo que se trata de expresar.
2. Nominal, ordinal y el nivel de razn o radial.
3. Para clasificar sin establecer ninguna otra diferencia entre las unidades o individuos de que se trate.
4. Asigna valores numricos y puede introducir la posibilidad de un
orden determinado.
5. Incluye las posibilidades de los otros niveles y la del cero absoluto.
6. El nivel de medicin.
7. Los factores que tomar como constantes y los que tendr como
variables.
8. Discretas y continuas.
9. Las discretas tienen nmero de valores, las continuas tienen un
nmero infinito de valor.
10. A falla personal.
Defectos sistemticos surgidos de fallas intencionadas o fortuitas de los aparatos de medicin.
Errores aleatorios que corresponden al mismo proceso de medicin.
11. De la confiabilidad y validez que tenga la observacin de los datos.
12. En la representabilidad o capacidad de ser generalizada que tenga
la investigacin en los resultados que exhibe.
13. Es la consistencia que muestra al ser realizada varias veces, o sea
a la ausencia de error que aparece en pruebas diferentes.
14. Es el grado con que sta representa una medida de lo que realmente se quiere medir.
Respuestas a la Autoevaluacin
150
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
151
Es conveniente que sepa manejar el control remoto del VHS o del Betamax
para que pueda adelantar o retroceder en las ideas que no le sean claras.
152
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
153
154
La curva normal es un instrumento que ayuda a organizar, describir y predecir el comportamiento de fenmenos que en su distribucin se aproximan a
la distribucin normal. As por ejemplo, y tomando la curva normal como modelo, podran estimarse el porcentaje de colombianos adultos cuya estatura
vara entre 1.60 metros y 1.80 metros y el porcentaje de aquellos que miden
menos de 1.60 metros o ms de 1.80 metros.
Otra forma en que la Curva Normal acta como modelo de suma importancia es en la llamada Distribucin de Muestreo. En efecto, si obtenemos
una gran cantidad de muestras aleatorias de un universo dado, el valor de los
promedios y de otras estadstica de esas muestras tienden a conformar una
distribucin normal. A modo de ejemplo veamos este caso: los valores 1, 2 y
3 conforman nuestro universo. De ese universo vamos a obtener todas las
posibles muestras de dos elementos. He aqu la primera muestra, el promedio de esa muestra es uno y lo anotamos en una tabla de frecuencia. Ahora
vamos a repetir el procedimiento con las otras posibles muestras, es decir,
tomamos los valores de la muestra y consignamos en la tabla el valor de su
promedio, he aqu el resultado final, los promedios de las diferentes muestras
tienen una distribucin muy cerca a la normal. Si el universo fuera mayor y las
muestras ms grandes el perfil de la curva normal sera ms notable. Hay otro
hecho en extremo interesante y es que el valor promedio de la distribucin de
estos promedios coinciden con el valor promedio del universo original. Este
carcter normal de la distribucin de muestreo es de gran importancia para
realizar inferencias ya que permite al investigador calcular la probabilidad de
que el valor de una estadstica obtenida en una muestra, coincida con el valor
del parmetro de la poblacin o universo. Como modelo terico, la curva normal tiene en sntesis las siguientes caractersticas: como sabemos es una
distribucin simtrica y asinttica que no toca el eje horizontal y se extiende
indefinidamente; el rea total debajo de la curva puede representar el nmero
total de elementos de la poblacin o universo, es decir, constituye el 100% de
los casos; esta propiedad permite que entre dos puntajes a lo largo del eje
horizontal sea posible determinar la proporcin de la frecuencia entre dos
puntajes; proporcin que ser igual al rea de la curva entre esos dos puntos.
Cuando se normaliza una distribucin, el medio aritmtico, la mediana y la
moda son iguales a cero; por lo tanto, los valores al lado izquierdo del eje
horizontal son negativos mientras que los valores del lado derecho son positivos.
La desviacin estndar en una desviacin normalizada es igual a uno, el
68.26% de los valores de la distribucin se localizan bajo el rea determinada
por una desviacin estndar a cada lado del medio aritmtico. Del mismo
modo el 95.46% de los valores se localizan entre extremos de dos desviaciones a lado y lado del medio. El 99% de los valores se agrupan bajo el rea que
determinan tres desviaciones estndar a lado y lado del mismo medio. La
comprensin y aplicacin de la curva normal es una exigencia en el trabajo
investigativo, particularmente cuando se desea hacer inferencias a partir de
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
155
Autoevaluacin
Apoyndose en el contenido del Mdulo 4, y en el video que acaba de ver
conteste o complete si es del caso las siguientes preguntas:
1. Qu es la distribucin normal?
2. Qu es la curva normal?
3. Por qu surge la curva normal?
4. Cuales son las caractersticas que deben cumplir la familia de las
curvas normales?
5. Qu es una curva normal asinttica?
6. Cul es la utilidad prctica de la curva normal?
7. Como modelo estadstico y matemtico la curva normal es un instrumento que ayuda a...
8. Qu es distribucin de muestreo?
9. Qu caractersticas tiene la curva normal como modelo terico?
10. Cuando se normaliza una distribucin, la media aritmtica, la mediana y la moda son igual a....
11. A qu es igual la sesviacin estndar de una distribucin normalizada?
12. Qu se necesita para aplicar la curva normal con acierto?
Despus de haber contestado las preguntas puedes comparar sus respuestas con el guin de contenido.
1. Es aquella en la cual las frecuencias tienden a concentrarse uniformemente alrededor de un valor central.
2. Es una representacin grfica y matemtica de aquellos fenmenos que bajo ciertas condiciones pueden considerarse como normalmente distribuidos.
3. Como representacin de la frecuencia de eventos que ocurren al
azar y por lo tanto como parte de la teora de la probabilidad.
4. Toda curva normal es simtrica.
La distribucin que representa la curva normal es la unimodal.
La curva normal es continua.
La curva normal es asinttica.
5. Es la que no toca el eje de la X y por lo tanto ocupar un nmero
infinito de observaciones.
6. Es su valor como modelo estadstico y matemtico.
7. Organizar, describir y predecir el comportamiento de fenmenos
que en su distribucin se aproximan a la distribucin normal.
8. Cuando la curva normal acta como modelo se obtiene una gran
cantidad de muestras aleatorias de un universo dado y el valor de
los promedios y de otras estadsticas tiende a conformar una distribucin de muestreo.
9. Es una distribucin simtrica y asinttica que no toca el eje horizontal y se extiende independientemente.
El rea total debajo de la curva normal puede representar el nmero total de elementos de la poblacin urbana.
10. Cero
11. A uno
12. Su exacta comprensin como instrumento estadstico, lo mismo
que el conocimiento preciso de la ndole y caractersticas de la investigacin para la cual se aplica.
Respuestas a la Autoevaluacin
156
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
157
Es conveniente que sepa manejar el control remoto del VHS o del Betamax
para que pueda adelantar o retroceder en las ideas que no le sean claras.
158
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
159
160
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO
161
162
Autoevaluacin
Apoyndose en el contenido del Mdulo 4, y en el video que acaba de ver
conteste o complete si es del caso las siguientes preguntas:
1. Qu es una muestra?
2. En qu se diferencian las generalizaciones que hace la ciencia
con respecto a las generalizaciones que no son cientficamente
ciertas?
3. Cmo se llaman los valores que el investigador mide en la muestra?
4. Con qu nombre se conocen los valores que corresponden a la
poblacin o universo?
5. De qu depende la representatividad de la muestra?
6. Qu es disear una muestra?
7. Qu tipos de muestras se utilizan en la investigacin?
8. Cundo se utilizan las muestras no probabilsticas o intencionales?
9
Qu es la muestra no probabilstica?
163
Despus de haber contestado las preguntas puedes comparar sus respuestas con el guin de contenido.
14. La precisin con que est definido el universo de la investigacin.
La claridad que el investigador tenga sobre los objetivos y variables de su estudio.
La recoleccin y procesamiento cuidadoso de los datos.
15. La claridad conceptual y rigor metodolgico.
164
165
Bibliografa
BERENSON, Mark. Estadstica bsica en administracin. Conceptos y aplicaciones .
1992.
BRIONES, G. Mtodos y tcnicas de investigacin para las ciencias sociales. Mxico,
Trillas, 1982.
CARVAJAL, Lizardo. Metodologa de la investigacin. Sptima edicin. Cali, FAID, 1991.
CEBALLOS ROJAS, Argemiro. Estadstica descriptiva y probabilidad bsica. 1994.
GODINO, J. y otros. Azar y probabilidad. Fundamentos didcticos y propuestas
curriculares. Sntesis, 1991.
GONZLEZ REYNA, Susana. Manual de redaccin e investigacin documental. Segunda edicin, Mxico, Trillas, 1994.
HARNETT y MURPHY. Introduccin al anlisis estadstico. Addison-Wesley Iberoamericana, 1993.
HOPKINS, Kenneth. Estadstica bsica para las ciencias sociales y el comportamiento. 1997.
KREYSZIG, Erwin. Estadstica matemtica. Limusa. 1983.
MASON, Robert; LIND Douglas. Estadstica para administracin y economa. 8a edicin. Santa Fe de Bogot, Alfaomega Grupo Editor S.A. de C.V., 1998.
MENDENHALL, William. Introduccin a la probabilidad y a la estadstica. Grupo Editorial Iberoamericana, 1991.
MENDENHALL, William; WACKERLY, Dennis; SCHEAFFER, Richard. Estadstica
matemtica con aplicaciones. Mxico, Grupo Editorial Iberoamericana, 1994.
MENDENHALL, SCHEAFFER y WACKERLY. Estadstica matemtica con aplicaciones. Grupo Editorial Iberoamericana, 1986.
166