Está en la página 1de 166

YOLANDA GALLARDO DE PARADA

ADONAY MORENO GARZN

Serie

APRENDER A INVESTIGAR

Mdulo 4
ANLISIS DE LA INFORMACIN

INSTITUTO COLOMBIANO PARA EL FOMENTO


DE LA EDUCACIN SUPERIOR, ICFES
Subdireccin General Tcnica y de Fomento
PATRICIA MARTNEZ BARRIOS
Directora General
PATRICIA ASMAR AMADOR
Subdirectora General Tcnica y de Fomento
MNICA IBARRA ROSERO
Jefe Divisin de Fomento (A)
MARA JESS RESTREPO ALZATE
Coordinadora del Proyecto

Serie: APRENDER A INVESTIGAR


ISBN: 958-9279-11-2 Obra completa
ISBN: 958-9279-15-5 Mdulo 4

1
1
2
2
3

Edicin: 1987
Reimpresin: 1988
Reimpresin: 1991
Edicin: 1995
Reimpresin: 1998
Edicin: (corregida y aumentada) 1999

ICFES
Calle 17 N 3-40 A.A. 6319
Telfono: 2819311 - 2834027 - 2834067 - 2435129
Fax: 2845309 - 2834047 - 2845980
Santa Fe de Bogot

Diseo de cartula, diagramacin e impresin:


ARFO EDITORES LTDA.
Carrera 15 N 53-86
Tels.: 2355968 - 2175794
Santa Fe de Bogot, D.C.

INSTITUTO COLOMBIANO PARA EL FOMENTO


DE LA EDUCACIN SUPERIOR

Serie:

APRENDER A INVESTIGAR

Mdulos:

1.
2.
3.
4.
5.

CIENCIA, TECNOLOGA, SOCIEDAD Y DESARROLLO


LA INVESTIGACIN
RECOLECCIN DE LA INFORMACIN
ANLISIS DE LA INFORMACIN
EL PROYECTO DE INVESTIGACIN

La serie APRENDER A INVESTIGAR ha sido realizada por el ICFES. Para las ediciones anteriores se cont
con el siguiente grupo de autores:
CARLOS ESCALANTE A.
Profesor Universidad Nacional de Colombia

HUMBERTO RODRGUEZ M.
Profesor Universidad Nacional de Colombia

ALBERTO MAYOR M.
Profesor Universidad Nacional de Colombia

EDUARDO VLEZ B.
Investigador Instituto SER de Investigaciones

NGEL FACUNDO D.
Exjefe Divisin de Fomento
Investigativo ICFES

El proyecto de actualizacin y revisin de la presente edicin de la serie APRENDER A INVESTIGAR fue realizado por el ICFES, para lo cual se conform el siguiente grupo de autores:
Mdulo 1:
LUIS JAVIER JARAMILLO
Mdulos 3 y 4:
ADONAY MORENO
YOLANDA GALLARDO DE PARADA

Universidad San Buenaventura - Cali


Universidad de Pamplona (N.S.)

Mdulos 2 y 5:
MARIO TAMAYO Y TAMAYO

Universidad ICESI - Cali

Instructivos para videos:


LUZ ESTELLA URIBE VLEZ

EAFIT - Medelln

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS DE LA INFORMACIN

Contenido
SERIE APRENDER A INVESTIGAR
Presentacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Propsito, poblacin y objetivos de la serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Estructura de aprendizaje de la serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La organizacin de la serie: los mdulos, y material audiovisual . . . . . . . . . . . . . . .
Descripcin sinttica de los mdulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La asesora de tutores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7
9
11
13
17
19
23

Mdulo 4: ANLISIS DE LA INFORMACIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

1.

NATURALEZA DE LA ESTADSTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

2.

DIVISIN DE LA ESTADSTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 Estadstica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Descripcin de datos, tcnicas de representacin grfica . . . . . . . . . .
2.1.2 Distribucin de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.3 Elaboracin de una tabla de frecuencias . . . . . . . . . . . . . . . . . . . . . . .
2.1.4 Presentacin grfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.4.1 Histogramas y polgonos de frecuencias . . . . . . . . . . . . . . . .
2.1.4.2 Grficas de barras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.4.3 Grficas lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.4.4 Grficas circulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

27
27
29
31
31
33
34
35
36
37

3.

DESCRIPCIN DE DATOS - TCNICAS NUMRICAS . . . . . . . . . . . . . . . . . . . . .


3.1 Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 La moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.2 La mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.3 La media aritmtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Medidas de dispersin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 El rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.2 Percentiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.4 Desviacin estndar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.5 Coeficiente de variacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Asimetra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Kurtosis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5 Tablas de contingencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41
41
41
42
44
46
47
47
48
50
50
51
51
53

SERIE: APRENDER A INVESTIGAR

4.

INTRODUCCIN A LAS PROBABILIDADES . . . . . . . . . . . . . . . . . . . . . . . . . . . .


4.1 Probabilidades elementales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Esperanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Leyes de las probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4 Anlisis combinatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.1 Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.2 Variaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.3 Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5 Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6 Distribucin binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.7 Distribucin normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.8 Distribucin de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60
60
62
62
64
64
66
66
67
70
70
76

5.

ESTADSTICA INFERENCIAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 La prueba de hiptesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Pruebas de significancia de muestras nicas o simples . . . . . . . . . . . . . . . . .
5.2.1 Prueba Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.2 Distribucin t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.3 Distribucin Chi cuadrado: 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80
81
86
86
87
92

6.

REGRESIN Y CORRELACIN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1 Introduccin a la bidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Ajuste de una recta de regresin rectilnea simple . . . . . . . . . . . . . . . . . . . . .
6.3 Correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.4 Coeficiente de correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

98
98
101
104
107

7.

ANLISIS DE LA VARIANZA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

111

8.

ESTUDIO DE FACTIBILIDAD DEL SOFTWARE ESTADSTICO . . . . . . . . . . . . . .


8.1 SAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.3 Requerimientos mnimos para la instalacin del Software SAS . . . . . . . . . . .
8.4 Requerimientos mnimos para la instalacin del Software SPSS . . . . . . . . . .
8.5 Manejador de Base de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

117
117
119
120
120
121

9.

STATGRAPHICS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1 Grupo I: Data handling and system utilities . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Grupo II: Plotting and descriptive statistics . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3 Grupo III: Anova and regression analysis . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4 Grupo IV: Time series procedures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.5 Grupo V: Advanced procedures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.6 Grupo VI: Mathematical procedures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.7 Requerimientos fsicos para la instalacin de Statgraphics . . . . . . . . . . . . . .

125
125
125
126
126
126
126
127

ANEXO: Instructivo para el uso del video


1.
Uso didctico del video . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.
Videos:
La medicin y las ciencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La curva normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

145
151
157

BIBLIOGRAFA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

165

137

MDULO 4: ANLISIS DE LA INFORMACIN

SERIE APRENDER A INVESTIGAR

Presentacin
El Instituto Colombiano para el Fomento de la Educacin ICFES, ha venido desarrollando proyectos que propenden por el mejoramiento de la calidad de la educacin
superior y la formacin del talento humano que sea capaz de asumir el reto que nos
impone la educacin del siglo XXI.
Dentro de este marco de referencia, la formacin de directivos, docentes e investigadores en el tema de la investigacin ha sido prioritaria para el ICFES, razn por la
cual ha continuado impulsando la divulgacin de materiales de gran utilidad para
incentivar la prctica investigativa en la educacin superior.
La SERIE APRENDER A INVESTIGAR es un material autoinstructivo que ofrece
los conceptos, las herramientas y los mtodos necesarios para la formulacin, perfeccionamiento y diseo de proyectos de investigacin.
A las puertas del nuevo milenio, estamos entregando a la comunidad acadmica
una nueva edicin actualizada y complementada de la SERIE APRENDER A INVESTIGAR, la cual contribuir a generar la cultura investigativa, que constituye la
base de la educacin, la ciencia y la tecnologa del pas.

PATRICIA MARTNEZ BARRIOS


Directora General

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS DE LA INFORMACIN

Introduccin
a la serie
El presente programa autoinstruccional denominado APRENDER A INVESTIGAR, contiene algunos de los principales elementos, tericos y prcticos, sobre conceptos, mtodos y tcnicas usualmente empleados en el trabajo de investigacin cientfica.
Aprender a Investigar es un proceso largo y complejo, que comprende diversas
dimensiones y etapas formativas, algunas de las cuales comienzan, o deben comenzar
a desarrollarse, desde los primeros aos de vida. Para el grupo de autores del programa, Aprender a Investigar no se reduce al estudio y dominio de la metodologa general de la investigacin cientfica. Aprender a Investigar implica, entre otras cosas, el
desarrollo de diversas dimensiones, tales como:
a) Un espritu de permanente observacin, curiosidad, indagacin y crtica de
la realidad, el cual nos permite preguntarnos si aquello que se conoce sobre algo
es realmente un conocimiento o si acaso ofrece una mejor explicacin del fenmeno o del objeto de estudio. Este espritu de observacin, crtica y creatividad se
desarrolla desde los primeros aos de vida.
b) Una slida formacin general y un creciente dominio de los conocimientos
sobre un rea especfica de la realidad, pues stos son la base y el punto de
partida para poder aportar nuevos conocimientos. Como el cmulo de informacin
cientfica es hoy en da tan grande y se encuentra en constante aumento, se hace
necesario concentrar la atencin en tpicos especficos, pues cada vez es ms
difcil seguir de cerca y estar al da sobre diversas temticas y mtodos de conocimiento. La formacin general y la concentracin del inters y aprendizaje permanentes en aspectos particulares de la realidad se ha venido efectuando a travs de
los diferentes niveles educativos hasta llegar a centrar el inters en un rea especfica del conocimiento. Esta segunda dimensin, unida al dominio de la metodolo-

10

SERIE: APRENDER A INVESTIGAR

ga general de la investigacin cientfica, es otro de los requisitos decisivos para


aprender a investigar.
c) La prctica investigativa misma por medio de la cual las teoras, principios,
conceptos, mtodos y tcnicas dejan de ser simples enunciados para convertirse en algo concreto y vivencial, constituye la tercera condicin indispensable.
El adagio popular dice que a nadar se aprende nadando. De forma semejante,
para aprender a investigar hay que lanzarse a la prctica investigativa. La teora
sin la prctica es vaca, pero la prctica sin la teora es ciega. Los conocimientos
sobre los contenidos y mtodos que se han venido adquiriendo sobre las disciplinas
de estudio, y aquellos que se puedan adquirir a travs de esta serie sobre metodologa general de investigacin cientfica, deben servir como guas iluminadoras de
la accin. En la medida de lo posible, para aprender a investigar es necesario
integrarse a un equipo de investigacin, el cual pueda ser conducido y orientado
por la experiencia terico-prctica de investigadores profesionales que estn en la
misma lnea de inters investigativo.
El estudio de la metodologa general de la investigacin cientfica, junto con ese
espritu indagador y creativo y los conocimientos de los contenidos y mtodos de reas
especficas del saber que usted ha venido adquiriendo, as como el deseo de lanzarse
pronto a la prctica investigativa, justifica el nombre que se ha dado a la serie: APRENDER A INVESTIGAR.
De otra parte, es importante advertir sobre las ventajas y limitaciones de un programa como ste. En primer lugar, al haber sido escrito dentro de la metodologa de
la autoinstruccin, si bien cuenta con la ventaja de permitir estudiar por cuenta propia, de acuerdo con el tiempo disponible y el ritmo personal de aprendizaje, tiene la
limitante de tener que suponer que quien sigue el programa posee los aprendizajes
previos requeridos para asimilar los contenidos y el nivel acadmico adecuado; se
cuenta por tanto, bsicamente, con la seriedad del estudiante y con el cumplimiento
estricto de las diferentes instrucciones del programa.
Es segundo trmino, debe tenerse en cuenta que la funcin de un programa como
ste es proporcionar los principales conceptos, mtodos y tcnicas de un proceso de
investigacin, los cuales son tratados de forma sencilla y resumida. Se presentan en
forma sucinta las diferentes discusiones que sobre cada aspecto se han dado en la
comunidad cientfica. Si se desea un conocimiento ms profundo, debe necesariamente recurrirse a aquellos textos que analicen cada tpico en toda su complejidad, al
investigador, profesor, instructor o tutor.

MDULO 4: ANLISIS DE LA INFORMACIN

11

Propsito, poblacin
y objetivos de la serie
El propsito del programa, serie APRENDER A INVESTIGAR, es familiarizar al
estudiante con los elementos conceptuales y algunas tcnicas bsicas que le permitan,
en su rea de estudio, comenzar a resolver problemas de conocimiento, aplicando la
lgica del proceso investigativo utilizando determinados instrumentos bsicos. No se
trata de proporcionar una informacin para memorizar sino que sta debe servir para
orientar la prctica investigativa del estudiante, dentro de la disciplina cientfica en
la cual se prepara como profesional e investigador.
En este sentido, la serie APRENDER A INVESTIGAR ha sido diseada para
una poblacin de estudiantes de educacin superior que se ha iniciado en el conocimiento de los contenidos y mtodos bsicos de una disciplina cientfica determinada y
que, por tanto, comienza a plantearse y a enfrentar algunos problemas de investigacin.
En la situacin corriente de nuestras instituciones de educacin superior, la poblacin objetivo de esta serie son estudiantes que estn cursando aproximadamente el
quinto semestre de carrera, y que van a tener su primera aproximacin a la metodologa general de investigacin cientfica.
El objetivo terminal de toda la serie o del curso completo consiste en lo siguiente:
Al finalizar el proceso instructivo, el estudiante deber estar en condicin de disear y emprender un proyecto de investigacin dentro de su disciplina acadmica, aplicando tanto los contenidos adquiridos con las asignaturas propias de su carrera, como
los elementos conceptuales y tcnicos adquiridos con el estudio de esta serie. Esto lo

12

SERIE: APRENDER A INVESTIGAR

capacitar para enfrentar y tratar de resolver problemas de su rea de estudio siguiendo la metodologa de la investigacin cientfica.
Para cumplir estos propsitos y estos objetivos, se supone que los usuarios de este
curso (estudiantes que estn en la mitad de una carrera de educacin superior), han
desarrollado los siguientes aprendizajes:

Comprensin clara de textos escritos.

Deduccin lgica, abstraccin y aplicacin de principios.

Conocimientos bsicos de historia.

Manejo general de los temas y mtodos bsicos de su disciplina de estudio.

Manejo de las operaciones matemticas.

Solucin de ecuaciones de primer grado.

Definicin de funciones matemticas.

Entendimiento de los conceptos lgicos de probabilidad.

Hacemos explcitas estas conductas mnimas de entrada, con la finalidad de


garantizar, por una parte, la adecuada ubicacin del curso dentro de los programas
acadmicos, o en el caso eventual de que ste se siga por fuera del mbito de un
programa acadmico formal, con la finalidad de garantizar la necesaria nivelacin
previa de los conocimientos bsicos.

13

MDULO 4: ANLISIS DE LA INFORMACIN

Estructura
de aprendizaje
de la serie
La serie APRENDER A INVESTIGAR consta de los siguientes elementos:
*
*
*

Cinco mdulos escritos y guas de utilizacin de videocasetes.


Cinco videocasetes que contienen trece programas de video para BETA o VHS.
Gua de utilizacin de videocasetes.

Los mdulos son el material fundamental de trabajo. Sin embargo, en aquellos


temas en los cuales el medio audiovisual permite una mayor riqueza y facilidad de
expresin, se prefiri su uso al del material escrito. En otros aspectos que presentan
alguna dificultad de comprensin, el material audiovisual cumple la funcin de complemento o refuerzo del material escrito. En ningn caso el material audiovisual es repetitivo dcl material escrito.
Toda la serie ha sido diseada como material autoinstructivo. Por tal razn, sin
sacrificar la necesaria precisin de los conceptos, se ha utilizado el lenguaje coloquial
y sencillo. Segn el propsito y el objeto antes expresados, se ha buscado hacer un
primer acercamiento del estudiante a los conceptos, mtodos y tcnicas bsicas de
investigacin, buscando ante todo despertar su inters por ellas. En los casos en los
cuales el estudiante desee profundizar, deber recurrir a la bibliografa bsica que se
le indica al final de cada unidad, as como una consulta con tutores, profesores o con
expertos investigadores en la materia. El conocimiento adquirido a travs del curso
debe servirle de gua para continuar profundizando en la materia.
Los mdulos de que consta la serie son:

14

SERIE: APRENDER A INVESTIGAR

Serie Aprender a Investigar


Organizacin de los mdulos
Material escrito
Mdulo 1

Mdulo 2

Mdulo 3

Mdulo 4

Mdulo 5

Videocasetes

CIENCIA, TECNOLOGA Y DESARROLLO


*Naturaleza de la actividad cientfica
*Naturaleza de la tecnologa
*Investigacin y desarrollo experimental
*El impacto socio-econmico
de la ciencia y la tecnologa
*La ciencia y la tecnologa en
la nueva revolucin industrial

*Ciencia y tecnologa:
desarrollo del hombre

15

LA INVESTIGACIN
*El conocimiento cientfico
*Tipos de investigacin
*Modelos y diseos de investigacin
*La interdisciplinariedad

*Tipos de investigacin
cientfica
*El experimento

15
15

RECOLECCIN DE LA INFORMACIN
*Conceptos bsicos de medicin
*Informacin primaria y secundaria
*Unidades variables y valores
*Tcnicas para el registro
de informacin secundaria
*Tcnicas para la recoleccin
de informacin primaria
*La encuesta

*Informacin primaria
y secundaria
*La observacin
*La encuesta
*La entrevista

15
15
15
15

ANLISIS DE LA INFORMACIn
*Descripcin de datos - Tcnicas
de representacin grfica
*Distribucin de datos - Tcnicas
numricas
*Introduccin a las probabilidades
*La prueba de hiptesis
*Regresin y varianza
*Anlisis y muestra
*Universo y muestra
*Estudio de factibilidad
de software estadstico

*La medicin
y las ciencias
*La curva normal
*La muestra

15
15
15

EL PROYECTO DE INVESTIGACIN
*Elementos del proceso investigativo
*Administracin del proyecto
*Evaluacin del proyecto
*El informe investigativo

*Cmo utilizar las fuentes


de informacin
*De dnde surgen los
problemas de investigacin
*Vamos a elaborar
un proyecto

15
15

Nota: En los mdulos escritos se incluye una gua didctica para utilizacin de los videocasetes.

MDULO 4: ANLISIS DE LA INFORMACIN

15

Se trata de que cada mdulo (tanto en el material escrito como en el material


audiovisual) sea autosuficiente, es decir, que en forma independiente comunique una
informacin completa sobre un determinado tema. Sin embargo, no debe perderse de
vista que cada uno de ellos es parte integrante del programa total. Entre uno y otro
mdulo existen relaciones determinadas de orden y niveles, que conforman la ESTRUCTURA DE APRENDIZAJE con la cual se dise la serie.
Es importante conocer esta estructura de aprendizaje, pues ella es una gran
ayuda, tanto para el estudio como para la evaluacin de los objetivos de aprendizaje
propuestos.

16

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS DE LA INFORMACIN

17

La organizacin de la serie:
los mdulos
y material audiovisual
Un mdulo consta de unidades de aprendizaje, que son consideradas como etapas que hay que recorrer, siguiendo una ruta estratgicamente diseada, para lograr un
objetivo propuesto.
Dentro de cada mdulo y antes de empezar cada Unidad se explicitan cules son
los objetivos especficos de aprendizaje que se persiguen.
En la tcnica de estudio independiente o de autoinstruccin, usted debe ser muy
consciente, antes de entrar a trabajar, de qu es lo que va a hacer. Esto le ayudar en
el aprendizaje. Una vez usted haya estudiado un contenido de acuerdo con su ritmo
propio de trabajo, al final de cada unidad encontrar unas preguntas sobre los contenidos que trata el mdulo que le permitirn autoevaluarse, conocer si usted domina esos
contenidos y, por tanto, decidir en forma personal y responsable si puede continuar
avanzando.
Recuerde y tenga siempre en cuenta que no todas las partes del proceso investigativo
presentadas en el modelo aparecen desarrolladas en el texto escrito, algunas han sido
desarrolladas en los videocasetes, por lo cual, cuando as se le indique, usted deber
recurrir al beta o VHS y seguir la gua de utilizacin de videos.
La serie est diseada de tal forma que es bsicamente usted quien juega el rol
principal, quien estudia y quien debe decidir si ha alcanzado los objetivos previstos. Se
han hecho grandes esfuerzos para organizar los diferentes materiales en funcin de un
aprendizaje a partir de un estudio independiente.

18

SERIE: APRENDER A INVESTIGAR

19

MDULO 4: ANLISIS DE LA INFORMACIN

Descripcin sinttica
de los mdulos
El mdulo 1
Hemos denominado al mdulo 1: Ciencia, tecnologa, sociedad y desarrollo

El propsito de este mdulo es proporcionar al estudiante que se inicia en el estudio


de la metodologa general de investigacin, una rpida visin de cmo la ciencia,
la tecnologa y la investigacin son actividades de carcter histrico, es decir,
que han evolucionado con el desarrollo del hombre y de la sociedad.

Mostrar cmo han adquirido en la actualidad una importancia estratgica.

Introducir en los conceptos de ciencia, tecnologa e investigacin.

Este mdulo se complementa con el videocasete: Ciencia y tecnologa: desarrollo


del hombre, 15.

El mdulo 2
Hemos denominado el mdulo 2: La investigacin

El propsito de este mdulo es presentar el conocimiento y el mtodo cientfico


como punto de partida para enfrentar la realidad y plantear procesos investigativos.

Mostrar los diferentes tipos de investigacin y dar elementos de juicio para la


utilizacin de medios y determinacin del tipo de diseo a seguir.

20

SERIE: APRENDER A INVESTIGAR

Presentar la interdisciplinariedad como una metodologa de investigacin cientfica.

Este mdulo se complementa con dos videocasettes: 1. Tipos de investigacin


cientfica, 15 y 2. El experimento, 15.

El mdulo 3
Hemos denominado al mdulo 3: Recoleccin de la informacin

El propsito de este mdulo es identificar las tcnicas bsicas para recolectar la


informacin que se requiere para el trabajo de investigacin.

Distinguir las reglas de diseo a que estn sometidas.

Plantear elementos bsicos para que, en dependencia con el tipo de investigacin,


el programa que se enfrenta y la estrategia concebida para resolverla, es decir, con
la hiptesis conductora del trabajo, se pueda emplear las tcnicas que ms se
ajusten a esos requerimientos.

Este mdulo se complementa con cuatro videocasettes: 1-. Informacin primaria y


secundaria, 15. 2-. La observacin, 15. 3-. La encuesta, 15. 4- La entrevista, 15.

El mdulo 4
Hemos denominado al mdulo 4: Anlisis de la informacin

El propsito de este mdulo es plantear las tcnicas ms comunes para el anlisis


de datos, y el saber cundo, cmo y por qu utilizarlas. Se plantea adems el anlisis
conceptual y la descripcin de paquetes estadsticos para uso del computador.

Este mdulo se complementa con tres videocasettes: 1-. La medicin y las ciencias, l 5. 2-. La curva normal, I 5. 3-. La muestra, 15.

El mdulo 5
Hemos denominado el mdulo 5: El proyecto de investigacin

MDULO 4: ANLISIS DE LA INFORMACIN

21

El propsito de este mdulo es lograr que el estudiante retome e integre los conceptos y los procesos de la metodologa de investigacin cientfica y pueda formular un proyecto de investigacin en su respectiva rea de estudio.

Presentar elementos bsicos para el desarrollo del proyecto de investigacin relacionados con el proceso de investigacin: la administracin del proyecto; la evaluacin del proyecto y el informe investigativo.

Este mdulo se complementa con tres videocasettes. 1-. Cmo utilizar las fuentes
de informacin, 15. 2-. De dnde surgen los problemas de investigacin, 15. 3-.
Vamos a elaborar un proyecto, 15.
Consideramos que este mdulo es de vital importancia y tanto los videos como los
otros mdulos convergen a ste. Es decir que el mdulo 5 es el centro de la serie
APRENDER A INVESTIGAR.
Como objetivos especficos del mdulo, tenemos:

Indicar al estudiante los factores a tener en cuenta en la eleccin de un tema para


investigar.

Proporcionar al estudiante las herramientas bsicas que le permitan identificar,


analizar y formular problemas de investigacin dentro de su rea de estudio.

Capacitar al estudiante para que pueda formular hiptesis para la solucin de los
problemas y sealarle algunos de los pasos que generalmente se siguen para poner
a prueba las hiptesis de investigacin.

Sealar las diferencias que existen entre las actividades cientifico-tcnicas, con la
finalidad de que pueda comprender la peculiaridad de una de ellas: la investigacin.

Hacer conocer que la forma moderna de investigar es a travs de la planeacin,


ejecucin y determinacin de aspectos administrativos del proyecto.

Proporcionar al estudiante y a los profesores parmetros de evaluacin para proyectos de investigacin.

Lograr que el estudiante entienda la necesidad e importancia de elaborar informes


parciales y finales, que estn en capacidad de elaborarlos aplicando las tcnicas
bsicas correspondientes.

22

SERIE: APRENDER A INVESTIGAR

23

MDULO 4: ANLISIS DE LA INFORMACIN

La asesora de tutores
Aunque los mdulos han sido diseados para que puedan utilizarse en estudio independiente o en forma auto-instructiva, es conveniente valerse de la asesora de tutores, profesores o expertos investigadores.
El trabajo tutorial es conveniente para:

Aclarar, ampliar y profundizar conceptos.

Orientar los ejemplos, ejercicios y prcticas hacia los temas y problemas propios
de la disciplina que estudie cada participante.

Resolver inquietudes y dudas.

Coordinar el contacto y trabajo con otros estudiantes.

Estimulacin del debate en grupos.

Estimular el aprendizaje en la prctica.

Auto-regular el proceso de aprendizaje.

Segn lo previsto en el diseo y organizacin de la serie, la asesora de tutores,


profesores o expertos investigadores no solo es conveniente sino necesaria en las
siguientes actividades:

La realizacin de experimentos y trabajo en laboratorios.

El diseo y la ejecucin del proyecto de investigacin.

Sin embargo, es importante enfatizar que el participante es el directo responsable


de su aprendizaje. Tanto los materiales escritos y los audiovisuales que conforman los
diferentes mdulos del programa, as como los tutores, profesores o investigadoresasesores son solamente medios que le apoyen en su decisin de aprender.

24

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS DE LA INFORMACIN

25

Mdulo 4

Anlisis
de la informacin
El anlisis de la informacin en el proceso investigativo, depende del
enfoque y del tipo de investigacin que se haya seleccionado, como tambin de los objetivos que se hayan planteado.
La estadstica se constituye en una herramienta fundamental para el
anlisis de la informacin. Sin embargo es necesario precisar y seleccionar el tratamiento estadstico dependiendo del enfoque cuantitativo o cualitativo, de la escala de medicin de las variables, de las hiptesis y de los
objetivos.
La estadstica es fundamental para resolver problemas de descripcin
de datos, anlisis de muestras, contrastacin de hiptesis, medicin de
relaciones y predicciones.

1. NATURALEZA DE LA ESTADSTICA
La estadstica es una rama de la ciencia, encargada del diseo y aplicacin de mtodos para recolectar, organizar, analizar y hacer deducciones a partir de ellos.
Aunque los orgenes de la estadstica se remontan a los estudios de
los juegos de azar del siglo XVIII, slo en los ltimos 60 aos se han desa-

26

SERIE: APRENDER A INVESTIGAR

rrollado las aplicaciones de los mtodos estadsticos en casi todos los


campos de la ciencia (social, comportamental y fsica). La mayor parte de
las primeras aplicaciones de la estadstica consistieron principalmente en
la presentacin de datos en forma de tablas y grficas. Este campo se
desarroll con rapidez llegando a incluir gran variedad de mtodos para
ordenar, resumir y expresar en alguna forma las caractersticas de un conjunto de nmeros. Hoy estas tcnicas cubren lo que es sin duda la ms
visible aplicacin de la estadstica: la masa de informacin cuantitativa
que se recopila y se publica todos los das en nuestra sociedad. Las tasas
de natalidad, de mortalidad, los ndices de precios, los promedios de goles obtenidos en las fechas semanales de ftbol, son algunas de las muchas estadsticas que nos resultan familiares.
Adems de expresar las caractersticas de la informacin cuantificaba, estas medidas proporcionan una base importante para el anlisis en
casi todas las disciplinas acadmicas, especialmente en las ciencias sociales y del comportamiento, donde la conducta humana no puede generalmente ser descrita con la precisin que se consigue en las ciencias
exactas. Las medidas estadsticas de satisfaccin, inteligencia, aptitud
para el trabajo y capacidad de liderazgo, que sirven para ampliar nuestro
conocimiento de las motivaciones y del rendimiento humano, son ejemplos de lo dicho. Del mismo modo, los ndices de precios, productividad,
producto nacional bruto, empleo, reservas disponibles y exportaciones son
elementos tiles tanto para el gerente como para el gobernante cuando se
trata de trazar una poltica encaminada a lograr el desarrollo y la estabilidad econmica a largo plazo.
La estadstica proporciona una metodologa para evaluar y juzgar las
discrepancias entre la realidad y la teora. Adems de su papel instrumental, el estudio de la estadstica es importante para entender las posibilidades y limitaciones de la investigacin experimental, para diferenciar las
conclusiones que pueden obtenerse de los datos de aquellas que carecen
de base emprica y en definitiva para desarrollar un pensamiento crtico y
antidogmtico ante la realidad.
En la actualidad con la ayuda de la informtica y la tecnologa el tratamiento estadstico de la informacin se hace ms sencillo.
Para el anlisis de datos cuantitativos, tenemos en la actualidad programas como el SAS, SPSS, MINITAB, SVSTAT, RESAMPLING, STATGRAPHIS. Para el anlisis de datos cualitativos existen programas como el
QUALPRO, ETHNOGRAPH, NUDIST, AQUAD.

27

MDULO 4: ANLISIS DE LA INFORMACIN

2. DIVISIN DE LA ESTADSTICA
La estadstica se divide en dos grandes ramas, dependiendo del mtodo empleado para manejar la informacin y hacer que tenga sentido: estadstica descriptiva y estadstica inferencial.

Poblacin
Muestra
Estadstica
descriptiva

Estadstica inferencial

Grfica 1.

2.1 Estadstica descriptiva. Permite describir resumir y analizar la


informacin obtenida de la muestra.
Para tal fin se recolecta la informacin, se tabula, se grafica y en muchos casos en vez de trabajar con todas las observaciones, es preferible
tener unas medidas que resuman los datos.
Bsicamente hay tres tipos de medidas de resumen: medidas de tendencia central, medidas de dispersin o variabilidad de los datos y medidas de ubicacin.
La grfica 1 se interpreta as: con los datos de la muestra se aplica la
estadstica descriptiva; con los resultados de la estadstica descriptiva se
hacen anlisis de estadstica inferencial referidos a la poblacin.

28

SERIE: APRENDER A INVESTIGAR

MAPA CONCEPTUAL DE ESTADSTICA DESCRIPTIVA

TABLAS DE FRECUENCIAS
TABULACIN
TABLAS DE CONTINGENCIA

GRFICAS O
DIAGRAMAS

PUNTOS
LNEAS
BARRAS
CRCULO
CAJA

MEDIDAS DE
TENDENCIA
CENTRAL

MEDIDAS
DE
RESUMEN

MEDIDAS DE
DISPERSIN

MEDIDAS DE
UBICACIN

HISTOGRAMAS

MEDIA
MEDIANA
MODA
MEDIA GEOMTRICA

RANGO
DESVIACIN ESTNDAR
VARIANZA
NDICE DE DISPERSIN
CATEGRICO
CUARTILES
QUINTILES
DECILES
PERCENTILES

29

MDULO 4: ANLISIS DE LA INFORMACIN

2.1.1 Descripcin de datos, tcnicas de representacin grfica


El concepto de la descripcin est asociada a la distribucin de frecuencias, que consiste en el ordenamiento o clasificacin de los valores
observados en una variable, de acuerdo con su magnitud numrica. Permite al investigador identificar la forma como ciertos puntos o caractersticas estn distribuidos.
La distribucin de frecuencia se puede construir a partir de variables
medidas a cualquier nivel, desde nominal hasta de razn.
Podramos suponer que queremos ver cuntos productores agrcolas
en una vereda son grandes, medianos o pequeos productores.
Entrevistamos a los productores de la vereda y les preguntamos la
extensin de su explotacin y la clasificamos de acuerdo con el tamao
(magnitud) en una de las tres categoras.
Se construye la distribucin de frecuencias que muestre cuntos productores son grandes, cuntos medianos y cuntos pequeos. El recuento ser:
Tabla 1 - Tipo de productor agrcola

Tipo de productor

Frecuencia

Pequeo
Mediano
Grande

7
12
9

Total

28

En el cuadro slo se ha agrupado el nmero de agricultores pertenecientes a cada categora. El nmero de agricultores se denomina observaciones o frecuencia (f).
Para el caso de variables medidas a nivel intervalo o de razn, podemos hacer exactamente el mismo ejercicio.
Si se tiene, por ejemplo, la informacin acerca del nmero de cajas de
madera que construyen al da unos carpinteros en un taller, podramos
clasificarlos por su productividad.

30

SERIE: APRENDER A INVESTIGAR

Tabla 2 - Nmero de cajas construidas por 15 carpinteros

Carpinteros

N de cajas
construidas

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

11
10
8
12
12
10
7
8
10
11
10
9
9
10
11

A partir de esta informacin podemos aclarar an ms la naturaleza de


la produccin por carpintero y se podra entrar a comparar esta productividad con la de otro tipo de taller o fbrica.
En la tabla 3 introducimos un mayor significado y ordenamiento a la
informacin que se est analizando.
Tabla 3 - Nmero de cajas construidas por 15 carpinteros

N de cajas
construidas

N de carpinteros
que construyen X
N de cajas

II

II

11

III

12

II

10

Hasta ahora los ordenamientos que se han hecho son bastante simples,
pero en la vida real muchas veces la informacin analizada es ms compleja
y la distribucin de frecuencias debe ser construida a partir de un mayor
nmero de puntajes.

31

MDULO 4: ANLISIS DE LA INFORMACIN

2.1.2 Distribuciones de frecuencias


La distribucin de frecuencias es un mtodo para organizar y resumir
datos. Bajo este mtodo los datos que componen una serie, se clasifican
y ordenan, indicndose el nmero de veces en que se repite cada valor.
Los caracteres de los elementos de una poblacin pueden ser: cualitativos y cuantitativos.
Los datos cualitativos, denominados tambin atributos, son todos aquellos fenmenos que pueden ser descritos cualitativamente, es decir mediante palabras; son ejemplos de atributos: la clasificacin de los alumnos de una universidad por departamento de origen, clasificacin de un
grupo de personas por ocupacin, por sexo, por cargo, etc.
Los caracteres cuantitativos, denominados variables, son todos aquellos fenmenos susceptibles de ser expresados cuantitativamente, es decir
mediante nmeros. Por ejemplo: peso, estatura, edad, nmero de hijos,
salarios, etc.
Las variables se dividen en: discretas y continuas, teniendo en cuenta
que sta clasificacin tiene ms valor terico que prctico.
Las variables discretas son aquellas que admiten solamente valores
enteros, es decir no tienen valores intermedios; por ejemplo el nmero de
hijos por familia, ya que no se puede decir que una familia tiene dos hijos
y medio.
Las variables continuas, son aquellas que admiten valores fraccionarlos, pudindose establecer intervalos. Por ejemplo, la estatura de una persona que mide un metro con setenta centmetros, que pesa sesenta kilos,
una libra y cuatro onzas, etc.
2.1.3 Elaboracin de una tabla de frecuencias
Tomemos como ejemplo una muestra de 20 alumnos, determinando
su peso en kilos; para facilitar el trabajo redondeamos las cifras.
X1 = 74
X2 = 67
X3 = 94
X4 = 70

X5 = 69
X6 = 61
X7 = 71
X8 = 79

X9 = 47
X10 = 85
X11 = 82
X12 = 55

X13 = 65
X14 = 88
X15 = 52
X16 = 58

X17 = 76
X18 = 57
X19 = 72
X20 = 66

32

SERIE: APRENDER A INVESTIGAR

El primer paso a seguir consiste en determinar el valor mximo y el


mnimo.
En el ejemplo tenemos:
Xmximo = 94; Xmnimo = 47
La diferencia entre el valor mximo y el mnimo se denomina recorrido
o rango.
94 - 47 = 47
El rango, ser entonces de 47.
Introducimos dos nuevos smbolos que son:
m = nmero de intervalos (o clase de la distribucin)
c = amplitud de intervalo (o de clase de la distribucin)
El valor de m, o sea, el nmero de intervalos se puede obtener mediante la siguiente frmula:
m = 1 + 3.3 log n , donde n es el nmero de datos
Es de anotar que la anterior frmula es poco conocida, por consiguiente, es poco usual. Sin embargo, se recomienda que el nmero de intervalos, hasta donde sea posible, no sea menor de 5 ni mayor de 16.
Para el clculo de amplitud del intervalo se puede aplicar la siguiente
frmula:

C=

Xmax. - Xmin.

o sea

rango
C=
m

En el caso de nuestro ejemplo, el nmero de intervalos ser:


m = 1 + 3.3 log2O de donde m = 1 + 3.3,x 1,30
m = 1 + 4,29
m = 5.29 5 intervalos.

33

MDULO 4: ANLISIS DE LA INFORMACIN

La amplitud del intervalo de clase ser:


Rango R =47
Nmero de intervalos m = 5
R
m

C=

de donde

C=

47
= 9.4
5

Redondeando y para mejor manejo de los datos, se puede considerar


que la amplitud del intervalo sea de 9.
La tabla de frecuencias nos quedar en la siguiente forma,
Tabla 4 - Distribucin de frecuencias del peso de 20 alumnos
Peso

Frecuencias (f)

Frecuencia Relativa Fr

46 - 55
56 - 65
66 - 75
76 - 85
86 - 95
Total

3
4
7
4
2
20

3/20 = 0.15 = 15%


4/20 = 0.20 = 20%
7/20 = 0.35 = 35%
4/20 = 0.20 = 20%
2/20 = 0.10 = 10%
20/20 = 1 = 100%

Frecuencia relativa (Fr)


Es su frecuencia dividida por el total de datos y se expresa generalmente como un porcentaje:
Fr =

f
__
n

2.1.4 Presentacin grfica


Aunque las tablas sean ya el resultado de una concentracin de datos,
pueden ser, sin embargo, demasiado amplias y complejas, de modo que
pierden una buena parte de lo que debera ser su cualidad primordial, la
claridad.
Entonces, podemos recurrir a la presentacin grfica, para la mejor
comprensin y anlisis de los datos. En las variables discretas se hace la
representacin mediante diagramas de frecuencias; para ello, en el eje hori-

34

SERIE: APRENDER A INVESTIGAR

zontal, se colocan los distintos valores de las frecuencias absolutas o relativas. Si la representacin se refiere a las frecuencias absolutas o relativas
acumuladas se denomina: Diagrama de frecuencias acumuladas, colocndose los valores de la variable en el eje horizontal y las frecuencias Fr, en el
vertical.

2.1.4.1 Histogramas y polgonos de frecuencias


Una distribucin de frecuencias, se puede describir por medio de histogramas de frecuencias, que son grficos que representan la informacin
contenida en una distribucin de frecuencias.
El ejemplo de la tabla 4, sobre el peso de los alumnos, se puede presentar en un histograma que representa exactamente lo mismo.

Grfica 1.
Peso en kilos de 20 alumnos de un colegio

Otra manera de describir la distribucin de la informacin obtenida, es


por medio del polgono de frecuencias.
Estos son grficos en la forma de una serie de lneas rectas conectadas entre s y que unen puntos medios de intervalos a lo largo del eje
horizontal.
El caso del peso de los alumnos, puede servirnos para ilustrar la tcnica
de los polgonos de frecuencia. Para construirlo se siguen los mismos pasos que para construir un histograma, pero en lugar de construir los rectngulos a partir de los lmites superior e inferior de los intervalos, se calcula el
punto medio del mismo y se unen, por medio de una lnea recta que se
conecta a los puntos medios de los dems intervalos.

35

MDULO 4: ANLISIS DE LA INFORMACIN

As por ejemplo en el grfico 1 podemos trazar el polgono de frecuencias, uniendo los puntos medios del histograma de frecuencias.

2.1.4.2 Grficas de barras


La grfica de barras es fcil de construir y su interpretacin es de
gran utilidad. Una grfica diseada para mostrar magnitudes absolutas deber tener su inicio en cero y una escala de cantidades continuas. Las grficas de barras pueden construirse en forma vertical u
horizontal.
Las grficas de barras pueden dividirse en tres tipos:
a. Grficas de barras con partes componentes. En esta grfica cada barra ha sido segmentada en dos partes componentes; as, por ejemplo,
en la siguiente grfica se tiene que la poblacin de estudiantes de 100
semestre de la facultad X, de la Universidad Y, se distribuye segn el
sexo y la edad as:

Distribucin de los estudiantes de dcimo semestre de la Facultad X,


de la Universidad Y, por sexo y edad

Edad

1 5 -1 9
2 0 -2 4
h o m b re s

2 5 -2 9

m u je re s

3 0 -3 4

10

20

30

40

N m e ro d e E s tu d ia n te s

En la grfica se muestra el nmero de estudiantes clasificados por


sexo y edades, en cada barra se presentan los dos componentes, los
hombres y las mujeres.

b. Grficas de barras agrupadas. En esta grfica, se presentan los mismos datos de estudiantes, excepto que los componentes por sexo se
muestran separadamente as:

36

SERIE: APRENDER A INVESTIGAR

Distribucin de los estudiantes de dcimo semestre de la Facultad X,


de la Universidad Y, segn el sexo y la edad

1 5 -1 9

Edad

2 0 -2 4
m u je r e s
h o m b re s
2 5 -2 9

3 0 -3 4

10

15

20

25

30

N m e r o d e E s tu d ia n te s

c. Grficas de barras bidireccionales. Cuando se desea graficar cantidades positivas y negativas, tales como prdidas y ganancias en la produccin de una empresa, por tipo de producto. As, en la grfica de
produccin de la empresa X, se tiene que las prdidas y ganancias por
tipo de producto son:

Utilidad o prdida en la produccin de la Empresa X


Estufas
Calentadores de agua
Secadores

utilidad o
prdida

Enfriadores
Planchas

-40

-20

20

40

60

Produccin

2.1.4.3 Grficas lineales


Cuando debe presentarse una serie que cubre un gran nmero de perodos de tiempo, los datos graficados por medio de barras se ven demasiado acumulados; entonces, stas pueden ser reemplazadas por una
lnea, ya que las lneas son ms efectivas que las barras, cuando existen
marcadas fluctuaciones en las series, o cuando deben presentarse varias
series sobre la misma grfica. Por ejemplo, el nmero de estudiantes de
la facultad X, matriculados por sexo, en el perodo 1990-1998.

37

MDULO 4: ANLISIS DE LA INFORMACIN

Nmero de Estudiante

Nmero de estudiantes de la Facultad X, matriculados por sexo,


en el perodo 1990-1998
600
500
400
300
200
100
0

Hom bres
M ujeres
Total
90

91

92

93

94

95

96

97

98

Aos

2.1.4.4 Grficas circulares


Las grficas circulares, llamadas tambin de tipo pastel, se usan para
mostrar los tamaos relativos de los componentes de un total. Son utilizados, para indicar cosas tales como participacin de cada facultad en el
total de estudiantes matriculados de determinada universidad, en perodos diferentes.
El proceso para realizar el diagrama consiste en una regla de tres.
Para conocer el ngulo de cada sector se debe relacionar los 3600
que tiene una circunferencia con el tamao de la muestra y con cada una
de sus frecuencias absolutas, as:
360
X

n
F1

Por ejemplo, si la siguiente tabla representa el nmero de docentes de


una universidad, clasificados por modalidad educativa.
Modalidad
Tcnica
Tecnologa
Universitaria
Post-grado

5
25
80
15
N = 125

El diagrama circular se construir as:


360
X

125
5

Donde 125 es el tamao de la muestra y


5 la frecuencia en la primera modalidad.

38

SERIE: APRENDER A INVESTIGAR

X = 360 x 5
125

Luego

En el siguiente ejemplo, se muestra la distribucin porcentual del nmero de estudiantes matriculados en 5 facultades de una universidad X,
en los aos de 1990 y 1998.

c
13%

d
27%

e
23%

a
15%
b
18%

b
14%

a
31%

e
15%

d
36%

c
8%

DESCRIPCIN DE DATOS, TCNICA DE REPRESENTACIN


GRFICA - AUTOEVALUACIN N 1
Lea cuidadosamente cada uno de los siguientes enunciados y seale la respuesta correcta.
1. El
a)
b)
c)
d)

propsito principal de la estadstica descriptiva es:


Representar los datos por medio de histogramas.
Obtener la informacin necesaria para la investigacin.
Medir en escalas nominales, ordinales e intervalos.
Conocer las caractersticas generales de una distribucin de
frecuencias.
e) Todas las anteriores.

2. Una distribucin de frecuencias slo se puede construir a partir de


variables medidas en escalas intervalos.
S _______ No _______

39

MDULO 4: ANLISIS DE LA INFORMACIN

Por qu? _______________________________________________


_________________________________________________________
3. Si clasificamos 220 municipios en grandes, medianos y pequeos, de acuerdo con el nmero de habitantes, de forma tal que
tenemos 49 grandes, 63 medianos y 108 pequeos, cmo los
representara en un histograma de frecuencias como en un diagrama circular?
4. Para construir un histograma de frecuencias, primero es necesario construir un polgono de frecuencias.
S _______ No _______
5. En un examen general de matemticas los 30 alumnos de un curso obtuvieron las siguientes calificaciones:
Calificacin

N de alumnos

78
77
76
75
74
73
72
71
70
69
68
67
66
65
64
63
62
61

1
1
0
2
1
0
2
2
4
5
3
0
3
2
0
1
2
1

Represente la misma informacin en una distribucin de frecuencias,


basada en intervalos. Determine el rango, el nmero de intervalos y
la amplitud de los intervalos. Represente los resultados por medio de
un histograma y un polgono de frecuencias.

1. d
2. No
3. Grfico
4. No
5. Rango = 17; nmero de intervalos = 6; amplitud de intervalo = 3
Calificaciones

Frecuencia
Relativa %

61-63
64-66
67-69
70-72
73-75
76-78

4
5
8
8
3
30

13.3
16.7
26.7
26.7
10.0
100.0

Graficar
RESPUESTAS A LA AUTOEVALUACIN N 1
40

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS DE LA INFORMACIN

41

3. DESCRIPCIN DE DATOS - TCNICAS NUMRICAS


La segunda tcnica utilizada en la estadstica descriptiva se basa en
dos tipos de clculos numricos: Los de tendencia central y los de dispersin.
Las medidas de tendencia central se basan en que, en cualquier distribucin de frecuencias, los valores tienden a concentrarse al rededor de
un valor central de la distribucin.
Las de dispersin, por el contrario, se basan precisamente en la manera en que los valores se distribuyen alrededor de esos valores centrales.
Para entender la naturaleza de la distribucin, tenemos que tratar de
describir el centro de la distribucin de las mediciones y la forma como
stas varan alrededor de ese centro.
Podemos utilizar estas tcnicas descriptivas, tanto para estudiar los
parmetros de la poblacin como las estadsticas de las muestras y en
este ltimo caso, a partir de ellas podemos estimar los correspondientes
parmetros de la poblacin.
3.1 Medidas de tendencia central
A continuacin describimos las tcnicas de tendencia central: moda,
mediana y media aritmtica.
3.1.1 La moda
La moda de una distribucin se define como el valor que presenta la
mayor frecuencia. Se usa con mediciones de escala nominal, ordinal, de
intervalo o de razn.
Es comnmente utilizada como una medida de popularidad, que refleja la tendencia de una opinin. En algunas distribuciones slo hay una
moda, pero en otras puede haber dos o ms modas. Si tomamos 1, 4, 4,
4, 2, 5, 5, 8, 3, 6, 5, vemos que tanto el cuatro como el cinco aparecen con
ms frecuencia y en tres ocasiones. Es decir, hay dos modas y la distribucin es bimodal.
Cuando se trabaja con datos agrupados, la moda se refiere como el
valor medio del intervalo que constituye la mayor frecuencia.

42

SERIE: APRENDER A INVESTIGAR

Tabla 5. Puntajes obtenidos por 50 alumnos de un curso de fsica


Puntajes

Frecuencias

30 - 32
33 - 35
36 - 38
39 - 41
42 - 44
45 - 47
48 - 50
51 - 53
54 - 56
57 - 59

4
4
5
7
12
7
4
3
2
2

Total

50

En la tabla 5, presentamos la distribucin obtenida al estudiar los puntajes


obtenidos por 50 estudiantes como calificacin en un curso de fsica.
El intervalo que contiene el mayor nmero de casos, o mayor frecuencia es 42 - 44. Este intervalo contiene los puntajes 42, 43 y 44. El valor
medio del intervalo es, por lo tanto, 43 y lo denominamos como la moda.
3.1.2 La mediana
La mediana se define como la medida de tendencia central que divide
a cualquier distribucin en dos partes iguales.
En la siguiente distribucin:
7, 8, 8, 9, 12, 15, 18, 18, 20, 21, 23.
La mediana es 15, porque se sita en el punto que divide la distribucin
en dos partes iguales. Hay el mismo nmero de casos antes y despus
del 15.
La mediana se usa en variables medidas en escala ordinal, intervalo o
de razn. Su mayor uso es cuando se tienen muchas observaciones y
generalmente se utiliza en distribuciones de ingresos, edades, pesos.
Cuando hay una distribucin con un nmero par de casos, la mediana
es el promedio de los dos valores medios. As, en la siguiente distribucin
de notas:
78,95,86,73,52,90,89,84,76,92

43

MDULO 4: ANLISIS DE LA INFORMACIN

El valor de la mediana es 85, porque, primero al ordenar la distribucin


de menor a mayor as:
52,73,76,78,84,86,89,90,92,95
Siendo 10 el total de notas, las que aparecen en la posicin quinta y
sexta estn en la mitad de la distribucin, entonces la mediana ser:
84 + 86 = 85
2
Cuando se tiene informacin agrupada, la mediana se define como el
valor dentro del intervalo que divide la distribucin en dos partes iguales.
El smbolo utilizado es Me.
En la tabla 6, tenemos una distribucin cualquiera con 5 intervalos de
tamao 5 y con 30 observaciones.
Tabla 6. Distribucin de frecuencias de los pesos de 30 estudiantes

Intervalos

Frecuencias
acumuladas

30 - 34
35 - 39
40 - 44
45 - 49
50 - 54

4
7
8
6
5

4
11
19
25
30

Total

30

Los pasos a seguir para el clculo de la mediana son:

Encuentro las frecuencias absolutas acumuladas.


Con base en las frecuencias acumuladas ubico el intervalo donde quede la frecuencias correspondiente a la mitad del tamao de la muestra, es decir: n
2

Encuentro el valor del lmite real inferior del intervalo donde est n
2

Aplico la siguiente frmula:

44

SERIE: APRENDER A INVESTIGAR

n _ Fa
2
Mediana = Li +

C
Fn
2

donde Li

= Lmite real inferior donde est ubicada

n
2

Fa = Suma de las frecuencias anteriores a donde est


ubicado
C

2
= Amplitud del intervalo.

En el ejemplo
est dada por:
n
2

anterior de los pesos de 30 estudiantes la mediana

30
= 15
2

Li = 39.5

Corresponde al lmite inferior donde est 15 como


frecuencia acumulada.

Fn
= 8
2

Corresponde a la frecuencia del intervalo donde est

Fa = 11

Corresponde a la suma de las frecuencias antes de

C=5

Es la amplitud del intervalo.

n
2
n
2

Luego:
Mediana = 39.5 +

(15 - 11)
x 5
8

Mediana = 42
3.1.3 La media aritmtica
Es la medida de tendencia central ms conocida, es fcil de calcular, de
gran estabilidad en el muestreo, sus frmulas permiten tratamiento algebraico.

45

MDULO 4: ANLISIS DE LA INFORMACIN

Adems, presenta el inconveniente de ser muy sensible a los valores


extremos, cuando stos son demasiado bajos o demasiado altos. Se representa as: X
La media aritmtica se define como la suma de todos los valores observados dividido por el nmero de observaciones (n).
La frmula para datos no agrupados es: X =

xi
n

Donde -Xi corresponde a la sumatoria de todos los valores de la


muestra.
La media aritmtica de la siguiente distribucin es:
1.1, 2, 1, 2.4, 3, 2, 4.5
X =

1.1 + 2 + 1 + 2.4 + 3 + 2 + 4.5


16.1
=
= 2.28
7
7

Para las distribuciones con datos agregados, existe una frmula, aunque un poco ms complicada, es bastante fcil de aplicar.
media =

fx
n

donde f corresponde a las frecuencias, y X al valor de cada marca de


clase.
Tabla 7. De valores de los pesos de los 30 estudiantes

Intervalos

x
Marca de clase

f
Frecuencias

fx

30-34
35-39
40-44
45-49
50-54

32
37
42
47
52

4
7
8
6
5

128
259
336
282
260

Total

30

1265

La marca de clase es el punto medio de cada intervalo. Para tal fin se


suman los dos valores extremos y se divide entre dos. Por ejemplo, la
marea de clase para el primer intervalo es:

46

SERIE: APRENDER A INVESTIGAR

X =

30 + 34
64
=
= 32
2
2

Por consiguiente al aplicar la frmula la media aritmtica es:


media = 1.265 = 42.17
30
La media aritmtica tiene sus ventajas, sobre las otras medidas de
tendencia central, en que:

Cada caso se incluye en el clculo.


Es rgidamente calculada, es decir, slo hay una para conjunto de datos.
Es importante para hacer inferencias, es decir sirve tambin para calcular parmetros de la poblacin.

La media aritmtica slo se puede calcular a valores numricos, es


decir que estn en escala de intervalos o de razn.
3.2 Medidas de dispersin
Son aquellas que nos determinan cmo se agrupan o se dispersan los
datos alrededor de un promedio.
En este captulo se estudiarn las medidas que se utilizan para determinar cun bien representan los promedios a la distribucin considerada.
En el siguiente ejemplo se presentan las notas obtenidas por dos grupos de estudiantes:
Grupo A

Grupo B

80
80
75
83
82
81
82
75
79
7

97
95
70
72
73
96
80
72
71
71

795

797

MDULO 4: ANLISIS DE LA INFORMACIN

47

XA = 79.5
XB = 79.7
La media aritmtica de ambas series es prcticamente igual (79.5 en
el grupo A y 79.7 en el grupo B). Un anlisis de las cifras individuales
revelan un gran contraste. En el grupo A hubo muy poca variacin entre
las notas, siendo la ms alta 83 y la ms baja 75. En el grupo B, se nota
mayor variacin, en este grupo la mayor nota fue 97 y la menor 71. Como
conclusin se podra decir que en el grupo B hubo notas muy altas y muy
bajas. En el grupo A las notas tuvieron una mayor concentracin alrededor del promedio.
Para establecer esta caracterstica se utilizan las medidas de variacin o dispersin, entre las cuales las ms utilizadas son el rango, la
varianza y la desviacin estndar.
3.2.1 El rango
La medida ms simple de dispersin es el rango. Este identifica la
distancia entre el valor mayor y el valor menor de la distribucin. Ms
especficamente, se define como la diferencia entre el mayor valor y el
menor valor. Se simboliza por r.
Ejemplo, el rango de la siguiente distribucin es:
25, 36, 64, 20, 48, 59.
r = 64 - 20 = 44
El rango es sencillo de calcular pero tiene la desventaja de que es
sensible a los valores extremos.
3.2.2 Percentiles
Los percentiles son usados para calcular una segunda medida de dispersin. El P-simo percentil de un conjunto de mediciones ordenadas
segn su magnitud, es el valor que tiene P% de las mediciones por debajo
de l y (100 P%) por encima.
Se utilizan muy frecuentemente para describir los resultados de pruebas
de conocimiento, como los del Sistema Nacional de Pruebas y en la clasificacin de personas en forma comparativa. Entre los percentiles de ms
inters estn el 25, el 50 y el 75, frecuentemente denominados como el
menor cuartil Q1, el cuartil mediano (mediana) Q2 y el cuartil superior, Q3.

48

SERIE: APRENDER A INVESTIGAR

3.2.3 Varianza
De todas las medidas de dispersin, la ms importante, ms conocida
y usada es la varianza. Se define como la media aritmtica de los cuadrados de las desviaciones, respecto a su media. Se simboliza por S 2.
Su frmula es:
S2 =

(x - media)

S2 =

f (X - media)

para datos no agrupados

datos agrupados

Ejemplo con datos no agrupados


Xi = 5; X 2 = 3; X3 = 1; X4 = 6; X5 = 10
X =

5 + 3 + 1 + 6 + 10
25
=
= 5
5
5

S2 =

(5-5)2 + (3-5)2 + (1-5)2 + (6-5)2 + (10-5)2


5

S2 =

0 + 4 + 16 + 1 + 25
46
=
= 9.2
5
5

Lo cual indica que la varianza de los datos es de 9.2


Ejemplo para datos agrupados
Supongamos la siguiente tabla de pesos en kilogramos:

49

MDULO 4: ANLISIS DE LA INFORMACIN

Tabla 8 - Pesos de 100 estudiantes de un colegio

Pesos

Marca de
clase X

X-X

(X - X)2

Frecuencias f

f (X - X)2

60-62
63-65
66-68
69-71
72-74

61
64
67
70
73

-6.45
-3.45
-0.45
2.55
5.55

41.60
11.90
0.20
6.50
30.80

5
18
42
27
8

208.0
214.2
8.4
175.5
246.4

100 = n

852.51

Total

X = 67.45

f (x - x)

S2 =

S2 =

852.5

donde

X es la marca de clase
X la media aritmtica
f la frecuencia de cada intervalo

= 8.52

100

Propiedades de la varianza
a. La varianza siempre debe ser un valor positivo S 2> 0
b. La varianza de una constante es 0, es decir: si Xi = C para todo i,
entonces S 2 = 0
c. La varianza de una constante ms una variable, es igual a la varianza
de la variable.
S2

(k + X)

: = S 2k + S 2x = 0 + S 2x = S 2x

Tambin es vlida para la diferencia


S2

(k + X)

: = S2k + S 2x = 0 - S 2x = S 2x

d. La varianza de una constante por una variable, es igual al producto de


la constante al cuadrado por la varianza de la variable:
S 2 (kX): = k2 S 2X

50

SERIE: APRENDER A INVESTIGAR

3.2.4 Desviacin estndar


La desviacin tpica estndar es la raz cuadrada de la varianza, considerada siempre con signo positivo.
S=

S2

Para el caso del peso de los 100 estudiantes del colegio la desviacin
estndar es:
S=

8.52 = 2.92

La varianza se expresa siempre en unidades diferentes a las originales,


es decir, si la variable se refiere a peso en Kg, al calcular la varianza estar
dado el peso en Kg al cuadrado. Es una de las razones por la cual se utiliza
la desviacin estndar, pues se expresa en las mismas unidades de la variable.
3.2.5 Coeficiente de variacin
Esta medida relaciona la desviacin estndar y la media, para expresar la variacin de la desviacin con respecto a la media aritmtica. Se
acostumbra expresarlo en porcentaje.
La frmula que se utiliza es:
Cv =

S
X

100

El coeficiente de variacin sirve para determinar el grado de homogeneidad de la informacin. Si el valor del coeficiente de variacin es pequeo
indica que la informacin tiene un alto grado de homogeneidad y si el coeficiente de variacin es grande es porque la informacin es heterognea.
Ejemplo: al hallar el coeficiente de variacin de 6, 3, 4, 7, 8
X =

28
= 5.6
5

S = 1.85

Cv =

1.85
= 0.3304 = 33.04%
5.6

Lo cual indica que la informacin es homognea, pues el coeficiente


de variacin es de 33.04%.

51

MDULO 4: ANLISIS DE LA INFORMACIN

3.3 Asimetra
Una distribucin es simtrica si se tiene que: la media es igual diana e
igual al modo (X = Md = Mo); pero si la distribucin se vuelve asimtrica
las tres medidas se separan y entonces el valor promedio ar ser mayor
que la mediana, que a su vez ser mayor que el modo, deducindose que
la distribucin es asimtrica positiva. Si la media aritmtica es menor que
la mediana y sta menor que el modo, se dice que la distribucin es
asimtrica negativa. En la distribucin asimtrica positiva, la curva presenta un alargamiento a la derecha; en la negativa el alargamiento presenta hacia la izquierda. Vase grficas 4.

Grfica 4. Asimetra

Las frmulas para calcular la asimetra y su grado son:


As =

As =

Media aritmtica - Modo


Desviacin estndar

X - Mo

3(Media aritmtica - Mediana)


Desviacin estndar

s
=

3(X - Md)
s

3.4 Kurtosis
Una caracterstica importante de la variacin de algunas distribuciones es su grado de agudeza en la cima de la curva que las representa
agudeza que se observa en la regin del modo, comparada con las condiciones halladas para el mismo sitio en la curva normal, es lo que
Kurtosis.

52

SERIE: APRENDER A INVESTIGAR

Si la curva es ms plana que la normal, la distribucin se llama achatada


o platicrtica; si es ms aguda, lleva el nombre de apuntada o leptocrtica,
y si la curva es normal, se denomina mesocrtica.
La Kurtosis es una medida de altura de la curva, por lo tanto est representada por el cuarto momento de la media. En la misma forma que
para la asimetra, su clculo se efecta en funcin de la desviacin estndar
y de los momentos unidimensionales de orden cuatro con respecto a la
media aritmtica.
Su frmula es:

a4 =

m4
s4

m4

m 22

Otra formula para medir la Kurtosis es la que se basa en los cuartiles


y percentiles.

K =

Q
P90 - P10

En donde Q = 1/2 (Q3-Q1). Si el valor encontrado de la Kurtosis es


igual a 0.263 se dice que la curva es mesocrtica o normal; si es mayor, la
curva es leptocrtica y si es menor, la curva es platicrtica.
Por ejemplo, calcular el coeficiente de Kurtosis, si el valor del primer
cuartil es Q1 = 68.25; Q3 = 90.75; P10 D1 =58.12 y P90 = D9 = 101.00
Aplicando la frmula se tiene:

K =

Q
P90 - P10

Se tiene Q =

K =

en donde Q =
1
2

1
2

(Q3-Q1) reemplazando

(90.75 - 68.25) =

11.25
101.00 - 58.12

11.25
42.88

(22.5) = 11.25

= 0.262

Se puede decir que la curva es normal o mesocrtica.

53

MDULO 4: ANLISIS DE LA INFORMACIN

3.5 Tablas de contingencia


En muchas ocasiones, la informacin puede organizarse y presentarse de acuerdo con la relacin entre dos o ms variables.
Es cuando se habla de tablas de doble entrada o mltiples entradas o
comparacin de colectivos. Las variables pueden ser categricas o numricas.
Esta forma de representacin presenta grandes ventajas, entre otras
resume informacin y posibilita el anlisis de dependencia, asociacin,
correlacin y homogeneidad.
Supongamos que a partir de datos disponibles en nuestro estudio se
ha elaborado el siguiente cuadro:

Tabla 9. Distribucin de alumnos por jornadas y clase de colegio

CLASIFICACIN DE
LA JORNADA

nica
Maana
Tarde
Total

NMERO DE ALUMNOS
COLEGIOS
OFICIALES

COLEGIOS
PRIVADOS

TOTAL

230
583
418

840
614
234

1070
1197
652

1231

1688

2919

Si comparamos los datos en direccin horizontal constatamos que el


mayor nmero de estudiantes corresponde a la jornada de la maana,
mientras que si leemos los datos en direccin vertical el mayor nmero de
estudiantes corresponde los colegios privados.
En ocasiones el investigador desea especificar y analizar los datos
con ms variables. Para el ejemplo anterior podra ser sexo y edad.

54

SERIE: APRENDER A INVESTIGAR

Tabla 10. Distribucin de alumnos por jornadas,


clase de colegio, sexo y edad

Clasificacin

COLEGIOS OFICIALES

COLEGIOS PRIVADOS

de la jornada

Hombres

Hombres

Mujeres

Mujeres

10-15

15-20

nica

52

80

22

76

132

180

423

105

Maana

121

47

168

247

241

132

86

155

Tarde

123

154

49

92

76

51

47

60

296

281

239

415

449

363

5561

320

Subtotal
TOTAL

10-15 15-20 10-15 15-20 10-15 15-20

1231

1688

En este ejemplo, el 52 corresponde al nmero de estudiantes hombres


entre los 10 y 15 aos, de jornada nica pertenecientes a colegios oficiales.
Las tablas de contingencia se pueden realizar con frecuencias relativas, es decir, con porcentajes.
NDICE DE DISPERSIN CATEGRICO
Para datos ordinales y nominales se utiliza el llamado NDICE DE DISPERSIN CATEGRICO, cuya frmula es:

D =

K(N2 - f2)
N2(K - 1)

Donde K
es el nmero de categoras de la variable.
f2 es la suma de las frecuencias al cuadrado
N = nmero de casos (tamao de la muestra)
Por ejemplo:
Si tenemos la siguiente clasificacin de 15 estudiantes por preferencias deportivas:

55

MDULO 4: ANLISIS DE LA INFORMACIN

DEPORTES

ALUMNOS

f2

8
2
5

64
4
25

FTBOL
VOLEIBOL
BASKET
TOTAL

15

El ndice de dispersin categrico sera:


D =

D =

3(225 - 93)
225(3 - 1)
396

= 0.88

450

Lo cual indica que los datos presentan una dispersin del 88%.

DISTRIBUCIN DE DATOS, TCNICAS NUMRICAS


AUTOEVALUACIN N 2
Lea cuidadosamente cada uno de los siguientes enunciados y seale la respuesta correcta.
1. Para entender la naturaleza de la distribucin de frecuencias, las
medidas de tendencia central son mejores que las de dispersin
S _______ No _______
2. Las medidas de tendencia central son-.
___________________________________________________
3. Cul es la mediana de la siguiente distribucin?
4, 4, 5, 3, 7, 9, 5, 1, 7, 3, 7, 7, 5

56

SERIE: APRENDER A INVESTIGAR

4. Un profesor pidi los pesos en Kg a 30 estudiantes del curso de


lgebra y obtuvo los siguientes resultados:

Edad

No. de estudiantes
f

30-34
35-39
40-44
45-49
50-54

5
6
8
7
4

Total

30

a. Cul es el peso promedio de sus alumnos? _________


b. Cul es la mediana? _________
c. Cul es la moda de las edades? _________
5. Cules son las modas de las siguientes series de nmeros?
a) 122, 103, 148, 113, 103, 118.
b) 75, 84, 37, 49, 51, 83.
c) 22, 43, 22, 38, 41, 43, 20.
6. Cul es la medida de dispersin ms sencilla?
___________________________________________________
7. El rango tiene la desventaja de ser sensible a los valores
extremos.
S _______ No _______

57

MDULO 4: ANLISIS DE LA INFORMACIN

8. La varianza siempre debe ser un valor positivo.


S _______ No _______
9. Cmo se define la Desviacin Estndar?
___________________________________________________
10. Una de las caractersticas de la Kurtosis es el grado de agudeza
de la curva, la cual se puede clasificar en tres tipos:
a. Una ms plana que la normal 0:
b. La segunda ms aguda 0:
c. Si la curva es normal 0:

__________________
__________________
__________________

RESPUESTA A LA AUTOEVALUACIN N 2

10. a. Platicrtica. b. Leptocrtica. c. Mesocrtica


9. La raz cuadrada de la varianza
8. S
7. S
6. El rango
5. a) 103

b) No hay

c) 22 y 43

4. a. X = 4.18
b. Mediana = 42
c. moda= 8
3. 5
2. Media, mediana y moda
1. No

58

SERIE: APRENDER A INVESTIGAR

Taller de estadstica N 1
Se realiz un experimento para evaluar el efecto de la edad en la frecuencia cardaca, cuando se somete una persona a un grado especfico
de ejercicios. Se seleccionaron al azar hombres de cuatro grupos de edades, 10-19, 20-39, 40-59, 60-69. Cada individuo recorri la banda sin fin a
una velocidad especfica durante 12 minutos y se registr el aumento de
la frecuencia cardaca, la diferencia antes y despus del ejercicio, (en latidos por minuto)
Qu puede usted concluir, si los siguientes datos son el resultado del
procesamiento de la informacin apoyada en el computador.

VARIABLE
Talla
Promedio
Mediana
Moda
Varianza
Desviacin estndar
Mnimo
Mximo
Rango
Quartil inferior
Quartil superior
Rango interquartil
Skewness
Kurtosis
Coeficiente de variacin
Suma

GRUPO 1

GRUPO 2

GRUPO 3

GRUPO 4

15
30.1333
30
22
24.8381
4.98378
22
39
17
26
34
8
-0.0873053
-0.612727
16.5391
452

10
27.5
27.5
24
23.8333
4.88194
21
34
13
24
32
8
-0.0716212
-1.59948
17.7525
275

12
29.5
29
33
19.1818
4.37971
22
37
1.5
26.5
33
6.5
0.0311649
-0.726827
14.8465
354

12
38.3333
37.5
36
50.6061
7.11379
28
54
26
34.5
42
7.5
0.668752
1.02909
18.5577
460

Preguntas
1.
2.
3.
4.
5.

Qu tipo de muestreo se realiz?


Qu grupo fue ms homogneo en los resultados? Por qu?
Comparando las medias aritmticas qu grupo obtuvo la menor
media?
Qu grupo presenta un mayor rango? Qu significa?
Si consideramos el grupo 4
5.1 Cul es el mnimo valor?
5.2 Cul fue el mayor aumento de frecuencia cardaca?
5.3 Qu porcentaje de la informacin est por debajo de 34.5?

MDULO 4: ANLISIS DE LA INFORMACIN

6.

59

5.4 Qu porcentaje de la informacin est por encima de 34.5?


5.5 Qu porcentaje de la informacin est entre 34.5 y 42?
Si consideramos el grupo 2
6.1 Qu porcentaje de la informacin est por encima de 32?
6.2 Qu valor corresponde al dato que ms se repite?
6.3 Qu dato est ubicado en el primer cuartil?
6.4 Qu significado tienen las dos respuestas anteriores?

Respuestas
1.
2.
3.
4.
5.

6.

Muestreo aleatorio por estratos segn edades.


El grupo No. 3 porque obtuvo el menor coeficiente de variacin.
El grupo No. 2 con un valor de 27.5.
El grupo No. 4 significa que obtuvo mayor variabilidad entre el dato
mayor y el dato menor.
5.1 28
5.2 54
5.3 El 25%
5.4 El 75%
5.5 El 50%
6.1 El 25%
6.2 24
6.3 24
6.4 Significa que por debajo del dato que ms se repite hay un 25%
de la informacin.

60

SERIE: APRENDER A INVESTIGAR

4. INTRODUCCIN A LAS PROBABILIDADES


4.1 Probabilidades elementales
Consideramos varios ejemplos: es casi seguro que hoy no llueve, con
ello expresamos algn grado de confianza de que no llueve, a pesar de la
completa seguridad.
Qu posibilidad existe de obtener una buena nota en el examen de
economa? En el de estadstica?
En el prximo examen tengo la oportunidad de obtener una nota alta.
Si un aficionado a la hpica es preguntado sobre una fija en una determinada carrera, puede darnos una insinuacin de cul caballo puede ganar. El caballo X tiene una buena oportunidad.
Nos encontramos con un conjunto cuya tcnica se refiere a resultados
que no estamos muy seguros. Asociamos cierto grado de confianza, con
relacin a que cada una de estas predicciones se realice. El cierto grado
de confianza reposa en la experiencia (pasada y presente).
Los Bayecianos definen la probabilidad de un acontecimiento, como
una medida del grado de confianza que uno tiene, en que ocurra el acontecimiento.
Otros autores consideran que la probabilidad pertenece a aquellas nociones imposibles de ser definidas adecuadamente y se les considera
basadas en la experiencia. Por lo tanto, se puede decir que la probabilidad
es una creencia basada en la experiencia.
Consideramos algunas definiciones, segn el mtodo.
a. Mtodo axiomtico. El cual concibe la probabilidad de ocurrencia
de un suceso, como un nmero comprendido entre cero y uno. Este concepto tiene que ver directamente con la nocin de frecuencia relativa,
donde: 0 < p < l.
Supongamos que se lanza 100 veces una moneda, anotamos el nmero
de veces que sale cara y las veces que sale sello; los resultados fueron los
siguientes:
Frecuencias absolutas:
Frecuencias relativas:
Posibilidad:

cara 56 veces;
56/100;
p = 56% (xito);

sello 44 veces
44/100
q = 44% (fracaso)

61

MDULO 4: ANLISIS DE LA INFORMACIN

b. Mtodo emprico o prctico. Considera la probabilidad de un suceso, como aquel nmero al cual se aproxima cada vez la frecuencia relativa de la ocurrencia de un suceso, cuando las veces que se repite el
experimento que origina ese suceso es bastante grande. Este concepto
tiene algo que ver con el experimento de Quetelet, en donde la probabilidad de un suceso tiende a estabilizarse en un punto, cuando el nmero de
experimentos se va haciendo cada vez ms grande.
c. Mtodo clsico. Considera la probabilidad como el cuociente de
dividir los casos favorables, que pueden ocurrir en un suceso, por el total
de casos posibles.
Nmero de casos favorables
p = __________________________
Nmero de casos posibles
Ejemplos:
En el lanzamiento de una moneda hay:
2 posibilidades

N Combinaciones

C
S

(C)
(S)

Probabilidades
1/2 = 0.5
1/2 = 0.5

1 = 1.0

Lanzamiento de dos monedas.


4 Posibilidades
2C
1Cy1S
2S

N Combinaciones
(C,C)
(C, S)
(S,S)

Probabilidades

1
(S, C) 2
1

1/4 = 0.25
2/4 = 0.50
1/4 = 0.25

1 = 1.00

Lanzamiento de tres monedas.


8 posibilidades
1C
2C y 1S
2S y 1C
3S

N Combinaciones
(C, C, C)
(C, C, S) (C, S, C) (S, C, C)
(S,S,C)(S,C,S)(C,S,S)
(S, S, S)

Probabilidades
1
3
3
1

1/8 = 0.125
3/8 = 0.375
3/8 = 0.375
1/8 = 0.125

1 = 1.000

62

SERIE: APRENDER A INVESTIGAR

En efecto el nmero de casos posibles en los ejemplos anteriores se


obtiene:
21 = 1
22 = 4
23 = 8

2n
2 = casos posibles en una moneda
n = nmero de lanzamientos

En un dado sera: 6n
61 = 6
62 = 36

6 = casos posibles en un dado


36 = casos posibles al lanzar dos dados

4.2 Esperanza
Si p es la posibilidad de xito en un suceso, en un solo ensayo, el
nmero de sucesos o esperanzas de ese suceso en n ensayos, estar
dado por el producto de n y la probabilidad de xito p.
E=np
Ejemplo:
En el lanzamiento 900 veces de dos dados, cul es la esperanza de
que la suma de sus caras sea un valor menor a 6?
Primero obtenemos la probabilidad de xito del suceso en un solo
ensayo.
(1,1) (1,2) (1,3) (1,4) (2,1) (2,2) (2,3) (3,1) (3,2) (4,1) = 10
Como se lanzan 900 veces, en dos dados, se tiene:

E = np = 900

10
36

900
36

= 250

La esperanza es que en 250 de los 900 lanzamientos, la suma de sus


caras sea menor de 6.
4.3 Leyes de las probabilidades
Para facilitar el clculo de las probabilidades se emplean estas leyes.
1. Si dos o ms sucesos son tales que solamente uno de ellos puede ocurrir en un solo ensayo, se dice que son mutuamente excluyentes. Se

63

MDULO 4: ANLISIS DE LA INFORMACIN

denomina probabilidad aditiva y ser igual a la suma de las probabilidades


de cada suceso.
P = P 1 + P2 + P3........... + Pn
Ejemplo:
La probabilidad de obtener un as o un rey, sacando una sola carta en
una baraja espaola de 40 cartas. Si uno de los casos aparece, queda
excluido el otro.
P1 =

4
40

1
(As)
10

P2 =

4
40

1
(Rey)
10

P = P1+P2 =

1
1
+
10
10

2
10

1
5

2. Se dice que dos o ms sucesos son independientes, si la probabilidad


de presentacin de alguno de ellos queda influenciada por la presentacin del otro. En caso contrario, se dice que son dependientes.
En otras palabras, si el resultado de un suceso no afecta al otro, se
dice que son independientes, por lo tanto se efectuar la multiplicacin
de las probabilidades para cada suceso.
P = P1 x P2 x P3..... x Pn
Ejemplo:
Qu probabilidad tendremos de obtener dos reyes, sacando una carta de una baraja y la otra de una segunda baraja?
P =

4
4
x
40
40

16
1
=
1600
100

Se dice que los sucesos son dependientes, o eventos compuestos, si la


ocurrencia o no ocurrencia de un evento en cualquier prueba afecta la
probabilidad de otros eventos en otras pruebas, es decir que la probabilidad del segundo suceso depende del primer suceso, el del tercero, de
lo que haya sucedido en el primero y segundo y as sucesivamente.

64

SERIE: APRENDER A INVESTIGAR

Ejemplo:
La probabilidad de obtener tres ases, sacando sucesivamente tres
cartas de una baraja espaola, sin volverlas a incluir (sin reposicin)
en el montn.
P1 =

P =

P=

4
40

P2 =

4
3

40
39

3
39

2
38

P3 =

2
38

24
59280

1
2470

4.4 Anlisis combinatorio


El anlisis combinatorio es un sistema que permite agrupar y ordenar,
en diversas formas, los elementos de un conjunto.
Los tres principales tipos de anlisis combinatorio son:
4.4.1 Permutaciones
Se denominan permutaciones de elementos, los diferentes grupos
que se pueden hacer, tomndolos todos cada vez.
Las permutaciones implican orden.
Cada conjunto ordenado de elementos se denominar una permutacin de los n elementos diferentes.
La formula es Pn = n!, donde Pn corresponde al nmero de permutaciones posibles.
Por ejemplo:
Determine el nmero de permutaciones posibles de las letras A, B, C, D.
P4 = 4! = 4 x 3 x 2 x 1 = 24
Representmoslas:

65

MDULO 4: ANLISIS DE LA INFORMACIN

ABCD
ABDC
ACBD
ADBC
ADCB
ACDB

BACD
BADC
BCDA
BDAC
BDCA
BCAD

CABD
CADB
CBAD
CDAB
CDBA
CBDA

DABC
DACB
DBAC
DCBA
DCAB
DBCA

Otro ejemplo:
Cuntos nmeros diferentes de 9 cifras se pueden formar con los dgitos
del cero al 9, usndolos una sola vez?
P10,= 10! = 10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 3.628.800

Permutaciones con repeticin


Las permutaciones con repeticin r, son un caso particular de las variaciones y no existe una ley sencilla para su formacin. Dado lo complicado del
sistema, slo, se presenta la frmula que logra el nmero de esta clase de
permutaciones.
Sean los elementos aa - bbb - cc - d, para permutar con repeticin, tendremos 8 elementos repartidos as: dos del primero, tres del segundo, dos
del tercero y uno del cuarto, entonces las permutaciones se presentarn
as:
P8(r: 2,3,2,1) y la frmula respectiva ser:
P8(r:2,3,2,1) =

8!
2!3!2!

8x7x6x5x4x3x2x1
2x1x3x2x1x2x1

P8(r:2,3,2,1)=1680
La formula ser

Pn(r: r1, r2) =

Ejemplo:

n!
r1!r2!

De cuntas maneras distribuiramos 3 monedas de $100 y 4 monedas


de $500 en una misma lnea?
P7(r: 3,4) =

7!
3!4!

P7(r: 3,4) = 35

7x6x5x4x3x2x1
3x2x1x4x3x2x1

66

SERIE: APRENDER A INVESTIGAR

Otro ejemplo:
Cuntos grupos de 2 letras se pueden formar con las letras de la palabra
amigas.
P6(r: 2) =

6!

= 360

2!

4.4.2 Variaciones
Las variaciones corresponden a aquellas permutaciones donde los elementos no se toman en su totalidad.
Dado un conjunto de n elementos diferentes, se denominar permutacin
parcial o variaciones, de subconjunto de r elementos (r<n) pertenecientes al
conjunto dado.
La frmula es: Vrn =

n!
(n - r)!

En el ejemplo de las cuatro letras o elementos (n) vamos a permutar de a 2 (r)


V24 =

4!
(4 - 2)!

4x3x2x1
2x1

AB
AC
AD

BA
BC
BD

= 12

CA
CB
CD

DA
DB
DC

Ejemplo:
Cuntas cifras diferentes de 4 dgitos se pueden formar con los dgitos
del 0 al 9, usndolos una vez?
V10
4 =

10!
(10 - 4)!

10 x 9 x 8 x 7 x 6 x 5 x 4 x 3 x 2 x 1
6x5x4x3x2x1

= 5.040

4.4.3 Combinaciones
Son aquellas en las que no interesa el orden de la aparicin de elementos del conjunto. Ser lo mismo AB que BA.

67

MDULO 4: ANLISIS DE LA INFORMACIN

Cuando se toma la totalidad de elementos, solamente se puede hacer una


combinacin. Si se tiene las letras A, B, C, D y se combinan de dos en dos, se
obtienen 6 casos:
AB
AC
AD

BC
BD

CD

La frmula ser:
(nr ) = Cnr =

n!
r!(n - r)!

Y se lee combinacin de n elementos tomados de r en r.


Ejemplo:
Cul es la combinacin de las 4 letras A, B, C, D, tomadas de 4 en 4.
(44) = C44 =

4!
4!(4 - 4)!

4x3x2x1
4x3x2x1x1

= 1

El factorial de cero es uno (0! = l).


En la combinacin de estas 4 letras tomadas de 2 en 2 ser,
(24) = C24 =

4!
2!(4 - 2)!

4x3x2x1
2x1x2x1

= 6

4.5 Probabilidad condicional


En algunos eventos probabilsticos se tiene alguna informacin, que
reduce el espacio muestral original a uno de sus subconjuntos; las probabilidades asociadas a esos subconjuntos determinan la probabilidad condicional.
Su frmula est dada as:
P(B/A) =

Ejemplo:

A)
P(B
P(A)

68

SERIE: APRENDER A INVESTIGAR

El 18 % de las familias de un barrio tienen vehculo propio, el 20% tiene


vivienda de su propiedad y el 12% tiene vivienda y vehculo. Cul es la posibilidad de tener vivienda si se tiene vehculo?
A = Propietario de vehculo
A = No propietario de vehculo
B

Propietario de vivienda

No propietario de vivienda

P(B/A) =

Total

0.12

0.06

0.18

0.08

0.74

0.82

Total

0.20

0.80

1.00

0.12
0.18

= 0.66

INTRODUCCIN A LAS PROBABILIDADES


AUTOEVALUACIN N 3
1. La definicin clsica de probabilidades es el cociente de dividir el
nmero de casos favorables que pueden ocurrir en un suceso, por
el nmero de casos posibles: S ______
No ______
2. Cul es la probabilidad de que una bola, extrada al azar de una
urna que contiene 3 bolas rojas, 4 blancas y 5 azules, sea blanca?
a. 3/12
b. 1/3
c. 5/16
d. Ninguna

69

MDULO 4: ANLISIS DE LA INFORMACIN

3. Una seora invita a cenar a 8 personas; despus de sentarse ella,


de cuntas maneras se pueden sentar sus invitados?
4. En un juego de moneda, entre dos personas, con un premio de
$1.000 por aparicin de cara, cul es la esperanza de ganar con el
resultado de cara?
5. De cuntas maneras se pueden sacar dos manzanas de una caja
que contiene 8 manzanas?

RESPUESTAS A LA AUTOEVALUACIN N 3
5 . C82 = 28
4 . $500
3 . 40.320
2 . 1/3
1. S.

70

SERIE: APRENDER A INVESTIGAR

4.6 Distribucin binomial


En repetidos ensayos, siendo p la probabilidad de xito en un solo ensayo
la cual debe permanecer fija y q la probabilidad de fracaso, entonces la probabilidad P de que se obtengan r xitos en n ensayos, es el termino del desarrollo binomial (q+p)n.
La frmula general ser:
p = Cnr pr qn-r
Los criterios que deben satisfacer una experiencia binomial son:
a) Existir un nmero fijo de pruebas repetidas (n).
b) Cada una de las n pruebas debe tener dos resultados: favorable o desfavorable; en el caso de una moneda ser: cara o sello.
c) La probabilidad de xito de un acontecimiento es fija.
d) Las pruebas son independientes.
e) Nos interesa el nmero de xitos en n pruebas.
En caso de lanzar 4 monedas y se quiera determinar la probabilidad de
obtener exactamente dos caras, ser:
2

P = C

1
2

P = 6

1
16

4
2

4-2

1
2
=

4!
=
2!2!
6
16

1
2

1
2

4.3.2.1
2.1.2.1

1
4

1
4

= 0.375 = 37.5%

4.7 Distribucin normal


Muchas distribuciones de mediciones, que se hacen tanto en las ciencias sociales como en las ciencias naturales, tienden a tener un polgono
de frecuencias con una forma que se asemeja al corte transversal de una
campana.
Esta distribucin se observa ms cuando el nmero de observaciones
es grande y cuando en muchos casos las investigaciones se realizan con
muestras de poblaciones grandes; en la mayora de los casos las distri-

MDULO 4: ANLISIS DE LA INFORMACIN

71

buciones tienden a aproximarse a la curva en forma de campana ya mencionada.


Una distribucin de frecuencias que se asemeja a una campana se reconoce como una Distribucin Normal, que por tener caractersticas especiales, se convierte en un requisito fundamental para entender el proceso relacionado con la inferencia estadstica y la prueba de hiptesis.
Cuando el nmero n de experimentos es grande, se hace difcil el clculo
de las probabilidades mediante el teorema del Binomio; para facilitar el clculo
y agilizar las operaciones, utilizaremos la distribucin normal.
Entre las propiedades de la distribucin normal estn,
a. El rea total debajo de la curva, puede representar el nmero total de elementos en una poblacin y se puede considerar que el rea es igual a la
unidad.
Esta propiedad permite determinar la proporcin de la frecuencia contenida entre dos puntajes a lo largo del eje horizontal, ya que se puede calcular
la proporcin del rea debajo de la curva y contenida entre los dos puntos.
b. La media aritmtica, la mediana, y la moda de una distribucin normal son
iguales a cero.
c. La desviacin estndar es igual a 1
d. Como veamos, tiene una distribucin simtrica.
e. Es una distribucin asinttica, es decir, como no toca el eje de las X, se
extiende infinitamente.
f. En una distribucin normal el 68.26% de los valores bajo la curva, se encuentra dentro de ms o menos una desviacin estndar de la media aritmtica; el 95.46% de los valores debajo de la curva se encuentra dentro
de ms o menos dos desviaciones estndar de la media y el 99.9% se
encuentra dentro de ms o menos tres desviaciones estndar, tal como
se ve en la grfica 5.
La curva est dada por la funcin:

72

SERIE: APRENDER A INVESTIGAR

Y=

z2

e2G

G 2

donde: n
G
e

nmero de datos
desviacin estndar de la distribucin binomial = npq
base de los logaritmos naturales = 2.71828
3.1416
media de la distribucin nominal = np

Grfica 5. Caractersticas de una distribucin normal.

Probabilidad mediante una aproximacin a la curva normal


X y Y son cantidades concretas de la misma especie. La variante estadstica z =

, representa una medida de las desviaciones estndar o


G
de las G llamadas unidades estandarizadas. La expresin anterior tambin
es conocida como desviacin normal. Aplicando la frmula podemos calcular la probabilidad, por ejemplo de obtener 4, 5 y 6 caras, en 9 lanzamientos de una moneda, mediante una aproximacin a la binomial.

73

MDULO 4: ANLISIS DE LA INFORMACIN

n=9
p=
q=
= np = 9 () = 4.5
G = npq = 9 () () = 1.5
p = (3.5 < x <6.5)
x = 4,5 y 6 caras

Grfica 6.

Se tiene que x 3.5 corresponde al lmite inferior de 4, y x 6.5 es el lmite


superior de 6. Se va a buscar el valor del rea comprendido entre 3.5 y 6.5,
o sea, P (3.5<x<6.5). Primero localizamos el rea a partir de la media
hasta el lmite inferior, dado que cada lado vale el 50%, la suma total ser
igual a uno.
De donde z =

x
G

entonces z =

3.5 - 4.5
= 0.67
1.5

z = (-0.67) = 0.2486, tomado de la tabla, rea bajo la curva normal.

74

SERIE: APRENDER A INVESTIGAR

Z=

6.5 - 4.5

= 1.33

1.5

Z = 1.33 = 0.4082, tomado de la tabla, rea bajo la curva normal.


Se desea el rea comprendida entre z = -0.67 y z = 1.33
Para ello sumamos: 0.2486 + 0.4082 = 0.6568
La probabilidad de que aparezca 4, 5 y 6 caras es del 65.68%. Vase
grfica 6.
Ejemplos:
Usando la tabla del rea bajo la curva normal, plantearemos algunos
problemas que servirn de modelo. Ver grficas: 7 - 8 - 9 y 1 0.
a) Para z = 1.5 y z = -1.4
z = 1.5 la tabla da 0.4332

z =1.4 la tabla de 0.4192

p (-14<z<1.5) = 0.4332+0.4192
p 0.8524 = 85.24%

Grfica 7.

75

MDULO 4: ANLISIS DE LA INFORMACIN

b) Si se plantea p (z<1.5), corresponde al siguiente grfico.


0.5000 + 0.4332 = 0.9332 = 93.32%

Grfica 8.

c) P (z>1.5)
0.5000 - 0.4332 = 0.0668 =6.68%

Grfica 9.

76

SERIE: APRENDER A INVESTIGAR

d) Si queremos conocer el porcentaje de frecuencia comprendida entre


z = -3 y z = -2, ser necesario proceder por diferencia.
z = -3 = 0.4987
z = -2 =

0.4772
0.0215

La diferencia es 0.0215 = 2.15%


P (-3 < z < -2)= 2.15%

Grfica 10.

4.8 Distribucin de Poisson


Se tiene ahora una distribucin binomial, cuando n es grande, por lo general mayor de 50, a la vez que p, la probabilidad de xito de un suceso se
acerque a cero, mientras que q, la probabilidad de fracaso, se aproxime a
uno, de tal manera que el producto np, llamado lamda es menor o igual a 5,
debe utilizarse la distribucin de Poisson.
Su frmula es:
P=

xe-
X!

donde e = 2.71828

77

MDULO 4: ANLISIS DE LA INFORMACIN

= np
x = nmero de casos favorables
Ejemplo:
a) Si el 1 % de las bombillas fabricadas por una compaa son defectuosas,
hallar la probabilidad de que en una muestra de 100 bombillas 3 sean
defectuosas.
= 100 x 0.01 = 1
X=3
P =

13 - e-1
3!

1 (0.36788)

= 0.06131

3.2.1

e-1 (utilizamos la tabla para valores de e-)


e-1 = 0.36788
b) Si, la probabilidad de que una persona adquiera la enfermedad como
consecuencia de una vacuna contra la misma, es 0.0002, cul es la
probabilidad de que la adquieran exactamente 5 personas en una poblacin de 10.000 vacunados?
x . e-
p=
X!
= np = 10.000 x 0.0002 = 2
x=5
entonces P =

25 (0.13534)
5.4.3.2.1

P = 0.03609 = 3.61 %
P (x = 5) = 3.61 %

32(0.13534)
120

4.33088
120

78

SERIE: APRENDER A INVESTIGAR

LA CURVA NORMAL Y SUS APLICACIONES


AUTOEVALUACIN N 4
1. La curva normal se caracteriza por que es asimpttica. Esto quiere
decir que:
a. La media es igual a la moda

_________________

b. Tiene forma de campana

_________________

c. Es simtrica

_________________

d. Nunca toca el eje

_________________

e. Ninguna de las anteriores

_________________

2. La tabla bajo la curva normal sirve para indicar cul es:


a. La proporcin de los casos que se encuentran entre la media y
un valor llamado puntaje _____________
b. El valor de la desviacin estndar en relacin con el valor de la
media _____________
3. En una distribucin normal, la media, la mediana y la moda son
iguales:
S _____

No _____

4. Cul es el rea bajo la curva normal que corresponde a un z =


2.5?
_____________________________________________________
5. El promedio de las notas de un curso est en 1.350 puntos y tiene
una distribucin normal con una desviacin estndar de 18 puntos.
a. Qu porcentaje de alumnos tiene notas entre 1.350 y 1.377
puntos?
_________________
b. Entre 1.365 y 1.377

_________________

c. Entre 1.31 y 1.351.

_________________

79

MDULO 4: ANLISIS DE LA INFORMACIN

6. Con una distribucin de 20 elementos se obtiene una media de 20.3


y una desviacin estndar de 2.81. Si uno de los elementos tiene un
valor de 28, cul es el valor de z?
a. 17.18

_____________

b. 7.70

_____________

c. 2.74

_____________

d. 5.48

_____________

e. Ninguno de los anteriores

_____________

7. En una distribucin normal, el 68.26% de los valores bajo la curva


se encuentra dentro de ms o menos una desviacin estndar de la
media aritmtica.
S _____

No _____

8. En una distribucin binomial, cuando n es pequea, se utiliza la distribucin de Poisson.


S _____

No _____

RESPUESTAS A LA AUTOEVALUACIN N 3
c)21.14%;

b)13.65;

2=a-,

1 =d;

6=c)2.74;
3=S;

7=S;
4=49.38%;

8=No
5=a)43.32%;

80

SERIE: APRENDER A INVESTIGAR

5. ESTADSTICA INFERENCIAL
Ayuda a determinar la confiabilidad de la inferencia de que los fenmenos observados en la muestra ocurrirn tambin en la poblacin de donde
se seleccion la muestra. Es decir, sirve para estimar la eficacia del razonamiento inductivo con el cual se infiere que lo que se observa en una
parte se observar en el grupo entero.
El objeto de la estadstica es el de hacer inferencias (predecir, decidir)
sobre algunas caractersticas de la poblacin con base en la informacin
contenida en una muestra.
Por lo tanto, se puede afirmar que el empleo de la estadstica inferencial
presume el dominio de la estadstica descriptiva. Sin embargo se debe
tener presente que al predecir un resultado o tomar una decisin se est
sujeto a una incertidumbre o margen de error, bien sea por la tcnica de
muestreo o por la seleccin del estadstico de prueba.
Es importante resaltar que se debe diferenciar entre las tcnicas que
son vlidas para el anlisis de los datos cualitativos y de los datos cuantitativos.
En el caso de la estadstica inferencial el investigador se encuentra
con dos tipos de tcnicas. Por un lado las tcnicas paramtricas que
suponen una serie de supuestos acerca de la naturaleza de la poblacin
de la que se extrajo la muestra de estudio. Por otro lado, las tcnicas no
paramtricas, que no requieren supuestos sobre las caractersticas de la
poblacin y que se facilitan ms para el anlisis de datos nominales y
ordinales.
Las ventajas de las tcnicas paramtricas es que son ms potentes
que las no paramtricas y por consiguiente las inferencias que se realizan
son ms fiables. El inconveniente es que el investigador no siempre puede cumplir con los requisitos y supuestos que exige el enfoque paramtrico,
sobre todo en investigaciones educativas y sociales.
La ventaja de las tcnicas no paramtricas es que son fciles de utilizar y algunas son tan potentes como las paramtricas.
El anlisis de datos cualitativos ha generado tcnicas propias, que actualmente constituyen toda una metodologa especfica que viene marcada
por la propia idiosincrasia cualitativa y que toma determinadas opciones en
relacin a las unidades de registro de los datos y la forma de tratarlos.

MDULO 4: ANLISIS DE LA INFORMACIN

81

Actualmente existe inters por sistematizar estos procedimientos, sin


embargo esta tarea es difcil debido al carcter abierto y flexible de la metodologa, los diversos enfoques, y la variedad de objetivos cientficos que
puede cubrir.
Una de las maneras de realizar estimaciones es con las pruebas de
hiptesis referentes a sus valores.
En muchos aspectos el procedimiento formal para la prueba de hiptesis es similar al mtodo cientfico.
5.1 La prueba de hiptesis
Ya el investigador, desde el momento en que identifica y delimita el problema que va a investigar, ha aclarado los elementos conceptuales y las
hiptesis o modelos que tiene que probar. En las etapas complicadas con
la generacin de los instrumentos, con la recoleccin de la informacin y
con la codificacin de la misma, estas hiptesis se aclaran mucho ms y
en algunos casos, toman caractersticas cuantitativas, permitiendo la aplicacin de tcnicas estadsticas, para probar su relevancia en cuanto a su
capacidad para generalizar el fenmeno, o la relacin entre fenmenos, a
poblaciones mayores, o para tomar decisiones en relacin con tales fenmenos.
En esta parte distinguiremos la lgica del proceso para probar una hiptesis y aplicaremos en casos determinados la prueba Z, la prueba T y la
prueba de significacin entre muestras, para ilustrar el proceso de prueba
de hiptesis.

La lgica de la prueba de hiptesis


En el proceso de la estadstica inferencial, hay dos tipos de hiptesis
claves: una es la hiptesis de investigacin (H 1), que simplemente seala
la existencia de un hecho o de un evento, o la relacin entre dos o ms
fenmenos.
La otra es la hiptesis nula (H0) que se construye artificialmente para
que el investigador evale su hiptesis de investigacin.
Si la hiptesis de investigacin afirma que existe una relacin entre dos
o ms fenmenos, la hiptesis nula (H0) plantea que no existe relacin
entre los dos fenmenos.

82

SERIE: APRENDER A INVESTIGAR

Es decir, se utiliza esta ltima como un modelo para probar la hiptesis de


investigacin, o sea, probar su veracidad o su falsedad.
Para probar una hiptesis, se necesita:
1 La existencia o planteamiento de la misma.
2 Que se anticipen los eventos que pueden resultar a partir de la observacin o experimentacin.
3 Que se especifiquen las condiciones bajo las cuales la hiptesis se puede
rechazar o aceptar.
4 Que se haga el experimento y la observacin y que se analice el evento o
resultado.
5 Que se tome la decisin de rechazar o aceptar la hiptesis.
Esto implica que, aunque se tiene que observar o experimentar, todas las
suposiciones se hacen antes de las mismas observaciones o experimentos.
Es decir, el investigador predice y luego bajo las reglas del juego de su prediccin evala en relacin con los resultados. Si stos no son consistentes con
lo que se predijo, se rechaza la hiptesis.
Con un ejemplo podemos ilustrar la naturaleza de la prueba de hiptesis.
Supongamos que se est probando una nueva semilla para resolver problemas de productividad en una regin determinada. La hiptesis de la investigacin sera que la media aritmtica por fanegada es mayor de 519 arrobas, que
es el tradicionalmente observado en esa regin.
Para verificar la hiptesis tenemos que completar los cinco pasos siguientes:
1 Aclarar la hiptesis de investigacin H1 y crear la hiptesis nula H0.
2 Obtener la distribucin del muestreo.
3 Seleccionar un nivel de significancia y una regin de rechazo.
4 Hacer la prueba estadstica.
5 Comparar y concluir.

MDULO 4: ANLISIS DE LA INFORMACIN

83

Punto 1
El paso uno se define en el enunciado del problema. Para que sea verificada HI, el proceso a seguir es contradecir a H0, es decir, hay que contradecir
que la media aritmtica es igual o menor a 519.
Entonces las dos hiptesis se representan as:
H1: X > 519
H0: X < 519
Con lo anterior, lo que se est diciendo es que, si encontramos que el
promedio de produccin por fanegada es de 519 arrobas o menos, tendremos que concluir que nuestra hiptesis inicial H1, tendr que ser modificada y
por lo tanto, la nueva semilla, por lo menos en cuanto a su productividad, no
es competitiva con las tradicionalmente utilizadas.

Punto 2
Una vez aclaradas las suposiciones del punto 1, acerca de H1 y H0, por
medio de un razonamiento matemtico podemos obtener la distribucin de
muestreo, o sea, la distribucin de todos los posibles valores que una estadstica puede tener, con base en un muestreo probabilstico de un universo.
Esta distribucin nos dice, entonces, qu probabilidad hay de obtener cada
uno de los resultados.
Dependiendo del tamao de las muestras, las distribuciones de muestreo
tienden a tomar una distribucin normal y por ello no es necesario calcularlas.
Un teorema importante, que es una aplicacin de la distribucin normal,
conocido como el teorema del Lmite Central, dice que si en una poblacin
de tamao N, con una media de y una varianza de S2 se obtienen muestras al azar, la distribucin de las medias de las muestras seleccionadas
ser normal -y ms lo ser en la medida en que se incremento el nmero de
muestras seleccionadas- y tendr una media de Y y varianza S2/N.
El teorema garantiza que la media de una muestra puede estar muy cercana al de la poblacin, en la medida en que tenga un tamao n grande, ya
que la varianza de la distribucin de las medias muestrales S2/N, se hace
ms pequea en la medida en que aumenta el tamao n.
La desviacin estndar de la distribucin de las medias de la muestra se
denomina como el error estndar: S/ /N

84

SERIE: APRENDER A INVESTIGAR

Punto 3
A partir de la informacin obtenida, el investigador puede escoger resultados que permitan aceptar o rechazar sus supuestos. Posteriormente, los resultados identificados para rechazar la suposicin se llaman de regin crtica,
dividiendo as los resultados en los que sirven para rechazar y los que sirven
para aceptar la hiptesis nula, sabiendo que estos sectores estn relacionados con errores de tipo y .
Una vez aclaradas la H1 y H0, obtenemos aleatoriamente una muestra de
la produccin por fanegada de la semilla probada en la regin.
Calculamos la media aritmtica y la desviacin estndar de los datos de la
muestra, informacin sta que nos permite hacer la prueba estadstica.
Si calculamos x, sabemos que la distribucin de muestreo de x, suponiendo que H0 es cierto, es bastante aproximada a una distribucin normal
con un = 519.
Valores de x, que contradicen H0 y por lo tanto validan a H1, sern aquellos que se encuentran en la regin de la cola derecha de la distribucin,
como lo seala la figura 11. Estos valores contradictorios generan la regin de rechazo, es decir, si el valor observado de x cae en la regin de
rechazo, descartamos H0 y aprobamos H1. Observemos que se verifica H1
contradiciendo H0. Por lo tanto si x cae en la regin de aceptacin de la
figura 11, aceptamos H0 y no podemos verificar H1. Esta es la etapa de
comparacin con la regin de rechazo.
Grfica 11. Suponiendo que H0 es verdadera, los valores
contradictorios de X estn en la cola superior.

MDULO 4: ANLISIS DE LA INFORMACIN

85

Hay posibilidad de cometer dos tipos de errores al probar la hiptesis.


Podemos, como en cualquier proceso de decisin entre dos escogencias,
cometer el error de rechazar a H0 cuando en realidad es verdadera; error
tipo l ; o podemos aceptar H0 cuando en realidad es falsa; error tipo ll .
Y aunque es conveniente determinar la regin de aceptacin y de rechazo,
minimizando tanto el error tipo como el error tipo , esto no es imposible
porque estn inversamente relacionadas, es decir, para una muestra de
tamao , cuando se cambia la regin de rechazo para incrementar el error
, el error disminuye y viceversa.
Para resolver este problema, la comunidad de cientficos ha decidido
que se debe trabajar con la probabilidad de cometer error tipo l y la especificacin del valor para el error tipo determina la regin de rechazo.
Cmo se hace? Volviendo a nuestro ejemplo, sabemos que rechazamos
H0 si obtenemos grandes valores de x.
Si tenemos una muestra de 36 terrenos de una fanegada, como muestra del estudio y si la media aritmtica es x = 573 y la desviacin estndar
es S = 124 la pregunta clave sobre la cual tenemos que tomar una decisin es si el x para toda la regin es mayor que 519.
Para concluir, decidimos el valor del error con el cual queremos trabajar; siempre sabemos que hay la posibilidad de cometer un error. Si en este
caso queremos correr el riesgo de equivocarnos 1 de cada 40 decisiones,
es decir de rechazar incorrectamente H0 entonces = 1/40 = 0.025
Como suponemos que H 0 es verdadera, x est distribuida normalmente y tiene = 51 9 y una desviacin estndar de:
S 124 20.67
=
=
N 36

Punto 4
Supongamos que en la figura 11 la regin rayada sea la equivalente a la
de un = 0,025. Para calcular el punto de rechazo, se tiene que calcular el
valor de Z, que tiene un rea de 0.025 a su derecha. En la tabla de reas
bajo la curva normal vemos que el valor correspondiente es de 1.96, por lo
que lo designaremos como el lmite para la regin de rechazo y si el valor
observado de x es mayor que 1.96, desviaciones estndar arriba de = 159,
se rechaza la hiptesis nula.

86

SERIE: APRENDER A INVESTIGAR

Cuando el valor de x es igual a 573 y el de S es igual a 124, el valor de


Z normalizado es:
Z =

x-
S
N

573 - 519
124
36

54
20.67

= 2.61

Punto 5
El ltimo paso es comparar el valor obtenido con el dispuesto como
rechazo, ya que x encontrado est a ms de 1.96 unidades de desviacin
estndar arriba del = 519, rechazamos H0 en favor de H1 y concluimos
que la productividad de la nueva variedad de semilla es significativamente
mayor que 519.
5.2 Pruebas de significancia de muestras nicas o simples
Cuando se quiere probar hiptesis a partir de una muestra nica, se
pueden utilizar varias pruebas de significancia de hiptesis. En estudios
en ciencias naturales y ciencias sociales es muy frecuente este tipo de
situaciones y las tcnicas utilizadas ms frecuentemente son la prueba Z,
y la prueba t frecuentemente llamada t de Student.
5.2.1 Prueba Z
Normalmente se utiliza cuando se conoce el parmetro de la poblacin. Ilustremos su uso con el siguiente ejemplo hipottico:
En una institucin de enseanza media se presenta una desercin que
los directores consideran muy alta y pensaron que con un programa de
consejera, podran controlarla, con la hiptesis de que cuanta ms gua
personal, mayor sera la probabilidad de continuar exitosamente en la
institucin. Se gener una consejera y al cabo de un ao se recopil informacin sobre el nmero de veces que cada estudiante tuvo contacto formal con un consejero.
La media aritmtica para el total de estudiantes fue de 12.1 visitas al
ao, con una desviacin estndar de 3.21.
Meses despus se hizo una muestra aleatoria simple de 40 estudiantes desertores y a partir de los datos obtenidos con la recopilacin de informacin, se les calcul una media aritmtica de 9.11. Al ver que era ms
baja que el resto de la poblacin, los directores se hicieron la siguiente pre-

87

MDULO 4: ANLISIS DE LA INFORMACIN

gunta. Es el nmero de visitas de los desertores significativamente ms


bajo que el de la poblacin estudiantil?
Supongamos la hiptesis de la investigacin H 1: x < y la hiptesis
nula H0: x > , decidimos utilizar un nivel del 0.01 de significancia, la muestra,
como vimos, es probabilstica.
Para probar la hiptesis calculamos el puntaje Z, normalizado como
habamos visto as:

Z =

x-
S
N

9.11 - 12.1
3.21
40

-2.99
3.21
6.32

= -5.86

El signo es indiferente al resultado, porque estamos trabajando con


reas, por lo tanto Z = 5.86.
En la tabla de reas bajo la curva normal, vemos que para que el x sea
significativamente distinto de = 12.1, se necesita una Z = 2.33 o mayor;
como el Z obtenido es mayor, se rechaza H 0 y se acepta H1, ya que:
0.5000 - 0.0100 = 0.4900
Entonces Z = 2.33
Concluimos que los estudiantes desertores tienen un nmero de contactos significativamente inferior al resto de la poblacin estudiantil.
5.2.2 Distribucin t de Student
En los casos en que no se conoce el parmetro poblacional, dependemos nicamente de las estadsticas de las muestras y utilizamos la
Prueba t.
Cuando n > 30 (muestra grande) la desviacin estndar simbolizada por
se le considera como un buen estimador de la desviacin estndar
poblacional, debido a que existe una mayor probabilidad de que los valores
extremos que toma la variable, queden incluidos en el clculo de la varianza para la muestra, tal como ocurre en el clculo de la varianza poblacional.

s,

Siendo,

s = S, la frmula para obtener s ser:

88

SERIE: APRENDER A INVESTIGAR

s^ =

(x - x)

Para n < 30 (muestra pequea) la desviacin estndar se simboliza


por s, cuando no se ha efectuado ninguna correccin. Se considera que,
s, por lo general, es mejor que S, debido a la menor probabilidad de que
se incluyan los valores extremos de la variable. Por tanto, se hace necesario efectuar algunas correcciones en el clculo:
a. Cuando se da la desviacin estndar sin corregir:

s^ =

(x - x)

n
n-1

b. Cuando se desea corregirla directamente

s^ =

(x - x)

n-1

En la distribucin de t Student, se considera que las curvas son simtricas, pero algo ms achatadas y ms abiertas en los extremos, los cuales corresponden a regiones crticas. A medida en que el tamao de la
muestra se hace ms grande, ms se acerca a la normal.
La funcin dada para este tipo de distribucin es:

Y = C 1+

t
v

v+1
2

donde v corresponde a los grados de libertad, nmero que depende de


n; C es una constante que depende de v y es calculada en tal forma que el
rea bajo la curva sea igual a 1.
Grados de libertad
Corresponden al nmero mximo de variables que puedan asignarse
libremente, antes de que el resto de las variables queden completamente
determinadas.

89

MDULO 4: ANLISIS DE LA INFORMACIN

Las variantes estadsticas para el clculo de t son:


a) En las distribuciones muestrales donde n < 30, la frmula es:
t=

x-
s^
n-1

tambin puede escribirse en la siguiente forma


t=

x-

n
donde

s se obtiene corrigindola as:

s= s^

n-1

s=

(x - x)

n-1

b) En las distribuciones de medias muestrales se tiene:


t=

(X - Y)2 (x - y)

sx-y

siendo

s2=

(X - X)

+ (Y - Y)2
n1+n2-2

2
sx-y = sn
1

s2
n2

En la determinacin de los puntos crticos, t i (inferior) y ts (superior), se


utiliza la tabla t de Student. En primer lugar se fija el nivel de significacin,
por ejemplo, = 0.05, luego se calculan los grados de libertad, siendo en
distribuciones muestrales v = n - 1, en diferencias de medidas muestrales:
v= ni + n2 - 2. Si la prueba es bilateral, se tomar el 5% para cada una de

90

SERIE: APRENDER A INVESTIGAR

las regiones crticas y si es unilateral se tomar el doble del nivel de


significancia asignado; en este caso, ser 0. 1 0.
Ejemplos:
1. Una muestra de 25 observaciones tiene una media de 42.0 y una desviacin estndar de 8. Trabajando con un nivel de significancia del 1%.
Existe razn para rechazar la hiptesis de que la media de la poblacin es de 46.0.
a. H 1: x K46
H 0: = 46
b. = 0.01

Grfica 12.

c.

s^ = 8

s= 8
t =

25
= 8(1.021) = 8.17
25 - 1
42 - 46
8.17
25

t =

-4
1.63

= -2.45

V = 25-1; = 0.01; corresponde a una t = 2.7969

91

MDULO 4: ANLISIS DE LA INFORMACIN

Como el valor de t = -2.45 queda en la regin de aceptacin, se acepta


la hiptesis de que = 46, es decir no existe razn para rechazar que la
media de la poblacin es 46.
2. Un fabricante de cigarrillos analiza el tabaco de dos marcas diferentes, para determinar el contenido de nicotina y obtiene los siguientes
resultados, en miligramos.
Marca A: 24
Marca B: 27

26
28

25
25

22
29

23
26

Los resultados anteriores, sealan que existe una diferencia en el


contenido medio de nicotina en ambas marcas?
Solucin:
a) HI: x K y
H O: x = y
b) = 0.05

sx-y

c)

=1

Siendo:

s=

(X - X)

+ (Y - Y)2
n1+n2-2

2
sx-y = sn
1

s2
n2

Tabla 11. Resultado de las dos marcas de cigarrillos


para determinar el contenido de nicotina
X

x-x

24
26
25
22
23

27
28
25
29
26

0
2
1
-2
-1

120

135

(x - x)2

y-y

(y - y)2

0
4
1
4
1

0
1
-2
2
-1

0
1
4
4
1

10

10

92

SERIE: APRENDER A INVESTIGAR

X =

120
= 24
5

s=

10 + 10
=
5+5-2

s = 1.6
sx-y =

Y =
20
=
8

135
= 27
5
2.5

s2 = 2.5
2.5
2.5
+
=
5
5

1 =1

d) t = (24 - 27) - 0 = 3 = 3
1
1
e) v = n1 + n2-2
v=5+5-2
v=8

Grfica 13.

f) Los resultados anteriores sealan que existe una diferencia significativa en el contenido medio de nicotina en ambas marcas. Vase grfica
13.
5.2.3 Distribucin Chi Cuadrado: 2
La distribucin normal se utiliza en todos aquellos casos que ofrecen
dos resultados posibles; cuando se presentan ms de dos resultados posibles, debe aplicarse la prueba chi cuadrado que se simboliza as: 2. Un
ejemplo tpico de distribucin lo constituye el lanzamiento de una moneda
con posibilidades de que aparezca cara o sello. Uno de 2 consiste en el
lanzamiento de un dado con seis caras posibles, numeradas del 1 al 6.

93

MDULO 4: ANLISIS DE LA INFORMACIN

El Chi cuadrado es la suma de las fracciones que tienen por numerador


el cuadrado de las diferencias entre las frecuencias reales u observadas y
las frecuencias esperadas o tericas y por denominador la frecuencia esperada.
2 =

2
(ni - n*)
i

n*i

en donde ni frecuencia observada o real


n*i frecuencia terica o esperada
Se puede observar en la frmula, que mientras mayor sea la coincidencia entre las frecuencias observadas y las esperadas, menor ser el valor
de 2. Si 2 = 0 significa concordancia entre las frecuencias observadas y
las esperadas.
Ejemplo:
Supongamos que se lanza un dado 60 veces. Se sabe que las frecuencias tericas, para este caso son de 10 veces cada cara y las frecuencias reales son los resultados del lanzamiento. La base de un nivel
de significancia del 5%, permite suponer que el dado no es perfecto?
Solucin:
El problema da las frecuencias reales nt, para cada cara, como se ve en
la tabla 12. Las frecuencias esperadas se obtienen multiplicando la probabilidad de cada suceso por n (nmero de lanzamientos). Vase grfica 14.
Tabla 12. Frecuencia en el lanzamiento de un dado 60 veces
Caras

ni

ni*

n i - n i*

(ni - n i*)2

2
(ni - n*)
i

n*i
1
2
3
4
5
6

7
14
8
5
16
10

10
10
10
10
10
10

-3
4
-2
-5
6
0

9
16
4
25
36
0

0.9
1.6
0.4
2.5
3.6
0

60

60

9.0

94

SERIE: APRENDER A INVESTIGAR

n*i= np1= 60

( )

1
60
=
=10
6
6

y as se obtienen las dems frecuencias te-

ricas.
Se realiza la prueba teniendo en cuenta los siguientes pasos:
1) HI: ni K n*i
H I: ni K n*i
2) = 0.05
2
3) =

(ni - n*i)2
n*i

= 9.0

4) V = n - 1 = 6 - 1 = 5... 20.05 = 11.07

Grfica 14.

En la tabla de distribucin de 2, encontramos que 11.07 es el valor


crtico.
5) 2 < 20.05 , es decir 9 < 11.07, por lo tanto se acepta la hiptesis de que
la diferencia no es significativa. En otras palabras podemos afirmar que
a un nivel del 5%, las diferencias que presentan las frecuencias reales,
con relacin a las frecuencias tericas no nos da base para afirmar que
el dado est cargado.

95

MDULO 4: ANLISIS DE LA INFORMACIN

PRUEBAS DE HIPTESIS - AUTOEVALUACIN N 5


1. La hiptesis de investigacin es exactamente lo mismo que la
hiptesis nula?
S _____

No _____

2. Si una hiptesis de investigacin es que dos poblaciones tienen


iguales medias aritmticas, cul es la hiptesis nula?
a. Que en efecto tienen iguales medias aritmticas

____

b. Que las dos poblaciones tienen distintas medias aritmticas ____


c. Que las medias aritmticas pueden ser iguales o distintas

____

d. Para poder definirla hay que conocer la desviacin estndar ____


3. Una distribucin de muestreo es lo mismo que una distribucin
de una muestra?
S _____

No _____

Por qu?
___________________________________________________
___________________________________________________
4. El nivel de significancia es:
a. Lo mismo que el nivel de precisin

_____

b. La regin crtica de una curva normal

_____

c. Una probabilidad

_____

d. El error alfa

_____

e. La exactitud con que se predicen los parmetros _____


5. El valor crtico de un puntaje Z para una prueba de una cola, al
nivel de significancia 0.05 es: ________

96

SERIE: APRENDER A INVESTIGAR

6. A partir de una muestra de obreros en una fbrica, se puede


inferir a cerca de las caractersticas de esa fbrica?
a. No

_____

b. Slo si uso una prueba Z

_____

c. Slo si uso una prueba t

_____

d. Si se usa una prueba Z o prueba t

_____

7. La prueba t se prefiere a la prueba Z cuando no se conocen los


parmetros del universo?
S _____

No _____

8. Los salarios diarios de una industria estn distribuidos normalmente con una media de $132 y una desviacin estndar de $25.
Si una empresa de dicha industria, que cuenta con 40 obreros
paga en promedio $122, puede acusarse a esta compaa de
pagar salarios inferiores al nivel de significancia del 1%?
S _____

No _____

Desarrollo: _________________________________________
___________________________________________________
___________________________________________________
9. Una hiptesis dice que el estudiante promedio de la universidad
colombiana tiene un coeficiente de inteligencia mayor que el resto
de la poblacin. Escriba una hiptesis de investigacin y una
hiptesis nula, con un coeficiente de inteligencia que al estandarizarse tiene una X = 100
Hiptesis de investigacin: ______________________________
Hiptesis nula: ________________________________________
10. Un fabricante de ciertas piezas de proyectiles sostiene que en
condiciones normales de reparacin, tienen una duracin media
=320 horas. Probar esta afirmacin frente a la alternativa
K320, si 16 piezas duran un promedio de 308 horas, con una
desviacin de 29 horas. Utilizar un nivel de significancia del 5%.

1. No, es lo contrario.
2. b
3. No. La distribucin de una muestra son las caractersticas que
tienen los datos a partir de una muestra.
La distribucin de un muestreo es la distribucin de una muestra de medias a partir de muestras.
4. c
5. 1.96
6. d
7. S
122 132
8. Z =
= 2.53 cae en la regin de rechazo. Se puede
25
40
acusar a la compaa de pagar salarios inferiores al nivel del 1%
9. Hiptesis de investigacin: H 1= x >100 Hiptesis nula: H0=x100
10. t =

308 320
29

= 1.60 cae en la zona de aceptacin, o sea, que

15
la duracin promedio es de 320, a un nivel significativo del 5%.
11. S, porque 2 = 4.518 y cae en la zona de aceptacin y se puede
considerar el dado perfecto.
RESPUESTAS A LA AUTOEVALUACIN N 5
Explique.
S _____

No _____

Puede considerarse el dado perfecto al nivel del 1% de significancia?


Cara A
ni

1
12

2
17

3
20

4
22

5
13

6
16

11. Un dado se lanza 100 veces y se obtienen los siguientes resultados:


MDULO 4: ANLISIS DE LA INFORMACIN

97

98

SERIE: APRENDER A INVESTIGAR

6. REGRESIN Y CORRELACIN
6.1 Introduccin a la bidimensional
En esta parte examinaremos la relacin entre variables, medidas en escalas de intervalo o de razn. Pero ya no slo queremos comparar, ahora
queremos entender qu tipo de conexin hay entre las variables, por intermedio de la relacin que existe entre ellas, e ir ms all entendiendo la
naturaleza de la relacin entre las variables.
En las distribuciones bidimensionales se consideran dos variables en
forma simultnea, determinndose si tienen alguna relacin funcional entre
s; an ms, cuantificando dicha relacin. Estas variables pueden ser ambas discretas, ambas continuas, o una discreta y otra continua.
Llamaremos Xi a la primera variable, donde i toma todos los valores
desde 1 hasta n. As tendremos X1, X2, X3, ... Xn; Yi se considerar como la
segunda variable, donde i toma los valores desde 1 hasta n. Se tendrn
tantos valores de X como valores de Y, es decir, se tomarn siempre pares
de observaciones.
Tabla. Valores de X y Y
Xi

Yi

Xi

Yi

Xi2

Yi2

X1
X2
X3
X4

Y1
Y2
Y3
Y4

6
10
14
20
27
33

3
4
8
12
18
25

36
100
196
400
729
1.089

9
16
64
144
324
625

18
40
112
240
486
825

Xn

Yn

110

70

2.550

1.182

1.721

XY

Para cada variable se podr calcular la media aritmtica, la varianza y


la desviacin estndar, usando los datos no agrupados.
X =

Xi

Y =

Yi

110
6
70
6

= 18.33

= 11.67

99

MDULO 4: ANLISIS DE LA INFORMACIN

S2x =

X2i

S2y =

Y2i

X2 =

Y2 =

2.550
5
1.182
6

(18.33)2 = 89.01

(11.66)2 = 61.04

Sy=

Sy2

89.01

= 9.44

Sy=

Sy2

61.04

= 7.81

La covarianza es una medida de dispersin que representa el grado de


variabilidad conjunta entre Xi y Yi. Su smbolo es mxy myx. Se define como
la media del producto de las desviaciones respecto a las medias aritmticas. Entonces se puede calcular la covarianza por la siguiente frmula:

mxy =

XY
n

X Y

Tomando los datos de la tabla anterior podemos calcular la covarianza


as:
mxy =

1.721
6

= (18.33)(11.67)

mxy = 286.83 213.91


mxy = 72.92

Los datos de la distribucin bidimensional anteriormente dada puede


representarse grficamente en un par de ejes de coordenadas, tomando
el eje de la abscisas para la primera variable (Xi) y el eje vertical para los
valores de la segunda variable (Yi).

100

SERIE: APRENDER A INVESTIGAR

En un plano cartesiano se presentan tantos datos como puntos pares


de observaciones se tengan, correspondiendo cada punto a un par de observaciones. A esta representacin grfica se le denomina indistintamente diagrama de desparramiento, de esparcimiento o nube de puntos.

Grfica 15. Nube de puntos

El problema consiste ahora en unir varios puntos de ese conjunto o


nube de puntos, mediante un ajuste, ya sea rectilneo, parablico, exponencial o de cualquier otro tipo de lnea que represente al conjunto. En
algunos casos esos puntos estarn condensados al rededor de la lnea,
en otros presentarn diferencias; en este ltimo caso, se pueden producir
grandes errores, como consecuencia de que el ajuste realizado no es el
ms indicado.
El tipo de lnea que se relaciona, depender de la forma que asuma el
conjunto de puntos, al hacer la respectiva grfica. Tambin valindose de la
experiencia del estadstico se puede determinar el mejor ajuste. En la
exponencial, es muy sencilla la identificacin, basta que la variable muestre
un crecimiento geomtrico, como por ejemplo, la poblacin, el producto bruto,
etc.
En general, se dice que la curva que hace mnima la suma de los cuadrados de las desviaciones entre puntos dados, dicha lnea es la mejor.

101

MDULO 4: ANLISIS DE LA INFORMACIN

6.2 Ajuste de una recta de regresin rectilneo simple


Supngase que se desea ajustar una recta, para ello sabemos que la
ecuacin general de la recta es:
Y = a + bx,

X = a + by

donde X, en la primera ecuacin y Y en la segunda es la variable que


se supone conocida, llamada variable independiente. Ahora, Y y X en una
segunda ecuacin corresponde a la variable que se va a estimar, conocida con el nombre de variable dependiente.
a. es el coeficiente de posicin, denominado tambin origen, o sea, es
la altura de la perpendicular levantada en el punto de origen. Vase grfica
16.
El coeficiente de posicin puede ser mayor, menor o igual a cero.
a) a>0

b) a=0

c) a<0

Grfica 16.

En el primer caso ser un punto por encima del origen, en el segundo


pasar por el origen y en el tercero estar por debajo del origen.
b. Es el coeficiente angular, el cual nos determina los crecimientos o
la cantidad que aumenta en Y, por cada unidad que aumenta X y se denomina como pendiente.
El coeficiente angular puede ser:

102

SERIE: APRENDER A INVESTIGAR

a) b>0

b) b<0

c) b<0

Grfica 17. Coeficiente angular b.

Grfica 18. Posicin de a y b.

Si b es un valor mayor que cero, es decir positivo, nos indicar que la


recta es ascendente; si b es menor que cero, la recta ser descendente y
si es igual a cero, la recta es paralela al eje horizontal o vertical.
Cuando se tiene la ecuacin Y = a + bx, se dice en este caso que se
est estimando a Y en funcin de X. Para la ecuacin X = a + by, decimos
que estimamos a X en funcin de Y
El problema, ahora, consiste en calcular los parmetros a y b.
Partiendo de las ecuaciones normales de los mnimos cuadrados, se
pueden calcular estos parmetros.

MDULO 4: ANLISIS DE LA INFORMACIN

103

Las ecuaciones normales para los mnimos cuadrados son:


1) Y = Na + b X
2) XY = a X + b X2
Tomaremos los datos de la distribucin bidimensional de la tabla y reemplazando en estas ecuaciones se tiene:
1) 70 = 6a + 110b
2) 1.721 = 110a + 2.550b
Por sustitucin, eliminamos a y calculamos el valor de b as, multiplicamos los valores de la ecuacin (1) por -110 y los de la ecuacin (2) por
6 y se resta de la primera.
1) -7.700 = -660a - 12.100b
2) 10.326 = 660a + 15.300b
2.626 = 3.200b
b =

2.626

= 0.82

3.200

Reemplazamos el valor calculado de b en la ecuacin (1) as:


1) 70 = 6a+110(0.82)
70 = 6a + 90.2
a =

70 90.2
6

a = -3.37
Reemplazando en la ecuacin general de la recta, Y = a + bx, se tiene:
Y = 3.37 + 0.82x
cuando se quiere estimar X en funcin de Y, se procede de la siguiente
forma:
X = a + by

104

SERIE: APRENDER A INVESTIGAR

Las ecuaciones normales para el clculo de los parmetros a y b son:


1) X = Na + b Y
2) XY.= a Y + b Y2
1) 110 = 6a + 70b
2) 1.721 = 70a + 1.128b
Multiplicando (1) por -70 y (2) por 6 y luego restamos de la primera:
1) -7.700 = -420a - 4.900b
2) 10.326 = 420a + 7.092b
2.626 = 2.192b
b =

2.626

= 1.20

2.192

Reemplazando este valor en la ecuacin (1) se tiene el valor de a


1) 110 = 6a+70(1.20)
110 = 6a+84
a =
a =

100 84
6
100 84
6

Reemplazando en la ecuacin general de la recta X = a + by, se tiene:


X = 4.33 + 1.20y
6.3 Correlacin
En la prctica algunas de las variables que medimos en los procesos de
investigacin, tienen un nivel de medicin intervalo o de razn y para resolver problemas con estos niveles existen unas tcnicas diferentes a las
que hasta ahora hemos visto.

MDULO 4: ANLISIS DE LA INFORMACIN

105

Cuando tenemos mediciones realizadas con escalas intervalos o de


razn, la mejor medida paramtrica de asociacin es la relacin de Pearson
(r), tambin conocida como la relacin Producto-Momento. Para hacer
una correcta interpretacin del coeficiente, se tienen que hacer dos suposiciones.
1. Se supone que la relacin es lineal.
2. Que la distribucin de las variables asociadas tiende a ser normal.
Es importante entender que una correlacin entre dos variables produce
un nmero que resume la naturaleza de la asociacin entre las variables.
En el caso de la correlacin de Pearson, ese nmero (r) toma valores
desde -1 hasta +1, pasando por cero, cuando hay relacin entre las variables. Si la relacin tiende a ser inversa, se aproximar a -1, en la medida
en que sea perfecta y por el otro lado, si la correlacin tiende a ser directa,
se acercar a +1. No slo sirve para indicar si hay o no relacin, sino para
indicar la fuerza de la misma y tambin para compararla con las otras
variables.
Una forma adecuada para ilustrar la naturaleza de r, se muestra en la
figura 19. Aqu se presentan 6 tipos de relaciones entre las dos variables X
y Y. Cada punto en los cuadrantes representa los valores de X, y Y toma
un elemento de la muestra o poblacin analizada.
En la grfica A, se ve claramente una nube de puntos dispersos, casi
que aleatoriamente distribuidos. Cuando esto sucede no existe ninguna
relacin directa entre las dos variables, es decir r es igual o tiende a cero
(r 0).
En la grfica B, vemos que existe una tendencia. A mayores valores de
X parecen estar asociados mayores valores de Y, por lo tanto, existe una
relacin directa entre las dos variables. Es decir r>0.
En la grfica C, vemos que tambin hay una tendencia, pero en este
caso indicando que a valores pequeos de X corresponden valores grandes de Y y a valores grandes de X corresponden valores pequeos de Y. O
sea, hay una relacin inversa entre las dos variables r<0.
En la grfica D, vemos que hay una correlacin no lineal entre las dos
variables. En el rango de valores bajos y altos de X corresponden valores
bajos de Y y en el rango de valores intermedios de X corresponden valores
altos de Y. Aunque r 0, no podemos decir que no hay relacin entre las

106

SERIE: APRENDER A INVESTIGAR

dos variables, slo que la relacin es curvilnea y por lo tanto requiere de


un tratamiento particular.

Grfica 19. Ejemplos para entender la interpretacin de r.

Los dos ltimos grficos E y F sirven para ilustrar una situacin que
suele presentarse durante una investigacin.
En el caso E, vemos que la mayora de los elementos analizados, parecen indicar la no existencia de relacin entre las dos variables, pero hay
unos pocos casos donde altos valores de X tienen a los valores de Y.
En el caso F, se presenta lo contrario, la mayora de las observaciones
analizadas indican una relacin positiva entre X y Y, pero unos pocos casos la distorsionan, ya que rompen la tendencia.
Estos ejemplos, muestran la utilidad de hacer uso de histogramas y de
las distribuciones de las frecuencias obtenidas, para no cometer errores.
Por ejemplo, concluir que no hay relacin en el caso del grfico D, cuando

107

MDULO 4: ANLISIS DE LA INFORMACIN

en realidad hay una no lineal; o decir que hay relacin positiva en el grfico
E, o que no existe relacin en el grfico D, cuando en realidad es lo contrario.
En estos dos ltimos casos, lo recomendable es retirar los elementos
distorsionadores, o completar una mayor informacin, por si en realidad lo
sugerido por los casos extremos es la tendencia real, o por ltimo, revisar
los procesos de recoleccin, codificacin o sistematizacin de la informacin, donde se pudo haber cometido algn error.
6.4 Coeficiente de correlacin
Nos permite cuantificar el grado de correlacin existente entre las variables X y Y.
Hay dos maneras de calcular el coeficiente de correlacin, una aritmtica y otra por medio de lgebra de matrices.
Hagamos un ejercicio aritmtico:
Supongamos que queremos medir la asociacin que existe entre innovacin tecnolgica y produccin, en 11 empresas que elaboraron un mismo producto. En la tabla 12 se presenta la informacin obtenida en visitas
realizadas a 11 industrias.

Tabla 12. Ejemplo para calcular r


X2

Y2

XY

tecnolgico X

Produccin
y

1
2
3
4
5
6
7
8
9
10
11

44
62
30
50
28
34
49
54
72
66
27

20
19
15
21
13
15
17
17
22
21
14

1.936
3.844
900
2.500
784
1.156
2.401
2.916
5.184
4.356
729

400
361
225
441
169
225
289
289
484
441
196

880
1.178
450
1.050
364
510
833
918
1.584
1.386
378

N=11

X=516

Y=194

X2= 26.706

Y2=3.520

XY = 9.531

Empresa

Nivel

108

SERIE: APRENDER A INVESTIGAR

Una frmula para calcular r es:

r =

N XY ( X)( Y)
N X ( X)2 N Y2 ( Y)2
2

Sustituyendo tenemos:
(11)(9.531) (516)(194)

r =

11(26.706)(516)2 11(3.520)(194)2
r =

4.737
29.820.840

r = 0,867
Como correlaciones cercanas a 1 son altas e indican una asociacin
positiva, concluimos que hay una alta asociacin entre la tecnologa utilizada y la produccin en el tipo de industria estudiadas.
El grado de correlacin lo podemos clasificar evitando un tanto la rigidez de sus lmites:
a. Correlacin perfecta, cuando r=1 (o menos de 1).
b. Correlacin excelente, cuando r es mayor que 0.90 y menor que 1,
(-1<Y<-0.90).
c. Correlacin aceptable, cuando r se encuentra entre 0.80 y 0.90
(-090<r<-080).
d. Correlacin regular, cuando r se encuentra entre
0.60 y 0.80 (-080<r<-0.60).
e. Correlacin mnima, cuando r se encuentra entre 0.30 y 0.60
(-0.60<r<-0.30).
f.

No hay correlacin para r menor de 0.30 (-0.30<r<0)

MDULO 4: ANLISIS DE LA INFORMACIN

REGRESIN Y CORRELACIN - AUTOEVALUACIN N 6


1. La frmula Y = a + bx, corresponde a la ecuacin general de la
recta?
S _____

No _____

Qu nombre recibe la variable X? __________________________


2. Qu nombre recibe a?
____________________________________
3. Qu nombre recibe b?
____________________________________
4. Con base en los datos de la siguiente tabla de valores para X y Y,
halle la recta de regresin por los mnimos cuadrados. Para
Y=a+bx
____________________________________________________
Xi
Yi
____________________________________________________
13
5
14
7
8
9
10
8
15
11
____________________________________________________
60
40
____________________________________________________
5. Calcule el coeficiente de correlacin, a partir de los datos de la
siguiente tabla:
____________________________________________________
Xi
Yi
____________________________________________________
9
23
17
35
20
29
19
33
20
43
23
32
____________________________________________________
108
195
____________________________________________________

109

1. S. Variable independiente.
2. Coeficiente de posicin.
3. Coeficiente angular.
4. Y = -180.4 + 15.7x
5. r = 0.60
RESPUESTAS A LA AUTOEVALUACIN N 6
110

SERIE: APRENDER A INVESTIGAR

111

MDULO 4: ANLISIS DE LA INFORMACIN

7. ANLISIS DE LA VARIANZA
Del anlisis de varianza, podemos decir que esta tcnica estadstica,
normalmente es utilizada para analizar resultados en la investigacin con
diseos experimentales y cuasi experimentales. Muchas veces necesitamos comparar dos o ms distribuciones, que corresponden a variaciones
de una misma variable dependiente, afectada por una o ms variables
independientes.
Las variables independientes pueden ser medidas en cualquier tipo de
escala, pero la variable dependiente debe ser medida, al menos, al nivel
intervalo. Si las variables independientes son medidas al nivel intervalo o
de razn, tendramos un tpico caso de anlisis de regresin mltiple.
Si queremos medir la importancia relativa de tres procesos en la calidad de un producto final utilizamos el anlisis de varianza (ANOVA).
En la tabla 13 tomamos unos datos hipotticos para ilustrar su caso. Tenemos tres grupos de 5 productos, seleccionados independientemente,
al azar, con sus respectivos puntajes, en cuanto a su calidad; sta, que
es la variable dependiente, se midi por medio de una escala intervalo.
Tabla 13. Datos para ilustrar el uso de Anova

Mtodo 1

Mtodo2

Mtodo 3
Total

X2

X2

X2

6
10
9
11
12

36
100
81
121
144

9
7
8
8
5

81
49
64
64
25

4
6
9
4
3

16
36
81
16
9

48

482

37

283

26

158

111

x 9.6

7.4

5.2

7.4

N 5

1.5

Supongamos que cada grupo sometido a un mtodo de produccin


distinto, tiene varianzas iguales. Es decir, la hiptesis nula H 0, es que no

112

SERIE: APRENDER A INVESTIGAR

hay diferencias en las medias aritmticas de los tres grupos. Supongamos que queremos analizar las observaciones a un nivel de significancia
del 0.05 y ver si hay diferencias en la calidad por el mtodo empleado. El
clculo de F, contra cuya distribucin de muestreo se comparan los resultados, es el procedimiento a seguir.
1 Suma total de los cuadrados de los puntajes de los tres grupos as:

(X X) = X
2

( X)2
N

= (482 + 283 + 158)

(111)2
15

= 923 821.4 = 101.6


2 Suma de cuadrados entre columnas. Igual frmula pero referida a cada
uno de los tres grupos o mtodos utilizados as:

Mtodo 1 = 482

Mtodo 2 = 283

Mtodo 3 = 158

(48)2
5
(37)2
5
(26)2
5

= 482 460.8 = 21.2

= 283 273.8 = 9.2

= 158 135.2 =
Total

22.8
53.2

3 Suma de cuadrados entre columnas (grupos).


Suma total del cuadrado = suma dentro + suma entre
Suma entre = suma total - suma dentro.
Suma entre = 101.6 - 53.2
Suma entre = 48.4

113

MDULO 4: ANLISIS DE LA INFORMACIN

4 Grados de libertad. Son los siguientes:


Suma total

= n-1
= 15-1=14

Suma dentro

= K(N 1-1); donde K=nmero de grupos y N 1


tamao de los grupos (5)
= 3(5-1)
= 12

Suma entre

= K-1
= 3-1
=2

5 Clculo para anlisis de la varianza con el valor de F


Suma de
Grados de
Cuadrados
libertad

Estimacin
de la varianza

Total

101.6

14

Entre columnas

48.4

24.20

Dentro de las
columnas

53.2

12

4.43

5.46

La estimacin de la varianza es la razn de la suma de cuadrados y


los grados de libertad y F es igual a la razn de la estimacin entre y la
estimacin dentro.

Varianza entre

48.4
2

= 24.2

F =
Varianza dentro =

53.2
12

= 4.43

24.2
4.43

= 5.46

114

SERIE: APRENDER A INVESTIGAR

6 Decisin
En la tabla de distribucin F vemos que con un nivel de significancia
del 0.05 y con 2 y 12 grados de libertad, necesitamos un valor igual o mayor a 3.88 para poder rechazar H0. Como en efecto obtuvimos uno de 5.46,
rechazamos H0 y concluimos que los mtodos utilizados s producen una
diferencia significativa en la calidad del producto.

ANLISIS DE VARIANZA - AUTOEVALUACIN N 7


1. En una universidad se quiere probar el efecto que distintos mtodos de enseanza tienen, en los resultados de un curso dado.
Tres mtodos se proponen y se aplican a tres grupos, compuestos de 14 estudiantes, cada grupo seleccionado aleatoriamente
entre los alumnos del curso. Los resultados del examen final del
semestre se presentan a continuacin. Se puede concluir que los
mtodos producen un efecto diferencia.
52
49
34
52
14
41
34
42
33
39
51
43
39
43

27
36
34
32
41
33
25
19
28
22
25
14
22
27

16
14
23
21
29
20
28
27
17
12
40
28
18
21

2. La distribucin que se utiliza para probar el nivel de significancia


de un anlisis de varianza es el 2
Verdadero _____

Falso _____

1. Suma total = 5.112.4


2. Suma de cuadrados entre columnas:
Mtodo 1 =

1.309.4

Mtodo 2 =

675.5

Mtodo 3 =

715.4

Total

2.700.3

3. Suma de cuadrados entre columnas.


Suma de cuadrados entre las columnas:
5.112.4
2.700.3
2.412.1
4. Grados de libertad.
Suma total

= 42-1 =41

Suma dentro

= 3(14 - 1)39

Suma entre

= 3-1 =2

5. Clculo F
Sumade
cuadrados

Grados de
libertad

Varianza

Total

5.112.40

41

Entre

2.412.10

1.206.10

Dentro

2.700.30

39

69.24

17.42

RESPUESTA A LA AUTOEVALUACIN N 7
MDULO 4: ANLISIS DE LA INFORMACIN

115

Si se prueba con significancia del 0.01, esto implica que necesitamos un F al menos de 5.3, para rechazar H0 y aceptar que los
mtodos s tienen efecto en el rendimiento acadmico de los estudiantes y como se obtiene un F=17.42, concluimos que s tiene
efectos.
2. Falso, es la distribucin F.
Comente los resultados de los 2 problemas.

116

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS DE LA INFORMACIN

117

8. ESTUDIO DE FACTIBILIDAD DEL SOFTWARE


ESTADSTICO
La necesidad de contar con una herramienta adecuada para la enseanza e investigacin estadstica, conlleva a realizar un estudio detallado
de los programas con mayor aplicacin en estos campos, adems se
debe considerar para la implementacin de stos, los recursos fsicos
para un desempeo eficaz.
El paquete estadstico SAS y SPSS cumplen con los requerimientos
acadmicos debido a su manejo personalizado, cursos de actualizacin y
asesora continua, lo cual contribuye como soporte a la docencia y en
gran parte al proceso educativo.
8.1 SAS
Es un sistema que provee herramientas para la captura, administracin y anlisis de datos.

Este software permite un total control sobre la informacin.

Permite accesar, administrar, analizar y presentar la informacin.

El SAS est conformado por los siguientes mdulos:

STAT
Provee herramientas para el anlisis estadstico avanzado. Sirve para
administrar la informacin como:
Almacenamiento y recuperacin de informacin.
Programacin y modificacin de datos.
Reportes.
Anlisis estadstico.

118

SERIE: APRENDER A INVESTIGAR

SAS/STAR PROCEDURES

Regression
NLIN

Analysis
Of Variance

Multivariante

Survial

Clustering

CANCORR

Analysis

ACLACUS

FACTOR

LIFEREG

CLUSTER-

REG-RSREG

PLANTTEST

Categorical

Discriminant

CADMOD

CANDISC

SCORE

ANOVAORTHOREG

Scoring

PRINCOMP

FREQ

FASTCLUS

GLM

DISCRIM
STEPDISC

TREE-

NESTEDVARCOMP

VARCLUS

FSP**
Sirve para construir y manipular conjuntos de datos. Este mdulo facilita
la captura de datos, validacin, verificacin en tablas, edicin y consulta.
AF**
Sirve para crear mens y para encadenar los diversos mdulos.
ETS*
Provee herramientas para realizar proyecciones en modelos economtricos. Puede realizar reportes como tablas de amortizacin y tablas de
depreciacin.
OR
Provee una herramienta para investigacin de operaciones.
QC*
Es una aplicacin para estadsticas en control de calidad.
GRAPH
Es el mdulo que posee el SAS

Convenciones:
* No es necesario.
** Para realizar aplicaciones bajo ambientes SAS.

MDULO 4: ANLISIS DE LA INFORMACIN

119

SHARE
Permite el acceso concurrente de varios usuarios a archivos comunes
SAS. Este mdulo garantiza la integridad y la seguridad de la informacin.
ACCES
Este mdulo sirve para realizar las interfaces en los manejadores de
bases de datos.
8.2 SPSS
BASE
Contiene estadsticas bsicas, grficos de alta resolucin y un paquete completo de listado. Con el SPSS BASE 6.0 bajo Windows se producir un anlisis y resultados de alta calidad.
Estadsticas profesionales
Medidas de similariedad y diferencias en sus datos, provee tcnicas
de clasificacin. En este procedimiento incluye Anlisis Cluster, Anlisis
Discriminante, Anlisis Factor, Anlisis Multidimensional, Anlisis Proximidades, Mnimos Cuadrados con Ponderacin y Mnimos Cuadrados con
dos fases.
Estadsticas avanzadas
Incluye sofisticadas tcnicas como: Regresin Decox, Estimacin
Kalpian Meier, Regresin Logstica, Anlisis Lineal Logartmico, Anlisis
de Varianza Multivariado, Regresin No-Lineal de Vida (Tabla vida).
Tablas
Crea una variedad de cuadros tabulares, incluyendo tablas complejas
(mltiple respuesta).
Tendencias
Ejecuta pronsticos y anlisis de series de tiempo, modelos de suavizacin y mtodos para estimacin autorregresin.

120

SERIE: APRENDER A INVESTIGAR

Categoras
Ejecuta anlisis conjunto y procedimientos de optimizacin, incluyendo anlisis de correspondencia.
Chaid
Desarrolla modelos predictivos, produce variables predictorias.
Lissrel
Relaciona un anlisis estructural lineal y modelos de ecuaciones simultneas.
8.3 Requerimientos mnimos para la instalacin del Software SAS
1. Procesador 486 o superior.
2. Memoria RAM 32 Mb o superior.
3. 20 Mb de espacio en el disco duro.
4. Cualquiera de las siguientes opciones

Windows versin 3.1 o posteriores.


Windows para trabajo en grupo versin 3.1 o posteriores.

8.4 Requerimientos mnimos para la instalacin del Software SPSS


1. Procesador 386 o superior.
2. Memoria RAM 32 Mb o superior.
3. 20 Mb como mnimo para almacenar el SPSS.
4. Monitor VGA.
5. Cualquiera de las siguientes opciones.
6. Windows versin 3.1 o posteriores.

Windows para trabajo en grupo versin 3.1 o posteriores.

MDULO 4: ANLISIS DE LA INFORMACIN

121

8.5 Manejador de Base de Datos


En la actualidad existen en el mercado una gran variedad de manejadores de bases de datos con caractersticas nicas, es decir, no son compatibles con los sistemas tradicionales de manejadores de bases de datos
de segunda y tercera generacin como Dbase, DataEase, Foxpro. Los
manejadores de Bases de Datos de cuarta generacin que se recomiendan por compatibilidad son Acces, Paradox, Foxpro.
Para cumplir con los objetivos educativos se recomienda por su flexibilidad y compatibilidad el Foxplus bajo ambiente Windows.
Visual Foxpro 6.0
La herramienta para el desarrollador profesional de aplicaciones xBase.
(En esta nueva versin obtendr: Mejor rendimiento e IDE, mayor conectividad y soporte de ActiveX).
Caractersticas
Sigue la evolucin de Foxpro desde un sistema de desarrollo de bases
de datos de escritorio y de tipo procedural a un entorno de desarrollo
orientado a objetos, con las herramientas necesarias para construir aplicaciones y componentes en sistemas clientelservidor e lnternet.
Visual Foxpro 6.0 es un miembro de la familia que integra el sistema de
desarrollo Visual Studio. Permite la utilizacin de los ltimos avances en los
sistemas operativos Windows y Windows NT y ha sido diseado para permitir a los 500.000 desarrolladores que usan Visual Foxpro una forma ms
potente y eficiente de crear aplicaciones multicapa cliente/servidor, basadas en Web y centradas en el tratamiento de datos. La compatibilidad con
el ao 2000 est totalmente asegurada.
Visual Foxpro mantiene un completo set de comandos Xbase para permitir una curva suave de aprendizaje a los programadores de bases de
datos en entornos MsDos.
Dispone de las caractersticas ms avanzadas en el diseo de clases
orientadas a objeto incluyendo herencia, subclases, encapsulacin y polimorfismo. Las libreras de clases visuales y no visuales (por cdigo) reducen enormente el tiempo de desarrollo.

122

SERIE: APRENDER A INVESTIGAR

Existen herramientas de diseo para todas las fases de desarrollo de


la aplicacin. Un motor de bases de datos altamente eficiente, un lenguaje
centrado en los datos y la capacidad de creacin de componentes hacen
de Visual Fospro una herramienta idnea para la generacin de lgica de
negocio en los entornos multicapa con tratamientos intensivos de datos.
Visual Foxpro puede intercambiar datos con bases de datos SQL a
travs de ODBC (Open Database Connectivity). De esta forma, no es
necesario un gran esfuerzo en la adaptacin de aplicaciones basadas en
servidor de ficheros a aplicaciones clientelservidor. Tambin podemos utilizar los componentes ADO (ActiveX Data Objects) para intercambiar informacin con datos relacionases y no-relacionales mediante OLE DB.
Visual Foxpro puede ser utilizado en las tres capas de una arquitectura
clientelservidor. Puede suministrar el interface de usuario a travs del uso
de formularios con toda la potencia de la orientacin a objeto. Los controles
ActiveX pueden usarse en los formularios y se subciasean para extender
sus funcionalidades. La lgica de negocio puede encapsularse en componentes muy eficientes gracias a la potencia de Fospro en la recuperacin y
manipulacin de datos. Los componentes COM pueden ser llamados desde el front-end del usuario o desde el servidor lnternet. Los componentes
comunican con las bases de datos de Fospro y SQL a travs de ODBC y
OLE DB. En almacenamiento de datos puede estar soportado por el motor
de Visual Foxpro. En arquitecturas CIS la mejor combinacin es SQL para
el proceso de las transacciones y Visual Foxpro para el manejo de consultas locales y procesos batch.
Novedades en Visual Foxpro 6.0
La aparicin de Visual Foxpro 6.0 ha supuesto principalmente una evolucin de las herramientas de desarrollo para adaptarlas a la arquitectura
COM y al desarrollo de aplicaciones multicapa en lnternet e lntranet. Adems dispone de herramientas de desarrollo mejoradas y ampliadas. Por
ltimo se han revisado los comandos de programacin, destacando la
mejora en el soporte del ao 2000.
Las principales novedades son:
OLE Drag and Drop
El OLE Drag and Drop permite intercambiar datos entre los controles de
una aplicacin o entre varias aplicaciones que soporten esta funcionalidad.
Ahora podemos arrastrar ficheros desde el explorador de Windows a la
ventana del proyecto o transportar textos con el ratn desde Word o Excel.

MDULO 4: ANLISIS DE LA INFORMACIN

123

Visual foxpro dispona desde versiones anteriores de un drag and drop


propietario. Sigue existiendo, pero se recomienda no utilizar los dos tipos
de drag and drop simultneamente en una aplicacin.
Documentos activos
Visual Foxpro permite crear documentos activos, los cuales permiten
visualizar documentos no-Htmi en un explorador de lnternet. De momento
slo es posible con el Microsoft lnternet Explorer. Un documento activo es
un tipo de documento OLE embebido. Se visualiza totalmente en un rea
de la aplicacin contenedora o host, mezclando su men con el del host.
La tecnologa de documento activo permite visualizar mltiples tipos de
documentos dentro de un nico contenedor.
A diferencia de Visual Basic, los formularios de Visual Foxpro no requieren modificaciones para crear documentos activos. Es suficiente con
iniciar la aplicacin desde una clase basada en la clase base ActiveDoc.
La clase base ActiveDoc aporta las propiedades, eventos y mtodos para
un documento activo y de esta forma interactuar con el host.
Mejoras en el servidor de automatizacin
Un servidor de automatizacin es un componente que expone su
funcionalidad, la cual puede ser usada por otras aplicaciones a travs de
la automatizacin. Visual Foxpro puede crear servidores de automatizacin
dentro o fuera del proceso.
Las mejoras en este tema se refieren al soport del Apartement Model
Threading. De esta forma Visual Foxpro tiene soporte para Microsoft Transaction Server. Los componentes construidos con Visual Foxpro pueden
ser manejados por el explorador de Microsoft Transaccin Server y participar en las transacciones con otros componentes.
Otras mejoras de adaptacin de los servidores de automatizacin a la
arquitectura COM son: gestin optimizada del Runtime, soporte mejorado
de las libreras de tipos, manejo de excepciones, paso de arrays, nuevas
propiedades y mtodos para la automatizacin...
Galera de componentes
La galera de componentes es una nueva herramienta que ayuda a agrupar y organizar objetos como las clases, libreras, formularios, botones.
Los distintos objetos pueden organizarse en otros objetos como proyectos,

124

SERIE: APRENDER A INVESTIGAR

aplicaciones u otras agrupaciones diferentes. Estas agrupaciones visuales se pueden adaptar dinmicamente a las necesidades del desarrollador.
La galera de componentes incluye tambin las Visual Foxpro Foundation Classes. Son un conjunto de clases para mejorar las aplicaciones,
reutilizando cdigo probado y optimizado.
Estas clases pueden incluirse en nuestros proyectos directamente o
crear subciases para adaptarlas a las distintas aplicaciones.
Aplicacin de cobertura y control de rendimiento de cdigo
La aplicacin de cobertura genera informacin de las lneas que fueron
ejecutadas en un determinado fichero. Por otro lado se puede configurar
el control que se realiza sobre las lneas de cdigo ejecutadas, cuntas
veces se ejecutan, duracin y muchos otros aspectos.
Acceso por programa al proyecto
En versiones anteriores de Visual Foxpro, el nico acceso a los proyectos se realizaba de forma directa, abriendo la tabla pix a travs del
gestor de proyectos. Ahora se ha implementado un objeto proyecto para
poder manipularlo por programa. El objeto proyecto acta de intermedio
entre un proyecto abierto y el desarrollador que puede interactuar directamente con el proyecto.

MDULO 4: ANLISIS DE LA INFORMACIN

125

9. STATGRAPHICS
Software para el anlisis de datos cuantitativos y cualitativos cuya estructura est sobre la base de mens. Existen versiones para trabajar bajo
DOS y bajo Windows.
El men principal de Statgraphics permite entrar a cualquiera de las 22
secciones divididas en seis grupos.
9.1 Grupo I: Data handling and system utilities
A. DATA MANAGEMENT. Men para entrada de datos, definicin de variables, importacin y exportacin de datos.
B. SYSTEM ENVIROMANT. Acceso a requerimientos y configuracin del
sistema.
C. REPORT WRITER AND GRAPHICS REPLAY. Configuracin de impresoras.
D. PLOTTER INTERFACE. Interfase para plotter.
9.2 Grupo II: Plotting and descriptiva statistics
E. PLOTTING FUNCTIONS. Elaboracin de grficas estadsticas en dos
y tres dimensiones.
F. DESCRIPTIVE METHODS. Resume datos, realiza distribuciones de
frecuencia, obtiene estadsticas bsicas.
G. ESTIMATION AND TEST. Elabora intervalos de confianza y pruebas de
hiptesis para una o dos muestras. Permite hacer pruebas de bondad
de ajuste.
H. DISTRIBUTION FUNCTIONS. Genera nmeros aleatorios. Permite hacer clculos con las principales funciones de probabilidad continuas y
discretas.
I.

EXPLORATOR Y DATA ANALYSIS. Realiza el anlisis exploratorio de


datos, diagrama de tallos y hojas, diagrama de caja, etc.

126

SERIE: APRENDER A INVESTIGAR

9.3 Grupo III: Anova and regression analysis


J. ANALYSIS OF VARIANCE. Realiza anlisis de varianza de una o dos vas.
K. REGRESION ANALYSIS. Ajusta modelos lineales y no lineales en una
y varias variables.
9.4 Grupo IV: Time series procedures
L. FORECASTING. Pronosticacin con modelos de series temporales.
M. SMOOTHING. Procedimientos de promedios mviles
N. QUALITY CONTROL. Procedimientos de control de calidad estadsticos.
O. TIME SERIES ANALYSIS. Procedimientos para ajustar modelos ARIMA
a series temporales.
9.5 Grupo V: Advanced procedures
P. CATEGORICAL DATA ANALYSIS. Tablas de contingencia, correspondencias simples, etc.
Q. MULTIVARIATE METHODS. Componentes principales, anlisis de conglomerados, tests multivariados, etc.
R. NONPARAMETRIC METHODS. Pruebas no paramtricas con una y
varias muestras.
S. SAMPLING. Determina tamao de la muestra.
T. EXPERIMENTAL DESIGN. Mtodos de diseo de experimentos, anova,
manova, diseos 22, 23, etc.
9.6 Grupo VI: Mathematical procedures
U. NUMERICAL ANALYSIS. Mtodos de anlisis numricos, races de funciones, mtodo simple, lgebra, etc.
V. MATHEMATICAL FUNCTIONS. Glosario de funciones matemticas,
aplicaciones.

MDULO 4: ANLISIS DE LA INFORMACIN

127

9.7 Requerimientos fsicos para la instalacin de Statgraphics


1. Sistema operativo DOS (Windows 3.1 o superior si se va a instalar la
versin bajo Windows).
2. Procesador 386 o superior
3. El monitor se configura en la instalacin.
4. 5 Mb para almacenar el STATGRAPHICS.

128

SERIE: APRENDER A INVESTIGAR

Tablas
reas bajo la curva normal

Fraccin del rea total (10.000) bajo la curva normal, correspondiente a distancias entre la media y las ordenadas situadas a z unidades de desviacin
estndar de la media.

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

Nmeros aleatorios

129

130

SERIE: APRENDER A INVESTIGAR

Distribucin de t

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

Distribucin de X2

131

132

SERIE: APRENDER A INVESTIGAR

Valores de F con significancia de 0.05

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

Valores de F con significancia de 0.01

133

Serie
APRENDER A INVESTIGAR

ANEXO

Mdulo 4
Instructivo para el uso del video
ESTELA URIBE VLEZ

1. Uso didctico del video


2. Videos:
La medicin y las ciencias
La curva normal
La muestra

136

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

137

1. USO DIDCTICO DEL VIDEO


En este documento queremos mostrar la importancia que tiene la utilizacin de video en las aulas de clase, sus ventajas y desventajas en las actividades acadmicas. As mismo, que es responsabilidad del profesor el buen
uso que de ste se haga para facilitarle el proceso enseanza-aprendizaje.
El video es un sistema de almacenamiento de imgenes y sonidos que
utiliza los mismos fundamentos tcnicos que la televisin y que naci para cubrir las necesidades que las programadoras de T.V. tenan para almacenar sus
programas y librarse de la esclavitud de la emisin en directo. Su aparicin
revolucion la tecnologa televisiva, que hasta el momento se reduca a la transmisin de sucesos en directo, de forma irrepetible. El video configur una nueva
televisin donde el programa elaborado por montaje, el diferido, las repeticiones y los intercambios de programas, enriquecen la produccin televisiva.
La mayor ventaja que tiene el video con respecto al resto de los audiovisuales, desde el punto de vista didctico, es la posibilidad de una presentacin flexible y un fed-back inmediato.
Una de las funciones que debe cumplir el video en el aula es la de ser un
facilitador para el proceso enseanza-aprendizaje.
El docente debe reflexionar sobre la realidad educativa concreta y, como
consecuencia de ello, descubrir cules son sus necesidades reales con relacin al video como medio concreto, fruto del desarrollo de las nuevas tecnologas de la comunicacin y su aplicacin en la enseanza.
El video como medio didctico
La forma ms frecuente de esta utilizacin consiste en el trabajo con el
grupo/aula la situacin de enseanza masiva, en la que el monitor sustituye
el discurso del profesor. Generalmente se recurre a este medio para motivar/
introducir un tema, aunque para algunos temas y/o disciplinas generalmente
aquellas centradas en la explicacin de procesos, etc. el video introduce
algunos momentos didcticos.
El video puede cumplir diferentes funciones dentro de los procesos de
enseanza-aprendizaje; entre ellas tenemos:
Funcin motivadora
El video, como todos los medios basados en lenguajes visuales, es particularmente apto para transmitir emociones, sensaciones, afectos, que a menudo las palabras no logran expresar con la misma precisin, ya que la imagen, por su misma naturaleza, comunica de manera inmediata, ms rpida y

138

SERIE: APRENDER A INVESTIGAR

emotiva que la palabra. En este sentido, adems de implicar al alumno en la


informacin videogrfica, pueden desarrollarse y afirmarse actitudes, estimular la imaginacin, la fantasa...
Bsicamente se trata de utilizar el video para captar la atencin y, a su
vez, dar una primera idea, muy general sobre el tema. El tipo de programas
que podemos emplear puede proceder de emisiones de televisin comercial,
de pelculas, de actividades realizadas en el propio centro, entre otras. Su
grado de elaboracin desde el punto de vista educativo puede ser muy elemental, ya que lo fundamental de esto reside en lo que tiene de actualidad o de
inters para el alumno. El profesor es quien puede decidir qu tipo de contenidos son los adecuados, en cada caso concreto, para el desarrollo de esta
funcin. El material puede tener los orgenes ms diversos.
Funcin presentadora/introductoria
La presentacin del contenido del tema, bien en su totalidad, bien en una
parte del mismo, puede ser otra de las funciones del video en el aula. Esta
utilizacin es sensiblemente diferente a la anterior y no se puede entender ni
tiene sentido de forma aislada.
El desarrollar un tema en el aula por medio del video debe tener dos acciones previas:
1. Adecuar el programa a la situacin concreta de clase.
2. Desarrollar los materiales que van a permitir la comprensin y el desarrollo del mismo, el video por s solo tiene problemas para, de una forma
adecuada, dar una informacin a un grupo de alumnos. La velocidad de la
narracin puede ser, entre otros, uno de los problemas que se pueden
presentar. Para suplir algunos de estos problemas se hace indispensable
que el profesor prepare por lo menos dos tipos de materiales complementarios a esta presentacin como son:
Materiales de ampliacin del contenido del video. Estos deben permitir
que el alumno vea la importancia del tema que el video ha mostrado y
cmo desarrollar aquellos aspectos tratados en el video que puedan
tener un inters relevante. Deben ser fundamentalmente documentos,
referencias bibliogrficas, etc., que el profesor debe preparar para cada
video.
Materiales de observacin o evaluacin del video. Deben ser como guas
de observacin del problema, en el que se destacan aquellos aspectos
del mismo que tienen un mayor inters y que deben ser observados con
ms atencin. Tienen una doble funcin: destacar los puntos fundamentales y evaluar los contenidos por el alumno. Estas guas contienen una

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

139

serie de cuestiones que se han de responder con la informacin que


facilita el programa visionado. No se trata exclusivamente de preguntas
y respuestas en el sentido ms tradicional. Pueden ser esquemas para
completar, mapas a complementar, grficas, etc.
Un uso complementario de todo lo anterior va a permitir al estudiante no
slo la utilizacin de cualquier gua, sino tambin la manipulacin de los programas de video utilizados en clase, de tal forma que pueda crear con ellos su
propio programa, bien con intencin de completar el aprendizaje o bien con
una intencin evaluadora.
Funcin informativa
Est directamente relacionada con la adquisicin de conocimientos y con
la relacin que se establece entre las nuevas informaciones que se reciben y
las ideas que ya se poseen, desarrollando nuevos conceptos y conocimientos. El video acta de mediatizador desde el momento que se trata de una
observacin indirecta. Esta observacin no puede limitar el estudio a lo que el
entorno le ofrece visualmente, sino que se ocupar de cosas que no pueden
ser observadas directamente, bien por problemas especiales no se puede
acceder, bien por problemas temporales acontecimientos que pueden apreciarse con la concentracin o dilatacin del tiempo, lugares inaccesibles para
la visin humana, o por tratarse de una conexin con otras tecnologas telescopios, microscopios, o de acceso difcil, costoso o peligroso.
Funcin instructiva
El video, adems de motivar y transmitir informacin, ha de servir para
proporcionar instrumentos tendientes a la organizacin del conocimiento y al
desarrollo de destrezas. Las destrezas, las actitudes de base conseguidas,
pueden transferirse a otros mbitos del conocimiento, de la cultura o de las
situaciones vitales a travs de principios.
La aplicacin de estos principios a la utilizacin didctica se centra, fundamentalmente, en la intervencin del profesor en la transmisin del mensaje
especialmente, en el modo de presentacin, de tal forma que lo haga ms
dinmico y activo. Esta intervencin requiere un conocimiento de las implicaciones que el modo de presentacin de un material tiene en el alumno, la
posibilidad de flexibilizar la utilizacin de los materiales a fin de adecuarlos al
mayor abanico de necesidades y condiciones y, por ltimo, requiere tambin
la integracin del medio en el contexto.
Estos principios son:
a. El modo de presentacin: La eficacia del mensaje depende tanto del contenido como de su presentacin.

140

SERIE: APRENDER A INVESTIGAR

b. Flexibilidad de utilizacin: La flexibilidad supone para el profesor el tratamiento de dicho mensaje desde enfoques diversos:
a. La audiencia: Debe conocer muy bien a su audiencia y tener claras sus
necesidades.
b. Contemplar la necesidad de utilizacin en situaciones didcticas que
no sean solamente grupales.
c. Utilizacin integrada en el contexto educativo: El profesor debe presentar contenidos que se integren en el medio afectivo, social y cultural del
alumno destinatario.
Funcin de recapitulador
Este es otro posible uso del video en la situacin interactiva de clase, el
empleo de las secuencias ms significativas del tema expuesto, dndole un
tratamiento diferente, ms gil, ms breve, puede permitir que todo el tema se
resuma en unos pocos minutos, de manera que quede claro cules son las
ideas y los conceptos fundamentales del mismo.
Las funciones anteriores van interrelacionadas y le corresponde al profesor desarrollarlas de tal forma que se adecuen a sus propsitos; por lo tanto el
profesor debe, con anterioridad a la utilizacin del video en el aula, visionar
repetidamente el mismo, analizarlo y decidir cules son los puntos esenciales
del tema, desarrollando seguidamente los materiales complementarios para
los estudiantes.
El video como medio de expresin y de comunicacin
Si concebimos el video como un medio que une la comunicacin didctica, es obvio que, adems de transmitir informacin externa ms o menos
modificada o manipulada por el profesor, debe servir de medio de expresin
de las propias ideas y experiencias para los protagonistas del proceso enseanza-aprendizaje profesor y alumnos.
El video, por su propia naturaleza, resulta un medio apropiado en una comunicacin bidireccional multidireccional en el aula. Su desarrollo como tal, exige, no obstante, un cambio radical en algunas concepciones ancladas en el
sistema educativo y, especialmente, aquellas relacionadas con la facultad y la
libertad para comunicar.
Es necesaria la participacin libre y consciente por parte del alumno en el
proceso comunicativo.

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

141

La simplicidad tcnica de manejo y los bajos costos de este medio, hacen


posible lo que con el cine era ms complicado. La enseanza de la imagen es
hoy factible en su doble vertiente, para contemplarla y para usarla como medio de expresin. Conocer los criterios y principios que estn detrs de un
mensaje verboicnico nos permite dos tipos de acciones:
Primero. Facilitar la decodificacin completa de los programas que nos
llegan por los medios de comunicacin de masas, fundamentalmente la
televisin.
Segundo. Permite utilizar un nuevo medio de expresin de forma correcta,
de manera que podamos decir lo que deseamos y que nuestro mensaje
sea decodificado de acuerdo con nuestra intencin.
En relacin con esto ltimo debemos recordar que el video es un medio de
comunicacin, y por lo tanto rene las condiciones necesarias para poder
establecer por medio de l un proceso de comunicacin fundamentalmente
grupal y en menor medida personal.
El video como medio de investigacin
El video rene unas condiciones que le hacen ser un buen auxiliar para la
investigacin, tanto para los estudiosos de la educacin, profesores, investigadores, etc., como para los propios alumnos. Por lo que respecta a los primeros, el video permite la grabacin de distintos tipos de situaciones que
tengan que ver con la enseanza y que, posteriormente, se pueda estudiar al
ritmo que se desee. Reuniones de grupos de trabajo, situaciones de clase,
entrevistas, etc., son algunas de las ocasiones en las que el video puede
aportar la posibilidad de observar aspectos que, de otra manera, pueden pasar inadvertidos.
En el caso de los alumnos que tambin es extensible a cualquier tipo de
investigaciones, el video puede proporcionar el soporte ideal para la observacin del desarrollo de procesos de tipo fsico, etc., archivo documental, realizacin de informes y un buen nmero ms de posibilidades que prcticamente est limitado solamente por la imaginacin y creatividad de los usuarios.
Otros usos del video
Evidentemente, existen otros usos del video en el aula, entre los cuales
podemos destacar su utilizacin como medio de entretenimiento, o como recursos para la formacin permanente del profesorado, para la comunicacin
universidad-padres, como medio de investigacin, entre otros.
Desde este punto de vista, los usos que resultan bsicos para los profesores pueden ser:

142

SERIE: APRENDER A INVESTIGAR

a. En la formacin del profesorado, actuando como instrumento de anlisis


en diversas tcnicas, como microenseanza, y tambin en la familiarizacin de los profesores respecto a dicho medio.
b. En la investigacin didctica, como instrumento de anlisis de las interacciones profesor-alumno, de las conductas de los alumnos, de la actuacin
de los profesores... Tambin constituye un campo de investigacin en este
terreno la investigacin sobre diseo y elaboracin de materiales didcticos
en video.
Todos los posibles usos descritos casi nunca podremos aislarlos totalmente en la prctica educativa; as por ejemplo, la formacin del profesorado
no puede desligarse del componente de medio de investigacin que el video
desarrolla.
Ventajas del video como ayuda didctica
Permite mostrar situaciones histricas, presentes y futuras.
Se pueden repetir acciones.
Se pueden integrar imagen, color y sonido.
Permite adecuar parte de un tema en imgenes que se puedan proyectar.
Mantiene la atencin del estudiante, si el tema es motivador.
Posibilita la reflexin en grupo sobre el tema proyectado.
Se pueden realizar anlisis parciales sobre el tema, suspendiendo la proyeccin cada vez que el profesor o el estudiante lo consideren necesario.
Permite la interactividad en clase.
Puede ser visto en grupos o individualmente.
No requiere oscuridad para su presentacin.
Desventajas del video como ayuda didctica
Slo se debe presentar una idea del tema que se va a tratar.
El desarrollo del tema puede ser muy rpido y no se capta fcilmente.
Si el tema es largo y montono permite que los estudiantes se distraigan.
Propicia los comentarios durante la proyeccin, lo que puede distraer a los
asistentes.
Si el tema no est bien tratado permite el adormilamiento entre los asistentes.

143

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

Errores ms comunes cuando se presenta un video


No conocer el tema del video con anterioridad a la presentacin.
Desconocer su estado fsico (imagen rayada, mal sonido, baches...).
Pretender que un video por s solo sea didctico.
No preguntar a su audiencia si lo ha visto.
No hacerle una introduccin antes de su presentacin.
No analizar al final de la presentacin una evaluacin o conclusiones sobre el tema.
Presentar videos muy largos sin hacer pausas para reflexionar sobre el
tema o hacer declaraciones sobre el mismo.
No adecuar el aula para su presentacin.
Apagar la luz cuando se utiliza un monitor de T.V.
Utilizar un monitor de T.V. pequeo para una audiencia muy grande.
Desconocer el funcionamiento de los equipos: T.V., VHS o Betamax.
Algunas recomendaciones para utilizar el video con fines didcticos
QU NO HACER

QU HACER

1. Seleccionar todo el video slo por


el ttulo.

1. Ver el contenido del video y analizarlo


para ver si es apropiado al tema
que queremos complementar.

2. Presentar un video sin conocer su


contenido y su estado fsico, sonido, imagen.

2. Revisar muy bien el material seleccionado antes de presentarlo.

3. Proyectar un video sin hacer antes una presentacin del tema.

3. Hacer una presentacin del tema


y explicar qu se pretende con el
video.

4. Presentar un video sin preguntar


a los participantes si ya conocen
su contenido.

4. Debemos interrogar a los participantes si ya conocen el video,


para no repetirlo o hacer otro enfoque sobre el mismo.

5. Presentar videos muy largos sin


hacer una pausa.

5. Hacer una pausa para evitar la fatiga, hacer preguntas o aclaraciones sobre el tema si es del caso.

144

SERIE: APRENDER A INVESTIGAR

6. Presentar videos en idiomas extranjeros,

6. Debemos preguntar si el idioma


del video es comprensible para
todos.

7. Seleccionar el video como nico


medio de apoyo a un curso.

7. Debemos combinar medios en


nuestros cursos.

8. Utilizar un monitor de T.V. pequeo para audiencias numerosas.

8. Seleccionar el tamao del monitor de T.V. de acuerdo con el nmero de la audiencia.

9. Oscurecer el aula cuando se


est utilizando un monitor de T.V.

9. Se debe dejar la luz prendida,


esto permite observar la reaccin
de la audiencia ante el video.

10. Terminar la presentacin sin hacer conclusiones o preguntas sobre el video.

10. Al terminar de ver un video se deben hacer preguntas, aclaraciones, verificar si se cumpli el objetivo propuesto.

Bibliografa
MARTNEZ SNCHEZ, Francisco. La educacin ante las nuevas tecnologas de la
Educacin: Configuracin de los videos didcticos. Anales de la Pedagoga N 8,
1990, pgs. 159-180.
COLOM CAELLAS, Antonio J., SUREDA NEGRE, Jaume, SALINAS IBEZ, Jess.
Tecnologas y medios didcticos. De Cincel S.A., Madrid, 1988.

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

145

2. VIDEOS
2.1 VIDEO: LA MEDICIN Y LAS CIENCIAS
Introduccin
El propsito de este video es mostrar qu es la medicin, sus diferentes procesos para recolectar la informacin.
El material audiovisual cumple la funcin de complemento o refuerzo al
material escrito, est concebido como un material autoinstructivo elaborado
como imgenes sencillas y de una forma coloquial.
La informacin consignada en cada uno de los videos es autosuficiente,
es decir, que en forma independiente comunica una informacin completa
sobre un determinado tema. Sin embargo, no debe perder de vista que cada
uno de ellos es parte integrante de una unidad global que es todo el curso.
Para complementar el Mdulo 4, Anlisis de la informacin, se ha elaborado el video La medicin y las ciencias, el cual le dar una visin panormica y al mismo tiempo ser un complemento al tema que usted ha estudiado.
Recomendaciones
Antes de ver este video le recomendamos haber estudiado el Mdulo 4,
Anlisis de la informacin, y estar familiarizado con las tcnicas bsicas para
recolectar la informacin,
Recuerde que el ideo es una ayuda complementaria, que pretende reforzar el contenido que usted ya estudio, adems debe tener en cuenta:

Para ver el video utilice un monitor de televisin adecuado, mnimo de 14.

No oscurezca la sala en donde vea el video, as no se fatigar.

Recuerde llevar papel y lpiz para que tome nota.

Es conveniente que sepa manipular el control remoto del VHS o Betamax


para que pueda adelantar o retroceder en las ideas que no le sean claras.

Despus de ver el video debe realizar la Autoevaluacin que aparece a


continuacin del guin de contenido. Si ve el video con otros compaeros
podr realizar despus una mesa redonda para discutir las respuestas, lo
que lo har ms interesante y as los aportes que hagan los participantes
sern valiosos.

146

SERIE: APRENDER A INVESTIGAR

Guin de contenido del video


LA MEDICIN Y LAS CIENCIAS
Los investigadores disponen hoy de instrumentos muy precisos para medir magnitudes de espacio, de tiempo, de intensidad, no slo en nuestro mundo cercano sino en el espacio sideral.
Estos adelantos tcnicos son el resultado de un proceso tan largo como la
presencia humana sobre la Tierra, tan antiguo como su necesidad de enumerar, de contar, de medir las cosas, los animales, los seres diversos que compartan con l su pequeo mundo circundante. Para numerar cosas o para
medir longitudes, lo ms obvio era recurrir al propio cuerpo, utilizar los dedos,
los brazos, los pies, como unidades de medida; pero al tratarse de longitudes,
los pies de Pedro eran ms largos que los pies de Pablo, y unos y otros ms
largos que los de sus mujeres. Fue preciso entonces escoger arbitrariamente
el pie derecho de Pedro como medida universal para toda la tribu, y como
Pedro no poda concurrir a todos los sitios donde se necesita, se hicieron
rplicas de los pies de Pedro para que todos pudieran utilizarlas.
La fbula anterior puede ser o no ser una resea exacta de la manera como
se inici la historia de las medidas en el mundo, pero fue sta la manera como
se impuso, como consecuencia de la revolucin francesa, el sistema mtrico
decimal para las mediciones en casi todos los rincones del planeta. Aunque el
metro de cien centmetros tiene relacin matemtica como una medida de la
tierra misma, la medida metro es un objeto de platino e iridio que se encuentra
en el museo de Svres cerca de Pars, esa medida tiene la ventaja de que
se le puede tomar rplicas bastante adecuadas, como sta que es el patrn
de longitud para Colombia y reposa en la Universidad Nacional.
Son medidas arbitrarias en su origen, pero aceptadas por el mundo y por
consiguiente convertibles para la mayora de la gente que sabe lo que significa
un metro, un kilogramo, una hora, un ao luz. La investigacin cientfica moderna se hace en una u otra forma, con base en procesos de medicin que
pretenden sealar las caractersticas de los objetos que se investigan; aunque es preciso decir que lo cuantitativo no constituye la parte ms importante
de la investigacin y que incluso en investigaciones relativas a ciencias sociales la medicin tiene sus limitaciones que deben ser comprendidas por el
investigador, para que no aspire a llegar con sus conclusiones ms all de lo
que le permiten los datos. Los procesos de medicin se han desarrollado
ms all en las ciencias naturales y en las llamadas exactas que en las ciencias sociales; pero de todos modos siempre y cuando el investigador tome
las medidas reservas tambin el comportamiento de los seres humanos y
sus actitudes pueden ser medidas, tanto en las ciencias sociales como en las
naturales o en las exactas. Las mediciones que logramos hacer dejan siempre margen al error, porque siempre nos valemos de nuestros sentidos que

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

147

estn sujetos permanentemente a insuficiencias habituales o temporales, y


nuestros instrumentos de medida ms perfectos siempre dejan la posibilidad
abierta para la incertidumbre. Sin embargo, cuando se toman todas las precauciones y se realizan todas las pruebas y contra pruebas necesarias, el
cientfico puede confiar en sus mediciones y quienes recibimos el beneficio
de sus investigaciones tambin podemos aceptar como slidas las bases
sobre las que estn edificadas. Podemos por ejemplo crear hiptesis sobre
comportamiento del mercado de algn producto y establecer si dicho comportamiento puede ser observado en sus consecuencias, si luego nuestros
sentidos y nuestros instrumentos nos dicen que estamos experimentando lo
que preveamos, podemos tener confianza en que nuestra hiptesis era cierta. Lo que s tiene que considerar indispensable el investigador para que el
proceso de medicin tenga su efecto es la clarificacin y clasificacin de los
conceptos que utiliza, de tal manera que haya definiciones que permitan lograr acuerdos acerca de lo que se trata de expresar, o sea, que los otros
entiendan lo que quiere decir aunque no lo compartan.
Hay diversos niveles de medicin ya sea en fsica o en astronoma, en
sociologa o economa, segn las propiedades o caractersticas que estn
siendo medidas; ante todo el nivel nominal que slo sirve para clasificar sin
establecer ninguna otra diferencia entre las unidades o individuos de que se
trata, y los nmeros vienen a desempear medianamente el papel de nombres para distinguir a uno del otro. El nivel ordinal le asigna valores numricos
a los sujetos en tal forma que los valores ms altos corresponden a los individuos que tiene ms de la caracterstica que se est midiendo, con lo que se
diferencia uno del otro, como en el nivel anterior, pero adems introduce la
posibilidad de un orden determinado. Sin embargo, hay por lo menos dos grandes limitaciones: la diferencia entre el individuo que tiene el nmero uno y el
que tiene el nmero dos no es igual a la que existe entre ste y el que tiene el
nmero tres; adems, no existe el cero absoluto y si le ponemos el nmero
cero a alguno de los muecos, sera para significar que tiene menor altura que
el nmero uno, pero no significara ausencia de altura. De esas dos fallas, el
nivel intervalo de medicin soluciona la primera, permite establecer el orden
con intervalos iguales de tal manera que entre 10 y 20 grados hay la misma
diferencia que entre 20 y 30 grados de temperatura; pero tampoco tenemos el
cero absoluto, pues una temperatura de cero grados no significa carencia de
temperatura sino el comienzo de la escala positiva y de la negativa.
Finalmente existe el nivel de razn o radial en la medicin, que incluye las
posibilidades de los otros niveles, pero tambin incluye la del cero absoluto. El
ingreso de las diversas personas se mide en pesos que son iguales para uno
y para otro; por lo tanto, se pueden diferenciar segn reciban ms o menos.
Pero, adems, tienen la posibilidad de un cero absoluto como en el caso de
quien est desempleado y no recibe un solo centavo de ingreso. El investigador deber definir muy bien el nivel de medicin que corresponde al problema

148

SERIE: APRENDER A INVESTIGAR

que desea investigar y el nivel que escoja le estar sealando la tcnica estadstica que debe utilizar para analizar los fenmenos.
Adems de la escogencia adecuada de los niveles de medicin que el
investigador necesita, en cada caso debe tener bien claros los factores que
tomar como constantes y los que tendr como variables. Generalmente se
designan los factores constantes con las primeras letras del alfabeto castellano o del griego, y las variables con las ltimas letras de nuestro alfabeto, a las
que se puede aadir distintivos numricos. Por ltimo, las variables pueden
tomar slo cierto nmero de valores y entonces son variables discretas, como
cuando damos un valor unitario a cada respuesta acertada de un alumno, o
pueden ser variables que tomen un nmero infinito de valores y entonces son
variables continuas como en el sistema mtrico decimal.
Volvamos sobre la posibilidad de error que siempre acecha al investigador
y que es ms preocupante segn sea la necesidad de precisin y el instrumento que utiliza. Los errores pueden obedecer a falla personal, como por
ejemplo: un defecto de la vista en el investigador, o a defectos sistemticos
surgidos de fallas intencionadas o fortuitas de los aparatos de medicin. Y
finalmente se dan los errores aleatorios, que corresponden al mismo proceso
de medicin, ya que por ejemplo: la ms precisa de las balanzas no nos da
siempre la misma medida, aunque es imposible cerrar el paso a toda posibilidad de error. El cientfico tiene que cuidar que su investigacin sea siempre
confiable, vlida y representativa.
La calidad interna radica en la representatividad o capacidad de ser generalizada que tenga la investigacin en los resultados que exhibe. La confiabilidad
de una medicin es la consistencia que muestra al ser realizada varias veces,
o sea se refiere a la ausencia de errores que aparece en pruebas diferentes.
La validez de una medicin es el grado con que sta representa una medida de lo que realmente se quiere medir, o sea de aquello que en etapa anterior
se ha aclarado conceptualmente como objeto de la investigacin o de la medicin especfica; con lo que ya se est diciendo que es ms importante asegurarse de la validez de la medicin que de su confiabilidad. Aunque no es
posible establecer directamente la validez de una medicin, la prctica cientfica ha consagrado varias maneras indirectas, ya sea para mediciones hechas en el campo de las ciencias naturales o exactas, o ya sea en el de las
ciencias sociales.
Por ltimo la representatividad o generalidad de una medicin tiene que
ver con el grado en que sus resultados surgidos a partir de una muestra pueden ser atribuidos a la poblacin general; porque si la medicin no est
bien hecha pierde representatividad as se haya escogido cuidadosamente la
muestra.

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

Autoevaluacin
Apoyndose en el contenido del Mdulo 4 y del video que acaba de ver,
conteste o complete si es del caso las siguientes preguntas:
1. Qu debe considerar el investigador para que el proceso de medicin tenga efecto?
2. Cmo pueden ser los niveles de medicin?
3. Para qu sirve el nivel nominal?
4. Para qu sirve el nivel ordinal?
5. En qu consiste el nivel de razn o radial en la medicin?
6. Qu determina la tcnica estadstica que el investigador debe utilizar para analizar los fenmenos?
7. Qu otros factores debe considerar el investigador adems de la
escogencia de los niveles de medicin?
8. Cmo pueden ser las variables?
9. Qu diferencia hay entre estas variables?
10. A qu puede obedecer la posibilidad de error en la medicin que
realiza el investigador?
11. De qu depende la calidad interna de un proceso de investigacin?
12. En qu radica la calidad externa de los procesos de investigacin?
13. En qu consiste la confiabilidad de una medicin?
14. Qu es la validez de una medicin?

149

Despus de haber realizado la autoevaluacin puede comparar sus respuestas con el guin de contenido.
1. Clarificacin y clasificacin de los conceptos que utiliza, para lograr
acuerdos acerca de lo que se trata de expresar.
2. Nominal, ordinal y el nivel de razn o radial.
3. Para clasificar sin establecer ninguna otra diferencia entre las unidades o individuos de que se trate.
4. Asigna valores numricos y puede introducir la posibilidad de un
orden determinado.
5. Incluye las posibilidades de los otros niveles y la del cero absoluto.
6. El nivel de medicin.
7. Los factores que tomar como constantes y los que tendr como
variables.
8. Discretas y continuas.
9. Las discretas tienen nmero de valores, las continuas tienen un
nmero infinito de valor.
10. A falla personal.
Defectos sistemticos surgidos de fallas intencionadas o fortuitas de los aparatos de medicin.
Errores aleatorios que corresponden al mismo proceso de medicin.
11. De la confiabilidad y validez que tenga la observacin de los datos.
12. En la representabilidad o capacidad de ser generalizada que tenga
la investigacin en los resultados que exhibe.
13. Es la consistencia que muestra al ser realizada varias veces, o sea
a la ausencia de error que aparece en pruebas diferentes.
14. Es el grado con que sta representa una medida de lo que realmente se quiere medir.
Respuestas a la Autoevaluacin
150

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

151

2.2 VIDEO: LA CURVA NORMAL


Introduccin
El propsito de este video es mostrar qu es la curva normal, su comprensin y la aplicacin en el trabajo investigativo.
El material audiovisual cumple la funcin de complemento o refuerzo al
material escrito, est concebido como un material autoinstructivo elaborado
con imgenes sencillas y de una forma coloquial.
La informacin consignada en cada uno de los videos es autosuficiente,
es decir, que en forma independiente comunica una informacin completa
sobre un determinado tema. Sin embargo, no debe perder de vista que cada
uno de ellos es parte integrante de una unidad global que es todo el curso.
Para complementar el Mdulo 4. Anlisis de la informacin, se ha elaborado el video La curva normal, el cual le dar una visin panormica y al
mismo tiempo ser un complemento al tema que usted ha estudiado.
Recomendaciones
Antes de ver este video que tiene una duracin de 15 minutos, le recomendamos haber estudiado el Mdulo 4, conocer en qu consiste el modelo terico de la curva normal y cules son sus mltiples aplicaciones.
Recuerde que el video es una ayuda complementaria, que pretende reforzar el contenido que usted ya estudi; adems tenga en cuenta:

Para ver el video utilice un monitor de televisin adecuado, mnimo de 14.

No oscurezca la sala en donde vea el video, as no se fatigar.

Recuerde llevar papel y lpiz para que tome nota.

Es conveniente que sepa manejar el control remoto del VHS o del Betamax
para que pueda adelantar o retroceder en las ideas que no le sean claras.

Despus de ver el video debe realizar la Autoevaluacin que aparece a


continuacin del guin de contenido. Si ve el video con otros compaeros
podr realizar despus una mesa redonda para discutir las respuestas, lo que
lo har ms interesante y as los aportes que hagan los participantes sern
valiosos.

152

SERIE: APRENDER A INVESTIGAR

Guin de contenido del video


LA CURVA NORMAL
Qu nuevas vas son necesarias para la ciudad? Qu cantidad de provisiones debe almacenar este negocio para atender a sus clientes? En qu
nivel est la calidad de esta deportista? Para responder preguntas como stas es necesario observar y registrar la frecuencia y la forma como ocurren
ciertos hechos a lo largo de un perodo. En el caso de las vas, por ejemplo:
podramos llegar a conocer datos como el promedio de vehculos que transitan durante varios das de la semana; o la clase de vehculos que con ms
frecuencia pasan por all; son buses, camiones o carros particulares, y con
mayor observacin podramos llegar a conocer muchos detalles de la forma
como se comporta el trnsito en esa calle en distintas horas y en diversas
pocas del ao. De la misma manera y con procesos similares de observacin el propietario de este negocio podra calcular las provisiones que debe
almacenar de acuerdo con la forma como se comporta la demanda de sus
clientes segn das, horas y clase de producto.
En el caso del deportista, tambin sera posible registrar las marcas que
logra en su deporte, con el fin de medir sus progresos a lo largo de un entrenamiento o para compararlo con las marcas que logran otros competidores. La
estadstica nos proporciona entonces un conjunto de tcnicas para registrar y
observar el comportamiento de fenmenos variables. Cuando se efectan
mediciones estadsticas se observan diferentes formas en la frecuencia con
que ocurre el fenmeno. Por ejemplo: si examinas el comportamiento del cliente
en esta panadera a lo largo del da, es probable encontrar que las ventas
mximas se localizan en dos perodos, en las primeras horas de la maana y
las ltimas de la tarde. Esta clase de distribuciones se conocen como bimodales. En otro tipo de distribuciones las mayores frecuencias se acumulan a
uno u otro lado de los valores de la variable. Por ejemplo: es probable que las
calificaciones que un profesor oneroso concede a sus alumnos estn representadas por un tipo de curva concreta en la cual se registra que la mayor
parte de estudiantes consiguen buenas notas; en el caso del profesor muy
estricto la distribucin de las frecuencias ser opuesta al caso anterior.
En el caso dos, la curva refleja que slo unos pocos estudiantes consiguen buenas notas, mientras que la mayora slo alcanzan calificaciones malas
o mediocres. Otra clase de distribucin, conocida como distribucin normal,
es aquella en la cual las frecuencias tienden a concentrarse uniformemente
alrededor de un valor central. A esa distribucin se aproxima por ejemplo: los
puntajes que los estudiantes consiguen en exmenes como las pruebas del
ICFES, o los de ingreso a la universidad; en ese caso la mayor parte de estudiantes se concentra en los puntajes intermedios de la escala, mientras que
un grupo menor consigue los puntajes mximos y otros resultantes se ubican
en los mnimos.

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

153

A partir del concepto de distribucin normal, la ciencia de la estadstica ha


desarrollado un modelo terico de importantes y mltiples aplicaciones. Este
modelo se conoce como curva normal y no es otra cosa que una representacin grfica y matemtica de aquellos fenmenos que bajo ciertas condiciones pueden considerarse como normalmente distribuidos. En su origen la
curva normal surge como representacin de la frecuencia de eventos que
ocurren al azar, y por lo tanto como parte de la teora de la probabilidad. En
efecto, al tomar estas ocho monedas podemos preguntarnos con qu frecuencia relativa saldrn caras si las lanzramos un gran nmero de veces. Lo
primero que responde la teora de probabilidad es que en la mayor parte de los
casos saldrn cuatro caras, del mismo modo podremos suponer que en el
menor nmero de veces saldrn solamente caras y que en un nmero de
veces igualmente menor no saldrn caras. El histograma completo de frecuencias relativas para el caso propuesto tendr finalmente esta distribucin,
y si en vez de ocho lanzramos diecisis monedas aumentara el nmero de
las barras dentro del histograma y cada vez se identificara mejor el perfil de la
curva y de la distribucin normal. De esta manera la curva normal representa
en su origen la frecuencia con que ocurren fenmenos regidos por el azar,
sobre los cuales operan multitud de factores independientes. De la misma
forma que podemos encontrar crculos de diferente dimetro sin que por ello
pierdan su carcter de crculos, es posible tambin encontrar curvas cercanas a la normal, pero con diferentes configuraciones. Por ejemplo: estas dos
curvas registran el mismo valor como promedio pero su amplitud vara porque
es distinta a su desviacin estndar.
Estas dos curvas registran promedios diferentes pero sus desviaciones
estndar son iguales.
En estas dos curvas los promedios y las desviaciones estndar son diferentes.
Sin embargo la familia de las curvas normales cumplen las siguientes
caractersticas: en primer lugar toda curva normal es simtrica, es decir que
la mitad de su lado izquierdo es igual a la mitad del lado derecho, igualmente
la distribucin que representa la curva normal es unimodal a tal punto que
promedio, mediana, y moda tienen todos el mismo valor.
De otra parte, y a diferencia de un polgono de frecuencia, la curva normal
es continua, y por lo tanto slo registra en rigor valores de variables que sean
continuas.
Otra caracterstica comn es que la curva normal es asinttica, es decir,
que no toca el eje de las x y que por lo tanto ocupar un nmero infinito de
observaciones; si bien es cierto que en las ciencias sociales las mediciones
no son continuas ni el nmero de observaciones es infinito, la utilidad prctica
de la curva normal es su valor como modelo estadstico y matemtico.

154

SERIE: APRENDER A INVESTIGAR

La curva normal es un instrumento que ayuda a organizar, describir y predecir el comportamiento de fenmenos que en su distribucin se aproximan a
la distribucin normal. As por ejemplo, y tomando la curva normal como modelo, podran estimarse el porcentaje de colombianos adultos cuya estatura
vara entre 1.60 metros y 1.80 metros y el porcentaje de aquellos que miden
menos de 1.60 metros o ms de 1.80 metros.
Otra forma en que la Curva Normal acta como modelo de suma importancia es en la llamada Distribucin de Muestreo. En efecto, si obtenemos
una gran cantidad de muestras aleatorias de un universo dado, el valor de los
promedios y de otras estadstica de esas muestras tienden a conformar una
distribucin normal. A modo de ejemplo veamos este caso: los valores 1, 2 y
3 conforman nuestro universo. De ese universo vamos a obtener todas las
posibles muestras de dos elementos. He aqu la primera muestra, el promedio de esa muestra es uno y lo anotamos en una tabla de frecuencia. Ahora
vamos a repetir el procedimiento con las otras posibles muestras, es decir,
tomamos los valores de la muestra y consignamos en la tabla el valor de su
promedio, he aqu el resultado final, los promedios de las diferentes muestras
tienen una distribucin muy cerca a la normal. Si el universo fuera mayor y las
muestras ms grandes el perfil de la curva normal sera ms notable. Hay otro
hecho en extremo interesante y es que el valor promedio de la distribucin de
estos promedios coinciden con el valor promedio del universo original. Este
carcter normal de la distribucin de muestreo es de gran importancia para
realizar inferencias ya que permite al investigador calcular la probabilidad de
que el valor de una estadstica obtenida en una muestra, coincida con el valor
del parmetro de la poblacin o universo. Como modelo terico, la curva normal tiene en sntesis las siguientes caractersticas: como sabemos es una
distribucin simtrica y asinttica que no toca el eje horizontal y se extiende
indefinidamente; el rea total debajo de la curva puede representar el nmero
total de elementos de la poblacin o universo, es decir, constituye el 100% de
los casos; esta propiedad permite que entre dos puntajes a lo largo del eje
horizontal sea posible determinar la proporcin de la frecuencia entre dos
puntajes; proporcin que ser igual al rea de la curva entre esos dos puntos.
Cuando se normaliza una distribucin, el medio aritmtico, la mediana y la
moda son iguales a cero; por lo tanto, los valores al lado izquierdo del eje
horizontal son negativos mientras que los valores del lado derecho son positivos.
La desviacin estndar en una desviacin normalizada es igual a uno, el
68.26% de los valores de la distribucin se localizan bajo el rea determinada
por una desviacin estndar a cada lado del medio aritmtico. Del mismo
modo el 95.46% de los valores se localizan entre extremos de dos desviaciones a lado y lado del medio. El 99% de los valores se agrupan bajo el rea que
determinan tres desviaciones estndar a lado y lado del mismo medio. La
comprensin y aplicacin de la curva normal es una exigencia en el trabajo
investigativo, particularmente cuando se desea hacer inferencias a partir de

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

155

una muestra. La curva es un modelo, es una abstraccin; para aplicarla con


acierto se requiere su exacta comprensin como instrumento estadstico; lo
mismo que el conocimiento preciso de la ndole y caractersticas de la investigacin para la cual se aplique.

Autoevaluacin
Apoyndose en el contenido del Mdulo 4, y en el video que acaba de ver
conteste o complete si es del caso las siguientes preguntas:
1. Qu es la distribucin normal?
2. Qu es la curva normal?
3. Por qu surge la curva normal?
4. Cuales son las caractersticas que deben cumplir la familia de las
curvas normales?
5. Qu es una curva normal asinttica?
6. Cul es la utilidad prctica de la curva normal?
7. Como modelo estadstico y matemtico la curva normal es un instrumento que ayuda a...
8. Qu es distribucin de muestreo?
9. Qu caractersticas tiene la curva normal como modelo terico?
10. Cuando se normaliza una distribucin, la media aritmtica, la mediana y la moda son igual a....
11. A qu es igual la sesviacin estndar de una distribucin normalizada?
12. Qu se necesita para aplicar la curva normal con acierto?

Despus de haber contestado las preguntas puedes comparar sus respuestas con el guin de contenido.
1. Es aquella en la cual las frecuencias tienden a concentrarse uniformemente alrededor de un valor central.
2. Es una representacin grfica y matemtica de aquellos fenmenos que bajo ciertas condiciones pueden considerarse como normalmente distribuidos.
3. Como representacin de la frecuencia de eventos que ocurren al
azar y por lo tanto como parte de la teora de la probabilidad.
4. Toda curva normal es simtrica.
La distribucin que representa la curva normal es la unimodal.
La curva normal es continua.
La curva normal es asinttica.
5. Es la que no toca el eje de la X y por lo tanto ocupar un nmero
infinito de observaciones.
6. Es su valor como modelo estadstico y matemtico.
7. Organizar, describir y predecir el comportamiento de fenmenos
que en su distribucin se aproximan a la distribucin normal.
8. Cuando la curva normal acta como modelo se obtiene una gran
cantidad de muestras aleatorias de un universo dado y el valor de
los promedios y de otras estadsticas tiende a conformar una distribucin de muestreo.
9. Es una distribucin simtrica y asinttica que no toca el eje horizontal y se extiende independientemente.
El rea total debajo de la curva normal puede representar el nmero total de elementos de la poblacin urbana.
10. Cero
11. A uno
12. Su exacta comprensin como instrumento estadstico, lo mismo
que el conocimiento preciso de la ndole y caractersticas de la investigacin para la cual se aplica.
Respuestas a la Autoevaluacin
156

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

157

2.3 VIDEO: LA MUESTRA


Introduccin
El propsito de este video es mostrar qu es la muestra, cundo utilizar una muestra, qu obtiene el investigador a travs de la muestra.
El material audiovisual cumple la funcin de complemento o refuerzo al
material escrito, est concebido como un material autoinstructivo elaborado
con imgenes sencillas y de una forma coloquial.
La informacin consignada en cada uno de los videos es autosuficiente,
es decir, que en forma independiente comunica una informacin completa
sobre un determinado tema. Sin embargo, no debe perder de vista que cada
uno de ellos es parte integrante de una unidad global que es todo el curso.
Para complementar el Mdulo 4. Anlisis de la informacin, se ha elaborado el video: La muestra, el cual le dar una visin panormica y al
mismo tiempo ser un complemento al tema que usted ha estudiado.
Recomendaciones
Antes de ver este video que tiene una duracin de 15 minutos, le recomendamos haber estudiado el Mdulo 4, conocer qu es la muestra, cmo se
utiliza, para qu sirve, cmo se determina sta. Recuerde que el video es una
ayuda complementaria, que pretende reforzar el contenido que usted ya estudi. Adems tenga en cuenta:

Para ver el video utilice un monitor de televisin adecuado, mnimo de 14.

No oscurezca la sala en donde vea el video, as no se fatigar.

Recuerde llevar el papel y lpiz para que tome nota.

Es conveniente que sepa manejar el control remoto del VHS o del Betamax
para que pueda adelantar o retroceder en las ideas que no le sean claras.

Despus de ver el video debe realizar la Autoevaluacin que aparece a


continuacin del guin de contenido. Si ve el video con otros compaeros
podr realizar despus una mesa redonda para discutir las respuestas, lo que
lo har ms interesante y as los aportes que hagan los participantes sern
valiosos.

158

SERIE: APRENDER A INVESTIGAR

Guin de contenido del video


LA MUESTRA
Muchas afirmaciones sobre caractersticas de las personas de una regin
o sobre las que tienen una misma profesin u oficio, o sobre caractersticas
de las personas segn su edad o sexo son ejemplo de generalizaciones, hechas a partir de la observacin de apenas unos casos. Eso quiere decir que
en la vida cotidiana deducimos que una poblacin tiene cierta caracterstica
por el hecho de haberla observado en una muestra de esa poblacin.
Todos generalizamos pero todos sabemos que esas generalizaciones no
son cientficamente ciertas; sin embargo, la ciencia tambin hace generalizaciones a partir de la observacin de un nmero limitado de casos. La diferencia est en que la ciencia sigue rigurosos mtodos para garantizar la validez
de sus generalizaciones. En efecto, el trabajo del investigador cientfico es
encontrar leyes, relaciones, comportamientos y otras caractersticas que permitan conocer mejor, bien sea el mundo de los fenmenos naturales o bien el
mundo de los fenmenos humanos y sociales. En este proceso son muchas
y diversas las preguntas que motivan un trabajo de investigacin. Por ejemplo: cuntos desempleados tiene el pas? o cmo puede controlarse la roya
de los cafetos?, o de qu manera influye el nivel educacional de los padres
en el desarrollo fsico y mental de sus hijos? En casos como estos los
desempleados o los cafetos o los padres de familia constituyen la poblacin o
universo objeto de cada investigacin. Pero ante la imposibilidad de que el
investigador examine a cada individuo de su universo o poblacin sean desempleados, o cafetos, o padres de familia o cualquier otro conglomerado, se
hace indispensable que tan solo observe una muestra tomada de la poblacin
o universo objeto de su estudio y que a partir de esa muestra pueda generalizar vlidamente para todos los casos. As pues, podemos decir que cuando el
investigador desea conocer una caracterstica de una poblacin o universo su
trabajo se orienta en primer lugar a observar esa caracterstica en una muestra tomada de esa poblacin o universo, los valores que el investigador mide
en la muestra se conocen como estadstica y los valores que corresponden a
la poblacin o universo se conocen como parmetros. As por ejemplo puede
ocurrir que en una muestra encontremos un 10% de desempleo. Ese valor
sera la estadstica, pero es posible que el valor real del desempleo en la ciudad en la cual se tom la muestra al contabilizar absolutamente todos los
casos sea un 12%, esta cifra entonces sera el parmetro. Podemos decir
entonces que el investigador obtiene estadsticas de la muestra para inferir
parmetros de la poblacin o universo. En este proceso de inferencia cientfica, el investigador debe cumplir varias y rigurosas exigencias; debe en primer
lugar garantizar que su muestra sea representativa del universo, es decir, que
la muestra reproduce las distribuciones y valores del universo o poblaciones
con mrgenes de error calculables. La representatividad de la muestra depende de varios factores; uno de ellos es la identificacin del universo de don-

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

159

de va a sacar la muestra, esta identificacin del universo o marco de muestreo


no siempre es sencilla; hay algunas dificultades inherentes, la primera es la
posibilidad de delimitar un universo, por el hecho de que todo universo es un
organismo vivo que se expande, que crece y es dinmico; tomemos el caso
de la poblacin de una ciudad o el nmero de carros que hay en la ciudad, o el
nmero de maestros que hay en una nacin, esos universos estn permanentemente creciendo y por lo tanto es muy difcil dar una delimitacin precisa
en un momento preciso; en segundo lugar existe una segunda clase de limitaciones que tiene que ver con el tipo de objeto social sobre el cual se va a hacer
la muestra.
Hay objetos sociales que de por s son distintamente definidos como por
ejemplo: el nmero de alcohlicos que hay en una ciudad o el nmero de
vagabundos, etc., en esos casos evidentemente no hay manera de precisar
el universo; hay una tercera clase de delimitaciones que tienen que ver con
las posibilidades tecnolgicas al servicio de una investigacin, para poder
delimitar ese universo en objetos que estn ya centralizados, que tienen registros pblicos, por ejemplo el problema no es tanto el dato ni la clase de
dato, sino el control y la sofisticacin que existe en cuanto a la informacin
para ese tipo de datos. Otro factor influyente en la representatividad de la
muestra es el diseo muestral. Disear una muestra es buscar que cada
componente de un universo tenga la posibilidad de estar incluido en la muestra y que se pueda calcular la posibilidad que cada elemento tenga de estar en
la muestra.
Las muestras aleatorias o probabilsticas son de varias clases y exigen
diferentes procedimientos de seleccin; sin embargo no son las nicas que
se utilizan en la investigacin porque tambin existen muestras no probabilsticas. Las muestras no probabilsticas o intencionales se justifican particularmente en etapas exploratorias de la investigacin o para finar instrumentos de redaccin de datos o para estudios en profundidad.
Este es un caso: la muestra no probabilstica se elabora siempre sin tener
en cuenta los procedimientos estadsticos de muestreo, es aquella donde no
se conoce el universo y es muy difcil, por lo tanto, determinar una muestra, y
donde los elementos de la muestra tienen no todas las mismas posibilidades
de ser escogidas para el estudio. Vamos a poner un ejemplo muy claro que es
la forma de explicarlo. En investigacin tenemos una forma de conseguir informacin llamada bola de nieve. La podemos aplicar a una investigacin en
pintura. Por ejemplo: queremos investigar a los pintores en Colombia, nicamente conocemos un pintor y no conocemos a los dems, por lo tanto no
conocemos ni el universo ni la muestra. Vamos donde este pintor que conocemos y hacemos la entrevista, al final de la entrevista le preguntamos por
dos pintores similares a l en el grupo que nos interesa. Para hacerle la entrevista vamos donde esta gente, los entrevistamos y al final les preguntamos
tambin si conocen otros dos pintores, cada uno de ellos. En esta forma va-

160

SERIE: APRENDER A INVESTIGAR

mos ampliando el grupo de gente que estamos necesitando y la bola de nieve


va creciendo. Ya no tenemos solamente uno, tenemos seis y eso se va ampliando. Cada persona nos va dando dos nombres ms y en esta forma vamos creando un universo de donde podemos sacar una muestra que la vamos creando. Inicialmente en este caso sera la muestra primero y el universo
despus, pero nicamente debe ser utilizada la muestra no probabilstica en
aquellos casos en que no exista conocimiento sobre el universo y por lo tanto
la dificultad para conseguir una muestra sea muy grande.
En resumen el investigador define con la mayor claridad posible el universo de su estudio, que las amas de casa, que los miembros de partidos polticos, que los de un servicio pblico, etc., ahora el investigador obtiene muestras unas veces aleatorias y otras intencionales de la poblacin o universo
que desea estudiar, pero ojo, que sean muestras representativas.
El investigador hace sus observaciones y mediciones sobre la muestra,
de esa manera obtiene estadsticas o sea valores como frecuencias, promedios y otros que le sirven para conocer el comportamiento de la muestra de
las variables que est investigando. Finalmente y mediante procesos estadsticos el investigador puede, con margen de errores calculables, generalizar a
la poblacin o universo las observaciones hechas a la muestra; de modo general eso es as; pero hay unos pasos de anlisis de datos y comprobacin de
hiptesis muy rigurosos. Medir algo en la muestra y generalizar a la poblacin
es lo que se conoce como inferencia, es decir, que una estadstica nos permite hallar un parmetro.
Para definir el tamao de la muestra hay que considerar algunos aspectos, unos de orden prctico y otros de orden terico. En el orden prctico y
para definir su muestra busca orientaciones en otros estudios similares e
igualmente examina los recursos econmicos con que cuenta, el tiempo de
que dispone. Desde el punto de vista terico, el investigador determina su
muestra principalmente de acuerdo con los objetivos de su estudio e igualmente se sirve de las frmulas que las estadsticas proporcionan para calcular tamao de muestra. Cmo influyen estos factores prcticos y tericos
para que un investigador determine el tamao de su muestra?
Un factor importante es la naturaleza del estudio o sea qu tipo de investigacin se est realizando, de qu tipo de investigacin se trata. Pongamos
algunos ejemplos:
En primer lugar es muy importante la naturaleza del estudio, es decir, qu
tipo de investigacin se est realizando, en qu tipo de disciplina y cuales son
los objetivos precisos de la investigacin para el momento en que el investigador selecciona o determina la muestra. En segundo lugar hay dos factores
tambin muy importantes, el factor econmico y el factor tiempo que ya el

MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

161

investigador debe haber tenido en cuenta desde el momento en que inici su


investigacin. La complejidad de una muestra por ejemplo hace que aumente
el precio de una investigacin o los costos de una investigacin. Por otra parte, tambin se puede racionalizar adecuadamente el tiempo si se han hecho
estudios previos sobre lo que es la muestra. Tambin debe tenerse en cuenta
el tipo de procesamiento de la informacin que se va a hacer, y por otra parte
la forma como se va a hacer la recoleccin de informacin. Una tercera caracterstica importante es la tradicin que otros investigadores han construido
con relacin al tipo de muestra que han utilizado, para investigaciones o estudios similares, finalmente la estadstica y la teora del muestreo han proporcionado herramientas muy valiosas a los investigadores de diferentes disciplinas para la adecuada toma de decisiones, en el momento de determinacin
de la muestra.
La precisin de los resultados no slo depende del tamao de las muestras, si hay errores de recoleccin, una muestra grande podra ser mala, mientas que una muestra pequea con cuidadosa recoleccin y seleccin podra
ser excelente.
Una muestra grande no es suficiente para garantizar la precisin de los
resultados.
Para determinar una muestra no basta con saber frmulas matemticas
que nos permitan encontrar su tamao, depende en primer lugar de la precisin con que est definido el universo de la investigacin, de la claridad que el
investigador tenga sobre los objetivos y de su estudio, la recoleccin y procesamiento cuidados de los datos. De esta forma la claridad conceptual y rigor
metodolgico son la garanta necesaria para que finalmente las tcnicas estadsticas permitan inferir resultados a partir de una muestra.

162

SERIE: APRENDER A INVESTIGAR

Autoevaluacin
Apoyndose en el contenido del Mdulo 4, y en el video que acaba de ver
conteste o complete si es del caso las siguientes preguntas:
1. Qu es una muestra?
2. En qu se diferencian las generalizaciones que hace la ciencia
con respecto a las generalizaciones que no son cientficamente
ciertas?
3. Cmo se llaman los valores que el investigador mide en la muestra?
4. Con qu nombre se conocen los valores que corresponden a la
poblacin o universo?
5. De qu depende la representatividad de la muestra?
6. Qu es disear una muestra?
7. Qu tipos de muestras se utilizan en la investigacin?
8. Cundo se utilizan las muestras no probabilsticas o intencionales?
9

Qu es la muestra no probabilstica?

10. El investigador hace sus observaciones y mediciones sobre...


11. Qu obtiene el investigador a travs de la muestra?
12. ,Qu es inferencia?
13. Cmo se define el tamao de la muestra?
14. Para determinar una muestra qu debe tener en cuenta un investigador?
15. Qu constituye la garanta necesaria para que finalmente las tcnicas estadsticas permitan resultados a partir de una muestra?

1. Son las generalizaciones hechas a partir de la observacin de apenas unos casos.


2. En que la ciencia sigue rigurosos mtodos para garantizar la validez de sus generalizaciones.
3. Estadsticos.
4. Parmetros.
5. De la identificacin del universo de donde se va a sacar la muestra.
6. Es buscar que cada componente de un universo tenga la posibilidad de estar incluido en la muestra y que se pueda calcular la posibilidad que cada elemento tenga de estar en la muestra.
7. <->Muestras aleatorias o probabilsticas
<->Muestras no probabilsticas o intencionales
8. Se justifican particularmente en etapas exploratorias de la investigacin o para afinar instrumentos de redaccin de datos o para estudios en profundidad.
9. Es aquella donde no se conoce el universo y es muy difcil por lo
tanto determina una muestra y donde los elementos de la muestra
no tienen todos la misma posibilidad de ser escogidos para el estudio.
10. La muestra
11. Obtiene estadstica, o sea valores como frecuencias, promedios y
otros que le sirven para conocer el comportamiento de la muestra
de las variables que est investigando.
12. Es medir algo en la muestra y generalizar a la poblacin.
13. Se debe buscar orientacin en otros estudios similares, examinar
los recursos econmicos con que se cuenta, el tiempo de que se
dispone, lo anterior desde el punto de vista prctico; y desde el punto de vista terico el investigador determina su muestra principalmente de acuerdo a los objetivos de su estudio e igualmente se
sirve de las frmulas que la estadstica proporciona para calcular
tamaos de muestra.
Respuestas a la Autoevaluacin
MDULO 4: ANLISIS
INSTRUCTIVO
PARA EL
DE
USO
LA INFORMACIN
DEL VIDEO

163

Despus de haber contestado las preguntas puedes comparar sus respuestas con el guin de contenido.
14. La precisin con que est definido el universo de la investigacin.
La claridad que el investigador tenga sobre los objetivos y variables de su estudio.
La recoleccin y procesamiento cuidadoso de los datos.
15. La claridad conceptual y rigor metodolgico.

164

SERIE: APRENDER A INVESTIGAR

MDULO 4: ANLISIS DE LA INFORMACIN

165

Bibliografa
BERENSON, Mark. Estadstica bsica en administracin. Conceptos y aplicaciones .
1992.
BRIONES, G. Mtodos y tcnicas de investigacin para las ciencias sociales. Mxico,
Trillas, 1982.
CARVAJAL, Lizardo. Metodologa de la investigacin. Sptima edicin. Cali, FAID, 1991.
CEBALLOS ROJAS, Argemiro. Estadstica descriptiva y probabilidad bsica. 1994.
GODINO, J. y otros. Azar y probabilidad. Fundamentos didcticos y propuestas
curriculares. Sntesis, 1991.
GONZLEZ REYNA, Susana. Manual de redaccin e investigacin documental. Segunda edicin, Mxico, Trillas, 1994.
HARNETT y MURPHY. Introduccin al anlisis estadstico. Addison-Wesley Iberoamericana, 1993.
HOPKINS, Kenneth. Estadstica bsica para las ciencias sociales y el comportamiento. 1997.
KREYSZIG, Erwin. Estadstica matemtica. Limusa. 1983.
MASON, Robert; LIND Douglas. Estadstica para administracin y economa. 8a edicin. Santa Fe de Bogot, Alfaomega Grupo Editor S.A. de C.V., 1998.
MENDENHALL, William. Introduccin a la probabilidad y a la estadstica. Grupo Editorial Iberoamericana, 1991.
MENDENHALL, William; WACKERLY, Dennis; SCHEAFFER, Richard. Estadstica
matemtica con aplicaciones. Mxico, Grupo Editorial Iberoamericana, 1994.
MENDENHALL, SCHEAFFER y WACKERLY. Estadstica matemtica con aplicaciones. Grupo Editorial Iberoamericana, 1986.

166

SERIE: APRENDER A INVESTIGAR

MONTGOMERY, Douglas C. Diseo y anlisis de instrumentos. Grupos Editorial Iberoamericana, 1991.


MONTGOMERY, Douglas C. Control estadstico de la calidad. Grupo Editorial Iberoamericana, 1991.
PARZEN, ENMANUEL. Teora moderna de probabilidades y sus aplicaciones. Mxico,
Limusa, 1991.
PEA SNCHEZ DE RIVERA, Daniel. Estadstica, modelos y mtodos. Tomo I y Tomo
II. Alianza Editores, 1990.
SCHEAFFER, MENDENHALL, OTT. Elementos de muestreo. Grupo Editorial Iberoamericana, 1987.
SCHEAFFER y McCLAVE. Probabilidad y estadstica para ingeniera, Grupo Editorial
Iberoamericana, 1993.
SUREZ DE LA CRUZ, Alberto Camilo. Metodologa para el estudio y la investigacin.
Cuarta edicin, Bogot, Ediciones Ciencias y Derecha, 1991.

También podría gustarte