Está en la página 1de 132

CON SPSS

Este libro constituye un material de fcil comprensin de la estadstica en la


investigacin cientfica orientada al campo educativo.

Gasto promedio mensual (s/.)
700,0
600,0
500,0
400,0
300,0
200,0
100,0
10
8
6
4
2
0
Std. Dev = 132,31
Mean = 428,7
N = 20,00

2009
UNIVERSIDAD NACIONAL DE HUANCAVELICA


CERAPIO QUINTANILLA CNDOR
ADOLFO CORTAVARRIA LINARES
ii





























iii






ESTADSTICA APLICADA A LA
INVESTIGACIN CIENTFICA
CON SPSS



iv




ESTADSTICA APLICADA A LA
INVESTIGACIN CIENTFICA

Diseo y produccin Cerapio Quintanilla C.
Portada Kenny Quintanilla R.


D.R. 2009 Coleccin Shara.
Ninguna parte de este material electrnico puede ser comercializada, tampoco
reproducida sin el permiso escrito a los autores. El uso de este material es exclusivo
para fines acadmicos y cientficos que deber ser citado

ISBN Versin electrnica.
Elaborado en Per



Escuela de Post Grado
Universidad Nacional de Huancavelica.

Coleccin Shara



v

INDICE
NOTA PRELIMINAR
vii


CAPITULO I

1. CONCEPTOS BSICOS DE LA ESTADSTICA
1
Breve resean histrica de la Estadstica.
1
Objetivos de la Estadstica.
2
Poblacin
2
Variables
3
Muestra
5
Clasificacin de la informacin.
7
Presentacin de informacin
14
Diagrama de hojas y tallos
27
Diagrama de cajas.
28
Ejercicios.
29


CAPITULO II



2. MEDIDAS DE TENDENCIA CENTRAL Y DE
POSICIN
35
Medidas de posicin.
35
Media Aritmtica.
35
Mediana.
37
Moda.
39
Medidas de Dispersin
43
Varianza.
43
Desviacin estndar
46
Coeficiente de variacin.
46
Ejercicios.
48
CAPITULO III



3. DOCIMASIA DE HIPTESIS.
51
Hiptesis Estadstica.
51
Hiptesis Nula y Hiptesis Alterna.
52
Prueba de una hiptesis estadstica.
53
Pruebas de Hiptesis Paramtricas.
54
Pruebas de Hiptesis con la Distribucin Z
54
Pruebas de hiptesis t- student.
58
Prueba de Hiptesis para la diferencia de proporciones.
63
Ejercicios.
65
Coeficiente de Correlacin y Regresin Lineal.
67

vi

Diagramas de Dispersin.
67
Regresin Lineal.
68
Correlacin.
70
Ejercicios.
80
Pruebas de Hiptesis No Paramtrica
82
Pruebas de Hiptesis con Chi Cuadrada.
82
Prueba de Hiptesis de Wilcoxon.
89
Prueba de Hiptesis con U de Mann Whitney.
96
Prueba de Hiptesis de Kruskal Wallis.
103
Prueba de Hiptesis de Friedman
108
Ejercicios.
114
CASOS DE ANALISIS ESTADSTICO
118
BIBLIOGRAFIA.
119
TABLAS.
120


vii



NOTA PRELIMINAR

Este material fue inspirado por los alumnos de Matemtica quienes en buscar lo
accesible para su comprensin de la Estadstica propusieron su elaboracin. Porque hoy
en da, la estadstica es imprescindible en toda las ciencias de la naturaleza (fsica,
qumica, biologa, ingeniera y otras rea afines) como en las ciencias humanas
(economa, psicologa, sociologa, educacin, etc.) y cobra un papel de importancia cada
vez mayor. En el campo educativo no es ajeno a este fenmeno, ms que nada en las
investigaciones cuantitativas, as como en la toma de decisiones de los resultados que se
obtienen en el quehacer educativo.
Por otra parte, en nuestro medio existen publicaciones referentes al desarrollo de la
estadstica descriptiva e inferencial, utilizando mtodos tradicionales hasta el uso de la
tecnologa (el uso de sofisticados software estadstico). Sin embargo, stas no presentan
una aplicacin con ejemplos didcticos y el uso del software. Es por ello, los autores
comprometidos con el quehacer educativo y la investigacin educativa ponemos a los
interesados el material sin perder la rigurosidad haciendo uso del software estadstico
Statistical Package for the Social Science (SPSS), presentando ejemplos aplicativos al
campo educativo y a la investigacin educacional, desarrollados manualmente y
contrastndose los resultados con el uso del software SPSS de manera didctico y
guiados paso a paso para su mejor comprensin.
Para el adecuado proceso de aprendizaje del lector el libro ha sido dividido en tres
captulos, en cada captulo el uso del SPSS se presenta para contrastar cada ejemplo
propuesto, y su uso est guiado mediante la presentacin de las ventanas respectivas. En
el captulo I, se presenta los conceptos fundamentales de la estadstica descriptiva:
tratamiento de los datos y sus presentaciones mediante tablas de frecuencia y grficos.
El captulo II, aborda la parte de medidas de tendencia central (media, mediana y moda)
y medidas de dispersin (varianza, desviacin tpica y coeficiente de variacin). Y
finalmente en el captulo II, se desarrolla lo concerniente a la estadstica inferencial,
exclusivamente las pruebas de hiptesis. Sin embargo, la necesidad en el campo
educativo ha permitido que presentemos los dos tipos de pruebas estadsticas: pruebas
de hiptesis paramtricas y pruebas de hiptesis no paramtricas.
Se ha dado mucho nfasis en las pruebas de hiptesis no paramtricas, porque stas
permiten al investigador desarrollar libremente sin importar los parmetros de la
poblacin, ya que muchos trabajos de investigacin no se ajustan a los requisitos para el
uso de las pruebas de hiptesis paramtricas.
viii

Es nuestro deseo que el esfuerzo invertido en la preparacin de este libro, para que los
investigadores en el campo de la educacin tengan un beneficio personal y contribuyan
en aras de la educacin. Todas las sugerencias de los investigadores, estudiantes y
lectores que nos ayuden a mejorar el contenido sern bienvenidas.
Finalmente, nos resta expresar nuestra gratitud a todos quienes pusieron un grano de
arena en la cristalizacin del libro, en especial a la Dra. Olga Pacovilca Alejo por sus
sugerencias e inters en la publicacin, a Jess Huarcaya por su apoyo incondicional.
Tambin queremos agradecer a la Universidad Nacional de Huancavelica y la escuela
de Post Grado por permitirnos realizar este trabajo fruto de nuestras experiencias en las
aulas.
Huancavelica, noviembre del 2009

Los autores.






ESTADISTICA
Lo especial de la Estadstica para ser precisos, es su habilidad de cuantificar la incertidumbre. Esto
permite a los estadsticos hacer afirmaciones categricas con una seguridad total sobre el nivel de
incertidumbre
Tomado del Libro: LA ESTADSTICA EN COMIC.
Larry Gonick.
Woollcott Smith.




















CAPTULO 1


INTRODUCCIN AL SPSS
En sta primera parte es brindar al investigador los conceptos y procedimientos bsicos para
la utilizacin del software SPSS (Statistical Package for Social Science) bajo el entorno
Windows. Se considera que el lector tiene instalado el software SPSS en su computadora
personal, por lo que el usuario deber seguir los pasos bsicos, as como la barra de mens,
las barras de herramientas y el uso de las ventanas (el editor de datos y el visor de los
resultados).
El programa por su especial cualidad, nos ofrece una amena forma de desarrollar la
estadstica y su aplicacin para la toma de decisiones. Si bien es cierto que las versiones
cada vez es mejor, para un trabajo de investigacin en condiciones normales es suficiente
una versin de SPSS 15, por tal motivo el texto est desarrollado con dicha versin (aunque
en le mercado existe la nueva versin PASW).
1.1. Iniciar SPSS
Para iniciar el trabajo con SPSS, debe hacer clic en el botn Inicio, luego hacer clic en
programas y ubicar SPSS para Windows.



2 C. Quintanilla C. / A. Cortavarria L.

Luego parece la presentacin del programa y al fondo la ventana de editor de datos.


Si hacemos clic en Cancelar pasaremos directamente a la ventana de editor de datos.
Y si deseamos hacer clic en Aceptar debemos elegir qu deseamos hacer?: ejecutar el
tutorial, introducir datos, ejecutar una consulta creada anteriormente, etc. Una vez
ejecutada esta accin pasar al editor de datos.
1.2. Pasos para la introduccin de datos
a) Introduccin directa de datos
Antes de ingresar los datos es necesario reconocer las partes bsicas de la ventana de
editor.













Una vez recolectado los datos, se inicia introduciendo los datos en las columnas de
variables determinado por Vista de datos. Si deseamos definir variables, debemos
Fila de
casos/individuos
Vista de matriz
de datos
Vista de variables
Columna de variables (var0001, var0002, var0003 )
Estadstica Aplicada a la Investigacin Cientfica 3

hacer clic en Vista de variables y especificar: nombre, tipo de variables, anchura,
decimales, etiqueta, y otros atributos, tal como se muestra en la ventana.



b) Extrayendo un archivo de una carpeta
La segunda forma de obtener datos es extrayendo un archivo de una carpeta
determinada (del disco, USB, disquete)



1.3. Barra de Men
La barra de men permite acceder a todas la funciones que considera SPSS. Cada
venta posee su propia barra de mens. La se presenta a continuacin.



4 C. Quintanilla C. / A. Cortavarria L.

Archivo: Permite abrir, cerrar, guardar e imprimir archivos.
Edicin: Permite cortar, copiar, insertar variables y pegar elementos; as como acceder
a otras opciones.
Ver: Muestra la barra de estado, permite personalizar la barra de herramienta.
Transformar: Permite modificar datos, transponer variables, reemplazar valores
perdidos, recodificar en las mismas variables y distintas variables, y otras.
Analizar: Permite realizar distintos tipos de anlisis estadstico para la elaboracin de
reportes de investigacin y anlisis de datos.
Grficos: Crea grficos de barras, histogramas, grficos interactivos, permite verificar
cuadros de dilogos antiguos.
Utilidades: Permite definir conjuntos, ejecutar procesos, editar mens, cambiar
tipografas.
Ayuda: permite encontrar temas especficos que ayuda y muestra la informacin
acerca de los procedimientos y funciones de SPSS.
1.4. Barra de herramientas
La barra de herramientas incorpora varias ventanas y que stas contienen las funciones
de trabajo.


Para identificar las acciones de cada una de ellas, deber colocar el puntero en el icono
correspondiente y sta le indicar que accin realiza.
1.5. Ventanas
En SPSS existen dos ventanas principales que son: Editor de datos y el Visor
1.5.1. Ventana de Editor de Datos
Esta ventana muestra el contenido del fichero de datos. Permite crear nuevos datos o
modificar los archivos existentes. Adems est compuesto por dos vistas: Vista de
datos y Vista de variables.



Estadstica Aplicada a la Investigacin Cientfica 5

1.5.2. Ventana de Visor
En esta ventana se muestra los resultados estadsticos, tablas de frecuencias y grficos
que se generan. Para realizar informes de los resultados en Word, simplemente se
selecciona y se hace una copia (copy) y se pega.


A partir de los siguientes captulos se desarrollar la parte estadstica y sus aplicaciones se
realizaran con los ejemplos desarrollados de tal manera que se pueda comprobar con el
programa SPSS.
6 C. Quintanilla C. / A. Cortavarria L.











CAPTULO II

CONCEPTOS BSICOS DE ESTADSTICA

2.1. Breve Resea Histrica de la Estadstica
El origen de la Estadstica se remonta a la escritura de nmero, donde el hombre empez a
llevar cuentas mediante marcas de la caza que realizaba. En el Antiguo Testamento se
encuentran varias relaciones de censos, la Biblia menciona el censo que Moiss levant a
instancias de Jehov.
Por otro lado los gobiernos de Babilonia, Egipto y Roma reunan registros detallados de sus
poblaciones, sus ejrcitos y de sus recursos con fines de recabar impuestos. En la Edad
Media, los gobiernos empezaron a asentar en documentos la propiedad del suelo; se sabe
que en el ao 762 d. de C., el Emperador Carlomagno solicit descripciones pormenorizadas
de las propiedades con que contaban las iglesias. Guillermo el Conquistador (1086), ordena
la elaboracin de un libro Domesday Book, que concierne a la propiedad, extensin y valor
de las tierras de Inglaterra, cuyo documento fue la primera obra estadstica de Inglaterra.
Luego por los aos 1654 el Caballero de Mrs propuso preguntas relacionado al
lanzamiento de dados En ocho lanzamientos sucesivos de un dado intenta un jugador de
obtener un uno, pero el juego se interrumpe despus de tres intentos fallidos. En qu
proporcin ha de ser compensado el jugador?; dando origen a una nueva teora
denominado Probabilidad que en la actualidad viene a ser parte de la Estadstica. En 1705
Jacques Bernoull escribe una teora clsica de probabilidades, titulado Ars conjectandi
(Arte de la conjetura), cuya obra fue publicado luego de ocho aos de la muerte del autor.
En el Imperio Incaico, an cuando los pobladores no conocan la estadstica como tal
estaban familiarizados y llevaron registros de su poblacin, terrenos y otras cuentas
mediante los Quipus; as estuvieron familiarizados con datos e informes sobre aspectos
demogrficos y econmicos.
Por los aos (1719 1772) el Alemn Godofredo de Achenwall fue el primer terico de la
Estadstica que le dio el nombre de estadstica, basndose en el origen etimolgico Status.
Sin embargo, segn otras fuentes la palabra estadstica procede del vocablo "estado" pues la
funcin principal de que los gobiernos de los estados fue siempre establecer registros de
poblacin, nacimientos, defunciones, inventarios de la riqueza, etc., por lo que las personas
entienden por estadstica al conjunto de datos, tablas y grficos que se suelen publicar en los
Estadstica Aplicada a la Investigacin Cientfica 7

peridicos. Pero, en la actualidad, se entiende por estadstica el mtodo que sirve para tomar
decisiones, de ah que se emplee en muchos estudios e investigaciones cientficos.
Definiciones.
Definir tal como es la estadstica es poco tedioso, porque muchos autores tienen diferentes
apreciaciones con respecto a la estadstica por el mismo hecho del avance tecnolgico y
cientfico. Mara Jos Marquez de Cant (1991) dice: Actualmente la Estadstica es una
rama de la matemtica aplicada que colecciona, clasifica y evala o analiza datos como base
para inferencias o conclusiones vlidas, as como para tomar decisiones en base a ese
anlisis
1
. As mismo, Woolson R y Clarke W (2002) citan a Broadly : estadstica es el
campo de estudio del mtodo de la obtencin de datos, resumen y realizar inferencias de los
datos de grupos de individuos
2

Estas consideraciones, nos permiten decir que la Estadstica es una ciencia que recopila
informacin, evala y contribuye en la toma de decisiones ante situaciones de
incertidumbre, justificndolo cientficamente.
2.2. OBJETIVOS DE LA ESTADSTICA
a) Descripcin de grandes colecciones de datos
La descripcin se refiere a que los datos que vienen expresados en su forma natural
deben ser clasificados y presentados sistemticamente en cuadros o tablas como una primera
reduccin de datos.
b) Anlisis estadstico de datos experimentales y de los fenmenos observados.
Toda investigacin estadstica incluye un problema de anlisis, con el objeto de
formarse un concepto de la poblacin o universo y adoptar decisiones.
c) Prediccin o comportamiento de los fenmenos en el futuro.
Este objetivo de prediccin y previsin est implcito tanto en la descripcin como en el
anlisis estadstico, puesto que en general interesa orientar la toma de decisiones con
vigencia y efecto en futuro.
2.3. POBLACIN
Es la totalidad de las unidades de observacin (personas, objetos o eventos) con una
determinada caracterstica, adems que puede ser medible o contable y que pueden ser
cualitativo o cuantitativo, sobre los cuales se desean tomar una decisin.
Si la caracterstica observada es medible o contable, recibe el nombre de variable
estadstica continua o discreta. Las poblaciones pueden ser estudiadas en su totalidad si son
pequeas; pero en la prctica las poblaciones son grandes y en algunos casos infinitos
EJEMPLO:
a) Alumnos matriculados en COU en toda Espaa.
b) Los zancudos portadores del Dengue.

1
Mara Jos Marquez de Cant. PROBABILIDAD Y ESTADISTICA Edit. McGrawHill. Mxico 1990.
2
R. Woolson; W Clarke. STATISTICAL METHODS FOR THE ANALYSIS OF BIOMEDICAL DATA.
John Wiley and Sons, INC., Publucation. New York 2002.
8 C. Quintanilla C. / A. Cortavarria L.

c) El nmero de glbulos rojos de una persona.
d) El nmero de hijos de las familias en el Per
2.4. VARIABLE
Una variable (X) es un smbolo que representa una caracterstica a estudiar en una poblacin.
Llamamos dato (x) al valor numrico (nmero o no) que la variable toma sobre un individuo
concreto de la muestra.
2.4.1. Segn su naturaleza.
a) Variables cualitativas: son atributos susceptibles de ser expresado mediante palabras
(ocupacin, profesin, actividad econmica, marcas de autos, sexo, estado civil, color, etc.),
slo se pueden contar y no son medibles. Se puede clasificar en variables cualitativo ordinal,
sta pero si se puede jerarquizar (profesin, cargos, instruccin, etc.); y variable cualitativo
nominal, que no se puede jerarquizar (sexo, religin, color, etc.).
b) Variables cuantitativas: son aquellas variables que se expresan numricamente
(ingresos, egresos, consumo de azcar, edades, estatura, notas de los estudiantes, talla del
calzado, etc.), estas unidades pueden ser medibles. Existen dos tipos de variables: variable
cuantitativo continuo y variable cuantitativo discreto.
b.1. Discreta Son aquellas variables que se expresan en nmero enteros.
EJEMPLO:
- Nmero de hijos por familia en la ciudad de Huancavelica.
- Nmero de estudiantes matriculados en la UNH.
b.2. Continua Son aquellas variables que son expresados en decimales y que se puede
tomar los valores dentro de un intervalo, es decir se expresan en
nmeros reales.
EJEMPLO:
- La medida de la temperatura: 15,8 C.
- La estatura de algn estudiante de una Facultad: 1,72 m.
- La masa de los estudiantes matriculados al curso de Estadstica Bayesiana: |58 70
| kg.
Es posible categorizar las variables cuantitativas en variables cualitativas, por
EJEMPLO si las notas de los estudiantes en matemtica tienen notas de 0 a 20, stas
podran categorizarse de la siguiente manera:
Tabla N 01
00 a 05 06 a 10 11 a 15 16 a 20
D C B A

Pero se debe tener en cuenta, que al realizar esta operacin se pierde el verdadero valor de la
informacin. Por lo que se recomienda utilizar slo en casos necesarios.
Estadstica Aplicada a la Investigacin Cientfica 9

Variables dicotmicas:
son aquellas variables que slo pueden tomar dos valores, (SI/NO); (0; 1).
Esquema de la posicin de las variables.



2.4.2. Variables segn su relacin.
a) Variables dependientes (VD - efecto).
Son aquellas que se explican por otras variables, son los resultados o efectos respecto
a los cuales existe una causa, motivo o razn.
EJEMPLO
El puntaje obtenido (VD) en el examen de Admisin; este resultado es probable que
guarda relacin con el coeficiente de Inteligencia.
b) Variables Independientes (VI - Causa).
Son las variables explicativas o predictivas, que influye sobre la variable
dependiente.
EJEMPLO
El coeficiente de inteligencia influye en el resultado en el puntaje obtenido en el
examen de Admisin.
c) Variables Intervinientes (Causa).
La variable interviniente es aquella que se afecta indirectamente condicionando los
resultados de la variable dependiente, que muchas veces no se puede controlar durante la
investigacin.
Ejemplo: El puntaje obtenido (VD) en el examen de Admisin, est en relacin al
coeficiente de Inteligencia (VI). La variable interviniente es la alimentacin o el
estrs, que influye en el verdadero resultado del examen.
V
A
R
I
A
B
L
E
S

CUANTITATIVAS
CUALITATIVAS
D
I
C
O
T
O
M
I
C
A
S

Discreta
Continua
Nominal
Ordinal
10 C. Quintanilla C. / A. Cortavarria L.

2.4.3. Variable segn su escala de medicin.
a) Variables Nominales
Son aquellas variables que establecen categoras nominativas sin explicar orden entre
ellas.
EJEMPLO.
Las variables que se caracterizan sin tener orden: sexo, estado civil, raza, credo, lugar
de nacimiento.
b) Variables Ordinales
Son aquellas variables que se caracterizan por tener orden entre sus categoras.
EJEMPLO.
Las profesiones (porque se puede ordenar de acuerdo al nivel), grado de instruccin,
orden de mrito, clases sociales.
c) Variables de Intervalos.
Son aquellas variables cuya caracterstica son de expresar orden y grados de
distancias iguales entre diversas categoras, funcionan por convencin y tienen un
cero relativo.
EJEMPLO.
La temperatura, la hora, las puntuaciones de 0 a 20, tablas con baremos, etc.

Vector observacin
El vector observacin va ha depender del tipo de variables en estudio (Discreta, continuo,
ordinal, nominal y dicotmico).

EJEMPLO.
El seor Eduardo Saldaa es el vector observacin (V
1
), cuyas variables en estudio son:
masa = 62 kg; estatura = 1,63 m; profesin = Fsico (F), estado civil = casado (C), lugar de
procedencia = Trujillo (T).
luego el vector es:
1
62
1 63
(
(
(
( =
(
(
(

,
V F
C
T

2.5. MUESTRA.
En la realidad es imposible calcular el verdadero valor de cualquier parmetro de una
poblacin infinita. En la mayor parte de los casos tampoco resulta prctico calcular el
verdadero valor de cualquier parmetro de una poblacin finita. Por lo que es necesario,
realizar estimaciones a cerca de los parmetros de la poblacin, a partir de una muestra
representativa.
Estadstica Aplicada a la Investigacin Cientfica 11

DEFINICIN. La muestra es un subconjunto de elementos representativos pertenecientes
a la poblacin, tomado de tal manera que los resultados obtenidos en su
estudio se pueden generalizar a la poblacin de la cual se extrajo. Los
elementos de la muestra deben de ser seleccionado de acuerdo a un plan o
regla.
Al respecto, R. Sierra Bravo dice: De modo cientfico, se puede definir las muestras como
una parte de un conjunto o poblacin debidamente elegida, que se somete a una observacin
cientfica en representacin del conjunto, con el propsito de obtener resultados vlidos,
tambin para el universo total investigado.

La importancia del muestreo y la inferencia estadstica se derivan del proceso de
consecucin de los datos que van a proporcionar la informacin deseada acerca de una
poblacin.











DEFINICIN. Se denomina parmetro a la medida usada para describir las caractersticas
de los elementos (X
1
, X
2
, X
3
, . . . X
N
) de la poblacin en estudio.
Tabla N 02
a. Media poblacional.

b. Varianza poblacional
2
o
c. Desviacin estndar
poblacional.
o
d. Proporcin poblacional p
e. Tamao poblacional N.

DEFINICIN. Se denomina estadsticas a las medidas de resumen que describen una
caracterstica de los elementos de la muestra. A partir de las estadsticas
(estadgrafos) se estima los parmetros de la poblacin.

POBLACIN
X1
X2
X3
Xj
ESTADISTICA INFERENCIAL
Toma de decisin.
Unidad Estadstica
MUESTRA
Tcnicas de muestreo
Diagrama de relacin entre poblacin y muestra
12 C. Quintanilla C. / A. Cortavarria L.

Tabla N 03
a. Media muestral x
b. Varianza muestral
2

s
c. Desviacin estndar.
muestral
s

d. Proporcin muestral
P
e. Tamao muestral n.

2.6 CLASIFICACIN DE LA INFORMACIN: Recopilacin,
codificacin y tabulacin.
Para iniciar el trabajo en Estadstica Descriptiva necesariamente se requiere de un
planificacin, es decir que tipo de variable se va ha investigar, en que espacio se tiene que
trabajar, cual es el objetivo de dicho trabajo, que necesito para realizar el trabajo. Una vez
determinado el tipo de trabajo a realizar se contina con los siguientes pasos.





2.6.1. RECOPILACIN DE DATOS.
La recopilacin de datos es la parte principal para realizar un trabajo de investigacin:
existen tres (3) mtodos para obtener informacin.
a) Recurrir a fuentes ya publicados
(gubernamentales, industriales, resmenes,
investigaciones, reportes, etc.).
b) Disear un experimento similar para obtener
informacin.
c) Efectuar una encuesta.
Conclusin y/o interpretacin
Estadstica Aplicada a la Investigacin Cientfica 13

Tomemos un ejemplo del tercer caso, realizar una encuesta:
EJEMPLO:
Se desea encontrar informacin bsica social de una persona, para tal efecto se usa un
instrumento llamado ficha de encuesta.

FICHA DE ENCUESTA

INSTRUCCIN: Complete y marca con una (X) la alternativa correcta de la informacin
solicitada.
1. EDAD.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ (en aos)
2. SEXO
a) Varn b) Mujer
3. ESTADO CIVIL
a) Soltero b) Casado c) Divorciado d) Viudo
4. GRADO DE INSTRUCCIN (concluido)..
a) Universitario b) Secundaria c) Primaria d) Analfabeto
5. SALARIO
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ (mensual en soles)
6. TIPO DE VIVIENDA.
a) Ladrillo b) Adobe c) Tapial d) No tiene
7. RELIGIN.
a) Catlico b) Pentecosts c) Otros
8. TIPO DE COLEGIO DONDE ESTUDI.
a) Pblico b) Privado c) Religioso
9. NMERO DE HERMANOS (Unidades) _ _ _ _ _ _
10. PESO (kg) _ _ _ _ _ _ _
11. ESTATURA (m) _ _ _ _ _ _ _
12. GASTO APROXIMADO MENSUAL (s/.) -------------
Este instrumento debe de ejecutarse en una muestra, y cada rubro nos reporta la informacin
de los encuestados.







14 C. Quintanilla C. / A. Cortavarria L.

Tratamiento de la informacin: se debe seguir los siguientes pasos una vez recogida la
informacin:
clasificacin y/o recodificacin si es necesario.
recuento de frecuencias.
agrupacin de los datos, en el caso que la variable aleatoria es continua o discreta y sea
muy grande.
2.6.2. CLASIFICACIN DE DATOS
Es la tabulacin de la informacin mediante tablas de simple y
doble entrada dependiendo de la relacin de las variables. Luego,
sta nos permite presentar mediante tablas de frecuencias y
grficos. Sin embargo, es necesario contar con la tecnologa,
quien nos permite ahorrar tiempo en la clasificacin,
presentacin y toda informacin necesaria que uno desee.
2.6.3. CODIFICACIN DE LA ENCUESTA
La codificacin est sujeto cmo se debe realizar el tratamiento estadstico; para nuestro
propsito es necesario codificar para trabajar con el SPSS. Por ejemplo, la variable EDAD
considerar su edad (aos). As, consideramos a las variables con sus respectivos cdigos.
X
1
: EDAD (en aos)
X
2
: SEXO (1: varn, 2: Mujer).
X
3
: ESTADO CIVIL
1: Soltero; 2: Casado; 3: Divorciado; 4 Viudo.
X
4
: GRADO DE INSTRUCCIN
0: Universitario 1: Secundaria 2: Primaria 3: Analfabeto.
X
5
: Salario (en soles)
X
6
: TIPO DE VIVIENDA
(1: Ladrillo 2: Adobe; 3: Tapial; 4: No tiene).
X
7
: RELIGIN (1: Catlico; 2: Pentecosts; 3 Otros).
X
8
: TIPO DE COLEGIO DONDE ESTUDI
(1: Pblico; 2: Privado; 3: Religioso).
X
9
: NMERO DE HERMANOS (unidades).
X
10
: PESO (kg).
X
11
: ESTATURA (metros).
X
12
: GASTO PROMEDIO MENSUAL (Nuevos Soles).

Estadstica Aplicada a la Investigacin Cientfica 15

Una vez realizado la encuesta y codificado se realiza el llenado del consolidado
(consideremos una supuesta encuesta a 30 personas) cuyo cuadro muestra los resultados:

LLENAR LA BASE DE DATOS (SPSS).
Tabla N 04
n
i X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
X
12

1
33 1 1 0 2550 1 3 2 3 74 1,75 950
2
18 2 2 1 700 4 1 1 6 55 1,6 250
3
40 1 2 1 700 3 1 1 8 65 1,62 230
4
22 1 1 0 4500 4 1 3 2 68 1,73 1230
5
24 1 2 1 900 2 1 1 5 68 1,68 320
6
54 2 1 0 1500 4 2 3 7 54 1,6 450
7
34 1 2 1 800 2 3 1 4 69 1,7 220
8
44 1 4 2 600 2 2 1 6 68 1,68 180
9
32 2 3 1 500 2 1 1 5 60 1,65 158
10
20 2 2 1 700 4 1 1 7 58 1,6 230
11
19 1 1 0 1800 4 3 1 5 72 1,74 520
12
25 1 2 0 4500 1 1 2 2 74 1,76 1600
13
23 1 2 1 1200 4 1 1 4 68 1,6 360
14
26 1 2 1 1500 1 1 1 4 76 1,68 380
15
35 1 3 1 1500 1 1 1 6 70 1,69 460
16
38 2 2 2 700 1 1 1 5 58 1,55 210
17
42 1 2 1 4500 1 1 2 8 82 1,78 1580
18
38 2 2 1 2500 1 1 3 4 60 1,55 540
19
33 1 2 0 1850 1 1 1 5 76 1,74 350
20
31 1 2 1 1850 1 1 1 3 78 1,8 540
21
37 2 1 1 500 2 1 1 5 56 1,58 210
22
26 1 2 2 500 3 3 1 6 68 1,68 120
23
28 1 2 3 500 3 1

6 70 1,72 160
24
30 1 2 1 1800 1 1 1 3 78 1,76 340
25
36 1 1 0 2800 4 1 1 5 79 1,82 820
26
34 2 2 1 700 2 3 1 6 65 1,6 190
27
46 1 2 3 1200 3 1

7 72 1,68 430
28
45 1 2 0 3500 1 1 2 3 80 1,72 860
29
36 1 2 1 1200 1 1 1 4 86 1,75 360
30
29 1 2 1 1800 1 1 1 6 78 1,7 420

Esta tabla se hace una copia y se pega en la venta de Vista de datos, como se muestra en la siguiente
figura.


16 C. Quintanilla C. / A. Cortavarria L.

ENTORNO DE TRABAJO EN SPSS.
Para iniciar la base de datos, debe abrir el programa SPSS, luego copiar la tabla de consolidado
(tabla N 04) de la pgina anterior y pegar; quedando la tabla de la siguiente manera.

Una vez introducido la informacin es necesario recodificar (mediante nmeros), asignar sus
nombres de las variables. Para realizar dicha operacin hacer clic en vista de variables y seguir la
siguientes instrucciones.






Escribir el nombre de
las variables.
En la columna Valores
hacer clic, y aparece la
ventana que se muestra en la
siguiente pgina.
En las variables expresadas
en nmeros condicionar los
decimales. Ejemplo, en
Edad se considera cero
decimal; en Estatura debe
considerar dos decimales.
Estadstica Aplicada a la Investigacin Cientfica 17



En el ejemplo, tomemos para etiquetar la variable X
7
de Relegin

Una vez finalizados las codificaciones de los atributos de las variables, en la ventana de
Vista de variables debe quedar como la siguiente tabla.



Ingresar los valores numricos
asignados a las respuestas de las
variables, y hacer clic en Aadir.
Finalmente hacer clic en Aceptar.
Se ingresa los cdigos
asignados a cada atributo
de la variable.
Se escribe cada atributo de la variable.
Luego pulsar Aadir para cada una de
ellas hasta finalizar todas. Finalmente
pulsar Aceptar.
Colocar los ttulos de las variables en la
columna de Etiqueta.
18 C. Quintanilla C. / A. Cortavarria L.

Una vez registrado en la Vista de variables los correspondientes tems. Pulsar en la Vista de datos
(data view), luego aparece la figura completa

Otra manera formal de ingresar los datos es colocando etiquetas, asignar los valores a cada
caracterstica de cada variable, en la Vista de variables, tal como se muestra en la tabla.


Luego hacer clic en Vista de variables, y ingresar la informacin de cada ficha (encuesta) una por
una, hasta completar los 30 fichas encuestadas.

Estadstica Aplicada a la Investigacin Cientfica 19

2.7. PRESENTACIN DE INFORMACIN
Tablas de distribucin de frecuencia
Cuando no se cuenta con el apoyo de la tecnologa, tambin se puede clasificar los datos en
cuadros o tablas de resumen de las observaciones originales.
2.7.1. DATOS DE VARIABLES DISCRETAS
Es cuando las variables estn expresadas por variables cualitativas o de variables
cuantitativas con valor en nmeros enteros.
EJEMPLO.
De la encuesta anterior se desea presentar la primera variable cualitativa de edad y queda
de la siguiente manera:
Tabla No. 05
EDADES DE PROFESORES DEL MAGISTERIO PERUANO
i. Caractersticas Conteo Frecuencias
absolutas
(n
i
)
Porcentaje
%
1 Adolescente // 2 10
2 Joven //// - /// 8 40
3 Adulto //// - //// 10 50
Es cuando los valores de las variables cuantitativas se encuentran expresados en nmeros
enteros y reales, estos valores se suelen ordenar en forma ascendente en una tabla de
frecuencia.
Definicin. Dada la variable X, consideramos una muestra de tamao n que toma valores
distintos, x
1
. x
2
, x
3
, . . .x
k
(si la variable es cuantitativa x
1
< x
2
< x
3
< . . <.x
k
).
Frecuencia absoluta (n
i
) de un valor x
i
: Es el nmero de veces que dicho valor aparece en
la muestra, donde

1 2 3
1
...
k
i k
i
n n n n n n
=
= + + + + =

, donde n es tamao muestral.


Considerando las variables definidas en la tabla de frecuencia, se puede definir las
frecuencias acumuladas
Frecuencia absoluta acumulada del valor i-simo es la suma de las frecuencias absolutas
hasta dicho valor y se denota por N
i
.
N
i
= n
1
+ n
2
+ n
3
+ . . .+ n
i
.
Frecuencia relativa de un valor x
i
es el cociente de la frecuencia absoluta de x
i
entre el
tamao de la muestra (n), se representa por h
i
.
,
i
i
n
h
n
= se cumple
1
1
k
i
i
h
=
=


Frecuencia relativa acumulada (H
i
) del valor i-simo, es la suma de las frecuencias
relativas hasta dicho valor.
20 C. Quintanilla C. / A. Cortavarria L.

H
i
= h
1
+ h
2
+ h
3
+ . . .+ h
i
.
i
i
N
H
n
= .
Si las frecuencias relativas las multiplicamos por 100, obtenemos los porcentajes ( %)
%
i
= (h
i
)100.
EJEMPLO
Sea las notas de un examen de Estadstica Inferencial tomados a 50 estudiantes, cuyo
resultado es en la escala vigesimal:
12 10 11 09 10 11 13 16 15 11 10 15 15
08 11 15 12 11 10 12 14 13 14 12 13 13
12 15 10 07 09 13 14 11 17 16 13 11 10
12 11 15 11 10 13 10 14 11 10 16
a) Cuntos alumnos tiene notas aprobatorias?
b) Qu porcentaje de alumnos tienen notas desaprobatorias?
SOLUCIN
Luego ordenando, construimos la tabla de frecuencia, cuyo resultado es la siguiente tabla:
Hallando el rango: R = 17 7 = 10 k = 10+1 = 11 intervalos.

i. x
i
notas
Tarjas (n
i
) (N
i
) (h
i
) (H
i
) %
1 07 / 1 1 0.02 0.02 2
2 08 / 1 2 0.02 0.04 2
3 09 // 2 4 0.04 0.08 4
4 10 //// - //// 9 13 0.18 0.26 18
5 11 //// - //// 10 23 0.20 0.46 20
6 12 //// - / 6 29 0.12 0.58 12
7 13 //// - // 7 36 0.14 0.72 14
8 14 //// 4 40 0.08 0.80 8
9 15 //// - / 6 46 0.12 0.92 12
10 16 /// 3 49 0.06 0.98 6
11 17 / 1 50 0.02 1.00 2
+
+
+
+
Estadstica Aplicada a la Investigacin Cientfica 21

a) Se consideran notas aprobatorias iguales o superiores a 11.
Luego los aprobados son: 10+6+7+4+6+3+1 = 37 estudiantes.
b) Consideramos desaprobados cuando la notas son inferiores a 11.
Verificamos en el porcentaje (%), los desaprobados estarn entre las notas de 7 y 10.
Desaprobados: 2% + 2% + 4% + 18% = 26%.
IMPORTANTE: Con respecto a notas, nmero de hijos y datos que contienen
valores enteros de rangos pequeos, no es recomendable usar
intervalo, porque se tiende a perder informacin.

TRABAJANDO CON EL SPSS.




Luego para ingresar las notas del examen pulsar en Vista de Datos y luego ingresar los datos.


Ingresar en la
columna las notas
obtenidas.
Rotular con notas
Poner el Ttulo en
Etiqueta.
22 C. Quintanilla C. / A. Cortavarria L.

Ingresar a Analizar ---> Estadstica descriptiva --->Frecuencias



El resultado se obtiene tal como se muestra en la tabla de frecuencia generada por SPSS.

NOTAS DE EXAMEN DE ESTADSTICA

Frecuencia Porcentaje
Porcentaje
vlido
Porcentaje
acumulado
Vlidos 7
1 2,0 2,0 2,0
8
1 2,0 2,0 4,0
9
2 4,0 4,0 8,0
10
9 18,0 18,0 26,0
11
10 20,0 20,0 46,0
12
6 12,0 12,0 58,0
13
7 14,0 14,0 72,0
14
4 8,0 8,0 80,0
15
6 12,0 12,0 92,0
16
3 6,0 6,0 98,0
17
1 2,0 2,0 100,0
Total
50 100,0 100,0

Hacer clic en notas
Hacer clic para pasar a
la casilla de variables y
pulsar Aceptar.
Estadstica Aplicada a la Investigacin Cientfica 23

EJEMPLO
De nuestra encuesta realizada se tiene el nmero de hermanos, utilizando el SPSS y
siguiendo la secuencia se puede realizar la operacin.
Abrir el archivo de SPSS con el nombre guardado (en nuestro caso se guard con ENCUESTA DE
SHARA 2009). Una vez abierto realizar la siguiente operacin Ingresar a Anlisis ---> Estadstica
Descriptiva --->Frecuencias

Y se tiene la figura del al ventana Visor.


Nmero de hermanos

Frecuencia Porcentaje
Porcentaje
vlido
Porcentaje
acumulado
Vlidos 2
2 6,7 6,7 6,7
3
4 13,3 13,3 20,0
4
5 16,7 16,7 36,7
5
7 23,3 23,3 60,0
6
7 23,3 23,3 83,3
7
3 10,0 10,0 93,3
8
2 6,7 6,7 100,0
Total
30 100,0 100,0


Seleccionar nmero
de hermanos y
finalizar con OK
Hacer clic en la
tabla, y haciendo
Ctrl+C se pude
copiar y pasar a
una hoja de Word.
24 C. Quintanilla C. / A. Cortavarria L.

2.7.2. DATOS DE VARIABLES CONTINUAS
Tablas de frecuencia.
Es aquella que se elabora para poder realizar las operaciones a partir de la clasificacin de
los datos.
Existen dos tipos de tablas, una para datos no agrupados que vemos en el EJEMPLO
anterior y otra para datos agrupados y en sta ltima se considera los intervalos.

i | L
i
L
s
) Tarjas Y
i
(n
i
) N
i
(h
i
) H
i
%
i
1 L
1
L
2 ////// Y
1
n
1
N
1
=n
1
h
1
H
1
=h
1
%
1
2 L
2
L
3
/// Y
2
n
2
N
2
h
2
H
2
%
2
. . . . . . .
. . . . . . .
. . . . . . .
k L
k
L
k+1
Y
k
n
k
N
k
h
k
H
k
%
k

EJEMPLO.

Un investigador realiza un trabajo de investigacin sobre puntuaciones de exmenes de
admisin en la UNH, revisa las puntuaciones alcanzados por los ingresantes en 1996; donde
las puntuaciones fueron de 0 a 100. El resultado de 80 ingresantes fue lo siguiente:
72 81 65 83 58 56 72 63 49 81 56 60 83 89 60 52
38 79 59 39 62 32 28 39 49 48 65 72 81 58 45 52
43 71 90 42 63 73 69 75 91 49 67 76 72 60 40 58
52 68 54 52 58 77 88 70 61 39 74 68 29 36 49 62
31 73 40 38 59 60 75 93 53 57 61 65 70 79 37 46

SOLUCIN

a) Hallando el rango o recorrido (R) .

R = x
mx
x
mn

x
mx
: Valor mximo = 93, x
mn
: valor mnimo = 28
R = 93 28 = 65
Estadstica Aplicada a la Investigacin Cientfica 25

b) Nmero de intervalos (k).
Como el nmero de datos es 80, es necesario agrupar en intervalos de clase (k), cuyo valor
mnimo es 5 y su valor mximo es 20. Pero debemos tener en cuenta que al realizar
intervalos se pierde informacin, por lo que se debe tener cuidado.


Para obtener el nmero adecuado de intervalo de clase (k), tcnicamente se utilizan las
formulas de Sturges y de Portugal.
FORMULA DE STURGES.
k = 1+3,322.Log(n); si n s 50
FORMULA DE PORTUGAL.
k = 1,8914 + 3,991.Log(n); si 50 < n s 100.
k = 2,756 + 5,8154 Log(n); si n > 100.
La formula de Portugal fue presentado en 1985 en el Simposium Departamental de
Matemtica UNSA Arequipa.
De nuestro ejercicio, tenemos: n = 80, por lo que utilizaremos la formula de Portugal.
k = 1,8914 + 3,991.Log(80); entonces k = 9,486.
Luego redondeando al entero k = 10.

c) Amplitud de cada intervalo (A)
Para encontrar la amplitud A se realiza la siguiente operacin
A= R / k.
Si A no es exacta en el nmero de decimales de los datos, entonces, el nmero A se
aproxima por exceso de manera que cubra por completo al rango: kA > R.
Del EJEMPLO: si k = 10 y R = 65.
La amplitud es A = (65)/10, entonces A = 6,5 redondeando al entero superior se tiene
A = 7 y k = 10.
Pero si multiplicamos k.A = (7)(10) = 70, sobra cinco (5), entonces esta sobra distribuimos
en dos partes: 2 a la izquierda y 3 a la derecha, por ser la derecha generalmente abierta





5s k s 20
28
96
26
2
3
93
26 C. Quintanilla C. / A. Cortavarria L.

d) Construccin de la tabla de frecuencia.

i. | L
i
L
s
> Y
i

Tarjas
Frec.
Abs.(n
i
)
Frec. Absol.
Acumulada(N
i
)
Frecuencia
Relativa(h
i
)
Frec. Rel.
Acumulada(H
i
)
%
1 | 26 33> 29.5 //// 4 4 0.0500 0.0500 5
2 | 33 40> 36.5 //// - // 7 11 0.0875 0.1375 8.75
3 | 40 47> 43.5 //// - / 6 17 0.0750 0.2125 7.5
4 | 47 54> 50.5 //// - //// 10 27 0.1250 0.3375 12.5
5 | 54 61> 57.5 ////-////-//// 14 41 0.1750 0.5125 17.5
6 | 61 68> 64.5 //// - //// 10 51 0.1250 0.6375 12.5
7 | 68 75> 71.5 //// -////-/// 13 64 0.1625 0.8 16.25
8 | 75 82> 78.5 //// - //// 9 73 0.1125 0.9125 11.25
9 | 82 89> 85.5 /// 3 76 0.0375 0.95 3.75
10 | 89 96> 92.5 //// 4 80 0.0500 1 5
80 Suma =1 100%
Para Y
1
= (L
i
+L
s
)/2 Y
1
= (26+33)/3 = 29,5; Y
2
= (33+40)/3. . .

TRABAJANDO CON EL SPSS.
Veamos como se desarrollar la tabla de frecuencia con el SPSS, para ello se debe seguir la
secuencia. Ingresar todos los datos de los puntajes obtenidos en el Examen de Admisin de
1996 en una hoja del SPSS, como se muestra en la figura adjunta.

+
+
En la primera columna ingresar
las 80 puntuaciones obtenidas en
el examen.

Hacer clic en Vista
de variables

Estadstica Aplicada a la Investigacin Cientfica 27



Ubicarse en el men Transformar ---> Recodificar en distintas variables, luego aparece el
cuadro de dilogo mostrado.









Nombrar las
puntuaciones.

Escribir el Titulo en
Etiqueta Luego regresar
a Data View.
Aqu se puede cambiar
de nombres. Escribimos
PUNTAJES.
Para ingresar los
intervalos hacer clic en
Valores antiguos y
nuevos
Hacer clic en
Rango. En este
espacio se codifica
los intervalos.
Hacer clic en (ancho). En
este lugar cambiar por el
nmero 7 para nuestro
trabajo. Recordemos que
se necesita el intervalo de
amplitud 7.
Se ha seleccionado
Puntuacin.
28 C. Quintanilla C. / A. Cortavarria L.






Luego la tabla aparece con los intervalos en la segunda columna.


Ingresar al men Anlisis ---> Estadstica Descriptiva ---> Frecuencias
Ingresar los lmites
inferiores y
superiores.
Re-escribir el intervalo
con un guin. Luego
pulsar Aadir. As,
ingresar sucesivamente
hasta completar el
ingreso de todos los
intervalos. Pulsar
Continuar.
Pulsar el botn
Cambio.
Finalmente pulsar el
botn Aceptar.
Y aparece en la 2da
columna los intervalos.
Se observa que los
intervalos aparecen en
la segunda columna.
Estadstica Aplicada a la Investigacin Cientfica 29



El resultado se obtiene de manera fcil, cuyo resultado se ve en el siguiente grfico


Para nuestro reporte, se hizo copia de la Figura anterior, luego se pas a Word.
PUNTAJES

PUNTAJES

Frecuencia Porcentaje
Porcentaje
vlido
Porcentaje
acumulado
Vlidos 26-33
4 5,0 5,0 5,0
33-40
9 11,3 11,3 16,3
40-47
4 5,0 5,0 21,3
47-54
11 13,8 13,8 35,0
54-61
15 18,8 18,8 53,8
61-68
10 12,5 12,5 66,3
68-75
13 16,3 16,3 82,5
75-82
7 8,8 8,8 91,3
82-89
4 5,0 5,0 96,3
89-96
3 3,8 3,8 100,0
Total
80 100,0 100,0


Seleccionar el que se
renombr PUNTAJES y
pasar a Variables. Si desea
graficar histogramas y el
diagrama circular, pulsar
Grficos luego elegir
grfico de sectores y
histogramas, y pulsar
Continuar. Finalmente
Aceptar.
Se muestra la tabla de
frecuencias. Si desea pasar a
su reporte, hacer Ctrl C,
llevar la Word y pegar.
Se tiene una inconveniencia. En la
en la columna de frecuencia
absoluta, NO se obtuvo el mismo
resultado encontrado al realizar
manualmente.
Por qu?, el SPSS, ha hecho los
intervalos abiertos hacia la
izquierda (33 40|, mientras en
nuestra tabla se tuvo el intervalo
as: |33 40).
30 C. Quintanilla C. / A. Cortavarria L.

En la misma figura anterior, se tiene el diagrama circular que pedimos, cuya grafica
se pasa al reporte haciendo un clic en la figura y haciendo Ctrl C, luego pegar en la hoja
Word. En el siguiente figura se muestra el resultado.
PUNTAJES
89-96
82-89
75-82
68-75
61-68
54-61
47-54
40-47
33-40
26-33

REPRESENTACIONES GRFICAS
Para hacer ms clara y evidente la informacin que nos dan las tablas se utilizan los
grficos, que pueden ser:
- Diagramas de barras ( datos cualitativos y cuantitativos de tipo discreto). En el eje y
se pueden representar frecuencias absolutas o relativas. De la encuesta realizada,
graficamos la variable ESTADO CIVIL. Ir Graficos luego eligir Interactivos y aparece
Barras, luego de hacer clic aparece el grfico de abajo y elegimos ESTADO CIVIL y
OK (segunda figura).

Luego se tiene la grfica de barras.
Muestra los intervalos para cada
grupo.
Importante. Es mejor
presentar las figuras en dos
dimensiones, porque en tres
dimensiones distorsiona su
presentacin visual y el
lector puede equivocarse.
Elegir ESTADO CIVIL.
Luego pulsar Aceptar.
Estadstica Aplicada a la Investigacin Cientfica 31

Las barras muestran frecuencias
1 2 3 4
Estado Civil
0
5
10
15
20
R
e
c
u
e
n
t
o

- Histogramas (datos cuantitativos de tipo continuo o discreto con un gran nmero de
datos ) . El histograma consiste en levantar sobre cada intervalo un rectngulo. Ir
Graficos interactivos luego elegir histograma... luego aparece el cuadro de dilogo
de histograma donde se elige edad, y Aceptar.


20 30 40 50
Edad de los encuestados
0
2
4
6
R
e
c
u
e
n
t
o


Elegir Puntuaciones y pasar a
Variable. Y hacer clic en
histograma y activar curva
normal si desea que
aparzcala curva.
Finalmente Aceptar.
32 C. Quintanilla C. / A. Cortavarria L.

Para regular el intervalo de frecuencias, una vez realizada la grfica, realizar doble clic en
la parte inferior del grfico.
Continuar con el doble clic hasta que aparezca Eje de la escala, donde el nmero de
intervalo para divisores se debe modificar, as el nmero de marcas, luego cambiar en
Intervalo 10 a 7, luego pulsar Aceptar.
14 21 28 35 42 49 56
Edad de los encuestados
0
2
4
6
R
e
c
u
e
n
t
o

- Polgono de frecuencias y diagrama de sectores ( diagrama de circular) Ir Graficos
luego elegir Interactivo... Sectores simple y aparece el cuadro de Pie Charts
luego trasladar tipo de vivienda a variables del grfico de sectores y pulsamos
Aceptar. Si se hace doble clic en la figura, se puede modificarlas caracterstica de la
variables y colocar los porcentajes.
ladrillo
adobe
tapial
no tiene
Tipo de vivienda
Los sectores muestran frecuencias
ladrillo
43,33%
adobe
20,00%
tapial
13,33%
no tiene
23,33%


Existen una variedad de grficos para su presentacin, pero se tiene que tener cuidado en
graficar, porque muchas veces realizamos grficos que distorsiona la informacin.

Estadstica Aplicada a la Investigacin Cientfica 33

2.8. DIAGRAMA DE HOJAS Y TALLOS.
Es una tcnica para organizar datos sin perder la identidad de cada dato observado, como si
ocurriera en una distribucin de frecuencias por intervalos. Veamos en casos diferentes.
Sean los nmeros: 37, 4,5 y 2,36
Luego, el tallo ser 3; 4; 23. Y las hojas sern: 7; 5 y 6.
Los tallos ordenados son ubicados en forma vertical. Las hojas ordenadas de cada tallo son
ubicadas horizontalmente.

EJEMPLO.
Sean los datos notas de Geometra.
12 10 11 13 10 11 13 16 15 11
18 11 15 12 11 10 12 14 13 14
12 15 10 07 10 13 14 11 17 16
12 11 15 11 10 13 10 14 11 10
10 12 13 16 15 13 11 10 15 13
a) Desarrolle un diagrama de tallo y hojas.
b) Cuntos alumnos tienen notas desaprobatorias?

SOLUCIN.
Utilicemos en este caso el nmero 7, no permite tomar el primer dgito como tallo, entonces
tomaremos los nmeros de dos dgitos como tallos y las hojas sern CEROS (0) tantas veces
que se repiten.
a) En los casos de 8 y 9 no tiene valores por lo que no tiene ningn valor (no se toma en
cuenta).
TALLO HOJAS FRECUENCIA
7 0 1
8
9
10 0000000000 10
11 0000000000 10
12 000000 6
13

00000000 8
14 0000 4
15 000000 6
16 000 3
17 0 1
18 0 1
34 C. Quintanilla C. / A. Cortavarria L.

Con los mismos resultados se obtuvo utilizando SPSS, y es el siguiente:
NOTAS Stem-and-Leaf Plot
Frequency Stem & Leaf

1,00 7 . 0
,00 8 .
,00 9 .
10,00 10 . 0000000000
10,00 11 . 0000000000
6,00 12 . 000000
8,00 13 . 00000000
4,00 14 . 0000
6,00 15 . 000000
3,00 16 . 000
1,00 17 . 0
1,00 18 . 0

Stem width: 1,00
Each leaf: 1 case(s)


b) La cantidad de alumnos desaprobados es 11. Se ha verificado la frecuencia de los
datos 7 y 10.
Para realizar los tallos y hojas con SPSS, siga las siguientes instrucciones. Ir a Analizar y
luego a Estadstica Descriptiva luego explorar seleccione la variable nota y enve a
Dependiente y finalmente Grficos... --> tallos y hojas y continuar y finalmente Aceptar.




Estadstica Aplicada a la Investigacin Cientfica 35

Y se tiene el resultado.
Salario mensual Stem-and-Leaf Plot

Frequency Stem & Leaf

,00 0 .
12,00 0 . 555567777789
3,00 1 . 222
8,00 1 . 55588888
,00 2 .
3,00 2 . 558
,00 3 .
1,00 3 . 5
3,00 Extremes (>=4500)

Stem width: 1000
Each leaf: 1 case(s)

2.9. DIAGRAMA DE CAJAS.
Este diagrama de caja (box plots) describe y presenta directamente los cuartiles y las
medianas, el diagrama de caja se encuentra entre el recorrido intercuartil que tiene como
extremos P
75
y P
25
.
En el grfico se muestra los resultados del examen de Geometra, el grfico se realiz con el
SPSS.
Ir a Analizar y a Estadstica Descriptiva luego explore seleccione la variable Edad y
enve a Dependente y pulsar en Grficos --> Niveles de factores juntas y continuar y
pulsar Aceptar.

Edad de los encuestados
60
50
40
30
20
10


Dato mximo
P
75
=Q
3
Mediana (Me)=P
50
=Q
2

Dato Mnimo
P
25
=Q
1

36 C. Quintanilla C. / A. Cortavarria L.

PRACTICA.
I. Utilizar el paquete estadstico SPSS, para realizar la clasificacin de los
ejercicios. (guiarse con el captulo 1).
Se considera bsica la informacin dada para que puede realizar los trabajos.
1. En los tems, clasificar si las informaciones son variables cualitativas o cuantitativas, discretas o
continuas.
a) Nmero de partos en el Hospital de Huancavelica.
b) El nmero de muertos en accidentes de transito en el 2003.
c) Edad de los docentes de la Facultad de Educacin.
d) La temperatura de los nios de una escuela X.
e) Tipos de procedencia de los alumnos de la Facultad de Educacin.
f) Religin que profesan los docentes de la UNH.
g) Nmero de ingresantes a la UNH.
h) Tipos de trastornos psicolgicos de los alumnos de la U.N.H
i) Nmero de hijos por familia.
j) El pH de la sangre.
k) Lugar de nacimiento.
l) Grado de instruccin de los padres.
m) Tasa de crecimiento demogrfico.
n) Nmero de habitaciones por vivienda.
o) Las pulsaciones de corazn.
p) Temperatura de las personas en grados Celsius.
q) Nmero de glbulos rojos.
r) Grado de agresividad de las personas.
s) Tiempo de servicios de los docentes en los centros educativos.
t) Nmero de desempleados en el magisterio peruano.
u) El nmero de viviendas de material rustica en el Per.
v) Las mariposas en la selva peruana.
2. Escribir en el parntesis correspondiente si al caso propuesto se aplica la estadstica descriptiva o
Inferencial.
a) La clasificacin de las edades de los estudiantes de una seccin de la Especialidad de
Matemtica y Fsica. (.............................)
b) Se realizo un estudio de 100 alumnos de la UNH y se concluyo que el 40% de estudiantes
proceden de otro lugar y el 60% son de Huancavelica. (........................................)
c) Se aplico una encuesta a 200 profesores de los colegios y a partir de su anlisis se lleg a la
conclusin que el magisterio no est de acuerdo con el nuevo programa.
(...............................)
II. Utilizar el paquete estadstico SPSS, para desarrollar los ejercicios, de
acuerdo lo descrito en la parte I.
Estadstica Aplicada a la Investigacin Cientfica 37

3. La siguiente informacin ha sido obtenida de la secretara de la FED y corresponde a los
resultados de la evaluacin realizada a los profesores de esta facultad en el ao 2003.
B C B C B A B B A B D B B
D D B A A C A A C A A C B
A A A E A C D E B C C E A
A D A A B E D A B A B D C
A C D E A A B A B A C D A

a. Presentar la informacin dada mediante un cuadro de distribucin de frecuencias.
b. Que % de profesores obtuvieron calificacin: A (Excelente), B(Muy bueno), C(Bueno),
D(Regular) y E(Deficiente).
c. Representar mediante una histograma, y diagrama circular (pastel).
4. Se tienen las notas de 48 alumnos en Estadstica Bayesiana.

10 11 12 14 08 05 09 14 07 11 08 11
06 10 08 14 15 10 12 16 08 16 15 15
15 13 14 11 13 09 12 10 13 06 08 10
09 10 11 11 11 12 10 11 09 11 14 14

a. Presentar en una tabla de frecuencia debidamente ordenados.
b. Presentar mediante barras la frecuencia absoluta.
c. Graficar la frecuencia relativa acumulada.
d. Qu cantidad alumnos obtuvieron a lo ms notas a lo ms de 10?.
e. Presentar en un Diagrama de tallos y hojas lo datos.

5. Un estudiante de historia realiza estudio sobre nmero de hijos que tienen las familias de
Huancavelica, luego se obtuvo en 72 familias se encontr los siguientes datos:

2 0 5 8 9 2 5 6 1 6 13 6
4 3 3 9 3 0 4 4 8 2 3 8
4 5 6 6 5 1 3 7 7 5 9 5
5 8 4 10 6 8 6 7 3 8 8 8
3 6 2 8 4 9 7 8 5 2 5 9
1 7 5 7 7 5 5 6 9 6 8 6
Fuente: Encuesta 2003 Huancavelica, Historia y CC SS. UNH.

a. Clasificar los datos y presentarlos en una tabla de frecuencia.
b. Presentar mediante Diagrama de tallos y hojas.
c. Cuntas familias tienen al menos 6 hijos?.
d. Qu porcentaje de familias tienen a lo ms 4 hijos?.
e. Presentar una grfica mediante polgono de frecuencia.

6. A los ingresantes de Matemtica y Fsica, se le ha sometido a una prueba de lenguaje con 100
preguntas, donde cada una vale 01 punto, siendo la calificacin individual se presenta los
resultados.

74 89 98 65 77 73 52 65 33 94
54 76 47 67 64 69 50 55 81 41
77 45 53 59 73 55 91 61 41 80
60 68 39 74 85 35 48 35 78 60
88 57 94 84 42 65 66 85 66 71

a. Clasificar los datos y presentarlos en una tabla de frecuencia de 5 intervalos.
b. Cuntos ingresantes tienen a lo ms 80 puntos?.
c. Cuntos ingresantes tienen al menos 50 puntos?.
38 C. Quintanilla C. / A. Cortavarria L.

d. Presentar mediante la Diagrama de tallos y hojas.
e. Presentar una grfica mediante histogramas y polgonos de frecuencia el porcentaje.

7. Se toma un examen de 100 preguntas a 40 alumnos de Matemtica y Fsica. El nmero de
preguntas respondidas es:

61 81 79 78 81 66 77 76 92 83
74 77 94 87 98 70 92 68 86 78
70 82 60 81 75 76 81 63 87 41
77 52 70 82 77 84 46 88 79 67

a. Clasificar los datos y presentarlos en una tabla de frecuencia de 5 intervalos.
b. Cuntos estudiantes tienen a lo ms 60 puntos?.
c. Presentar mediante Diagrama de tallos y hojas.
d. Qu porcentaje de estudiantes alcanzaron puntajes entre 40 y 70?.
e. Presentar una grfica mediante histogramas y polgonos de frecuencia de la frecuencia
absoluta.
f. Presentar Hi con una grfica escalonada.

8. Se hizo una investigacin sobre la permanencia de los estudiantes en aos en la Universidad
Nacional de Huancavelica. (considerando los que abandonan y las que culminan).

3.9 5.8 4.2 5.6 5.4 7.5 6.6 9.8 6.9 4.3
7.1 5.5 5.8 9.4 6.0 5.6 5.0 5.4 7.8 5.6
5.6 5.2 6.1 7.2 3.5 3.7 3.1 2.0 5.8 6.0
3.3 4.1 9.1 2.5 5.7 5.9 6.5 5.3 7.5 5.4
6.7 6.8 4.7 6.3 5.6 10.6 5.0 6.1 6.6 6.1
5.4 5.8 5.8 7.4 5.3 5.8 5.8 6.0 4.8 3.8
6.2 2.6 6.9 6.9 2.6 6.8 7.5 5.2 9.2 6.5
6.3 5.9 4.0 8.6 9.3 7.4 6.3 8.6 8.8 7.5
10.4 6.8 6.4 8.2 5.2 3.0 8.5 5.1 5.2 4.5
6.7 5.1 7.7 4.0 2.3 9.7 4.8 9.2 8.1 4.2
7.8 5.0 5.8 5.5 3.9 8.4 5.7 4.5 8.2 3.7

a. Construir una tabla de frecuencia con 6 intervalos.
b. Cuntos estudiantes tienen a lo ms 3,0 aos?.
c. Cuntos ingresantes tienen al menos 4,8 aos?.
d. Qu cantidad de alumnos alcanzaron aos entre 4,0 y 8,5?.
e. Presentar una grfica mediante histogramas y polgonos de frecuencia de la frecuencia
absoluta.
f. Presentar Hi con una grfica escalonada.

9. Una firma de corredores de bolsa, public una lista de 600 acciones y que consideraba
Plenamente Apreciadas; en la misma lista daban los precios en soles de estas acciones como
son:

19.3 16.1 22.8 15.2 30.3 16.4 10.8 17.7 51.9 67.7 35.2
20.9 57.3 27.2 24.3 25.4 12.2 18.3 22.4 19.3 22.4 24.5
26.3 35.9 47.5 20.1 59.6 29.0 34.5 25.4 19.3 15.6 42.7
25.8 24.6 23.0 41.2 42.9 37.8 15.6 19.0 42.5 23.8 38.6
12.2 18.3 22.4 19.3 22.6 25.4 26.3 23.5 40.2 45.2 28.8
29.5 29.2 52.5 17.9 33.1 15.2 16.3 15.6 48.7 15.0 36.4

a. Construir una tabla de frecuencia.
b. Cuntos acciones tienen a lo ms S/.42.5?.
Estadstica Aplicada a la Investigacin Cientfica 39

c. Cuntos acciones tienen al menos S/.20.5?.
d. Qu cantidad de acciones alcanzaron costos entre S/.24,0 y S/.51,5?.
e. Presentar una grfica mediante histogramas y polgonos de frecuencia de la frecuencia
absoluta.
f. Presentar Hi con una grfica escalonada.


10. En una encuesta realizada a estudiantes del IV Ciclo de la Especialidad de Matemtica y Fsica
de la UNH sobre los ponderados acumulados al II Ciclo, se obtuvo los siguientes resultados

15.8 26.4 17.3 11.2 23.9 24.8 18.7 13.9 9.0 13.2
22.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 23.7
26.8 22.7 18.0 20.5 11.0 20.9 15.5 19.4 16.7 10.7
19.1 15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.0
18.5 23.0 24.6 20.1 16.2 18.0 7.7 13.5 23.5 14.5
14.4 29.6 19.4 17.0 20.8 24.3 22.5 24.6 18.4 18.1
8.3 21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7 31.8
25.9 10.5 15.9 27.5 18.1 17.9 9.4 24.1 20.1 28.5
Fuente: Encuesta 2004 Huancavelica, Matemtica Fsica.
UNH.

a. Construir una tabla de frecuencia de 10 intervalos.
b. Presentar mediante Diagrama de tallos y hojas.
c. Cuntos estudiantes tienen al menos ponderado de 13?.
d. Qu porcentaje de estudiantes alcanzaron ponderados entre 11.0 y 23?.
e. Presentar una grfica mediante histogramas y polgonos de frecuencia de la frecuencia
absoluta.
f. Presentar Hi con una grfica escalonada.


11. En un Complejo Hospitalario de la ciudad de Huancayo, se tom muestra de los valores de
protena en sangre de 50 nios recin nacidos normales registrados en el perodo del 23 de enero
al 28 de abril de 2004 cuyos resultados son las siguientes:

5.388 6.211 5.133 5.937 5.137 4.823 5.007 6.299 6.050 5.590
6.118 6.118 5.860 5.860 5.345 5.928 5.860 4.929 6.661 5.384
5.018 5.384 4.991 6.593 5.305 5.766 5.990 5.156 7.212 4.234
4.765 3.950 5.119 3.201 4.255 6.454 5.582 4.446 5.310 4.310
4.970 5.446 7.443 5.204 5.269 5.222 4.623 6.082 6.712 5.071

a. Construir una tabla de frecuencia de 7 intervalos.
b. Presentar mediante Diagrama de tallos y hojas.
c. Presentar una grfica mediante histogramas y polgonos de frecuencia de ni.
d. Presentar Ni y Hi con una grfica escalonada.



III. Completar la informacin necesaria, usando la parte terica
necesaria.

12. La tabla muestra la distribucin de ingreso familiar con intervalos de igual amplitud,
correspondiente a 80 familias.

40 C. Quintanilla C. / A. Cortavarria L.

i | intervalos > Yi (ni) Ni (hi) Hi %
1 |160 - >
2 | - > 48 60
3 | - > 12.5
4 | - > 0,075
5 | - 210 >

a. Reconstruir una tabla de frecuencia.
b. Qu porcentaje de familias ganan menos de 200 nuevos soles?.
c. Cuntos familias tienen al menos ingresos de S/.170?.
d. Qu cantidad de familias alcanzaron ingresos entre S/.175 y S/.195?.

13. Se tiene una tabla de frecuencia incompleta de variable continua que un investigador no
concluy, porque los datos fue de tamao n = 3000.

i | intervalos > Yi (ni) Ni (hi) Hi %
1 |1.35 - > 0,1
2 | - > 2M/3
3 | - > 3M
4 | - > M/3
5 |9.35 - > 5M/3
6 | - > M

a. Reconstruir una tabla de frecuencia.
b. Representar mediante un histograma hi.

14. Completar la siguiente tabla de frecuencia, siendo sta simtrica. Adems se sabe que Cj = 3.

i | intervalos > Yi ni Ni hi Hi %
1 | - >
2 | - >
3 | - > 45
4 | - > 8 0.96
5 | - >
50

a. Reconstruir una tabla de frecuencia.
b. Qu porcentaje de valores se encuentran entre 40,5 y 49,5?.
c. Presentar una grfica mediante histogramas y polgonos de frecuencia de la frecuencia
absoluta.
d. Presentar Hi con una grfica escalonada.


----------------------o0o----------------------
Estadstica Aplicada a la Investigacin Cientfica 41








CAPITULO III

MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIN.

En esta etapa la estadstica esta dedicada al estudio y anlisis de las medidas descriptivas.
Estas medidas se denominarn estadgrafos o estadsticas cuando se trata de la muestra, en
cambio se denominarn parmetros cuando se trata de datos de la poblacin. Es importante
remarcar, que cuando se trabaja con los datos de la muestra, stas sern de utilidad para su
uso posterior en las pruebas de hiptesis.
MEDIDAS DESCRIPTIVAS













En el desarrollo de sta unidad se desarrollar los estadgrafos ms importantes.
3. MEDIDAS DE POSICIN
3.1. MEDIA ARITMTICA.
La media aritmtica se puede considerar como el punto de equilibrio de todas las
observaciones o el centro de equilibrio de un objeto, es decir, el momento de todas las
observaciones.

Aritmtico
Geomtrico
Armnico
Promedios
Mediana
Moda
Tendencia
Central
Quantiles
D
E

P
O
S
I
C
I

N

DE DISPERSIN
Recorrido intercuartlico
Varianza
Desviacin estndar
Desviacin media
COEFICIENTES
De variacin
De asimetra
De curtosis

42 C. Quintanilla C. / A. Cortavarria L.

DEFINICIN. La media aritmtica es la suma de los valores observados de una
variable X, dividido entre el nmero de observaciones.
a) Media aritmtica de datos no agrupados
La media de n valores {x
1
. x
2
, x
3
, . . .x
n
}, de la variable cuantitativa X , observados en
una muestra es el nmero:
1 2 3
...
n
x x x x
x
n
+ + + +
= =
1
n
i
i
x
n
=


EJEMPLO.
Sean las notas de 12 alumnos de matemtica obtenidas en la signatura de Geometra IV .
Seccin A 05 08 09 09 10 11 12 10 13 12 13 15
Luego el promedio
x =
05 08 09 09 10 11 12 10 13 12 13 15
12
+ + + + + + + + + + +
x =
127
12
, x = 10,583.
b) Media aritmtica de datos agrupados
La media de n valores {x
1
. x
2
, x
3
, . . .x
n
}, de la variable cuantitativa X , observados en
una muestra muchas de ellas tienen los mismos valores, lo cual resulta que se tiene que
agrupar en grupos de n
1
, n
2
, n
3
, . . . n
i
, cuyo resultado respectivo de la media es:
1 1 2 2 3 3
...
i i
x n x n x n x n
x
n
+ + + +
= =
1
k
i i
i
x n
n
=


EJEMPLO.
Del ejemplo anterior, puntajes alcanzados en el examen de Admisin.
i. | Li Ls >
Y
i
Frec. Abs. (n
i
) Y
i
n
i


1 | 26 33> 29.5 4 118
2 | 33 40> 36.5 7 255.5
3 | 40 47> 43.5 6 261
4 | 47 54> 50.5 10 505
5 | 54 61> 57.5 14 805
6 | 61 68> 64.5 10 645
7 | 68 75> 71.5 13 929.5
8 | 75 82> 78.5 9 706.5
9 | 82 89> 85.5 3 256.5
10 | 89 96> 92.5 4 370

n = 80
10
1
k
i i
i
y n
=
=

= 4 852
y = (4852)/80


y = 60,65
Estadstica Aplicada a la Investigacin Cientfica 43

PROPIEDADES.
i) Si todos los valores observados x
1
, x
2
, x
3
, . . . x
n
son iguales a una constante b,
entonces



EJEMPLO: sean las notas de Jorge 12, 12, 12, 12, 12. Entonces su media ser: x = 12,
la misma constante.

ii) Si todos los valores observados x
1
, x
2
, x
3
, . . . x
n
se le suma o resta una constante, el
nuevo valor de cada observacin transformado es b x y
i i
= , luego la media es:



iii) Si a cada uno de los valores observados x
1
, x
2
, x
3
, . . . x
n
se le multiplica por una
constante a diferente de cero (0), el nuevo valor de cada observacin transformado
es
i i
ax y = , entonces la media aritmtica es.



iv) Si realizamos en adjuntar las propiedades ii) y iii), sta se transforma en funciones
lineales especiales.




donde: a y b son constantes.


3.2. MEDIANA.
En muchos casos la media aritmtica no es una buena medida de tendencia central, por
ejemplo las notas de 10, 12, 11, 13 y 20. En este caso, la nota de 20 distorsiona la
informacin, resultara la media de 13,2. Entonces, surge la necesidad de utilizar la mediana.
Y cuyo valor sera de 12, una informacin al menos adecuada.
La mediana es una medida que localiza el centro de las observaciones; es decir,
distribuye en dos partes iguales las observaciones de una distribucin. Para variables
cuantitativas, es un nmero tal que al menos el 50% de los datos es menor o igual que la
mediana y al menos el 50% mayor o igual.
a) Para datos no tabulados
se ordenan en forma ascendente y luego se ubica el valor central.
EJEMPLO
Se tienen las notas de estudiantes de la especialidad de matemtica.
Seccin A 12 10 9 12 8 5 12 11 13 9 15
M(x) = M(b) = b
b x M y M y = = ) ( ) (
) (y M y = =aM(x)
b ax y
i i
=
Valores
transformados
Valores
observados
inicialmente
44 C. Quintanilla C. / A. Cortavarria L.

Seccin B 08 11 12 13 12 10 12 11 12 8
* Ordenamos los datos de la seccin A:
Seccin
A
5 8 9 9 10 11 12 12 12 13 15

50% de datos Me = 11 50% de datos.
La mediana Me = 11, porque la cantidad de datos es impar.
* Ordenamos los datos de la seccin B:
Seccin
B
8 8 10 11 11 12 12 12 12 13

50% de datos Me = 11,5 50% de datos.
En este caso como la cantidad de datos es par se tom los dos datos centrales, entonces
Me =
11 12
2
+
=11,5.
b) Para datos tabulados
Si los valores de la variable estn tabulados mediante una distribucin de frecuencias por
intervalos, la mediana se determina por:

1
2
i
i i
i
n
N
Me L A
n

| |

|
= +
|
|
\ .
;
EJEMPLO.
i. | L
i
L
s
> Y
i

Frec.
Abs. (n
i
)
Frec. Absol
Acumulada(N
i
)
1 | 26 33> 29.5 4 4
2 | 33 40> 36.5 7 11
3 | 40 47> 43.5 6 17
4 | 47 54> 50.5 10 27
5 | 54 61> 57.5 14 41
6 | 61 68> 64.5 10 51
7 | 68 75> 71.5 13 64
8 | 75 82> 78.5 9 73
9 | 82 89> 85.5 3 76
10 | 89 96> 92.5 4 80

80

A
i
= 33 26 = 7,
j
n = 14, N
j
= 41, N
j-1
= 27.
Luego la mediana es Me =
40 27
54 ( )7
14

+
Se ubica el valor de
2
n

en
1
2
j j
n
N N

s <
N
j-1
= 27
Ubicamos el valor de
80
40
2
=
en
1
2
j j
n
N N

s < se
encuentra entre 27 y 41.
N
j
= 41
j
n = 14
Me = 60,5
Estadstica Aplicada a la Investigacin Cientfica 45

Propiedades. La mediana es el punto para el que en la distancia eucldea media a los
valores de la muestra es mnima, es decir, para cualquier ae9.
1 1
k k
i i i i
i i
x Men x an
= =
s


Slo tiene en cuenta la posicin de los valores en la muestra y por otro lado tienen
mucho mejor comportamiento que la media cuando hay observaciones anmalas.
3.3. MODA.
Definicin. La moda de una serie de datos es el valor Mo, que se define como el dato que
ms se repite.
La moda no siempre existe, y si existe, no siempre es nica. La moda sirve para sealar el
valor que ms se repite en una variable. La moda es el valor menos importante debido a su
ambigedad.
a) Moda para un conjunto de datos de cantidad pequea.
EJEMPLO.
Sean las notas de un grupo de nios de educacin Inicial, en aprestamiento a las
matemticas:
12, 13, 11, 11, 10, 11, 12, 11 y 12.
Solucin.
La moda es la nota 11, porque existen 4 nios que obtuvieron la nota de 11 y es la mayor
cantidad que los dems notas.
EJEMPLO.
Se realiza una encuesta en el estudiantado de la Universidad, con referencia a la actitud
(excelente (E), bueno (B), Regular (R), Deficiente (D)) de los estudiantes con respecto a sus
profesores cuyos resultados son:
R, D, E, B, D, B, B, D, D, D, R, R, E, R, D, D, R, D, R, D
Solucin.
La moda es la letra D, porque, del encuestado se ha obtenido mayor cantidad de
estudiantes que manifiestan que son deficientes la actitud de estudiante frente a sus
profesores.
b) Moda para datos de cantidades grandes y agrupadas.
Para calcular la moda de n datos tabulados en k intervalos, se ubica al intervalo que tiene
mayor frecuencia (intervalo modal). Luego se utiliza la formula.
Mo =
i i
A
D D
D
L
|
|
.
|

\
|
+
+
2 1
1
; donde:


EJEMPLO. Sobre el estudio inicial del puntaje de ingresos a la Universidad Nac. De
Hvca.
D
1
= n
i
n
i-1
.
D
2
= n
i
n
i+1
.
46 C. Quintanilla C. / A. Cortavarria L.

Solucin
Ubicamos el intervalo con mayor frecuencia absoluta, y es el I
5
, donde n
5
= 14. Luego se
tiene:
i | L
i
L
s
> Y
i
. Fr. Abs
(n
i
).
1 | 26

33 > 29,5 4
2 | 33

40 > 36,5 7
3 | 40

47 > 43,5 6
4 | 47

54 > 50,5 10
5 | 54

61 > 57,5 14
6 | 61

68 > 64,5 10
7 | 68

75 > 71,5 13
8 | 75

82 > 78,5 9
9
| 82

89 >
85,5 3
10 | 89

96 > 92,5 4
80

Reemplazando las diferencias
D
1
= n
i
n
i-1
.
D
2
= n
i
n
i+1
.

D
1
= 14 10 = 4. D
2
= 14 10 = 4.
Reemplazando en la ecuacin,
Mo = 7
4 4
4
54
|
.
|

\
|
+
+
Importante. La formula de la moda slo es aplicable en distribuciones con una sola
frecuencia mxima.

A TRABAJAR CON EL SPPS.
Para usar la herramienta del SPSS, ingrese los datos en la primera columna, como se ha
realizado las operaciones anteriores. Luego ingresar a Anlisis, como se muestran las
figuras o abrir el archivo anterior.


Ingresar los datos de los
resultados del examen de
admisin en la columna
respectiva.
n
i-1
= 10

n
i
= 14

L
i
= 54
n
i+1
= 10

Mo = 57,5
Estadstica Aplicada a la Investigacin Cientfica 47





PUNTUACIONES DE EXAMEN DE ADMISIN
N Vlidos
80
Perdidos
0
Media
60,49
Mediana
60,00
Moda
49(a)
Desv. tp.
16,036
Varianza
257,139
Rango
65
Mnimo
28
Mximo
93
Percentiles 25
49,00
50
60,00
75
72,00

PUNTUACIONES DE EXAMEN DE ADMISIN
100 80 60 40 20
F
r
e
c
u
e
n
c
i
a
10
8
6
4
2
0
Histograma
Media =60,49
Desviacin tpica =16,
036
N =80

a Existen varias modas. Se mostrar el menor de
los valores.


Hacer clic en Anlisis
Estadstica Descriptiva y
Frecuencias.
Elegir la variable (puntajes
de Admisin) y enviar a
variables
Elegir las opciones que
desea obtener (Media,
mediana y moda).
Luego pulsar en
Estadsticos.
Elegir las medidas de
dispersin. Y otros medidas que
desea conocer.
Finalmente pulsar Continuar.
2 C. Quintanilla C. / A. Cortavarria L.

Observacin. Que la media es 60,49, lgicamente defiere de nuestra media que
encontramos y es de 60,65. Donde esta el error?. No existe error, lo que pasa es que la
media que realizamos fue en un conjunto de datos sometidos a tablas de frecuencia y
lgicamente se tiende a perder informacin. En cambio la mquina (SPSS), ha realizado
operacin sin intervalos y cuyo resultado es ese valor de 60,49. Por dicha razn se
recomienda que no deba hacerse abuso del uso de las tablas de frecuencia.

MEDIDAS DE DISPERSIN
Cuando las medidas de Posicin no son suficientes para describir un conjunto de valores de
alguna variable estadstica, los promedios determinan el centro, pero no indican las
dispersin o como estn situados los datos respecto al centro.
Las Medidas de dispersin o variabilidad son nmeros que miden el grado de separacin de
los datos con respecto a un valor central, que generalmente es la media aritmtica. Las
principales medidas de dispersin son:
- El rango o recorrido.
- El recorrido intercuartlico.
- La varianza.
- La desviacin estndar o desviacin tpica.
- El coeficiente de variacin.
Por la naturaleza del curso, solamente las tres ltimas desarrollaremos.
3.4. VARIANZA
La varianza, es una medida que cuantifica el grado de dispersin o de variacin de los
valores de una variable cuantitativa con respecto a su media aritmtica. La varianza es
pequea, si el valor de las variables se concentra al alrededor de la media. En cambio, el
valor de la varianza es grande si los valores de las variables se encuentran alejados del valor
de la media.
La varianza muestral se denota por
2
s y la varianza poblacional se denota por
2
o ,
cuyas unidades de medidas se expresan en unidades de medicin al cuadrado (m
2
, kg
2
, s/
2
, ..
etc.).
DEFINICIN. La varianza o variancia de una poblacin finita de N elementos, se define
como la media aritmtica del cuadrado de las desviaciones de las
observaciones con respecto a su media , y cuya ecuacin es:

N
x
N
i
i
=

=
1
2
2
) (
o
DEFINICIN. La varianza o variancia de una poblacin finita de n elementos de una
variable X, se define media aritmtica del cuadrado de las desviaciones de
las observaciones con respecto a su media. Denotamos:

n
x x
s
n
i
i
=

=
1
2
2
) (

n
x x n
s
k
i
i i
=

=
1
2
2
) (

Estadstica Aplicada a la Investigacin Cientfica 3

Sin embargo, sta sera un estimador sesgado de las varianza poblacional
2
o , adems da la
impresin de que es la misma formula en la muestra y en la poblacin. Es cierto, pero las
medias x y difieren y que raras veces pueden coincidir; Bessel realiza una correccin,
luego la ecuacin para la muestra es:
1
) (

1
2
2

=

=
n
x x
s
n
i
i
Para datos no agrupados.
1
) (

1
2
2

=

=
n
x x n
s
k
i
i i
Para datos agrupados en k intervalos.
Realmente, estas ecuaciones si son estimadores insesgado de la varianza poblacional
2
o (revisar en estimacin puntual de parmetros) , por lo que trabajaremos con dicha
ecuacin.
Propiedades:
i) La varianza de un conjunto de observaciones x
1
, x
2
, x
3
, . . . x
n
siempre es un nmero
no negativo.



ii) La varianza de una constante es cero (0). Significa que si las observaciones x
1
= x
2
= x
3

= . . .= x
n
= b constante, entonces:



iii) Si a cada observacin x
1
, x
2
, x
3
, . . . x
n
se le adiciona una constante b > 0, la nueva
varianza del nuevo conjunto de valores y
1
, y
2
, y
3
, . . . y
n
donde y
i
= x
i
b, coincide
con el valor inicial. Por la propiedad ii).
V(y) = V(x b) V(y) = V(x) V( b) V(y) = V(x) 0.
Por tanto,


iv) Si a cada observacin x
1
, x
2
, x
3
, . . . x
n
se le multiplica una constante b > 0, la nueva
varianza del nuevo conjunto de valores y
1
, y
2
, y
3
, . . . y
n
donde y
i
= ax
i
, es igual a la
varianza original multiplicado por el cuadrado de la constante.

V(y) = V(ax)

v) De las propiedades iii) y iv) se tiene: V(y) = V(ax b), luego desarrollando
encontramos: porque V(b) = 0





V(y) = a
2
V(x)
V(x) > 0
V(b) = 0
V(y) = V(x)
V(y) = a
2
V(x)
4 C. Quintanilla C. / A. Cortavarria L.

EJEMPLO

Sobre el trabajo de investigacin de las puntuaciones de los ingresantes a la UNH. Hallar su
varianza.
Se sabe que la media es x = 60,65.


SOLUCIN.

Como la suma de
(n
i
)(y y )
2
= 21354,2
la varianza es:
1 80
2 , 21354

= s = 270,306329






EJEMPLO.
El Sindicato de Docentes del Magisterio peruano, mediante su reclamo logra obtener unos
aumentos. Hasta antes realizar su pedido, el promedio de haberes de todo el magisterio era
de s/.1150 nuevos soles y una varianza de S/.90 al cuadrado. El incremento obtenido fue de
20%, adems una bonificacin de S/. 100 nuevos soles por dedicacin a la institucin
educativa.
i) Despus del reclamo cuanto equivale el nuevo promedio?.
ii) Cuanto equivale el nuevo aumento ms la bonificacin?.
iii) Cuanto equivale la nueva varianza?.

SOLUCIN.
Sea el incremento el 20% de haber, entonces la ecuacin es:
y = ax + b y = 0,2x + x + b
luego la ecuacin es: y = 1.2x + b
i) Hallando la nueva media.
M(y) = M(1.2x) M(y) = 1,2M(x) . Prop.
i. | Li Ls > Y
i
Frec.Abs.(n
i
) (y
i
y )
2
(n
i
)(y y )
2
1 | 26 33> 29.5 4 790,3225 3 881,29
2 | 33 40> 36.5 7 583,2225 4 082,5575
3 | 40 47> 43.5 6 294,1225 1 764,7350
4 | 47 54> 50.5 10 103,0225 1 030,2250
5 | 54 61> 57.5 14 9,9225 138,9150
6 | 61 68> 64.5 10 14,8225 148,2250
7 | 68 75> 71.5 13 117,7225 1 530,3925
8 | 75 82> 78.5 9 318,6225 2 867,6025
9 | 82 89> 85.5 3 617,5225 1 852,5675
10 | 89 96> 92.5 4 1 014,4225 4 057,69

n = 80
21 354,2
2
s = 270,30633
Estadstica Aplicada a la Investigacin Cientfica 5

M(y) = 1,2(1 150) = 1 380.
ii) Hallar media + la bonificacin.
M(y) = 1,2M(x) +M( b)
M(y) = 1,2(1 150) +100 M(y) = 1480.
iii) La nueva varianza:
V(y) = V(1.2x + b) V(y) = 1,2
2
V(x) +V( b)
V(y) = 1,2
2
(90) +0 V(y) = 129,6.

3.5. DESVIACIN ESTANDAR.
La desviacin tpica cuantifica el error que cometemos si representamos una muestra
nicamente por su media.
1
) (

1
2

=

=
n
x x
s
n
i
i
para datos no agrupados.
1
) (

1
2

=

=
n
y y n
s
k
i
i i
para datos agrupados en k intervalos.

Del EJEMPLO anterior sobre los puntajes de ingresantes a la UNH, se tiene:
La varianza:
2
s = 270,30633
Luego la desviacin tpica es: 3063291 , 270 = s =

3.6. COEFICIENTES DE VARIACIN
Las medidas de dispersin anteriores dependen de las unidades de medida, el
coeficiente de variacin es en cambio, una unidad de medida de dispersin relativa
(adimensional).
100

x
S
CV =
Con el mismo ejercicio anterior tenemos:
100
65 , 60
441 , 16
= CV = 27,12%.
Nota La obtencin de las medidas de posicin se ha detallado sus procedimientos con el
SPSS, y se deja al lector seguir los pasos para encontrar la varianza y desviacin
estndar.

16,44099538
.
6 C. Quintanilla C. / A. Cortavarria L.

A TRABAJAR CON EL SPPS.
Para usar la herramienta del SPSS, ingrese los datos en la primera columna, como se ha
realizado las operaciones anteriores. Luego ingresar a Anlisis, como se muestran las figuras.




PUNTUACIONES DE EXAMEN DE ADMISIN
N Vlidos
80
Perdidos
0
Media
60,49
Mediana
60,00
Moda
49(a)
Desv. tp.
16,036
Varianza
257,139
Rango
65
Mnimo
28
Mximo
93
Percentiles 25
49,00
50
60,00
75
72,00

PUNTUACIONES DE EXAMEN DE ADMISIN
100 80 60 40 20
F
r
e
c
u
e
n
c
i
a
10
8
6
4
2
0
Histograma
Media =60,49
Desviacin tpica =16,
036
N =80


Hacer clic en Anlisis
Estadstica Descriptiva y
Frecuencias.
Elegir la variable (puntajes
de Admisin) y enviar a
variables
Elegir las opciones que
desea obtener (Media,
mediana y moda).
Luego pulsar en
Estadsticos.
Elegir las medidas de
dispersin. Y otros medidas que
desea conocer.
Finalmente pulsar Continuar.
2 C. Quintanilla C. / A. Cortavarria L.

EJERCICIOS.

1. Dos fabricantes de productos educativos XY anuncian que la vida promedio de sus productos
es de 7 aos, utilizndolas en condiciones normales en un laboratorio. Para ello, la UNH que
desea adquirir, realiza una encuesta para determinar si es afirmativo la propuesta de los
fabricantes, cuyo resultado son:
FABRICANTE A: 8, 7, 5, 6, 7, 8, 5, 7, 6, 5, 9, 7, 8, 9, 6, 7, 9, 6, 7, 8
FABRICANTE B: 4, 5, 2, 3, 9, 7, 9, 7, 5, 7, 6, 6, 7, 8, 9, 8, 9, 6, 7, 7, 5.
a. Cul vida promedio seal cada fabricante?.
b. Cul de los materiales educativos representara mejor duracin.
c. Cul de los fabricantes ofrece mejor homogenidad con respecto a la duracin?.

2. La media mnima para aprobar el curso de Estadstica Bayesiana es de 12 puntos. El estudiante
presenta las notas de 12, 13, 11, 9, 8, 11, 10, 12 y 15. Si el alumno no aprueba, cuantos puntos
se debe agregar a cada examen para aprobar?. Hallar la nueva varianza.

3. Se tiene los ponderados acumulados durante los cuatro 6 primeros ciclos de 50 estudiantes, tal
como se muestra:

80 57 65 81 47 53 41 69 76 42
71 74 52 50 54 59 61 85 89 73
41 65 33 35 68 73 55 67 88 66
94 84 85 64 45 55 78 39 94 66
60 77 35 74 77 91 48 60 65 98

a. Construir la tabla de frecuencia.
b. Graficar ni, Ni, hi, y Hi.
c. Hallar la media, mediana y moda.
d. Hallar la varianza, desviacin tpica y coeficiente de variacin.
e. Hallar el Q
1
, Q
3
, D
4
, D
8
, C
25
, y M
750
.

4. Se tiene la siguiente tabla de frecuencias relativas respecto a 300 estudiantes de las
especialidades de Matemtica Fsica y Historia y Ciencias Sociales, cuya distribucin se
encuentra de acuerdo a la edad.

EDADES
|18 - 21> |21 - 24> |24 - 27> |27 - 30> |30 - 33>
h
i
0.15 0.25 0.35 0.15 0.10

a. Hallar la media, mediana y moda de las edades.
b. Hallar la varianza, desviacin tpica y coeficiente de variacin de las edades.
c. Hallar el Q
1
, Q
3
, D
4
, D
8
, C
25
, y M
750
.
d. A partir de que edad es el cuartel superior, y cuantos los conforman.

5. Dada la siguiente tabla de frecuencia incompleta sobre los dimetros de los lpices que utilizan
los estudiantes, cuyas medidas generaron una media de 0,61.

EDADES
|0,20 0,40> |0,40 0,60> |0,60 0,80> |0,80 1,00>
h
i
0.15 0.25 0.40 0.20

a. Completar la tabla de frecuencia y hallar la mediana y moda.
b. Hallar la varianza, desviacin tpica y coeficiente de variacin.

Estadstica Aplicada a la Investigacin Cientfica 3

6. Se tiene una muestra de los salarios de los docentes que trabajan en el sector educacin:

560 613 57 3 775 626 750 635 551 643 604
608 575 613 557 376 622 696 675 686 593
655 727 654 614 685 738 659 628 757 802
668 613 697 765 727 576 754 682 819 647
698 648 665 656 658 763 655 793 650 643
684 712 725 583 733 554 732 557 814 560
658 608 658 805 667 809 681 680 668 718
729 733 733 753 759 744 666 652 736 653
733 749 682 592 693 555 677 635 673 634
679 569 676 620 650 756 623 587 636 598

a. Hallar la media, mediana y moda.
b. Hallar el Q
1
, Q
3
, D
5
, D
7
, C
25
, y M
750
.
c. Hallar la varianza, desviacin tpica y coeficiente de variacin

7. En las ltimas luchas reivindicativas se ha logrado un aumento, con las siguientes propuestas:
PRIMERO: un aumento de 10% y una bonificacin de S/.50 nuevos soles.
SEGUNDO: un aumento de 106 nuevos soles.
d. Cul de las propuestas debera de tomar como mejor alternativa, para el magisterio?.
e. Cul de las alternativas no le conviene al Gobierno?.
f. Si el Magisterio consta de 250 000 profesores, Cunto debe el Estado prever para los pagos
despus del aumento?.
g. Hallar la media y la varianza despus del aumento.

8. En la Especialidad de Matemtica-Fsica son matriculados en el curso de Topologa General, 24
estudiantes llevan el curso por primera vez, 6 llevan por segunda vez y 2 por tercera vez. Se
sabe que 12 es el promedio de notas de los que llevan por primera vez y las notas de los que
llevan por segunda vez en promedio es superior en un 15% de los que llevan por primera vez.
calcular el promedio de notas de los que llevan el curso por tercera vez si la suma total de las
notas es de 410.

9. En una prueba de inteligencia en un rea rural se obtuvo los puntajes. La tabla incompleta se
encuentra por error de la secretaria del Profesor Shara, que ahora requiere completar con los
datos existentes. ( n = 50, c
j
= 20 puntos)


k |li - ls> Yi ni Ni Yi.ni.
1 10 300
2 400
3 23 350
4 17
5 110 1 100

a. Hallar la media, mediana y moda.
b. Hallar el Q
1
, Q
3
, D
2
, D
7.5
, C
25
, y M
750
.
c. Hallar la varianza, desviacin tpica y coeficiente de variacin.
d. Cuntos estudiantes alcanzaron puntajes entre la media y la mediana?

10. La siguiente informacin ha sido obtenida de la secretaria de la FED y corresponde a los
resultados de la evaluacin realizada a los profesores en el ao 2003.

4 C. Quintanilla C. / A. Cortavarria L.

B B C B C B A B B A B D B B
D A D B A A C A A C A A C B
A A A A E A C D E B C C E A
A B D A A B E D A B A B D C
A A C D E A A B A B A C D A

a. Hallar la moda.
Si existe una escala de calificacin como se muestra:
CALIFICACIN
E D C B A
ESCALA |0 a 04> |04 a 08> |08 a 12> |12 a 16> |16 a 20|

b. Hallar la media, la mediana.
c. La media encontrada convertir a la escala de cualidad y explicar el fenmeno.

11. Un estudiante de historia realiza estudio sobre nmero de hijos que tienen las familias de
Huancavelica, luego se obtuvo en 96 familias los siguientes datos:

2 0 5 8 9 2 5 6 1 6 11 6
4 3 3 9 3 0 4 4 8 2 3 8
4 5 6 6 5 1 3 7 7 5 9 5
5 8 4 10 6 8 6 7 3 8 8 8
3 6 2 8 4 9 7 8 5 2 5 9
1 7 5 7 7 5 5 6 9 6 8 6
5 3 9 12 1 8 13 9 8 3 7 5
3 1 5 3 8 5 9 0 4 3 6 2
Fuente: Encuesta 2004 Huancavelica, Historia y CC SS. UNH.

a. Hallar la media, mediana y moda.
b. Hallar la varianza, desviacin tpica y coeficiente de variacin.

12. En la Universidad Nacional de Huancavelica, el coeficiente de variacin de sus 250 profesores
es de 50%. Se realiza un reajuste de sueldos de acuerdo a Ley, todos los sueldos en S/. 1100
nuevos soles, ahora con un C.V. de 40%. Sin embargo la Universidad con una nueva poltica fija
un sueldo mnimo de S/.3500 nuevos soles. Antes del reajuste haban 10 personas que ganaban
S/.3000 en promedio y todos ellos ganaban menos de S/. 3200. Determinar la cantidad de dinero
necesario para cubrir la mensualidad por parte de la Universidad luego del reajuste.

13. Una empresa aseguradora para S/ 30,000 en caso de accidente de carro y cobra una tasa de S/.
1,000. se sabe que la probabilidad de que un carro sufra un accidente en una determinada
localidad es de 3%. Si se sabe que hay 100 carros asegurados, Cunto espera ganar por cada
carro la aseguradora?. Rp. S/. 100. por c/u.

14. Sea X una variable aleatoria con funcin de densidad de probabilidad;


2
0 3
9
0
x
, ..... x
f ( x )
....

s s

Cero en otros caso.



Calcular la media: ( ) ( ) E x xf x dx
+

=
}
.




Estadstica Aplicada a la Investigacin Cientfica 5








CAPITULO III
DOCIMASIA DE HIPTESIS
Ideas bsicas.
En muchas situaciones estamos interesados en tomar una decisin de aceptar o
rechazar una determinada afirmacin basndonos en un conjunto de evidencias. Un ejemplo
comn es el caso en que un individuo esta siendo juzgado por un determinado delito. Con
base en las evidencias (testimonios, fotografas, etc,), el Juez tendr que determinar si es
culpable o inocente el individuo. Podemos, entonces concluir que el Juez formula dos
hiptesis: H
O
: el individuo es inocente y la alternativa H
A
: el individuo es culpable.
Con base a las evidencias presentadas, el Juez puede estar cometiendo un error, pues a pesar
de las evidencias el individuo puede ser inocente. El mismo se dara a la aceptacin de la
Hiptesis Nula como verdadera. En ese caso, el Juez estara considerando como inocente a
un individuo culpable.
Un problema ms prximo del rea de atencin de la estadstica ( a pesar de que la
estadstica a sido utilizada para resolver problemas jurdicos), es el problema de decidir
sobre la eficacia o no de una cierta vacuna utilizada en el combate a una determinada
enfermedad. Los investigadores formulan las hiptesis:
H
0
: La vacuna no es eficiente.
H
A
: La vacuna es eficiente,
En ese caso, un experimento es planeado en un grupo posiblemente grande de
personas seleccionadas al azar recibe vacuna y el resto recibe una sustancia incua. Con
base en los resultados de ese experimento, los investigadores entonces decidirn por H
0
y H
A

. Nuevamente no est descartada los errores que hayan cometidos al considerarse, por
ejemplo la vacuna eficiente ( que la H
0
es falsa) cuando en realidad esta no es o es ( que la
H
0
es verdadera ), esto sera bastante perjudicial para la poblacin. El estadstico
involucrado en la investigacin debe procurar utilizar tcnicas que tengan una mnima
probabilidad de cometer error.
En este captulo, el objetivo de la inferencia estadstica se utilizar para probar la
validez de una afirmacin acerca del valor del parmetro de la poblacin. La afirmacin
expresada generalmente se llama Hiptesis, a estos mtodos se les denominan pruebas
de hiptesis, contraste de hiptesis o docimasia de hiptesis.
3.1. HIPTESIS ESTADSTICA.
Obviamente una hiptesis tautolgica no requiere ninguna comprobacin estadstica,
por EJEMPLO: El viajar maana o no, no es ni falso ni cierto. En general, una hiptesis
6 C. Quintanilla C. / A. Cortavarria L.

es una explicacin propuesta que puede o no ser cierta, por EJEMPLO: Shara me quiere,
est afirmacin puede ser cierta o falsa.
Una hiptesis estadstica es una afirmacin cuantitativa acerca de una poblacin.
DEFINICIN. Llamamos hiptesis estadstica a cualquier afirmacin acerca de la
distribucin de probabilidades de una o ms variables aleatorias.
Denotamos por H
0
(hiptesis Nula) la hiptesis de inters. En el caso que H
0
sea rechazada,
aceptamos como verdadera la hiptesis alterna H
1
.
3.2. HIPTESIS NULA Y HIPTESIS ALTERNA
DEFINICIN. Se llama hiptesis nula (H
0
), a la hiptesis que inicialmente es aceptada
provisionalmente como verdadera y cuya validez ser sometida a la
comprobacin experimental. Una vez ejecutado la parte experimental nos
permitir aceptarla o rechazarla.
Nota: Habitualmente la hiptesis alternativa representa la creencia que el investigador
quiere probar.
DEFINICIN. Se llama hiptesis alterna (H
1
o H
A
), a la hiptesis que se acepta en caso de
que la hiptesis nula haya sido rechazado. Su planteamiento es contrario a
la hiptesis nula.
El ejemplo nos muestra lo opuesto que son H
0
y H
1
, si se considera que es
0
u el
valor del parmetro u de una poblacin cuya distribucin se supone conocida, entonces las
afirmaciones son:
a. H
0
: u =
0
u y H
1
: u =
0
u .
b. H
0
: u =
0
u y H
1
: u >
0
u .
c. H
0
: u =
0
u y H
1
: u <
0
u .
EJEMPLOS:

Hiptesis cientfica Hiptesis
Estadstica
Ho: El promedio promocional en la asignatura de estadstica a
final de cada ciclo es de 12,5.
H
A
: El promedio promocional en la asignatura de estadstica a
final de cada ciclo es diferente a 12,5.
H
0
: =12,5.
H
A
: = 12,5
Ho: En la enseanza de Anlisis Matemtico asistido con
software matemtico, el rendimiento acadmico por los
alumnos alcanza un promedio de 13.
H
A
: En la enseanza de Anlisis Matemtico asistido con
software matemtico, el rendimiento acadmico por los
alumnos alcanza por lo menos un promedio de 13.
H
0
: s13.
H
A
: >13.
Ho: Por lo menos el 90% de los estudiantes de tiempo
completo usarn la biblioteca durante la semana de
exmenes finales.
H
A
: A lo menos el 90% de los estudiantes de tiempo completo
usarn la biblioteca durante la semana de exmenes finales.
H
0
: t >0,9.
H
A
: t < 0,9.
Estadstica Aplicada a la Investigacin Cientfica 7

3.3. PRUEBA DE UNA HIPTESIS ESTADSTICA

Para tomar decisiones estadsticas, se requieren dos hiptesis: Hiptesis nula y la
Hiptesis alterna referidas a un parmetro u .
La hiptesis nula H
0
es la primera hiptesis que se plantea de manera que debe especificar el
valor
0
u del parmetro u en estudio. Por esta razn, algunos autores plantean las hiptesis
nula H
0
: u =
0
u y sta debe de ser probado.
Prueba de hiptesis nula H
0
contra hiptesis alterna H
1
.
Hiptesis Nula Hiptesis Alterna Direccionalidad
H
0
:
E
u =
0
u vs H
1
:
E
u =
0
u .
Prueba bilateral de dos colas.
2 o 2 o
o 1
0
H
0
:
E
u =
0
u vs H
1
:
E
u >
0
u .
Prueba unilateral de cola a la
derecha.
o 1

H
0
:
E
u =
0
u vs H
1
:
E
u <
0
u .
Prueba unilateral de cola a la
izquierda.

o 1


DEFINICIN. Se denomina nivel de significacin de una prueba de hiptesis a la
probabilidad de cometer un error de tipo I (probabilidad :
o
).
Verdadero
Decisin
Ho Verdadera Ho Falsa
Aceptar Ho.
Decisin correcta
Probab: (1 o).
Error tipo II.
Aceptar Ho cuando
en realidad es falso.
Probab: |.
Rechazar Ho.
Error tipo I.
Rechazar Ho cuando en
realidad es verdadero.
Probab: o.
Decisin correcta
Probab: (1 |).


8 C. Quintanilla C. / A. Cortavarria L.

NIVEL DE SIGNFICANCIA.
El nivel de significacin es fijado por el investigador, generalmente es
o
= 0.05
(5%), pero tambin se considera los valores
o
= 0.01 (1%) o
o
= 0.1 (10%). Es
convencional usar el nivel de significancia del 5% en caso de investigaciones cuasi-
experimentales y educativos donde es poco difcil controlar las variables; mientras que en
un laboratorio es al 1%, donde se realiza el experimento con mayor precisin.
IMPORTANTE: Las pruebas de hiptesis slo proporcionan evidencias evaluables
y no razones absolutas o finales para la aceptacin o rechazo de la
hiptesis.

3.4. PRUEBAS DE HIPTESIS PARAMETRICAS.
Porque se denomina pruebas paramtricas?, es cuando se realiza una prueba de
hiptesis y se conoce los supuestos medias (
1

2
) poblacionales, supuestas varianzas
(
2
1
o ,
2
2
o ) poblacionales; es decir si se conoce los parmetros de la poblacin. Adems, no
solamente sus media ni varianzas, sino dependiendo que parmetro que se tenga que probar,
de la distribucin de la poblacin cuya funcin de densidad es f(x;u).
Cabe aclarar, cuando se realiza un trabajo de investigacin generalmente no se conoce el
tipo de distribucin de la poblacin de donde se extrae la muestra, tampoco sus parmetros
de dicha poblacin, pero lo asumimos los supuestos parmetros y tipo de distribucin de la
poblacin como si fuese normal o aproximadamente normal y cometemos el craso error de
utilizar estadsticos que no son correctos o adecuados para dicho tratamiento; por lo que se
sugiere al investigador tener cuidado en el uso de los estadsticos.
a. La distribucin de la poblacin es normal o aproximadamente normal. Se determina
comparando , Me y Mo y la diferencia a lo ms debe ser un punto.
b. Poblaciones con varianzas homogneas (homocedasticidad o dispersin similar).
c. La variable principal de estudio es numrica.
d. Seleccin de muestra es aleatoria.

3.4.1. Pruebas de hiptesis con la distribucin Z.
Sin lugar a duda, el modelo de mayor uso de todas las distribuciones continuas es la
distribucin normal, denominado tambin distribucin gaussiana (atribuido a C.F. Gauss,
quien hizo primero referencia all por los aos 1809 en relacin a la teora de errores de
medidas fsicas; sin embargo, ya haba sido descubierto por Moivre en 1733 como la forma
limitante a la binomial. Tambin fue conocida por Laplace en 1774 pero por un error
histrico a sido acreditada a Gauss)
3
.
Definicin. Una funcin de densidad de una variable aleatoria X, tiene una distribucin
normal y cuyos parmetros son su media y desviacin tpica o. Su funcin de
densidad de probabilidad es:

3
Maria jos Marques de Cantu. PROBABILIDAD Y ESTADISTICA, Edit. McGraw Hill Mxico 1990. pp.
137.
Estadstica Aplicada a la Investigacin Cientfica 9


2
2
1
2
1
) (
|
.
|

\
|

=
o

t o
x
e x f
< x <+; o>0.
La grfica corresponde cuando = 0 y o = 1
y se conoce como la distribucin normal
estndar.
2
2
1
2
1
) (
x
e x f

=
t


La distancia de un valor x a la media es (x ), al expresar esta distancia en
unidades de desviaciones estndares o, obtenemos la ecuacin
o

=
x
z ,
luego la funcin de densidad de probabilidad es expresado de la forma
2
2
1
2
1
) (
z
e z f

=
t
; < z <+;
Ahora ya expresado la distribucin normal estndar, ser de nuestro uso en las
pruebas de hiptesis, porque sin tener alguna idea sobre la distribucin normal es difcil
comprender la tarea.
3.4.1.1. Prueba de hiptesis acerca de dos medias con Varianzas
2
1
o y
2
2
o supuestas
conocidas.
Sean
1
X y
2
X las medias de dos muestras aleatorias independientes de taamos n
1
y
n
2
seleccionadas respectivamente de dos poblaciones independientes, con medias
1
y
2
y
varianzas
2
1
o y
2
2
o respectivas supuestas conocidas.
Definicin. Si las dos poblaciones son normales, entonces, las estadsticas
1
X y
2
X tienen
respectivamente distribucin normal N(
1
;
2
1
o /n
1
) y N(
2
;
2
2
o /n
2
). Luego la
estadstica
1
X
2
X tiene una distribucin aproximadamente normal
N(
1

2
;
2
1
o /n
1
+
2
2
o /n
2
), para n
1
> 2 y n
2
2.
Definicin. Si las dos poblaciones no son normales pero n
1
y n
2
son suficientemente
grandes (n
1
> 30 y n
2
30), entonces, la estadstica
1
X
2
X tiene una
distribucin aproximadamente normal
N(
1

2
;
2
1
o /n
1
+
2
2
o /n
2
).
Luego, segn sea el tipo de distribucin de las dos poblaciones normales o no, la
estadstica
N(0,1)
10 C. Quintanilla C. / A. Cortavarria L.


2
2
2
1
2
1
2 1 2 1
) (
n n
X X
Z
o o

+

=
tiene una distribucin exactamente o aproximadamente normal N(0;1).
Cuyo valor numrico es:
2
2
2
1
2
1
2 1 2 1
) (
n n
x x
z
k
o o

+

= para
1

2
= 0, significa que se
supone verdadera la hiptesis nula.
EJEMPLO.
En la Facultad de Educacin, Esp. Matemticas de la UNH, se desea comparar dos mtodos
A (mtodo tradicional) y B (mtodo asistido por software) la enseanza de la geometra
Diferencial, para ello se seleccion dos muestras aleatorias de tamaos n
1
= 30 y n
2
= 32 ,
cuyos medias respectivas de rendimiento en los dos grupos son
1
x = 12 y
2
x = 15. La
experiencia muestra que las poblaciones de notas en matemticas para ambos grupos estn
distribuidas en forma aproximadamente normal con desviaciones tpicas de 6 y 5
respectivamente.
a) Al 5% de nivel de significancia, se puede concluir que difieren significativamente la
enseanza a travs de los dos mtodos?
b) En caso de ser cierto, cul de los dos mtodos es mejor.
SOLUCIN.
a) Veamos que sucede.
i) Como nos refieren que difieren significativamente, implica que sta es nuestro hiptesis
de investigacin la hiptesis alterna (H
A
). Por lo que proponemos el sistema de hiptesis.
H
0
:
T
=
C

La enseanza de la Geometra Diferencial asistido por un
software no difiere a la enseanza de la Geometra
Diferencial con el mtodo tradicional.
H
A
:
T

C

La enseanza de la Geometra Diferencial asistido por un
software difiere significativamente a la enseanza de la
Geometra Diferencial con el mtodo tradicional.

T
: Media supuesta del mtodo tradicional

C
: Media supuesta del mtodo asistido por software.
ii) Nivel de significancia. o = 0,05 (5%).
iii) Regin crtica.
Como nuestra hiptesis de investigacin dice DIFIERE (no dice si mejor o es peor que
la tradicional, puede ser cualquiera), significa que tiene dos colas. Entonces se tiene
que distribuir o = 0,05 en dos partes.
o/2 = 0,025 1- o/2 = 0,975.
Luego Z
1-o/2
= Z
0,975
= 1,96. Este valor encontramos en la tabla de la distribucin Z.
Estadstica Aplicada a la Investigacin Cientfica 11

iv) Estadstica de contraste.
32
5
30
6
) 0 ( 15 12
2 2
2 1
+
=
=

k
z = 2,13.
v) Decisin.
2 o
2 o
o 1
0




Como z
k
= 2,13 pertenece a la regin de rechazo, se rechaza la hiptesis nula (Ho), y se
acepta la hiptesis alterna. Existe diferencia significativa entre los dos mtodos.
b) Verificamos cual de los dos mtodos es mejor.
Cuando se realiza la prueba de hiptesis, slo aceptamos o rechazamos la hiptesis
nula; sin embargo, no sabemos cual de los dos mtodos fue mejor. Para ello, el intervalo de
confianza es una de las herramientas que muestra cual de ellas fue mejor.
Como se sabe que o = 0,05 y Z
0,975
= 1,96 utilizaremos intervalos de confianza.
2
2
2
1
2
1
2 / 1 2 1 2 1
2
2
2
1
2
1
2 / 1 2 1
n n
z x x
n n
z x x
o o

o o
o o
+ + s s +


12 15 (1,96)
32
5
30
6
2 2
+
T

C
12 15 + (1,96)
32
5
30
6
2 2
+
5,76
T

C
0,24.
Decisin:

Como
T

C
< 0
T
<
C
, El mtodo asistido con software es mejor.

3.4.1.2. Prueba de hiptesis a cerca de dos medias con Varianzas
2
1
o y
2
2
o supuestos
desconocidos.
a) Poblaciones no normales.

T

C

5,76 0,24 0
Regin de rechazo Ho
- 1,96
Regin de rechazo Ho Regin de aceptacin
1,96
z
k
= 2,13
12 C. Quintanilla C. / A. Cortavarria L.

DEFINICIN. Si las dos muestras aleatorias independientes de tamaos n
1
y n
2
se
seleccionan de poblaciones cuyas distribuciones no son normales (se
desconoce las distribuciones de la poblaciones) con varianzas
2
1
o y
2
2
o
supuestas desconocidas, se cumple para las muestras n
1
y n
2

suficientemente grandes (n
1
> 30 y n
2
30), los parmetros
2
1
o y
2
2
o se
estiman con las varianza muestrales
2
1
s y
2
2
s .
Luego, para
1

2
= 0, significa que se supone verdadera la hiptesis nula se
cumple:

2
2
2
1
2
1
2 1 2 1

) (
n
s
n
s
X X
Z
+

=


y tiene una distribucin exactamente o aproximadamente normal N(0;1).
Importante: Es recomendable si el tamao de las muestras son grandes, no utilizar
la distribucin t student, porque no se conoce la distribucin de la
poblacin.
b) Poblaciones normales (Pruebas de Hiptesis con distribucin t Student).
Sea
1
X ,
2
X las medias y varianzas
2
1
s ,
2
2
s de dos muestras aleatoria independientes
de tamaos n
1
y n
2
respectivamente seleccionados de dos poblaciones normales con medias

1
y
2
, varianza
2
1
o y
2
2
o desconocidas, en este caso se recomienda el uso de la distribucin
t- Student; y se presentan dos casos:
b1) Se tienen varianzas supuestas iguales
2
1
o =
2
2
o =o .
Se utiliza cuando se realiza un trabajo de investigacin en una misma poblacin, o en
una poblacin que tengan la misma caracterstica. Por EJEMPLO, cuando se realiza un
trabajo de investigacin en un mismo Institucin Educativa con dos grupos, una de control y
otra experimental.
La ecuacin respectiva es:
2
2
1
2
2 1 2 1

) (
n
s
n
s
X X
T
c c
+

=


tiene una distribucin t student con r = n
1
+ n
2
2 grados de libertad, donde la varianza
comn es:

2
) 1 ( ) 1 (

2 1
2
2 2
2
1 1 2
+
+
=
n n
s n s n
s
c

siendo su valor numrico:
)
1 1
(
) (
2 1
2
2 1 2 1
n n
s
x x
t
c
k
+

=


para
1

2
= 0, significa que se supone verdadera la hiptesis nula.
Estadstica Aplicada a la Investigacin Cientfica 13

b2) Se tienen varianzas supuestas diferentes
2
1
o
2
2
o .
Esta prueba se utiliza cuando las muestras son extradas de poblaciones distintas. Por
EJEMPLO, cuando se realiza un trabajo de investigacin en dos Instituciones educativas
distintas de diferentes regiones, cuyas caractersticas por su puesto son distintos.
Para esta distribucin es:
2
2
2
1
2
1
2 1 2 1

) (
n
s
n
s
X X
T
+

=

tiene una distribucin t student con r grados de libertad,
siendo:
1


2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1

|
|
.
|

\
|
+

|
|
.
|

\
|
|
|
.
|

\
|
+
=
n
n
s
n
n
s
n
s
n
s
r , redondeando al entero ms cercano.
Luego el valor de
2
2
2
1
2
1
2 1 2 1

) (
n
s
n
s
x x
t
k
+

=

,
para
1

2
= 0, significa que se supone verdadera la hiptesis nula.
EJEMPLO.
Con la finalidad de saber el rendimiento en matemtica se tom muestras aleatorias en el
tercer grado en dos colegios centenarios, una en la ciudad de Huancayo (T) y otra en la
ciudad de Huancavelica (C), y las muestras son de 15 y 14 estudiantes respectivamente,
cuyas notas finales en matemtica son:

Hyo 12 08 11 10 15 14 12 14 11 10 8 12 13 11 14
Hvca. 11 12 15 6 8 10 11 10 11 12 11 13 10 11
a) Al 5% de nivel de significancia se puede afirmar que el rendimiento en matemticas
son diferentes. Suponiendo que tienen las poblaciones normales de las notas en
matemtica.
SOLUCIN:
i) Hiptesis.
H
0
:
T
=
C

El rendimiento en matemticas en ambos
colegios es igual.
H
A
:
T

C

El rendimiento en matemticas en ambos
colegios no es igual.
ii) Hallando sus medias y varianzas respectivas.
14 C. Quintanilla C. / A. Cortavarria L.

Huancayo Huancavelica
Media 11,6667 10,79
Desviacin tpica 2,125 2,12
Varianza muestral 4,52 4,49
Tamao de muestra n
T
= 15 n
C
= 14
iii) Grado de libertad y Valor crtico.
Segn el problema, las varianzas supuestas son diferentes (
2
Hyo
o
2
Hvca
o ), porque se
trata de lugares y realidades distintas, adems se sabe que las poblaciones tienen
distribuciones normales. Entonces utilizaremos la estadstica t student para varianzas
de poblaciones supuestas diferentes.
Hallemos el grado de libertad:
1 14
14
49 , 4
1 15
15
52 , 4
14
49 , 4
15
52 , 4
2 2
2

|
.
|

\
|
+

|
.
|

\
|
|
.
|

\
|
+
= r r = 26,88 r = 27.
Buscando el valor Crtico.
Como o = 0,05 y nuestra hiptesis es de dos colas, se divide o = 0,05 en dos partes.
o/2 = 0,025 1- o/2 = 0,975
luego t
1-o/2;r
= t
0,975;27
.= 2,052 (ver tabla de t de student)
vi) Estadstica de contraste.
14
49 , 4
15
52 , 4
) 0 ( 79 , 10 6667 , 11
2 1
+
=
=

k
t = 1,11. t
k
= 1,11.
vii) Decisin:
2 o
2 o
o 1
0




Como t
k
= 1,11 pertenece a la regin de aceptacin de la hiptesis nula (Ho), se acepta la
hiptesis nula y se concluye que el rendimiento en matemticas en ambos colegios es igual.


Regin de rechazo Ho
-2,052
Regin de rechazo Ho Regin de aceptacin
2,052
t
k
= 1,11
Estadstica Aplicada a la Investigacin Cientfica 15

TRABAJANDO CON EL SPSS
Ahora veamos como funciona con el SPSS, los datos de la muestra ingresaremos y seguiremos los
siguientes pasos; para iniciar hacer clic en Vista de Variables.

Luego aparece la ventana de Etiqueta de valor.

Se contina el proceso haciendo clic en Vista de Datos, para luego completar la
informacin.

Una vez concluido con la operacin, ahora hallemos la prueba t de student, siguiendo los pasos.

Ingresar las notas de
ambos colegios en dos
grupos distintos.
Considerar con 1 las notas del colegio
de Huancayo y 2 las notas del colegio
de Huancavelica.
Codificar con 1 y 2 a cada
colegio utilizando
Aadir, y OK
Hacer clic en Analizar, y
Comparar Medias ---> Prueba
de T para muestras
independientes.
Hacer clic en Valores
para codificar.
Poner ttulos en
Etiqueta
16 C. Quintanilla C. / A. Cortavarria L.



luego encontramos el resultado.

Estadsticos de grupo

COLEGIOS Huancayo
y Huancavelica N Media
Desviacin
tp.
Error tp. de
la media
NOTAS DE LOS
ESTUDIANTES DE
CADA COELGIO
Huancayo
15 11,6667 2,12692 ,54917
Huancavelica
14 10,7857 2,11873 ,56625



Prueba de muestras independientes


Prueba de Levene
para la igualdad
de varianzas Prueba T para la igualdad de medias
F Sig. t gl
Sig.
(bilateral)
Diferencia
de medias
Error tp.
de la
diferencia
95% Intervalo de
confianza para la
diferencia
Inferior
Superio
r
Inferior
Superior Inferior Superior Inferior Superior Inferior
Notas
,282 ,600 1,117 27 ,274 ,88095 ,78893 -,73779 2,49969

1,117 26,877 ,274 ,88095 ,78882 -,73791 2,49982



Que fcil, verdad?.
Hacer clic en Definir
Grupos - Colegios
Luego aparece la ventana de
Definir Grupos. Ingresar los
nmeros asignados a los
colegios 1 y 2. y Continua.
Finalmente, Aceptar
Estadstica Aplicada a la Investigacin Cientfica 17

3.4.2. Prueba de hiptesis para diferencia de proporciones.
Si el resultado de un experimento son DICOTOMICOS (xito fracaso, si no),
como el nmero de votos (a favor o en contra), nmero de nios que se ausentan de la
escuela en un da, etc., nos referimos a estos como datos de conteo. Los modelos
apropiados para el anlisis de los datos de conteo son la distribucin binomial, la
distribucin de Poisson, la distribucin multinomial y algunas de las distribuciones discretas.
Sean X
1
y X
2
el nmero de xitos en dos muestras aleatorias independientes de
tamaos n
1
y n
2
seleccionados de dos poblaciones cuya distribucin es Bernoulli B(1, p
1
) y
B(1, p
2
), donde los parmetros desconocidos p
1
y p
2
son las proporciones de xitos
poblacionales respectivos.
Luego las proporciones de xitos muestrales respectivas son:

1
1
1
n
X
P = y
2
2
2
n
X
P =
y para n
1
y n
2
suficientemente grandes (n
1
30 y n
2
> 30), la variable aleatoria.
La raz cuadrada se llama error estndar de la distribucin muestral de diferencia de
proporciones.

|
|
.
|

\
|
+
2 1
1 1
)

1 (

n n
P P
donde P es el valor comn de los estadgrafos y es un estimador insesgada de p
1
y p
2
.
Adems P

puede ser aproximada por:


P

=
2 1
2 2 1 1
n n
P n P n
+
+

luego la estadstica es
|
|
.
|

\
|
+

=
2 1
2 1 2 1
1 1
)

1 (

) (
n n
P P
p p p p
z
k

para p
1
p
2
= 0, significa que se supone verdadera la hiptesis nula y es la que se debe probar.
EJEMPLO.
En una encuesta de opinin estudiantil universitaria en la Facultad de Educacin de la UNH
sobre un proyecto de actividades de proyeccin social, se consult a 250 mujeres y 300
hombres. De las cuales 120 mujeres y 180 hombres aprobaron el proyecto. Frente a esto
resultados, determinar si la diferencia observada es significativa. Usar o = 0,02.
Solucin.
Hiptesis:
H
0
: p
h
= p
m

La proporcin de varones que aprueba el proyecto es igual a la
proporcin de mujeres que aprueban el proyecto.
H
A
: p
h
p
m

La proporcin de varones que aprueba el proyecto es diferente
a la proporcin de mujeres que aprueban el proyecto.
18 C. Quintanilla C. / A. Cortavarria L.

Nivel de significancia. o = 0,02 (2%).
Regin crtica.
Como nuestra hiptesis de investigacin dice DIFERENTE, significa que tiene dos
colas. Entonces se tiene que distribuir o = 0,02 en dos partes.
o/2 = 0,01 1- o/2 = 0,99.
Luego Z
1-o/2
= Z
0,99
= 2,33. Este valor encontramos en la tabla de la distribucin Z.
Proporcin de varones a favor del proyecto:

300
180
1
= P = 0,60 40 , 0
1
= Q
Proporcin de mujeres a favor del proyecto:
250
120
2
= P = 0,48. . 52 , 0
2
= Q
Luego la proporcin comn es:
P =
300 250
) 60 , 0 ( 300 ) 48 , 0 ( 250
+
+
= 0,55. 45 , 0 = Q .
Hallando la distribucin z.
|
.
|

\
|
+
=
=
300
1
250
1
) 45 , 0 )( 55 , 0 (
) 0 ( 48 , 0 60 , 0
2 1
p p
z
k
= 2,81,
Decisin:
2 o 2 o
o 1
0

Como z
k
= 2,81 y pertenece a la regin de rechazo, se rechaza la hiptesis nula (H
o
) y se
acepta la hiptesis alterna H
A
. Tal como se muestra en la figura. Por tanto, la diferencia
observada es significativa.

Regin de rechazo Ho
-2,33
Regin de rechazo Ho Regin de aceptacin
2,33
z
k
= 2,81
Estadstica Aplicada a la Investigacin Cientfica 19

EJERCICIOS.
1. Cules de las siguientes afirmaciones son verdaderas?.









2. Dos profesores de la E.A.P.E.I. FED UNH, desean comparar dos mtodos A y B en el
aprestamiento matemtico en nios de educacin inicial en dos centros educativos diferentes.
Los resultados son las siguientes:

CENTROS
EDUCATIVOS
METODOS muestras MEDIAS x
Varianza
2
s
Centro educativo X A 50 15 16
Centro educativo Y B 60 13 9

a) Al 5% de nivel de significancia, se puede afirmar que los resultados son iguales?
b) En caso de ser diferentes, cual de los dos mtodos tuvo mejor resultado?

3. Se realiza exactamente el mismo examen de razonamiento matemtico para los alumnos
clasificados por sexo (damas y varones) seleccionados al azar de la poblacin del Colegio XYZ
del 4to grado. Las damas que son de 144, obtuvieron una puntuacin promedio de 88 puntos con
una varianza de 47 puntos; en cambio los varones que son de 144 alcanzaron un promedio de 90
puntos con una varianza de 34 puntos.
a) Al 5% de nivel de significancia, se puede afirmar que los resultados son iguales?
b) En caso de ser diferentes, cual de los dos mtodos tuvo mejor resultado?
4. Un investigador en educacin matemtica realiza un estudio en la enseanza del anlisis
matemtico asistido con un software en la UNH. Para ello selecciona aleatoriamente 16 alumnos
para el grupo experimental asistido por computadoras y 14 alumnos para el grupo control que
fue asistido solamente con clases tradicionales. Se sabe por experiencia que la poblacin de las
notas es normal. Los resultados son:
Grupo experimental.
11 15 13 9 11 16 15 15
12 09 14 13 16 12 14 13
Grupo Control .
13 12 13 14 18 10 14
11 09 11 12 11 14 12
a) Se puede afirmar que la enseanza del anlisis matemtico mediante software es
superior a la enseanza tradicional con respecto a sus medias?. Considerar o = 0,05
b) Probar la hiptesis a travs de proporciones, teniendo en cuenta los aprobados? .
Considerar o = 0,05

I. Las pruebas de hiptesis slo proporcionan evidencias absolutas ( )
II.
Cuando se evala la prueba de hiptesis, se evala la hiptesis
de investigacin (H
A
).
( )
III.
Las estimaciones puntuales son iguales a las estimaciones por
intervalos.
( )
IV. Los intervalos de confianza sirve para la prueba de hiptesis. ( )
20 C. Quintanilla C. / A. Cortavarria L.

5. Un profesor de nios excepcionales sostiene que al menos el tiempo promedio de respuesta de
nios con retardo metal a un determinado sonido es de 157 milisegundos. Se selecciona una
muestra aleatoria simple de 25 nios obteniendo el siguiente resultado con respecto al tiempo en
milisegundos:
158 156 160 162 165 162 156 160 158 158 160 163
152 161 165 159 161 160 160 156 157 160 159 161
154 151 162 161 156 158 157 156 155 158 152 153
a. Al 5% de significacin, se acepta o rechaza la afirmacin del profesor.
6. Se hizo un experimento con 11 nios seleccionados al azar, para ver si un entrenamiento previo,
basado en las rompecabezas, contribuye a tener un mejor rendimiento en el aprendizaje del
lgico matemtico. Se aplicaron dos pruebas: una antes y otra despus del entrenamiento; cuyo
resultado es:
Puntuacin
No. del estudiante
1 2 3 4 5 6 7 8 9 10 11
Antes 40 60 70 80 38 68 65 75 52 71 83
Despus 42 65 65 82 35 62 70 75 55 69 85
a. Al 5% de significacin, se acepta o rechaza la afirmacin la hiptesis de que el
entrenamiento previo contribuye a tener mejor rendimiento.
























Estadstica Aplicada a la Investigacin Cientfica 21

3.5. COEFICIENTE DE CORRELACIN Y REGRESIN LINEAL.
Frecuentemente en investigacin estamos interesados en estudiar la relacin entre
dos variables; en el campo educativo, se tiene la relacin entre la habilidad mental y el
rendimiento acadmico en matemticas, o qu relacin existe entre el resultado de un
examen de Matemticas y el curso de Geografa. La naturaleza y grado de relacin entre
estas variables pueden ser analizados a travs de dos tcnicas: Regresin y Correlacin
aunque estn relacionados tienen propsitos e interpretaciones diferentes.
El anlisis de regresin es til para determinar la forma probable de la relacin entre
las variables, cuando hay un fenmeno de causa y efecto; cuyo objetivo es predecir o estimar
el valor de una variable dependiente (Y) a causa de la variable independiente (X).
El anlisis de correlacin, consiste en la medicin del grado de intensidad de
asociacin entre las dos variables sin importar cual es la causa y cual es el efecto. La
correlacin puede ser negativa (cuando al aumentar una variable la otra disminuye) o
positiva (Cuando al aumentar una variable la otra tambin aumenta). En la correlacin no
existe variable dependiente e independiente, solamente son variables aleatorias.
3.5.1 DIAGRAMAS DE DISPERSIN.
El primer paso a realizar en el estudio de la relacin entre dos variables es el
diagrama de dispersin que consiste en representar los pares de valores (X
i
; Y
i
) como puntos
en un sistema cartesiano XY.

COSTO DE LIBRO
22 20 18 16 14 12 10 8
V
E
N
T
A
S

E
N

1
1

D
I
A
S
60
50
40
30
20
10

Figura No. 3.5.1.a Figura No. 3.5.1.b

PRECIO DE VENTA
82 80 78 76 74 72 70 68
C
A
S
A
C
A
S

V
E
N
D
I
D
A
S

A
L

D
I
A
18
16
14
12
10
8
6
4
2
0

Figura No. 3.5.1.c Figura No. 3.5.1.d.
HABILIDAD MENTAL
50 40 30 20 10
E
X
A
M
E
N

D
E

M
A
T
E
M

T
I
C
A
20
18
16
14
12
10
8
6
4
EXAMEN 1 DE LOGICA
20 19 18 17 16 15 14 13 12 11 10 9 8 7 6
E
X
A
M
E
N

1

D
E

M
A
T
E
M

T
I
C
A
20
19
18
17
16
15
14
13
12
11
10
9
8
7
6
22 C. Quintanilla C. / A. Cortavarria L.

Hemos presentado algunos principales diagramas de dispersin: la Figura No 3.5.1.a es una
relacin lineal positiva, la Figura No. 3.5.1.b relacin lineal negativa, Figura No. 3.5.1.c No existe
relacin y la Figura No. 3.5.1.d relacin parablica. El anlisis de regresin puede ser lineal o
no lineal (curvilneo) o lineal mltiple, todo depende de las variables en estudio.
3.5.2. REGRESIN LINEAL SIMPLE
El objetivo principal del anlisis de la regresin es establecer una relacin funcional
entre dos variables relacionados, tomando como datos muestrales (aleatorios), que
constituyan buenos estimadores de la correspondiente relacin poblacional.
Abordaremos la lnea recta, partiendo del EJEMPLO siguiente:
EJEMPLO.
Se desea saber si la habilidad mental de los nios influye en su rendimiento acadmico de
matemtica del estudiante. Para ello se ha tomado informacin de 16 estudiantes.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
20 48 16 37 40 41 46 21 35 38 36 40 35 45 28 32
10 19 8 14 16 17 18 13 14 15 14 16 13 18 12 14
SOLUCIN.
En la figura se muestra el diagrama de dispersin de los datos que corresponde a habilidad
mental y el rendimiento en matemtica.
Como se observa, es una ecuacin lineal
simple cuya ecuacin es:
Y
c
= a + bX,
Existen varios mtodos para calcular la
ecuacin de la regresin, utilizaremos el
mtodo de mnimos cuadrados, por ser
matemticamente ms exacto.

Supongamos que Y
c
= a + bX, es la
ecuacin de la recta, donde Y
c
representa el
valor terico de Y
i
o el valor estimado de Y,
que corresponde a un valor particular de X.
El criterio de mnimos cuadrados requiere
que encontremos las constantes a y b tales
que
2
) (
c i
Y Y

se mnimo (es decir tiende a cero).


Las constantes a y b se llaman coeficientes de regresin, a es la interseccin con el
eje de la ordenadas Y, mientras tanto b es la pendiente de la lnea de mejor ajuste.
(Y
i
Y
c
)
2
.. .. . .. . . . (i)
en esta ecuacin (i) sustituimos el valor de Y
c
= a + bX , luego la ecuacin queda as:
(Y
i
a bX)
2

Para satisfacer la condicin de minimizar las desviaciones de los valores reales de Y
i
con
respecto a la lnea terica, basta con derivar con respecto a a y con respecto a b e
Linear Regression
20,00 30,00 40,00
HABILIDAD MENTAL
10,00
12,50
15,00
17,50
E
X
A
M
E
N

D
E

M
A
T
E
M

T
I
C
A

EXAMEN DEMATEMTICA = 4,13 + 0,30 * habelida


R-Square = 0,89
Figura No. 3.5.2.1
Estadstica Aplicada a la Investigacin Cientfica 23

igualar a cero la derivada; las ecuaciones que resulten, la resolverlas, definirn los valores de
a y b que minimizan dichas observaciones:
Sea, z = (Y
i
a bX)
2
(ii),
y derivamos (ii) con respecto a a:

da
dz
= 2(Y
i
a bX)(1 ) = 0.
Desarrollando se obtiene:
2Y
i
+ 2na + 2bX = 0
2Y
i
= 2na 2bX
Y
i
= na + bX . (iii).
Nuevamente derivamos (ii) con respecto b:

da
dz
= 2(Y
i
a bX)(X ) = 0.
Desarrollando se obtiene:
2XY
i
+2aX + 2bX
2
= 0
2XY
i
= 2aX 2bX
2

XY
i
= aX + 2bX
2
. (iv)
Finalmente, se tiene las ecuaciones (iii) y (iv), llamados sistema de ecuaciones normales.



Al resolver las ecuaciones se obtiene:

=
2 2
2
) (
XY) X)( (
X X n
Y X
a y

=
2 2
) (
X) Y)( (
X X n
XY n
b
Para facilitar el trabajo se ha simplificado la ecuacin de a en trminos de b y queda de
la siguiente manera:
n
X b Y
a

=
Continuamos el desarrollo del ejemplo propuesto.
Se desea saber si la habilidad mental de los nios influye en su rendimiento acadmico de
matemtica del estudiante. Para ello se ha tomado informacin de 16 estudiantes.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
20 48 16 37 40 41 46 21 35 38 36 40 35 45 28 32
10 19 8 14 16 17 18 13 14 15 14 16 13 18 12 14
Y
i
= na + bX

XY
i
= aX + 2bX
2

24 C. Quintanilla C. / A. Cortavarria L.

Si bien es cierto que la tecnologa nos ayuda a operar, pero es necesario saber como se desarrolla.
Aqu presentamos el proceso.

No. del estudiante X Y XY X
2
.
1
20 10 200 400
2
48 19 912 2304
3
16 8 128 256
4
37 14 518 1369
5
40 16 640 1600
6
41 17 697 1681
7
46 18 828 2116
8
21 13 273 441
9
35 14 490 1225
10
38 15 570 1444
11
36 14 504 1296
12
40 16 640 1600
13
35 13 455 1225
14
45 18 810 2025
15
28 12 336 784
16
32 14 448 1024
X =558 Y =231 XY =8449 X
2
=20790
Sustituyendo los valores se tiene:
2
) 558 ( ) 20790 ( 16
) 231 )( 558 ( ) 8449 ( 16

= b b = 0,29545.
16
) 558 )( 29545 , 0 ( 231
= a a = 4,13367.
Luego la ecuacin es
Es la misma ecuacin que aparece en el cuadro corrido con el SPSS que dimos
solucin inicialmente (Figura No. 3.5.2.1).
El valor de a corta al eje corta al eje Y en 4,13367; y el valor de b = 0,29545,
indica que cuando el valor de X aumenta en puntaje aumenta 0,295535 a cada puntaje del
rendimiento en matemtica.
Podemos predecir, si el alumno tiene en habilidad mental de x=47 puntos
Y
c
= 4,13367 + 0,29545X Y
47
= 4,13367 + 0,29545(47).
Entonces su valor de Rendimiento en matemtica es : 18,01982, es decir una nota de 18.
Pero tampoco podemos predecir algo que no es lgico, por ejemplo si consideramos x = 200,
significa que el puntaje en matemticas sera 63,22; esto significa que existen mximos
como mnimos donde la ecuacin se cumple en una situacin real. Sin embargo, la ecuacin
matemtica es simplemente como cualquier ecuacin.
3.5.3. CORRELACIN.
El anlisis de correlacin, busca medir el grado de correlacin entre dos variables o
grado de intensidad de asociacin entre las dos variables X y Y. La medida del grado de
asociacin entre las dos variables se llama coeficiente de correlacin, representado
Y
c
= 4,13367 + 0,29545X.
Estadstica Aplicada a la Investigacin Cientfica 25

universalmente por y el parmetro poblacional, en cuanto al coeficiente de correlacin
de la muestra es r.
El coeficiente de correlacin r de Pearson, toma valores toman valores comprendidos
entre 1 y +1.
Poblacional: 1 +1
Muestral: 1 r +1
Los valores negativos indican una correlacin negativa y los valores positivos una
correlacin positiva.




Para calcular el valor de coeficiente de correlacin de Pearson se usa:
( )( )




=
2 2 2 2
) ( ) ( ) ( ) (
) )( ( ) (
Y Y n X X n
Y X XY n
r

EJEMPLO.
Se desea saber si la habilidad mental de los nios se correlaciona con su rendimiento
acadmico de matemtica. Para ello se ha tomado informacin de 16 estudiantes.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
20 48 16 37 40 41 46 21 35 38 36 40 35 45 28 32
10 19 8 14 16 17 18 13 14 15 14 16 13 18 12 14
SOLUCIN.

No. del est. X Y XY X
2
. Y
2
.
1 20 10 200 400 100
2 48 19 912 2304 361
3 16 8 128 256 64
4 37 14 518 1369 196
5 40 16 640 1600 256
6 41 17 697 1681 289
7 46 18 828 2116 324
8 21 13 273 441 169
9 35 14 490 1225 196
10 38 15 570 1444 225
11 36 14 504 1296 196
12 40 16 640 1600 256
13 35 13 455 1225 169
14 45 18 810 2025 324
15 28 12 336 784 144
16 32 14 448 1024 196
X = 558 Y = 231 XY = 8449 X
2
= 20790 Y
2
= 3465
-1 1
0
Valores dbiles
Valores fuertes
Valores fuertes Valores dbiles
Correlacin nula
26 C. Quintanilla C. / A. Cortavarria L.

Sustituyendo valores
( )( )
2 2
231 ) 3465 ( 16 558 ) 20790 ( 16
) 231 )( 558 ( ) 8449 ( 16


= r r = +0,945153.
Se verifica que existe una correlacin fuerte entre las dos variables.
IMPORTANTE: Sobre prueba de hiptesis.
Por lo general se tiene inters en saber si puede concluirse que 0, si X y Y estn
correlacionados. Por lo general se desconoce el verdadero valor de si se extrae una
muestra de la poblacin, pero si existe el inters de calcular el valor de r a partir de la
muestra y que es el estimador de . Por tanto se puede probar la hiptesis
H
o
: = 0 VS. H
A
: 0
para ver si ste valor de r es de magnitud suficiente como para indicar que las dos (2)
variables (X y Y) estn correlacionados.
DEFINICIN 1. Cuando se desea demostrar H
o
: = 0, se usa el estadstico t de Student
para n 2 grados de libertad, cuya ecuacin es:

2
1
2
r
n
r t

=
DEFINICIN 2. Cuando se desea demostrar H
o
: =
o
(0), donde
o
es distinto de
cero (0), debe utilizarse otro procedimiento para n 25 . Fisher
4
sugiere
que r debe transformarse en z
r
, cuya ecuacin es
)
1
1
ln(
2
1
r
r
z
r

+
= (ln : logaritmo natural).
Puede demostrarse que z
r
tiene una distribucin aproximadamente normal con una
media de.
)
1
1
ln(
2
1

+
= z
y una desviacin estndar de
3
1
n

Luego para probar la hiptesis nula H
o
: =
o
, la estadstica de prueba es

3
1

=
n
z z
Z
r

tiene una distribucin aproximadamente normal.
El lector que no tiene mucho conocimiento en matemtica y tiene dificultad para
realizar operaciones con logaritmos naturales, puede usar la tabla de transformacin de r a z.

4
R.A. Fisher, ON THE PROBABLE ERROR OF AN COEFFIENT OF CORRELATION DEDUCED FROM A SMALL
SAMPLE. Metron, 1 1991, 3 21.
Estadstica Aplicada a la Investigacin Cientfica 27

DEFINICIN 3. Cuando se desea demostrar H
o
: =
o
(0), donde
o
es distinto de
cero (0), debe utilizarse otro procedimiento. Hotelling
5
sugiere para
tamaos pequeos 10 n < 25, el procedimiento de transformarse r en
z*, cuya ecuacin es

n
r z
z z
r
r
4
3
*
+
=
cuya desviacin estndar es
1
1
*

=
n
z
o
Luego, la estadstica de contraste es

1
1
* * *

=
n
z z
Z = ( ) 1 * * * n z z
donde:
n
z
z z
4
3
* *

+
= ; (z** es respecto =
0
).
Para hallar el valor de z
r
y z

recorrer a la definicin 2 del grupo.


EJEMPLO. (para la definicin 1).
Para mostrar al culto lector, probemos los resultados del EJEMPLO anterior a un nivel de
significancia o = 0,05 (5%). Para recordar mostremos el texto literal:
Se desea saber si la habilidad mental de los nios se correlacionan con su rendimiento
acadmico de matemtica. Para ello se ha tomado informacin de 16 estudiantes
La tabla se puede ver en el desarrollo del ejercicio anterior.
SOLUCIN.
Encontramos su coeficiente de correlacin que es
r = +0,945153.
Hiptesis:
H
o
: = 0
H
A
: 0
Los valores crticos
Como nuestra hiptesis alterna es H
A
: 0, entonces es prueba bilateral de dos colas.
Entonces se tiene que distribuir o = 0,05 en dos partes.
o/2 = 0,025 1- o/2 = 0,975.
El grado de libertad es: n 2 = 16 2 = 14.
Luego t
1-o/2; 14
= t
0,975;14
= 2,145. Este valor encontramos en la tabla de la distribucin t
de Student.
Estadstica de contraste.

5
H. Hotelling. NEW LIGHT ON THE CORRELATION COEFFICIENT AND ITS TRANFORMS, Journal
of the Statistical Society. Ser B, 15 (1953), 193 232.
28 C. Quintanilla C. / A. Cortavarria L.

2
1
2
r
n
r t

=
sustituyendo
2
) 945153 , 0 ( 1
2 16
945153 , 0


= t
t = 10,827.
Decisin.
2 o
2 o
o 1
0




Como t = 10,827 pertenece a la regin de rechazo, se rechaza la hiptesis nula (Ho), y se
acepta la hiptesis alterna. Se concluye que las dos variables X y Y estn correlacionados.

EJEMPLO. (para la definicin 2).
Como nuestra muestra es menor que 25, el resultado no es cierto, debemos de tener
cuidado. Esta prueba es correcto cuando la muestra es mayor que o igual que 25 (n > 25).
Solo por situaciones de desarrollo mostrar la operacin. (tener cuidado).
Ahora supongamos que la hiptesis nula H
0
: 0; es decir, H
o
: =
o
y el valor de
no es cero. Del mismo EJEMPLO anterior a un nivel de significancia o = 0,05 (5%).
Solucin.
Hiptesis.
H
o
: = 0,98
H
A
: 0,98 ( puede ser mayor o menor).
n = 16.
Como nuestra hiptesis alterna es H
A
: 0,98, entonces es prueba bilateral de dos
colas. Luego se tiene que distribuir o = 0,05 en dos partes.
o/2 = 0,025 1- o/2 = 0,975.
Luego Z
1-o/2;
= Z
0,975;
= 1,96.
Estadstica de contraste.
-2,145
Regin de rechazo Ho Regin de rechazo Ho
2,145
Regin de aceptacin
t = 10,827
Estadstica Aplicada a la Investigacin Cientfica 29

3
1

=
n
z z
Z
r

pero se requiere calcular los valores de z
r
y z

. Calculemos entonces:
Se conoce el valor de r = 0,945153 r = 0,95.
)
1
1
ln(
2
1
r
r
z
r

+
= )
95 , 0 1
95 , 0 1
ln(
2
1

+
=
r
z = 1,83178.
Se conoce el valor de = 0,98.
)
1
1
ln(
2
1

+
= z )
98 , 0 1
98 , 0 1
ln(
2
1

+
=

z = 2,29756.
Ahora la estadstica de contraste:
3
1

=
n
z z
Z
r

3 16
1
29756 , 2 83178 , 1

= Z = - 1,6793
lo cual aceptaramos la hiptesis nula, esto ocurre porque n < 25, por lo que no es
recomendable usar este estadstico. Solamente se usa para mayores que 25. Ya habamos
pronosticado que no funcionara.
EJEMPLO. (para la definicin 3).
Utilizando la definicin 3 , el resultado es real.
Ahora supongamos que la hiptesis nula H
0
: 0; es decir, H
o
: =
o
y el valor de
no es cero. Del mismo EJEMPLO anterior a un nivel de significancia o = 0,05 (5%).
Solucin.
Hiptesis.
H
o
: = 0,98
H
A
: 0,98 ( puede ser mayor o menor).
n = 16.
Como nuestra hiptesis alterna es H
A
: 0,98, entonces es prueba bilateral de dos
colas. Luego se tiene que distribuir o = 0,05 en dos partes.
o/2 = 0,025 1- o/2 = 0,975.
Luego Z
1-o/2;
= Z
0,975;
= 1,96.
Estadstica de contraste.
Antes de utilizar el estadstico hallemos z* y z**
Se conoce el valor de r = 0,945153 r = 0,95.
)
1
1
ln(
2
1
r
r
z
r

+
= )
95 , 0 1
95 , 0 1
ln(
2
1

+
=
r
z = 1,83178.
30 C. Quintanilla C. / A. Cortavarria L.

Se conoce el valor de = 0,98.
)
1
1
ln(
2
1

+
= z )
98 , 0 1
98 , 0 1
ln(
2
1

+
=

z = 2,29756.
Luego sustituyendo
n
r z
z z
r
r
4
3
*
+
=
) 16 ( 4
95 , 0 ) 83178 , 1 ( 3
83178 , 1 *
+
= z
z* = 1,73107
n
z
z z
4
3
* *

+
=
) 16 ( 4
98 , 0 ) 29756 , 2 ( 3
29756 , 2 * *
+
= z z** = 2,17455.

La estadstica de contrastes.

1
1
* * *

=
n
z z
Z
1 16
1
17455 , 2 73107 , 1

= Z
Z = - 1,7175.
Decisin.
2 o
2 o
o 1
0



Como Z = - 1,7175 y es mayor que Z
0,975;
= - 1,96; sta se encuentra en la regin de
aceptacin de la hiptesis nula. Se acepta la hiptesis y que la correlacin poblacional es de
= 0,98.
-1,96
Regin de rechazo
Ho
Regin de rechazo
Ho
1,96
Regin de aceptacin
Z = -1,72
Estadstica Aplicada a la Investigacin Cientfica 31

A TRABAJAR CON EL SPSS
Seguir los siguientes pasos.
i) Ingresar los datos como en la figura








ii) Una vez realizado ubicarse en Anlisis ---> Regression ---> Linear y aparece la figura de
abajo, una vez terminada la operacin hacer clic en OK



en el resultado se muestra el coeficiente de correlacin encontrado en el ejercicio, el valor de r de
Pearson fue de 0,945.

Model Summary
Model R R Square Adjusted R
Square
Std. Error of
the Estimate
1 ,945 ,893 ,886 ,99508
a Predictors: (Constant), HABILIDAD MENTAL

Tambin encontramos los valores de los coeficientes de la regresin lineal para completar la
ecuacin Y
c
= a + bX , donde el valor de a y b son 4,134 y 0,295 respectivamente
Coefficients
Unstandardiz
ed
Coefficients
Standardized
Coefficients
t Sig.
Model B Std. Error Beta
1 (Constant) 4,134 ,984 4,202 ,001
HABILIDAD
MENTAL
,295 ,027 ,945 10,827 ,000
a Dependent Variable: EXAMEN DE MATEMTICA
Adems la correlacin ya se ha resuelto automticamente, se muestra en el cuadro
precedente. Recordemos la Hiptesis:
H
o
: = 0 VS. H
A
: 0
Ingresar los datos de las
dos variables
Registrar las variables con
sus especificaciones
Seleccionar
como
muestra el
EJEMPLO.
32 C. Quintanilla C. / A. Cortavarria L.

Probamos la t de Student cuyo resultado es t = 10,827.
Coefficients
Unstandardiz
ed
Coefficients
Standardized
Coefficients
t Sig.
Model B Std. Error Beta
1 (Constant) 4,134 ,984 4,202 ,001
HABILIDAD
MENTAL
,295 ,027 ,945 10,827 ,000
a Dependent Variable: EXAMEN DE MATEMTICA




iii) Si deseamos hallar la ecuacin de la regresin lineal y el cuadro respectivo de las dispersiones
con los datos se deber seguir los siguiente pasos:


Ir a Graph ---> Interactive --->Scaterplot y aparece el cuadro.


y aparece la figura

Linear Regression
20,00 30,00 40,00
HABILIDAD MENTAL
10,00
12,50
15,00
17,50
E
X
A
M
E
N

D
E

M
A
T
E
M

T
I
C
A

EXAMENDEMATEMTICA = 4,13 + 0,30 * habelida


R-Square = 0,89

Seleccionar la
variable dependiente
e independiente y
OK
Hacer doble Clic y
debe aparecer el
cuadro de llamada.
El valor de t = 10,827, encontrado en la
prueba de hiptesis del EJEMPLO 1.
Estadstica Aplicada a la Investigacin Cientfica 33



Finalmente aparece el resultado:








Elegir NO
COLOR y OK
La ecuacin de
la Regresin
Lineal
La recta y los puntos
de dispersin.
34 C. Quintanilla C. / A. Cortavarria L.

EJERCICIOS
1. En un reporte de investigacin realizada en 100 personas, se obtiene la variable X que
corresponde al nmero de litros de bebidas alcohlicas consumidas, y la variable Y corresponde
al nmero de accidentes de automviles por cada 100 personas que ingieren bebidas alcohlicas.

X 2 3 4 5 6 7 8 9 10
Y 8 10 12 18 20 22 25 28 30

a. Calcule la ecuacin de regresin de X sobre Y.
b. Calcule el coeficiente de correlacin.
c. Pruebe con una hiptesis la correlacin.
2. Un investigador en el rea de matemtica de la UNH obtiene la siguiente informacin con
respecto a horas de estudio (X) para prepararse para el examen de matemticas, y obtener la
calificacin en dicho examen (Y).

X 1 2 2 3 3 3,5 4 4 4,5 4,5 5 5,5 5,5 6
Y 8 10 12 12 16 14 16 12 14 16 18 16 18 20

a. Calcule la ecuacin de regresin de X sobre Y.
b. Trace la grfica (diagrama de dispersin).
b. Calcule el coeficiente de correlacin.
c. Pruebe con una hiptesis la correlacin.
3. Un grupo de 8 estudiantes que se preparan para un examen de admisin se sometieron a una
prueba de habilidad mental (X), luego relacionaron con los puntajes obtenidos (Y). el resultado se
tiene en le recuadro.

No. Habilidad Mental (X). Examen de Admisin (Y).
1 Flix 6 15
2 Vctor 10 18
3 Julio 15 25
4 Max 20 32
5 Ofelia 25 36
6 Abel 30 40
7 Norma 35 45
8 Gaby 40 55

a. Calcule la ecuacin de regresin de X sobre Y.
b. Trace la grfica (diagrama de dispersin).
c. Calcule el coeficiente de correlacin.
d. Pruebe con una hiptesis la correlacin.
4. Un estudiante de matemtica desea ver si existe correlacin entre las notas obtenidas en las
asignaturas de letras y las asignaturas de matemticas.
Matemtica 12 13 10 14 12 11 16 15 12 12 15
Letras 18 16 14 12 11 13 14 15 16 12 14
a. Calcule la correlacin entre ambas asignaturas.
b. Existe regresin lineal, se puede hallar su ecuacin?, explique.
5. Se toma una muestra de 30 estudiantes de la especialidad de matemtica, y se realiza una
relacin entre peso y estatura, cuyo resultado se presenta.
Estadstica Aplicada a la Investigacin Cientfica 35

Alumno. Estatura (m) Peso (kg) Alumno. Estatura (m) Peso (kg)
1
1,63 65
16
1,68 65
2
1,73 70
17
1,56 58
3
1,55 54
18
1,85 89
4
1,85 85
19
1,70 68
5
1,75 70
20
1,69 70
6
1,64 68
21
1,58 54
7
1,54 60
22
1,70 73
8
1,65 60
23
1,67 65
9
1,58 50
24
1,62 66
10
1,83 78
25
1,80 86
11
1,70 90
26
1,55 58
12
1,51 56
27
1,58 64
13
1,64 68
28
1,70 74
14
1,50 45
29
1,76 80
15
1,70 69
30
1,50 60

a. Trace la grfica (diagrama de dispersin).
b. Halle la ecuacin de la regresin si existe
c. Calcule el coeficiente de correlacin y.
d. Pruebe con una hiptesis la correlacin.


36 C. Quintanilla C. / A. Cortavarria L.

3.6. PRUEBAS DE HIPTESIS NO PARAMETRICA.
A diferencia de las pruebas de hiptesis paramtricas que tienen significancia y incluye
una lista de prerrequisitos, as como estn basados en supuestos de que las poblaciones
estn distribuidos normalmente con parmetros media y varianza. En las pruebas de
hiptesis No paramtricas, no interesa el tipo de distribucin de la poblacin, ni sus
parmetros (no se hacen suposiciones), apenas se suponen la independencia de los datos.
Sin embargo las pruebas no paramtricas tiene algunas desventajas como las siguientes:
i) Existe perdida de informacin.
ii) La potencia de estas pruebas es menor que la potencia de las pruebas paramtricas.
iii) Tienden a ser conservadoras; es decir, que tienden a conducir a la aceptacin de la
hiptesis nula con ms frecuencia de lo que se debera.
iv) Es menos confiable.
Sin embargo, es un buen instrumento para realizar los trabajos mientras los datos son
ms pequeos. En general, es verdad que cuanto menos se suponga, tanto menos puede
inferirse de un conjunto de observaciones; pero tambin es verdad que cuanto menos se
suponga, tanto ms se amplia la aplicabilidad de nuestro mtodo.
Las principales que tenemos son:
- U de Mann Whitney (para 2 muestras independientes).
- T de Wilcoxon (para 2 muestras dependientes).
- H de Kruskal Wallis (para K muestras independientes).
- ANOVA de Friedman (para K muestras dependientes).
- Chi cuadrada (para 1 sola muestra).
- Existen muchas otras pruebas ms que el lector podra investigar, pero en el curso
slo tomaremos las pruebas estadsticas citadas.
3.6.1. Pruebas de Hiptesis con Chi Cuadrada.
Cuando se realiza un trabajo de investigacin en educacin, a menudo se presentan
situaciones donde es necesario verificar la hiptesis de investigacin, y la ms conocida es la
chi cuadrada (_
2
), y en su forma general se llama pruebas concernientes de diferencias de
k proporciones.
Presentamos los arreglos correspondientes
EXITOS FRACASOS
MUESTRA 1 x
1
. n
1
x
1

MUESTRA 2 x
2
. n
2
x
2


MUESTRA k x
k
. n
k
x
k

La chi cuadrada se puede manejar en forma paramtrica y no paramtrica; para los
fines de este libro nos restringiremos a la forma no paramtrica.
La prueba Chi cuadrada relativa a frecuencias.
Es un mtodo til para probar la hiptesis relacionado a la diferencia entre conjunto de
frecuencias observadas en una muestra y el conjunto correspondiente de frecuencias tericas
o esperadas.
La ecuacin correspondiente del estadstico es:
Estadstica Aplicada a la Investigacin Cientfica 37

_
2
=


i
i i
E
E O
2
) (

O
i
: Frecuencia observada de realizacin de un acontecimiento determinado.
E
i
: Frecuencia esperada o terica.
Es necesario tomar en cuenta el grado de libertad (r), y se obtiene de la tabla de contingencia
r = (f 1)(k 1).
Donde: f : nmero de filas.
k : nmero de columnas.
Dado el nivel de significancia o para r grados de libertad, en la tabla el valor c =
2
(1 ),r o
_


que viene a ser el punto crtico de la prueba.

Regla de decisin:
Si _
2
(cal)
> c, se rechaza la hiptesis nula
Ho, caso contrario se aceptar la hiptesis
nula Ho.



EJEMPLO.
Un estudiante de Ciencias Sociales preocupado en las elecciones realiza un seguimiento. Un
partido XK asegura que el 85% de la poblacin est a su favor. Por lo que el estudiante
obtiene una muestra aleatoria de 2 500 ciudadanos; de ellos 1800 favorecen al partido XK.
A la luz de los resultados, determinar si es falso lo que aseguran los representantes de XK.
Usar nivel de significancia 1%.
SOLUCIN.
Hiptesis.
Ho : p = 0,85
H
A
: p < 0,85
Calculando las frecuencias esperadas.
frecuencias Actitud Total
Favorecen No favorecen
Observada (O
i
) 2050 450 2500
Esperada (E
i
) 2125 375 2500
Se afirma que el 85% de los ciudadanos favorecen a XK, entonces:
E
1
= (85%)(2500) = 2 125
E
2
= (15%)(2500) = 375. o 2500 2125 = 375.

o
1-o
Regin crtica
c
38 C. Quintanilla C. / A. Cortavarria L.

Calculando

2
cal
_ =
2 2
(2050 2125) (450 375)
2125 375

+ ,
2
cal
_ = 17,65.
El valor crtico al 1%.
Se tiene k = 2 filas y c = 2 columnas,
entonces r = (2-1)(2-1) = 1,
luego
2
(1 ),r o
_

=
2
(0,99), 1 r
_
=
= 6,64. (ver tabla de Chi cuadrada).
Cuando se compara ambos valores, el
2
cal
_ = 17,65 calculado es mayor que de la tabla. Por
tanto, rechazamos Ho. De aqu podemos concluir No es cierto lo que afirma XK.

Importante: cuando se tiene un solo grado de libertad se puede aplicar una prueba de
distribucin normal.
EJEMPLO.
Resolver el ejemplo anterior aplicando la distribucin normal.
SOLUCIN.
Hiptesis.
Ho : p = 0,85
H
A
: p < 0,85
La proporcin muestra para n = 2500 es:

2050
0,82
2500
P = = 0,18 Q =
Calculando z.
P p
z
pq
n

= ; sustituyendo en

0,82 0,85
(0,85)(0,15)
2500
z

= = - 4,20.

Regin crtica para o = 0,01.
(1 o) = 1 0,01 = 0,99.
Adems nuestra hiptesis tiene una sola cola y a la izquierda.
Entonces Z
1-o
= Z
0,99
= 2,33. (ver tabla de distribucin z).


Estadstica Aplicada a la Investigacin Cientfica 39

Decisin.

o 1




Como z
k
= - 4,20 y pertenece a la regin de rechazo, se rechaza la hiptesis nula (H
o
) y se
acepta la hiptesis alterna H
A
. Tal como se muestra en la figura. Se concluye que, lo que
afirma XK no es cierto.

EJEMPLO.
Determinar con base en los datos muestrales obtenidos que se presentan en la tabla,
si la proporcin verdadera de compradores que favorecen el Plumn M sobre el Plumn N
es la misma en las tres ciudades. Considerar o = 0,05 (5%.).

Ciudades
Actitud
Total Favorecen al
plumn M
Favorecen al
plumn N
Ayacucho 232 168 400
Huancayo 260 240 500
Tacna 197 203 400
689 611 1300
SOLUCIN.
Hiptesis.
Ho : p
A
= p
H
= p
T


H
A
: p
A
; p
H
; p
T
no son todas iguales.

Hallando las frecuencias esperadas.
E
11
= (689)(400)/1300 = 212.
E
21
= (689)(500)/1300 = 265.
E
31
= (689)(400)/1300 = 212.
E
12
= (611)(400)/1300 = 188
E
22
= (611)(5000)/1300 = 235
E
32
= (611)(400)/1300 = 188
- 2,33
Regin de rechazo
z
k
= - 4,20

40 C. Quintanilla C. / A. Cortavarria L.

Ciudades
Actitud
Total Favorecen al
plumn M
Favorecen al
plumn N
Ayacucho 232 212 168 188 400
Huancayo 260 265 240 235 500
Tacna 197 212 203 188 400
689 611 1300




2
cal
_ = +

212
) 212 197 (
265
) 265 260 (
212
) 212 232 (
2 2 2


188
) 188 203 (
235
) 235 240 (
188
) 188 168 (
2 2 2


2
cal
_ = 6,4733.
Regin crtica para o = 0,05.
Se tiene k = 3 filas y c = 2 columnas, entonces r = (3-1)(2-1) = 2,
luego
2
(1 ),r o
_

=
2
(0,95), 1 r
_
=
= 5,99. (ver tabla de Chi cuadrada).
Como el valor de
2
cal
_ = 6,4733 es mayor que el valor crtico 5,99 se rechaza la hiptesis
nula. Es decir, las proporciones verdaderas de compradores que favorecen el Plumn M
sobre el Plumn N en las tres ciudades no son las mismas.

E
11
=212
E
21
=265
E
31
=212
E
12
=188
E
22
=235
E
32
=188
Estadstica Aplicada a la Investigacin Cientfica 41

A TRABAJAR CON EL SPSS.
Se inicia aperturando una nueva hoja de trabajo.


Hacer clic en Values en CIUDADES DE VENTA y registrar la codificacin.

Hacer clic en Values en MARCA DE PLUMONES y registrar la codificacin

Una vez realizado toda la operacin ir al men Data ---> Weight Case (ponderar casos) y
aparece el cuadro de dilogo

Rotular los
nombres y
Ttulos.
Hacer clic en
Data View.
Ingresar en la columna
fila los nmeros 1, 2 y 3,
que representan a
Ayacucho, Hunacayo y
Tacna.
Ingresar en la
columna (columna) la
opcin de actitud con
1 y 2, combinando
fila y columna.
Ingresar los valores de
la tabla, fila y columna.
(frecuencia Observada).
Ingresar la codificacin
de las ciudades como se
muestra el ejemplo
Ingresar la
codificacin de la
marca de los
plumones como se
muestra el ejemplo.
Finalizar OK.

42 C. Quintanilla C. / A. Cortavarria L.



Iniciar en el men Analyze ---> Descriptive Statistic y ---> Crosstab


Pulsar el botn Statistic luego seleccionar Chi square y contingency Coefficient y
Continue. Pulsar el botn Cells luego seleccionar Expected (frecuencia esperada), y
continue y finalmente OK.
Se obtiene la tabla incluido las frecuencias esperadas.

CIUDADES DE VENTAS * MARCA DE PLUMONES
Crosstabulation
CIUDADES DE
VENTAS
MARCA DE PLUMONES Total
PLUMON M PLUMON N
AYACUCHO
232 168 400
212,0 188,0 400,0
HUANCAYO
260 240 500
265,0 235,0 500,0
TACNA
197 203 400
212,0 188,0 400,0
Total 689 611 1300
689,0 611,0 1300,0

Chi-Square Tests
Value df Asymp. Sig.
(2-sided)
Pearson
Chi-Square
6,473 2 ,039
N of Valid Cases 1300
a 0 cells (,0%) have expected count less than 5. The minimum expected count is 188,00.
Symmetric Measures
Value Approx. Sig.
Nominal by
Nominal
Contingency
Coefficient
,070 ,039
N of Valid Cases 1300
a Not assuming the null hypothesis.
b Using the asymptotic standard error assuming the null hypothesis.

Seleccionar frecuencia
Observada y hacer clic en
Weight cases by, como
muestra el ejemplo.
Finalizar OK.

Seleccionar Ciudades de
venta (fila).

Seleccionar Marca de
plumones (columna).
Finalizar OK.

Hacer clic en Statistic .

Estadstica Aplicada a la Investigacin Cientfica 43

Correccin de yates.
La correccin fue propuesta en 1934, haciendo que las frecuencias observadas
(discretas) se aproximen a una distribucin continua, solo en casos de tablas de 2x2.
Consideramos que si puede usar cuando la muestra es pequea n < 50 , o algunas o
todas las frecuencias de las celdas son menores que 5 se puede aplicar el Chi cuadrado
corregida por Yates.
2
cal
_ =
| |
) )( )( )( (
5 , 0 ) (
d b c a d c b a
n bc ad n
+ + + +


si la tabla es de 2x2.

a b a+b
c d c+d
a+c b+d

Con respecto a la correccin de Yates para tablas de 2x2 existe controversia entre
autores. Por EJEMPLO, citado por Wayne W. Daniel (1994; 483) Grizzle, Lancaster,
Pearzon, y Placket han cuestionado su uso. El trabajo de Grizzle, en particular, ha reforzado
el caso en contra el uso de sta correccin, basndose en que, con demasiada frecuencia,
conduce a una prueba demasiada conservadora; es decir, el uso de la correccin conduce con
demasiada frecuencia al no rechazo de la hiptesis nula
6
. En general se ha convenido no se
requiere correccin para tablas de contingencia mas grandes.
3.6.2. Pruebas de Hiptesis de Wilcoxon
Esta prueba sirve para realizar la prueba de hiptesis cuando se trabaja con un slo
grupo; en este caso cuando se tiene una prueba de entrada y salida en un solo grupo,
cuyo diseo de investigacin es
O
1
X O
2
.
O
1
: Pre test.
X: Aplicacin de la variable.
O
2
: Post Test.
DEFINICIN. La prueba T de Wilcoxon considera la magnitud relativa, as como la
direccin de las diferencias y da mayor peso al par que muestra una
diferencia grande entre las dos condiciones.
Para encontrar la suma de sus rangos, es necesario tomar los valores de los rangos de las
pruebas de entrada y salida. Y multiplicar con el valor de la diferencia entre las dos pruebas
del individuo.
EJEMPLO,
Se tiene las calificaciones de examen de Trigonometra, en un solo seccin, para
verificar si causa efecto el uso de cierto mtodo a un nivel de significancia de 5% se propone
la siguiente hiptesis: que si influye el nuevo mtodo.

6
Wayne W. Daniel. BIOESTADISTICA, Edit UTEHA, Mxico 1994.
44 C. Quintanilla C. / A. Cortavarria L.

No. Nombres
Calificacin
Entrada Salida
01 Csar 10 12
02 Hugo 08 13
03 Wilder 12 13
04 Ofelia 11 11
05 Mx. 12 14
06 Vctor 09 08
07 Roco. 13 14
08 Shara 12 13
09 Abel. 11 10
10 Marcelino 10 11
11 Rufino 12 14
12 Teobaldo. 09 12

SOLUCIN.
Hallando el rango de la diferencia, se ordena en forma ascendente los valores de la
diferencia sin considerar los signos:
Orden 1 2 3 4 5 6 7 8 9 10 11
Diferencia 1 1 +1 +1 +1 +1 +2 +2 +2 +3 +5
Rango i), ii), iii), 3,5 3,5 3,5 3,5 3,5 3,5 8 8 8 10 11
i) Cuando existe el valor CERO (0), sta no se considera. En este caso la alumna
Ofelia tiene nota de 11 en prueba de entrada y nota de 11 en prueba de salida, lo
que genera cero (0) en la diferencia.
ii) Para hallar los rangos de 1 y +1, se suma los ordenes que les correspondes y
luego se divide entre la cantidad de ordenes.
1 2 3 4 5 6
3, 5
6
+ + + + +
= .
Luego su rango de 1 y +1 es 3,5.
iii) Para hallar los rangos de 2 y +2, se suman sus ordenes que son 4 y 5
7 8 9
8
3
+ +
= . Luego el rangos de 2 y +2 es 8.
iv) Como 3 y 5 son nicos, se considera su nico orden, que es 10 y 11 en cada uno de
ellos.
v) Finalmente el valor encontrado en la fila de Rango, se multiplica con la diferencia
encontrada en la columna 5.
Estadstica Aplicada a la Investigacin Cientfica 45


No. Nombres
Calificacin
Diferencia
Rango de
la
diferencia
Entrada Salida
01 Csar 10 12 +2 +16
02 Hugo 08 13 +5 +55
03 Wilder 12 13 +1 +3,5
04 Ofelia 11 11 0
05 Mx. 12 14 +2 +16
06 Vctor 09 08 1 3,5
07 Roco. 13 14 +1 +3,5
08 Shara 12 13 +1 +3,5
09 Abel. 11 10 1 3,5
10 Marcelino 10 11 +1 +3,5
11 Rufino 12 14 +2 +16
12 Teobaldo. 09 12 +3 30

T
()
= 7


Regla de decisin. Para contrastar la hiptesis de investigacin es necesario probar la
hiptesis nula.
a) Se elige el valor de o, y dependiendo si la prueba es de una cola o de dos colas se
utiliza la tabla T de Wilcoxon.
b) si la hiptesis nula fuese verdadera, se esperara que los rangos estuvieran igualmente
divididos entre valores positivos y negativos y la suma de sus rangos sean
aproximadamente iguales.
c) Se busca la suma de T
()
y T
(+)
en la columna del rango de la diferencia, y se elige
el menor para obtener T
C
s T

.
d) Si se obtiene el T
C
s T

respectivo, se rechaza la hiptesis nula, y se acepta la


hiptesis alterna; es decir que son diferentes.
Del ejemplo anterior, se tiene que T
()
= 7, y como se requiere informacin de que el
mtodo influye significativamente, luego como la hiptesis es de dos colas, entonces
T
;n
= T
0,05;n=11
= 11, para n = 11, porque existe un valor cuyo resultado es cero (0).
Luego probando se tiene T
C
s T

-7s 11 , el cual correcto. Por tanto, se


rechaza la hiptesis nula, y se acepta la hiptesis alterna; es decir, el mtodo tuvo
efecto.
IMPORTANTE.
Cuando n > 25, no podemos usar la tabla T de Wilcoxon. Sin embargo como la muestra es
suficientemente grande se aproximan a una distribucin normal (Z).
a) La ecuacin de la distribucin Z:
Calificacin de salida
menos de entrada.
Se multiplica el valor
obtenido del rango y la
diferencia
46 C. Quintanilla C. / A. Cortavarria L.

Z =
( )
T
T E T
o

, donde T es T
()
o T
(+)
que es el menor.
b) Luego hallemos la media (valor esperado).
E(T) =
( 1)
4
n n +

c) La desviacin tpica.
( 1)(2 1)
24
T
n n n
o
+ +
=

d) Luego la decisin toma los valores crticos para Z

en la tabla de distribucin
normal., dependiendo si son de dos colas o de una sola cola.

El ejemplo anterior.

Ahora, desarrollaremos con la distribucin Z (esto ocurre cuando n > 25). Sin embargo,
nuestra muestra es pequea n = 11, y cuando el SPSS realiza la operacin la prueba de
Wilcoxon desarrolla a travs de la distribucin Z, demostraremos como se desarrolla.
Hallando su media, para ello los valores que resulten cero (0) en la diferencia no se
consideran, en nuestro caso en al tabla tenemos 12 alumnos, pero la Estudiante Ofelia no
ser considerado por resultar cero (0).
e) La media (valor esperado).
E(T) =
11(11 1)
33
4
+
=
f) La desviacin tpica.
11(11 1)(2(11) 1)
11, 25
24
T
o
+ +
= =
g) Luego se utiliza la distribucin Z:
Z =
7 33
2, 31
11, 25

= , donde T es T
()
.
Como se propone la hiptesis de investigacin que si influye el nuevo mtodo al 5%
de nivel de significancia, verificamos que la hiptesis tiene dos colas, la influencia puede ser
negativo o positivo.
Como nuestra hiptesis de investigacin dice DIFIERE, significa que tiene dos colas.
Entonces se tiene que distribuir o = 0,05 en dos partes.
o/2 = 0,025 1- o/2 = 0,975.
Luego Z
1-o/2
= Z
0,975
= 1,96. Este valor encontramos en la tabla de la distribucin Z.

Estadstica Aplicada a la Investigacin Cientfica 47

Decisin:
2 o
2 o
o 1
0




Como z
k
= - 2,31 y pertenece a la regin de rechazo, se rechaza la hiptesis nula (H
o
) y se
acepta la hiptesis alterna H
A
tal como se muestra en la figura. Por tanto, la enseanza de la
trigonometra con el mtodo desarrollado es significativa.
Regin de rechazo
Ho
-1,96
Regin de rechazo Ho
Regin de aceptacin
1,96
z
k
= -2,31
48 C. Quintanilla C. / A. Cortavarria L.

AHORA A TRABAJAR CON EL SPPSS.
Aperturar una hoja de trabajo en el SPSS.





Una vez culminado el ingreso de datos, para realizar el contraste de Wilcoxon y comprobar la
hiptesis, si hay diferencia significativa entre los rangos medios de los variables: Prueba de entrada
de los alumnos y su respectiva Prueba de salida.
Elegir: Analizar Pruebas no paramtricas 2 muestras relacionadas. Tal como se muestra en el cuadro
de dilogo.


En la hoja de Vista de
Variables, rotular lo que
corresponde como el
EJEMPLO.
Completado la operacin,
hacer clic en Vista de
Datos.
.
En la hoja de Vista de Datos,
aparece los Rotulos de NOMBRES,
ENTRADA Y SALIDA
.
Ingresar los Nombres de los
estudiantes en la columna.
.
Ingresar las notas de entrada y
salida respectivamente.
.
Estadstica Aplicada a la Investigacin Cientfica 49



NOTA: Con ste cuadro de dilogo se pueden hallar otras dos pruebas no paramtricas. La
de Signo y la de McNemar.


En el siguiente cuadro se muestra el resultado.


Rangos
N
Rango
promedio
Suma de
rangos
PRUEBA DE SALIDA

PRUEBA DE ENTRADA
Rangos
negativos
2(a) 3,50 7,00
Rangos
positivos
9(b) 6,56 59,00
Empates 1(c)
Total
12
a PRUEBA DE SALIDA < PRUEBA DE ENTRADA
b PRUEBA DE SALIDA > PRUEBA DE ENTRADA
c PRUEBA DE SALIDA = PRUEBA DE ENTRADA

Estadsticos de contraste(b)

PRUEBA DE SALIDA -
PRUEBA DE ENTRADA
Z
-2,358(a)
Sig. asintt. (bilateral)
,018
a Basado en los rangos negativos.
b Prueba de los rangos con signo de Wilcoxon

El contraste Z = -2,358(a) ps 0,018 indica que existe diferencia significativa entre la prueba de
entrada y prueba de salida en la asignatura de Trigonometra utilizando el nuevo mtodo.
NOTA: es importante aclarar que el valor calculado de manera manual en el ejemplo 1 es z
k
= -
2,31, y no concuerda con el valor de contraste Z = -2,358(a) calculado con el SPSS. La razn es
sencilla, porque trabajamos con n = 12 y forzamos pese que la cantidad de datos es menor que 25 (n
< 25).
!!!!que facil.




Hacer clic y seleccionar
prueba de entrada, y la
prueba de salida.
Debe aparecer en
Selecciones actuales
variable 1 y variable 2.
Hacer clic en el botn, y
aparece tal como se
muestra el cuadro de
dilogo. Finalmente pulsar
el botn Aceptar.
50 C. Quintanilla C. / A. Cortavarria L.

3.6.3. Pruebas de Hiptesis con U de Mann Whitney.
La prueba U de Mann Whitney se usa para probar que si dos grupos independientes han
sido tomados de la misma poblacin; es decir, se parte de que la hiptesis nula H
o
pruebe
que las medias son iguales (H
o
:
1
=
2
), contra la alternativa H
1
que son diferentes (H
1
:

1
=
2
, prueba bilateral), o la hiptesis alternativa H
1
de que uno de las medias de un
grupo es mayor que la del otro (caso unilateral). sta prueba constituye una alternativa ms
til ante la prueba paramtrica t de student, cuando el investigador no puede suponer los
parmetros de la poblacin y la rigurosidad para la utilizacin de dicha prueba. Cuyo diseo
de investigacin puede ser de acuerdo al trabajo realizado
I.
Comparacin esttica o
comparacin de grupos slo
despus

X O
1
.
O
2
.
X: Aplicacin de la variable
experimental.
O
1
: Grupo que recibe el tratamiento.
O
2
: Grupo que no recibe el tratamiento.
II.
Dos grupos equivalentes o con
grupo control no equivalente
(grupo control no aleatorizado)

GE: O
1
X O
2
.

GC: O
3
O
4
.
X: Aplicacin de la variable
experimental.
O
1
O
3
: Observacin de entrada a cada
grupo en forma simultnea.
O
2
O
4
: Observacin de salida a cada
grupo en forma simultnea.
GE: Grupo Experimental.
GC: Grupo Control
III.
Dos muestras separadas y
aplicados con tratamientos
distintos

X
1
O
1
.

X
2
O
2
.
X
1
: Aplicacin de la Variable 1 al grupo
1.
X
2
: Aplicacin de la Variable 2 al grupo
2.
O
1
O
2
: Observacin de salida a cada
grupo en forma simultnea e
independiente.
La estadstica de Mann Whitney se denota con U. El valor de U se basa en la suma de
rangos de cualquiera de las dos muestras, y se define como el menor de los dos valores de
U
1
y U
2
de acuerdo a las ecuaciones:
U
1
=
1 1
1
( 1)
2
n n
T
+

U
2
=
2 2
2
( 1)
2
n n
T
+

Donde:
T
1
= suma de los rangos de la primera muestra.
T
2
= suma de los rangos de la segunda muestra.
n
1
= tamao de la primera muestra.
n
2
= tamao de la segunda muestra.
Decisin.
Para el nivel de significacin o y los tamaos n
1
y n
2
de las muestras en la tabla de valores
de la U de Man Whitney, se encuentra el valor crtico U
o
. se rechaza la hiptesis nula Ho si
ocurre U
c
s U
o
. No se rechaza caso contrario.
Estadstica Aplicada a la Investigacin Cientfica 51

Importante:
Para n
1
>8 y n
2
>8, Mann Whitney a demostrado que la distribucin U se aproxima a la
distribucin normal, con
Media:
U
=
1 2
2
n n
y
Varianza:
2
U
o =
1 2 1 2
( 1)
12
n n n n + +

Por lo que se puede determinar la distribucin Z.
Z =
u
U
U
o

aproximadamente N(0;1).
EJEMPLO.
Una profesora de Educacin Inicial, realiza un trabajo de investigacin que consiste en
alimentar a dos grupos nios con dietas nutritivas que permitan desarrollar tanto en el peso
como en el rendimiento. Por esta vez, muestra solamente el resultado del incremento del
peso despus de 15 das. La alimentacin fue administrada bajo condiciones idnticas.

DIETA 1
12,0 14,9 10,7 13,2 14,5 14,7 15,1 11,8
13,5 14,0 10,1 18,4 14,3 16,3 10,2 23,6

DIETA 2
12,0 18,9 19,2 15,4 15,3 15,8 21,3 20,7
19,6 18,8 14,8 20,1 23,8 21,1 16,2 13,9

Probar la hiptesis nula de que las dos dietas son idnticas contra la hiptesis
alternativa que la dieta 2 produce un mayor aumento de peso que la dieta 1. Usar nivel de
significancia del 1% (o = 0,01).

SOLUCIN.
i) Hiptesis.
H
0
:
d1
=
d2

La aplicacin de las dietas 1 y 2 tienen igual resultado en
la ganancia de pesos.
H
A
:
d1
<

d2

Con la aplicacin de la dieta 1 la ganancia de pesos es
menor que la ganancia de pesos que con la dieta 2.
ii) Hallando los rangos.
Para hallar los rangos se ordena los pesos de mayor a menos, se les asigna el orden
correlativo en el mismo orden ascendente. En caso de existir repeticin de nmeros
se suman el rango que les corresponde y se divide entre el nmero de veces que se
repite los pesos (variables).

52 C. Quintanilla C. / A. Cortavarria L.

Peso Rango Peso Rango Peso Rango Peso Rango
10,1 1 13,9 9 15,3 17 19,2 25
10,2 2 14 10 15,4 18 19,6 26
10,7 3 14,3 11 15,8 19 20,1 27
11,8 4 14,5 12 16,2 20 20,7 28
12 5,5 14,7 13 16,3 21 21,1 29
12 5,5 14,8 14 18,4 22 21,3 30
13,2 7 14,9 15 18,8 23 23,6 31
13,5 8 15,1 16 18,9 24 23,8 32
Una vez encontrado el rango se le otorga a cada uno de los pesos de los grupos aplicados
con las dietas 1 y 2.

D
i
e
t
a

1

peso 12 14,9 10,7 13,2 14,5 14,7 15,1 11,8
rango 5,5 15 3 7 12 13 16 4 75,5
peso 13,5 14 10,1 18,4 14,3 16,3 10,2 23,6
rango 8 10 1 22 11 21 2 31 106
SUMA DE RANGOS DIETA 1 (T
1
) 181,5

D
i
e
t
a

2

peso 12 18,9 19,2 15,4 15,3 15,8 21,3 20,7
rango 5,5 24 25 18 17 19 30 28 166,5
peso 19,6 18,8 14,8 20,1 23,8 21,1 16,2 13,9
rango 26 23 14 27 32 29 20 9 180
SUMA DE RANGOS DIETA 2 (T
2
) 346,5
iii). Hallando la media:
U
=
1 2
2
n n


U
=
(16)(16)
2
= 128
Varianza:
2
U
o =
1 2 1 2
( 1)
12
n n n n + +

2
U
o =
(16)(16)(16 16 1)
12
+ +
= 704.

iv). Regin crtica para o = 0,0 (1%).
Como nuestra hiptesis alterna de investigacin dice La dieta 1 tiene menor ganancia
de peso, significa que tiene una cola a la izquierda.
Si o = 0,01 1- o = 0,99.
Luego Z
1-o
= Z
0,99
= 2,33. Este valor encontramos en la tabla de la distribucin Z.

v). Estadstica de contraste. Como se desea saber sobre la dieta 1, tomamos para U el
valor de U
1
.
Estadstica Aplicada a la Investigacin Cientfica 53

U = U
1
=
1 1
1
( 1)
2
n n
T
+

U = U
1
=
16(16 1)
181,5
2
+
U = U
1
= 45,5
Ahora, se puede determinar la distribucin Z, para n
1
y n
2
mayores que 8.
Z
k
=
u
U
U
o

.
Z
k
=
45, 5 128
704

= 3, 11.

vi). Decisin.
o 1





Como Z
k
= 3,11 pertenece a la regin de rechazo, se rechaza la hiptesis nula (Ho), y se
acepta la hiptesis alterna. Existe Es cierto que la dieta 2 mejora en la ganancia de pesos.


Regin de rechazo Ho
Regin de aceptacin de Ho.
- 2,33
z
k
= 3,11
54 C. Quintanilla C. / A. Cortavarria L.

AHORA A TRABAJAR CON EL SPSS.
Iniciar una nueva hoja de trabajo en el SPSS, luego iniciar con el ingreso de los datos.



Mediante valores (values), asignamos a determinados valores de las variables. En este caso, con: 1 a la variable
dieta 1 y con 2 a la variable dieta2, de forma que cuando trabajamos con ellos nos aparecer dieta 1 y dieta
2; al realizar cada rotulo hacer clic en Add y finalmente OK.


Finalmente aparece el cuadro.



Ingresar los pesos de
ambos de ambos grupos
ordenadamente.
Asignar los cdigos de las
dietas. Con el nmero 1 a
la dieta 1 y con el nmero
2 a la dieta 2. Hacer clic
en Variable View.
Renombrar con
pesos y dietas
Poner los Ttulos en Label
luego hacer clic en la fila 2
y la columna de Value.
Hacer clic
Se visualiza el
rotulado anterior
Estadstica Aplicada a la Investigacin Cientfica 55




Ahora hacer clic en Analyze ---> No parametrics Test -- -> 2 Independent Sample






El resultado es la que se tiene a la vista.
Ranks
DIETAS APLICADAS N Mean
Rank
Sum of
Ranks
PESOS
GANADOS
DIETA 1 16 11,34 181,50
DIETA 2 16 21,66 346,50
Total 32


Test Statistics
PESOS GANADOS
Mann-Whitney U 45,500
Wilcoxon W 181,500
Z -3,110
Asymp. Sig. (2-tailed) ,002
Exact Sig. [2*(1-tailed Sig.)] ,001
a Not corrected for ties.
b Grouping Variable: DIETAS APLICADAS


Pasar al espacio la
variable de los
pesos ganados
Pasar al espacio de
Grouping Variable el
rotulado de dietas.
Hacer clic en Define
Groups.
Asignar los valores de 1
y 2, quienes representan
a Dieta 1 y Dieta 2.
Finalmente Continue.
56 C. Quintanilla C. / A. Cortavarria L.

Importante: Que hubiese pasado si trabajsemos con la hiptesis alterna que diga que la
dieta 2 mejora en peso?. La prueba sera con cola a la derecha, y se trabajara
con la ecuacin para hallar U y se tiene que utilizar U
2
=
2 2
2
( 1)
2
n n
T
+
,
aplicando a la ecuacin se tendra el valor de U y se tiene que utilizar U
2
=
210,5. Y finalmente la estadstica de contraste es:
Z
k
=
210, 5 128
704

= 3, 11. Resultado positivo, en este caso se hubiese


rechazado la hiptesis nula y aceptado la hiptesis alterna, el investigador tiene que tener
cuidado.
Pero el SPSS, ha trabajado con el U
1
= 45,5. Por tanto la computadora solamente
utiliza la primera opcin por lo que se debe de tener cuidado al desarrollar los
ejercicios.


Estadstica Aplicada a la Investigacin Cientfica 57

ANLISIS DE VARIANZA
3.6.4. Pruebas de Hiptesis de Kruskal Wallis.

Es la generalizacin de la prueba de U de Mann Whitney. Esta prueba trabaja con tres o
ms muestras independientes con el objeto de probar la hiptesis nula Ho que las muestras
provienen de poblaciones iguales, contra la hiptesis alterna H
1
que las muestras provienen
de poblaciones diferentes. Cuyo diseo de investigacin se muestra y que pueden ser
exactamente iguales o similares.

Ms de dos muestras
separadas y aplicados con
tratamientos distintos (X
1
,
X
2
, X
3
, )
X
1
O
1
.

X
2
O
2
.

X
3
O
3
.
.
.
.
X
1
: Aplicacin del Variable 1 al grupo 1.
X
2
: Aplicacin del Variable 2 al grupo 2.
X
3
: Aplicacin del Variable 3 al grupo 3
O
1
O
2
O
3
. . . : Observacin de salida a
cada grupo en forma simultnea e
independiente.

El mtodo es similar con la prueba de la U de Mann Whitney; es decir, asignamos el
rango a cada observacin, considerando todas las muestras en conjunto; se asigna rango 1 a
la menor observacin, 2 al que sigue, 3 al siguiente y asi sucesivamente, luego se suman los
rangos para cada grupo (muestra). Para calcular la prueba H es la ecuacin:
H
c
=
2 2 2 2
3 1 2
1 2 3
12
( ... ) 3( 1)
( 1)
k
k
R R R R
n
n n n n n n
+ + + + +
+


Donde:

1 2 3
...
k
n n n n n = + + + + , tamao de la muestra

R
1
= Suma de rangos asignados a las observaciones de la muestra 1.
R
2
= Suma de rangos asignados a las observaciones de la muestra 2.

R

R
k
= Suma de los rangos asignados a los n
k
observaciones de la muestra k sima.

Kruskal Wallis lleg a la conclusin de que si la hiptesis nula era verdadera, y si cada
muestra tena al menos cinco observaciones, el estadstico H tena una distribucin de
probabilidad aproximada por la distribucin _
2
con (k 1) grados de libertad.

.

.

.

.

58 C. Quintanilla C. / A. Cortavarria L.

Para la toma de decisin para contrastar la hiptesis nula Ho, es contrastar si H
C

s
2
1 o
_

con un nivel de significacin o especificado aceptamos Ho; en caso contrario
rechazamos.
EJEMPLO

Un profesor dise cuatro diferentes mtodos para el aprestamiento a las matemticas en
Educacin Inicial. Los alumnos de la seccin fueron divididos en 4 grupos independientes, a
cada grupo se le aplicaron diferentes mtodos, al 5% de nivel de significancia se desea saber
si tiene efecto la aplicacin de los mtodos; cuyo resultado de los ponderados se presenta en
la tabla:

METODOS PONDERADOS OBTENIDOS
METODO A 18,7 15,3 14,3 15,0 15,8 18,1 17,6
METODO B 11,6 12,4 10,8 16,1 13,8 13,4
METODO C 14,5 16,0 14,8 14,0 16,3 10,8
METODO D 17,2 17,2 17,7 13,3 16,1

SOLUCIN.
Ordenamos el total de las observaciones y luego asignamos rangos a cada observacin en la
muestra conjunta y en seguida obtenemos las sumas de rangos para cada muestra. La
ordenacin puede realizarse con la ayuda de EXCEL y otorgarle los rangos.

METODO A METODO B METODO C METODO D
Pond. Rango Pond. Rango Pond. Rango Pond. Rango
14,3 9 10,8 1,5 10,8 1,5 13,3 5
15 12 11,6 3 14 8 16,1 16,5
15,3 13 12,4 4 14,5 10 17,2 19,5
15,8 14 13,4 6 14,8 11 17,2 19,5
17,6 21 13,8 7 16 15 17,7 22
18,1 23 16,1 16,5 16,3 18
18,7 24
R
1
= 116 R
2
= 38 R
3
= 63,5 R
4
= 82,5

Ho: Los cuatro mtodos tienen igual resultado en el aprestamiento a las matemticas.
H
A
: Los cuatro mtodos tienen diferentes resultados en el aprestamiento a las
matemticas.
Calculando H
c
de la ecuacin.

Estadstica Aplicada a la Investigacin Cientfica 59

H
c
=
2 2 2 2
3 1 2 4
1 2 3 4
12
( ) 3( 1)
( 1)
R R R R
n
n n n n n n
+ + + +
+

H
c
=
2 2 2 2
12 116 38 63, 5 82, 5
( ) 3(24 1)
24(24 1) 7 6 6 5
+ + + +
+

H
c
= 8.93
Decisin:
Encontremos el valor de
2
1 o
_

=
2
0,95
_ con r = k 1 grados de libertad.
Luego r = 4 1 = 3, verificamos en la tabla y
2
0,95
_ = 7,82.
Como H
c
= 8,93 >
2
0,95
_ = 7,82 rechazamos la hiptesis nula y concluimos que con la
aplicacin de los mtodos de aprestamientos se obtienen diferentes ponderaciones; es decir,
tuvo efecto la aplicacin de los mtodos.


60 C. Quintanilla C. / A. Cortavarria L.

AHORA A TRABAJAR CON EL SPSS.

Se apertura el SPSS una de trabajo. Luego introducimos los ponderados en la primera columna por
orden de Mtodos.







Luego aparece.


Ahora ingresar a Analyze ---> Noparametric Test ---> K independent Samples , luego aparece
la ventana
Empezar ingresando los
ponderados de las notas de
los mtodos A, B, C y D
Ingresar
1 para el mtodo A,
2 para el mtodo B,
3 para el mtodo C y
4 para el mtodo D.
Hacer Clic
Escribir notas y
mtodos,
Hacer Clic
Se da etiqueta a los
mtodos:
1 significa Mtodo A,
2 significa Mtodo B,
3 significa Mtodo C y
4 significa Mtodo D.
Cada vez que se introduzca
la etiqueta pulsar la tecla
Aadir (ADD).
Para terminar OK.
luego en Label escribir los
titulos:Resultado de Examen
y Mtodos Aplicados
Estadstica Aplicada a la Investigacin Cientfica 61







El resultado sale a la vista.

Ranks

METODOS
APLICADOS
N Mean Rank
RESULTADO DE EXAMEN METODO A
7 16,57

METODO B
6 6,33

METODO C
6 10,58

METODO D
5 16,50

Total
24
Test Statistics
RESULTADO DE EXAMEN
Chi-Square 8,937
df 3
Asymp. Sig. ,030
a Kruskal Wallis Test
b Grouping Variable: METODOS APLICADOS


Las notas pasar Test
Varible List y
Mtodos a
Grouping Variable,
Seleccionar
Grouping
Varible, y hacer
clic en Define
Range
Ingresar los valores
de los mtodos
etiquetados que son
desde 1 al 4, se
considera e 1 y el 4.
Pulsar continue y
finalmente OK.
El resultado
obtenido al
calcular con
la formula de
Krsukal
Wallis.
62 C. Quintanilla C. / A. Cortavarria L.

3.6.5. Pruebas de Hiptesis de Anlisis de Varianza en dos direcciones por
rangos de Friedman.

Es cuando se desean comparar varias muestras o grupos de puntajes aparejadas (a cada
puntaje de un grupo le corresponde otro puntaje del otro grupo o otros grupos; tambin suele
llamar grupos o muestras dependientes o correlacionadas), el apareamiento puede ser
obtenido relacionando conjuntos con sujetos en una o ms variables previas y aleatoriamente
asignando a cada elemento del conjunto pareado varias condiciones diferentes o, si los
mismos sujetos son elementos de cada grupo a comprobar, entonces los conjuntos pareados
resultan adecuados.
Importante: Su uso es cuando no se cumplen los requisitos bsicos para el uso
de las pruebas paramtricas; es decir los puntajes de dichos
grupos no se distribuyen normalmente y no hay homogeneidad de
las varianzas.
La hiptesis nula de para el procedimiento de Friedman es que los efectos atribuidos a los
tratamientos son los mismos (no existe diferencias entre tratamientos) y la hiptesis alterna
es que si existe una diferencia entre los tratamientos.

Bloques o
Sujetos

Tratamiento
1 2 . . . j . . . k
1
Y
11
Y
12
. . . Y
1j
. . . Y
1k

2
Y
21
Y
22
. . . Y
2j
. . . Y
2k

. . . . . . . . . . . . . . . . . . . . .
n
Y
n1
Y
n2
. . . Y
nj
. . . Y
nk


Al igual que en los otros procedimientos no paramtricos, la prueba de Friedman se basa en
los rangos; para cada bloque (rengln) se asigna un rango a las observaciones comenzando
con 1 y terminando con k. La estadstica de Friedman est dada por:
2 2
1
12
3 ( 1)
( 1)
k
r j
j
R n k
nk k
_
=
| |
= +
|
+
\ .


EJEMPLO 1.
En una Institucin Educativa de Educacin Especial, se solicit a 9 fisioterapeutas que
clasificaran tres (03) modelos de estimuladores elctricos de bajo voltaje segn su
preferencia. Un rango de 1 indica la primera preferencia, rango de 2 indica la segunda
preferencia y rango de 3 indica la tercera preferencia. Los resultados se tienen en la tabla
No. 01.


Estadstica Aplicada a la Investigacin Cientfica 63

Tabla No.01.
Rangos asignados por fisioterapeutas a tres modelos
de estimuladores elctricos de bajo voltaje

Terapeuta
MODELOS
A B C
1 1 2 3
2 1 2 3
3 1 2 3
4 2 1 3
5 1 3 2
6 3 1 2
7 1 2 3
8 2 1 3
9 2 1 3
R
j 14 15 25
Solucin.
Ho: No existe preferencia por los modelos. (Despus de sumar los rangos por cada grupo, si
la hiptesis es verdadera estas sumas sern iguales).

H
A
: Existe preferencia por los modelos. (Como los rangos de preferencia estn de
acuerdo al orden de rango, existe la preferencia por los modelos no por iguales).
Consideremos al 5% de nivel de significancia (o=0,05). Pero como los datos se
encuentran en la tabla de Friedman, no es necesario el nivel de significancia.
Luego tomamos los valores r = 9 (nmero de reglones-Bloques); y k = 3 (nmero
de columnas-Tratamientos).
( )
2 2 2 2
12
14 15 25 3(9)(3 1)
9(3)(3 1)
r
_ = + + +
+

2
8, 22222
r
_ =

En la Tabla V de Friedman, se puede contrastar para r = 9 (k=3), que la probabilidad de
obtener un valor de
2
r
_ = 8,22222 tan grande debido solo al azar y que es igual a 0,016. Por
tanto se rechaza la hiptesis nula y concluye que los tres modelos no son igualmente
preferidos con o=0,05>0,016.
Nota. Cuando los valores de r (filas) y k (columnas) exceden los valores de la
Tabla V se puede usar los valores crticos de la Tabla III (Ch cuadrada
2
r
_ ) con
k 1 grados de libertad.
64 C. Quintanilla C. / A. Cortavarria L.

AHORA A TRABAJAR CON EL SPSS.
Se apertura el SPSS y una de trabajo. Luego introducimos los ponderados en la primera columna por
orden de Mtodos




Luego hacer clic en Vista de Datos y aparece la tabla:

Una vez culminado para realizar el anova de Friedman elegir Analizar Pruebas no paramtricas
k muestras relacionadas.

a) Seleccionar y transferir cada una de las tres variables (
modelo A, modelo B y modelo C) a la seccin Contrastar Variables.
Ingresar:
Terapeuta
Modelo A,
Modelo B,
Modelo C.





Hacer clic
en vista de
variables.





Poner
etiquetas.





Hacer click
en Valores
Para le
Modelo A..





Ingresar los valores y
etiquetar Aadir luego
Aceptar.
La misma operacin para
los modelos B y C.





Ingresar los valores de la
Tabla No. 01. del Ejemplo
No. 01.
Terapeutas, 1, 2, 3, . . . ,9.
Modelo A,
Modelo B
Modelo C





Hacer clic en
k muestras
seleccionadas.





Estadstica Aplicada a la Investigacin Cientfica 65



Los resultados se tienen en el cuadro que se presentan:

Estadsticos descriptivos
N Media
Desviacin
tpica Mnimo Mximo
MODELO A
9 1,6667 ,70711 1,00 3,00
MODELO B
9 2,7778 ,44096 2,00 3,00
MODELO C
9 1,5556 ,72648 1,00 3,00

Analizando, se tiene que los modelos A y C tienen mejor preferencia, porque los rangos
promedios los muestran as; se espera que el modelo C sea elegido por tener el mejor rango,
y que el modelo B es el que tiene como tercera opcin.

Rangos

Rango
promedio
MODELO A
1,67
MODELO B
2,78
MODELO C
1,56

La prueba de hiptesis, las diferencias entre los grupos se comprueba mediante la Tabla V
de Friedman

Estadsticos de contraste(a)
N
9
Chi-cuadrado
8,222
gl
2
Sig. asintt.
,016
a Prueba de Friedman

Por tanto se rechaza la hiptesis nula y se concluye que los tres modelos no son igualmente
preferidos con o=0,05>0,016

Ejemplo 2.
Se desea saber si existen diferencias entre cinco tipos de entrenamiento. El criterio consiste en el
rendimiento. Seis estudiantes se someten a cinco (5) tipos de entrenamiento y se mide su rendimiento
en atencin.

Los resultados se tienen en la siguiente tabla.

Pulsar el botn
Estadsticos, marcar
Descriptivos y
pulsar continuar.

Para finalizar pulsar
el botn Aceptar





El valor obtenido al
calcular es

2
r
_ = 8,22222
Comparando en la
Tabla V se obtiene
0,016.
66 C. Quintanilla C. / A. Cortavarria L.

Tabla No 01
Estudiante Entre. 1 Entre. 2 Entre. 3 Entre. 4 Entre. 5
1 13 25 12 25 29
2 18 19 16 21 24
3 17 23 15 22 20
4 19 25 15 20 23
5 24 30 24 36 37
6 15 21 13 19 18
Solucin.
Utilizando el mismo procedimiento en el Ejemplo 1, apertura una nueva hoja de trabajo y hacer clic
en Vista de Variables y completar tal como se muestra en la figura.


Hacer clic en Vista de datos y completar la informacin de la Tabla No. 01 del Ejemplo 2.
Cuyo resultado se muestra en la siguiente figura:

Una vez culminado para realizar el anova de Friedman elegir Analizar Pruebas no paramtricas
k muestras relacionadas.
a. Seleccionar y transferir cada una de las tres variables (ENTREN1 a ENTREN5) a la seccin
Contrastar Variables.



Estadstica Aplicada a la Investigacin Cientfica 67

b. Hacer clic en Estadsticos y marcar Descriptivos, y pulsar el botn continuar y finalmente
pulsar el botn Aceptar.


El resultado se obtiene de la manera muy sencilla. Adems con este cuadro se pueden hallar
otras dos pruebas no paramtricas. La W de Kendall y la Q de Cochran.



Estadsticos descriptivos
N Media Desviacin tpica Mnimo Mximo
ENTRENAMIENTO 2 6 23,8333 3,81663 19,00 30,00
ENTRENAMIENTO 3 6 15,8333 4,26224 12,00 24,00
ENTRENAMIENTO 4 6 23,8333 6,30608 19,00 36,00
ENTRENAMIENTO 1 6 18,5000 3,61939 13,00 24,00
ENTRENAMIENTO 5 6 24,3333 7,50111 18,00 37,00
Los rangos promedios de cada variable indican que los entrenamientos difieren, y el que tuvo mejor
resultado en atencin y fue el Entrenamiento 2, y que el entrenamiento 1 tuvo el peor resultado. En
este caso, cuanto ms alto es el puntaje, mayor ser el rendimiento.
Rangos
Rango promedio
ENTRENAMIENTO 1 2,42
ENTRENAMIENTO 2 4,08
ENTRENAMIENTO 3 1,08
ENTRENAMIENTO 4 3,75
ENTRENAMIENTO 5 3,67

La prueba de hiptesis (al nivel de significancia de o =0,05 (5%)).
La diferencia entre los grupos se comprueban mediante el estadstico Chi cuadrado
2 2
1 0,95 o
_ _

= (4)=
9,49 de la Tabla III, y es menor que
2
(4)
r
_ = 15,119 calculado mediante el SPSS (comprobar
realizando la operacin manual, haciendo rangos de menor a mayor). En este caso no se puede usar la
tabla de Friedman por ser el valor de k = 6 mayor que k=4.


Estadsticos de contraste(a)
N
6
Chi-cuadrado
15,119
gl
4
Sig. asintt.
,004
a Prueba de Friedman

Por lo que se concluye que existe diferencia significativas
en atencin entre los cinco grupos de entrenamiento.

Que fcil!!!!!!!!!!.
C. Quintanilla C. / A. Cortavarria L.
68
EJERCICIOS.

1. Se entrevistaron a hombres y mujeres (muestras) para determinar si fumaban cigarrillos o no. Se
encontr 15 varones son fumadores de 29 y que 20 mujeres fumaban de 30. Comprobar la
hiptesis nula de que la frecuencia relativa de los varones fumadores es la misma que de las
mujeres fumadoras. Dicha investigacin se debe probar al 5% de nivel de significancia.


2. El siguiente cuadro refleja la reaccin de una muestra aleatoria de 115 estudiantes de la UNH,
frente a la expansin del programa de Bilinge Intercultural a otras provincias segn el nivel del
curso.

Reaccin
Nivel del curso
Total
1er nivel 2do nivel 3er nivel
A favor 20 19 15 54
En contra 10 16 35 61
Total 30 35 50 115

Considerando al 5% de nivel de significancia, probar la hiptesis


3. Dos grupos de estudiantes (que recibieron clases regulares y los que recibieron clases por
correspondencia) se presentaron a exmenes finales de Estadstica. Se obtiene que 22 de los 30
que asistieron a recibieron en clases regulares aprobaron el examen, mientras tanto, 10 de los 28
que recibieron clases por correspondencia aprobaron el examen. Comprobar la hiptesis nula al
5% de nivel de significancia, que la frecuencia relativa de los alumnos que recibieron clases
regulares y por correspondencia son iguales.


4. Se tiene el inters por conocer si la actitud de los ciudadanos del Per respecto al dilogo entre el
gobierno y el Grupo Armado es independiente de la ideologa del partido a la cual pertenecen.
Una encuesta aleatoria de 500 ciudadanos clasificados por afiliacin a los partidos polticos dio
los siguientes resultados:

Actitud hacia el
dilogo.
Observacin segn afiliacin partidaria
Total
APRA UN Otros Partidos
A favor 35 80 50 165
En contra 45 60 80 185
Se abstienen 20 60 70 150
Total 100 200 200 500

Considerando al 5% de nivel de significancia, probar la hiptesis de que la actitud de los
ciudadanos con respecto al dilogo es independiente de la ideologa partidista.

5. Un profesor de Historia realiza una investigacin sobre los niveles de retencin de palabras
relacionados con la historia. Para ello elabora una prueba de entrada, y somete dicha prueba a 22
estudiantes de Historia y Ciencias Sociales. Luego aplica un mtodo que ayuda a incrementar la
capacidad de retencin. Los resultados son:

P
ALUMNOS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
E 72 70 68 67 73 71 72 70 69 70 68 72 69 66 73 71 70 72 70 69 72 73
S 74 72 69 68 72 73 72 74 68 73 69 70 68 69 74 73 70 74 68 71 75 76

Estadstica Aplicada a la Investigacin Cientfica
69
Probar la hiptesis de que el mtodo recibido por los estudiantes ayuda a mejorar a retener las
palabras relacionados a Historia. Considerar de 5% de significancia. Utilizar Prueba del Signo.

6. Se hizo experimento con 11 estudiantes seleccionados al azar, para ver si un entrenamiento
previo, basado en la solucin de rompecabezas (lgico matemtico), contribuye para tener un
mejor rendimiento en el aprendizaje de la teora de conjuntos. Se aplicaron dos pruebas: una
antes y otra despus del entrenamiento. Los resultados se presentan a continuacin.

Prueba
ALUMNOS
1 2 3 4 5 6 7 8 9 10 11
Entrada 10 11 11 08 12 12 12 12 14 13 15
Salida 12 12 14 11 13 15 12 15 12 14 18

Por medio de la prueba del signo, determine si el entrenamiento previo ayuda a mejorar el
aprendizaje de la teora de conjuntos. Utilice un error de 5% (valor de alfa).
a. Los ejercicios (1) y (2), desarrollar a travs de la Prueba de Rangos sealados de Wilcoxon


7. Los estudiantes de Ciencias Sociales e Historia, realizan un estudio sobre las comidas nativas
que nuestros antepasados utilizaron en sus dietas. Para ello realizan un experimento en la
reduccin de pesos a 20 seoritas subidas de peso durantes seis semanas. Los pesos antes y
despus del rgimen se presentan a continuacin.

Ps
SEORITAS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
E. 90 110 87 86 79 92 96 97 93 78 96 87 125 116 108 79 146 98 90 88
S. 84 99 92 84 77 92 89 95 98 73 92 88 121 109 102 85 137 94 91 79

Utilizando la prueba de Wilcoxon, al 5% de significancia, determinar si la dieta de nuestros
antepasados tuvo efecto.

8. El Director de una Centro Educativo asegura que los docentes a quienes se les d un
entrenamiento sobre relaciones humanas, y dan una impresin agradable entre sus alumnos. Para
probar lo anterior se seleccionaron al azar 22 docentes, dividindose en dos grupos de 11 cada
una. Al grupo experimental se dio un curso de relaciones humanas y trato en el saln de clases.
Los resultados se presentan, de acuerdo a la tabla de calificacin de 0 a 10.

Grupos Calificaciones
Experimental 3 9 8 7 3 9 7 4 9 8 7
Control 5 0 1 5 2 2 0 6 2 6 5

Utilizando la Prueba de U de Mann Whitney, verificar si el Director tiene razn. Utilice un
nivel de significancia de alfa de 0.05.


9. Un psiclogo clnico (docente universitario) desea conocer la relacin entre la agresividad y las
diferencias sexuales, seleccion un grupo de 12 nios y 12 nias de seis aos de edad. Las
puntuaciones de agresividad exhibida durante las experiencias se presentan a continuacin.

Grupo PUNTUACIONES
Nios 86 69 72 65 110 65 115 46 141 104 40 50
Nias 55 40 22 58 16 8 9 16 26 37 22 15


C. Quintanilla C. / A. Cortavarria L.
70

A travs de la Prueba de Mann Whitney, al 5% de nivel significancia, pruebe:

a) Pruebe que la agresividad es la misma en ambos sexos.
b) Pruebe que la agresividad en los varones es mayor que en las mujeres.

10. Se inyectaron tres grupos de personas que sufren de depresin con una nueva droga
tranquilizante. Al grupo A se le inyectaron 0,5 mg; al grupo B 1,0 mg y al grupo C 1,2 mg. En
el siguiente cuadro se muestran los tiempos que tardaron en dormirse.

Tiempo (mnimo)
A 11 13 9 14 15 13
B 9 11 10 8 12 -
C 10 5 8 6 10 6

Utilizando la prueba H de Kruskal- Wallis, al 5% de nivel d significancia, probar que las
diferencias en las dosificaciones tienen efecto real en los tiempos medios necesario para
dormirse en las poblaciones de donde se producen.


11. Se quiere comprobar la efectividad de tres mtodos para ensear teora de conjuntos. Para tal fin
se tomaron al azar 24 estudiantes homogneos, los cuales se dividieron en tres grupos. Despus
de 6 semanas de ensear conjuntos con diferentes mtodos, se aplic el mismo examen a los tres
grupos, cuyos resultados son.


METODOS Puntuacin
Mtodo A 88 92 74 68 76 80 89 70
Mtodo B 95 80 77 69 72 76 83 66
Mtodo C 89 93 81 71 67 92 78 64

Utilizando el mtodo de Kruskal- Wallis, probar de que los tres mtodos tienen igual efectividad
para ensear teora de conjuntos, contra la alternativa de que son diferentes. Use el 1% de nivel
de significancia.


12. Suponga que tres tipos de estilos, A, B y C, se estudiarn por su legibilidad, y la calificacin de
legibilidad se registra en la tabla:

Tipos de estilo
A 22 24 21 17 26 25
B 26 36 37 37 33 32
C 23 30 29 26 31 -

Utilizando el mtodo de Kruskal- Wallis, probar de que los tres mtodos tienen igual
efectividad para ensear teora de conjuntos, contra la alternativa de que son diferentes. Use el 5%
de nivel de significancia.


13. Un fabricante de plumones para pizarras acrlicas, est interesado en determinar el efecto que
tiene 3 ingredientes en la duracin del plumn (en das). El fabricante asign al azar cada uno de
los tres ingredientes a 10 (diez) grupos de plumones en experimento, tal como se muestra en al
tabla.
Estadstica Aplicada a la Investigacin Cientfica
71

Ingred.
GRUPOS
1 2 3 4 5 6 7 8 9 10
A 14 10 14 12 10 16 12 12 10 12
B 18 18 18 20 16 14 16 16 16 18
C 18 16 18 20 20 16 17 18 18 20

Utilizando la prueba de Friedman, tienen efectos distintos los ingredientes en la duracin de
los plumones?.

14. La UNH adquiere un lector ptico de marca SHAROX, esta mquina es capaz de leer marcas
hechas con lpiz en una forma especial. Un fabricante de SHAROX cree que su producto puede
operar igualmente bien en diversos entornos con temperatura y humedad diferentes. Para
determinar si los datos de operacin contradicen esta creencia, el fabricante pide a un laboratorio
de pruebas industriales muy conocido que pruebe su producto. Se seleccionaron al azar cinco
SHAROX de reciente produccin y se oper con cada una de ellas en distintos entornos. Se
registr el nmero de formas de cada una de ellas al procesar durante una hora, y se utiliz este
dato como medida de eficiencia de operacin del SHAROX. Utiliza la prueba de Friedman para
determinar si hay pruebas de que las distribuciones de probabilidad de los nmeros de formas
procesadas por hora difieren en su ubicacin para al menos dos de los entornos. Considere nivel
de significancia o = 0,05.

Mquina No Entorno
1 2 3 4 5 6
1 7633 7601 7561 7500 7702 7600
2 7850 7820 8100 7802 7904 7819
3 8175 8101 8235 8111 8201 8102
4 7990 7932 7922 7910 7900 7892
5 8055 8025 8007 8001 8100 7991


C. Quintanilla C. / A. Cortavarria L.
72
















CASOS MAS IMPORTANTES DE ANLISIS ESTADSTICO
CASOS PARAMTRICO NO PARAMTRICO
1. Comprobar 2 medias de
grupos independientes.
Ejm. Puntaje de autoestima
en dos aulas.

t de Student para muestras
independientes.
U de Mann - Whitney
2. Comparar dos medias de dos
grupo relacionados.
Ejm. Media de rendimiento
acadmico antes y despus.
t de Student para muestras
dependientes.
T de Wilcoxon.
3. Comparar K medias de
grupos independientes.
Anlisis de varianza (anova)
o prueba (F).
Anlisis de varianza de
Kruskal Wallis.

4. Para estudio de seguimiento
comparar K medias de grupos
relacionados.
Ejm. Comparar X de
rendimiento acadmico al
inicio, medio y final de ao.
Anlisis de varianza de
mediciones repetidas. Se usa
ms en medicina.
Anlisis de varianza de
Friedman.
Se usa ms en
educacin.
5. Comparar dos proporciones
de grupos relacionados.
Ejm. Conocimiento: Sabe o
no sabe; actitud: favorable o
desfavorable. Favorito de
candidatos.
Distribucin Z para
proporciones
Anlisis de Mc Nemar.
6. Comparar K proporciones de
grupos relacionados.
Anlisis de Cochran.
7. Relacin de 2 variables
cualitativas.
Ejm. Sexo y autoestima.
x
2
de independencia.
8. Relacin de 2 variables
cuantitativas.
Coeficiente de correlacin de
Pearson
Correlacin de
Spearman.
Estadstica Aplicada a la Investigacin Cientfica
73


BIBLIOGRAFIA

Freud, J., Miller, I. and Miller, M. (1999). Mathematical Statistical. USA, New Yersy:
Printice Hall.
Mostellery, F. and Rourke, K. (1973). Study Statistic: Nonparametric and Order Statistic.
USA: Addisson Wesley.
Fisher, R. (1921). On the Probable Error of a Coeffient of correlation Deduced from a small
Sample. USA: Metron.
Dickinson, J. (1971). Nonparametric Statistical Inference. USA: Mc Graw Hill Book
Company.
Marqus de Cant, M. (1991). Probabilidad y estadstica: Para ciencias Qumico
Biolgicas. Mxico: Edit. McGraw Hill.
Woolson, R. And Clarke, W. (2002). Statistical Methods for the Analysis of Biomedical
Data. USA: A John Wiley , INC., PUBLICATION
Crdova, M. (2003). Estadstica: Descriptiva y Inferencial. Per: Edit. Moshera; 5ta edicin.
Gay, L. and Airasian, P. (2000). Educational Research: Competencies for Analysis and
Application. USA: Printice Hall. 6
th
edition.
Martel, P. y Diez, F. (1997). Probabilidad y Estadstica en Medicina. Espaa: Ediciones Dias
de Santos.
Gonick, L. y Smith, W. (1993). La Estadstica en Comic. Espaa: Edit. Zendreria Zariquiey.
Levin, J. (1979). Fundamentos de Estadstica en a Investigacin Social. Mxico: Edit.
HARLA.
Wayne, D. (1994). Bioestadstica: Base para el anlisis de las ciencias de la salud. Mxico:
UTEHA, NORIEGA EDITORES.
Camacho, J. (2001). Estadstica con SPSS para Windows. Mxico: Edit. Alfaomega.
Prez, C. (2001). Tcnicas Estadsticas con SPSS. Espaa: Edit. Printice Hall.
Eves, H. (1953). An Introduction to the History of Mathematics. USA: Rinehart and
Winston, Inc.
Hotelling, H. (1953). NEW LIGHT ON THE CORRELATION COEFFICIENT AND ITS
TRANFORMS. Journal of the Statistical Society; Ser B, 15 (1953), 193 232.