Está en la página 1de 94

UNIVERSIDAD TECNOLOGICA

INDOAMERICA

PROGRAMA DE MAESTRA EN GESTIN DE PROYECTOS SOCIO PRODUCTIVOS

PROGRAMACION

GENERAL

DEL

ESTADSTICA

Tutor
MAGISTER JUAN PAREDES B.

QUITO - ECUADOR

EVENTO

MSc. Juan Paredes B.

1
PLAN DEL EVENTO ACADEMICO

1.

PRESENTACION
El mbito socio - productivo, con toda su complejidad, tiene implcito dentro de
s una serie de situaciones en sus procesos, que demandan del investigador un
permanente monitoreo de los mismos, para sobre la base de los resultados que
obtenga, realizar modificaciones, ampliaciones y/o eliminando aquellos aspectos
que se encuentran influyendo sobre los resultados que obtiene.
Considerar que este monitoreo puede ser realizado nicamente sobre la base de
la experiencia del investigador, implica sobre valorar un nico aspecto, dentro
del proceso investigativo que esto implica. Consecuentemente, no se puede
hablar de apreciaciones, por el contrario es menester asumir posiciones que
demuestren una solvencia en la formacin y en la capacitacin terico-prctica
de confrontar aquellos aspectos que se considera relevantes con argumentos
tcnicos que, permitan efectivamente probarlos.
En este contexto se plantea la realizacin de un mdulo de ESTADSTICA
APLICADA con eminente aplicacin al mbito socio - productivo, construido
con el propsito esencial de permitir que los futuros maestrantes en esta
especializacin de cuarto nivel, sean capaces no slo de aplicar frmulas
muchas de las cuales pueden ser obtenidas directamente de los diferentes
programas computarizados- sino lo que es ms importante: interpretar y tomar
decisiones en torno a la informacin cuanticualitativa a la que tiene acceso el
investigador, sea como resultado de su prctica como de su investigacin.
La aplicabilidad del presente mdulo se circunscribe a la prctica profesional.
As, se pretende lograr en los profesionales que se desenvuelven en este nivel, un
progresivo apropiamiento de los elementos terico-prcticos de la Estadstica,
aplicables a la empresa y la indagacin de su problemtica.

2.

OBJETIVO GENERAL
Posibilitar la adquisicin de conocimientos y mtodos estadsticos, a travs de
ejercicios prcticos tendientes a la toma de decisiones en el mbito socio productivo.

3.

OBJETIVOS ESPECIFICOS
a. Estudiar las definiciones bsicas utilizadas en anlisis estadstico.
b. Conocer los procesos y grficos estadsticos aplicables de acuerdo a la
orientacin de la investigacin.
c. Aplicar e interpretar las frmulas de tendencia central y de dispersin.
d. Establecer los requisitos para realizar un adecuado muestreo.
e. Determinar la mejor prueba estadstica a aplicar en funcin de los objetivos
f. Aplicar las diferentes pruebas y mtodos en ejercicios tipo para su posterior
generalizacin.

MSc. Juan Paredes B.

4.

CONTENIDOS
UNIDAD I.- GENERALIDADES
1.
2.
3.
4.

DEFINICIN DE ESTADISTICA
LA ESTADSTICA Y SU RELACION CON LAS CIENCIAS SOCIALES
DEFINICIONES BASICAS
ACTIVIDADES DE APLICACION

UNIDAD II.- ESTADSTICA DESCRIPTIVA


1.
2.
3.

4.

4.

METODOS PARA ORGANIZAR DATOS


TABLAS
GRAFICOS
a.
Diagramas de puntos
b.
Histogramas
c.
Polgono de frecuencias
d.
Ojiva o Polgono de Frecuencia acumulada
e.
Pasteles
MEDIDAS DESCRIPTIVAS
a.
Media Aritmtica
b.
Mediana
c.
Moda
MEDIDAS DE DISPERSION
a.
Amplitud
b.
Desviacin Estndar
c.
Varianza
d.
Coeficiente de Variacin
e.
Coeficiente de Sesgo

UNIDAD III.- LA MUESTRA


1.
EL MUESTREO
a.
Poblacin
b.
Marco Muestral
c.
Muestra
2.
REQUISITOS DE UN MUESTREO ADECUADO
3.
TIPOS DE MUESTREO
a.
Muestreo probabilstico o aleatorio
1.
Muestreo simple al azar
2.
Muestreo estratificado
3.
Muestreo por conglomerados (superficies o reas
geogrficas)
4.
Muestreo sistemtico o en serie
5.
Muestreo de etapas mltiples
b.
Muestreo no probabilstico o no aleatorio
1.
Muestreo decisional
2.
Muestreo de cuota
3.
Muestreo basado en expertos
4.
Muestreos casuales o fciles de estudiar

MSc. Juan Paredes B.

UNIDAD IV.- TOMA DE DECISIONES Y VERIFICACIN DE HIPOTESIS


1.
2.
a.
1.
2.
b.
1.
2.
c.

MODELO LOGICO
MODELO MATEMATICO
Hiptesis Nula
Planteamiento de la Ho en diseos bilaterales
Planteamiento de la Ho en diseos unilaterales
Hiptesis Alterna
Para diseos bilaterales
Para diseos unilaterales
Alfa

3.

MODELO ESTADISTICO

UNIDAD V.- PRUEBAS DE COMPROBACIN DE HIPOTESIS


1.

DOSIMACIA

2.

X2 CUADRADO

3.

PRUEBA t

4.

PRUEBA F

MSc. Juan Paredes B.

4
UNIDAD I
GENERALIDADES

1.

DEFINICIN DE ESTADISTICA
Es un conjunto de tcnicas para la recoleccin, manejo, descripcin y anlisis de
informacin, de manera que las conclusiones obtenidas de ella, tengan un grado
de confiabilidad especificado.
La Estadstica permite la comprobacin de aquellos aspectos que se han
propuesto en las hiptesis, por tanto posibilita la verificacin de la relacin
propuesta en las variables. Esta comprobacin puede ser de tipo cuantitativo
como de tipo cualitativo y, se encuentra en relacin directa con el diseo de la
investigacin.

2.

LA ESTADSTICA Y SU RELACION CON LAS CIENCIAS SOCIALES


Todas las actividades que se presentan en campos como: natural y social, son
susceptibles de ser cuantificadas bajo algn tipo de criterio, cuantificacin que
posteriormente es igualmente susceptible de ser analizada e interpretada.
La necesidad de cuantificar y contribuir a la resolucin de estos problemas ha
determinado que muchos cientficos desarrollen teoras instrumentales de
carcter matemtico que han contribuido a la consolidacin de la Estadstica.
Fenmenos sociales como la mortalidad ocasionada por plagas, los seguros en
previsin contra la consecuencia de la piratera martima, las guerras y an los
juegos de azar impulsaron el estudio de las probabilidades, fundamento vital de
la Estadstica, sistematizado por Galileo (1564-1642), Pascal (1623-1662) y
Fermat (1601-1665). Los estudios de Simpson en el siglo XVIII sobre la
distribucin continua y de Laplace y Gauss sobre la distribucin normal,
contribuyeron a formalizar ms el avance de los mtodos estadsticos.
A esto se suman las reflexiones de Quetelet en el sentido de que el mundo
tambin ofreca regularidades o frecuencias susceptibles de distribucin, que son
aportes significativos para las Ciencias Humanas, salto que a finales del siglo
XIX alcanza a la Gentica, la Biologa, la Psicologa, la Sociologa y an las
Artes; iniciando su consolidacin como disciplina a fines de la II Guerra
Mundial con los aportes de Galton, Pearson, Yule y Fisher.
La teora sobre errores, correlacin, diseo experimental, series temporales,
anlisis de componentes y de chi-cuadrado, as como la del muestreo, aseguran
su aplicabilidad en el campo de las ciencias sociales 1.
La Estadstica proporciona a las Ciencias Sociales los mtodos y tcnicas que las
orientan para la extraccin de informacin relevante de los datos; la bsqueda,
construccin y evaluacin de modelos intrnsecos en los datos; el diseo

Mogrovejo, Jorge, et al. (1997). Estadstica aplicada a la educacin. Loja: CEPOSTG, pp. 8-18

MSc. Juan Paredes B.

eficiente de experimentos e instrumentos de investigacin; y, an con


limitaciones en la autentificacin cientfica.
Son los mtodos estadsticos y sus tcnicas los que posibilitan calcular
promedios como indicadores del comportamiento caracterstico de un grupo,
determinar la variabilidad o dispersin de los datos con respecto de la media,
describir grficamente la naturaleza del grupo o de la muestra, determinar la
fiabilidad de un instrumento de medicin, entre otros muchos aspectos; son los
campos en los cuales puede aplicarse la Estadstica.
Su aplicacin se relaciona directamente con:
a. La formulacin de hiptesis (cuyo planteamiento es fundamental al momento
de realizar un trabajo investigativo).
b. La obtencin de datos (relacionado con la informacin que se debe obtener
para el proyecto).
c. Confrontacin de los resultados obtenidos con la hiptesis planteada (su
abordaje demanda una adecuada aplicacin).

3.

DEFINICIONES BASICAS
Se exponen algunos trminos de uso frecuente:
a. Dato: viene expresado por numerales que pueden ser cantidades directas de
la informacin o reflejar observaciones cuantificables de categoras
empleadas en el anlisis; en el primer caso son datos cuantitativos, en el
segundo cualitativos. Se ordenan x1, x2 , x3, x4,.........
Son aquellos valores que se obtienen en diferentes aspectos pero que, son:
susceptibles de ser comparados entre s, permiten sacar conclusiones; y,
tomar decisiones.
Ejemplo 1.- Se obtienen los siguientes datos que representa el consumo
diario de agua por familia, en un distrito suburbano durante un verano
reciente:
Razn del uso del agua
Ducha y tina
Lavar trastes
Beber y cocinar
Lavar ropa
Regar el pasto
Sanitario
Varios
Total

Galones por da
99
13
11
33
150
88
20
414

MSc. Juan Paredes B.

Ejemplo 2.- Se obtienen los siguientes datos en relacin con el cumplimiento


de valores corporativos de los directores departamentales de la Empresa y:
Empleados
x1
x2
x3
x4
x5

Seguir rdenes
S
S
CS
RV
N

Donde las equivalencias son:


S =
CS =
RV =
N =

Siempre
Casi siempre
Rara vez
Nunca

b. Medicin: procedimiento de asignacin de numerales a objetos o


acontecimientos de acuerdo con ciertas normas.
Ejemplo 3.- Se obtienen los siguientes datos en relacin a la satisfaccin de
requerimientos del cliente, en la matriz de MOVISTAR en Quito, en un da
especfico :
Apreciacin
Clientes
Excelente
29
Muy Bueno
31
Bueno
13
Regular
6
Insuficiente
2
c. Variables: magnitudes susceptibles de ser medidas y expresadas a travs de
datos.
Ejemplo 4.- El servicio eficaz al cliente incide en las ventas de la empresa.
d. Variable continua: pueden asumir valores en cualquier punto de una escala
numrica, que puedan corresponderse con los puntos de una recta; por
ejemplo: longitud, masa, peso, tiempo de vida til de una mquina, la
temperatura en un momento dado el da, el tiempo diario que una persona ve
televisin.
Ejemplo 5.- Una empresa de transporte interprovincial, recibe una serie de
bultos para transportar. Estos bultos estn expresados en kilogramos para
calcular el flete del transporte.
Bultos
x1
x2
x3
x4
x5

Peso (Kg.)
50,5
50,6
49,8
49,7
49,6

MSc. Juan Paredes B.

e. Variable discreta: Es aquella que puede tomar solamente ciertos valores


dentro de un intervalo establecido. Ejemplos de datos discretos son: el
nmero de clientes que ingresa a un almacn en un da, el nmero de aos
que vive una persona, el sexo de una persona, el grupo sanguneo.
Ejemplo 6.- Distribucin por sexos de los empleados del departamento de
Publicidad de la empresa OPY:
Sexo
Masculino
Femenino

Empleados
13
16

f. Variables independientes y dependientes: de las primeras se derivan las


segundas en una relacin directa o con la ingerencia de factores
intervinientes.
Ejemplo 7.- Sobre la base del ejemplo 4:
Tipo
Independiente
Dependiente

Variable
Servicio eficaz al cliente
Ventas

g. Poblacin: conjunto que representa todas las mediciones de inters para el


investigador, generalmente es un conjunto finito.
Ejemplo 8.- Los usuarios de TVCable pertenecientes a la zona norte de la
ciudad de Quito.
h. Muestra: uno de los subconjuntos de la poblacin de inters que el
investigador selecciona ordinaria o deliberadamente, sea para conocer su
particular comportamiento o para inferir propiedades de la poblacin de la
cual provienen.
Ejemplo 9.- Para conocer la proporcin de desperdicio en un saco de maz,
para determinar el contenido de azcar de una botella de gaseosa o para
conocer el nmero de piezas defectuosas en un lote de productos; bastar
mezclar bien los productos y tomar una pequea parte de ellos. Lo que se
deduzca de sta muestra servir para juzgar a la totalidad del producto.
Supngase que deseamos conocer las preferencias electorales de todos los
miembros adultos de la ciudad de Quito. La poblacin la constituyen todas
las personas en capacidad de votar que viven en Quito y la muestra ser el
conjunto de unidades maestrales seleccionadas al azar del padrn electoral
de esta ciudad, que completen la cantidad establecida en la respectiva
frmula de muestra.
i. Parmetros: valores que reflejan las propiedades de la poblacin.
Ejemplo 10.- La edad promedio de los clientes de la zona norte de la ciudad
de Quito que contratan TVCable es de veinte y cinco aos.
=

25 aos

MSc. Juan Paredes B.

j. Estadgrafos: valores que reflejan los correspondientes a la muestra.


Ejemplo 11.- La edad promedio de los clientes de TVCable pertenecientes a
la zona norte de la ciudad de Quito, seleccionados de acuerdo a muestra es
de 24 aos.

24 aos

k. Redondeo: aproximacin; si la cifra ltima es 5 o mayor que 5 se redondea


al numeral inmediato superior; si por el contrario la cifra es menor que 5 se
le deprecia.
Ejemplo 12.- Se obtienen los siguientes datos en relacin con los dimetros
en centmetros de cinco bolas de cojinete manufacturadas por una fbrica
Bolas de Cojinete
x1
x2
x3
x4
x5

Dimetro(cm)
1,738
1,735
1,740
1,730
1,729

Redondeando:
Bolas de Cojinete
x1
x2
x3
x4
x5

Dimetro(cm)
1,74
1,74
1,74
1,73
1,73

l. Denominacin: los subconjuntos que son investigados estn integrados por


mediciones de alguna caracterstica que se desea estudiar; se pueden
denominar con X, Y o Z.
Ejemplo 13.- Se mide el peso y la estatura de los empleados del
departamento de la empresa CYCE, el peso puede ser X y la estatura Y.

MSc. Juan Paredes B.

9
ACTIVIDADES DE APLICACIN No. 1

OBJETIVOS
1. Incentivar la reflexin crtica sobre la importancia de la Estadstica en los procesos
socio - productivos.
2. Lograr la interiorizacin de los conceptos fundamentales de esta disciplina.

ACTIVIDADES
1. Consulte por lo menos tres definiciones de Estadstica y elabore un cuadro de doble
entrada que permita establecer semejanzas y diferencias.
2. Escriba su criterio personal sobre la importancia de la Estadstica en la formacin de
los futuros Magsteres en Gestin de Proyectos Socio - Productivos.
3. Enuncie dos ejemplos de cada una de las definiciones bsicas, aplicadas en su
mbito laboral.
4. Desarrollar el Taller Prctico N 1 que ser entregado durante la primera tutora.

MSc. Juan Paredes B.

10
UNIDAD II
ESTADSTICA DESCRIPTIVA

1.

METODOS PARA ORGANIZAR DATOS

Es importante partir de la adecuada organizacin de los datos que se recopilen, por


tanto los mtodos que se empleen deben poseer caractersticas que permitan
alcanzar los objetivos que se pretenden lograr y, posibilitar la comprobacin o no
de las hiptesis planteadas. Estos mtodos deben poseer los siguientes rasgos:
a. Proporcionar la mxima informacin contenida en los datos en forma rpida
y fcil de visualizar.
b. Poseer sencillez operativa.
c. Permitir la presentacin de una forma grfica.
Los mtodos pueden ser tabulares, grficos y numricos; por el nivel de
formacin, se realizar la referencia para los dos primeros que, incluso son punto
de apoyo para la Estadstica Inferencial.
2.

TABLAS
Los datos que se obtienen en cualquier investigacin, generalmente se presentan
en forma de tablas.
Tabla 1.

Nmero de empleados por departamento de la empresa ABC.


Departamentos
Marketing
Publicidad
Ventas
Produccin
Administrativo y Financiero

No. Empleados
10
9
20
45
8

De esta organizacin de los datos, se puede visualizar fcilmente que el


departamento de Produccin tiene el mayor nmero de empleados, mientras que
el Administrativo y financiero el menor nmero de empleados.
Tabla 2.

Exportacin de Flores Naturales, en cientos de miles de dlares,


de 24 florcolas ecuatorianas en 1998.
45
50
75
52
63
54

63
55
56
57
59
63

57
54
58
50
55
49

61
62
68
68
56
58

MSc. Juan Paredes B.

11

Este tipo de tablas permite en el caso de grupos pequeos, visualizar fcilmente


la informacin, a la par que posibilita la realizacin de comentarios que permitan
a quienes lean el informe el visualizar la informacin de la misma manera de
quien la expone.
Existe la posibilidad de presentar los datos en Tablas de Frecuencias o Tablas de
Distribucin de Frecuencias; se trabaja con intervalos de clase, cuando la
diferencia entre el puntaje mximo y el puntaje mnimo es igual o superior a 15.
La anchura de estos intervalos puede oscilar de tres a diez puntos mximo de
amplitud, una consideracin que debe tenerse presente es que a mayor nmero
de datos, la amplitud de los intervalos es mayor y, a la inversa.
En el ejemplo anterior el puntaje mximo es de 75 y el mnimo de 45, situacin
que establece una amplitud de 30 cientos de miles de dlares, en relacin a los
dos extremos, aspecto que permite a quien expone y a quien lee la informacin
darse cuenta que el grupo es muy heterogneo.
Las tablas de frecuencia, se realizan por medio de intervalos de clase cuya
frmula de clculo es:

A ( pmx pmn)

A
# ti

i =
A=
#ti =

Ancho del intervalo


amplitud (puntaje mayor puntaje menor)
nmero tentativo de intervalos

Ejemplo 14.- Distribucin por frecuencias de las Exportaciones de Flores


Naturales, en cientos de miles de dlares, de 24 florcolas ecuatorianas en 1998.

A (75 45) 30
#ti = 6

30
5
6

Es decir que se agruparn los datos en un nmero tentativo de seis intervalos de


clase, cada uno de ellos con una amplitud de cinco. Se pueden ubicar de puntaje
mayor a menor y a la inversa; dependiendo del caso se iniciar con el puntaje
mximo o mnimo.

MSc. Juan Paredes B.

Tabla 3.

12
Distribucin por intervalos de clase de las Exportaciones de
Flores Naturales, en cientos de miles de dlares, de 24 florcolas
ecuatorianas en 1998.
Clase
45 49
50 54
55 59
60 64
65 69
70 74
75 79

f (frecuencias)
2
5
9
5
2
0
1

Clase
75 79
70 74
65 69
60 64
55 59
50 54
45 49

f (frecuencias)
1
0
2
5
9
5
2

Existen algunas desventajas en el manejo de las tablas de frecuencia:


a. Prdida de informacin al presentar las observaciones en intervalos, sin
especificar cuales datos pertenecen a ellos. No es posible saber directamente
de la tabla cules son los valores numricos de datos que pertenecen al
intervalo.
b. Dado que el nmero de clases y la anchura de las mismas se pueden incluso
elegir arbitrariamente, no existe una representacin nica de los datos en las
tablas de frecuencia.

3.

GRAFICOS
Se puede graficar por Diagrama de Puntos, Histogramas, Polgonos de
frecuencias y Ojivas.
a.

Diagramas de puntos
Sirven para presentar grficamente tablas en las cuales se consideran
nicamente una variable y una cantidad asociada a cada valor de la
misma. Se pueden presentar dos formas presentan esencialmente la
misma informacin- slo que en diferente forma y con diferente
propsito. As se pueden presentar:
1)
El primer tipo de diagrama de puntos se construye colocando en
el eje horizontal los valores de la variable (los cuales en muchos
casos son arbitrarios) y en el eje vertical las cantidades asociadas

MSc. Juan Paredes B.

2)

13
a stos. Finalmente, para cada valor de la variable y cada cantidad
asociada se dibujan puntos cuya altura corresponde a la magnitud
de dicha cantidad.
Para construir el segundo tipo de diagramas de puntos se colocan
en el eje horizontal los valores de la variable y sobre cada valor se
dibujan tantos puntos como veces aparezcan stos.

Figura 1.

Diagrama de puntos correspondientes a las Exportaciones de


Flores Naturales, en cientos de miles de dlares, de 24 florcolas
ecuatorianas en 1998.

Figura 1a.

Diagrama de puntos correspondientes a las Exportaciones de


Flores Naturales, en cientos de miles de dlares, de 24 florcolas
ecuatorianas en 1998.

MSc. Juan Paredes B.

b.

14

Histogramas
Se llama Histograma a la grfica de barras verticales sin espaciamiento
entre ella, construida colocando en el eje vertical a las frecuencias
absolutas o relativas y en el eje horizontal a los lmites de clase de una
tabla de frecuencias. Lo anterior implica que si los intervalos de clase son
iguales, sobre cada clase se erigen rectngulos cuyas reas son
proporcionales a las frecuencias de clase. Las etapas que se deben cubrir
para construir histogramas son:
1)
2)
3)

Colocar en el eje horizontal los lmites de clase.


Colocar en el eje vertical las frecuencias relativas o absolutas.
Erigir rectngulos cuya base son las clases y su altura las
frecuencias que corresponden a cada clase.

Figura 1b.

Histograma correspondiente a la distribucin de frecuencias de


las Exportaciones de Flores Naturales, en cientos de miles de
dlares, de 24 florcolas ecuatorianas en 1998.
10
9
8
7
6
5

Serie1

4
3
2
1
0
45

50

55

60

65

70

75

Se observa en este histograma que existe cierta asimetra, lo que indica


que la mayora de datos pertenecen al intervalo (55 59) y, el resto se
presenta de forma asimtrica; este aspecto es ms fcil de identificar en
un histograma que en una tabla de frecuencias.

c.

Polgono de frecuencias
Un Polgono de frecuencias es una grfica de lneas rectas que unen los
puntos obtenidos al colocar en el eje horizontal a los valores medios de
clase y en el vertical a las frecuencias relativas o absolutas. Es de resaltar
que el procedimiento equivale a unir los puntos medios de la cara
superior de los rectngulos de un histograma por medio de lneas rectas.

MSc. Juan Paredes B.

Figura 1c.

15
Polgono de frecuencias correspondiente a las Exportaciones de
Flores Naturales, en cientos de miles de dlares, de 24 florcolas
ecuatorianas en 1998.
10
9
8
7
6
5

Serie1

4
3
2
1

ACTIVIDADES DE APLICACIN No. 2

0
1

472

523

574

625

676

72
7

77
8

El Polgono de Frecuencias debe ser siempre cerrado, consecuentemente


se grafican los puntos ms all de los valores reales, existiendo un
intervalo mayor y uno inferior a los que realmente constan en la tabla.

d.

Ojiva o Polgono de Frecuencia acumulada


Una Ojiva o PFA es una grfica construida con segmentos de lneas
rectas que unen los puntos obtenidos al colocar en el eje horizontal a los
lmites superiores de clase y en el vertical la frecuencia acumulada
relativa o absoluta.

Clase
45 49
50 54
55 59
60 64
65 69
70 74
75 79

f
(frec
uenc
ias)
2
5
9
5
2
0
1

fa

2
7
16
21
23
23
24

Al momento de graficar, debe considerarse tambin el lmite inferior de


la primera clase, al que se le asigna una frecuencia acumulada de cero,
para a partir de la misma proceder a realizar la acumulacin de
frecuencias.

MSc. Juan Paredes B.

16

As mismo, obsrvese que, por su naturaleza una Ojiva es no decreciente.

Figura 1d.

Polgono de frecuencias acumuladas absolutas correspondiente a


las Exportaciones de Flores Naturales, en cientos de miles de
dlares, de 24 florcolas ecuatorianas en 1998.
30
25
20
15

Serie1

10
5
0
451

e.

492

54
3

594

564

69
6

74
7

798

Pasteles
Permite graficar porcentajes o proporciones, es recomendable si existen
hasta un mximo de cinco alternativas, caso contrario pueden dificultar
en lugar de facilitar la comprensin de la informacin que se est
graficando.

Figura 1e.

Distribucin porcentual de frecuencias a las Exportaciones de


Flores Naturales, en cientos de miles de dlares, de 24 florcolas
ecuatorianas en 1998.

8%

0% 4%

8%
1
21%

21%

2
3
4
5
6
7

38%

MSc. Juan Paredes B.

17

Al existir siete grupos los pasteles tienden a presentar los porcentajes de


forma acumulada.

4.

MEDIDAS DESCRIPTIVAS
En los ejemplos del apartado precedente puede observarse que las tablas,
histogramas, distribuciones de frecuencias presentan formas muy variadas, por
lo que no es fcil comparar dos conjuntos de datos mediante la simple
inspeccin de sus representaciones grficas.
Es importante al trabajar con datos cuantitativos o cualitativos el obtener
cantidades que describan sucintamente el conjunto de datos que se estudia. Son
de particular inters cantidades que localicen el centro de las observaciones (o
ms bien de su distribucin de frecuencias) y la dispersin o variabilidad de las
mismas; las primeras son medidas de tendencia central y las segundas
medidas de dispersin. Las medidas de tendencia central son tres: Media
aritmtica, Mediana y Moda.
a.

Media Aritmtica
Se define como la suma de las observaciones dividida para el total de las
mismas; corresponde geomtricamente al punto de equilibrio de los
datos. Es la ms usada de las medidas descriptivas. Tiene la ventaja de
ser muy fcil de calcular, adems de poseer propiedades tericas
excelentes desde el punto de vista de la Estadstica Inferencial. Su
principal desventaja es que, por ser el punto de equilibrio de los datos, es
muy sensible a la presencia de observaciones extremas.
En el caso de valores sin agrupar la frmula de la Media Aritmtica es:
Media Aritmtica muestral
Media Aritmtica poblacional
x
x
X

n
N
En el caso de valores agrupados con frecuencias, la frmula es:
Media Aritmtica muestral
Media Aritmtica poblacional
xf
xf
X

n
N
donde:

X
x

xf

=
=
=

Media Aritmtica
Sumatoria de todos los datos
Sumatoria de todos los datos por su frecuencia absoluta

n
N

=
=

respectiva
Nmero total de datos de la muestra
Nmero total de datos de la poblacin

En el caso de valores acumulados en intervalos de clase la frmula es:

MSc. Juan Paredes B.

18

Media Aritmtica muestral

Media Aritmtica poblacional

fiVi

i 1

n
=

fiVi

Media aritmtica

fiVi

Sumatoria de la multiplicacin de los puntos medios por

i 1

la frecuencia de cada intervalo de clase


n
N

=
=

Nmero total de datos de la muestra


Nmero total de datos de la poblacin

Ejemplo 15.- Calcular la media aritmtica de las Exportaciones de Flores


Naturales, en cientos de miles de dlares, de 24 florcolas
ecuatorianas en 1998
45
50
75
52
63
54

63
55
56
57
59
63

SIN AGRUPAR LOS DATOS

x
n

X = 1388
24
X = 57.83

57
54
58
50
55
49

61
62
68
68
56
58

MSc. Juan Paredes B.

19

CON DATOS AGRUPADOS


Clase
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79

Vi
47
52
57
62
67
72
77

fi
2
5
9
5
2
0
1

fiVi
94
260
513
310
134
0
77

24

1388

fiVi
i 1

1388
57.83
24

X 57.83

b.

Mediana
Cuando se observa asimetra en la distribucin, la Media Aritmtica no
es una buena medida de tendencia central, ya que por ser el punto de
equilibrio de los datos resulta muy afectada por valores extremos. Para
ilustrar este punto considrense los nmeros: 27 3,4 3,2 3,3 3,1,
donde la Media es de 8, valor que nos dara una idea muy distorsionada
de la magnitud de las observaciones. Para este tipo de situaciones es
conveniente definir otra medida de tendencia central y, en este caso sera
la MEDIANA.
La Mediana (Me) de un conjunto de n nmeros, ordenados de mayor a
menor, es el nmero central en el arreglo. Si n es un nmero non, slo
hay un valor central. Si n es un nmero par, hay dos valores centrales, y
la mediana debe tomarse como la media aritmtica de estos dos valores.
Ejemplo 16.- Calcular la mediana para los nmeros
27
3,4
3,2
3,3
3,1
El primer paso es ordenar los nmeros:
3,1
3,2
3,3
3,4
27
Como en este caso n = 5 (nmero non) hay un solo valor central que es
3,3 y, este es el valor de la mediana. Es decir:
Me

3,3

MSc. Juan Paredes B.

20

Ntese que la Me (3,3) es un valor ms tpico que la Media Aritmtica.


Ejemplo 17.- Calcular la mediana para el precio de venta unitario
diez DVD de diferentes marcas.
110

112

108

106

109

110

111

107

105

113

107

108

109

110

110

111

112

113

Ordenar:
105

106

Como en este caso n = 10 (nmero par) hay dos valores centrales que son
109 y 110. Se aplica la frmula:

Me

109 110
109.5
2

Me 109.5

Ejemplo 18.- Calcular la mediana para las Exportaciones de Flores Naturales, en


cientos de miles de dlares, de 24 florcolas ecuatorianas en 1998
45
50
75
52
63
54

63
55
56
57
59
63

57
54
58
50
55
49

61
62
68
68
56
58

49
54
56
58
62
68

50
54
56
58
63
68

50
55
57
59
63
75

Ordenar:
45
52
55
57
61
63

Como en este caso n = 24 (nmero par) hay dos valores centrales que son
57 y 57, no se aplica la frmula:

Me 57
La Mediana es un valor que divide a los datos en mitades. Una con todas
las observaciones mayores o iguales a la mediana y otra con aquellas
menores o iguales a ella. Para conjuntos de datos asimtricos, es mejor
medida de tendencia central que la Media Aritmtica.

MSc. Juan Paredes B.

21

En el caso de valores agrupados, la obtencin de la Mediana sigue un


proceso especfico. Puesto que se trata de encontrar un nmero tal que la
mitad de las observaciones sean mayores o iguales y la mitad menores o
iguales que l, la mediana debe estar en una clase tal que la frecuencia
relativa acumulada hasta la clase que precede inmediatamente sea menor
que 0,5 y la frecuencia relativa acumulada hasta la clase que se busca sea
mayor o igual a 0,5. A esta clase se le llamar la Clase de la Mediana.
Una vez localizada la clase de la mediana, el valor buscado se encuentra
fcilmente si se supone, como en el caso de la Media, que las
observaciones en esta clase se encuentran uniformemente distribuidas en
el intervalo de clase. El valor de la mediana se localiza por una simple
interpolacin como sigue:
a
b
c

=
=
=

lmite inferior de la clase de la mediana


lmite superior de la clase de la mediana
frecuencia relativa acumulada hasta la clase que precede a
la clase de la mediana
frecuencia relativa de la clase de la mediana

La mediana se representa:

Me a z

Donde z es la cantidad desconocida, pero que de acuerdo con nuestra


suposicin de uniformidad en las observaciones en el intervalo, debe
cumplir la siguiente relacin: si en una distancia b a se encuentra una
frecuencia relativa d, en z, que es la distancia del lmite inferior de la
clase de la mediana a la mediana, se debe tener una frecuencia relativa
0,5 c . Esto puede expresarse por medio de una regla de tres simple:

ba
z

d
0,5 c
Despejando z se obtiene:

b a 0,5 c
d

De donde se obtiene como ecuacin para la mediana:

Me a

b a 0,5 c
d

MSc. Juan Paredes B.

22

Ejemplo 19.- Calcular la mediana para las Exportaciones de Flores Naturales, en


cientos de miles de dlares, de 24 florcolas ecuatorianas en 1998
.
Clase
45 49
50 54
55 59
60 64
65 69
70 74
75 79
Clase
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79

Clase de la Mediana

f (frecuencias)
2
5
9
5
2
0
1

Vi
47
52
57
62
67
72
77

fi
2
5
9
5
2
0
1
24

55 - 59

pi
0,083
0,208
0,375
0,208
0,083
0,000
0,042

Pi
0,083
0,292
0,667
0,875
0,958
0,958
1,000

Datos:

a
b
c
d

=
=
=
=

Me 55

55
59
0,292
0,375

59 550,5 0,292 57.22


0,375

La Mediana es 57.
c.

Moda
La Moda (Mo) de un conjunto de datos es el valor (si existe) que ocurre
con mayor frecuencia. Si es un valor nico se dice que la distribucin de
frecuencias es unimodal. Si se tienen dos o ms valores con la misma
frecuencia mxima se dice que la distribucin es bimodal, trimodal, etc..
Es una medida que es poco usada por cuanto puede ocurrir que no exista
o que no sea un valor nico; pero en el caso de datos individuales es muy
til.

MSc. Juan Paredes B.

23

Ejemplo 20.- Sealar la moda de las Exportaciones de Flores Naturales, en


cientos de miles de dlares, de 24 florcolas ecuatorianas en
1998.
45
50
75
52
63
54

63
55
56
57
59
63

57
54
58
50
55
49

61
62
68
68
56
58

El valor que se repite ms (3) es el nmero 63. La Mo = 63, es una


distribucin unimodal.
Cuando la distribucin de frecuencias es simtrica, la media aritmtica,
la mediana y la moda coinciden.
El clculo de la moda en tablas de frecuencias, adquiere mayor
importancia, ya que es frecuente que sea un valor nico. Para propsitos
descriptivos es suficiente reportar la clase modal, que es la clase cuya
frecuencia absoluta es mayor. Si se desea un valor nico se toma el valor
medio de la clase modal.
Ejemplo 21.- Calcular la clase modal de las Exportaciones de Flores Naturales, en
cientos de miles de dlares, de 24 florcolas ecuatorianas en 1998

Clase
45 49
50 54
55 59
60 64
65 69
70 74
75 79

f
(frecuen
cias)
2
5
9
5
2
0
1

La clase que tiene la mayor frecuencia absoluta (55 59) es la Clase


Modal, se puede reportar como valor modal el valor medio del intervalo
de clase, es decir 57.
De los ejemplos que se han manejado en esta seccin, el conjunto de
datos de 24 establecimientos de venta diaria de hamburguesas, se ha
manejado en relacin a las tres medidas de tendencia central. La media,
la mediana y la moda para este grupo son:

MSc. Juan Paredes B.

24

Medida
Media Aritmtica
Mediana
Moda

5.

Sin agrupar
57,83
57
63

Tabla de frecuencias
57,83
57,22
57

MEDIDAS DE DISPERSION
Las medidas de tendencia central resultan insuficientes al momento de
caracterizar una distribucin, puesto que otro aspecto que debe ponerse en
consideracin es la variabilidad de la distribucin.
Al interior de una distribucin los datos pueden variar ostensiblemente entre s,
las medidas de dispersin a utilizar son: amplitud, desviacin estndar,
varianza, coeficiente de variacin y coeficiente de sesgo.

a.

Amplitud

La medida de dispersin ms simple recibe el nombre de amplitud, y es muy


poco usada, puesto que su nica ventaja es la sencillez con la que se calcula. Es
comn que se le asigne el nombre de Rango. Cuanto ms grande sea el rango,
mayor ser la dispersin de los datos de una distribucin.
La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones
de mayor y menor valor numrico en el mismo.
Ejemplo 22.- Calcular la amplitud de las Exportaciones de Flores Naturales, en
cientos de miles de dlares, de 24 florcolas ecuatorianas en 1998
.
45
50
75
52
63
54

63
55
56
57
59
63

57
54
58
50
55
49

61
62
68
68
56
58

A (75 45) 30
La amplitud es una medida de dispersin cuya ventaja es la facilidad con
la que se calcula; sus desventajas:

En su clculo solo intervienen dos elementos del conjunto.

MSc. Juan Paredes B.

25

Al aumentar el nmero de observaciones puede esperarse que


aumente la variabilidad puesto que la amplitud no toma en cuenta el
tamao del conjunto, no es una medida adecuada para comparar la
variabilidad de dos grupos de observaciones, a menos que stos sean
del mismo tamao.

b.

Desviacin Estndar
La Desviacin Estndar 2 es el promedio de desviacin de las
puntuaciones con respecto a la media. Esta medida es expresada en las
unidades originales de medicin de la distribucin. Se interpreta en
relacin a la media. Cuanto mayor es la dispersin de los datos alrededor
de la media, mayor es la desviacin estndar.
Desviacin Estndar muestral

X X

X X

fV

Desviacin Estndar poblacional

fV

para datos simples

n 1

n 1
2

nX 2

n 1

N
2

con frecuencias

con intervalos de clase

N
2

Ejemplo 23.- Calcular la desviacin estndar de los siguientes datos:


6
2
5
4
7
-1
1
0
Xi
6
2
5
4
7
-1
1
0
24

xi - x
3
-1
2
1
4
-4
-2
-3
0

(xi x)2
9
1
4
1
16
16
4
9
60

Primero se calcula la media aritmtica:

24
3
8

Hernndez, Roberto, et al. (1991). Metodologa de la investigacin. Mxico: McGraw-Hill, pp. 362-365

MSc. Juan Paredes B.

26

Se determina la desviacin de cada puntuacin respecto a la media (xi


x) y se le eleva al cuadrado.
Se aplica la frmula:

X X

s=

n 1

s= 2,93

60 / 7

EN DATOS AGRUPADOS
Calcular la desviacin estndar de las Exportaciones de Flores Naturales, en
cientos de miles de dlares, de 24 florcolas ecuatorianas en 1998
Clase
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79

Vi
47
52
57
62
67
72
77

1)

fi
2
5
9
5
2
0
1

fiVi
94
260
513
310
134
0
77

24

1388

Encontrar el punto medio (Vi) de cada intervalo y determinar


la media de la distribucin (con la frmula para datos
agrupados).

fiVi

i 1

1388
57.83
24

X 57.83

2)

Elevar la media al cuadrado.

X 57.83 3344,31
2

3)

Multiplicar la columna fiVi por los puntos medios y obtener una


columna llamada fiVi 2 y, se procede a obtener la sumatoria ().

MSc. Juan Paredes B.

27
Clase
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79

Vi
47
52
57
62
67
72
77

fiVi 2
4418
13520
29241
19220
8978
0
5929

fiVi
94
260
513
310
134
0
77

4)

81306

Aplicacin de la frmula:

fV

nX 2
n 1
2

81306 24(3344,31)
23

s 6,73

La desviacin estndar se interpreta como cunto se desva en


promedio- de la media un conjunto de puntuaciones.

c.

Varianza
La varianza es la desviacin estndar elevada al cuadrado (s2), diversos
mtodos estadsticos parten de la descomposicin de la varianza. Para la
Estadstica Descriptiva se utiliza preferentemente la desviacin estndar.
Varianza Muestral
Varianza Poblacional

d.

S2
Coeficiente de variacin

El coeficiente de variacin mide el grado de dispersin de un conjunto de


datos en relacin con su media, en trminos de porcentaje. Para
calcularlo se divide la desviacin tpica de una distribucin por su media
y el resultado se multiplica por cien.
Coeficiente de variacin muestral Coeficiente de variacin poblacional
CV =

S
(100)
X

En el ejemplo que nos ocupa:


CV = 6,73 (100)
57.83

CV =

(100)

MSc. Juan Paredes B.

28

CV= 11.64%
Esto significa que los datos de los pesos de los alumnos se desvan en
promedio respecto de la media aritmtica en un 11,64%.

e.

Coeficiente de sesgo
Mide el sesgo de la distribucin
Coeficiente de sesgo muestral

3( X mediana )
S

Coeficiente de sesgo poblacional

3( mediana )

Si P< 0, los datos estn sesgados a la izquierda. Si P>0, estn sesgados a


la derecha. Si P = 0, estn distribuidos normalmente.

MSc. Juan Paredes B.

29
ACTIVIDADES DE APLICACIN No. 2

OBJETIVOS
3. Revisar las tcnicas de presentacin de datos obtenidos en el proceso empresarial.
4. Aplicar las frmulas para las medidas de tendencia central y de dispersin.

ACTIVIDADES
5. En la empresa que usted trabaja, consiga la informacin sobre la edad (en aos
completos) de todo el personal (mnimo 25 datos) y proceda a presentarlos a travs
de tablas de valores individuales y por intervalos de clase. Realice todos los tipos de
graficaciones con esa informacin.
6. Con los datos anteriores obtenga medidas de tendencia central y de dispersin.
7. Resuelva los siguientes problemas:
1. Los agentes de Merrill Lynch tienen las tasas de rendimiento de cuatro valores
diferentes a lo largo de los ultimos aos. Todos parecen haber ofrecido con un
rendimiento medio similar en todo el periodo. Los agentes han de decidir ahora la
manera de identificar aquellos valores que entraan menos riesgo como
oportunidades de inversin.
2. El director ejecutivo de una pequea empresa de electrnica present recientemente
un componente revolucionario de un rel elctrico que espera tendr una creciente
aceptacin. Ahora se enfrenta al problema de decidir como medir el crecimiento
medio de sus ventas a lo largo de los ltimos aos. Qu le sugerira usted?.
3. Definir y poner ejemplos de una medida de tendencia central y una medida de la
dispersin.
4. El profesor Doezoff se traslada del departamento de estadstica al de economa. El
decano alega que este traslado disminuir el IQ medio de ambos departamentos.
Qu hiptesis hace el decano sobre los niveles de IQ de cada departamento y sobre
el del doctor Doezoff?.
5. La empresa Snowflake vende botas de esquiar en San Luis Obispo, California. De
los ltimos 100 pares vendidos, 4 eran de talla 9, 33 de la talla 9 , 26 de la talla
10, 29 de talla 10 y 8 de la talla 13. Comentar el uso de la media aritmtica, la
mediana y la moda como medidas de tendencia central, y la utilizacin de cada una
de ellas para tomar decisiones en relacin con las tallas que se deben tener en
existencia. Calcular cada una de las medidas.
6. El entrenador de ftbol americano de la universidad estatal registr las yardas
ganadas (o perdidas) en el primer saque por su ataque en el partido del sbado
pasado. Los valores fueron: 7, 12, -5, 4, 0, -7, 2, -3

MSc. Juan Paredes B.

30

Calcular la media aritmtica, la mediana y la moda.


7. Una encuesta realizada en instituciones financieras de un centro urbano cerca de
Peoria (V. Problema anterior) revel que los tipos de inters de las hipotecas eran
de:
7,1%, 7,3%, 6,3%, 6,7%, 6,8%, 6,85%, 7,5%
a) Son los tipos de inters de las hipotecas mas altos en Peoria o en el otro centro
urbano?
b) Qu ciudad parece tener unos tipos de inters ms coherente entre instituciones?
c) Calcular e interpretar el cociente de sesgo de Pearson.
8. Las ventas mensuales del emporio de coches usados de Fast Freddie fueron:
Enero
69
abril 74
Febrero
73
Mayo 79
Marzo
78
Junio 82
Fast Freddie espera conseguir unas ventas de 87 antes de agosto. Lo conseguir si
las ventas siguen aumentando al mismo ritmo?
9. Como propietario de una agencia de publicidad prospera de Chicago, Geoge Kay
gana 110,000 dlares al ao. Sus siete empleados ms recientes ganan 15,000,
21,000, 18,500, 17,900, 21,200, 15,900 y 22, 500 dlares. Qu medida de la
tendencia central piensa usted que es la mejor indicacin del promedio de estos ocho
sueldos?. Calcule el promedio.
10. Una reciente informacin de las oportunidades de inversin estudiadas por la revista
Fortune revel que las inversiones tpicas en valores producan un 7,2% de
rendimiento, el dinero invertido es bonos un 8,1%, los fondos colocados en terrenos
un 3,7% y los activos a la vista un 5,5% en una cuenta de ahorro o del mercado
monetario. John Wise, de acuerdo con Fortune, tiene el 40% de su fortuna en
valores, el 40% en bonos y el resto a la vista. Lars Holton mantiene una cartera que
consta del 34% en valores, el 10% en terrenos, el 16% a la vista y el 40% en bonos.
Qu inversor tiene mayor tasa de rendimiento?
11. Con el dinero que gan en la lotera estatal, Lucky Louie compr 10.000 dlares en
bonos de empresa, 5.000 dlares en bonos del estado y deposit 7.000 y 8.000
dlares respectivamente en dos cuentas del mercado monetario. Las cuatro
inversiones le dan unos rendimientos de 12, 7, 8 y 9%, respectivamente. Cul es la
tasa de rendimiento medio de Lucky?.
12. Contestar al problema anterior si se supone que los tiempos pertenecen a una
distribucin normal. Dibujar un grfico que ilustre las respuestas.

13. La tabla de frecuencias siguiente recoge las edades de 50 de los directores ejecutivos
de las empresas ms importantes de la nacin incluidos en el nmero de Forbes del
24 de mayo de 1993:
a) Calcular e interpretar la media aritmtica, la mediana y la moda.
b) Calcular e interpretar la varianza y la desviacin tpica

MSc. Juan Paredes B.

31

Edades

Frecuencia

50 y menos de 55
55 y menos de 60
60 y menos de 65
65 y menos de 70
70 y menos de 75
75 y menos de 80

8
13
15
10
3
1
50

14. Janna Vice utiliza dos mquinas diferentes para fabricar conductos de salida de
papel destinados a copiadoras Kodak. Los conductos de una muestra de la primera
mquina median 12.2, 11.9, 11.8, 12.1, 11.9, 12,4, 11,3 y 12,3 pulgadas. Los
conductos hechos con la segunda mquina median 12.2, 11.9, 11.5, 12.1, 12.2, 11.9
y 11.8 pulgadas. Janna tiene que utilizar la mquina que produzca conductos de
tamaos ms uniformes. Qu maquina deber utilizar?.
15. Las puntuaciones de los dos primeros juegos de pruebas estadsticas que usted
realiz estaban distribuidas normalmente y daban unas medias de 90 la prueba A y
50 la prueba B. Esperara usted una desviacin tpica alta o baja de la prueba A?.
Deseara una desviacin tpica alta o baja de la prueba B si piensa que hizo bien la
prueba?. Por qu?. Dibuje un grfico que ilustre la lgica de sus respuestas.
16. A continuacin figura una muestra de los beneficios por accin, en dlares, de
valores negociados en la bolsa de Nueva York:
1.12, 1.43, 2.17, -1.19, 2.87, - 1.49
a) Calcular la varianza y la desviacin tpica
b) Interpretar la desviacin tpica
17. Se hizo una encuesta de treinta y cinco hogares tpicos en relacin con su
estimacin de incremento que experimentaran sus impuestos a consecuencia del
paquete econmico propuesto por el presidente Clinton en el verano de 1993. Sus
respuestas se recogieron en un peridico local y se muestran a continuacin:
$812.0000
735.0000
739.0000
489.0000
1015.0000

945.0000
875.0000
689.0000
589.0000
499.0000

1010.0000
758.0000
658.0000
499.0000
908.0000

956.0000
872.0000
521.0000
512.0000
658.0000

825.0000
1000.0000
965.0000
865.0000
498.0000

1009.0000
687.0000
851.0000
625.0000
729.0000

954.0000
687.0000
745.0000
953.0000
857.0000

a) Construir una tabla de frecuencias con el nmero adecuado de clases y un


intervalo de 85 dlares. Establecer el lmite inferior de la primera clase en 485.
b) Calcular e interpretar la media aritmtica, mediana, moda, varianza y desviacin
tpica

MSc. Juan Paredes B.

32

18. El nmero de horas trabajadas cada semana por Ronnie en los dos ltimos meses
fue:
52 48 37 54 48 15 42 12
Suponiendo que son datos muestrales, calcular la:
a) Media aritmtica
b) Mediana
c) Moda
d) Cul es probablemente la mejor medida del punto central?
19. En la tabla se muestran datos sobre la frecuencia de ausentismo en una factora
propiedad de Novell Electronics, La direccin cuenta con los conocimientos
estadsticos de usted para analizar el comportamiento de sus empleados en
comparacin con las normas nacionales. Los estudios indican que el nmero medio
de das por ao que los empleados estn ausentes en toda la nacin en factoras
similares es de 27 aproximadamente. Ayude a Novell a evaluar y discernir el
significado de las cifras. Calcule la media aritmtica, la mediana y la moda, y
comntelas:
Das anuales de ausencia
0-10
11-21
22-32
33-43
44-54
55-65
66 o ms

Frecuencia
4
10
12
15
10
5
4
60

20. En la tabla de frecuencias que sigue se han recogido las prdidas trimestrales de 50
empresas:

Prdidas
(en miles de dlares)
50 y menos de 100
100 y menos de 150
150 y menos de 200
200 y menos de 250
250 y menos de 300
300 y menos de 350
350 y menos de 400

Frecuencia
(nmero de empresas)
2
8
15
10
12
1
2
50

a) Calcular e interpretar la media aritmtica, la mediana y la moda.


b) Calcular e interpretar la varianza y la desviacin tpica

MSc. Juan Paredes B.

33

21. Un informe publicado en un nmero reciente de la revista Fortune indicaba el


incremento en el uso de las mquinas de fax en la actividad empresarial diaria.
Afirmaba que determinadas oficinas financieras envan documentos por fax una
media de 15 a 20 veces al da. Como directora de la oficina, Pam Whiting est
preocupada por el aumento de costos relacionado con la mquina de fax de su
oficina. Los resultados de una muestra del nmero de veces al da que se envan
documentos por fax en su oficina a lo largo de un perodo de 66 das se indican en
la tabla que figura a continuacin:
a) Calcular la media aritmtica, la mediana y la moda y comentar si Pam tiene
motivos para estar preocupada.
b) Calcular la varianza y la desviacin tpica para obtener una medida de la
dispersin del uso diario del fax

Clase
(nmero de documentos)
0 y menos de 5
5 y menos de 10
10 y menos de 15
15 y menos de 20
20 y menos de 25
25 y menos de 30

Frecuencia
(nmero de das)
3
7
12
10
19
15
66

22. A la direccin del problema anterior tambin le preocupa el hecho de que el


rendimiento de los empleados es demasiado errtico; hay demasiada variacin en el
tiempo empleado por los trabajadores en realizar la tarea. Determinar y calcular el
estadstico que correspondera a la preocupacin de la direccin.
M
6
8
10
12
14
16
18
20
22

fM 2
72
512
1000
2160
3332
3584
2268
3600
1452
17980

fM
12
64
100
180
238
224
126
180
66
1190

23. La revista Forbes public un artculo sobre un consorcio britnico financiero e


inversor que compraba caballos de carreras en Lexington, Kentucky. La
preocupacin del consorcio se centraba en la depresin que afecta a los hipdromos
en todo el pas y en que las apuestas en las carreras estn en slo 13,900 millones de
dlares, el mnimo en 20 aos. A continuacin se clasifican las ganancias de 88 pura

MSc. Juan Paredes B.

34

sangre. El consorcio desea conseguir una media de 100,000 dlares por cada caballo
que posee:
a) Sugieren estos datos que el consorcio logra este objetivo?. Calcular las tres
medidas de la tendencia central y comentar.
b) Calcular la medida adecuada de variacin en las ganancias de los caballos.
Ganancias
(miles de dlares)
10 y menos de 30
30 y menos de 50
50 y menos de 70
70 y menos de 90
90 y menos de 110
110 y menos de 130
130 y menos de 150

Frecuencia
(nmero de caballos)
8
7
12
15
18
19
9
88

24. Con los datos del problema anterior calcular la varianza y la desviacin tpica
Ganancias
(miles de dlares)
0 y menos de 10
10 y menos de 20
20 y menos de 30
30 y menos de 40
40 y menos de 50
50 y menos de 60
60 y menos de 70
70 y menos de 80
80 y menos de 90
90 y menos de 100

Frecuencia
(nmero de caballos)
2
0
4
7
9
7
6
4
2
1
42

25. Los sindicalistas de una factora de Ford Motor Company en Toledo argumentan
que los trabajadores de la lnea de fabricacin perciben un salario horario medio ms
bajo y con mayor variabilidad que los trabajadores de oficinas, lo que constituye un
incumplimiento del convenio colectivo. Se toma una muestra de n = 10 de cada
clase de trabajadores que da los valores siguientes. Apoyan estos datos la
reclamacin de los sindicalistas?.

MSc. Juan Paredes B.

Trabajadores
1
2
3
4
5
6
7
8
9
10

35
Trabajadores
de produccin

Trabajadores de
oficina

12.15
18.17
19.42
15.17
18.63
16.42
15.49
18.73
19.12
18.36

15.12
18.42
17.12
16.92
18.15
15.81
19.12
19.15
18.73
19.66

26. Los empleados de la factora de Kansas City producen 42.2 unidades por hora con
una desviacin tpica de 10.2 unidades. Los valores de la factora de Denver son
4.17 y 12.7
a) Qu empleados son ms constantes en su esquema de produccin?
b) Qu factora tendran los empleados ms productivos si la produccin est
distribuida normalmente.
27. Una agente de inversiones encuentra dos valores prometedores. El primero produce
un rendimiento medio de 10% con una desviacin tpica del 1.2%. El segundo
produce una tasa de rendimiento media del 20% con una desviacin tpica del 5%.
Con ayuda del coeficiente de variacin como medida del riesgo, la agente aconseja a
su cliente ms conservador que invierta en el primer valor. Estara usted de
acuerdo?. Explquelo.
28. A continuacin se indican las relaciones precio-ganancia de 30 valores diferentes
negociados en la bolsa de Nueva York (NYSE):
4.8 5.2 7.6 5.7 6.2 6.6 7.5 8.0 9.0 7.7
3.7 7.3 6.7 7.7 8.2 9.2 8.3 7.3 8.2 6.5
5.4 9.3 10.0 7.3 8.2 9.7 8.4 4.7 7.4 8.3
a) Calcular la media y la desviacin tpica
b) De acuerdo con el teorema de Chebyshev, Cuntas relaciones preciorendimiento se sitan dentro de dos desviaciones tpicas de la media?.
c) Cuntos estn en realidad dentro de dos desviaciones de la media?

MSc. Juan Paredes B.

36

29. A continuacin se da la tabla de frecuencias de las ventas mensuales en dlares de


equipos de parapente en el mercado del sur de California:
Clase
(en cientos de dlares)
5 y menos de 10
10 y menos de 15
15 y menos de 20
20 y menos de 25
25 y menos de 30
30 y menos de 35
35 y menos de 40

Nmero de meses
5
7
9
10
8
3
2

F
5
12
21
31
39
42
44

a) Usted es el estadstico jefe de la Bounce Twice Parachute Company, y su jefe le


pide una descomposicin de la frecuencia de ventas. Est interesado en el valor
por debajo del cual se sita al menos el 60% de las observaciones con una
descomposicin completa en cuartiles.
b) Adems, usted piensa que sera til determinar los valores de los percentiles 10
y 90.
30. Una supervisora de una factora de montaje recibi las siguientes puntuaciones de
eficiencia a lo largo de los 12 ltimos meses:
56, 69, 48, 75, 65, 72, 81, 43, 61, 42, 36, 52
a) Si desea producir la impresin ms favorable, debera informar sobre la media
aritmtica, la mediana o la moda de las puntuaciones en su autoevaluacin
anual?
b) Hasta qu punto han sido consistentes sus puntuaciones?
31. A continuacin se indican las puntuaciones medias de una muestra de 50 estudiantes
de la Universidad estatal de Ohio. Determinar el nmero de clases utilizando el
intervalo de clase adecuado de una tabla de frecuencias. Construir la tabla y calcular
la media aritmtica, la mediana y la moda:
3.72
1.47
2.77
3.01
0.57
1.52
3.44
3.54
3.45
2.09

1.97
4.00
3.01
1.29
2.01
3.59
3.88
3.01
1.11
1.09

2.22
3.99
1.97
2.57
3.40
1.09
0.59
2.89
0.88
1.55

0.59
1.83
2.87
3.31
0.59
1.55
2.57
2.79
3.88
3.42

4.00
1.75
2.52
0.97
3.34
3.20
3.32
2.23
1.19
2.02

MSc. Juan Paredes B.

37

32. Dar una lista de empresas comprendidas en el recorrido intercuartlico con los datos
del problema anterior.
Ventas totales (1998)
(miles de millones de dlares)

10
11
12
13
15
16
17
20
21
22
26
30
34
39
51
54
72
76
102

f
2
4
3
3
3
2
3
1
1
1
2
1
2
1
1
1
1
1
1
34

33. En la tabla se recoge una muestra de 100 cotizaciones al cierre de la bolsa de Nueva
York. Los precios estn redondeados al dlar ms prximo. Calcular la varianza y la
desviacin tpica:

Clase
20 y menos de 25
25 y menos de 30
30 y menos de 35
35 y menos de 40
40 y menos de 45
45 y menos de 50
50 y menos de 55

Frecuencia
2
8
9
19
26
20
16

34. Un conjunto de datos que se sabe normal contiene n = 10,000 observaciones y tiene
una media de 52.5 y una desviacin tpica de 5,5:
a) Cuntas observaciones estn en el intervalo de 47 a 58?.
b) Cuntas observaciones estn en el intervalo de 41.5 a 63.5?.
c) Cuntas observaciones estn por debajo de 36 o por encima de 69?.
35. Se selecciona de la lnea de produccin una muestra de n = 1,000 cajas de 36 onzas
de Krispies de arroz de Kelloggs. Los pesos netos del contenido pertenecen a una

MSc. Juan Paredes B.

38

distribucin normal con una media de 37 onzas y una desviacin tpica de 2 onzas.
El director ejecutivo de Kelloggs insiste en que al menos el 75% de todas las cajas
que salen de la lnea de produccin estn dentro de 0.5 onzas del peso neto
especificado en la caja (36 onzas en este caso). Apoya esta muestra la afirmacin del
director ejecutivo?. Dibuje una grfica para ilustrarlo.

MSc. Juan Paredes B.

39
UNIDAD III
LA MUESTRA

1.

EL MUESTREO
Cuando no es posible investigar a todos los elementos de una poblacin o
universo, se opera mediante la tcnica del Muestreo, la cual se fundamenta en el
principio de que el todo esta constituido por partes y que, las partes representan
al todo, sin embargo, para que la muestra sea representativa del todo, debe reunir
ciertos requisitos, los mismos que se consiguen a travs de la tcnica del
muestreo.
El diseo de la muestra implica tres etapas:
1. Esquema del muestreo (cmo se va a seleccionar la muestra y que tipo de
muestreo se va a utilizar).
2. Encontrar estimadores.
3. Determinar el tamao de la muestra.
El tamao de la muestra estar relacionada con los objetivos del estudio, las
caractersticas de la poblacin, adems de los recursos y del tiempo que se
dispone.
a.

Poblacin

Poblacin o universo es el conjunto o agregado del nmero de elementos con


caractersticas comunes, en un espacio y tiempo determinados sobre los cuales
se puede realizar observaciones. El tamao de la poblacin es la cantidad de los
elementos que la integran y puede ser finita: est delimitada y se conoce el
nmero de elementos que la integran. Infinita es aquella donde no est
delimitado el nmero y, son poblaciones inmensamente grandes.
b.

Marco Muestral
Es una lista completa de todas las unidades muestrales de la poblacin o
alguna otra base que permita un proceso de seleccin de tal manera que
cada elemento de la poblacin tenga una probabilidad matemtica
conocida de ser seleccionada para muestra. Existe dos tipos de marcos
muestrales: marcos para muestras por rea (lista de hogares por rea, por
barrio, por parroquia, e.g.) y marcos para muestra por listado (alumnos
listados en el libro de matrculas, e.g.).

c.

Muestra
Subconjunto representativo de elementos de una poblacin o universo;
del estudio de la muestra se deducen unas leyes que se hacen extensivas a
todo el conjunto poblacional, duplicando los mtodos de inferencia, una
muestra debe tener dos caractersticas bsicas: tamao y
representatividad.

MSc. Juan Paredes B.

40

Tamao: debe ser suficientemente amplio para que permita


extrapolaciones correctas, de no ser as se producen errores de muestreo.
Representatividad: los diferentes elementos que componen una
poblacin tienen que encontrarse comprendidos proporcionalmente en la
muestra.
Tamao de la muestra: es el nmero absoluto de unidades muestrables
seleccionadas del universo.
d.

2.

Unidad Muestral.- Los objetos que se seleccionan de una poblacin, se


llaman unidades maestrales.

REQUISITOS DE UN MUESTREO ADECUADO


Con el fin de que el muestreo proporcione resultados efectivos, es necesario
tomar en cuenta lo siguiente:
a. Contar con la asesora de un estadstico experimentado para obtener un
diseo de muestreo.
b. La exactitud de la informacin no slo depende de la aplicacin de las
frmulas de muestreo; influyen: la calidad del cuestionario, la capacitacin
de los entrevistadores, la supervisin del trabajo de campo y la confiabilidad
de la codificacin, son imprescindibles para lograrla.
c. Las entrevistas y los cuestionarios incompletos y la sustitucin de los
entrevistados porque el encuestador tiene dificultad para entrevistarlos, daa
la representatividad de la muestra.
d. El muestreo es slo una parte del proceso de investigacin y, aunque los
resultados que se obtienen son cuantificables, es necesario analizarlos e
integrarlos en relacin con el contexto total de la investigacin.
e. En el proceso de muestreo existen dos tipos de errores:
Errores debido al muestreo o la cota de error inherente al mtodo de
muestreo.
Errores no debidos al muestreo, sino a fallas de tipo humano al obtener
informacin, al procesarla, o de distorsin de instrucciones.
f. A medida que el tamao de la muestra crece, error tiende a cero.
g. De los diseos de muestra debe elegirse el de mayor precisin al costo
mnimo.

MSc. Juan Paredes B.

3.

41

TIPOS DE MUESTREO

PROBABILISTICOS
O ALEATORIOS

NO PROBALISTICO
O NO ALEATORIOS

a.

Simple al azar
Estratificado uniforme
Por conglomerados
Sistemtico o en serie
Etapas mltiples

Decisional
Realizado por expertos
Por cuotas
Casuales o fciles de estudiar

Muestreo probabilstico o aleatorio

Es el que incluye todos los procedimientos que se basan en el clculo de


probabilidades o procesos al azar, y parten del criterio de dar a cada elemento de
la poblacin iguales probabilidades de ser seleccionados como unidades
muestrales. En esta tcnica probabilstica no interviene en modo alguno la
voluntad o el criterio del investigador.
Las etapas para determinar el tamao de la muestra en el muestreo
aleatorio simple, que es el ms usual, son las siguientes 3:

Determinar el nivel de confianza con el que se desea trabajar:


X = o el 68% de confianza
X = 2 o el 95% de confianza
X = 3 o el 99% de confianza

Estimar las caractersticas del fenmeno investigado. Para ello se


determina la probabilidad de que se realice el evento (p) o la de
que no se realice (q); cuando no se posea suficiente informacin
de la probabilidad del evento, se le asignan los mximos valores:
p
=
0.50
q
=
0.50

Determinar el grado de error mximo aceptable en los resultados


de la investigacin. Esto puede ser hasta el 10%; normalmente lo
aconsejable es trabajar con variaciones del 2 al 6,5 ya que
variaciones superiores al 10% reducen demasiado la validez de la
informacin.

Se aplica la frmula de la muestra de acuerdo con el tipo de


poblacin.

GONZALEZ, Miguel. (1998). Diseos y proyectos de investigacin educativa. Loja: CEPOSTG, pp.
124-141

MSc. Juan Paredes B.

42

Infinita: Cuando no se sabe el nmero exacto de unidades del que est


compuesta la poblacin, difcilmente se presentan estos casos en el mbito
educativo.

pqz 2
n 2
e
Finita: Cuando se conoce cuantos elementos tiene la poblacin. La frmula
es:

Z 2 pqN
Ne 2 Z 2 pq

Z 2 2 N
Ne 2 Z 2 2

En donde:
Z
N
p
q
e
n

=
=
=
=
=
=
=

nivel de confianza
universo
probabilidad a favor
probabilidad en contra
error de estimacin
tamao de la muestra
varianza = pq = S 2

El error de estimacin se utiliza con dos finalidades: a) estimar la precisin


necesaria, y b) determinar el tamao de muestra ms adecuado.
Ejemplo 24.- Se desea aplicar una encuesta sobre la aceptacin
de un producto a los estudiantes de bachillerato de las
unidades educativas del sector norte de ciudad de Quito.
a)

Se determina el nivel de confianza (95% - 5%) o (90% o


10%).

b)

Se obtiene el marco muestral, en este caso la referencia


sera el Departamento de Planeamiento en el que consta el
registro de las unidades educativas (que para nuestro caso
ser de 21703 estudiantes).

c)

Se obtiene una lista de los estudiantes que asisten a cada


unidad educativa y se numeran.

d)

Se elige el mtodo de muestreo. Dadas las caractersticas


de la poblacin se utilizara el mtodo probabilstico y el
muestreo aleatorio simple.

e)

Se aplica la frmula para los distintos valores:

MSc. Juan Paredes B.

43
VALORES
n
=
e
=
Z
=
N
=
q
=

?
1%, 5%, 10%
1.96 (tabla de distribucin normal)
21703
0.50

Z 2 pqN
n
Ne 2 Z 2 pq

Se sustituye con el 99% de confiabilidad.

(2.58) 2 (0.50)(0.50)(21703)
n
(21703)(0.01) 2 (2.58) 2 (0.50)(0.50)

36115.9623
3.8344

n 9418.9344 9419

Se sustituye con el 95% de confiabilidad.

(1.96) 2 (0.50)(0.50)(21703)
(21703)(0.05) 2 (1.96) 2 (0.50)(0.50)

20843.5612
55.2179

n 377.48 377

Se sustituye con el 90% de confiabilidad


(1.65) 2 (0.50)(0.50)(21703)
n
(21703)(0.10) 2 (1.65) 2 (0.50)(0.50)

14771.6044
217.7106

MSc. Juan Paredes B.

44
n 67.85 68
f)

Se comparan los resultados, se analizan y se elige el ms


adecuado. En este ejemplo si se observan los resultados,
obviamente el ms adecuado es el de 9419 que dejara el
menor margen de error y, incluira todas las caractersticas
de la poblacin y, su confiabilidad es muy alta.
En el caso de 377 el margen de error aumenta y el que
sera totalmente inadecuado de ser elegido es de 68 por
cuanto el nivel de error y, consecuentemente de
confiabilidad es muy bajo.

g)

1.

Mediante una tabla de nmeros aleatorios se eligen los


estudiantes y las unidades educativas a los que se aplicara
la encuesta de aceptacin del producto.

Muestreo simple al azar

Consiste en seleccionar las unidades muestrales utilizando medios


mecnicos de juegos de azar, ruletas, monedas o la tabla de nmeros
aleatorios de Random.
Puede ser con reemplazo o sin reemplazo. El muestreo en el que cada
miembro de la poblacin puede elegirse ms de una vez, se llama con
reemplazo y el muestreo sin reemplazo es aquel en el que cada miembro de
la poblacin puede elegirse una sola vez.
2.

Muestreo estratificado

Consiste en dividir a la poblacin en subgrupos o estratos y seleccionar una


muestra aleatoria simple dentro de cada uno. En relacin con el muestreo
aleatorio simple tiene tres ventajas:

El costo de recoleccin y anlisis de datos se reduce al dividir


los grupos con elementos similares pero que difieren de grupo
a grupo.
La varianza del estimador de la media se reduce debido a que
la variabilidad dentro de los estratos es generalmente menor
que la variabilidad de la poblacin.
Se obtienen estimadores separados para los parmetros de
cada subgrupo o estrato sin necesidad de seleccionar otra
muestra.

La estratificacin es til siempre y cuando se puedan definir con facilidad los


estratos y sean claramente observables. Cuanto mayor sea el nmero de
variables estratificadoras menos satisfactorios sern los resultados de la
muestra.

MSc. Juan Paredes B.

45

Las etapas para la seleccin de una muestra estratificada son:

Especificacin clara y detallada de cada estrato.


Seleccin de una muestra aleatoria en cada estrato.

Es aconsejable cuando existen claras diferencias en la poblacin que se va a


estudiar, por ejemplo: religin, sexo, nivel socio-econmico, etc., en un
poblacin relativamente grande. Cuando el nmero de elementos que integra
cada estrato es diferente, la seleccin de la muestra debe realizarse de tal
manera que el nmero de elementos de cada estrato sea proporcional al
tamao de ste.
Su clculo se inicia aplicando el mtodo de nmeros ndices para cada
estrato, su frmula es:

ni

nNi
N

Ejemplo 25.- La Empresa INSUMOS S. A desea realizar un curso de


capacitacin sobre como incrementar la productividad. De sus 382
filiales, deber escogerse las sucursales y los empleados que con un 95%
de confiabilidad y con un 5% de error debern asistir al curso
mencionado.

a)

Se aplica la frmula para establecer la muestra.

(1.96) 2 (0.50)(0.50)(382)
(382)(0.05) 2 (1.96) 2 (0.50)(0.50)

366.8728
1.9154

n 191.5385 192
Debern asistir al curso de capacitacin 192 filiales.

b)

Se utiliza la tabla de nmeros aleatorios para seleccionar


las filiales del marco muestral (listado proporcionado por
la empresa matriz).

c)

Se obtiene un listado de los empleados que se encuentran


en produccin en las filiales elegidas:

MSc. Juan Paredes B.

46

N1
N2
N3
N4
N5

d)

Nivel
Cobertura Internacional
Cobertura Nacional
Cobertura Regional
Cobertura Distrital
Cobertura Local

Nmero
534
173
345
15
144
1211

Se aplica el mtodo de nmeros ndices:

ni

nNi
N

Donde:
ni
n
Ni
N

=
=
=
=

nmero ndice
tamao de la muestra
nmero de nios en cada categora
tamao de la poblacin

Sustituyendo:

e)

3.

n1 192

534
268empleados
382

n2 192

173
87empleados
382

n3 192

345
173empleados
382

n4 192

15
7.54 8empleados
382

n5 192

144
72empleados
382

En las filiales elegidas en el punto b), se realiza la


capacitacin al nmero de empleados determinado para
cada estrato, distribuyndolos proporcionalmente con el
mtodo de nmeros ndices.

Muestreo por conglomerados (superficies o reas geogrficas)

Se realiza seleccionando aleatoriamente un conjunto de grupos de elementos


muestrales llamados conglomerados y llevando a cabo un censo completo en

MSc. Juan Paredes B.

47

cada uno de stos. Es similar a la muestra estratificada pero en este caso se


trata de una estratificacin cartogrfica o de grupos de elementos que no han
sido clasificados previamente.
Esta seleccin se diferencia de la estratificada en que las reas o
conglomerados son intrnsecamente heterogneos, mientras que los estratos
tienden a una homogeneidad interna.

Se delimita la poblacin objeto de la investigacin.


Se realiza un levantamiento del plano, croquis o carta en la
que se encuentra la poblacin.
Se divide en zonas, sectores, manzanas, etc. (de acuerdo al
tipo de investigacin, a la clase de poblacin, a las
necesidades y a los recursos disponibles).
Se numera separadamente cada una de estas diferentes
divisiones y subdivisiones.

Este tipo de muestreo disminuye los costos pero, en ocasiones puede


aumentar el error de muestreo debido a que los elementos de un
conglomerado por lo general tienen caractersticas comunes.
4.

Muestreo sistemtico o en serie

Es un mtodo muy utilizado por ser simple, directo y econmico, requiere ya


conocer la poblacin y la muestra. Su clculo se realiza de la siguiente
manera:

Se calcula el intervalo de seleccin, dividiendo el tamao de


la poblacin para el tamao de la muestra, esto es:

F
F =
n =
N =

N
n
intervalo de seleccin
tamao de la muestra
poblacin o universo

Se sortea un nmero de uno hasta el que indique el intervalo


de seleccin, este nmero seala el primer elemento escogido.

Se suma este primer nmero al intervalo de seleccin en


forma sucesiva hasta llegar al lmite del universo o cerca de
ste.

Ejemplo 26.- Se desea establecer las filiales de acuerdo al orden en el que


se encuentren en el listado de la matriz, a las cuales deber aplicarse la
capacitacin sobre cmo incrementar la productividad.

MSc. Juan Paredes B.

48

382
1.98 2
192

Se debe escoger aleatoriamente un nmero entre 1y 2, que en este caso


podra ser 1 o 2.
A cualquiera de ambos nmeros que salga se le deber sumar 2 y despus a
ese resultado otros dos y, esas sern las filiales a cuyos empleados se les
aplicar la capacitacin.
5.

Muestreo de etapas mltiples

Cuando el resultado obtenido en la primera muestra no es satisfactorio,


decisivo, es necesario extraer una segunda muestra o ms muestras para
proceder al anlisis y tener verdaderos estimadores.
c.

Muestreo no probabilstico o no aleatorio


Este tipo de muestreo, como su nombre lo indica, se basa en el criterio
del investigador; situacin que determina que la muestra no
necesariamente tendr representatividad estadstica, siendo este aspecto
uno de los ms cuestionados en este tipo de muestreo. Las unidades de
muestreo no se seleccionan por procedimientos al azar; se utilizan por
razones de costo.
En general, los mtodos no probabilsticos carecen de validez cientfica,
adems de que no tienen una base terica para calcular la escala de error
ni la representatividad de la muestra, por lo tanto siempre es aconsejable
utilizar mtodos probabilsticos.
Los principales mtodos de muestreo no probabilstico son:
1.

Muestreo decisional
Los investigadores de campo utilizan su criterio para seleccionar
los elementos de una muestra con base en una definicin clara de
la poblacin objetivo.
Ejemplo 27.- Entrevistar a las personas con capacidad de voto
residentes en el sector de Carapungo, para determinar su
intencin de voto en los nuevos comicios de Alcalde.

2.

Muestreo de cuota

Se hace una clasificacin de la poblacin bajo estudio y se utilizan estas


categoras previamente fijadas para obtener un nmero predeterminado
de elementos en cada categora.

MSc. Juan Paredes B.

49

Ejemplo 28.- En una institucin pblica se establecen dos categoras:


empleados con capacitacin y sin capacitacin en proyectos, para
responder a una encuesta a fin de determinar su desempeo y
creatividad. Se decide entrevistar a 200 empleados en total, el 50%
sern empleados entre 25 y 40 aos de edad y el otro 50% empleados
mayores a 40 aos.
3.

Muestreo basado en expertos

Los elementos se eligen con base en la opinin de personas con


autoridad y suficientemente informadas acerca de la poblacin bajo
estudio.
Ejemplo 29.- En un estudio sobre el perfil del docente universitario,
se recurri a una encuesta de 250 docentes con maestra en docencia
universitaria y administracin educativa, como los sujetos ms
idneos para aplicarles una encuesta sobre las caractersticas y
cualidades del maestro de educacin superior.
4.

Muestreos casuales o fciles de estudiar


Este mtodo consiste en investigar a cualquier grupo de personas
que son de fcil acceso o que acuden a un lugar.
Ejemplo 30.- Los profesores de Universidad emplean con
mucha frecuencia a sus propios alumnos como muestra, es
decir, seleccionan directa e intencionadamente los individuos
de la poblacin que es de inters del investigador, por su
disponibilidad.

MSc. Juan Paredes B.

50

ACTIVIDADES DE APLICACIN No. 3

OBJETIVOS
5. Establecer los requisitos para realizar un adecuado muestreo.
6. Conocer las formas de calcular y seleccionar la muestra.

ACTIVIDADES
8. De una poblacin total de 631.325 personas como potenciales turistas, determine
tamao de muestra al 90%, 95% y 99% de confianza.
9. De la poblacin total de la Universidad Tecnolgica Indoamrica sede Quito, escoja
al 90%, 95% y 99% de confianza los estudiantes a los cuales se les aplicara una
encuesta sobre control de calidad en la educacin universitaria.
10. Plantee un problema a investigar, definiendo las variables independiente y
dependiente y, realice la propuesta de los criterios que aplicara para seleccionar la
muestra.

MSc. Juan Paredes B.

51

UNIDAD IV
TOMA DE DECISIONES Y VERIFICACIN DE HIPOTESIS

Para verificar una hiptesis deben considerarse


operacionalizarla y determinar su certeza o falsedad.

algunos

elementos

para

El planteamiento de la hiptesis implica tres modelos:


1. Lgico
2. Matemtico
3. Estadstico
1.

MODELO LOGICO
Se plantea la hiptesis en forma literal; en este planteamiento debe constar:
m.
n.
o.
p.
q.

2.

La medida estadstica que se va a utilizar.


Las variables de estudio.
El o los grupos que se investigan.
El nivel de confianza o probabilidad.
La prueba de significacin estadstica que verifica la hiptesis.

MODELO MATEMATICO
Es el planteamiento de la hiptesis a nivel de smbolos; se utilizan:
Ho = Hiptesis nula.
Ha = Hiptesis alterna.
Se plantean dos hiptesis alternas (H1 y H2) cuando se utiliza un diseo a
dos colas o bilateral; cuando no exista direccionalidad en el
planteamiento de la hiptesis.
Se plantear una sola hiptesis alterna (H a) cuando se trabaje en un
diseo unilateral o de una sola cola.
=

Alfa: Nivel de confianza o probabilidad. Generalmente se utilizan dos


niveles de confianza o probabilidad:
99%
95%

1%
5%

Error tolerable en la toma de decisin.

R =

Regin de rechazo.

P =

Prueba de significacin estadstica que verifica la hiptesis.

Gl =

Grados de libertad.
Deben plantearse nica y exclusivamente cuando se utilicen pruebas de
significacin t, x2 y F (Fisher).

MSc. Juan Paredes B.

a.

52

Hiptesis Nula
Para plantear la hiptesis nula se debe considerar:
1. Si el diseo es de una o dos colas.
2. El tipo de operacin de Estadstica que se va a utilizar:
a. Estimacin de parmetros (ESTADSTICO O ESTADIGRAFO:
es una medida muestral; PARMETRO: medida estadstica que
hace referencia a la poblacin).
b. Dosimacia (comparacin de grupos, contraste de hiptesis).
ESTADISTICO
X
Me
p (proporcin)
r (correlacin)
S
S2

1.

ESTADIGRAFO

MDN
fi
ro

Planteamiento de la Ho en diseos bilaterales

Se consideran dos hiptesis alternas, considerando que se pueden


presentar hasta tres probabilidades en los resultados que se obtengan.

Cuando se estima parmetros la Ho plantea la igualdad del


valor numrico de la medida estadstica que se utiliza para
medir la variable que se estudia.
Cuando se comparan grupos o Dosimacia la H o plantea la
igualdad de los grupos que se compara.

El signo para la Ho es =
EJEMPLOS:
Ho:
Ho:

= 15
= 0.75

DOSIMACIA

2.

H o:
H o:

=
=

Planteamiento de la Ho en diseos unilaterales

Puede hacerse en estimacin de parmetros y en dosimacia.


Se utilizar siempre y cuando exista tendencia,
direccionalidad en el planteamiento de la hiptesis.
Cuando se estiman parmetros se puede tener dos alternativas
del planteamiento de la Ho, que estn en funcin de la curva
normal que se utilice.

MSc. Juan Paredes B.

53
Si se utiliza la cola positiva la Ho plantear el signo = o < (menor
que).
Si se utiliza la cola negativa la Ho plantear el signo = o < (mayor
que).
EJEMPLOS:
Ho:
Ho:

> 15
< 15

Ho:
Ho:

> 0.75
< 0.75

DOSIMACIA
La Ho sigue manteniendo los signos en comparacin de los
grupos.

b.

Ho:

>

Ho:
Ho:

<

Hiptesis Alterna

1.

Para diseos bilaterales

ESTIMACIN DE PARAMETROS
La

as:

H1:
H2:

> 15
< 15

H1:
H2:

> 0.75
< 0.75

DOSIMACIA
H1:
>
H2:
<
H1:

H2:

2.

Para diseos unilaterales

MSc. Juan Paredes B.

54
ESTIMACIN DE PARAMETROS
Ho:
Ha :

> 15
< 15

Ho:
Ha :

> 0.75
< 0.75

Matriz resumen de Ho y Ha en diseos unilaterales y


bilaterales en estimacin de parmetros y dosimacia
Tipo de
Diseo
Unilateral
(1 cola)
Bilateral
(2 colas)

c.

Estimacin de Parm.
Ho
Ha
<
>
>
<
=
>
>

Dosimacia
Ho
Ha
<
>
>
<
=
>
<

Alfa
1. El nivel de confianza es un porcentaje de rea de la curva normal que
permite aceptar o rechazar la Ho y adems indica el nivel de
seguridad que el investigador tiene en el planteamiento de sus
hiptesis.
2. El nivel de confianza siendo un porcentaje de rea de la curva normal
permite determinar los lmites crticos en trminos de desviaciones
estndar de la regin de rechazo y por consiguiente con los lmites
crticos determinar las reas de la curva normal que corresponden
tanto a la Ho como a la Ha.

3. Toda la curva es igual al 100% o a 1 en proporciones.

99% Bilateral
+ 2.58
Unilateral
+ 2.33
95% Bilateral
+ 1.96
Unilateral
+ 1.645

MSc. Juan Paredes B.

55

4. Estos valores normales se utilizarn siempre y cuando en la


investigacin se trabaje con muestras grandes (ms de 31 casos).
5. Con muestras pequeas para determinar estos valores primeramente
se deben conocer los grados de libertad con los que se trabaje.
TIPO DE
DISEO
UNILATERAL
BILATERAL

Nivel de confianza
95%
99%
+ 1.64
+ 2.33
+ 1.96
+ 2.58

6. Todo lo anterior se ubica en la curva normal.


7. El signo de la Ho es < en cola (+) y es > en cola (-).

REPRESENTACIN GRAFICA

Diseos Unilaterales

Se presentan dos espacios. El rea ms grande corresponder a la H o.


Cada parte de la curva es un rea con nombre especfico. As:
a. La zona ms grande es ZONA DE ACEPTACIN de Ho.
b. La zona ms pequea es ZONA DE RECHAZO o H a.

MSc. Juan Paredes B.

56

Diseos Unilaterales

Diseos Bilaterales

1.

Hay tres reas:


- la ms grande H o su signo es =
- lado derecho H1 su signo es >
- lado izquierdo H2 su signo es <

MSc. Juan Paredes B.

57

2.

Existen dos zonas de rechazo.

3.

La identificacin de las reas que corresponden a la H o y H1


permitirn en razn de sus respectivos valores crticos- alcanzar a
tomar una decisin frente a las hiptesis de investigacin.

POR EJEMPLO EN LOS DISEOS UNILATERALES

Cola + al 99% de confianza.


Se acepta la Ho cuando el valor obtenido es igual o menor al
propuesto a 2.33

Cola + al 95% de confianza.


Aceptamos Ho cuando sea = o menor a 1.64

Cola al 99% de confianza.


Aceptamos Ho cuando sea = o mayor a 2.33

POR EJEMPLO EN LOS DISEOS BILATERALES

3.

La Ho cuando el valor de la prueba se halla entre + 2.58 y + 1.96

La H1 cuando el valor de la prueba > a 2.58 y 1.96

La H2 cuando el valor de la prueba < a -2.58 y -1.96

MODELO ESTADSTICO
En el que se define las frmulas que se aplicarn para la comprobacin de las
hiptesis planteadas.

MSc. Juan Paredes B.

58
UNIDAD V
PRUEBAS DE VERIFICACION

1.

DOSIMACIA
Dosimacia es comparacin de grupos o contraste de hiptesis; implica el
establecimiento de dos grupos o subgrupos que, comparados entre s posibilitan
la verificacin de los planteamientos realizados a nivel de hiptesis, requiere el
manejo de grupos grandes (ms de 30 observaciones).
a.

Diferencia de Medias
Se utiliza esta prueba cuando las variables son de tipo cuantitativo. La
diferencia de los grupos que se comparen debe realizarse a travs de la
utilizacin de variables independientes de clasificacin como por
ejemplo: condicin socio-econmica, sexo, nivel de instruccin,
ubicacin geogrfica, entre otros.
La medida estadstica con la cual se trabaja es la Media Aritmtica.
1.

Diseo Global

Posibilita la comparacin de dos grupos, en los cuales se va a obtener el


Promedio 1 y el Promedio 2 en relacin a una misma variable y, utilizando el
mismo instrumento. Posibilita comparar si la diferencia que existe entre ambos
promedios es significativa o no en trminos estadsticos.
Este diseo permite conocer la existencia o no de diferencias entre los grupos
que se comparan con respecto a la misma variable, permite conocer la realidad.
Este tipo de prueba es muy pertinente con la Investigacin de tipo descriptivo o
expost-facto.
Ejemplo 31.a)

Planteamiento del problema


Cul es la diferencia del monto de ventas, entre los
vendedores de las subsidiarias A y B de la Transnacional
Global, dedicada a la distribucin de insumos industriales.

b)

Objetivos
Determinar la diferencia del monto de ventas, entre los
vendedores de las subsidiarias A y B de la Transnacional
Global, dedicada a la distribucin de insumos industriales.

MSc. Juan Paredes B.

59
c)

Hiptesis
Si existe diferencia entre el monto de ventas, de los
vendedores de las subsidiarias A y B de la Transnacional
Global, dedicada a la distribucin de insumos industriales.

d)

Modelo Matemtico
Ho:
H1:
:
R:
P:

e)

X1 = X 2
X1 X 2
0.01
+ 2.58
Z (o razn crtica)

Modelo Estadstico

X1 X 2
S X1 X 2
S12 S 22

n1 n2

S X1 X 2

fV
n
S

fV

nX 2

n 1

GRUPO No. 1 MONTO DE VENTAS DE LOS


VENDEDORES DE LA SUBSIDIARIA A
90
92
87
68
78
105
85

95
97
86
77
108
90
88

A (110 68) 42
#ti = 10

70
105
81
91
110
95
70

100
108
80
77
90
93
73

99
80
75
80
100
96
78

MSc. Juan Paredes B.

60
i

42
4.2
10

i4

Intervalos
108 - 111
104 107
100 103
96 99
92 95
88 91
84 87
80 83
76 79
72 75
68 71

fV
n

F
3
2
2
3
4
5
3
4
4
2
3
35

V
109.5
105.5
101.5
97.5
93.5
89.5
85.5
81.5
77.5
73.5
69.5

fV
328.5
211
203
292.5
374
447.5
256.5
326
310
147
208.5
3104.5

fV2
35970.75
22260.5
20604.5
28518.75
34969
40051.25
21930.75
26569
24025
10804.5
14490.75
280194.75

3104.5
35

X 88.7

fV

nX 2

n 1

280194.75 35(88.7) 2
35 1

S 2 =141.93

GRUPO No. 2 MONTO DE VENTAS DE LOS


VENDEDORES DE LA SUBSIDIARIA B
102
50
80
78
85
76
88
70

100
90
77
79
73
70
85
80

90
80
69
80
72
88
83
75

98
76
73
100
71
73
98
79

77
68
75
90
75
74
100
70

MSc. Juan Paredes B.

61

A (100 50) 50
#ti = 10

60
6
10

i6

Intervalos
98 103
92 97
86 91
80 85
74 79
68 73
62 67
56 61
50 55

fV
n

F
6
0
5
7
11
10
0
0
1
40

3222
40

nX 2

V
100.5
94.5
88.5
82.5
76.5
70.5
64.5
58.5
52.5

fV
603
0
442.5
577.5
841.5
705
0
0
52.5
3222

X 80.55

fV

n 1

S 2 =120.72

264240 40(80.55) 2

40 1

fV2
60601.5
0
39161.25
47643.75
64374.75
49702.5
0
0
2756.25
264240

MSc. Juan Paredes B.

62

RAZON CRITICA

X1 X 2
S X1 X 2

S X1 X 2

S12 S 22

n1 n2

S X1 X 2

141.93 120.72

35
40

S X1 X 2 2.7

Z
f)

88.7 80.55
2.7

Matriz de Datos
GRUPOS
Subsidiaria A
Subsidiaria B

g)

Z = 3,02

DECISIN

n
35
40

S2
141.93
120.72

X
88.7
80.55

MSc. Juan Paredes B.

63
X1 X 2
X1 > X 2

El monto de ventas de los vendedores de la


subsidiaria A es mayor que el monto de ventas
de los vendedores de la subsidiaria B.

SI EXISTE DIFERENCIA SIGNIFICATIVA ENTRE


EL MONTO DE VENTAS DE LOS VENDEDORES
DE LA SUBSIDIARIA A QUE ES MAYOR QUE EL
MONTO DE VENTAS DE LOS VENDEDORES DE
LA SUBSIDIARIA B

b.

Diferencia de Proporciones o Porcentajes


Cuando las variables son cualitativas, es decir corresponden a
caractersticas o cualidades de los sujetos, por ejemplo opiniones
y criterios.
Pretende establecer la significancia de las diferencias de los
PORCENTAJES de los grupos que se investiga.
Ejemplo 32.Cul es la diferencia de opinin entre investigadores hombres y
mujeres de la ciudad de Quito sobre la aplicacin del Marco
Lgico como metodologa para la elaboracin de proyectos.
a)

Objetivos
Determinar si las diferencias de
investigadores son significativas o no.

b)

Hiptesis
No existe diferencia significativa.
95%
:
0.05
R:
+ 1.96
P:
Z%

opinin

entre

MSc. Juan Paredes B.

64

c)

Modelo Matemtico
95%
Ho:
H1:
:
R:
P:

d)

Modelo Estadstico

ZP

P1 P2
S P1 P2

S P1 P2

e)

P = P
P P
0.05
+ 1.96
ZP

P1 (1 P1 ) P2 (1 P2 )

n1
n2

Matriz de Datos
GRUPO
S
Hombres
Mujeres
TOTAL

f)

500
480
980

250
400
650

0.50
0.83
-------

Operacionalizacin de la frmula

P1

250
0.50
500

P2

400
0.83
480

S P1 P2

P1 (1 P1 ) P2 (1 P2 )

n1
n2

S P1 P2

0.50(1 0.50) 0.83(1 0.83)

500
480

MSc. Juan Paredes B.

65

S P1 P2 0.03

g)

ZP

P1 P2
S P1 P2

ZP

0.50 0.83 0.33

11
0.03
0.03

DECISIN

P P
P < P

SI EXISTE DIFERENCIA SIGNIFICATIVA ENTRE


LA OPININ DE LAS INVESTIGADORAS
MUJERES DE LA CIUDAD DE QUITO A FAVOR
DE LA APLICACIN DEL MARCO LGICO
COMO
METODOLOGA
PARA
LA
ELABORACIN DE PROYECTOS.

MSc. Juan Paredes B.

2.

66

LA PRUEBA X2
Se aplica en variables cualitativas, trata de averiguar:
1. Las discrepancias entre las frecuencias observadas en la investigacin y las
frecuencias calculadas
2. Trata de determinar si las variables que se investigan se asocian o no en el
universo que se investiga.
ESTABLECE SI DOS O MAS VARIABLES SE ASOCIAN O NO.
En la matriz de frecuencia observada los valores numricos de la frecuencia
debern ser por lo menos mayores a cinco (5) y el nmero de columnas filas no
deber exceder a doce (12), caso contrario la prueba pierde su efectividad.
Cuando se trabaja con dos o ms variables se denomina MULTIGRUPO o
MULTIVARIABLE.
Ejemplo 33.Existe relacin entre la condicin socio-econmica y el nivel de instruccin del
padre de familia de los alumnos de 1er. Ao de Educacin Bsica de las
Escuelas Fiscales del sector nor-occidental de la ciudad de Quito.
a)

Objetivos
Determinar si la condicin socio-econmica se relaciona con el nivel de
instruccin.

b)

Hiptesis
Si existe relacin.
Ho:

X2o

H1:

X2o

<

X2t

>

X2t

NO HAY RELACION

SI HAY RELACION

El X2 no parte de ninguna medida estadstica descriptiva, slo toma en


consideracin el ordenamiento tabular obtenido en la investigacin
(frecuencias), las cuales no son medidas estadsticas. Slo toma en
cuenta el nmero de veces que se repite cada respuesta.

MSc. Juan Paredes B.

c)

67

Modelo Matemtico
95%
:
0.05
R:
P:
X2
Gl: (NC-1)(NF-1)
R:

d)

99%
:
0.01
R:
P:
X2
Gl:
(NC-1)(NF-1)

La regin de rechazo slo queda indicada hasta tanto se conozcan


los grados de libertad.

Modelo Estadstico

X2

( fo fe )2
fe

Operacionalizacin de la frmula
Cuadro de X2 Cuadrado
fo

fe

fo-fe

(fo-fe)2

fo fe
fe

X
fe
Tf
Tc
TG

e)

Tf * Tc
TG
=
=
=

Total de filas
Total de columnas
Total General

Matriz de Frecuencias Observadas

NIVEL
INSTRUCCION
Sin instruccin
Primaria
Media
Superior
TOTAL

Condicin socio-econmica
Alta
Media
Baja
15
8
16
12
13
15
10
9
8
23
5
6
60
35
45

TOTAL
39
40
27
34
140

MSc. Juan Paredes B.

f)

68

Operacionalizacin de las frmulas

95%
:
gl:
R:
P:

99%
:
gl:

0.05
(NC-1)(NF-1)
(3-1) (4-1) = 6
(gl6) > 12.592
X2

R:
P:

0.01
(NC-1)(NF-1)
(3-1) (4-1) = 6
(gl6) > 16.812
X2

fo

fe

fo-fe

(fo-fe)2

15
12
10
23
8
13
9
5
16
15
8
6

16.71
17.14
11.57
14.57
09.75
10.00
06.75
08.50
12.54
12.86
08.68
10.93

-1.71
-5.14
-1.57
+8.43
-1.75
-3.00
+2.25
-3.50
-3.46
+2.14
-0.68
-4.93

02.92
26.42
02.46
71.06
03.06
09.00
05.06
12.25
11.97
04.58
00.46
24.30
X2

fo fe
fe
0.17
1.54
0.21
4.87
0.31
0.90
0.74
1.44
0.95
0.35
0.05
2.23
13.76

MSc. Juan Paredes B.

g)

3.

69

DECISIN

X2o :

13.76 <

X2t (16.812)

X2o :

13.76 >

X2t (12.592) SI HAY RELACION (al 95%)

NO HAY RELACION (al 99%)

LA PRUEBA t DE STUDENT
Es una prueba de significacin estadstica. La prueba t se la utiliza:
1.
2.

3.

4.
5.

6.

7.

8.

9.

Con muestras pequeas, es decir cuando el n es menor que 31.


Cuando se desea establecer la diferencia ente medias aritmticas, las
cuales pueden ser conseguidas en un solo grupo o en dos grupos
independientes.
Cuando las variables dependientes que se estudien sean de tipo
cuantitativo y por consecuencia en su procesamiento se pueda obtener
una , por tanto las variables debern ser medidas a travs de escalas
intervalares.
Cuando las muestras sean obtenidas por procedimientos probabilsticos o
al azar.
Bajo la presuncin de que la poblacin de la o las variables que se
estudien se distribuyen normalmente, es decir que tengan una apariencia
de la curva normal.
En proyectos de investigaciones experimentales o cuasi experimentales,
es decir cuando el investigador en el diseo logra controlar todas las
variables extraas al experimento.
El proyecto cuasi-experimental cuando el investigador no logra controlar
todas las variables extraas y por tanto algn momento pueden
influenciar en la variable dependiente.
Cuando se desee probar la influencia que ejerce un determinado
programa o variable independiente o experimental en la variable
dependiente o de efecto.
Se puede trabajar con uno o dos grupos.

MSc. Juan Paredes B.

70

Toda investigacin utiliza trminos, palabras, CONSTRUCTO: que es sinnimo


de trmino, palabra, es un concepto cientfico.
1.

2.

El investigador maneja conceptos, CONSTRUCTOS, utiliza un lenguaje


en el cual los conceptos que utiliza no son independientes sino que se
relacionan con otros trminos, conceptos.
Los conceptos cientficos o CONSTRUCTOS se relacionan con otros
conceptos y pueden ser medidos y observados. Cuando se encuentra en
una investigacin operacionalizada se convierte en variable pues se est
utilizando el concepto.

Se estudiar la prueba t bajo tres variantes fundamentales:


1.
2.
3.

El estudio experimental de un grupo con un diseo antes y despus,


tambin denominado DISEO DE PANEL.
El estudio de dos grupos independientes, pero las muestras iguales.
El estudio de dos grupos pero con diferente tamao de muestra.

Las variaciones que se establecen entre estas tres formas que se utiliza la prueba
t, se hallan ms bien en el modelo estadstico de los datos ya que los
planteamientos tericos tanto del problema, objetivo e hiptesis son
aproximadamente similares.

a.

1er. CASO DISEO DE PANEL O DISEO ANTES Y DESPUS


O PRE-TEST Y POST-TEST
Esta forma se la utiliza cuando el investigador est interesado en estudiar
un solo grupo. Es decir, una sola muestra y determinar en ella la
influencia que ejerce una variable independiente en otra variable
dependiente para lo cual el investigador inicialmente administrar una
prueba pre-test de diagnstico de la variable dependiente antes del
experimento (variable experimental o causal) y luego del experimento
administrar una segunda prueba al mismo grupo pero despus del
experimento para evaluar a la variable dependiente los cambios o
modificaciones producidas.
Los datos del PRETEST se constituyen en control de los datos del
POSTEST. Se establece la relacin entre X1 y X2. Si las medias son
iguales significa que el programa aplicado no tiene efectividad.
Ejemplo 34.Que influencia ejerce la aplicacin de un curso de capacitacin sobre
como incrementar las ventas en la empresa Insumos S.A., la misma que
cuenta con 15 vendedores a nivel nacional. Con la finalidad de medir la
eficacia del curso, se compar los datos de ventas en miles de dlares,

MSc. Juan Paredes B.

71

obtenidos por los vendedores del curso, 6 meses antes de la capacitacin


y 6 meses despus de ella.

a)

Objetivos
Determinar si el programa de capacitacin ejerce influencia en el
incremento de las ventas en la empresa Insumos S.A.

b)

Hiptesis
El promedio de ventas de los vendedores sometidos al programa de
capacitacin mejora, respecto del promedio obtenido antes de haber
sido sometidos al programa, siendo estadsticamente significativo al
95% - 99% de probabilidad con la prueba t.

c)

Modelo Matemtico

X 1 = X 2
X 1 X 2
0.01
n 1= 15-1 = 14
+ 2.977(gl = 14)
t

Ho:
H1:
:
gl:
R:
P:

d)

Modelo Estadstico

D
SD

tD

SD

nD 2

n 1

D
n

SD

SD
n 1

MSc. Juan Paredes B.

72

Operacionalizacin de las frmulas

No.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.

08
07
10
11
11
09
08
10
11
10
16
10
11
08
11
151

07
09
11
10
13
14
09
11
12
12
09
09
08
12
11
157

D 6 0.4
n

SD

SD
tD

15

nD 2

n 1

SD
n 1
D
SD

118 15(0.4) 2
2.87
15 1

2.87
0.77
15 1
0.4
0.52
0.77

(1-2)
D
+1
-2
-1
+1
-2
-5
-1
-1
-1
-2
+7
+1
+3
-4
0
-6

D2
1
4
1
1
4
25
1
1
1
4
49
1
9
16
0
118

MSc. Juan Paredes B.

e)

73

DECISIN

-2.977 < t

< 2.977

SE ACEPTA LA Ho NO HAY DIFERENCIA SIGNIFICATIVA, POR


TANTO LA IMPLEMENTACION DEL PROGRAMA NO ES CAUSA DE
LA VARIACIN EN EL RESULTADO OBTENIDO.

b.

2do. CASO MUESTRAS IGUALES EN LOS DOS GRUPOS


Cuando ambos grupos tienen igual nmero de sujetos. Se utiliza este
modelo:
1. Cuando se desee estudiar una variable dependiente bajo la influencia
de un factor experimental o independiente.
2. Cuando tienen igual nmero de participantes.
3. El un grupo se constituye en grupo control y el otro grupo en
experimental; a este ltimo se le someter a la influencia del factor
experimental o variable independiente.
En esta segunda forma puede presentarse que el investigador desea
manejar dos variables o factores experimentales, el uno que influye en
un grupo y la otra experimentacin en el otro grupo. Es decir los dos
grupos sufren experimentacin sobre una misma variable dependiente.

MSc. Juan Paredes B.

74

Ejemplo 35.El Director General de la UTI Quito determin que en dos cursos de la
Maestra en Gestin de Proyectos Socio Productivos, por haber dos
docentes diferentes en la asignatura de Proyectos, se obtenan diferentes
resultados. Se sugiri que tanto el profesor del paralelo A como el del
paralelo B utilizaran la misma metodologa, 50% teora y 50% prctica,
la diferenciacin estaba determinada por el docente.
Al finalizar el Mdulo los resultados se presentaron de la manera que se
expone en el siguiente cuadro:

No.
1.
2.
3.
4.
5.
6.
7.
7.
9.
10.

a)

15
17
13
10
19
08
12
10
11
15
130

17
16
17
13
12
16
15
10
11
6
130

Objetivo
Determinar si la presencia de uno u otro docente influye en el rendimiento de
Proyectos de los maestrantes de los paralelos A y B.

b)

Hiptesis
Determinar si existen diferencias o no entre grupos.

c)

Modelo Matemtico
Ho:
H1:
:
gl:
R:
P:

X 1 = X 2
X 1 X 2
0.01
n1 + n2 2 =10+10-2 = 18
+ 2.878 (gl=18)
t

MSc. Juan Paredes B.

f)

75

Modelo Estadstico

t X1X2

X1 X 2
S X1X2

X
n

(n1 1) S X1 (n2 1) S X 2
2

S X1X2

SX

n1 n2 2

n1 n2
n1n2

( X X ) 2
n 1

Operacionalizacin de las frmulas


No.
1.
15
2.
17
3.
13
4.
10
5.
19
6.
08
7.
12
7.
10
9.
11
10.
15
130

X X 1 ) X2 X 2 )
17
04
13.69
16
16
7.29
17
00
13.69
13
09
0.09
12
36
1.69
16
25
7.29
15
01
2.89
10
09
10.89
11
04
5.29
6
04
53.29
133
108
116.10

MSc. Juan Paredes B.

X1

X2

76
1

X
n

130
13
10

133
13.3
10

( X 1 X 1 ) 2

n 1

S X1

S X2

( X 2 X 2 ) 2

n 1

116.10
3.59
10 1

(n1 1) S X1 (n2 1) S X 2
2

S X1X2

S X 1 X 2

n1 n2 2

n1 n2
n1n2

(10 1)(3.46) 2 (10 1)(3.59) 2 10 10

1.58
10 10 2
(10)(10)

t X 1 X 2
g)

108
3.46
10 1

X 1 X 2 13 13.3

0.19
S X 1 X 2
1.58

DECISIN

-2.878 < t X 1 X 2 < 2.878


SE ACEPTA LA Ho NO HAY DIFERENCIA
SIGNIFICATIVA, POR TANTO LA IMPLEMENTACION
DEL PROGRAMA NO ES CAUSA DE LA VARIACIN EN
EL RESULTADO OBTENIDO.

MSc. Juan Paredes B.

c.

77

3er. CASO DOS GRUPOS INDEPENDIENTES


Vara nica y exclusivamente en el tamao de las muestras que se pueden
formar, es decir los grupos sern iguales en todas sus caractersticas
menos en el tamao. Se puede optar porque los dos grupos sean
experimentales o si no que un grupo sea de control y el otro
experimental.
Ejemplo 36.En dos cursos de la Maestra en Gestin de Proyectos Socio -Productivos
se sugiri que se apliquen dos metodologas en Macroeconoma.
1. Aplicacin de Proyectos.
2. Constructivismo Social.
Conseguidas las condiciones experimentales necesarias al trmino del
mdulo, se consiguieron los siguientes resultados:

15
17
13
10
19
08

No.
1.
2.
3.
4.
5.
6.
7.
7.
9.
10.
d)

17
16
17
13
12
16
15
10
11
6

Objetivo
Determinar cual de las dos metodologas ha conseguido mejores
resultados en Macroeconoma.

e)

Hiptesis

f)

Establecer si existe diferencia significativa o no en los promedios


obtenidos en Macroeconoma, de acuerdo a la metodologa que se
utiliza.
Modelo Matemtico
Ho:
H1:
:
gl:
R:
P:

X 1 = X 2
X 1 X 2
0.01
(n1 + n2 2) = 6+10-2 = 14
+ 2.977 (gl=14)
t

MSc. Juan Paredes B.

d)

78
Modelo Estadstico

X1 X 2
S X1X2

t X1X2

X
n

(n1 1) S X1 (n2 1) S X 2
2

S X1X2

n1 n2 2
( X X ) 2
n 1

SX

Operacionalizacin de las frmulas

15
17
13
10
19
08

No.
1.
2.
3.
4.
5.
6.
7.
7.
9.
10.

X1

X2

82

X
n

17
16
17
13
12
16
15
10
11
6
133

X X 1 ) X2 X 2 )
1.7689
13.69
11.0889
7.29
0.4489
13.69
13.4689
0.09
28.4089
1.69
32.1489
7.29
2.89
10.89
5.29
53.29
116.10

82
13.67
6

133
13.3
10

n1 n2
n1n2

MSc. Juan Paredes B.

79
( X 1 X 1 ) 2

n 1

S X1

( X 2 X 2 ) 2

n 1

S X2

116.10
3.59
10 1

(n1 1) S X1 (n2 1) S X 2
2

S X1X2

S X 1 X 2

n1 n2 2

n1 n2
n1n2

(6 1)(4.18) 2 (10 1)(3.59) 2 6 10

1.97
6 10 2
(6)(10)

t X 1 X 2

e)

87.3334
4.18
6 1

X 1 X 2 13.67 13.3

0.19
S X 1 X 2
1.97

DECISIN

-2.977 < t X X < 2.977


1

PARA EL APRENDIZAJE DE MACROECONOMA, SE


PUEDE UTILIZAR TANTO PROYECTOS COMO EL
CONSTRUCTIVISMO SOCIAL PUESTO QUE LAS DOS
PROPORCIONAN IGUALES RESULTADOS.

MSc. Juan Paredes B.

4.

80

RAZON F CON TRES O MAS MEDIAS POBLACIONALES


Para ensayar hiptesis se utiliza en este caso Anlisis de Varianza que es el
estimador adecuado, por cuanto el valor tipificado Z y t de Student, slo se
aplican para dos media y cuando se espera que las medias poblaciones son
iguales 1 = = 3 = 4 = etc.... De igual manera se espera que las varianzas
sean iguales 1 2 = 22 = 32 = etc....
Cuando se trabaja con muestras aleatorias, se consideran a las muestras como
clases de una que es el total o poblacin y en este caso se utiliza la Razn de la
Varianza.
Se aplica la frmula:

S12
S 22

Donde:
S12
S22
S12 =

=
=

Varianza entre clases.


Varianza dentro de las clases.

Suma de las variaciones de las medias de cada grupo (clase con respecto a la media general)
Nmero de clases

Na( X a X g ) 2 Nb( X b X g ) 2 .....Nx( X x X g ) 2


S12

Nmero de grupos menos 1


Ni
=
i
=
=
Xi
X g =
X i-Xg =
S12
=
S22
=
S22 =

X g )2

n 1

Nmero de elementos de las diferentes clases o grupos (a,b,c,etc.).


Clases individuales, a, b, c, etc...
Media de cada clase.
Media total, o media de las medias (g).
Variacin.
Varianza entre clases.
Varianza dentro de las clases.

Suma de las desviaciones de los valores de clase con referencia su media


Suma de los elementos de cada clase, menos el nmero de clases

Donde:
Xi
N

Ni( X

=
=

Valores individuales.
na + nb + nc + .... nx

MSc. Juan Paredes B.

81

Ejemplo 37.Un analista financiero desea saber si existe diferencia significativa entre las
utilidades obtenidas por las empresas A, B Y C. Se recopil informacin de los
rendimientos mensuales de cada una de estas empresas, obtenindose la
siguiente informacin en miles de dlares.

A
80
75
60
95
40

B
70
50
105
72
55
98
450
75

350
70
a.

C
110
50
68
80

xaa
100
25
100
625
900

308
77

1750

xbb
25
625
900
9
400
529
2488

xcc
1089
729
81
9

1908

Hiptesis
Ho

Xa

Xb

Xc

H1

Xa

Xb

Xc

O tambin:
Ho:
H1:

b.

Las medias de las utilidades de las 3 empresas son iguales.


Las medias de las 3 empresas difieren significativamente en lo
que respecta a sus utilidades.

Razn F

D1
K 1 3 1
2
Valor que corresponde a 3.89 en la tabla

D2 n K 15 3 12
Fc > 3.89, se rechaza la Ho

S12
S 22

Na( X a X g ) 2 Nb( X b X g ) 2 Nc( X c X g ) 2


S
K 1
2
1

CALCULO DE LA RAZON F

S12

5(70 73.87) 2 6(75 73.87) 2 4(77 73.87) 2


3 1

MSc. Juan Paredes B.

82

S12 60.87
S 22

S 22
F
Fc=

( X a X a ) 2 ( X b X b ) 2 ( X c X c ) 2
n nmero de grupos

1750 2488 1908


512.17
15 3

60.86
0.12
512.17
0.12

DECISION
Fc = 0.12 < Ft = 3.89
SE ACEPTA Ho , ES DECIR NO HAY DIFERENCIA SIGNIFICATIVA
EN LA MEDIA DE LAS UTILIDADES DE LAS TRES EMPRESAS.

MSc. Juan Paredes B.

83
ACTIVIDADES DE APLICACIN No.4

OBJETIVOS
7. Conocer las pruebas estadsticas ms utilizadas para la comprobacin de hiptesis
en el mbito educativo.
8. Aplicar las frmulas en diferentes ejercicios.

ACTIVIDADES
11. Demostrar que 1 al 95 y 99% de confianza si los resultados obtenidos en la
investigacin son:
GRUPOS
1er. Curso
2do. Curso

S2
40.28
30.00

n
1312
1300

X
78.6
70.6

Si la prueba administrada tiene 80 items y mide razonamiento verbal.


Construir el problema, su objetivo, su hiptesis y comprobarla.
12. Probar al 95 y 99% de confianza si el tiempo compartido con los padres por parte de
los nios con y sin bajo rendimiento es significativo.
GRUPOS
Con bajo rendimiento
Sin bajo rendimiento
TOTAL

n
60
75

f
42
56

-------

13. Comprobar al 95 y 99% de confianza la relacin existente entre el desarrollo


psicomotor y los puntajes obtenidos en las diferentes pruebas.
DESARROLLO
PSICOMOTOR
Motricidad gruesa
Motricidad fina
Esquema corporal
Lateralidad
Ubicacin espacial
Ubicacin temporal
Lenguaje
TOTAL

AREAS ACADEMICAS
PreEsc.

PreMat.

PreLect.

Ent.
Natu.

Arte

Ms.

28
5
5
20
22
10
24

35
6
6
7
10
10
14

10
5
16
13
5
19
22

8
15
10
8
18
8
15

13
18
15
10
12
13
20

5
29
20
10
8
21
6

Ingls TOTAL

5
20
29
15
7
30
11

MSc. Juan Paredes B.

84

14. Determinar al 95 y 99% de confianza si el programa de estimulacin temprana


aplicada a nios de cinco aos en diferentes reas ha sido efectiva para su
desarrollo.
No.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.

Pre-test
23
22
25
19
27
14
14
16
19
21
24
13
15
19
21
19
15
14
17
13
16
18
19
21
22

Post-test
23
23
25
22
29
20
18
17
25
22
25
17
16
24
24
22
21
18
17
20
18
26
26
25
24

15. Divida su clase en dos grupos, a un grupo aplquele una prueba de Investigacin sin
proporcionarle ningn tipo de explicacin y a otro dndole todas las facilidades y
ayudas, determinar al 95 y 99% de confianza si existe diferencia significativa o no
en la forma en la que se ha aplicado esta prueba.
16. Compare los resultados obtenidos en Macroeconoma de su curso y de otro paralelo
que tenga un nmero diferente de alumnos; elabore una explicacin tentativa y al 95
y 99% de confianza pruebe estos resultados.
17. Plantee un problema entre tres paralelos de la Maestra en Gestin de Proyectos
Socio - Productivos, proponiendo las horas que requeriran los alumnos de cada uno
de estos para la resolucin de estas actividades. Compare los resultados al 95 y 99%
de confianza.

MSc. Juan Paredes B.

85

ANEXOS

MSc. Juan Paredes B.

86

MSc. Juan Paredes B.

87

MSc. Juan Paredes B.

88

MSc. Juan Paredes B.

89

MSc. Juan Paredes B.

90

MSc. Juan Paredes B.

91

MSc. Juan Paredes B.

92

MSc. Juan Paredes B.

93

BIBLIOGRAFA

WEBSTER Allen, Estadstica Aplicada a los Negocios y la Economa, Mc


Graw Hill, 2005.
BERENSON y otros, Estadstica para Administracin, Pretencie Hall 2006.
RITCHEY Ferris, Estadstica para las Ciencias Sociales, 2006.
MURRAY Spiegel, Estadstica, Mc Graw Hill, 2005.
DAZA Jorge, Estadstica Aplicada, Megabyte, 2006.
DIAS MOSTO Jorge, Estadstica, Elite, Lima- Per, 2001.