Está en la página 1de 190

CAPTULO I

Estadstica e Investigacin

Estadstica e Investigacin

1. La Estadstica y la Investigacin Cientfica

1
Slo con el propsito de crear un marco adecuado para nuestra exposicin, daremos
algunas ideas bsicas sobre investigacin, sin explicar los conceptos, dado que esto
compete al curso de Metodologa de la Investigacin Cientfica.

De las muchas definiciones que se pueden encontrar en la bibliografa, la siguiente


es sencilla, clara y completa: Es el estudio sistemtico, controlado, emprico, reflexivo y
crtico de proposiciones hipotticas sobre las supuestas relaciones que existen entre
fenmenos naturales. Permite descubrir nuevos hechos o datos, relaciones o leyes, en
cualquier campo del conocimiento humano.... (Canales, Alvarado y Pineda, 1996, p. 53).

Segn Canavos (1992), explica los tipos caractersticas y fases de la investigacin:

1.1. Qu tipos de Investigacin existen?

Existen tantas tipificaciones de la investigacin como criterios se emplean. Es


frecuente encontrar en la literatura sobre metodologa de la investigacin una exposicin de
las clasificaciones segn diversos criterios que a juicio de sus autores son los "ms
importantes". Ante esta situacin es conveniente aclarar que no hay clasificaciones buenas
ni malas, ni verdaderas ni falsas, ni ms importantes ni menos importantes. Una tipificacin
s puede ser ms o menos adecuada, til en mayor o menor grado para identificar una
investigacin. Hay quienes pretenden tipificar una investigacin particular segn los
diferentes criterios conocidos, el resultado es, en la mayora de los casos, un embrollo
artificial e intil.

En este texto le presentamos slo una tipificacin, la que en base a nuestra experiencia,
resulta ser de mayor utilidad en muchas disciplinas, en particular para las investigaciones
en el campo de la educacin y administracin.

1.1.1. La Investigacin Descriptiva (Diagnstica).


Cuando el objetivo de la investigacin es la descripcin o la caracterizacin de
un aspecto, fenmeno o un proceso educativo, estaremos en el caso de una investigacin
descriptiva.

*La investigacin descriptiva univariada.


Un ejemplo de este tipo sera una investigacin que se plantea el siguiente
objetivo:
"Identificar las caractersticas de los cliente puntuales en los crditos del Banco de Crdito-
sucursal Balta, atendidos en el presente ao (2013)".
La descripcin del fenmeno de la desercin consistir fundamentalmente en la medicin
de su incidencia segn gnero, grado de estudio, lugar de procedencia del cliente, tipo de
cliente, tipo de tarjeta que posee, movimientos mensuales que realiza a la tarjeta, actividad

2
a la que se dedica el cliente, etc.
Se trata de una investigacin cuyo propsito es el de caracterizar el comportamiento de una
sola variable, un solo fenmeno: clientes puntuales en los crditos.

Caractersticas. En general, una investigacin descriptiva univariada es aquella en la que:


a) El objetivo del estudio se limita a la descripcin o caracterizacin de un fenmeno o
proceso a travs de una serie de indicadores pertinentes para dicho propsito.
b) No se formulan hiptesis de relacin entre variables. El anlisis puede implicar la
formulacin y contraste de hiptesis estadsticas de bondad de ajuste, que centra el inters
en evaluar la distribucin terica de la variable o indicador en cuestin.
c) Desde la visin de algunos metodlogos este tipo de trabajo no es considerado como una
investigacin; nosotros consideramos que es una tarea con valor cientfico, a un nivel
inicial en la formacin de investigadores.
d) Se lleva a cabo sobre la base a una muestra, y no tiene sentido hablar de variables
dependientes o independientes.

CUIDADO. La expresin univariada, se debe entender como


el estudio de un solo fenmeno, ms adelante aclararemos

*La investigacin descriptiva correlacional.


Es aquella en la que el objetivo es el de buscar la relacin entre dos o ms
fenmenos o procesos. En el rea de la educacin consideremos que estamos interesados en
investigar no slo la desercin, sino que buscamos su relacin o vinculacin con otra(s)
variable(s), tales como las condiciones socioeconmicas, condiciones sociodemogrficas o
las caractersticas psicolgicas de los desertores. El objetivo de la investigacin podra ser
formulado en los siguientes trminos:

Determinar la relacin del fenmeno de la desercin con las condiciones


sociodemogrficas y psicolgicas de los escolares del Centro Educativo 10104

Caractersticas. En este tipo de investigaciones:


a) Se consideran dos o ms variables, en el caso de nuestro ejemplo las variables son la
desercin, las condiciones sociodemogrficas y las condiciones psicolgicas.
b) Se formula hiptesis de relacin entre las variables. Esta relacin slo es de correlacin o
covariacin y no de causa-efecto. La estructura de las hiptesis es, en forma general:
c) Existe una relacin directa (o inversa) entre la variable X y la variable Y
d) En cuanto a la funcin de las variables en la estructura relacional, una(s) variable(s)
puede(n) considerarse Variable(s) dependiente(s) y otra(s) como variable(s)
independiente(s), sin embargo, en la mayora de los casos no es posible o no es correcto
atribuir a las variables la funcin de ser dependientes o independientes, lo correcto es

3
considerarlos como fenmenos concomitantes o variables que varan en forma conjunta, es
decir, hay una covariacin entre ellas.
e) Se realizan las mediciones de las variables a travs de un conjunto de indicadores y
mediante procedimientos estadsticos se detecta la existencia o no de una relacin y, en
caso de existir evidencia, se cuantifica el grado de relacin entre los indicadores.
f) Las relaciones que se detectan no son relaciones de causa - efecto. Luego, no es correcto
tampoco formular conclusiones cuya estructura es: " la variable A influye en la variable B"
o "el fenmeno o factor A es causa del fenmeno o variable B".
g) Este tipo de investigacin tambin se puede realizar sobre la base de una o ms muestras.
(Canavos, 1992)

1.1.2. La Investigacin experimental.


Supngase que un profesor est interesado en investigar los logros en el
aprendizaje de los estudiantes mediante el uso del Nuevo Enfoque Pedaggico (N.E.P.)
frente al enfoque tradicional; Postula la hiptesis de que el nuevo enfoque pedaggico
permite el logro de aprendizajes en mayor grado que el enfoque tradicional. Cuenta con 80
escolares que tienen los mismos antecedentes acadmicos y son similares en muchas
caractersticas tales como edad, nivel educativo, nivel socioeconmico, inteligencia, etc.
Para verificar su hiptesis nuestro docente investigador procede del modo siguiente:

- Forma dos grupos de 40 estudiantes cada uno, asignando al azar a cada elemento en uno de
los grupos. Uno de los grupos constituye el Grupo Control y el otro, el Grupo
Experimental.
- Conduce el proceso de enseanza-aprendizaje de modo que emplea el Nuevo Enfoque
Pedaggico con el Grupo Experimental y el Enfoque Tradicional con el Grupo Control.
- Finalizado el periodo de aplicacin de ambos enfoques, realiza la evaluacin del logro de
los objetivos en ambos grupos y
- Procede a comparar ambos grupos mediante algn test (o prueba) estadstica.

Caractersticas
La experimentacin se utiliza para deducir relaciones causales. El significado cientfico de
la causalidad difiere del significado comn. El cuadro siguiente, reproducido de Malhotra,
aclara lo que debemos entender por causalidad en el campo de la ciencia.

Tabla 1
Significados comn y cientfico de causalidad
Significado comn Significado cientfico

4
-X es la nica causa de Y -X es slo una de las causas posibles de Y
-X siempre debe llevar a Y -La presencia de X provoca que la presencia de Y
(X es una causa que determina Y) sea ms probable (X es una probable causa de
-Es posible probar que X es la causa de Y. Y)
- Es difcil probar que X sea la causa de Y. A lo
ms podemos inferir que X es una causa de Y.
Fuente: Malhotra, 2008

-Se formula hiptesis de relacin causal entre las variables.


-Se puede hablar con propiedad de la variable dependiente (efecto) y de la variable
independiente (causa). En nuestro ejemplo la variable dependiente es el logro de objetivos
y la variable independiente es el enfoque aplicado, es una variable cualitativa con dos
modalidades de variacin: el N.E.P. y el Enfoque Tradicional.
-Se manipula de manera intencional la o las variables independientes.
-Se mide el efecto de la variable independiente sobre la variable dependiente.
-Se controla la validez interna de la situacin experimental, para evitar la influencia de
otras variables extraas.

Niveles de la Investigacin
Cientfica INVESTIGACIN
EXPERIMENTAL

INVESTIGACIN
CORRELACIONAL

INVESTIGACIN
DESCRIPTIVA
UNIVARIANTE

Figura 1: La siguiente figura trata de expresar los niveles para cada uno de los
tipos de investigacin referidos.

1.2 Cuntas y cules son las fases de la Investigacin?


En el proceso de investigacin se pueden identificar varias fases, siendo las dos
grandes fases las siguientes:

1.2.1. Fase de Planeacin


a. Seleccin del tema.
b. Planteamiento del problema

5
- Formulacin del Problema.
- Formulacin de objetivos
- Justificacin e Importancia.
c. Construccin del marco terico
- Teoras
- Antecedentes
- Datos
- Variables
- Hiptesis.
d. Diseo metodolgico
- Tipo de Investigacin
- Seleccin de diseo de la investigacin
- Diseo de la muestra
- Elaboracin de instrumentos de recoleccin de datos
- Diseo de formatos de tabulacin
- Previsin de los anlisis a realizar con los datos.

1.2.2. Fase de Ejecucin.


a. Seleccin de la muestra
b. Obtencin de datos
c. Edicin de datos
d. Codificacin de datos
e. Creacin de una base de datos
f. Anlisis de datos
g. Presentacin de los resultados del anlisis
h. Interpretacin de resultados
i. Formulacin de conclusiones
j. Redaccin y comunicacin del Informe de investigacin.

1.3. En qu fase del proceso de Investigacin interviene la Estadstica?


La Estadstica interviene en las dos fases del proceso de investigacin.

En la fase de Planeacin, la Estadstica interviene en el Diseo Metodolgico,


concretamente, en el diseo de la muestra, la elaboracin de los instrumentos de
recoleccin de datos, diseo de los formatos de los reportes o tablas y la previsin de los
mtodos especiales a emplear en el anlisis de los datos recolectados.
En la fase de Ejecucin, la Estadstica interviene casi en todas las actividades que se
sealan, salvo en la interpretacin de los resultados del anlisis, que es una tarea de
explicacin de los hallazgos de la investigacin a partir del marco terico respectivo.
(Devore, 1998)

1.4 En conclusin. Qu es la Estadstica?

6
Podemos decir que la Estadstica es una Ciencia que proporciona mtodos eficientes
para:
La Estadstica

SELECCIONAR
MUESTRAS

RECOPILAR
ORGANIZAR
PRESENTAR
DATOS
ANALIZAR
EN EL PROCESO DE UNA
INVESTIGACION

Figura 2: el organizador grfico nos presenta de manera


sistematizada el objeto y campo de accin de la Estadstica.

La estadstica constituye una metodologa para realizar investigaciones con un enfoque


cuantitativo. Existe el enfoque cualitativo de la investigacin, que se basa en metodologas
tales como la hermenutica y la etnografa.
Los mtodos que proporciona la estadstica son tan diversos que generalmente se dividen
en dos grandes categoras: estadstica descriptiva y estadstica inferencial.
1.4.1 Estadstica descriptiva:
Es la rama que se encarga de describir, analizar una serie de datos y extraer
conclusiones sobre el comportamiento de estas. Los grficos, tablas, diagramas y clculos
descriptivos nos ayudan a mostrar los datos de manera ms clara y elocuente.
1.4.2 Estadstica inferencial:
Es la rama que implica generalizaciones y afirmaciones con respecto a la
probabilidad de su validez.

Hasta esta parte tenemos una primera visin de la relacin entre la Investigacin
Cientfica y la Estadstica.
1.5 Importancia de la Estadstica
No existe actividad humana en que se deje de usar la Estadstica, las decisiones ms
importantes en nuestra vida se toman con ayuda de esta ciencia. La importancia en el rea
cientfica es porque:
a) Realiza una descripcin ms exacta.
b) Permite resumir los resultados de manera significativa y cmoda.

7
c) Nos permite obtener conclusiones generales y especficas.

1.6 Nomenclatura usada en la Estadstica

1.6.1 Medicin:
La medicin es un proceso de asignacin de nmeros u otros signos a las
caractersticas de los objetos, de acuerdo con ciertas reglas especificadas con anticipacin.

1.6.2 Poblacin:
Se denomina poblacin al conjunto de todas las unidades de observacin o
anlisis (que consiste en personas, animales, objetos, etc.), cuyas caractersticas observables
se van a estudiar. Una poblacin debe definirse en trminos de su contenido, extensin y
tiempo.

Tarea: En el caso del ejemplo de investigacin descriptiva:


Cul es el objetivo?
Respuesta:.......................................................................................................
Cul es el fenmeno de inters a investigar?
Respuesta: El fenmeno de
Dnde tiene lugar el fenmeno?
Respuesta: .........................................
En quienes ocurre el fenmeno?.
Respuesta:.......................................................................................................
La poblacin bajo estudio se debe definir siempre:
Describiendo sus elementos o entidades que la conforman, de modo que se pueda saber con
precisin si un elemento dado pertenece o no a la poblacin.
Delimitndolo en el espacio. Dnde ocurre el fenmeno?
Delimitndolo en el tiempo. Cundo ocurre el fenmeno?

Si la poblacin bajo estudio no es muy grande, en el sentido de la cantidad de sus


elementos, y si se cuenta con los medios econmicos y el tiempo suficientes, la
investigacin se realiza con todos los elementos de la poblacin.

Representacin de poblacin y muestra


1.6.3 Muestra:
Es una parte, un subgrupo de elementos de la poblacin que se selecciona para
participar en el estudio. Cuando la poblacin es muy grande, es decir tiene cientos o miles
de elementos o cuando los medios y el tiempo son limitados, la investigacin se conduce
slo por la muestra.

Figura 3: La figura nos representa la muestra como parte de una poblacin


de estudio.
Fuente: Lpez, 2014

1.6.4 Unidad de Anlisis:


Es cualquier elemento que tenga informacin sobre el fenmeno que se estudia.
As, si estudiamos la altura de los nios de una clase, cada alumno es una unidad de
anlisis; si estudiamos el precio de la vivienda, cada vivienda es una unidad de anlisis.

1.6.5 Dato:
Es el valor o respuesta que adquiere la variable.

1.6.6 Constante:
Es un dato cuyo valor no puede cambiar durante la ejecucin de la investigacin.
Recibe un valor en el momento de la recoleccin y este permanece inalterado durante toda
la investigacin.

1.6.7 Estadgrafo:
Es una medida usada para describir el comportamiento de una variable en la
muestra. Sirven para estimar parmetros o como valores de distribuciones de probabilidad
que permiten hacer inferencia estadstica.

1.6.8 Parmetro:
Son todas aquellas medidas que describen numricamente la caracterstica de una
poblacin. Tambin se les denomina valor verdadero, ya que una caracterstica poblacional
tendr un solo parmetro (media, varianza, etc.). Sin embargo, una poblacin puede tener
varias caractersticas, y, por tanto, varios parmetros.

1.6.9 Variable:
Es una caracterstica que representa a aquello que vara o que est sujeto a algn
tipo de cambio. Se trata de algo que se caracteriza por ser inestable, inconstante y mudable.

9
1.6.10 Indicador:
Son medidas verificables de cambio o resultado diseadas para contar con un
estndar contra el cual evaluar, estimar o demostrar el progreso con respecto a metas
establecidas. (ONU, 2002)

1.7 Clasificacin de variables y escala de medicin


Trataremos la clasificacin de variables por su naturaleza, por su escala y por la
relacin de sus variables

1.7.1 Por su Naturaleza

Clasificacin de las Variables por su Naturaleza

Cualitativas
Por su
Discretas
Naturaleza
Cuantitativas

Continuas
Figura 4: Por su naturaleza, las variables se clasifican en cualitativas y
cuantitativas, y a su vez las cuantitativas en discretas y continuas

1.7.1.1 Variables cualitativas: Son las variables que expresan distintas


cualidades, caractersticas o modalidad. Cada modalidad que se presenta se denomina
atributo o categora. Las variables cualitativas pueden ser dicotmicas cuando slo pueden
tomar dos valores posibles como: s y no, hombre y mujer, etc. o son politmicas cuando
pueden adquirir tres o ms valores.

1.7.1.2 Variables cuantitativas: Son las variables que se expresan mediante


cantidades numricas. Las variables cuantitativas adems pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala de
valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de valores
entre los distintos valores especficos que la variable pueda asumir. Ejemplo: El nmero de
hijos (1, 2, 3, 4, 5).

10
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo
especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m,
1,65 m, 1,66 m,...), o el salario. Solamente se est limitado por la precisin del aparato
medidor, en teora permiten que exista un valor entre dos variables.

1.7.2 Por su Escala

Clasificacin de las Variables por su Escala

Nominal
Cualitativas
Ordinal
Por su
Escala
Intervalo
Cuantitativas
Razn

Figura 5: Por su escala, las variables cualitativas pueden ser nominales u


ordinales, y las cuantitativas ene escala de intervalo y razn.

1.7.2.1 Variable cualitativa de escala Nominal: Presenta modalidades no


numricas que no admiten un criterio de orden, por ejemplo: sexo, estado civil, profesin,
color de cabello, etc.

1.7.2.2 Variable cualitativa de escala Ordinal: Presenta modalidades no


numricas que admiten un criterio de orden, por ejemplo: nivel de instruccin, ciclo
acadmico, cargo administrativo, etc.

1.7.2.3 Variable cuantitativa de escala Intervalo: Son variables numricas


cuyos valores representan magnitudes y la distancia entre los nmeros de su escala es igual.
Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad,
establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de
la escala. Las variables de intervalo carecen de un cero absoluto, por lo que operaciones
como la multiplicacin y la divisin no son realizables. Un ejemplo de este tipo de
variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es
la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una
temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.

1.7.2.4 Variable cuantitativa de escala Razn: Las variables de razn poseen

11
las mismas caractersticas de las variables de intervalo, con la diferencia que cuentan con
un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo
que se puede realizar cualquier operacin Aritmtica (Suma, Resta, Multiplicacin y
Divisin) y Lgica (Comparacin y ordenamiento). Este tipo de variables permiten el nivel
ms alto de medicin. Las variables altura, peso, distancia o el salario, son algunos
ejemplos de este tipo de escala de medida.

1.7.3 Por la relacin de sus variables

Clasificacin de las Variables por la Investigacin.

Dependiente
Por su
Investigacin
Independiente

Figura 6: Las variables por su investigacin pueden clasificarse


en dependientes e independientes.

1.7.3.1 Variables Dependientes: Es aquella que dentro de una hiptesis


representa la consecuencia, el efecto, el fenmeno que se estudia. Se simboliza con la letra
Y. Ejemplo: entre las variables rendimiento acadmico y aplicacin de mtodos, la variable
dependiente es rendimiento acadmico.

1.7.3.2 Variables Independientes: Es aquella que influye en la variable


dependiente y no depende de otra variable, dentro de una hiptesis. Se simboliza con la
letra X. Ejemplo: entre las variables hiperactividad y falta de autoestima, la variable
autoestima es independiente, ya que explica o influye en la hiperactividad del nio. (Miller,
1992)

PROBLEMAS PROPUESTOS

1. Clasifique adecuadamente las diversas variables


VARIABLES TIPO ESCALA
Nmero de artculos elctricos vendidos
Actitud de los pacientes durante su internado

12
El peso de la carga de los camiones
La longitud de 1000 tornillos con arandela y tuerca
El grado acadmico de un docente
Marca de computadoras utilizadas
Cantidad de dinero gastado en libros
Volumen de agua de un reservorio
Los tipos de fallas de una maquinaria
Nmero de inasistencias en un mes
Nivel socioeconmico de los habitantes de Chiclayo
Gravedad de un infarto
Nmero de ataques de asma semanales

2. Para cada ejercicio, identificar: poblacin, unidad de anlisis, muestra, variable y tipo de
variable:
2.1 En la empresa Agroindustrial Tumn S.A. trabajan 2500 personas. La empresa est
estudiando conceder un aumento de sueldo y encarga hacer un estudio de factibilidad para
analizar si es posible realizar el aumento. La comisin de funcionarios encargada de este
estudio toma una muestra de 180 trabajadores informando que ganan en promedio
mensualmente 1060 soles, la cual la comparan con los sueldos mensuales de otras
empresas. S usted fuera el auditor de este estudio de factibilidad, identifique lo siguiente:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:
2.2 El Gerente de Procter & Gamble, quiere saber cul es la marca de detergente que ms
prefieren las amas de casa de la ciudad de Chiclayo. Para llevar a cabo este estudio se
seleccion una muestra de 504 amas de casa de los alrededores del centro histrico de la
ciudad de Chiclayo. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:

2.3 La empresa Telefnica, desea disear nuevos planes de una tarifa en el servicio de telefona
mvil en la ciudad de Lima. Se elige 50 usuarios de telefona mvil y se observa sus gastos
en trfico telefnico. Identifique:

Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:

13
Tipo de variable:

2.4 Se est haciendo un estudio de la calidad de la produccin de lingotes o barras de acero


producidos por la empresa Sider Per de Chimbote. Se evalan los pesos y dimetros de
una muestra de 50 lingotes de acero. Dicha muestra fue obtenida de la produccin diaria en
forma aleatoria y las unidades de medida estn dadas en kg. y cm. Identificar:

Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:

2.5 La Oficina de Servicios Generales de la USS desea conocer los medios en los cuales con
mayor frecuencia se transportan los alumnos de la USS. Para ello realiza una encuesta a 50
alumnos de pregrado en el semestre 2012-II y encuentra que el 70% de los encuestados usa
el transporte pblico y el 20% usa el transporte de la universidad. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:

2.6 En una farmacia de Chiclayo, se est recogiendo informacin sobre el grado de satisfaccin
de los clientes respecto a su servicio nocturno, para ello se toma una muestra de 70 clientes
y concretamente se les pregunta en cuanto a la relacin calidad-precio de los medicamentos
en este servicio nocturno. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:

2.7 Un mdico de cabecera trabaja en un rea rural del distrito de Ferreafe que cuenta con
4500 habitantes, y est interesado en conocer cuando se producen un mayor nmero de
demanda de asistencia a domicilio, para reforzar el horario que ms lo necesita. Para ello
realiza una encuesta a 200 habitantes y ha recogido datos sobre las ltimas demandas que
ha tenido y las ha catalogado como visitas de maana, tarde, noche o festivo dependiendo
de la hora y en el da en que se han producido. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:

14
Tipo de variable:

2.8 El ministerio de agricultura est ofreciendo cursos a distancia y presenciales de


capacitacin a los integrantes de cooperativas agroindustriales debidamente formadas. La
cantidad de estas cooperativas en el pas son de 6750 y la cantidad de integrantes que la
conforman es igual a 68056. El ministerio quiere conocer mejor a su pblico objetivo, para
lo cual ha tomado una muestra de 210 cooperativas, a las cuales se les ha preguntado por:
tipo de orientacin de la cooperativa, nmero de personas participantes, qu cursos de
capacitacin ya han recibido?, y el ingreso en nuevos soles que manejan al mes.
Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:

2.9 El Director del diario la Industria quiere saber cul es el diario que ms prefieren los
lectores de la ciudad de Chiclayo. Para llevar a cabo este estudio se seleccion una muestra
de 684 lectores de dicha ciudad. Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:

2.10 La Facultad de Ciencias de la Comunicacin de una Universidad Pblica cuenta


con 5000 estudiantes y est realizando un estudio sobre el impacto de las redes sociales y el
internet en la formacin de los jvenes de la especialidad de Comunicacin Social. Para
ello se encuesta a chicos y chicas de primer y segundo semestre de dicha especialidad, si se
aplicaron 200 encuestas lo que proveer resultados del por qu las nuevas tecnologas se
han vuelto tan necesarias en estos das? Identifique:
Poblacin:
Unidad de anlisis:
Muestra:
Variable de Estudio:
Tipo de variable:

15
CAPTULO II

Mtodo de recoleccin de datos

2.1 Conceptos generales en la investigacin


Para comprender las tcnicas e instrumentos que se utilizan en la recoleccin y el
anlisis de informacin, es necesario definir conceptos bsicos que se utilizan, como los
siguientes.

Investigacin

Se define como una serie de mtodos para resolver problemas cuyas soluciones necesitan
obtenerse por medio de una serie de operaciones lgicas, tomando como punto de partida
datos objetivos. (Real Academia Espaola)

Mtodo

La palabra mtodo proviene del griego methodos, trmino compuesto por meta, que
significa con, y odos, que significa va. De acuerdo con la Real Academia Espaola,

16
mtodo es el procedimiento que se sigue en las ciencias para hallar la verdad y ensearla.
Es una forma razonada de utilizar tcnicas y procedimientos para realizar alguna actividad
en cierto orden siguiendo los principios ordenados de la ciencia.

Tcnica

Tcnica es un procedimiento o conjunto de procedimientos, reglas, normas o protocolos,


que tienen como objetivo obtener un resultado determinado, ya sea en el campo de la
ciencia, de la tecnologa, del arte, de la educacin o en cualquier otra actividad. (Real
Academia Espaola)

Instrumentos

Son las herramientas, las maquinarias y los equipos que sirven como apoyo para realizar
una investigacin; su utilizacin permite alcanzar los resultados esperados.

Recopilacin

Es un compendio, resumen o reduccin breve de una obra, un discurso o de cierto material


informativo. Al realizar una recopilacin de datos, stos provienen de observaciones reales
o de documentos que se usan de manera cotidiana. La recopilacin de informacin puede
obtenerse a partir de: a) bancos de datos, b) entrevistas o cuestionarios, c) observacin
directa o mediciones experimentales. (Hernndez, 2001)

2.2 Investigacin de campo


Los instrumentos de recopilacin de informacin para una investigacin de campo
son aquellos que se aplican directamente en el ambiente en donde se presenta el fenmeno
en estudio. Para ello se requiere de la elaboracin de un plan de trabajo, del diseo de los
instrumentos, del levantamiento de informacin en el campo donde se presenta el fenmeno
y de la concentracin y el anlisis de los resultados.

A continuacin analizaremos las tcnicas de recopilacin de informacin que permiten


efectuar el levantamiento de datos.

2.2.1 Cuestionarios
El cuestionario es un documento formal y estructurado mediante el cual se
recopila informacin, datos y opiniones a travs de preguntas especficas que se aplican
dentro de un universo o una muestra de individuos, con la finalidad de interpretar
posteriormente esa informacin. (Muoz, 2011)
En esencia, los cuestionarios utilizan dos tipos de preguntas: abiertas y cerradas.

Preguntas abiertas. Son aquellas en las que el encuestado es libre de emitir un juicio o una
opinin de acuerdo con su criterio acerca de lo que se le interroga; de esta forma, no existe

17
ninguna limitacin para la expresin de las ideas y opiniones, ni en profundidad ni en
temticas.

Preguntas cerradas. Son las interrogantes donde el encuestado tiene la oportunidad de


elegir, entre las opciones presentadas, aquella respuesta que est de acuerdo con su opinin.
Existen varias modalidades de respuestas cerradas; entre las ms comunes tenemos las
siguientes:

a) Preguntas dicotmicas, las cuales slo permiten dos posibles respuestas, por lo general
opuestas entre s, por ejemplo: ( ) S ( ) No; Masculino ( ) Femenino ( )
b) Preguntas tricotmicas. Son aquellas en que las opciones de respuestas son tres
posibilidades, por ejemplo: S ( ) No ( ) No sabe ( )
c) Preguntas de alternativas mltiples. Tambin conocidas como preguntas peine o tems, nos
presentan varias alternativas entre las que el encuestado elige alguna; por lo general, estas
opciones incluyen una gama de respuestas que varan de un extremo a otro, por ejemplo:
Elija la respuesta marcando con una x

( ) Soltero ( ) Divorciado ( ) Viudo ( ) Unin libre ( ) Casado


O bien, Cmo calificara el servicio?
Excelente ( ) Bueno ( ) Regular ( ) Malo ( ) Psimo ( )

Preguntas de gradacin de Likert. En estas respuestas se indican en forma gradual las


opiniones, intereses o actitudes de cada respuesta:
Totalmente de acuerdo ( ) De acuerdo ( ) Neutral ( )
En desacuerdo ( ) Totalmente en desacuerdo ( )

Asimismo, el diseo de un cuestionario contiene

1. Datos de identificacin
Contiene:
- Datos sobre el nombre, direccin, nmero de telfono del encuestado.
- La fecha, hora de entrevista.
- Nombre y cdigo del encuestador
2. Solicitud de cooperacin
Redactada para obtener la colaboracin de los encuestados. Contiene:
- Identificacin de la institucin que realiza el estudio y/o del encuestador.
- Explicacin del objetivo de la encuesta.
- El tiempo que ser preciso emplear para el llenado del cuestionario
3. Instrucciones
Son las instrucciones referidas a la forma de utilizar el cuestionario.

18
- Si el cuestionario se administra mediante entrevistadores, sean personales o por
telfono, las instrucciones son para el entrevistador y se encuentran en una hoja
separada, Hoja de instrucciones del entrevistador.
- Si el cuestionario es auto administrado o por correo, las instrucciones se encuentran
en el mismo cuestionario.
4. Informacin solicitada
Es la parte ms importante y extensa del cuestionario, est integrada por el conjunto de
preguntas a la obtencin de informacin relevante para los propsitos de la investigacin.
5. Datos de clasificacin.
Contiene datos generales para clasificar los encuestados, como el nivel socioeconmico,
tipo de vivienda, tipo de hogar, etc. a veces suele ponerse tambin en la primera parte del
cuestionario.
Si el cuestionario se administra mediante entrevista personal, son registrados por el
entrevistador, con base a la observacin.
Si el cuestionario es auto administrado, por correo o entrevista telefnica, los datos
los proporciona el encuestado.

Aplicacin de la prueba piloto. Despus de haberse elaborado el borrador de los


cuestionarios, el siguiente paso es que el investigador pruebe el cuestionario antes de
aplicarlo de manera definitiva. Para ello se emplea una recopilacin inicial de informacin
en forma experimental, es decir, se aplica el cuestionario a cierto nmero de personas que
respondern las preguntas; as, se observa la manera como estn contestando el cuestionario
y se evala si ste cumple con los objetivos planteados. El resultado que se obtiene de esta
prueba piloto sirve para corregir, modificar o ratificar la forma como estn planteadas las
preguntas.

2.2.2 Entrevistas
Entrevista es la recopilacin de informacin en forma directa, cara a cara, donde
el entrevistador interroga y obtiene informacin directamente del entrevistado, siguiendo
una serie de preguntas preconcebidas y adaptndose a las circunstancias que las respuestas
del entrevistado le presenten.

2.2.3 Encuestas
Otra de las tcnicas ms utilizadas en el desarrollo de una investigacin,
principalmente en las ciencias sociales, es el levantamiento de informacin mediante
encuestas, ya sea de opinin, de comportamiento, de actuacin o de cualquier otro factor
digno de evaluar. La encuesta se realiza con la ayuda de un cuestionario, cuya funcin es la
medicin y pueden aplicarse de manera personal, telefnica o por correo.

2.2.4 Observacin

19
Una de las tcnicas ms importantes que se utiliza en cualquiera de los mtodos
de investigacin cientfica es la observacin, la cual se puede definir como el examen
detenido de los diferentes aspectos de un fenmeno, con la finalidad de estudiar sus
caractersticas, rasgos y comportamiento dentro del ambiente donde se desarrolla el propio
fenmeno.
La observacin es el registro, en forma sistemtica, de patrones conductuales de personas,
objetos y sucesos a fin de obtener informacin sobre el fenmeno de inters.

Toda vez que decida emplear el mtodo de la observacin, para que sta sea sistemtica,
ser necesario que previamente resuelva los siguientes tres problemas:

Qu se va a observar?
Cmo se va a observar?
Cundo se va a observar?
Supongamos que su objetivo es el estudio de la atencin de los alumnos del primer ao de
secundaria en las clases de matemticas, empleando dos practicantes de la especialidad de
matemticas como observadores para que lleven a cabo el registro de la atencin en el aula
durante el perodo que va del mes de mayo a fines de julio.

No se trata de la observacin del tamao, ni de la edad de los alumnos, ni mucho menos del
color de los ojos de la profesora o de los practicantes, sino, se trata de la observacin de la
actividad psicofisiolgica de los alumnos, llamada atencin. En esta situacin concreta se
encuentran presentes las soluciones de los tres problemas:

Qu se va a observar?. Respuesta: La atencin.


Cmo se va a observar?. Respuesta: Mediante dos observadores, de modo que cada uno
registra una vez a cada alumno.
Cundo se va a observar?. Respuesta: En todas las clases de matemticas, desde mayo
hasta julio.
2.2.5 Experimentacin
Otra de las herramientas ms utilizadas en el mtodo cientfico de investigacin
es la experimentacin, un mtodo comn de las ciencias y la tecnologa, que consiste en el
estudio de un fenmeno, reproducido generalmente en un laboratorio, en las condiciones
particulares de estudio que interesan, eliminando o introduciendo aquellas variables que
puedan influir en l. Se entiende por variable todo aquello que pueda causar cambios en los
resultados de un experimento, existen variables independientes y dependientes. La
variable independiente es todo evento que se incorpora al experimento para ver cmo
influye en la variable dependiente.

2.3 Investigacin documental


La investigacin de tipo documental es aquella que se respalda en la recopilacin de
informacin a travs de escritos formales, libros, revistas, manuscritos, cuadros, figuras,

20
registros audibles en grabaciones fonogrficas o magnticas, y pginas de Internet. Esto
permite al investigador fundamentar y complementar su investigacin con lo aportado por
diferentes autores.

2.4 Validez y confiabilidad de los instrumentos


2.4.1. Validez de un Instrumento: se refiere al grado en que un instrumento de
medicin realmente mide la variable que pretende medir. Por ejemplo: que un instrumento
de inteligencia mida inteligencia y no ausencia de memoria.

Pasos para crear y validar un Instrumento de Medicin

Listar las variables que se van a medir u observar.


a) Revisar la definicin conceptual de las variables.
b) Establecer la definicin operacional.
c) Elegir un instrumento ya desarrollado que se adaptar para el estudio o crear un nuevo
instrumento, tomando en cuenta las dimensiones a medir y los indicadores especficos que
se utilizarn para cada una.
d) Indicar el nivel de medicin de cada tem o variable.
e) Establecer la forma en que se codificarn (darles un nmero que represente) las variables o
tems.
f) Aplicar una prueba piloto del instrumento.
g) Modificar el instrumento, a partir de los resultados de la prueba piloto.

2.4.2. Confiabilidad del Instrumento: Se refiere al grado en que su aplicacin


repetida al mismo sujeto u objeto produce resultados similares o consistentes con
mediciones previas.

Existen diversos mtodos para evaluar la confiabilidad de un instrumento, tales como:


a) Medida de Estabilidad: (confiabilidad test - retest). Un mismo instrumento es administrado
a un mismo grupo de personas despus de un perodo de tiempo. Se mide la confiabilidad a
travs de la correlacin entre ambos puntajes.

b) Mtodo de Formas paralelas o alternativas. Se Administran dos formas equivalentes, por


tanto no es el mismo instrumento. Las formas son equivalentes en contenidos, preguntas,
instrucciones, duracin, etc. Las formas se administran a un mismo grupo dentro de un
perodo de tiempo corto. Se mide la confiabilidad a travs de la correlacin entre ambos
puntajes.

c) Mtodo de las Mitades partidas (split - halves). Requiere una sola medicin en un mismo
grupo de sujetos. Se divide la prueba en dos mitades y se comparan los resultados en
correlaciones.

21
d) Coeficiente de Cronbach. Este coeficiente requiere una sola medicin y mide la
consistencia interna de los tems en cada escala y el instrumento como conjunto. Es decir
entrega un valor estadstico que nos indica en qu medida un conjunto de tems apuntan en
la misma direccin. (Ross,2000)

2.5 Organizacin y presentacin de datos


Despus de la recopilacin de los datos, es necesario resumirlos y presentarlos en
forma tal. Que faciliten su comprensin y su posterior anlisis y utilizacin. Para ello, se
ordenan en cuadros numricos y luego se representan en grficos.

Tabla de Frecuencias
Es el agrupamiento de datos en categoras que muestran el nmero de observaciones en
cada categora mutuamente excluyente.

Partes de una tabla:

Tabla..., Que (variable), A quien, Donde, Cuando


Variable

Indicador
Conteo o

Indicador Porcentaje

Total

2.5.1 Tablas para Variables Cualitativas


Fuente: de dnde se obtuvieron los datos?

Frecuencia absoluta simple

Frecuencia relativa porcentual

Variable fi hi%

Indicador

Indicador

Total

22
Nomenclatura usada en la tabla:
Frecuencia absoluta simple (f i) Es el nmero de veces que se repiten los valores dentro
de las diferentes categoras en que est dividida la informacin.
Frecuencia relativa porcentual (hi%) Es el valor que resulta al dividir cada una de las
frecuencias absolutas simples entre el nmero total de datos.
fi
hi % * 100
n

Ejemplo: La oficina de recursos humanos de la empresa constructora LAS TORRES S.A.


de la ciudad de Chiclayo, contrat a 20 obreros para construir un edificio en el cercado de
la ciudad, en sus fichas de inscripcin de cada obrero se registr su estado civil.

X1 = Soltero X8 = Divorciado X15 = Soltero


X2 = Casado X9 = Casado X16 = Casado
X3 = Viudo X10 = Casado X17 = Casado
X4 = Soltero X11 = Casado X18 = Soltero
X5= Divorciado X12 = Soltero X19 = Divorciado
X6 = Viudo X13= Divorciado X20 = Casado
X7 = Soltero X14 = Viudo
Con esta informacin construir una tabla de distribucin de frecuencia para la variable
Estado Civil.
Clases o categoras:
C1 = Soltero C2 = Casado
C3 = Divorciado C4 = Viudo

Tabulacin:
Tabla 1
Estado civil de 20 obreros de la empresa constructora Las Torres S.A.,
Chiclayo-diciembre 2013.
Estado Civil (x) fi hi %
Soltero 6 30
Casado 7 35
Divorciado 4 20
Viudo 3 15 23
TOTAL 20 100
Fuente: Fichas de inscripcin oficina recursos humanos.Diciembre-2013

Interpretacin:
El 30 % de obreros tienen el estado civil de solteros (6), el 35 % son casados (7), el 20 %
divorciados (4), y el 15 % son viudos (3).

2.5.2 Tablas de Variables Cuantitativas Discretas

Frecuencia absoluta simple

Frecuencia relativa porcentual

Variable fi Fi hi% Hi%

Indicador

Indicador

Total
Frecuencia relativa acumulada porcentual

Nomenclatura usada en la tabla: Frecuencia absoluta acumulada

Frecuencia absoluta acumulada (Fi) Se obtiene sumando y acumulando los valores de las
frecuencias absolutas intervalo por intervalo en orden ascendente.
F 1 = f1
F 2 = f1 + f 2
F 3 = f1 + f 2 + f3
Fi = f1 + f2 + f3 + + fi
Frecuencia relativa acumulada porcentual (Hi%) Se obtiene sumando y acumulando los
valores relativos simples intervalo por intervalo en orden ascendente.
H1 = h1
H2 = h1 + h2
H3 = h1 + h2 + h3

24
Hi = h1 + h2 + h3 + + hi
Ejemplo: Se realiza un estudio para determinar el nmero de trabajadores que emplea las
pequeas empresas del departamento de Lambayeque, para lo cual se toma una muestra de
20 pequeas empresas determinndose los siguientes datos
X1 = 6 X6 = 3 X11 = 4 X16 = 3
X2 = 5 X7 = 4 X12 = 5 X17 = 4
X3 =4 X8 =4 X13 =6 X18 = 6
X4 =4 X9 =5 X14 = 2 X19 =5
X5 =5
X10 = 5 X15 = 4 X20 =3

Clasificacin:
En este caso se identifican los distintos valores que tiene X i, primero ubicamos el valor
menor y mayor: Xmin = 2 y Mx. = 6. Los distintos valores que toma la variable X i los
vamos a denotar por fi resultando:
X1 = 2; X2 = 3; X3 = 4; X4 = 5; X5 = 6
Tabulacin:
Tabla 2
Nmero de trabajadores de una muestra de 20 pequeas empresas.
Departamento Lambayeque, 2012
N de Trabajadores fi Fi hi% Hi%
2 1 1 5 5
3 3 4 15 20
4 7 11 35 55
5 6 17 30 85
6 3 20 15 100
TOTAL 20 100

Fuente: Cmara de Comercio, Lambayeque-2012


Interpretacin:
El 35 % de las pequeas empresas de Lambayeque
Frecuenciatienen 4 trabajadores,
absoluta simple el 30% tienen 5
trabajadores. Por otra parte, el 55% de las pequeas empresas, poseen como mximo 4
trabajadores. Frecuencia absoluta acumulada

2.3.3 Tablas para Variables Cuantitativa Continua

Frecuencia relativa porcentual


Marca de Clase 25

Frecuencia relativa acumulada porcentual


Variable Yi fi Fi hi% Hi%

Indicador

Indicador

Total

Nomenclatura usada en la tabla:


Marca de clase (xi) La marca de clase es el punto medio de un intervalo.
l i 1 l i
Yi
2

Cuando la variable en estudio es continua, para elaborar una tabla de distribucin de


frecuencias deben seguir los siguientes pasos:

1 Elegir el Rango (R)


Se define como la diferencia entre el valor mximo y el valor mnimo.
R = X mx - Xmn

2 Elegir el nmero de Intervalos (I)


El nmero de intervalos puede fijarse arbitrariamente dependiendo del nmero de datos que
se tenga. Por lo general el nmero de intervalos a elegir, vara entre 5 a 20.
Sin embargo existen algunas frmulas que permiten determinar el nmero de intervalos.
K 1 3.322 * log n K 2 .5 * 4 n
, n 10
Dnde: K = Nmero de Intervalos
n = Nmero de datos.

3 Elegir la Amplitud (A)

26
Se define como el cociente que se tiene al dividir el Rango (R) entre el nmero de
intervalos (K).
R
A
K

Si la amplitud del intervalo resultara un valor no entero se procede a redondear al entero


inmediato superior si los datos son enteros.
Si los datos proporcionados estn en decimal, se redondea de acuerdo al nmero de
decimales de la informacin.

4 Construir los intervalos (I)


Comenzar teniendo como referencia el valor menor de los datos y la amplitud.
Ejemplo: Los siguientes datos representan las edades de 50 pacientes atendidos en los
servicios de emergencias del Hospital Regional Docente Las Mercedes, ciudad de Chiclayo
mes de abril de 2013.

63 68 36 49 56 64 59 35 78 43
36 43 53 70 57 62 43 68 62 27
89 64 72 52 51 62 60 71 61 55
26 59 60 67 57 67 61 67 51 81
60 53 64 76 44 73 56 62 63 60

Construir una tabla de distribucin de frecuencias.

i. Nmero de Intervalos
K 1 3.322 * log 50
= 6.64=7
I 2.5 * 4 50
I 7

ii. Hallar el Rango


R X max X min

R = 89 26 = 63

iii. Amplitud del Intervalo

27
R 63
A
I 7
A9

Tabla 3
Edad de 50 pacientes atendidos por servicios de emergencias Hospital
Docente las Mercedes Chiclayo. Abril, 2013
[Li-1, Li> Yi fi Fi hi % Hi %
26 - 35 30,5 2 2 4 4
35 - 44 39,5 6 8 12 16
44 - 53 48,5 5 13 10 26
53 - 62 57.5 15 28 30 56
62 71 66.5 14 42 28 84
71 80 75.5 5 47 10 94
80 89 84.5 3 50 6 100
TOTAL 50 100

Fuente: Registros Hospital Docente las Mercedes. Chiclayo, Abril-2013

Interpretacin:
f3: 5 pacientes atendidos por servicios de emergencias del Hospital Regional Docente de las
Mercedes de Chiclayo tienen una edad comprendida entre 44 y 53 aos.

h4 % :El 30 % de pacientes atendidos por servicios de emergencias del Hospital Regional


Docente de las Mercedes de Chiclayo tienen una edad comprendida entre 53 y 62 aos.

H5 % :El 84 % de pacientes atendidos por servicios de emergencias en el Hospital Regional


Docente de las Mercedes de Chiclayo tienen una edad menor de 71 aos pero mayor a 26
aos.

28
2.6 Representaciones grficas
Los grficos ms usuales para representar variables de tipo cualitativa son los
siguientes:
2.6.1. Diagramas de barras:
Se utiliza generalmente para representar variables cualitativas, representan en el
eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las
frecuencias relativas.

Tabla 4
Grado de instruccin de pacientes atendidos de Tuberculosis pulmonar,
Hospital Almanzor Aguinaga Asenjo - Chiclayo, Mayo - 2013
Grado de Instruccin fi %
Analfabeto 36 45
Primaria 24 30
Secundaria 16 20
Superior 04 05
TOTAL 80 100

Fuente: Registros Hospital Docente las Mercedes.Chiclayo,Mayo-2013

Grado de instruccin de pacientes atendidos de Tuberculosis pulmonar -


Hospital Almanzor Aguinaga Asenjo - Chiclayo, Mayo 2013
N
36

C A =Analfabetos P= Primaria S=Secundaria SP=Superior

N
0
T

E 3
Figura 1: 2Se puede observar que el 45% de los pacientes atendidos son
analfabetos, mientras que el 5% de ellos tienen un grado de instruccin
superior.
2
8

29
2
4
A P S
SP

Fuente: Registros Hospital Docente las Mercedes.Chiclayo,Mayo-2013


2.6.2 Grfico de sector (torta)
Es un grfico circular distribuido en sectores. Se usa para representar las
componentes de un total en variables cualitativas.

GRADO DE INSTRUCCIN

Ejemplo:
Teniendo en cuenta la informacin de la tabla 4, construir un grfico de sector.

30
Pacientes atendidos de tuberculosis pulmonar segn grado de instruccin Hospital
Almanzor Aguinaga Asenjo de Chiclayo Mayo, 2013

Superior ; 5%
Primaria; 30% Secundaria; 20%

Analfabeto ; 45%

Figura 2: Se puede observar que el 45% de los pacientes atendidos son analfabetos,
mientras que el 5% de ellos tienen un grado de instruccin superior.

Fuente: Registros Hospital Docente las Mercedes.Chiclayo,Mayo-2013


Para variables de tipo cuantitativa discreta tenemos el siguiente grfico:

2.6.3 Diagrama de Bastones


Las barras deben ser estrechas para representar los valores que toma la variable discreta.

31
Ejemplo
Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el nmero de caras, X,
obtenindose los siguientes resultados:

Representar grficamente el resultado.


En primer lugar observamos que la variable X es cuantitativa discreta.

Tabla 5
Nmero de veces que aparece una cara
al lanzar 3 monedas al aire

Lanzamiento de tres monedas al aire en ocho ocasiones

Figura 3: la figura nos muestra el nmero de veces que aparece una


cara al lanzar tres monedas aire.

2.6.4. Histograma
Un histograma se construye a partir de la tabla estadstica, representando sobre
cada intervalo, un rectngulo que tiene a este segmento como base. El criterio para calcular
la altura de cada rectngulo es el de mantener la proporcionalidad entre las frecuencias
absolutas (o relativas) de cada intervalo y el rea de los mismos.

Graficar la informacin de la tabla 3

32
Edad de 50 pacientes atendidos por servicios de emergencias. Hospital Docente
16
Las Mercedes Chiclayo. Abril, 2013
14

12

10

N DE PACIENTES 8

0
26 35 35 44 44 53 53 62 62 71 71 80 80 - 89
EDAD

Figura 4: Se puede observar la distribucin de los intervalos de edades, en donde es ms


evidente que el mayor porcentaje se ubica entre los 53-62 aos de los pacientes, y la menor entre
los 26-35 aos.

Fuente: Registros Hospital Docente las Mercedes.Chiclayo,Mayo-2013

2.6.5. Polgono de frecuencias


Es una lnea poligonal cerrada que une los puntos medios de los techos de los
rectngulos el histograma, se usa para comparar dos o ms distribuciones de variables
cuantitativas. El polgono de frecuencias se construye fcilmente si tenemos
representado previamente el histograma, ya que consiste en unir mediante lneas rectas los
puntos del histograma que corresponden a las marcas de clase.

33
% Masculino Femenino

Graficar la informacin de la tabla 3

Edad de 50 pacientes atendidos por servicios de emergencias.


Hospital Docente Las Mercedes Chiclayo. Abril, 2013
18
16
14
12
10
N DE PACIENTES 8
6
4
2
0
21.5 30.5 39.5 48.5 57.5 66.5 75.5 84.5 93.5
EDAD

Figura 5: el pico ms alto nos da referencia a que existen 15 pacientes atendidos con una
edad promedio de aproximadamente 58 aos.

34
Fuente: Registros Hospital Docente las Mercedes.Chiclayo,Mayo-2013

PROBLEMAS PROPUESTOS

1. Un conjunto de datos consta de 95 observaciones o datos. Cuntos intervalos


recomendara para construir la tabla de distribucin de frecuencias?
Rpta:____________________

2. Un conjunto de datos est integrado por 75 observaciones que van desde el 1.2 hasta
39.2 dlares (1 decimal). Cul es la amplitud que recomendara usted para la construccin
de una tabla de distribucin de frecuencias?
Rpta:____________________

3. Instruccin: Teniendo en cuenta la siguiente tabla de distribucin, compltela en forma


correcta utilizando las propiedades y definiciones dadas en clase:

Inversin Yi fi Fi hi Hi
20 - 30
30 - 40
40 - 50
50 - 60 5 96
60 - 70
Total 50
Adems se sabe que h2 = h4 y h1 = h5

4. Al investigar el nivel socioeconmico en las modalidades: bajo (B), medio (M), alto (A)
de 50 familias se obtuvo los siguientes datos:

M B B M A M B M B M
B B B M M A B B A M

35
A B B B M B M A M B
M M M B M M B A M M
A M M M M B B M A M
a. Indicar la variable en estudio.
b. Indicar el tipo de variable.
c. Elaborar la tabla de distribucin frecuencias.
d. Interpretar la tabla.

5. Un investigador desea determinar cmo varan los pesos en kilogramos de las obreras
de una empresa y toma una muestra de 50 mujeres para registrar luego dichos pesos. Los
datos obtenidos fueron los siguientes:

65 63 65 63 69 67 53 58 60 61
64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62
63 65 63 70 67 66 57 59 61 62
64 64 63 69 67 66 58 60 61 62
Construir la tabla de distribucin de frecuencias en forma completa (Incluyendo el nmero,
ttulo, conceptos, cuerpo o contenido, nota o notas de pie, fuente y elaboracin), usando la
Regla de Sturges para determinar el nmero de intervalos.

Interpretar:
h4%:...
H4%:..
F3:.....
f2:

6. Cervecera RICA CHELA


La Cervecera RICA CHELA acaba de lanzar al mercado una nueva cerveza. Despus del
lanzamiento, las ventas no han tenido el impacto esperado en las regiones (no incluye
Lima), por lo que han realizado un estudio de mercado, en el cual se han incluido las
principales ciudades: Trujillo, Chiclayo, Piura e Iquitos. El objetivo de la investigacin de
mercado es el tratar de determinar segmentos de mercado a los cuales puedan enfocarse e
idear una estrategia de comercializacin que eleven los niveles de consumo y venta. El
estudio de campo consider una muestra de 40 personas que respondieron en las cinco
ciudades. Los datos y las variables recolectadas se detallan a continuacin:

X1.Sexo
X2.Edad (en aos)
X3.Categora ocupacional (estudiante, obrero, empleado, profesional).
X4.Nivel de educacin (aos de escolaridad terminados).
X5.Estado civil (casado, no casado).
X6.Ingreso mensual.
X7.Si el encuestado bebe cerveza por lo menos una vez al mes (s, no).
X8.Ciudad.

Realizar lo siguiente:

36
a. Una tabla de frecuencias para la variable ingreso considerando la totalidad de los
datos.
b. Calcule e interprete a partir de la tabla construida: H2%, f3, h4%, F2, y3.
c. Considerando solamente los datos de la ciudad de Chiclayo construya una tabla que
distribuya a las personas tomadas como muestra de acuerdo a su estado civil. Asimismo,
utilice la grfica adecuada para presentar la informacin.
d. Considerando solo a las personas de Iquitos, presente una tabla que las distribuya de
acuerdo a su edad. Igualmente grafique sus resultados

Base de datos:

X4:Aos de
N X1:Sexo X2.Edad X3:Cat_ocu X5: E_C X6:Ingreso X7:Bebe X8:Ciudad
escolaridad

1 Masculino 34 Obrero 6 Casado 1200 Si Trujillo


2 Femenino 40 Ama de casa 10 No casado 3100 No Trujillo
3 Masculino 40 Empleado 17 No casado 3700 Si Trujillo
4 Femenino 33 Estudiante 6 No casado 2800 No Trujillo
5 Masculino 22 Estudiante 9 No casado 1100 Si Trujillo
6 Masculino 31 Empleado 11 No casado 800 Si Trujillo
7 Femenino 36 Ama de casa 9 No casado 1600 Si Trujillo
8 Masculino 36 Obrero 12 No casado 700 Si Trujillo
9 Femenino 38 Empleado 15 No casado 600 Si Trujillo
10 Masculino 35 Obrero 8 No casado 1200 No Trujillo
11 Masculino 30 Estudiante 14 No casado 700 Si Chiclayo
12 Femenino 31 Ama de casa 5 Casado 1200 No Chiclayo
13 Masculino 35 Obrero 6 Casado 1200 Si Chiclayo
14 Masculino 37 Obrero 17 Casado 1300 Si Chiclayo
15 Femenino 38 Ama de casa 10 No casado 1380 Si Chiclayo
16 Femenino 19 Estudiante 13 No casado 800 Si Chiclayo
17 Femenino 22 Estudiante 11 No casado 900 No Chiclayo
18 Masculino 32 Estudiante 14 Casado 1100 Si Chiclayo
19 Masculino 38 Obrero 12 No casado 1200 Si Chiclayo
Chiclayo
20 Masculino 34 Obrero 7 No casado 1600 Si
21 Femenino 26 Estudiante 15 No casado 1200 No Piura
22 Femenino 37 Ama de casa 5 No casado 1400 Si Piura
23 Masculino 35 Obrero 8 Casado 1300 Si Piura
24 Femenino 35 Ama de casa 9 Casado 980 Si Piura

37
25 Masculino 37 Obrero 8 Casado 1100 Si Piura
26 Femenino 39 Ama de casa 5 Casado 900 No Piura
27 Masculino 40 Obrero 7 No casado 1200 Si Piura
28 Masculino 30 Estudiante 10 No casado 900 Si Piura
29 Masculino 38 Obrero 7 No casado 700 Si Piura
30 Masculino 30 Obrero 9 Casado 450 Si Piura
31 Femenino 36 Ama de casa 9 Casado 900 No Iquitos
32 Femenino 23 Obrero 4 No casado 990 Si Iquitos
33 Masculino 42 Empleado 10 No casado 1300 No Iquitos
34 Masculino 31 Obrero 9 Casado 1300 No Iquitos
35 Masculino 38 Obrero 5 Casado 1200 Si Iquitos
36 Masculino 35 Obrero 12 No casado 900 Si Iquitos
37 Femenino 30 Estudiante 13 Casado 680 Si Iquitos
38 Masculino 44 Obrero 5 Casado 1200 Si Iquitos
39 Masculino 32 Estudiante 13 No casado 800 Si Iquitos
40 Masculino 46 Obrero 5 Casado 900 Si Iquitos

7. La siguiente tabla muestra la superficie (en millones de millas cuadradas) de los


ocanos.
Ocano: Pacfico Atlntico ndico Antrtico rtico
Superficie: 70 41 28 7 4
Identificar la variable, y represente los datos mediante dos grficos diferentes.
8. Construya una grfica adecuada que permita comprar la predileccin de los estudiantes
por las carreras de ciencias en tres universidades si se tienen los siguientes datos.

Universidade Alumnos que Total de


s Prefieren ciencias alumnos
A 300 6000
B 200 4000
C 180 7200

9. Se ha clasificado un grupo de personas de acuerdo a su ocupacin y procedencia. La


distribucin result la siguiente.
Ocupacin Costa Sierra Selva
Agricultores 15 16 7
Mineros 5 9 4
Tcnicos 13 8 2
Obreros 16 11 4

a. Haga un grfico para representar la distribucin de las personas por su ocupacin.


b. Haga un grfico para comparar la regin de procedencia de las personas segn su
ocupacin.

38
10. El volumen de exportacin de cobre, en miles de toneladas, durante el periodo 2005-
2009 se dan en la tabla que sigue. Trazar un grfico para:

Ao Gran minera Mediana minera Pequea minera


2005 30 30 30
2006 50 50 30
2007 80 60 43
2008 60 40 42
2009 50 45 40
a. Mostrar la evolucin de las exportaciones.
b. Ver el tipo de minera que determina principalmente la tendencia de las
exportaciones
c. Mostrar la proporcin de cada tipo de minera respecto al total de las exportaciones
por ao.

CAPTULO III

Medidas de Tendencia Central


y
39
Posicin

Medidas de Tendencia Central y Posicin


3. Medidas de centralizacin
Las Medidas de Centralizacin o de Tendencia Central son parmetros o estadgrafos que
expresan en forma resumida un conjunto de datos. Estos parmetros a travs de sus
propiedades y sus definiciones hacen posible el anlisis de un conjunto de datos.

3.1. El Promedio o Media Aritmtica


El promedio es el centro de la distribucin de los datos cuando se trata de casos
normales. Entendemos aqu por casos normales aquellos conjuntos de datos que no
contienen valores muy extremos, valores muy alejados de los dems (Universidad Catlica
de Valparaso) .
El promedio tiene los siguientes smbolos

para promedio poblacional

x para promediomuestral

3.1.1 Promedio para datos originales: Se denomina datos originales a un


conjunto de datos de cualquier variable y copiados de cualquier manera. La frmula para su
clculo es:
n
xi
i 1
x
n
Donde xi: Observaciones o datos
n: N de datos

40
Ejem.1: Los siguientes datos corresponde al ingreso econmico de 8 padres de los alumnos
de ingeniera de sistemas: 1200, 900, 1250, 1350, 800, 750, 1200, 1300. Encontrar el
ingreso promedio

1200 900 1250 1350 800 750 1200 1300


x
8

x 1093,75
Soles

El ingreso econmico promedio de 8 padres de familia es 1093,75 soles.

3.1.2 Promedio para datos tabulados


a. Promedio para datos tabulados no agrupados en intervalos
n

x f i i
x i 1

n
Formula:
Ejem. 2:

Tabla 1
Nmero De trabajadores por empresa
Xi fi
46 8
47 10
48 16
49 14
50 12
51 9
52 6
Total 75

41
Ingreso Econmico Yi fi Fi
454,5 587,5 521 5 5
587,5 720,5 654 5 10
720,5 853,5 787 10 20
853,5 986,5 920 13 33
986,5 1119.5 1053 16 48
1119,5 1252,5 1186 8 56
1252,5 1385,5 1319 5 62
Total 62
Reemplazamos los valores en la frmula:

46 x8 47 x10 48 x16 49 x14 50 x12 51x9 52 x6


x
75
x 48,84

El N promedio de trabajadores por empresa es aproximadamente 49

b. Promedio para datos tabulados agrupados en intervalos

x f i i
x i 1

n
FORMULA: Yi : Marcas de clase del intervalo

Ejem.3:
Tabla 2
Ingreso econmico de 62 padres de familia

42
521x5 654 x5 787 x10 920 x13 1053 x16 1186 x8 1319 x5
x
62
x 945,74

El ingreso econmico promedio de los 62 padres de familia es de 945,74 soles.

3.2. La Moda (Mod)


La Moda en un conjunto de observaciones, viene a ser el valor de la variable que se
presenta con ms frecuencia en la distribucin de datos.
No tiene smbolo definido.

3.2.1. Moda para datos cuantitativos agrupados


Ejemplo N 1: Los siguientes datos corresponde al ingreso econmico de 10 padres de
familia. Encontrar la moda.
970, 930, 860, 1040, 1020, 1380, 1410, 900, 1040, 1240
Mod = 1040
Ejemplo N 2: Ingreso econmicos de 8 trabajadores. Encontrar la moda.
1200, 1050, 910, 1300, 1550, 1420, 960
Estos datos no tienen moda.
Ejemplo N 3: corresponde al peso de 10 alumnos:
65, 54, 72, 60, 58, 54, 66, 70, 58
Mod1 = 54
Mod2 = 58
Un conjunto de datos puede tener una moda y se dice que la distribucin de los datos es
unimodal, ms de una moda se dice que la distribucin de los datos es multimodal o
tambin no tener moda y se dice que la distribucin de los datos es amodal.

3.2.2. Moda para Datos Cuantitativos agrupados


a. Moda para datos tabulados no agrupados en intervalos
Mod x j
Formula:

43
Ingreso
fi
Dnde: Econmico Fi
xj es el 454,5 587,5 5 5 valor de la
variable que 587,5 720,5 5 10 corresponde a la
mxima 720,5 853,5 10 20 frecuencia
853,5 986,5 13 33
absoluta.
986,5 1119.5 16 48
1119,5 1252,5 8 56
Ejem.4: Tomamos los
1252,5 1385,5 5 62
datos de la tabla 1 Total 62

Xi fi
46 8
47 10
48 16
49 14
50 12
51 9
52 6
Total 75

La Moda ser el valor de la variable que corresponde a la mxima frecuencia absoluta


(f4 =16), en este caso Mod = 48
El resultado significa que es ms frecuente encontrar empresas con 48 trabajadores

b. Moda para datos tabulados agrupados en intervalos


f i f i 1
Md L j 1 A
( f i f i 1 ) ( f i f i 1 )
Formula:
Donde:
fi = mxima frecuencia absoluta
fi-1 = frecuencia absoluta anterior a nj
fi+1 = frecuencia absoluta posterior a nj
Li-1 = lmite inferior del intervalo que se encuentra en la misma fila de nj
A = Amplitud del intervalo

Ejem.5: Vamos a tomar los datos de la tabla 2

44
De acuerdo a la teora:
1 fi = 16 2 Li-1 = 986,5 3 fi-1 = 13
4 A = 133 5 fi+1 = 8

Reemplazando lo valores en la frmula se tiene:

16 13
Mod 986,5 133
16 13 16 8
Mod 1022

Los sueldos o ingresos econmicos ms frecuente de 62 trabajadores encuentran alrededor


de 1022 soles.

3.2.3. Moda para datos cualitativos:


La moda estar dada por la categora de la variable que corresponde a la mxima frecuencia
absoluta.
Ejem.6: Tabla 3
Nivel de Instruccin de 70 personas
Nivel de instruccin fi hi%
Primaria 2 2,86
Secundaria 11 15,71
Sup. No Universitaria 42 60,00
Sup. Universitaria 15 21,43
Total 70 100,00

45
La mxima frecuencia es 42, por lo tanto, la moda es la categora superior no
universitaria, es decir: Mod = Sup. No Universitaria
3.3. La Mediana
Es el valor que divide a la totalidad de datos, ordenados en forma creciente o
decreciente, en dos partes iguales, de tal manera que el 50% de los datos se encuentren a la
izquierda de la mediana y el otro 50% a la derecha de la mediana.(Tomeo, 2003)

Li Me Ls

50% 50%

La mediana se aplica en lugar del promedio, cuando la variabilidad de los datos es muy
marcada. La mediana tambin se aplica a datos cualitativos ordenados de acuerdo a rangos.
La mediana no tiene smbolo definido.

3.3.1. Mediana para datos cuantitativos no agrupados


Se presentan dos casos:
a Cuando el N de datos es Par
Se ordenan los datos en forma creciente o decreciente y se toma el promedio de los dos
valores del centro.

Ejemplo N1: Los siguientes datos corresponden a las edades de 10 ingenieros:


50, 22, 61, 30, 55, 42, 46, 35, 38,28
Ordenamos en forma creciente:
22, 28, 30, 35, 38, 42, 46, 50, 55, 61
38 42
Me
2
Me 40

El 50% de los ingenieros tienen una edad mxima de 40 aos

b Cuando el N de datos es Impar


Ejemplo N2: Los siguientes datos corresponden al n de trabajadores de 9 empresas

63, 56, 94, 32, 58, 41, 90, 45, 104

46
Ordenamos de forma creciente

32, 41, 45, 56, 58, 63, 90, 94, 104

Se toma el valor del centro: Me = 58

El 50% de empresas tienen un nmero mximo de 58 trabajadores.

3.3.2. Mediana para Datos Cuantitativos Tabulados

a Mediana para datos no agrupados en intervalos

n
Fi 1
2
1 Cuando

Formula: Me = Xi

Dnde:

xj: Es el valor de la variable que se encuentra en la misma fila de Fi

n
2
Fi: Frecuencia absoluta acumulada inmediatamente mayor que

Fi-1: Frecuencia absoluta acumulada anterior a Fi

Procedimiento:
Ejem.7: Tomamos los datos de la tabla 1

Xi fi Fi
46 8 8 n 75
37,5 Fi 48
47 10 18 2 2
48 16 34 1 2
49 14 48
50 12 60 n
Fi 1 34 Fi 1
51 9 69 2
52 6 75 3 efectivamente
Total 75 47
50% de las empresas tienen como mximo 49 trabajadores.

n
Fi 1
2
2 Cuando

Li 1 Li
2
Formula:

Ejem.8: Los siguientes datos corresponden al N de hijos de 54 familias

Nmer Procedimiento:
o de
fi Fi
hijos n 54
Li 27 Fi mximo
42
El 50% de las2familias
2 tienen como
1 5 5 1
aproximadamente 4 hijos. 2
2 10 15
3 12 27
b Mediana para datos agrupados en intervalos
n
4 15 42 Fi 1
Fi 1 27 2
5 8 50
6 4 54 3 n efectivamente
Fi 1
Total 54 2
1 Cuando

48
n 2 Fi 1
Me Li 1 A *
Fi Fi 1
FORMULA:

Dnde:
Li-1 = lmite inferior del intervalo que se
Ingreso encuentra en la misma fila de Fi
fi
Econmico Fi A = Amplitud del intervalo
454,5 587,5 5 5 Fi = frecuencia absoluta acumulada
587,5 720,5 5 10
n
720,5 853,5 10 20
853,5 986,5 13 33 2
986,5 1119.5 16 48 inmediatamente mayor que
1119,5 1252,5 8 56 Fi-1= frecuencia absoluta acumulada anterior a
1252,5 1385,5 5 62 Fi
Total 62

Ejem.9: Vamos a tomar los datos de la tabla 2

Procedimiento:

49
n 62 n
31 Fi 1 20 Fi 1
2 2 2
1 2 Fi= 33 3 efectivamente

Li 1 853,5
4 5 A = 133

Reemplazando valores se tiene:

31 20
Me 853,5 133
33 20
Me 966,04

El 50% de trabajadores tienen un ingreso mximo de 966,04 soles.

n
Fi 1
2
2 Cuando

Me Li 1
:
Formula

Ejem.10: Los siguientes datos corresponden al peso en kilos de 120 alumnos.

Peso fi Fi
30 33 10 10
33 37 20 30
37 41 30 60
41 45 30 90
45 49 16 106
49 53 14 120
Total 120

Procedimiento:

50
n 120 n
60 Fi 90 Fi 1 60 Fi 1
2 2 2
1 2 3 efectivamente

Li 1 41 A4
4 5

Me 41
Reemplazando valores se tiene:

El 50% de los alumnos tienen un peso mximo de 41 kilogramos.

3.3.2. Mediana para datos cualitativos:

Es factible obtener la mediana cuando se tiene datos cualitativos, susceptibles de ordenarse


de acuerdo a rangos o categoras.

Ejem.11: Tomaremos los datos de la tabla 3


Nivel de Instruccin fi Fi
Primaria 2 2
Secundaria 11 13
Superior No Universitaria 42 55
Superior Universitaria 15 70
Total 70

Procedimiento:

n
35 Fi 55 Fi 1 13
2
1 2 3

La mediana est dada por la categora que se encuentra en la misma fila de F i; por lo tanto,
la mediana est dada por la categora Superior no universitaria.
El 50% de los padres de familia de los estudiantes tienen un grado de instruccin mximo
de Superior no universitaria.

51
3.4. Cuartiles (Qi)
Son medidas de posicin que dividen a la distribucin de datos ordenados, en cuatro partes
iguales, de tal manera que:

Li Q1 Q2 Q3 Ls

25%

50%

75%

3.4.1. Cuartiles para datos no agrupados


x (1) x ( 2) x (3) .... x ( n )
Una vez ordenados los datos tales que . El cuartil i-simo (i = 1,
i
( )( n 1 )
4
2 o 3), es el valor del dato que ocupa la posicin en el ordenamiento.
Si la posicin resulta entera, se hace una interpolacin lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentra la fraccin.

Ejem.12
Tomaremos los datos, ordenados previamente correspondientes al ingreso econmico
semanal de 7 padres de familia.
200, 225, 300, 420, 450, 460, 540

x1 x2 x3 x4 x5 x6 x7

Clculo del Primer Cuartil (Q1): i =1, n =7


i 1
( )( n 1 ) ( )( 7 1 ) 2
4 4
, posicin entera, luego Q1 = x2 = 225.
El 25% de los padres de familia, tienen un ingreso mximo de 225 soles.

Clculo del Segundo Cuartil (Q2): i =2, n =7


i 2
( )( n 1 ) ( )( 7 1 ) 4
4 4
, posicin entera, luego Q2 = x4 = 420
El 50% de los padres de familia, tienen un ingreso mximo de 420 soles.

52
Clculo del Tercer Cuartil (Q3): i =3, n =7
i 3
( )( n 1 ) ( )( 7 1 ) 6
4 4
, posicin entera, luego Q3 = x6 = 460.
El 75% de los padres de familia, tienen un ingreso mximo de 460 soles.
Ejem.13
Tomaremos los datos ordenados previamente, correspondientes al ingreso econmico
semanal de 10 padres de familia
200, 225, 300, 420, 450, 460, 540, 550, 600, 650

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
Clculo del Primer Cuartil (Q1): i =1, n =10
i 1
( )( n 1 ) ( )( 10 1 ) 2.75
4 4
, posicin no entera, luego Q1 estar entre las
observaciones X2 y X3.

Estableciendo proporciones se tiene:


Q1 x 2 0,75
Q1 x 2 ( x3 x 2 )(0,75)
x3 x 2 1
Q 225 (300 225)( 0,75)
Q 225 56,25
Q 281,25

El 25% de los padres de familia tienen un ingreso mximo de 281,25 soles.

Clculo del Segundo Cuartil (Q2): i =2, n =10


i 2
( )( n 1) ( )(10 1) 5,5
4 4
, posicin no entera, luego Q2 estar entre las observaciones X5
y X6.
Entonces:
Q2 x5 ( x 6 x5 )(0,5)
450 (460 450)(0,5)
450 5
Q2 455

El 50% de los padres de familia tienen un ingreso mximo de 455 soles.

Clculo del Tercer Cuartil (Q3): i =3, n =10

53
i 3
( )( n 1) ( )(10 1) 8,25
4 4
, posicin no entera, luego Q3 estar entre las
Observaciones X8 y X9.

Entonces:
Q3 x8 ( x9 x8 )(0,25)
550 (600 550)( 0,25)
550 12,5
Q2 562,5

El 75% de los padres de familia tienen un ingreso mximo de 562,5 soles.

3.4.2. Cuartiles para datos agrupados

n(i )
4 Fi 1
Qi Li 1 A *
Fi Fi 1

Formula:

Donde i, tomar valores de 1 a 3, segn se trate de calcular el 1, 2 3 cuartil.

Ejem.14
Para el cuadro N 2, calcular el primer, segundo y tercer cuartil.

54
Procedimiento: Es parecido al clculo de la mediana

n(1)
4 Fi 1
Q1 Li 1 A *
Fi Fi 1

Clculo del primer cuartil (Q1): i = 1

Formula:

Ingreso
fi Fi
Econmico
454,5 587,5 5 5
587,5 720,5 5 10
720,5 853,5 10 20
853,5 986,5 13 33
986,5 1119.5 16 48 n i 621
15,5
1119,5 1252,5 8 56 4 4
1 1252,5 1385,5 5 62
2 Fi= 20 Total 62

3 Fi-1 = 10

4 Li-1 = 720,5 5 A = 133

Reemplazando valores en la frmula:

15 10
Q1 720,5 133 *
20 10
Q1 787

El 25% de los trabajadores, tienen un ingreso mximo de 787 soles.

Clculo del segundo cuartil (Q2): i = 2

55
n(2)
4 Fi 1
Q2 Li 1 A *
Fi Fi 1

Formula:

Procedimiento:

n i 62 2
31
4 4
1 2 Fi = 33 3 Fi-1 = 20

4 Li-1 = 853,5 5 A = 133

Reemplazando valores en la frmula:

31 20
Q2 853,5 133
33 20
Q2 966,04

El 50% de los trabajadores, es decir 31, tienen un ingreso mximo de 966,04 soles.

Clculo del tercer cuartil (Q3): i = 3

n(3)
4 Fi 1
Q3 Li 1 A *
Fi Fi 1

Formula:

Procedimiento:

n i 62 3
46,5
4 4
1 2 Fi = 48 3 Fi-1 = 33

4 Li-1 = 986,5 5 A = 133

56
Reemplazando valores en la frmula:

46,5 33
Q3 986,5 133
48 33
Q3 1106,2

El 75% de los trabajadores, es decir 47 tienen un ingreso mximo de 1106,2 soles.

3.5. Deciles (Di)


Son medidas de posicin que dividen a la distribucin de datos, previamente ordenados, en
10 partes.
i
( )( n 1 )
10
El decil isimo es el valor del dato que ocupa la posicin en el ordenamiento.

Si la posicin no resulta entera, se hace una interpolacin lineal entre los dos valores
correspondientes a las dos observaciones entre las cuales se encuentre la posicin.
(Montgomery, 1997)

3.5.1. Deciles para datos originales


Ejemplo: Tomaremos los datos correspondiente al ingreso semanal, previamente ordenados
de 9 trabajadores de una empresa
320, 330, 345, 410, 460, 580, 900, 940, 940

x1 x2 x3 x4 x5 x6 x7 x8 x9

Calcular el Decil 2 y el Decil 6.


Decil 2 (D2): i = 2, n = 9
2
( )( 9 1 ) 2
10
Posicin entera
Por tanto el decil 2 es el dato que ocupa la segunda posicin: D2 = 330.

El 20% de los trabajadores tienen un ingreso mximo de 330 soles.

57
Decil 6 (D6): i = 6, n = 9
6
( )( 9 1 ) 6
10
:
Posicin entera
Por tanto el decil 6 es el dato que ocupa la sexta posicin: D6 = 580.

El 60% de los trabajadores tienen un ingreso mximo de 580 soles.

3.5.2. Deciles para datos tabulados


n(i )
10 Fi 1
Di Li 1 A *
Fi Fi 1

Formula:
Donde i, tomar valores de 1 a 9, segn se trate del primero, segundo, hasta el noveno decil.

Ejem.15
Para el cuadro N 2, calcular el 4 decil.

Procedimiento:

n i 62 4
24,8
10 10
1 2 Fi = 33 3 Fi-1 = 20

4 Li-1 = 853,5 5 A= 133

n ( 4)
10 Fi 1
D4 Li 1 A *
Fi Fi 1

Reemplazando valores en la frmula:

58
Ingreso 24,8 20
fi Fi D4 853,5 133 *
Econmico
33 20
454,5 587,5 5 5
587,5 720,5 5 10
D4 902,61
720,5 853,5 10 20
853,5 986,5 13 33
El 986,5 1119.5 16 48 40% de los trabajadores, tienen un
1119,5 1252,5 8 56
ingreso mximo de 902,61 soles.
1252,5 1385,5 5 62
Total 62
3.6. Percentiles

Para el clculo de los centiles o percentiles (P i) se procede de manera similar y las frmulas
correspondientes son: (Hoog, 1995)

i
( )( n 1 )
100
Para datos originales:

Para datos tabulados:

n(i )
100 Fi 1
Pi Li 1 A *
Fi Fi 1

Formula:

Ejem.16: Para la tabla 2, calcular el 37 percentil.

59
Procedimiento:

n i 62 37
22,94
100 100
1 2 Fi = 33 3 Fi-1 = 20

4 Li-1 = 853,5 5 A= 133

n(37)
100 Fi 1
P37 Li 1 A *
Fi Fi 1

Reemplazando valores en la frmula:

22,94 20
P37 853,5 133 *
33 20
P37 883,57

El 37% de los trabajadores, tienen un ingreso mximo de 883,57 soles.

60
PROBLEMAS PROPUESTOS

1. El siguiente cuadro muestra la distribucin de la renta anual (en miles de soles) en que
incurren 50 viviendas:
Renta anual 4-6 6-8 8 - 10 10 - 12 12 - 14 14 - 16 16 - 18
N de Viviendas 3 2 7 7 11 11 9
- Halle la renta anual promedio
- Calcule la renta anual mximo que paga el 50% de las viviendas
- Cunto es la renta anual que paga la mayora de los hogares?

2. Un dentista observa el nmero de caries en cada uno de los 100 nios de cierto colegio. La
informacin obtenida aparece resumida en la siguiente tabla:
N cari es fi hi%
0 25 25
1 20 20
2 X z
3 15 15
4 y 5
- Halle el nmero de caries promedio.
- El nmero de caries mximo que tienen el 50% de los nios.

3. El histograma de la distribucin correspondiente al peso de 100 alumnos de Bachillerato es


el siguiente

- Halle el peso ms frecuente en los alumnos


4. Los siguientes datos pertenecen a la distribucin de la produccin de papas (en Tn.) en 40
zonas del pas
L1= 20 f2 - f5=2 X5= 100 f1=4 f3=20
Si se sabe que la distribucin es simtrica y presenta 5 intervalos de clase.
- Reconstruya los intervalos de clase y obtenga las frecuencias absolutas
- Calcule la media, la mediana y moda e interprtelos
5. Dada la siguiente distribucin de frecuencias, calcular el valor de n sabiendo que la moda
es 60 y pertenece al tercer intervalo.
Intervalos f
61
16 32 6
32 48 n
48 64 8
64 80 3n
80 - 96 3

6. A los trabajadores de la empresa El Olivar, se les consult, sobre el nmero de hijos que
tienen a fin de regalarles un obsequio por navidad.
Nmero de Trabajadores
hijos
0 15
1 20
2 23
3 14
4 10
5 5
- Cuantos hijos en promedio tiene cada trabajador
- Cuantos hijos tiene la mayora de los trabajadores
- Cuantos hijos tiene como mximo el 85% de los trabajadores

7. Las notas de los alumnos que llevaron el curso Matemtica bsica se presenta a
continuacin:
15.0 11.9 10 15
12.1 13.8 8 14.5
9.5 12.3 7.5 12.7
8.3 20 6.3 13.6
10.4 15.3 5.5 19.2
12.5 14.5 15 14.5
11.6 11.9 13 11.2

- Cul es la nota promedio de los alumnos


- Cuanto es la nota mxima del 45% de los alumnos
- Cul es la nota mxima del 70% de los alumnos.

8. El tiempo en segundos que demoran las computadoras en transferir un mismo


archivo a un dispositivo externo esta dado en la siguiente tabla:

Tiempo en minutos Nmero de


computadoras
170 175 1
175 180 3
180 185 4
185 190 8

62
190 195 5
195 200 2
- Calcular la el tiempo mximo que demoran el 65% de las mquinas en transferir un
archivo.
- Cunto tiempo tardan la mayora de computadoras en transferir un archivo?
- Cul es el tiempo promedio.

9. Se recolect el nmero de papeletas por distintos motivos a un grupo personas que


se dedicaban hacer taxi, obtenindose la siguiente tabla:
Nmero de papeletas Taxistas
26-34 2
34-42 1
42-50 10
50-58 4
58-66 16
66-74 8
74-82 9
Total 50

-Calcule el nmero de papeletas promedio por taxista


-Calcule el nmero de papeletas ms frecuente en los taxistas.

10. Las personas que asisten al gimnasio Ponte en Forma comentaron sobre el
nmero de hijos que tienen:
3 0 4 4
2 1 3 3
0 1 4 4
1 2 2 2
1 0 3 0
2 3 4 3
3 2 1 2
2 1 3 2
- Cuntos hijos tienen en promedio las personas
- Cuntos hijos como mximo tiene el 45% de las personas.
- Cuntos hijos como mximo tiene el 74% de las personas.

63
CAPTULO IV

Medidas de Dispersin
Y
Deformacin

Medidas de Dispersin y Deformacin


4.1. Medidas de Dispersin
Son medidas o parmetros estadsticos que sirven de complemento a las medidas de
centralizacin en el anlisis de los datos. La dispersin o variacin es una caracterstica
importante de un conjunto de datos porque intenta dar una idea de cun esparcidos se
encuentran stos. (Mendenhall, 2000)

4.1.1. Recorrido o Rango: (R)

Viene a ser la diferencia entre el valor mximo y el valor mnimo de los datos, es decir:
R = VMax VMin

64
Ejem.1: Si tenemos los siguientes datos referentes al ingreso quincenal de 10 trabajadores.
720 860 820 456 - 950 1000 1150 980 1384 998
VMax = 1384
VMin = 456
R = 1384 456 = 928 soles.

El recorrido a rango como estadgrafo de posicin es muy limitado, porque slo considera
los valores extremos de la distribucin de datos y no nos indican nada sobre el
comportamiento de los datos.

4.1.2. Varianza:
La Varianza muestral es la que se presenta en la tabla adjunta y la varianza poblacional se
define en el captulo de probabilidades.

CONDICIN Muestra

Datos Originales
S=
2 ( x i x )2
n1

2
Datos Tabulados
S=2 ( x i x ) f i
sin intervalos n1

Datos Tabulados
S=
2 ( y i x )2f i
con intervalos n1

Ejem.2: Los siguientes datos corresponden a los ingresos econmicos por semana de 12
trabajadores de una empresa

Xi: 600, 650, 200, 710, 300, 550, 420, 460, 450, 540, 850, 225.

Para poder aplicar la frmula, primero debemos encontrar el promedio y luego aplicar la
frmula de la varianza.
x 496.25
1 Calculando el promedio:

S=2 ( x i x )2
2 Calculando la varianza muestral: n1

65
(600 496.25) 2 (650 496.25) 2 (200 496.25) 2 ...... (225 496.25) 2
S2
12 1
419156.22
S2
12 1
S 38105.11 Soles al cuadrado
2

4.1.3. Desviacin Estndar: Es la raz cuadrada de la varianza.

Las frmulas son las siguientes:

CONDICIN Muestra
Datos Originales
S=
( x i x )2
n1
Datos Tabulados
sin intervalos S=
(x i x )2f i
n1
Datos Tabulados
con intervalos S=
( y i x )2f i
n1

Ejem.3: A partir del ejemplo 2 se encontrar la desviacin estndar.

S S 2 38105.11
S 195.21 Soles

La dispersin promedio que existe entre los datos y la media aritmtica es de 195.21 soles.

4.1.4. Coeficiente de variacin:


Se utiliza para comparar la dispersin de dos conjuntos de datos que tienen unidades
diferentes, ya que representa una medida relativa de dispersin.
s
CV (100)
X

Ejemplo: La resistencia al rompimiento de dos muestras de botellas es la siguiente:

Muestra 1: 230 250 245 258 265 240


Muestra 2: 190 228 305 240 265 260

Muestra 1: Muestra 2

66

x 248 x 248

s = 12.56 s = 38.75

CV = 12.56/248*100= 5.06% CV = 38.75/248*100 = 15.625

La muestra 1 presenta menor variabilidad.

4.2 Medidas de Asimetra


4.2.1. Coeficientes de asimetra (As)
Miden el grado de deformacin horizontal de la distribucin de frecuencias.

ndices de Asimetra de Pearson (As).


Se definen:
3( y Me ) y Md
As As
S S

El primero es el ms usual.

Interpretacin
y Me Md
1. Si la distribucin es Simtrica, entonces As = 0, en este caso coinciden
2. Si la distribucin es Asimtrica Positiva sesgada a la derecha si: As > 0.
3. Si la distribucin es Asimtrica Negativa sesgada a la izquierda si: As < 0.

Fuente: Escobar, 2010


67
4.2.2. Estadgrafos de Apuntamiento o Kurtuosis
La kurtuosis viene a ser el grado de apuntamiento de una distribucin.
a. Si una distribucin tiene una elevada punta o apuntamiento, se llama Leptokrtica.
b. Si la distribucin se asemeja a una distribucin normal se llama Mesocrtica
c. Si la distribucin es aplanada se denomina Platikrtica. (Meyer, 2002)
El estadgrafo para analizar el apuntamiento es:

m4
S4
Coeficiente de Kurtuosis: a =
Donde S4 = ( S2 )2

x x ni
4
i

n
m4 =
Si a = 3 : La distribucin es Mesokrtica ( Normal).
Si a > 3 : La distribucin es Leptokrtica ( apuntada)
Si a < 3 : La distribucin es Platikrtica ( aplanada )

Fuente: Rodrguez, 2014


PROBLEMAS PROPUESTOS

1) Cierto diccionario tiene 1459 pginas con palabras definidas, a continuacin se indica el
nmero de palabras definidas en cada una de las pginas de una muestra aleatoria simple
obtenida de dichas pginas. Se utiliza esta muestra como base para estimar el nmero total
de palabras definidas en el diccionario. Cul es la variacin que existe?
51 63 36 43 34 62 73 39 53 79
2) A continuacin se presentan los salarios anuales de una muestra aleatoria simple de
entrenadores de futbol americano de la NCAA. Qu cambios se observaran en la
desviacin estndar si se omitiera el salario ms alto?
$150000 $300000 $350147 $232425 $360000 $229000
3) A continuacin se presentan las duraciones (en segundos) de canciones que eran populares

68
cuando se escribi este libro.(Las canciones son de Pink, One Direction,Shakira, Rihanna,
entre otros)La desviacin estndar cambiara mucho si se eliminara la cancin de mayor
duracin?
448 242 231 246 246 293 280 227 244 213 262
4) En un examen de matemticas los 30 alumnos de una clase han obtenido las puntuaciones
recogidas en la siguiente tabla. Halla la varianza y la desviacin tpica.
Calificaciones N
alumnos
[0,1) 2
[1,2) 2
[2,3) 3
[3,4) 6
[4,5) 7
[5,6) 6
[6,7) 1
[7,8) 1
[8,9) 1
[9,10) 1
5) En cierta clase se ha medido la altura de los 25 alumnos. Sus medidas, en cm, se reflejan en
la siguiente tabla agrupados en intervalos. Calcula la varianza y la desviacin tpica.
Alturas N
alumnos
[150,155) 3
[155,160) 7
[160,165) 6
[165,170) 4
[170,175) 5
6) Para el ejercicio 1 calcule e interprete el coeficiente de asimetra.
7) A partir del ejercicio 2 calcule e interprete la Kurtuosis.
8) Del ejercicio 3 calcular e interpretar las medidas de asimetra.
9) Hallar el ejercicio 4 el coeficiente de asimetra. Interpretar
10) Calcular e interpretar la Kurtuosis del ejercicio 5

69
CAPTULO V

Probabilidades

Probabilidades

5.1. Introduccin a las Probabilidades


A lo largo de la historia los jugadores han recurrido a las probabilidades para
realizar sus apuestas. Es as que hace 3500 A.C., juegos de azar con objetos de hueso,
que podran ser consideradas como los precursores de los dados, fueron ampliamente
desarrollados en Egipto y otros lugares. Los primeros dados cbicos con marcas
virtualmente idnticas a los dados modernos se han encontrado en tumbas egipcias que
datan del ao 2000 A.C. Es por eso que el juego con dados ha sido popular desde esa
poca y que por ello se le considera como un hecho clave para el primer desarrollo de la
Teora de la Probabilidad.
La Teora de la Probabilidad toma importancia cuando se inventaron frmulas y tcnicas
probabilsticas, siendo sus precursores: Jacob Bernoulli (1645-1705), Abraham de Moivre
(1667-1754), el reverendo Thomas Bayes (1702-1761)y Joseph Lagrange (1736-1813).
Fue en el siglo XIX en que Pierre Simn, Marquis de Laplace (1749-1827), unific esas

70
ideas y formul la primera teora general de la probabilidad.
La Teora de la Probabilidad se ha desarrollado constantemente desde el siglo XVII y se ha
aplicado ampliamente en diversos campos de estudio. Hoy, la Teora de la Probabilidad
es una herramienta importante para el desarrollo de la Estadstica Inferencial y tambin se
desarrolla en la mayora de las reas de ingeniera, administracin y Ciencias Afines.

5.2. Experimentos
La Teora de la Probabilidad tiene que ver con los diversos resultados posibles que
pueden obtenerse y los posibles sucesos que podran ocurrir cuando se realiza un
experimento. El trmino experimento se utiliza en la teora de la probabilidad para
describir virtualmente cualquier proceso cuyos resultados no se conocen de antemano con
certeza. Entonces, un experimento es el proceso mediante el cual se obtiene una
observacin (o una medicin) de un fenmeno.

5.2.1. Experimentos Aleatorios


Si se realiza un experimento, ste puede tener uno de varios posibles resultados;
si no puede predecirse con seguridad cual ocurrir, se dice que el experimento es aleatorio.
Por Ejemplo si lanzas una moneda, cuyo resultado puede ser, caer cara o caer sello. En
este experimento no podemos predecir con seguridad cul resultado aparecer con certeza.
Otro experimento aleatorio es el siguiente: al lanzar un dado, los resultados que se
obtienen pueden ser cualquier nmero del 1 al 6.

5.2.2. Experimentos Determinsticos


Si un experimento tiene un nico resultado posible, que al realizarlo sabemos
que ocurrir, el experimento se llamar determinstico.
Por Ejemplo, un experimento determinstico sera extraer una bola de una que contiene
bolas con un slo color, digamos negras. Si nos fijamos en el color de la bola extrada
sabemos de antemano que es negra. (Raymond y Myers, 1998).

5.3. Espacio Muestral


Es el conjunto de todos los posibles resultados de un experimento. Por Ejemplo, al realizar
el experimento de lanzar un dado y observar la cara que aparece, vemos una serie de
resultados posibles y que se representa por:
S = {1, 2, 3, 4, 5, 6 }
Otro Ejemplo es, si realizamos el experimento; si lanzamos dos monedas al aire,
observamos que los posibles resultados pueden ser (en este caso los resultados de a dos se

71
agrupan en pares ordenados):

T = { (sello, sello) (sello, cara) (cara, sello) (cara, cara) }

Otro Ejemplo es, si realizamos el experimento; se lanzan dos dados, los posibles
resultados al observar el nmero de puntos en ambas caras de los dados es el siguiente
espacio muestral:

(1,1) (1,2), (1,3), (1,4), (1,5), (1,1),


,(2,1) (2,2), (2,3), (2,4), (2,5), (2, 6),
,
(3,1) (3,2), (3,3), (3,4), (3,5), (3,6),
V= ,(4,1) (4,2), (4,3), (4,4), (4,5), (4, 6),
,(5,1) (5,2), (5,3), (5,4), (5,5), (5, 6),
,(6,1) (6,2), (6,3), (6,4), (6,5), (6, 6)
,

Ms Ejemplos:

Dados los siguientes experimentos:

E1: Lanzar una moneda y observar la cara superior.


E2: Lanzar un dado y observar el nmero que aparece en la cara superior.
E3: Extraer una bola de una urna que contiene bolas rojas R y bolas verdes V.
E4: Designar un delegado de un grupo de 50 personas a travs de un sorteo.
E6: Elegir un punto del intervalo cerrado [0,1]
E7: Observar el tiempo de vida de un T.V. SONY.
E8: verificar el estado de un transistor (0= apagado, 1= prendido).

Indicar su espacio muestral:

Solucin:

S 1
{c, s}
Para e1: , donde c= cara y s= sello.
S 2
{1,2,3,4,5,6}
Para e2:
S 3
{R , V }
Para e3:
S 4
{1,2,3, ,50}
Para e4: donde cada nmero representa a cada persona.

72
S 5
{1,2,3, }
Para e5:
S 6
{x R/0 x 1}
Para e6:
S 7
{t R/t 0}
Para e7:
S 8
{0,1}
8:
Para e

5.4. Eventos
Con base a los experimentos anteriores (lanzar un dado, lanzar dos monedas y lanzar
dos dados), observamos que stos pueden tener uno o ms resultados, a los cuales se les
llama Eventos y que se representan mediante letras maysculas.
Por tanto un Evento es un subconjunto de un Espacio Muestral.
Se puede hacer una lista de muchos eventos asociados con un experimento, algunos con
ms posibilidad de ocurrir que otros. Desde el punto de vista de conjuntos, un evento es un
subconjunto de un espacio muestral. Por Ejemplo, en el experimento de tirar un dado se
tiene:
{1} es el evento elemental o evento simple que indica que al lanzar un
dado salga la unidad.
{2, 4,6} es un evento que indica que al lanzar un dado salga nmero par.
{1, 2,3} es un evento que indica que al lanzar un dado salga un nmero menor
que 4
{1, 2, 3, 4, 5, 6} es un evento que indica que al lanzar un dado salga un nmero menor
que 7

Otro Ejemplo: En el experimento aleatorio lanzar 4 monedas simultneamente. Definimos


los eventos siguientes:

E1: Todas las monedas muestran el mismo lado


E2: Ocurren por lo menos dos caras
E3: Ocurre sello en el tercer lanzamiento.

S {ccc, ccs, csc, css , scc, scs , ssc , sss}


Sol: tenemos que:
E 1
{ccc, sss}
Luego:

73
E 2
{ccc, ccs, csc, scc}

E 3
{ccs, css, scs , sss}

Observaciones:
- A todo elemento de un espacio muestral se le denomina suceso, y se denota por
w S.
w,x,y, etc., es decir
E {w}
- Un evento con un solo elemento es un evento elemental, as es un evento
elemental.

- Si el conjunto vaco es subconjunto de cualquier conjunto, entonces es un
evento, y se denomina evento imposible.
Ejemplo: E= lanzar un dado y observar que la cara superior muestre un puntaje
E {}
mayor que 6
- Si todo conjunto es subconjunto de s mismo, entonces S tambin es un evento y
se le denomina Evento Seguro. En el Ejemplo de la tirada del dado un evento
seguro S sera ver un puntaje menor que 7 al lanzar el dado, como vemos el
evento sera:
S = {1, 2, 3, 4, 5, 6}, y es un evento seguro porque siempre ocurre.

5.5. lgebra de Eventos:


Simplemente es la misma lgebra de conjuntos, es decir podemos combinar eventos
para formar nuevos eventos, utilizando las diferentes operaciones conjunto:

Si denotamos los eventos por A, B, C, D, E, etc.

A B
a) es el evento que sucede s y solo si A B o ambas, suceden.
A B
b) es el evento que sucede s solo si A y B sucede simultneamente.
c
A,
c) (complemento de A), es el evento s y solo si, A no sucede.
Observacin: Dos eventos A y B son llamados mutuamente, si son disyuntivos, es decir si
A B
. En otras palabras, son mutuamente exclusivos si no pueden suceder
simultneamente. (Devore,1998)
Ejemplo: Lanzase un dado y observese el nmero que aparece en la cara superior

74
A {1,2,3,4,5,6}

Sea A el evento de salir un nmero par, B de salir impar y C salir primo.


A {2,4,6} B {1,3,5} C {2,3,5}.
, ,
A C {2,3,4,5,6}
Entonces: es el evento de que el nmero sea par o primo.
B C {3,5}
es el evento de que el nmero sea impar o primo.
c
C {1,4,6}
es el evento de que el nmero no sea primo.
5.6. Definiciones de Probabilidad:
La definicin de probabilidad tiene 3 enfoques:
1. Definicin Clsica o A priori
2. Definicin de probabilidad por frecuencia Relativa o Aposteriori.
3. Probabilidad Subjetiva.
Observacin: las dos primeras definiciones son probabilidades objetivas.

5.6.1. Definicin Clsica o A priori:


La probabilidad de un evento es la razn entre el nmero de casos (sucesos)
favorables y el nmero total de casos (sucesos) posibles del espacio muestral, siempre y
cuando cada uno de los resultados o sucesos del espacio muestral tiene la misma
posibilidad de suceder. As, la probabilidad de que ocurre el evento E es:
N ( E ) nE
P( E )
N (S ) n
Donde: N(E)=nE = cardinal del conjunto E
N(S)=n = cardinal del conjunto S.

Nota: cardinal de un conjunto es el nmero de elementos que tiene dicho conjunto.

Ejemplo: Se lanza dos dados. Calcular la probabilidad de:


a) Obtener suma 4.
b) Obtener suma 7.
c) Obtener suma par.
d) Obtener suma mayor que 5.
e) Que el resultado del primer dado sea mayor que el resultado del
segundo?
Solucin.: El espacio muestral lo podemos obtener a travs de un cuadro de doble entrada
donde S est formado por pares ordenados, en la cual el primer componente es el resultado
del primer dado y la segunda componente el resultado del segundo dado.

75
2 1 2 3 4 5 6
1 dado
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
6 (6,1) (6,2) (6,3) (5,4) (6,5) (6,6)
n 36

Sean los eventos:


n A
3
A: obtener suma 4 A={(3,1),(2,2),(1,3)}
n B
6
B: obtener suma 7 B={(6,1),(5,2),(4,3),(3,4),(2,5),(1,6)}
C:obtener suma par
C={(1,1),(1,3),(1,5),(2,2),(2,4),(2,6),(3,1),(3,3),(3,5),(4,2),(4,4),(4,6),(5,1), (5,3),(5,5),

n C
18
(6,2),(6,4),(6,6)}

n D
26
D: obtener suma mayor que 5

n E
15
E: resultado del primer dado mayor que el resultado del segundo dado

Por lo tanto:

P( A)
n A

3 1
P( B)
n B

3 1
P(C )
n C

18 1

n 36 2 n 36 6 n 36 2
, ,

P( D)
n D

26 13

n 36 18 P (E )
, queda para el estudiante.

5.6.2. Definicin por frecuencia Relativa o A posteriori

76
n A
Si un experimento bien definido se repite n veces (n grande); sea el nmero de veces

n A
n n A
que el evento A ocurre en los n ensayos donde , a este se le denomina
" nA "
n
frecuencia; y al cociente P ( A) n
se le denomina frecuencia
A relativa, la cual representa a la
n A, o sea:
estimacin de la probabilidad de que ocurra el evento

Si queremos obtener la verdadera probabilidad, entonces N debe ser muy grande.


n A
P ( A) n
lm
n
Observacin: las propiedades de la probabilidad por frecuencia relativa son las mismas que
la probabilidad clsica dados en las observaciones generales de la pg.

Ejemplo: en 20 centros educativos de las diferentes P.P.J.J. de Chiclayo que forman en total
a 16000 alumnos, se detectaron 1900 casos de tuberculosis. Hallar la probabilidad de
encontrar a un alumno tuberculoso en un colegio determinado.

Solucin: sea el evento E: un alumno tuberculoso en determinado colegio.

n A 1900 n 16000
,

1900
P( E ) 0,1186
16000 P ( E ) 11,86%
o en forma porcentual

Entonces diremos si escogemos un alumno de un determinado centro educativo, existe un


11,86% de posibilidades que est tuberculoso.

Ejemplo: La distribucin de alumnos de un determinado Instituto Pedaggico por niveles o


especialidades es la siguiente:

Nivel Especialidad Primaria Hist.y Geog. Leng.yLit. (C) Educ.Fis. Matem. Total
(A) (B) (E) (M)

77
N Total de alumnos 108 60 58 40 38 304
Alumnos sexo femen. 80 38 30 16 11 175
(F)
Alumnos sexo mascul. 28 22 28 24 27 129
(V)
Cul es la probabilidad de que un alumno seleccionado aleatoriamente

a) Sea una mujer?


b) Pertenezca a Lenguaje y Literatura
c) Sea un alumno masculino de la especialidad de Educacin Fsica?
d) Sea un alumno de sexo femenino de la especialidad de Matemtica?

Solucin:

a) Sea A el evento: la persona seleccionada es mujer.


n A 175
(total de alumnos del sexo femenino)

n 304
(total de alumnos del Instituto)

P( A)
n A

175
n 304

b) Sea B el evento: el alumno seleccionado pertenece a la especialidad de


lenguaje y Literatura.
n B 58
(total de alumnos de Lenguaje y Literatura)

P( B)
n B

58
n 304

c) Sea C el evento: la persona seleccionada es hombre y de la especialidad


de Educacin Fsica.
nC 24

24
P (C )
304

78
d) Sea D el evento: la persona seleccionada sea del sexo femenino de la
especialidad de Matemtica.
n D 11

11
P ( D)
304

5.6.3. Definicin Subjetiva


La probabilidad es subjetiva cuando en un experimento determinado, la
probabilidad de que un evento A ocurra, tiene un grado de creencia asignado a la ocurrencia
de este evento por un individuo en particular, pero eso s, est basado en toda la evidencia a
su disposicin, con las siguientes exigencias:

P ( A) 0
1) , representa la certeza de que el evento A no ocurrir.

P ( A) 1
2) , representa la certeza de que el evento A si ocurrir.

0 P( A) 1
3) , representa la certeza de que el evento A, ocurrir.

Claro es que si la probabilidad es subjetiva de la ocurrencia de un evento A, para una


persona tendr un determinado valor de acuerdo a las condiciones o evidencias que
dispone. Y para otra persona que tiene de repente ms evidencias, podra asignar a la
ocurrencia del evento A otra probabilidad diferente (un nmero diferente al anterior).

Ejemplo:

Cul es la probabilidad de que la seleccin peruana se clasifique al prximo Mundial de


Ftbol?

Cul es la probabilidad de que un profesor en educacin pblica gane S/.10000 en el


prximo gobierno?

Como pueden observar, son eventos nicos, que no han ocurrido antes. No hay forma de
que se puedan interpretar tales probabilidades como una frecuencia relativa o como una

79
probabilidad Clsica. Entonces el enfoque subjetivo de la probabilidad es pues adecuado en
la respuesta de las preguntas ltimamente expuestas.

5.7. Tcnicas de conteo:


Uno de las cuestiones importantes a tener en cuenta en las teoras de las
probabilidades es el conteo de los elementos que suceden en los diferentes eventos y
espacios muestrales, para esto recurrimos a tcnicas que nos ayudar a encontrar el cardinal
de los conjuntos requeridos para la solucin de un determinado problema de
probabilidades.

5.7.1. Principio aditivo


Si se desea llevar a efecto una actividad, la cual tiene formas alternativas para ser
realizada, donde la primera de esas alternativas puede ser realizada de M maneras o formas,
la segunda alternativa puede realizarse de N maneras o formas y la ltima de las
alternativas puede ser realizada de W maneras o formas, entonces esa actividad puede ser
llevada a cabo de,
M + N + ...+ W maneras o formas

Ejemplos:

1) Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que puede
seleccionar de entre las marcas Whirpool, Easy y General Electric, cuando acude a hacer la
compra se encuentra que la lavadora de la marca W se presenta en dos tipos de carga ( 8 u
11 kilogramos), en cuatro colores diferentes y puede ser automtica o semiautomtica,
mientras que la lavadora de la marca E, se presenta en tres tipos de carga (8, 11 o 15
kilogramos), en dos colores diferentes y puede ser automtica o semiautomtica y la
lavadora de la marca GE, se presenta en solo un tipo de carga, que es de 11 kilogramos, dos
colores diferentes y solo hay semiautomtica. Cuntas maneras tiene esta persona de
comprar una lavadora?

Solucin:

M = Nmero de maneras de seleccionar una lavadora Whirpool


N = Nmero de maneras de seleccionar una lavadora de la marca Easy
W = Nmero de maneras de seleccionar una lavadora de la marca General Electric
M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras

80
M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora
Cmo podemos distinguir cuando hacer uso del principio multiplicativo y cuando del
aditivo?

Es muy simple, cuando se trata de una sola actividad, la cual requiere para ser llevada a
efecto de una serie de pasos, entonces haremos uso del principio multiplicativo y si la
actividad a desarrollar o a ser efectuada tiene alternativas para ser llevada a cabo, haremos
uso del principio aditivo.

5.7.2. Principio Multiplicativo


Si se desea realizar una actividad que consta de r pasos, en donde el primer paso
de la actividad a realizar puede ser llevado a cabo de N 1 maneras o formas, el segundo paso
de N2 maneras o formas y el r-simo paso de Nr maneras o formas, entonces esta actividad
puede ser llevada a efecto de; N1 x N2 x ..........x Nr maneras o formas
El principio multiplicativo implica que cada uno de los pasos de la actividad deben ser
llevados a efecto, uno tras otro. (Miller y Johnson, 1992)
Ejemplos:
1) Una persona desea construir su casa, para lo cul considera que puede construir los
cimientos de su casa de cualquiera de dos maneras (concreto o block de cemento), mientras
que las paredes las puede hacer de adobe, adobn o ladrillo, el techo puede ser de concreto
o lmina galvanizada y por ltimo los acabados los puede realizar de una sola manera
cuntas maneras tiene esta persona de construir su casa?
Solucin
Considerando que r = 4 pasos
N1= maneras de hacer cimientos = 2
N2= maneras de construir paredes = 3
N3= maneras de hacer techos = 2
N4= maneras de hacer acabados = 1
N1 x N2 x N3 x N4 = 2 x 3 x 2 x 1 = 12 maneras de construir la casa

El principio multiplicativo, el aditivo y las tcnicas de conteo que posteriormente se


tratarn nos proporcionan todas las maneras o formas posibles de cmo se puede llevar a
cabo una actividad cualquiera.
2) Cuntos nmeros telefnicos es posible disear, los que deben constar de seis dgitos
tomados del 0 al 9?, a. Considere que el cero no puede ir al inicio de los nmeros y es
posible repetir dgitos, b. El cero no debe ir en la primera posicin y no es posible repetir
dgitos, c. Cuntos de los nmeros telefnicos del inciso b empiezan por el nmero siete?,
d. Cuntos de los nmeros telefnicos del inciso b forman un nmero impar?.

Solucin:

81
9 x 10 x 10 x 10 x 10 x 10 = 900,000 nmeros telefnicos
9 x 9 x 8 x 7 x 6 x 5 = 136,080 nmeros telefnicos
1 x 9 x 8 x 7 x 6 x 5 = 15,120 nmeros telefnicos
8 x 8 x 7 x 6 x 5 x 5 = 67,200 nmeros telefnicos

3) De cuntas maneras diferentes podr vestirse un joven que tiene 3 camisas diferentes, 4
pantalones y 2 pares de calzado?

Solucin: 3x 4 x 2 = 24 maneras diferentes

5.7.3. Principios Factoriales


5.7.3.1. Permutaciones:
h
Dado un conjunto finito A, de cardinal , se llaman permutaciones a las
ordenaciones totales que pueden hacerse con los elementos del conjunto A.

Ejemplo:

- el conjunto unitario {a} slo puede ordenarse de un modo nico.


- el conjunto {a, b} puede ordenarse de dos modos: ab, ba
- el conjunto {a, b, c} puede ordenarse en seis modos: abc, acb, bac, bca, cab, cba

Notando que dos cuales de estos seis permutaciones son distintas, es decir, difieren en la
posicin de sus elementos, entonces interesa el orden
n
En general el nmero de permutaciones de elementos es:

p n
n(n 1)(n 2).... * 3 * 2 *1 n!

p n n
Definicin: el nmero , de permutaciones que pueden construirse con elementos de
n!
un conjunto cualquiera es

Ejemplo: De cuntas maneras pueden ubicarse 8 nios en 8 carpetas?


Si el conjunto de los nios est escrito por {a, b, c, d, e, f, g}, entonces lo que se quiere es
ordenar de distinta forma los elementos, es decir permutar los elementos. Se supone que las
carpetas estn fijas.

82
Entonces el nmero de maneras que se pueden ubicarse los nios es:
p 8
8! 8 * 7 * 6 * 5 * 4 * 3 * 2 *1 40320

5.7.3.2. Variaciones:
(nVr )

n
Dado un conjunto de elementos, se da el nombre de variacin a cada una de
r
las ordenaciones que se pueden formar tomando grupos en elementos de este conjunto;
(r n)
teniendo en cuenta el orden que toman .

Del Ejemplo anterior tenemos que del conjunto {2, 3, 5, 6, 7, 9} tomamos 3 elementos para
formar nmeros diferentes de 3 dgitos (parte a), es decir tomamos grupos de 3 en 3
y
elementos, teniendo en cuenta el orden, dio como resultado por el principio fundamental
del conteo

6 *5 * 4 (3
6
=120 que vienen a ser (factorial generalizado)

3 factores

N de elementos
r
Luego el nmero de grupos diferentes de elementos ordenados (variaciones) que pueden
n
seleccionarse de un conjunto de elementos est dada por la frmula:

(r
nVr n n(n 1)(n 2)...( n r 1)

Problema: seis personas entran en un saln de espera en la que hay 8 sillas De cuantas
maneras diferentes pueden sentarse?

Solucin: se trata de variacin porque las personas se van a colocar en diferentes sillas,
pues se tiene en cuenta el orden.

8! 8!
V 20160
8
6
(8 6)! 2!
Rpta.

83
(nCr )
5.7.3.3. Combinaciones:
Una combinacin de objetos es aquel acto de juntarlos en donde no cuenta el
orden de colocacin de los objetos. Las diversas combinaciones de objetos difieren entre si
n
por la calidad de los ingredientes; es decir, dado un conjunto de elementos se pide
r
cuantos subconjuntos de elementos hay.

Ejemplo: del conjunto A={a, b, c, d}. Cuntos subconjuntos de 3 elementos hay?

Solucin: hallamos las combinaciones de 3 elementos (subconjuntos de 3 elementos del


conjunto

A) {a, b, c}, {a,b,d}, {a, c, d}, {b, c, d} Luego hay 4 combinaciones.


La dificultad se da si A tiene muchos elementos, para hallar el nmero de combinaciones
existe el siguiente teorema:

n!
nCr
r! (n r )!
r
Observacin: el nmero de combinaciones objetos se puede representar de la siguiente

n n!
nCr
r r! (n r )!
manera:

5.7.3.3.1. Tcnica para diagramar las combinaciones:


Consideremos el conjunto V={a, e, i, o, u}, de las vocales. Formemos los
subconjuntos de V, cuyo cardinal es 1:
{a}, {e}, {i}, {o}, {u}

Diremos que hemos formado as las combinaciones de orden 1 con los 5 elementos del
conjunto V. A partir de las combinaciones de orden 1 con los elementos de V, formamos las
combinaciones de orden 2 as:
{a} {a, e}, {a, i}, {a, o}, {a, u}

{e} {e, i}, {e, o}, {e, u}

{i} {i, o}, {i, u}

84
{o} {o, u}

{u}

Como podemos observar se coge un elemento seguido de los elementos de la derecha sin
regresar a la izquierda, este mismo procedimiento se sigue para formar las combinaciones
de orden 3, 4, etc.

Problema: un comit de 5 personas se va a seleccionar en un club de 12 miembros De


cuntos modos puede seleccionarse este comit?

Solucin: puesto que no interesa el orden, entonces se trata de combinaciones.

12! 12!
C 792
12 5
5! (12 5)! 5!7!
Entonces n
n C r
Cr
Propiedad de los nmeros Combinatorios: Si
n
C n
1
1)
n n
C r
C n 1
2)
nm nm
n m
C Cx y xy x y n m
3) se cumple: a)
n n n 1
C r
C r 1 C r 1
4)
n n n 1
C C
r
r r 1
5) (degradacin de ndices).

(PR )
5.7.3.4. Permutaciones con Repeticiones
Muchas veces se desea saber el nmero de permutaciones de objetos, de los
cuales algunos son iguales, para esto usamos el siguiente teorema:

85
n n
1 n 2
Teorema: el nmero de permutaciones de objetos de los cuales son iguales, son

n r n ,nn!
1 2
, nr
iguales, son iguales, dePR
donde
son de diferentes clases, entonces
tenemos: (Canavos,1992) n1!n2!n3!nr !

Ejemplo: hallar el nmero de permutaciones de la palabra DIVISIBILIDAD.

n 13
Solucin: tenemos
n1 5 n2 3
Las clases que se repiten son: letra I letra D Luego, por la
13!
PR
5!3!
frmula:

PROBLEMAS PROPUESTOS

1. Cul es la probabilidad de elegir un nmero de 2 cifras que se pueden formar con los
dgitos 1, 3, 5 y 7?
2. Cul es la probabilidad de elegir un nmero de 3 cifras existen en el sistema de base seis?
3. De un grupo de 5 estudiantes, cul es la probabilidad de elegir un grupo de tres alumnos
podran formarse.
4. Cul es la probabilidad de elegir un viaje de A a D sin retroceder?

5. Dos personas A y B se distribuyen al azar en tres oficinas numeradas con 1,2, y 3


respectivamente, pudiendo estar ambos en una misma oficina. Cul es la probabilidad que
a) La oficina se quede vaca? b) Dos oficinas se queden vacas?

6. En una compaa hay 6 varones y 4 damas que aspiran ser miembros de un comit. Si se
deben escoger 2 al azar escribiendo los nombres en hojas de papel y sacndolos de una

86
urna. Cul es la probabilidad que los dos sean hombres? Cul que sean un hombre y una
mujer o dos mujeres?
7. De 20 personas que contrajeron cierta enfermedad al mismo tiempo y que fueron llevados a
una misma sala de un hospital, 15 se recuperan completamente en 3 das; al cabo del cual,
se escogen aleatoriamente 5 personas para un chequeo. Cul es la probabilidad que los 5
sean dados de alta?
8. Cul es la probabilidad que exactamente 4 sean dados de alta?
9. Cul es la probabilidad que ninguno sea dado de alta?
10. Diez libros se colocan aleatoriamente en un estante. Determinar la probabilidad que
tres libros determinados, sean colocados juntos.

CAPTULO VI

Teoremas de las probabilidades

87
6.1. Propiedades Generales de las Probabilidades:
Antes de conocer los teoremas de las probabilidades, es importante tener en cuenta
las siguientes propiedades:
1) La probabilidad de un evento cualquiera A est comprendido entre
0 y 1, es decir:
0 P ( A) 1

n 0 0 nA n

n A
Demostracin: tenemos que y y se cumple que: ,
0 nA n
0 P( A) 1
n n n n
dividiendo entre : l.q.q.d.

P ( A) 0
2) , si A es un evento imposible.
A n A
0
Demostracin: si A es un evento imposible ,

P( A)
n A

0
P( A) 0
n n
l.q.q.d.

P ( A) 1
3) , si A es un evento seguro.
nA n
Demostracin: Si A=S

P ( A)
n A

n
P ( A) 1
n n
l.q.q.d.

88
S {w1 , w2 , w3 , wn}
4) Si , siendo cada uno de los sucesos igualmente
probables o posibles, entonces se tiene:
n

P({wi}) 1
i 1

A {w1 , w2 ,, wr}
Luego, si A es un evento de S, tal que
r
P( A) P({w1})
i 1

Observaciones Complementarias:
S {w1 , w2 , w3 , wn}
Si el espacio muestral S est formado por: , es decir un nmero

P i w i
finito de elementos, entonces la probabilidad a un resultado , est dada por

P i
P ({wI})
, tal que cumple:
P i
0 i 1,2,3, n
(1)
n n

Pi P({w }) 1
i 1 i 1
i

(2)

Luego, la suma de las probabilidades asignadas a los puntos o resultados del espacio

w , w , w , w
1 2 3 n
muestral es la unidad (teniendo en cuenta que estos resultados son
mutuamente excluyentes y colectivamente exhaustivos).

Nota: Son mutuamente excluyentes:

{w1} {w2} {w3} {wn}

Son colectivamente exhaustivas:

{w1} {w2} {wn} S

89
- La probabilidad de un evento A es la suma de las probabilidades asignadas
de los puntos muestrales permanentes al evento A; estos es:

P ( A) Pi P({w }); Pi P({w })


I I
i
wi A wi A

Ejemplo: Ocho amigos juegan boliche una vez a la semana. Este grupo est formado por 2
parejas de casados, 3 jvenes y una joven. Antes del juego cada uno pone 10 soles en una
bolsa, cuyo contenido ser ganado por el que obtenga mayor puntaje. Si las mujeres tienen
la mitad de la habilidad que los varones poseen para el juego. Cul es la probabilidad de
que un soltero gane?, Cul es probabilidad de que gane una mujer?, Cul es la
probabilidad de que gane un hombre casado?

Solucin: el espacio muestral est formado por: 5 hombres que tienen igual habilidad,
siendo P la probabilidad de que gane un hombre.

3 mujeres que tiene la mitad de la habilidad de los hombres, entonces la probabilidad de


que gane una mujer es P/2.

P
5( P) 3 1 P 2 13
2 P 2 1 13.
Luego se tiene: y

a) Sea A, el evento gane un hombre soltero, A tiene 3 elementos, y stos


tiene igual habilidad:
P ( A) 3( P ) 3(2 13) P ( A) 6 13.

b) Sea B, el evento gane una mujer, B tiene 3 elementos, con igual habilidad:
P( B) 3( P 2) 3(1 13) P ( B) 3 13.

c) Sea C, el evento gane un hombre casado, C tiene 2 elementos con igual habilidad:
P(C ) 2( P) 2(2 13) P(C ) 4 13.

6.2. Axiomas y Teoremas de Probabilidad:

6.2.1. Axiomas:
Axioma 1.
Cualquiera que sea el suceso S, P [S] 0.

90
Axioma 2.
Si dos sucesos son incompatibles, la probabilidad de su unin es igual a la suma de sus
probabilidades:

Si: A B = P [AB ] = P [A ] + P [B ]

Axioma 3.
La probabilidad total es 1: P [E ] = 1

6.2.2. Teoremas Bsicos:


Teorema 1
Si A es un suceso y A' es su contrario, P [
A' ] = 1 P [ A]
Teorema 2:
La probabilidad del suceso vaco o suceso
imposible es P [ ] = 0.
Teorema 3:
Si dos sucesos A y B son tales que A CB ,
entonces P [ B ] = P [ A] + P [ B A].
Teorema 4:
Si dos sucesos A y B son tales que A B , entonces P [ A] P [ B ]
Teorema 5:
Dados dos sucesos cualesquiera A y B,
P [ A U B ] = P [ A ] + P [ B ] P [ A B ].

6.2.3. Teorema de la probabilidad condicional


Sean A y B dos sucesos, tales que P(A)>0. Denotamos la probabilidad de B dado
que A ha ocurrido.

Puesto que A ha ocurrido, se convierte en el nuevo espacio muestral reemplazando el


original .

Por lo tanto llegamos a la siguiente definicin:

P( A B) n( A B)
P(B|A)= P( A) = N ( A) =
nmero de casos favorables en que ocurre A B
nmero de casos favorables en que ocurre A

6.2.4. Teorema de Bayes

91
El teorema de Bayes, enunciado por Thomas Bayes, en la teora de la
probabilidad, es el resultado que da la distribucin de probabilidad condicional de un
evento aleatorio A dado B en trminos de la distribucin de probabilidad condicional del
evento B dado A y la distribucin de probabilidad marginal de slo A.

Sea {A1,A2,...,Ai,...,An} un conjunto de sucesos mutuamente excluyentes y exhaustivos, y


tales que la probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso
cualquiera del que se conocen las probabilidades condicionales P(B | Ai). Entonces, la
probabilidad P(Ai | B) viene dada por la expresin:

dnde:
P(Ai) son las probabilidades a priori.
P(B | Ai) es la probabilidad de B en la hiptesis Ai.
P(Ai | B) son las probabilidades a posteriori.
Esto se cumple
El Teorema de BAYES se apoya en el proceso inverso al del Teorema de la Probabilidad
Total:

Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad


de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que
ocurra un accidente).

Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente)


deducimos las probabilidades del suceso A (estaba lloviendo o haca buen tiempo?).

La frmula del Teorema de Bayes es:

Tratar de explicar estar frmula con palabras es un galimatas, as que vamos a intentar
explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que
este teorema tambin exige que el suceso A forme un sistema completo.

92
Ejemplo.

El parte meteorolgico ha anunciado tres posibilidades para el fin de semana:


a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%

Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un


accidente es la siguiente:
a) Si llueve: probabilidad de accidente del 20%.
b) Si nieva: probabilidad de accidente del 10%

Resulta que efectivamente ocurre un accidente y como no estbamos en la ciudad no


sabemos qu tiempo hizo (llovi, nev o hubo niebla). El teorema de Bayes nos permite
calcular estas probabilidades:

Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se


denominan "probabilidades a priori" (lluvia con el 50%, nieve con el 30% y niebla con el
20%).

Una vez que incorporamos la informacin de que ha ocurrido un accidente, las


probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se
denominan "probabilidades a posteriori".

Aplicacin de la frmula:

a) Probabilidad de que estuviera lloviendo:

La probabilidad expresada en porcentaje, de que efectivamente estuviera lloviendo el da


del accidente (probabilidad a posteriori) es del 71,4%.

b) Probabilidad de que estuviera nevando:

La probabilidad expresada en porcentaje de que estuviera nevando es del 21,4%.

93
PROBLEMAS PROPUESTOS

1. La siguiente tabla muestra la distribucin de 400 personas segn hbito de fumar y


presencia de bronquitis.

Hbito de Bronquitis
Total
Fumar SI NO
Fuma 140 110 250
No fuma 50 100 150
Total 190 210 400

Si se elige una persona al azar Cul es la probabilidad de que:


i) Fume y tenga bronquitis
ii) No fume dado de que tiene bronquitis
iii) No tenga bronquitis dado que fuma
iv) No fume o tenga bronquitis.
v) Los sucesos "Fumar" y "Tener bronquitis" son independientes?

2. Una compaa dedicada al transporte pblico explota tres lneas de una ciudad, de forma
que el 60% de los autobuses cubre el servicio de la primera lnea, el 30% cubre la segunda
y el 10% cubre el servicio de la tercera lnea. Se sabe que la probabilidad de que,
diariamente, un autobs se avere es del 2%, 4% y 1%, respectivamente, para cada lnea.
Determina la probabilidad de que, en un da, un autobs sufra una avera.

3. Se lanzan dos dados:


Cul es la probabilidad de obtener una suma de puntos igual a 7?
Si la suma de puntos ha sido 7, cul es la probabilidad de que en alguno de los dados haya
salido un tres?

4. Se lanzan dos dados equilibrados con seis caras marcadas con los nmeros del 1 al 6. Se
pide:
Halla la probabilidad de que la suma de los valores que aparecen en la cara superior sea
mltiplo de tres.
Cul es la probabilidad de que los valores obtenidos difieran en una cantidad mayor de
dos?

5. Describe el espacio muestral asociado a cada uno de los siguientes experimentos aleatorios.
Lanzar tres monedas:
Lanzar tres dados y anotar la suma de los puntos obtenidos. Extraccin de dos bolas de una
urna que contiene cuatro bolas blancas y tres negras.

94
6. Supongamos que en un examen para detectar cncer, el 90% de quienes tienen cncer y el
5% de los que no tienen cncer muestran una reaccin positiva. Se sabe que en un hospital
el 1% de los pacientes tiene cncer. Si un paciente es elegido al azar del hospital y tiene una
reaccin positiva en este examen Cul ser la probabilidad de que tenga realmente cncer?

7. En un laboratorio las mquinas A, B y C fabrican el 25, 15 y 60 por ciento del total de los
remedios, respectivamente. De lo que producen el 2, 4 y 6 por ciento respectivamente no
cumplen las normas. Si escogemos un remedio al azar de la produccin y no cumple las
normas. Cul mquina cree Ud. es ms probable que lo haya fabricado?

8. Se extrae una bola de una urna que contiene 4 bolas rojas, 5 blancas y 6 negras, cul es la
probabilidad de que la bola sea roja o blanca? Cul es la probabilidad de que no sea
blanca?

9. .En un centro escolar los alumnos pueden optar por cursar como lengua extranjera ingls o
francs. En un determinado curso, el 90% de los alumnos estudia ingls y el resto francs.
El 30% de los que estudian ingls son chicos y de los que estudian francs son chicos el
40%. El elegido un alumno al azar, cul es la probabilidad de que sea chica?

10. En cierta encuesta se listaron como sigue los resultados sobre el uso de ropa para dormir
mientras se viaja:
Gnero
Uso de ropa Hombre Mujer
Ropa interior 0,22 0,024
Camisn 0,002 0,18
Nada 0,16 0,018
Pijamas 0,102 0,073
Camiseta 0,046 0,088
Otros 0,084 0,003
a) Cul es la probabilidad de que un viajero sea hombre?
b) Cul es la probabilidad de que un viajero sea hombre si duerme en pijama o en
camiseta?

95
CAPTULO VII

Distribuciones Probabilsticas

Funciones de distribuciones de probabilidades discretas y continuas


A. Funcin de distribucin de probabilidades de una variable aleatoria discreta. Es una
lista de los valores de la variable aleatoria y sus respectivas probabilidades, donde cada
probabilidad toma valores entre 0 y 1 y adems la suma de las probabilidades de todos los
valores de la variable es igual a 1.

96
Ejemplo. La variable aleatoria X, nmero de veces que se interrumpe la electricidad en una
ciudad por mes, tiene la siguiente funcin de distribucin de probabilidades.

X f(x) =
probabilidad
1 0.35
2 0.30
3 0.20
4 0.10
5 0.05

B. Funcin de distribucin de probabilidades de una variable aleatoria continua. Es una


funcin f(x) no negativa con


f(x)dx 1

Ejemplo el tiempo. La variable aleatoria X, peso neto en libras de un herbicida qumico


empacado es

2.0, si 49.75 x 50.25


f(x)
0, si x 49.75 o si x 50.25

Note que f(x) es no negativo (valores mayores o iguales a cero) y que


50.25
f(x)dx 2dx 2x 2(50.25) 2(49.75) 1
(50.25)
(49.75)
49.75
.

C. Esperanza matemtica de una variable aleatoria discreta o media de la poblacin:



. Es un concepto matemtico y se define como sigue

E X xf(x)
x

En el ejemplo de funcin de distribucin de probabilidades continua tenemos que

97
5
E X xf(x) xf(x) 1(0.35) 2(0.30) 3(0.20) 4(0.10) 5(0.05) 2.2
x i 1


D. Esperanza matemtica de una variable aleatoria continua: . Se define

E X xf(x)dx

En el ejemplo de esperanza matemtica o media de una poblacin continua se tiene


50.25
2x 2
E X xf(x)dx x(2)dx
50.25
(50.25) 2 (49.75) 2 50
49.75 2 ( 49.75)

2
E. Varianza de una variable aleatoria discreta: . Se define como sigue

2 Var X E X x - f(x)
2 2

Calcularemos la varianza de la variable aleatoria X del ejemplo del caso discreto


5
2 Var X E X x - f(x) x 2.2 (2)
2 2 2

x i 1

(1 2.2) (0.35) (2 2.2) 2 (0.30) (3 2.2) 2 (0.20) (4 2.2) 2 (0.10) (5 2.2) 2 (0.05)
2

1.6

2
F. Varianza de una variable aleatoria continua . Se define de la siguiente manera

2 Var X E X x - f(x)dx
2 2

En el ejemplo del caso continuo tenemos


50.25
x3
Var X x - f(x)dx x - 50 (2)dx 2 x - 50 dx 2
2 50.25 2 50.25 2
2
49.75 49.75 3 49.75


2
3

(50.25) 3 (49.75) 3 0.0208

98
Distribuciones probabilsticas

7.1. Distribucin Binomial


Introduccin

En las empresas tenemos muchas situaciones donde se espera que ocurra o no un evento
especfico. ste puede ser de xito o fracaso sin dar paso a un punto medio. Por ejemplo,
en la produccin de un artculo, ste puede salir bueno o malo. Casi bueno no es un
resultado de inters. Para situaciones como stas se utiliza la distribucin binomial.

Describiremos el uso de la distribucin binomial para obtener la probabilidad de ocurrencia


de ese evento que representa un resultado esperado.

Utilidad:

La distribucin binomial se utiliza en situaciones cuya solucin tiene dos posibles


resultados.

Por ejemplo:

-Al nacer un beb puede ser hombre o mujer

-En el deporte un equipo puede ganar o perder.

-En pruebas de cierto o falso slo hay dos alternativas.

-Un tratamiento mdico puede ser efectivo o inefectivo.

-La meta de produccin o ventas del mes se pueden o no lograr.

-En pruebas de seleccin mltiple, aunque hay cuatro o cinco alternativas, se puede
clasificar como correcta o incorrecta.

99
La distribucin de probabilidad binomial es un ejemplo de distribucin de probabilidad
discreta. Est formada por una serie de experimentos de Bernoulli. Los resultados de cada
experimento son mutuamente excluyentes. Para construirla necesitamos:

1) la cantidad de pruebas n

2) la probabilidad de xitos p

3) utilizar la funcin matemtica.

A continuacin vemos La funcin de probabilidad de la distribucin Binomial.

P X x Cxn p x q n x
n!
P X x . p x .(1 p) n x
n x !x!

x : es el nmero de aciertos. p: es la probabilidad de xito n: es el nmero de


experimentos. 1-p q: es la probabilidad de fracaso

Medidas de resumen de la distribucin binomial:

a) Valor esperado o media aritmtica

E ( X ) np

b) Varianza

100
2
V ( X )= =npq

c) Desviacin estndar

npq

Ejemplo 1
Un comerciante tiene conocimiento de que el 12% de los artculos del lote recibido estn
defectuosos. Si un comprador elige 4 artculos, encuentre la probabilidad de que.
a) los 4 estn defectuosos.
4 4 0
P ( x=4 )=C 4 ( 0.12 ) ( 0.88 ) =0.0002074

b) de 1 a 3 estn defectuosos.
4 1 3 4 2 2 4 3 1
P ( 1 x 3 )=C 1 ( 0.12 ) ( 0.88 ) +C2 ( 0.12 ) ( 0.88 ) +C3 ( 0.12 ) ( 0.88 ) =0.4009728

Ejemplo 2
En pruebas realizadas a un amortiguador para automvil se encontr que el 20%
presentaban fuga de aceite. Si se instalan 8 de estos amortiguadores, hallar la probabilidad
de que,
a) 4 salgan defectuosos
P ( x=4 )=C 84 ( 0.2 )4 ( 0.8 )4 =0.05

b) ms de 5 tengan fuga de aceite.


8 6 2 8 7 4 8 8 0
P ( x >5 ) =C6 ( 0.2 ) ( 0.8 ) +C7 ( 0.2 ) ( 0.8 ) +C 8 ( 0.2 ) ( 0.8 ) =0.00123136

c) de 3 a 5 amortiguadores salgan defectuosos.


8 3 5 8 4 4 8 5 3
P ( 3 x 5 ) =C3 ( 0.2 ) ( 0.8 ) + C 4 ( 0.2 ) ( 0.8 ) +C 5 ( 0.2 ) ( 0.8 ) =0,20185088

d) Determine el promedio y la desviacin estndar de amortiguadores con defectos.


E ( x )=np=8( 0.20 )=1,6 2

101
Ejemplo 3
Un ingeniero que labora en el departamento de control de calidad de una empresa elctrica,
inspecciona una muestra al azar de 20 alternadores de un lote. Si el 10% de los
alternadores del lote estn defectuosos. Cul es la probabilidad de que en la muestra,
a) Ninguno este defectuoso
20 0 20
P ( x=0 )=C 0 ( 0.1 ) ( 0.9 ) =0,12157665

b) uno salga defectuoso,


P ( x=1 )=C20 1 19
1 ( 0.1 ) ( 0.9 ) =0,27017034

c) A lo ms dos salgan defectuosos

20 0 20 20 1 19 20 2 18
P ( x 2 ) =C0 ( 0.1 ) ( 0.9 ) +C 1 ( 0.1 ) ( 0.9 ) + C2 ( 0.1 ) ( 0.9 ) =0,67692681

d) ms de tres estn con defectos


P ( x >3 ) =1P ( x 3 )

1P [ C 20
0 ( 0.1 ) ( 0.9 ) +C 1 ( 0.1 ) ( 0.9 ) +C2 ( 0.1 ) ( 0.9 ) +C 3 ( 0.1 ) ( 0.9 ) ]
0 20 20 1 19 20 2 18 20 3 17

P ( x> 3 )=0,13295332

7.2. Distribucin Hipergeomtrica


Introduccion
La distribucin hipergeomtrica al igual que la distribucin binomial se aplica en
situaciones donde se espera que ocurra o no un evento especfico, la diferencia es que en la
distribucin binomial, cada producto es extrado con reemplazo y todos los intentos son
independientes, en cambio en la distribucin hipergeomtrica cada muestra es extrada sin
reemplazo y los intentos son dependientes.

Utilidad:

La distribucin hipergeomtrica es especialmente til en todos aquellos casos en los que se


extraigan muestras o se realizan experiencias repetidas sin devolucin del elemento
extrado o sin retornar a la situacin experimental inicial.

Por ejemplo:

-Se quiere seleccionar 2 hombres de 17 personas de las cuales hay slo 7 hombres

102
-En la agro industria se tiene 8 terneros de los cuales hay 3 enfermos, se quiere
seleccionar 2 para la venta.

- Se tiene 22 empleados de los cuales 12 tienen estudios tcnicos, se requiere 5 de ellos.

Este modelo presenta similitudes con el Binomial, pero sin la suposicin de independencia
de ste ltimo, la dependencia se debe al hecho de que N es finito y las extracciones se
efectan sin reemplazamiento

Se requiere los siguientes elementos:

1) la cantidad de pruebas N

2) n de elementos en la poblacin original que pertenecen a la categora deseada d

3) tamao de muestra extrada n


4) n de elementos en la muestra que pertenecen a la categora deseada x

5) utilizar la funcin matemtica.

Medidas de resumen de la distribucin binomial:

a) Valor esperado o media aritmtica

103
E (X) = n*d/N

b) Varianza

V(X) = n*p*q (N-n)/(N-1)

c) Desviacin estndar

= npq( Nn)/(N 1)

Ejemplo 1
En una empresa industrial diariamente se producen 14 unidades de metalmecnica, de las
cuales generalmente 5 salen defectuosas. Se examina en un da cualquiera una muestra de 4
unidades. Hallar la probabilidad de:

a) 2 unidades sean defectuosas.


5 145
P ( x=2 )=
( )( )
2 52
=0,8392
14
4( )
b) Las 4 sean defectuosas.
Tenemos
N= 14 d= 5 n= 4 x= 2

5 145
( x=4 )=
( 4 )( 54 )
P = 0.0449
(144)

Ejemplo 2

104
Entre los 12 colectores solares en exhibicin en una feria comercial 9 son planos y los otros
3 son curvos. Si una persona que visita la feria selecciona aleatoriamente 3 colectores para
probarlos y luego comprarlos, cul es la probabilidad de que:
a) los 3 sean colectores planos?
b) los 3 sean colectores curvos?

Solucin:
9 3

3 0
12

3
a) P(x=3) = = 0,3818
9 3

0 3
12

3
b) P(x=0) = = 0,004545

Ejemplo N 3:
Un fabricante de tractores compra motores de una compaa, bajo una condicin, acepta un
lote de 40 motores si de una muestra de 8 motores ninguno presenta defectos. Cul es la
probabilidad de aceptar un lote que en realidad tiene 2 motores con defectos?
2 38

0 8
40

8
P(x=0) = = 0,6359

7.3. Distribucin de Poisson


Introduccin
Llamada as en honor al probabilista francs Simen Denis Poisson. Aqu interesa contar el
nmero de veces que un determinado suceso ocurre en un periodo de tiempo determinado
Es un proceso de tiempo continuo que consiste en "contar" eventos raros (de ah el nombre
"sucesos raros") que ocurren a lo largo del tiempo.

Utilidad
Su utilidad se da en general en los problemas llamados lneas de espera, teora de colas o
similares.

105
Ejemplo
- N de leucocitos en una gota de sangre
- N de veces que una planta de energa nuclear emite gases radiactivos en un periodo
de tres meses
- Nmero de bacterias nocivas por cada cm3 de agua.
- Nmero de personas que llegan a una posta mdica para ser atendidos
- Nmero de aviones que llegan a un aeropuerto durante el da.

Es una distribucin de v.a. discreta en la que la variable representa al nmero de xitos en


el intervalo de tiempo o espacio, estos eventos son continuos e independientes, lo que
significa que el nmero de xitos que ocurren en un intervalo de tiempo dado o espacio son
independientes, de los que ocurren en cualquier otro intervalo, pero se supone que la tasa de
xitos por unidad de tiempo o espacio permanece constante, esta tasa lo representaremos
por .
Elementos:
1) Nmero promedio de ocurrencias por unidad de tiempo o espacio
2) Nmero de eventos de Poisson en un intervalo de tiempo o en un espacio de tamao t es
igual a x
3) e = 2.7182
4) = n*p (n=tamao de muestra y p= probabilidad de xito)
5) utilizar la funcin matemtica

Medidas de resumen de la distribucin de Poisson:

e x
x!
P(x) = x: 0, 1, 2, 3,..
Donde e = 2,71828.
E(x) = =
2
V(x) = =

La aproximacin de una v.a del tipo binomial a una del tipo Poisson, es muy buena si n
100 y p 0,05

Ejemplo 1:
Se sabe que el nmero promedio de camiones que llegan a un terminal terrestre durante el
da es de 10, las instalaciones del terminal pueden atender como mximo 15 camiones al
da. Cul es la probabilidad de que la capacidad de atencin del terminal sea superado en
un da cualquiera?
Solucin:
X = nmero de camiones que llegan al terminal terrestre durante el da para ser atendidos.

106
X= 0, 1, 2, 3,..
P(x > 15) = 1 P(x 15)

15
e 10 10 x

x 0 x!
=1- = 1 - 0,9513 = 0,0487
Ejemplo 2:
En cierto proceso de fabricacin en el que se producen artculos de porcelana ocurren
defectos que ocasionan problemas en las ventas, el fabricante asegura que en promedio uno
de cada 1000 artculos producidos es defectuoso. Cul es la probabilidad de que en una
caja de 3000 artculos haya:
a) exactamente 3 artculos con defectos?
b) al menos un artculo con defectos?

Solucin:
a) X: nmero de artculos defectuosos en la muestra.
= np = 3000(1/1000) = 3
e 3 33
3!
P(x=3) = = 0,224042

Si se hubiera usado la distribucin binomial, se tendra:


3000
0,001)( 0,999) 2997
3
P(x=3) = = 0,224154
Nuevamente la diferencia es bastante pequea.
b) P(x 1) = 1 - P(x=0) = 1 1/e3 = 1 0,049787 = 0,950213

Ejemplo 3:
El nmero de clientes que llegan a un banco es en promedio 60 por hora, cul es la
probabilidad de que lleguen 2 clientes en:
a) un minuto?
b) dos minutos?
Solucin:
a) = 60(1/60) = 1
e 1 12
1 / 2e 0,1839
2!
P(x=2) =
b) = 120(1/60) = 2
P(x=2) = e-222/2! = 2/e2 = 0,27067

107
7.4. Distribucin Normal
Introduccin
Llamada tambin distribucin gaussiana, es la distribucin de v.a. continua ms importante
y la de mayor uso, es la distribucin modelo y sirve de aproximacin para las dems
distribuciones, asimismo de acuerdo a la ley de los grandes nmeros muchas estadsticas
muestrales tienen distribucin normal. Su grfica se llama curva normal, es una curva
simtrica en forma de campana, o acampanada que se extiende sin lmites en ambos
sentidos sobre la recta real o eje de las X (abscisas en el eje cartesiano). sin embargo, hay
que tener mucho cuidado para usarlo sin previa comprobacin, pues las consecuencias
pueden ser impredecibles. Ejemplo si se disea cierto material para resistir una cantidad
dada de presin que se supone se distribuye normalmente alrededor del valor promedio y el
diseo se hace con esta suposicin, el material puede verse seriamente daado al
aplacrsele una presin elevada pero dentro de los lmites permisibles. Ha sido estudiado
por muchos matemticos como La Place, De Moivre, Gauss, etc. (Walpole,1998)

Utilidad
Se utiliza en muchos fenmenos que ocurren en la naturaleza, en la industria y en cualquier
campo, tales como: la temperatura del medio ambiente, la precipitacin pluvial, las
mediciones de magnitudes fsicas, el peso y la talla de las personas, etc.

Ejemplos
Consumo de cierto producto por un mismo grupo de individuos,
Cociente intelectual, grado de adaptacin a un medio
Efecto de una misma dosis de un frmaco, o de una misma cantidad de abono

Propiedades
1.- Sus puntos de inflexin son: - y + , por lo tanto es cncava hacia abajo en el
intervalo - < x < + ,
2.- La media y la Varianza de la distribucin son: y 2 respectivamente, y que son los
parmetros de la distribucin.
3.- Las reas comprendidas bajo la curva normal son:
, corresponde al 68,26% del rea total.
2, corresponde al 95,44% del rea total.
3, corresponde al 99,74% del rea total.
4.- A cualquier v.a que tiene distribucin normal con media y varianza 2, se le representa
por: N(, 2)

Definicin:

108
Se dice que una variable aleatoria continua X, tiene una distribucin normal, si su funcin
de densidad est dada por:
1 1 x 2
exp ( )
2 2
F (x) = -<x< Donde: - < < y > 0

Clculo Directo. Si Z N (0,1), Hallar.

a) P(Z1.60)
0.945
Segn la Tabla de la Distribucin Normal 2
Para Z1.60 P=0.9452

1.60
b) P(Z1.30)
Segn la Tabla de la Distribucin Normal
0.903
Para Z1.30 P=0.9032 2

1.30

c) P(Z-2.36)
Segn la Tabla de la Distribucin Normal
0.003
Para
9
Z-2.36 = 1-
Z2.36 P=1-
0.9961=0.0039
Z-2.36 = 0.0039

-2.36

d) P(-2.00Z2.00)
Segn la Tabla de la Distribucin Normal
Para -2.00Z2.00 = Z2.00- Z-2.00 P=0.9772-(1-0.9772)=0.9772-0.0228=0.9544
-2.00 Z2.00 = 0.9544

0.954
4

109
- 2.00
2.00
e) P(-2.50Z2.50)
Segn la Tabla de la Distribucin Normal
Para -2.50Z2.50 = Z2.50- Z-2.50 P=0.9938-(1-0.9938)=0.9938-0.0062=0.9876
-2.50 Z2.50 = 0.9876

0.987
6

- 2.50
2.50
Aplicaciones
1. Los tiempos de atencin al cliente en minutos en una entidad financiera BCP tienen
distribucin normal con medios 10 minutos y desviacin estndar de 0.6 minutos, hallar:

a) La probabilidad de que el tiempo de atencin sea menor a 11 minutos.


P [ X< 11]
1110
P( Z< )
P(X < 11) = 0.6

P( Z < 1.67) = P( Z 1.67)


P( Z < 1.67) = 0.95254
P( Z < 1.67) = 0.95254
Como se tiene 10 clientes entonces el nmero de tiempo de atencin de 11 minutos est
dada por:
n1 = n X P [X 11]
n1 = n X P [Z 1.67]
n1 = 10 X 0.95254
n1 = 9.53 minutos

110
0.9522

10 11
X

0.9

0 1.282
X

b) El porcentaje de clientes con un tiempo de atencin mayor a 8 minutos. P [ X>8 ]


810
P( Z< )
P(X > 8) = 0.6

P(Z - 3.33) = 1 - P( Z -3.33 )


P( Z -3.33) = 1 - 0.000434
P( Z -3.33) = 0.999566

Como se tiene 10 clientes entonces el nmero de clientes porcentaje de 8 minutos est dada
por:
n1 = n XP [x> 8]
n1 = n X P [Z > - 3.33]
n1 = 10 X 0.00343
n1 = 3.43 de clientes

111
0.9996

8 10
X

c) Si en un da se atiende a 1500 clientes


c.1. Cuntos clientes son atendidos en menos de 10 minutos. P [X<10]

1010
P( Z< )
P(X < 10) = 0.6

P( X < 10) = P( Z< 0 )


P( X < 10) = 0.500000
P( X < 10) = 0.500000

Como se tiene 10 minutos entonces el nmero es de 10 clientes.


n1 = n x P [X<10]
n1=n x P [Z<0]
n1=1500 x 0.500000
n1 = 750 clientes

c.2. Cuntos clientes son atendidos en ms de 11 minutos. P[X > 11]


1110
P(Z> )
P(X >11) = 0.6

P( X > 11) = 1 - P( Z> 1.67 )


P( X > 11) = 1-0.952540
P( X > 11) = 0.04746

Como se tiene 10 minutos entonces el nmero es de 11 clientes.


n1 = n x P [X> 11]
n1=n x P [Z< 1.67]
n1=1500 x 0.952540
n1 = 1428.81 clientes

112
0.04779

10 11
X

2. Los salarios de los trabajadores en cierta industria son en promedio $ 11.9 por hora y la
desviacin estndar es de $ 0.4. Si los salarios tienen una distribucin normal. Cul es
la probabilidad de que un trabajador seleccionado al azar:
a) Reciba salarios inferiores a $ 11?
P [X 11]
P (X11) = 11 11.9/0.4
P (Z -2.25) = P (Z< -2.25)
P (Z -2.25) = 0.0122
n = n x P (x11)
n = n x P (Z -2.25)
n =11 x 0.0122
n = 0.1342
n =13.42 Dlares

0.01222
11 11.9
X

b) Cul debe ser el salario menor que gana un trabajador que se encuentra entre
el 10% de los trabajadores que ms ganan?
P [X X1] = 0.10
Estandarizando obtenemos:
P (-ZX) = 0.01
Interpolando obtenemos:

Z AREA
-1.29 0.985
-Z 0.10
-1.28 0.1003

113
0.1003 0.0985 = (-1.28) (1.29)
0.10 0.0985 -Z -(-1.29)
0.0018 = 0.01
0.015 -Z+1.29
Aplicando la regla de tres simple obtenemos lo siguiente:
Z= -1.28
X -
= 1.28

X - 11.9
= 1.28
0.4
X1 = 11.9 + 1.28 x 0.4
X1 = 11.9 + 0.512
X1 = 12.412 dlares

0.8997

11.9 12.412
X

3. La renta media de los habitantes de un pas es de 4 de ptas/ao, con una varianza de 1,5. Se
supone que se distribuye segn una distribucin normal. Calcular:

a) La renta mnima y mxima que engloba al 80% con renta media.


P[ X X1] = 0.80

Estandarizando obtenemos:

P[ZZ1]=0.80

Z1 Se encuentra en el rea de los positivos de la distribucin normal estndar, entonces


aplicamos la propiedad:

P [ZZ1]=1-P[ZZ1]=0.80
1-P [ZZ1]=0.80

114
P [Z<Z1]=0.20
Interpolando:
Z REA
-0.85 0.1977
Z 0.20
-0.84 0. 2005

0.2005 0.1977 -0.84 + 0.85


=
0.20 0.1977 Z+0.85

0.0028 0.01
=
0.0023 Z-0.85

Aplicando la regla de tres simple obtenemos: Z= -0.84

X1 = 4 + (-0.84 x 1.5)
X1 = 4 + 1.26
X1 = -2.74 renta mnima.

0.8

2.738 4
X

7.5. Distribucin de Probabilidad T-Student


Introduccin
En ocasiones es necesario inferir si dos muestras provienen de la misma poblacin, o nos
encontramos con la dificultad de no conocer la desviacin tpica poblacional y nuestra
muestra es menor de 30 datos, en estos casos aplicamos la distribucin t

Utilidad
1) Para determinar el intervalo de confianza dentro del cual se puede estimar la media de
una poblacin a partir de una muestra pequea(n<30)
2) Para probar hiptesis cuando una investigacin se basa en muestreo pequeo.

115
3) Para probar si dos muestras proviene de la misma poblacin.

Ejemplos
-Para probar que el promedio de calificaciones de un grupo de 12 estudiantes, es el mismo
del ao anterior.
- El efecto del consumo de nicotina de mujeres embarazada con el contenido mineral seo
de su hijo.

v
La funcin de densidad t es simtrica con respecto a cero, adems, para > 1, E( T ) =0 y
v v v
para > 2, V ( T ) = / ( - 2 ). As vemos que una variable aleatoria con una distribucin
t
tiene el mismo valor esperado que una variable normal estndar. Sin embargo, una
variable aleatoria normal estndar siempre tiene una varianza de 1, mientras que la varianza
t
de una variable aleatoria con una distribucin siempre es mayor que 1. (Montgomery,
1997)
2
Definicin: Sea Z una variable aleatoria normal estndar y sea una variable aleatoria ji -
cuadrada con grados de libertad.
Z 2
Entonces s y son independientes,
Z
T
2 /

se dice que tiene una distribucin t con grados de libertad.

Elementos

Grados de libertad, n-1

Significancia, = Alfa

Ejemplos:

1. Si T se distribuye mediante una t(20) hallar :


a) P[T 2.528] = 0.99

116
b) P [ -1.325 T 2.845]
P [T 2.845] P [T -1 .325]
0.995 0.1
P (T) = 0.895

7.6. Distribucin X2 Cuadrada


Introduccin
La distribucin ji-cuadrada (X2) es la distribucin muestral de varianza (s 2). O sea que si se
extraen todas las muestras posibles de una poblacin normal y a cada muestra se le calcula
su varianza, se obtendr la distribucin muestral de varianzas.
Utilidad
-Para poder estimar la varianza de una poblacin normal.
-La relacin entre el uso de un frmaco con la hipertensin de los pacientes
-La relacin entre la contaminacin del suelo y el crecimiento de cierta especie de rbol.
Propiedades de las distribuciones X2
a) Los valores de X2 son mayores o iguales que 0.
b) La forma de una distribucin X2 depende del gl=n-1. En consecuencia, hay un nmero
infinito de distribuciones X2.
c) El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.

Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer el


estadstico X2. Si se elige una muestra de tamao n de una poblacin normal con varianza
2, el estadstico:

El estadstico tiene distribucin Ji-Cuadrada con (n-1)g.l.

Elementos

117
Grados de libertad (n-1)
Nivel de significancia = alfa
Varianza muestral S2
Varianza poblacional 2

Ejemplos:
Suponga que los tiempos requeridos por un cierto autobs para alcanzar un de sus destinos
en una ciudad grande forman una distribucin normal con una desviacin estndar =1
minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la
varianza muestral sea mayor que 2.

Solucin:

Primero se encontrar el valor de ji-cuadrada correspondiente a s2=2 como sigue:

El valor de 32 se busca adentro de la tabla en el


rengln de 16 grados de libertad y se encuentra
que a este valor le corresponde un rea a la
derecha de 0.01. En consecuencia, el valor de la
probabilidad es P(s2>2)
Es una medida existente entre las frecuencias
observadas y esperadas Y es suministrada por el estadstico Tambin se utiliza para
decidir si ciertas variables son independientes.
Por ejemplo un encuestador podra desear saber si, el sexo, los antecedentes tnicos o el
rango salarial de una persona son factores relevantes en la votacin para una eleccin de
algn legislador.
La definicin formal de la distribucin es la siguiente:

Sean Z1, Z2,,Zk, k distribuciones normales estandar independientes.

Se denomina tambin la distribucin Chi- cuadrado con k grados de libertad. que puede ser
cualquier entero positivo incluyendo al 1 y est representado por df.

Si x se distribuye mediante una x2, hallar:

a) P [ X 40.00]
= 1- P [ X 40.00]
= 1 - 0.995
0.005

118
b) P [ 15.45 X 40.00]
P [ X 40.00] - P [ X 15.45]
0.995 - 0.25
0.745

7.7. Normal Estandarizada


Introduccin
La distribucin normal estndar est tabulada (habitualmente en la forma del valor de la
funcin de distribucin ) y las otras distribuciones normales pueden obtenerse como
transformaciones simples de la distribucin estndar. De este modo se pueden usar los
valores tabulados de la funcin de distribucin normal estndar para encontrar valores de la
funcin de distribucin de cualquier otra distribucin normal.
La estandarizacin es un proceso que consiste en restar a la v.a. su esperanza y luego dividir
esta diferencia entre la desviacin estndar (Raymond, 1998):
x E ( x)
V ( x)
z=

x
~ N (0,1)

z=

Por lo tanto:
x
)

E(z) = E( = E(x/) E(/) = E(x)/ - / = / - / = 0
x
)

V(z) = V( = V(x/) V(/) = V(x)/2 0 = 2/2 = 1
En consecuencia:
1 1
exp z 2
2 2
f(z)= -<z<

Las distribuciones normales son estrictamente estables.


Ejemplos:
Calcule las siguientes probabilidades:
a) P(z 1)
b) P(z > 2)
c) P(z < 1,5)

119
d) P( -2 < z < 1.75)
e) P(0,05 < z > 1,96)

Solucin:
a) P(z 1) = F(1) = 0,8413
b) P(z > 2) = 1 P(z 2) = 1 F(2) = 1 0,9772 = 0,0228
c) P(z > 1,5) = F(1,5) = 0,9332
d) P( -2 < z < 1.75) = F(1,75) F(-2) = 0,9599 0,0228 = 0,9371
e) P(0,05 < z > 1,96) = F(1,96) F(0,05) = 0,975 0,5199 = 0,4551

Nota.- la tabla usa valores de z con dos decimales como mximo, por lo que se debe
redondear los valores de z originales a dos decimales.

Ejemplos Prcticos:

Ejemplo 1:
El tiempo requerido para ensamblar una pieza mecnica es una v.a. cuya distribucin es
normal con media igual a 12,9 mn. y = 2 minutos, cul es la probabilidad de que una
pieza sea ensamblada en:
a) en menos de 11,5 mn.?
b) entre 11 y 14,8 mn.?
c) en ms de 11,8 mn.?
d) exactamente 11 mn.?

Solucin:
a) P(x < 11,5) = P ( z < z1) = P(z < - 0,7) = 0,2420
11,5 12,9
2
Donde z1 = = -0.7
b) P (11 < x < 14, 8) = P (z2 < z < z3)= P(-0,95 < z < 0,95)
11 12,9 14,8 12,9
0,95 0,95
2 2
Dnde: z2 = z3 =
P (-0,95 < z < 0,95) = 0,8289 0,1711 = 0,6578

c) P(x > 11,8) = P(z > z4) = P(z > -0,55) = 1 F(-0,55) = 1- 0,7088

120
11,8 12,9
055
2
Donde z4 =
P(z > -0,55) = 1 F(-0,55) = 1- 0,2912 = 0,7088

d) P(x=11) = 0, sin embargo es factible estimar la probabilidad entre 110,5, es decir P(10,5
x 11,5) = P(z1 z z2)
10,5 12,9 11,5 12,9
1,2 0,7
2 2
Dnde: z1 = z2 =
P(-1,2 z - 0,7) = P(0,7 z 1,2) = 0,88493 0,75804 = 0, 12689

Como puede apreciar esta probabilidad es alta, por lo que la recomendacin es cuando los
valores sean bastante altos y no pequeos como lo que se tiene. O cuando se usa variables
discretas.

Ejemplo 2:

Un embarque de 2500 aros son enviados a una ensambladora con las especificaciones que
los dimetros de los aros deben estar en el intervalo 0,3 0,005 pulgadas. Si los dimetros
internos de los aros tienen una distribucin normal con media 0,302 pulg. Y una = 0,003
pulg.Qu porcentaje de aros cumplirn las especificaciones?
Solucin:
P(0,295 < x < 0,305) = P(z1 < z < z2) = P(-2,33 < z < 1,00)
0,295 0,302 0,305 0302
1,00
0,003 0,003
Donde. z1 = = - 2,33 z2 =
P(-2,33 < z < 1,00) = F(1,00) - F(-2,33) = 0,8413 0,0099 =0,8314
En conclusin el 83,14% de los aros cumplen con las especificaciones, en tanto que el
16,86% no los cumple, en consecuencia 2500(0,1686) = 421,5 = 422 aros

Ejemplo 3:

Los hornos elctricos fabricados por una compaa tienen una duracin promedio de 15000
hrs. Y una = 2500 hrs.
a) si el fabricante promete reponer todo horno que falle antes de las 7500 hrs., qu
proporcin de sus hornos tendr que reponer?
b) si da como tiempo de garanta de 8500 hrs., qu proporcin de los hornos tendr
reponer?

121
c) si slo quiere reponer mximo el 1% de sus hornos, qu tiempo de garanta tendr que
dar?
Solucin:
a) P(x 7500) = P(z z1)
7500 1500
3
2500
Donde z1 =
P(z -3) = F(-3) = 0,0013 0,13% de sus hornos

b) P(x 8500) = P(z z2)


8500 1500
2,6
2500
Donde z1 =
P(z -2,6) = F(-2,6) = 0,0047 0,4,7% de sus hornos

c) P(x < x0) = P(z < z0) = 0,01 z0 = -2,3267


x 0 1500
2500
Donde -2,3267 = x0 = 9183,25 hrs.
Nota.- En lo sucesivo en lugar de z = 2,3267 se usar z = 2,33

PROBLEMAS PROPUESTOS

122
1.- En una fbrica hay 12 mquinas. Cada una de ellas est averiada un da de cada 10,
cul es la probabilidad de que en un determinado da haya ms de tres mquinas
averiadas?

2.- De una poblacin de conservas se sabe que el 60% son buenos. Si se extrae un
conjunto de 10 de ellos, cul es la probabilidad de que en ese conjunto haya 7
defectuosos?

3..- Un mdico ha obsevado que el 13% de sus pacientes sufre de efectos negativos cuando
le administran cierto frmaco, a un grupo de 5 pacientes le recet ste medicamento y
desea saber la siguiente probabilidad.
a) Que ninguno de ellos tenga efectos negativos
b) Uno o ms tengan los efectos nosivos.
c) Un paciente tenga efectos nosivos

4.- De cada 2000 tornillos fabricados por una determinada mquina hay 2 defectuosos. Para
realizar el control de calidad se observan 150 tornillos y se rechaza el lote si el nmero de
defectuosos es mayor que 1. Calcular la probabilidad de que el lote sea rechazado?

5.- En un taller se averan una media de 2 mquinas a la semana. Calcula la probabilidad de


que no haya ninguna avera en una semana. Y de que haya menos de 6 en un mes?

6.- El nmero medio de llamadas telefnicas que se reciben en una central en cada minuto
es de 2, determnese la probabilidad que se reciban ms de 5 llamadas.

7.- Los avistamientos de Anchoveta sigue una distribucin de Poisson de media 2


avistamientos en un transecto de muestreo de 1km de recorrido tras una salida en barco.
Calcular la probabilidad de:
a.. No haya ningn avistamiento en el recorrido del barco:
b.. Haya menos de cinco en el mismo recorrido:
c.. Y menos de seis si consideramos un recorrido de 5km

8.- La concertista de piano Donna Prima est muy molesta por el nmero de tosidos que se
presentan en la audiencia justo antes de que empiece a tocar. Durante su ltima gira Donna
estim un promedio de 8 tosidos justo antes de empezar su concierto. La seora Prima le ha
advertido a su diretor que si escucha mas de cinco tosidos en el concierto de esa noche, se
rehusar a tocar. cul ser la probabilidad de la artista toque esa noche?

9.- Se tiene un programa de entrenamiento diseado para mejorar la calidad de las


habilidades de los supervisores de lnea de produccin. Debido a que el programa es
autoadministrado, los supervisores requieren un nmero diferente de horas para terminarlo.

123
Un estudio anterior revela que el tiempo medio para completar el programa es de 500 horas,
y que esta variable aleatoria normalmente distribuida tiene una desviacin estndar de 100
horas.
a.-Cul es la probabilidad de que un participante elegido al azar requiera mas de 500 horas
para completar e programa.
b.- Cul es la probabilidad de que un participante elegido al azar se tome entre 500 y 650
horas para completar e programa.

10.- El coeficiente de inteligencia se distribuye en la poblacin segn la ley normal con


media =100 y = 15. qu procntaje de individuos de la pblacin tendr un CI
superior a 120?.

11.- Supngase que la longitud de un ptalo de una poblacin de plantas de cierta especie,
se distribuye normalmente con una media = 3.2 cm. Y = 1.8 , Qu proporcon de la
pobacin se espera que tenga un ptalo de longitud:
a) Mayor que 4.5 cm.
b) Mayor que 1-78 cm.
c) entre 2.9 y 3.6 cm.

124
CAPTULO VIII

Muestreo

Tamao de Muestra

8.1. Tamao de Muestras

125
Para determinar un tamao de muestra es necesario identificar los siguientes componentes o
elementos:

1) La varianza (2): corresponde al grado de variabilidad que presentan las unidades de la


poblacin. Mientras ms grande sea 2 mayor ser el tamao de la muestra. El valor de 2x
supuestamente conocido, de lo contrario se debe estimar a travs de una investigacin
preliminar. En el caso de 2p = PQ, sucede algo similar, pero se tiene la costumbre de tomar
P= 0,50 con lo cual se obtiene el mximo valor posible de n.

2) Nivel de confianza: Tiene relacin directa con el tamao de la muestra, por lo tanto se dir
que a mayor nivel de confianza ms grande debe ser el tamao de la muestra. Los valores
de Z se obtienen mediante el uso de tablas como se ha venido haciendo. El nivel de
significacin es fijado por el investigador, de acuerdo a su experiencia.

3) Precisin de la estimacin: Corresponde al margen de error que el investigador fija de


acuerdo con el conocimiento que tenga acerca del parmetro que piensa estimar. Se le
conoce como error de muestreo (E).

Las frmulas para el clculo del tamao de muestra son los siguientes:

TAMAO DE Cuando se conoce N Cuando NO se conoce


MUESTRA N

NZ2 2 Z 2 2
n= n=
( N 1 )E2 + Z 2 2 E2
Para la media
2 2
NZ PQ Z PQ
n= n=
( N 1 )E2 + Z 2PQ E2
Para la proporcin
Donde:

n: Tamao de muestra
Nivel de Valor de
Z: Nivel de confianza confianza Z

E: Margen de 90% 1,65 error

95% 1,96
126
99% 2,58
2
: Varianza poblacional

: Desviacin estndar de la poblacin

P: Proporcin de la poblacin que tiene la

caracterstica de inters

Q: 1- P

N: Tamao de la poblacin

Ejemplo. 1:

El auditor de un banco desea estimar la proporcin de estados, de cuenta bancarias


mensuales para los depositantes del banco que tendrn errores de varias clases, y especifica
un coeficiente de confianza del 99% y un error mximo de 4%.

(a)Determinar el tamao de la muestra si no se dispone de informacin sobre la proporcin


verdadera de los estados de cuenta mensuales que tienen errores.

(b)Determinar el tamao de la muestra, si el auditor, por su experiencia, cree que la


verdadera proporcin de estados de cuenta con errores es 0.15.

Solucin A:
Z 2PQ
n=
E2

Z99% = 2,58
2,5820,50,5
n=
0,042
E = 4% = 0,04

P = 0,5

Q = 1-0,5 = 0,5

127
Solucin B:

Z 2PQ
n=
E2
Z99% = 2,58

E = 4% = 0,04 2,5820,150,85
n=
0,042
P = 0,15

Q = 1-0,15 = 0,85

Ejemplo. 2:

Se pretende realizar una investigacin para conocer el tiempo de estudio semanal dado
en horas, de los estudiantes de la Universidad Seor de Sipn. Si un estudio previo
determin que la varianza fue de 0,32 horas. Qu tamao de muestra sera
conveniente para la investigacin? Considerando un nivel de confianza del 95% y un
error tolerable de 0,05 horas.

Solucin :

Z 2 2
n= 2
E

Z95% = 1,96 1,9620,32


n=
0,052

E = 0,05

2 = 0,32

128
8.2. Muestreo

El muestreo son las tcnicas o herramientas utilizadas para la realizacin de una


muestra. En la aplicacin de estas tcnicas es necesario conocer y manejar algunos trminos
indispensables en el desarrollo de una investigacin, tal como se detallan a continuacin:

A. Poblacin o Universo: es un conjunto de unidades o elementos que presentan una


caracterstica comn; tambin se le considera como un conjunto de medidas. Si la
caracterstica observada ha sido medida, recibe el nombre de variable continua; si por el
contrario, tan slo se hace recuento se le denomina atributo o puede ser una variable
discreta.

Considerar la poblacin como conjunto de unidades o elementos, debe entenderse como un


grupo de personas, familias, establecimientos, manzanas, barrios, etc., pero en realidad es
un conjunto de medidas obtenidas de las caractersticas estudiadas.

B. Unidad y Elemento: la unidad es divisible, por ejemplo una familia se puede subdividir en
personas que la conforman; una universidad se divide en facultades, a su vez puede
considerarse como unidad, ya que se subdivide en cursos y stos en estudiantes. En cambio
el elemento es indivisible, una persona, una cosa, etc., sigue siendo la forma ms elemental
de presentacin, sin embargo, generalmente se habla en forma indistinta de elemento o
unidad como una sola cosa.

La unidad hace referencia a una persona, una familia, una vivienda, una manzana, un
barrio, un establecimiento, etc., y se denomina elemento cuando con ella obtenemos la
informacin necesaria. Es el individuo, entidad u objeto, del cual deseamos observar todas
o algunas de sus caractersticas para ser medidas o contadas. (Martnez, 2012)

8.2.1 Tipos de muestreo

Aqu destacan los muestreos de tipo probabilstico y no probabilstico:

I. Muestreo Probabilstico: Se denomina probabilstico cuando los elementos que


constituyen la poblacin o universo tienen la misma posibilidad de ser seleccionados.

129
A. Muestreo aleatorio simple: el mtodo de muestreo aleatorio simple es recomendable, en
especial, cuando la poblacin no es numerosa y las unidades se concentran en un rea
pequea; por otra parte, la caracterstica no debe tener gran variabilidad, porque implicara
un tamao muestral muy amplio lo que a su vez, incrementara costo y tiempo; por ltimo,
la poblacin debe facilitar su enumeracin para que permita la aplicacin de este mtodo:

- Se requiere un listado de unidades de la poblacin.

- No existe garanta de que todas las unidades queden representadas en la muestra,


cuando la caracterstica tienen una gran variabilidad.

- Si el coeficiente de variacin es mayor del 30% el tamao de muestra se va haciendo


ms grande.

B. Muestreo Aleatorio Estratificado: se denomina tambin como muestreo aleatorio


restringido, este procedimiento implica una divisin de la poblacin en grupos,
denominados estratos, en tal forma que el elemento presenta una caracterstica tan definida
que slo le permite pertenecer a un nico estrato.

- Afijacin igual: se da cuando los elementos quedan asignados o repartidos por igual
en cada estrato muestral.

- Afijacin proporcional: los elementos se distribuyen en los estratos muestrales, en la


misma proporcin en que se distribuyen los elementos de la poblacin.

- Afijacin ptima: cuando el tamao, tanto de la muestra general como para cada uno
de los estratos muestrales, depende del grado de variabilidad de la caracterstica en
cada estrato y del costo mnimo para una precisin dada.

C. Muestreo Sistemtico: ms que un mtodo de muestreo, es considerado como un mtodo


de seleccin, al que algunos denominan mtodo de seleccin a intervalos regulares. Se
aplica cuando la caracterstica a investigar se encuentra ordenada de acuerdo al valor,
tiempo, cantidad, etc.

D. Muestreo por conglomerados: este muestreo se utiliza cuando no existe listado, o bien las
unidades estn demasiado dispersas y no permiten llegar directamente a las fuentes de

130
informacin. Esto nos obliga a sustituir las unidades fsicas o elementales, por grupos de
unidades, que llamaremos conglomerados; generalmente son superficies o reas en las que
se ha dividido el espacio ocupado por la poblacin. Supongamos que se desea realizar
estudios a familias en una ciudad, cada unidad o familia se constituye en un conglomerado,
por tal razn se aplica en muestreo aleatorio monoetpico, es decir, se realiza la
investigacin en una sola etapa.(Martinez,2012)

II. Muestreo No Probabilstico: Entre los diferentes tipos de muestreo no probabilstico se


pueden mencionar: el casual o fortuito, el de seleccin experta, el muestreo de poblaciones
mviles y el de cuotas.

A. El muestreo casual o fortuito: se utiliza en diferentes reas de la investigacin como


arqueologa, historia y medicina, entre otras. Aqu las muestras se integran por voluntarios
o unidades mustrales que se obtienen en forma casual. Otras ciencias que no se preocupan
por la representatividad de sus especmenes son astronoma, fsica y qumica.

B. El muestreo de seleccin Experta: denominado tambin como muestreo de juicio, es una


tcnica utilizada por expertos para seleccionar especmenes, unidades o porciones
representativas o tpicas, segn el criterio del experto; por ejemplo: la seleccin de un
conjunto de especmenes con determinadas caractersticas, para un experimento de
laboratorio, o la seleccin de determinadas semanas del ao para llevar a cabo algunas
auditoras.

Es importante hacer notar que en este caso los criterios de seleccin pueden variar de
experto a experto, al determinar cules son las unidades de muestreo representativas de la
poblacin.

C. El mtodo de poblaciones mviles: se basa en el concepto de captura-marca-captura. La


poblacin total se estima con base en la proporcin de individuos en la recaptura, esto es,
aqullos que han sido capturados previamente y marcados. Este tipo de tcnicas se utiliza
mucho en el muestreo de insectos, peces, venados, ballenas y, en general, poblaciones de
animales en extincin.

D. El Muestreo de Cuotas: es un tipo de muestreo ampliamente utilizado en encuestas sobre


opinin electoral, investigacin de mercado o similares. Los encuestadores reciben la orden
de obtener cierto nmero de entrevistas (cuotas), a partir de las cuales se construye una
muestra relativamente proporcional a la poblacin. Este esquema se ve como una
alternativa del muestreo probabilstico, en el que se busca seleccionar una muestra
representativa de la poblacin estableciendo proporciones de los diferentes segmentos que

131
la componen. La tcnica consiste en determinar, al seleccionar la muestra, la cuota de
entrevistas que se debe cubrir de cada grupo de la poblacin y por cada enumerador. El
supuesto bsico de esto es que con la conjuncin de todas las cuotas se obtiene una imagen
de la totalidad.

Los diferentes tipos de muestreo no probabilstico mencionados varan ampliamente


en grado y rea de justificacin, pero cada una de sus tcnicas tienen en comn la
generalidad de los supuestos que sustentan la distribucin de las variables en la poblacin.
(Pimienta,2000).

PROBLEMAS PROPUESTOS

1. De una poblacin N=10000 personas nos proponemos obtener una muestra, para estimar el
ingreso promedio por persona. Se quiere que la estimacin muestra, no se aparte en ms de
$5000 del promedio verdadero y que esto se cumpla en 95 de cada 100 casos. La
desviacin tpica es de $30000 Cul es el tamao de muestra ptimo?

2. Supongamos que en un rea dada, la proporcin de explotaciones agropecuarias que poseen


energa es de 0,36 Cul es el error de muestreo de la estimacin, utilizando una muestra al
azar de 300 explotaciones, con una confianza del 95% un total de 8000 explotaciones?

3. Qu tamaa deber tener una muestra para estimar dentro del 3% la proporcin de mujeres
casadas que van peridicamente a consulta ginecolgica, en una poblacin de 5000 mujeres
y una seguridad del 95%?

132
4. Se desea estimar el costo promedio de matrculas de los estudiantes universitarios de la
ciudad. Por estudios anteriores y a precios actuales se sabe que la desviacin tpica es de
$18000. a) Calcular el tamao de muestra fijando para ello un error de $3000 y una
confianza del 99% b) Si se considera que la poblacin estudiantil que se desea investigar es
de 12000 Cul sera el valor de n?

5. En cierta residencial se espera que el 60% de las familias tengan vehculo propio. Se desea
hacer una investigacin para estimar la proporcin de familias propietarias de vehculos,
con un error del 3% y un coeficiente de confianza del 90%. a) Determine el tamao de
muestra b) Qu sucedera si P=0,5?

6. Una oficina de investigaciones sobre salud considera que el 20% de las personas adultas de
una regin, padecen cierta enfermedad parasitaria. Cuntas personas tendrn que
seleccionar en la muestra al azar, para que el error del estimado de la proporcin sea del 7%
y tenga una confianza del 99%?

7. Interesa estimar el nmero promedio de accidentes de trnsito en una ciudad. Durante un


ao (365 das) se determina una desviacin tpica de 12 accidentes diarios. Cuntos das
(tamao de muestra) se requieren para no errar en ms de dos accidentes, con un 90% de
confianza?

8. Entre los estudiantes de cierta universidad privada, se desea tomar una muestra para estimar
la proporcin de alumnos que utilizan la biblioteca. El error debe conservarse en un 4% con
una confianza del 96%. Cul es el tamao de la muestra, si la universidad tiene 3200
alumnos matriculados?

9. Qu tamao de muestra se requiere para una poblacin de 5000 unidades, si se desea un


error del 8% y un intervalo de confianza del 95%?

10. A partir de una muestra de 200 observaciones se encontr que, en una remesa haba 20
acumuladores defectuosos. Utilizando un nivel de confianza del 99%. Calcule el error de
muestreo.

133
CAPTULO IX

Introduccin a la Inferencia
Estadstica: Estimacin

9.1. INFERENCIA ESTADISTICA.


La estadstica tiene como finalidad inferir algo sobre una poblacin con base en una
muestra aleatoria tomada de la poblacin sobre la cual deseamos hacer la inferencia. La
Poblacin tiene constantes desconocidas que la caracterizan, sobre estas constantes se hace
la inferencia. La inferencia consiste en estimar y probar hiptesis sobre estas constantes
desconocidas.

Primero presentaremos algunos conceptos bsicos

134
a) Parmetro. Es una constante, generalmente desconocida, que caracteriza a una poblacin.

Por ejemplo, , la media de la poblacin. Si consideramos la poblacin de estudiantes de

la USS y conociramos que la edad promedio ( ) de todos los estudiantes es 20 aos
diramos que esta poblacin se caracteriza por ser una poblacin joven.

b) Estimador. Es aquel que se calcula con los datos de la muestra (es una funcin de la
X
muestra). Como ejemplo sealaremos a la media de la muestra ( ) la cual se calcula con
los datos de la muestra cmo sigue

x 1 x 2 ... x n
X
n

POBLACION

Media de la poblacin
2
Varianza de la poblacin

Desviacin estndar de la poblacin Parmetros
p
Proporcin de la poblacin

MUESTRA
X Media de la muestra

Varianza de la muestra
S2
Desviacin estndar de la muestra Estimadores
S
Proporcin de la muestra

c) Estimador puntual. Es aquel que estima al parmetro mediante un solo valor o punto.
Ejemplo la media de la muestra.

d) Estimador por intervalo. Llamado tambin intervalo de confianza es aquel que estima al

parmetro mediante un intervalo con un coeficiente de confianza (1- ).

135
e) Hiptesis. Es una afirmacin sobre algo la cual puede ser falsa o verdadera.
Ejemplo. Maana llover.

f) Hiptesis estadstica. Es una afirmacin sobre uno o varios parmetros de una o varias
poblaciones.

Ejemplo. =20, la edad media de todos los alumnos de la USS es 20 aos.

g) Hiptesis nula. Es una afirmacin sobre uno o varios parmetros que incluye la igualdad.
se designa con Ho.
Ejemplo. Ho = Los datos de la muestra provienen de una distribucin normal.

h) Hiptesis alternativa. Es el complemento de la hiptesis nula.


Ejemplo. Ha= H1= Los datos de la muestra no provienen de una distribucin normal.

i) Error tipo I. Es el que se comete al rechazar Ho dado que Ho es verdadera.

j) Error Tipo II. Es el que se comete al no rechazar Ho dado que Ho es falsa.



=Probabilidad de cometer el error tipo I.

=Probabilidad de cometer el error tipo II

k) Puntos crticos. Son valores tabulares que delimitan la regin de rechazo (RR) y la de no
rechazo (RA).

9.2 ESTIMACION DE PARAMETROS


En este tema veremos cmo estimar puntualmente y mediante un intervalo de

confianza al parmetro p (proporcin de una poblacin) y al parmetro (media de una
poblacin).

I. Estimacin de la proporcin de la poblacin, p :


Solo veremos el caso donde el tamao de muestra n es mayor o igual a 30, puesto que
el estimador se construye con base en la media de la muestra considerando n valores de una
variable medida en escala dicotmica (con solo dos valores 0 y 1). El fundamento terico es
el teorema central del lmite, el cual indica que cuando n es grande, la media muestral tiene
distribucin aproximadamente normal. La muestra aleatoria se puede haber tomado de
cualquier distribucin no necesariamente de la distribucin normal.
Primero presentaremos el resultado para estimar la proporcin de una poblacin y en
seguida un ejemplo.

136
Teorema 1

Si n 30, entonces:

p
a) El mejor estimador puntual para p es don de
x
p
n
.
Donde n es el tamao de muestra y x es el nmero de xitos obtenidos.


b) Un 100(1- )% intervalo de confianza para p es

pq pq
p - Z , p Z
2
n 2
n
.
Donde:
x Z
p
n q
p
2
, =1- , n es el tamao de la muestra y es un valor en la tabla de Z o

2
distribucin normal estndar de tal manera que a su derecha esta una probabilidad
.
Ejemplo 1.
En un estudio sobre desocupacin en el Municipio de T se tom una muestra aleatoria de
200 personas en edad laboral del Municipio de T de las cuales 26 contestaron que no tienen
trabajo.
a) Estimar puntualmente a p, la proporcin de desocupados en el Municipio de T.
b) Encontrar un 95% intervalo de confianza para p, Es decir estimar p con un
coeficiente de confianza del 95%.
c) Interpretar el estimador puntual y el estimador por intervalo.

Solucin
Puesto que n=200 es mayor que 30 y el nmero de xitos es x=26

p
a) El mejor estimador puntual de p es

137
x 26
p 0.13
n 200
.
p
El mejor estimador puntual para p es =0.13 (o 13%).
b) Un 95% de confianza para p se encuentra usando el inciso b) del teorema 1

Un 100(1- )% intervalo de confianza para p es

pq pq
p - Z , p Z
2
n 2
n
.
Donde:

Z
p q p 2
=0.13, =1- =1-0.13=0.87, n=200 y es un valor en la tabla de Z o distribucin

2
normal estndar de tal manera que a su derecha esta una probabilidad .
Z
2
Para encontrar , primero debemos calcular usando la siguiente formula.
100 porciento del intervalo de confianza pedido 100 95 5
0.05.
100 100 100

0.05 Z
0.025
2 2 2
Entonces y se encuentra en la tabla de la normal estndar ubicando
en el cuerpo de la tabla el valor 0.025 exacto o aproximado y finalmente se detecta el valor
Z Z
2 2
se observando el valor de con un decimal en la primera columna y el segundo
decimal en la primera hilera como se indica en la tabla siguiente
0.06

1.9 0.025

Z Z
2 2
Por lo tanto el valor de es =1.96.

138
En seguida determinamos los valores del lmite inferior y del lmite superior de 95% del
intervalo de confianza para p

pq (0.13)(0.87)
LI p - Z 0.13 1.96 0.13 0.05 0.08
2
n 200

pq (0.13)(0.87)
LS p Z 0.13 1.96 0.13 0.05 0.18
2
n 200

Entonces un 95% intervalo de confianza para p es [0.08, 0.18]. Es decir se estima que la
proporcin poblacional esta entre 0.08 y 0.18.

c) Interpretacin.
Si usamos un estimador puntual para estimar p, se concluye que el porcentaje de
desocupacin en el Municipio de T es alrededor del 13% y si usamos un estimador por
intervalo para estimar p se concluye que el porcentaje de desocupacin en el Municipio de
T esta entre el 8% y el 18% dicha conclusin se hace con un confianza de confianza
del95%.o con un error del 5%.

II. Estimacin de la media de una poblacin,
Existen muchos casos sobre estimacin puntual y por intervalo para la media de una
poblacin, tales como combinaciones de que la poblacin o variable en estudio tiene
distribucin normal o distribucin diferente de la normal, del tamao de muestra pequeo o
grande y con la varianza de la poblacin conocida o desconocida.
En este tema trataremos un solo caso para estimar la media de la poblacin considerando
2
que la poblacin o variable en estudio tiene distribucin normal con varianza
desconocida que es el caso ms frecuente y en nuestra opinin es el nico caso que se
encuentra en la realidad (aplicaciones) en el sentido de que la varianza de la poblacin es
desconocida. Si se tienen tamaos de muestras grandes los casos donde las variables en
estudio no tienen distribucin normal para estimar la media de una poblacin se pueden
usar las mismas frmulas que presentaremos luego puesto que el teorema central del lmite
nos dice que si se toma una muestra aleatoria de cualquier distribucin y el tamao de
muestra es grande la media de la muestra tiene distribucin aproximadamente normal que
es el requerimiento o suposicin para estimar la media de una poblacin.
En seguida se presenta el resultado y un ejemplo para estimar la media de la poblacin.

Teorema 2
Si se cumplen los dos requerimientos mencionados anteriormente; es decir, si la
variable en estudio tiene distribucin normal y la varianza de esta distribucin es

139
desconocida (si la varianza es desconocida, entonces la desviacin estndar de la
poblacin tambin es desconocida), entonces
X
a) El mejor estimador puntual para es la media muestral .

b) Un 100(1- )% intervalo de confianza para es

S S
X - t n -1, , Xt
2 n n -1,
2 n
.
Donde:
X
es la media de la muestra, S es la desviacin estndar de la muestra, n es el tamao
t
n 1,
2
de la muestra y es un valor en la tabla de t de Student con n-1 grados de

2
libertad (GL) de tal manera que a su derecha esta una probabilidad de

Ejemplo 2
En un estudio para estimar el salario promedio mensual de los profesores del departamento
de Lambayeque se tom una muestra aleatoria de tres profesores a los cuales se les registro
su salario mensual en soles. Se conoce que variable salario tiene distribucin normal. Los
datos de la muestra se dan a continuacin
1200 800 1000

a) Estimar en forma puntual a .

b) Estimar a mediante un intervalo de confianza del 95%.
c) Interpretar a los dos estimadores obtenidos.

Como los dos requerimientos se cumplen: la variable en estudio tiene distribucin normal y
2
la varianza es desconocida, usaremos el teorema 2 para encontrar los estimadores de .
X
a) El mejor estimador puntual para es
n

x i
1200 800 100 3000
X i 1
1000.
n 3 3

X
Entonces un estimador puntual para es =1000.

140

b) Un 100(1- ) % intervalo de confianza para .

S S
X - t n -1, , Xt
2 n n -1,
2 n
. Donde:
X
=1000,
n=3,
( x i ) 2 (1200 800 1000) 2
x i2 n
1200 2 800 2 1000 2
3
S 40000
n 1 3 1
,

0.05
0.025
2 2
y

t
n 1,
2
se encuentra en la tabla de la distribucin de T de Student ubicando en la primera

0.025
2
columna los n-1=2 grados de libertad, en la primera hilera la probabilidad y
t
n 1,
2
finalmente se detecta el valor en la interseccin de estos dos valores como se indica
en la tabla siguiente:


0.025
2

n-1=2 4.303

t t t 2, 0.025 4.303
n 1, n 1,
2 2
Por lo tanto el valor de es .
Con estos datos podemos calcular el lmite inferior (LI) y el lmite superior (LS) del
intervalo de confianza pedido.

141
S 200
LI X t 1000 4.303 * 1000 496.88 503.12.
n 1,
2 n 3

S 200
LS X t 1000 4.303 * 1000 496.88 1496.88.
n 1,
2 n 3

A si un 95% intervalo de confianza para .12 es [503.12, 1496.88].

c) Interpretacin
Si se usa un estimador puntual, se concluye que el salario promedio mensual de todos los
profesores del departamento de Lambayeque es de 1000 soles, sin embargo si se usa un
estimador por intervalo para el salario promedio, se estima que el salario promedio mensual
de todos los profesores del departamento de Lambayeque esta entre 503 soles y 1496.88
soles.

PROBLEMAS PROPUESTOS

1. En un estudio para para estimar la proporcin de familias que usan un determinado


detergente, 196 familias fueron seleccionadas aleatoriamente. De las 196 familias se
determin que 108 usan el producto (detergente).
a) Encontrar un estimador puntual para la proporcin de familias que usan dicho
detergente.
b) Encontrar un 99% intervalo de confianza para la proporcin de familias que usan el
detergente.
c) Encontrar un 95% intervalo de confianza para la proporcin de familias que usan el
detergente.
d) Interpretar lo obtenido en los incisos a), b) y c).

142
2. En un estudio realizado por Waall Street Journal, se tom una muestra aleatoria de 900
personas que estn suscritas en Wall Street Journal, de estas 900 personas el 40% indicaron
que terminaron al menos dos aos en una Universidad.
a) Encuentre un 95% intervalo de confianza para la proporcin de suscritores de Wall
Street Journal que terminaron al menos dos aos de estudios universitarios.
b) Interprete lo que encontr en el inciso a).

3. Un gerente compro 10000 bateras para la empresa en la cual trabaja. El gerente toma una
muestra aleatoria de 300 bateras de las 10000 compradas las cuales fueron examinadas
resultando 42 bateras defectuosas.
Encuentre un 95% intervalo de confianza para la proporcin de bateras defectuosas en tota
la poblacin de bateras compradas.

4. Se est considerando un nuevo medicamento para curar una determinada enfermedad. El


medicamento que se est usando actualmente tiene una probabilidad de 0.8 de curar dicha
enfermedad. Se tom una muestra aleatoria de 40 pacientes que padecen la enfermedad y se
les aplico el nuevo medicamento, resulto que 34 de ellos se curaron de la enfermedad.
a) Determine un 95% intervalo de confianza para la proporcin de todos pacientes que se
curan de la enfermedad si reciben el nuevo medicamento.
b) Considerara usted que el nuevo medicamento es mejor que el actual?

5. Un ingeniero civil est probando la resistencia de compresin del concreto. Prueba 120
muestras de las cuales 115 tienen resistencia mayor a 2250 psi.
a) Encuentre un 97% intervalo de confianza para la proporcin de muestras que tienen
resistencia mayor a 2250 psi.

6. Un agricultor afirma que l puede determinar si una semilla de papaya es macho con solo
palpar la semilla. Para probar tal afirmacin se tomaron 1000 semillas al azar para que
examine el agricultor y determine si es semilla de papayo macho, posteriormente se
sembraron las semillas y se determin realmente si eran semillas de papayo macho.
Finalmente al hacer el cotejo se encontr que el agricultor de detecto el sexo de 6 semillas
correctamente.
a) Encontrar un estimador puntual para la proporcin de semillas detectadas
correctamente por el agricultor con respecto al sexo.
b) Encontrar un 95% intervalo de confianza para la proporcin de semillas detectadas
correctamente por el agricultor con respecto al sexo. Cul es su opinin con respecto a
la afirmacin del agricultor?

7. El anlisis de los gases de la sangre arterial practicado a una muestra aleatoria de 15


hombres adultos fsicamente activos proporciono los siguientes valores de PaO2 en reposo:
75, 80, 80, 74, 84, 78, 89, 72, 83, 76, 75, 87, 78, 79, 88
Se conoce los valores de PaO2 tienen distribucin normal.
a) Estimar puntualmente a la media de la poblacin.
b) Encontrar un 95% intervalo de confianza para la media de la poblacin de la cual se
tom la muestra.

143
8. Se receto el medicamento A a una muestra aleatoria de 7 pacientes que padecan insomnio.
El nmero de horas de sueo experimentadas durante la segunda noche despus de iniciado
el tratamiento fueron las siguientes:
3.5, 5.7, 3.4, 6.9, 17.8, 3.8, 6.6
Se conoce que el nmero de horas de sueo tiene distribucin normal.
a) Encontrar un estimador puntual para el promedio del nmero de horas de sueo de la
poblacin.
b) Encontrar un 95% intervalo de confianza para la media de la poblacin.
c) Interpretar en trminos del problema lo encontrado en los incisos a) y b),

9. Un ingeniero civil est probando la resistencia de compresin del concreto. Prueba 6


muestras al azar y obtiene los siguientes resultados:
2216 2237 2249 2204 2225 2311
Se conoce que la resistencia de compresin del concreto tiene distribucin normal..
a) Encuentre un estimador puntual para el promedio de la resistencia de compresin del
concreto.
b) Construya un intervalo de confianza del 95% para la resistencia media.

10. Se analiz una marca particular de margarina diettica para determinar el nivel de cido
graso polinsaturado (en porcentaje).Una muestra de 6 paquetes al azar dio como resultado
los siguientes datos:
16.8 17.2 17.4 16.9 16.5 17.1
Se conoce que el nivel de cido graso polinsaturado tiene distribucin normal.

a) Encontrar un estimador puntual para .

b) Encuentre un 95% Intervalo de confianza para .
c) Interprete en trminos del problema lo calculado en los incisos a) y b).

144
CAPTULO X

Introduccin a la Inferencia
Estadstica: Prueba de
Hiptesis

10.1 PRUEBAS DE HIPOTESIS


Otra de las finalidades de la inferencia estadstica, probablemente la ms importante
en investigacin, es la prueba de hiptesis. Es decir, probar enunciados o afirmaciones
sobre los parmetros de las poblaciones.

I. Metodologa para desarrollar pruebas de hiptesis:


Para desarrollar una prueba de hiptesis puedes hacerlo haciendo uso de estos siete pasos:

1. Planteamiento de hiptesis: aqu debers plantear H0 y H1


2. Nivel de significancia: es el valor que te ayudar a tomar la decisin de aceptar o
rechazar H0
3. Estadstico de prueba: aqu slo se plasmar la funcin pivotal.
4. Regin de aceptacin y rechazo: Se determinar en funcin a los puntos crticos.
5. Calculamos el estadstico de prueba: se reemplaza los datos en la funcin pivotal.
145
6. Decisin: en este paso se tomar la decisin de aceptar o rechazar H0.
7. Conclusin: se describir y/o dar respuesta al problema presentado.

II. Tipos de pruebas de hiptesis:

a. Hiptesis bilateral de dos colas


H 0 :=0

H 1 : 0

b. Hiptesis unilateral hacia la derecha


H 0 :=0

H 1 :> 0

c. Hiptesis unilateral hacia la izquierda


H 0 :=0

H 1 :< 0

0 = es el valor del parmetro desconocido


III. Pruebas de Hiptesis para la proporcin p y para la media :

A. Pruebas de hiptesis sobre el parmetro p, proporcin de una poblacin


Solamente trataremos el caso cuando n es mayor o igual a 30 (caso de muestras

grandes), para este caso se presenta una prueba de dos colas (Ha: p p*) y dos pruebas de
una cola (Ha: p>p* y Ha: p<p*).

En los resultados o teoremas para pruebas de hiptesis presentaremos en cada uno de ellos
tres incisos describiendo brevemente los pasos a seguir para probar la hiptesis. Es decir, se
presenta el valor calculado (estadstica de prueba), el valor tabular o punto crtico, la regin
de rechazo (RR), regin de no rechazo o regin de aceptacin (RA), y la regla de decisin.

146
Teorema 3
Si n, el tamao de muestra, es mayor o igual a 30, entonces

a) Ho: p = p* versus

Ha: p p*

Valor calculado o estadstica de prueba



p p *
Zc
p * (1 p * )
n

Valor tabular, valor en la tabla de la distribucin normal estndar



Z valor en la tabla de Z tal que a su derecha esta una probabilid ad
2
2
Zt= .

Regin de rechazo (RR) y la regin de aceptacin (RA)

RR RA RR

-Zt Zt

Regla de decisin

Rechazar Ho si Zc cae en la RR. Es decir,


Rechazar Ho si Zc<-Zt o si Zc>Zt

b) Ho: pp* versus


Ha: p>p*

Valor calculado o estadstica de prueba



p p *
Zc
p * (1 p * )
n

Valor tabular, valor en la tabla de la distribucin normal estndar

147
Z valor en la tabla de Z tal que a su derecha esta una probabilid ad
Zt= .

Regin de rechazo (RR) y la regin de aceptacin (RA)

RA RR

Zt
Regla de decisin

Rechazar Ho si Zc cae en la RR. Es decir,


Rechazar Ho si Zc>Zt

c) Ho: pp* versus


Ha: p<p*

Valor calculado o estadstica de prueba



p p *
Zc
p * (1 p * )
n

Valor tabular, valor en la tabla de la distribucin normal estndar

Z valor en la tabla de Z tal que a su derecha esta una probabilid ad


Zt= .

Construir la regin de rechazo (RR) y la regin de aceptacin (RA)

RR RA

-Zt
Regla de decisin

Rechazar Ho si Zc cae en la RR. Es decir,


Rechazar Ho si Zc<-Zt.

Ejemplo
Usando los datos del ejemplo del estudio de desocupacin en el municipio de T probar con

=0.05 que el porcentaje de desocupacin en el municipio de T es diferente del 4%,


afirmacin que hace el gobierno central.

Usaremos las frmulas de inciso a) del teorema 3


1. Planteamiento de hiptesis:

148
Ho: p=0.04 versus

H1: p 0.04

2. Nivel de significancia:

=0.05.

3. Estadstico de prueba:
p p *
Zc
p * (1 p*)
n

4. Regin de aceptacin y rechazo:


Z Z 0.05 Z 0.025 1.96
2 2
Zt= .

Regin de rechazo (RR) y la regin de aceptacin (RA)


Zc=6.50

RR RA RR

-Zt Zt
-1.96 1.96

5. Calculamos el estadstico de prueba:


p p * 0.13 0.04
Zc 6.50
p * (1 p*) 0.04(1 0.04)
n 200

6. Decisin:

Puesto que Zc cae en la RR, se rechaza H0 con =0.05.

7. Conclusin:
Con un nivel de significancia del 5% se concluye que el porcentaje de desocupacin en
el municipio de T es significativamente diferente del 4% que afirma el gobierno central.
Tambin podramos haber probado la hiptesis considerando en la hiptesis alternante que
la proporcin de desocupados en el municipio de T es mayor del 4%, lo cual ilustraremos
en seguida.
Usaremos el inciso b) del teorema 3.

1. Planteamiento de hiptesis:
Ho: p=0.04 versus

149
H1: p>0.04

2. Nivel de significancia:

=0.05

3. Estadstico de prueba:
p p *
Zc
p * (1 p*)
n

4. Regin de aceptacin y rechazo:


Valor tabular Zt

Z Z 0.05 1.96
Zt= .

Regin de rechazo y regin de aceptacin


Zc=6.50

RA RR

Zt
1.96

5. Calculamos el estadstico de prueba:


p p * 0.13 0.04
Zc 6.50
p * (1 p*) 0.04(1 0.04)
n 200

6. Decisin:

Puesto que Zc cae en la RR, se rechaza Ho con =0.05.

7. Conclusin:

Con un nivel de significancia del 5% se concluye que el porcentaje de desocupacin en


el municipio de T es significativamente diferente del 4% que afirma el gobierno central.


B. Pruebas de hiptesis sobre el parmetro , media de una poblacin
Trataremos solo el caso cuando la variable en estudio tiene distribucin normal con

varianza desconocida., para este caso se presenta la una prueba de dos colas (Ha: *)

y dos pruebas de una cola (Ha: > * y Ha: < *).

150
Teorema 4

a) Ho: = * versus

Ha: *

Valor calculado o valor de la estadstica de prueba tc

X*

S
n
tc
Valor tabular tt

t valor en la tabla de Tcon n - 1 GL tal que a su derecha esta una probabilid ad
n 1,
2
2
tt= .
GL=grados de libertad
Regin de rechazo (RR) y la regin de aceptacin (RA)

RR RA RR

- tt tt

Regla de decisin

Rechazar Ho si tc cae en la RR. Es decir,


Rechazar Ho si tc < -tt o si tc > tt


b) Ho: = * versus

Ha: > *

Valor calculado tc

X*

S
n
tc

151
Valor tabular tt
t n 1, valor en la tabla de Tcon n - 1 GL tal que a su derecha esta una probabilid ad
tt= .
GL=grados de libertad

Regin de rechazo (RR) y la regin de aceptacin (RA)

RA RR

tt

Regla de decisin

Rechazar Ho si tc cae en la RR. Es decir,


Rechazar Ho si tc > tt


c) Ho: = * versus

Ha: < *
Valor calculado tc

X*

S
n
tc
Encontrar el tt

t n 1, valor en la tabla de Tcon n - 1 GL tal que a su derecha esta una probabilid ad


tt= .
GL=grados de libertad

Regin de rechazo (RR) y la regin de aceptacin (RA)

RR RA

- tt

Regla de decisin

Rechazar Ho si tc cae en la RR. Es decir,


Rechazar Ho si tc < -tt

152
Ejemplo
Usando los datos del ejemplo de investigacin sobre estimacin del salario promedio de

todos los profesores del departamento de Lambayeque, probar con =0.05 si el salario
promedio de los profesores es diferente a 1200 soles mensuales.
En el ejemplo tenemos los siguientes datos: n=3, la media muestral es igual a 1000 y la
desviacin estndar de la muestra es 200.
1. Planteamiento de hiptesis: 2.Nivel de significancia:

Ho: =1200 versus =0.05

H1: 1200
3. Estadstico de prueba:

X *

S
n
tc
4. Regin de aceptacin y rechazo:
Valor tabular tt
t t 2,0.025 4.303
n 1,
2
tt=
tt es un valor en la tabla de T con 2 grados de libertad y una probabilidad de 0.025 a
la derecha de dicho valor.
Regin de rechazo (RR) y la regin de aceptacin (RA)
tc = -1.73
RR RA RR

- tt tt
-4.303 4.303
5. Calculamos el estadstico de prueba:

X * 1000 1200
1.73
S 200
n 3
tc
6. Decisin:
Como el tc = -1.73 cae en la RA, no se rechaza Ho.

7. Conclusin:
Con un nivel de significancia del 5 % (error del 5%) se concluye que el salario
promedio de los profesores del departamento de Lambayeque no es significativamente

153
diferente de 1200 soles por mes. Es decir, con un nivel de significancia del 5% los datos de
muestra aleatoria no muestran evidencias para rechazar la hiptesis de que el salario
promedio de todos los profesores del departamento de Lambayeque es de 1200 soles
mensuales
PROBLEMAS PROPUESTOS

1. En un estudio sobre desocupacin en el Municipio de T se tom una muestra aleatoria de


200 personas en edad laboral del Municipio de T de las cuales 26 contestaron que no tienen
trabajo. El gobierno central afirma que el porcentaje de desocupados en el municipio de T
es del 4%. Pruebe la hiptesis de que el porcentaje de desocupacin en el municipio de T es

diferente del 4% usando una =0.01 y de su conclusin en trminos del problema.

2. En un estudio para para estimar la proporcin de familias que usan un determinado


detergente, 196 familias fueron seleccionadas aleatoriamente. De las 196 familias se
determin que 108 usan el producto (detergente).

Probar con =0.05 que ms del 90% de las familias usan el detergente. De su conclusin
en trminos del problema.

3. En un estudio realizado por Wall Street Journal, se tom una muestra aleatoria de 900
personas que estn suscritas en Wall Street Journal, de estas 900 personas el 40% indicaron
que terminaron al menos dos aos en una Universidad.

Probar con =0.05 que la proporcin de suscritores de Wall Street Journal que terminaron
al menos dos aos de estudios universitarios es del 50%.

4. Un gerente compro 10000 bateras para la empresa en la cual trabaja. El gerente toma una
muestra aleatoria de 300 bateras de las 10000 compradas las cuales fueron examinadas
resultando 42 bateras defectuosas.

Probar con =0.05 que menos del 5%. De las bateras son defectuosas. De su conclusin
en trminos del problema.

5. Se est considerando un nuevo medicamento para curar una determinada enfermedad. El


medicamento que se est usando actualmente tiene una probabilidad de 0.8 de curar dicha
enfermedad. Se tom una muestra aleatoria de 40 pacientes que padecen la enfermedad y se
les aplico el nuevo medicamento, resulto que 34 de ellos se curaron de la enfermedad.

Probar con =0.05 que el nuevo medicamento es mejor que el actual. De su conclusin en
trminos del problema.

6. Un ingeniero civil est probando la resistencia de compresin del concreto. Prueba 6


muestras al azar y obtiene los siguientes resultados:
2216 2237 2249 2204 2225 2311
Se conoce que la resistencia de compresin del concreto tiene distribucin normal.

154

Pruebe la hiptesis Ho: =2250 psi contra Ha: 2250 psi usando =0.05. Saque
conclusiones con base en el resultado de esta prueba.

7. Un fabricante de llantas est investigando la vida de las llantas producidas con un nuevo
producto. Tomo una muestra aleatoria de 16 llantas producidas con este nuevo producto y
las ha probado hasta el fin de su vida til en una prueba de carretera. La media y la
desviacin estndar muestrales son 60139.7 y 3645.94 km. Se conoce que la vida til de las
llantas tiene distribucin normal. Al fabricante le gustara demostrar que la vida media de

esta nueva llanta es mayor de 60000 km. Formule y pruebe las hiptesis apropiadas con
=0.05, y establezca conclusiones.

8. Una muestra aleatoria de n=100 medidores de agua es controlada dentro de una comunidad
para estimar el promedio de consumo de agua diario por casa, durante un periodo estacional
seco. La media y la varianza muestral fueron 12.5 y 1252. Se supone que el consumo de
agua tiene distribucin normal.

Pruebe la hiptesis con =0.05 que el consumo promedio diario de agua es menor que

9. Probar si los valores de la variable en estudio calificaciones tiene distribucin normal. Los
datos de la muestra se dan a continuacin.

11 09 03 03 03
05 10 06 05 02
03 15 04 07 01
08 18 02 03 02
01 11 03 03 03
04 02 06 05 05
03 05 08 01 04
Para probar si los datos de la muestra provienen de una distribucin normal construya un
histograma de frecuencias y observe si la distribucin de frecuencias tiene forma
acampanada lo cual indicara que los datos provienen de una distribucin normal en caso
contrario se concluye que los datos no provienen de una distribucin normal.
Hacer la prueba normal. Revisar un libro donde este descrito la prueba de bondad de ajuste
para prueba de normalidad. Por ejemplo puede revisar el libro: Introduccin a los mtodos
estadsticos un enfoque multidisciplinario de los autores Said y Zarate.

10. Saque conclusiones con base en el resultado de esta prueba.

155
CAPTULO XI

Prueba Chi Cuadrado

156
Pruebas No Paramtricas

Utilizamos el trmino No paramtrico para referirse nicamente a los contrastes que no


plantean hiptesis sobre parmetros y que se limitan a analizar las propiedades nominales u
ordinales de los datos.

Distribucin Chi-cuadrada ( 2)
La distribucin chi cuadrada es toda una familia de distribuciones. Las aplicaciones ms
comunes de la distribucin chi-cuadrada son (1) pruebas de bondad de ajuste y (2) pruebas
de independencia y (3) Prueba de Homogeneidad

1. Prueba de Bondad de Ajuste, consiste en determinar si los datos de cierta muestra


corresponden a cierta distribucin poblacional. En este caso es necesario que los valores de
la variable en la muestra y sobre la cual queremos realizar la inferencia est dividida en
clases de ocurrencia, o equivalentemente, sea cual sea la variable de estudio, deberemos
categorizar los datos asignando sus valores a diferentes clases o grupos.

Supongamos que tenemos un nmero k de clases en las cuales se han ido registrando un
total de n observaciones (n ser pues el tamao muestral). Denotaremos las frecuencias
observadas en cada clase por O1, O2,, Ok (Oi es el nmero de valores en la clase Ai). Se
cumplir:
O1 + O2 +... + O k = n

Lo que queremos es comparar las frecuencias observadas con las frecuencias esperadas
(tericas), a las que denotaremos por E1, E2,..., Ek. Se cumplir:
E1 + E2 +... + E k = n
Frecuencia Observada Frecuencia Observada
Clase 1 O1 E1
Clase 2 O2 E2

Clase K Ok Ek
Total n n

Veremos si las frecuencias observadas estn o no en concordancia con las frecuencias


esperadas (es decir, si el nmero de resultados observados en cada clase corresponden
aproximadamente al nmero esperado).
Para comprobarlo, haremos uso de un contraste de hiptesis usando la distribucin Chi-
cuadrado.

157
k 2
( OE i )
=
2

i=1 Ei

Ejemplo
El director de Movil, tiene la responsabilidad de controlar el nivel de existencias para
cuatro tipos de automvil vendidos por la firma. En el pasado, ha ordenado nuevos
automviles bajo la premisa de que los cuatro tipos son igualmente populares y la demanda
de cada tipo es la misma. Sin embargo, recientemente las existencias se han vuelto ms
difciles de controlar, y el director considera que debera probar su hiptesis respecto a una
demanda uniforme.

Tabla 1.Muestra la expectativa uniforme para una muestra de 48 autos


vendidos durante el ltimo mes.
Tipo de auto Ventas observadas Ventas esperadas
Tipo1 15 12
Tipo2 11 12
Tipo3 10 12
Tipo4 12 12

Solucin
1. Planteamiento de hiptesis
H0: La demanda es uniforme para los cuatro tipos de autos.
H1: La demanda no es uniforme para los cuatro tipos de autos.

2. Nivel de significancia:
=0.05
3. Estadstico de prueba
k 2
( OE i )
=
2
; 20.05 ;3=7.815
i=1 Ei

4. Regin de aceptacin y rechazo


Si 2c > 2t entonces se rechazala Ho
2 2
Si c > t entonces se rechazala Ho

5. Calculamos el estadstico de prueba

158
( 1512 )2 ( 1112 )2 ( 1012 )2 ( 1212 )2
2c = + + + =1.17
12 12 12 12

6. Decisin
2 2
Como c > t , entonces se rechaza la Ho

7. Conclusin:
La demanda no es uniforma para los 4 tipos de autos.
2. Prueba de Independencia, La prueba de independencia Chi-cuadrado, nos permite
determinar si existe una relacin entre dos factores analizadas en un estudio. Para saber si
dos factores muestran algn grado de dependencia se construyen tablas de doble entrada
(filas y columnas) .Es necesario resaltar que esta prueba nos indica si existe o no una
relacin entre las variables, pero no indica el grado o el tipo de relacin; es decir, no indica
el porcentaje de influencia de una variable sobre la otra o la variable que causa la
influencia.

Caractersti muestras Total A


ca A (i) l1 l2 lc ni .

a1 o1,1 o1,2 o1, c ni .

a1 o2,1 o2,2 o2, c ni .

. .
. .
a1 o r ,1 o r ,2 o r ,c nr .

Total n.j n.1 n.2 n. c n..

oij = Frecuencia observada de la respuesta o clase ai de la caracterstica A,

correspondiente a la muestra j.
ni . = Tamao de muestra de la localidad o muestra j.
c c
ni . = o ij ni . = o ij
j=1 j=1

r c r
n= ni . = n. j= oij
i=1 j=1 i =1

159
Con la informacin de este cuadro se procede a realizar la prueba de hiptesis, la
cual debe seguir el procedimiento que se muestra a continuacin.

Ejemplo 1
Alicia Garca es la directora de investigacin de Plaguicidas de un importante Laboratorio
en la ciudad de Chiclayo. En su proyecto actual Alicia debe determinar si existe alguna
relacin entre la clasificacin de efectividad que los consumidores asignan a un nuevo
insecticida y el sitio (urbano o rural) en el cual se utiliza. De los 100 consumidores a
quienes se le aplic la encuesta, 75 vivan en zonas urbanas y 25 en zonas rurales. La Tabla
2. Resume las clasificaciones hechas por los consumidores. (Use =0.10)

Tabla 2.
Clasificacin segn el uso de Plaguicidas

Clasificaci Urbano Rural Total


n
Arriba del 20 11 31
promedio
Promedio 40 8 48

Debajo del 15 6 21
promedio
Total 75 25 100

Solucin
1. Planteamiento de hiptesis
H0: La clasificacin y la ubicacin son independientes.
H1: La clasificacin y la ubicacin No son independientes.

2. Nivel de significancia:
=0.10

3. Estadstico de prueba
k 2
( OE i )
=
2
; 20.10 ;3=4.605
i=1 Ei

4. Regin de aceptacin y rechazo

160
2 2
Si c > t entonces se rechazala Ho

Si 2c > 2t entonces se rechazala Ho

5. Calculamos el estadstico de prueba

Clasificacin Urbano Rural Total


Arriba del 20 11 31
promedio 23.3 7.75
Promedio 40 8 48
36 12
Debajo del 15 6 21
promedio 15.8 5.25
Total 75 25 100

Clculo de las frecuencias esperadas:


n n ( 75 ) ( 31 )
e 11= 1. .1 = =23.25
n .. ( 100 )

n1. n.2 ( 25 ) ( 31 )
e 11= = =7.75
n .. ( 100 )

n2. n.1 ( 75 ) ( 48 )
e 11= = =36
n .. ( 100 )

n2. n.2 ( 25 ) ( 48 )
e 11= = =12
n .. ( 100 )

n3. n.1 ( 75 ) ( 21 )
e 11= = =15.75
n .. ( 100 )

n3. n.2 ( 25 ) ( 21 )
e 11= = =5.25
n .. ( 100 )

161
Estadstico de prueba:

2 ( 2023.3 )2 ( 117.75 )2 ( 4036 )2 ( 812 )2 ( 1515.8 )2 ( 65.25 )2


=
c + + + + +
23.3 7.75 36 12 15.8 5.25

2c =3.76

6. Decisin
2 2
Como c < t , entonces No se rechaza la Ho

7. Conclusin
No existen suficientes evidencias estadsticas con un nivel de significacin =0,05 para
afirmar que la clasificacin de la efectividad y la ubicacin donde se utiliza sean
independientes.

Ejemplo 2
Un investigador quiere estudiar si hay asociacin entre la prctica deportiva y la sensacin
de bienestar. Extrae una muestra aleatoria de 100 sujetos. Los datos aparecen a
continuacin.

Sensacin de Prctica deportiva Total


Bienestar
S no
S 20 25 45
No 10 45 55
Total 30 70 100

Contraste la hiptesis de independencia entre bienestar y prctica de deporte

( = 0.1)

162
Solucin

1. Planteamiento de hiptesis
H0: La prctica deportiva y la sensacin de bienestar son independientes.
H1: La prctica deportiva y la sensacin de bienestar No son independientes.

2. Nivel de significancia:
=0.10

3. Estadstico de prueba
k 2
( OE i ) 2
=
2
; 0.10 ;1=6,63
i=1 Ei

Grados de libertad=(r-1)(c-1)=(2-1)(2-1)=1

Al 0.05 de significancia =6,63

4. Regin de aceptacin y rechazo


Si 2c > 2t entonces se rechazala Ho

Si 2c > 2t entonces se rechazala Ho

5. Calculamos el estadstico de prueba

Sensacin de Prctica deportiva Total


Bienestar S no
S 20 25 45
13,5
32

163
No 10 45 55
16,50 38,5
Total 30 70 100

Estadstico de prueba:

2 ( 2013.5 )2 ( 2532 )2 ( 1016.5 )2 ( 4538.5 )2


=
c + + +
13.5 32 16.5 38.5

2c =8.13

6. Decisin
2 2
Como c < t , entonces se rechaza la Ho

7. Conclusin
Existen suficientes evidencias estadsticas con un nivel de significacin =0,05 para
afirmar que la prctica deportiva y la sensacin de bienestar estn asociadas.

3. Prueba de Homogeneidad
De varias muestras cualitativas, consiste en comprobar si varias muestras de un carcter
cualitativo proceden de la misma poblacin. Es necesario que las dos variables medibles
estn representadas mediante categoras con las cuales construiremos una tabla de
contingencia.

164
Ejemplo: En un estudio para evaluar la aceptacin de un producto X en tres
distritos de Chiclayo, se llev a cabo una encuesta y se encontraron los siguientes
resultados:

Opinin sobre Distrito Total


el producto X
La Jos Chiclayo
Victoria Leonardo
Ortiz
Bueno 69 10 30 109
Regular 62 33 75 170
Malo 19 7 95 121
Total 150 50 200 400

Probar si la opinin sobre el producto X es semejante en los tres distritos.


Use (=0.05)

Solucin
1. Planteamiento de hiptesis

H0: La opinin sobre el producto X es semejante en los tres distritos.

H1: La opinin sobre el producto X No es semejante en los tres distritos

2. Nivel de significancia:
=0.05
3. Estadstico de prueba
k 2
( OE i )
=
2
; 20.05 ;4 =9,488
i=1 Ei

Grados de libertad=(r-1)(c-1)=(3-1)(3-1)=4

Al 0.05 de significancia =9,488

4. Regin de aceptacin y rechazo

165
2 2
Si c > t entonces se rechazala Ho

Si 2c > 2t entonces se rechazala Ho

5. Calculamos el estadstico de prueba

Opinin sobre el Distrito Total


producto X La Jos Leonardo Chiclayo
Victoria Ortiz
Bueno 69 10 30 109
40,875 13,625 54,5
Regular 62 33 75 170
63,750 21,250 85,0
Malo 19 7 95 121
45,375 15,125 60,5
Total 150 50 200 400

Estadstico de prueba:

( 6940,875 )2 ( 1013,625 )2 (3054.5 )2 ( 9560.5 )2


2c = + + + +
40,875 13,625 54,5 60.5

2c =78,42099

6. Decisin
2 2
Como c > t , entonces se rechaza la Ho

7. Conclusin
Existen suficientes evidencias estadsticas con un nivel de significacin =0,05 que la
aceptacin del producto X no es semejante en los distritos de La Victoria, Jos Leonardo
Ortiz y Chiclayo.

166
PROBLEMAS PROPUESTOS

1. Se realiza un estudio para investigar la asociacin entre la recuperacin de una enfermedad


y el uso de vitaminas. Se selecciona 200 pacientes aleatoriamente y se recogen los datos
que se muestra en la tabla.
Recuperacin de la enfermedad
Uso de Total
Se recupera No se recupera
vitaminas
Si 72 68 140
No 48 12 60
Total 120 80 200
A un nivel de significancia de =0.1 pruebe si existe relacin entre las variables analizadas.

2. Se selecciona al azar 236 trabajadores y se les clasifica de acuerdo con sus hbitos de beber
licor, obtenindose los siguientes resultados.
Hbito de licor Rendimiento laboral
Alto Medio Bajo
Bebedor en exceso 28 31 14
Bebedor 29 16 12
promedio
Poco bebedor 17 9 23
No bebedor 27 19 11
Pruebe la hiptesis de independencia de los factores, es decir que el rendimiento laboral de
un trabajador es independiente del hbito que tiene de beber licor, para una significancia
=0.05.

3. En un grupo de enfermos que se quejaban que no podan dormir se les dio somnferos y
placebos. Los datos se muestran en la tabla adjunta.
Duermen bien Duermen mal
Somnferos 58 20
Placebos. 94 48
Es lo mismo tomar somnfero o placebos para dormir bien o mal en este grupo de
enfermos. Pruebe a un nivel de significancia del 5%

4. En el marco de un estudio realizado por el instituto de investigaciones de la universidad


USS, acerca del perjuicio tnico en los universitarios de Chiclayo, se aplic una encuesta a
los estudiantes segn su lugar de residencia. Se obtuvieron los resultados que se presentan
en la siguiente tabla:

167
Lugar de Grado de perjuicio Total
residencia Alto Bajo
AA.HH 32 28 60
Urbanizaciones 225 290 515
Residenciales 50 79 129
Total 307 397 704
A un nivel de significacin del 5% pruebe si las variables perjuicio tnico y Lugar de
residencia son independientes.

5. Se desea probar si la distribucin proporcional del rendimiento en una gran compaa


variaba segn el coeficiente intelectual de los trabajadores, para lo cual se toma una
muestra para cada nivel de CI y se clasifica segn el rendimiento en la compaa en la
siguiente tabla.

Coeficiente intelectual Rendimiento


Deficiente Regular Bueno
Por debajo del promedio 78 75 36
En promedio 53 87 67
Sobre el promedio 21 34 48
Verifique la hiptesis que la distribucin proporcional del rendimiento en la compaa es el
mismo para cada nivel un nivel de significancia del 5%.

6. La tabla contiene el resultado de un experimento para investigar el efecto de vacunacin de


animales de laboratorio, contra una determinada enfermedad. Mediante un nivel de
significacin del 0.05, pruebe la hiptesis de que no hay diferencia entre los grupos
vacunados y no vacunados, es decir que la vacunacin y la enfermedad son independientes.
Superaron la enfermedad Total
Si No
Vacunados 20 78 98
No vacunados 32 62 94
Total 52 140 192

7. La escuela profesional de Psicologa de la Universidad USS desea determinar si existe


asociacin entre el ciclo de estudios del estudiante y su nivel de nerviosismo frente a una
exposicin. Este es medido por una prueba estndar de nerviosismo y ansiedad. Se elige
aleatoriamente 400 estudiantes de los 3 turnos y se obtienen los siguientes resultados.

Ciclo de Nivel de nerviosismo y ansiedad Total


estudio No ligeramente moderadamente extremadamente

168
s
I 20 20 40 80 160
II 10 30 30 30 100
I y II 40 20 10 10 80
IV 40 20 0 0 60
Total 110 90 80 120 400
Realice la prueba al 5% de nivel de significancia.

8. Se visit uno de los restaurantes ms concurridos de la ciudad de Chiclayo, y nuestro


inters fue saber si existe o no relacin entre el consumo de bebidas alcohlicas y el sexo
de la persona, mediante un nivel de significacin del 0,05.
Consumo de bebidas Sexo de la persona total
alcohlicas Mujer varn
No, nunca 17 5 22
Espordicamente 57 11 68
Solo los fines de 69 18 87
semana
Los fines de semana y 16 7 23
un da ms
Total 159 41 200

9. Para conocer la opinin de los ciudadanos de Chiclayo sobre la sentencia al ex alcalde Beto
torres se tom una muestra de 120 personas y se ha obtenido los siguientes resultados:
valor Gl Significancia
asinttica
Ji-cuadrado de 0,343 2 0,842
Pearson
Usando un nivel de significancia del 5%, se puede afirmar que la opinin sobre la sentencia
al ex alcalde es independiente del gnero.

10. En una muestra aleatoria de 100 ciudadanos del distrito de Lambayeque, se les clasific por
su ocupacin: obrero, estudiante, profesional, y se les consult si estn a favor o en contra
de la integracin de un organismo de justicia, propuesto por el congreso. los datos se
muestran a continuacin.
Obrero estudiante profesional
A favor 23 29 27
En contra 25 39 35
Proponga y pruebe una hiptesis para demostrar, con el 5% de significancia, que la opinin
de los ciudadanos es independiente de su ocupacin.

169
CAPTULO XII

REGRESIN Y
CORRELACIN LINEAL

Regresin y correlacin lineal simple

En muchas ocasiones surge la necesidad de estudiar la relacin que existe entre dos
variables cuantitativas que tienen distribucin aproximadamente normal. Por ejemplo,

170
promedio ponderado semestral y nmero de horas de estudio en una muestra de estudiantes
universitario del I Ciclo de estudios. Antes de establecer un modelo que relacione a ambas
variables, es necesario averiguar si estas dos variables esta correlacionadas entre s; es decir
realizar una anlisis de correlacin.
12.1. Anlisis de correlacin de dos variables cuantitativas
El coeficiente de correlacin poblacional entre dos variables aleatorias x e y, se estima
con r.
n Yt X t Yt X t
r

n Yt 2 Yt n X t2 X t
2 2

Las sumatorias en la frmula anterior se realizan sobre las n observaciones, tomadas como
muestra.

Los del coeficiente de correlacin de Pearson se encuentran entre 1 y 1, esto es


1 rx , y 1

Por lo tanto a medida que el valor del coeficiente se acerca a 1 indica que ambas variables
estn fuertemente correlacionadas y de manera positiva o sea que ambas variables varan en
el mismo sentido, al aumentar una aumenta la otra o al disminuir una disminuye la otra.
Cuando el coeficiente se acerca a 1 indica que ambas variables estn fuertemente
correlacionadas y de manera negativa o sea que ambas variables varan en sentido opuesto,
al aumentar una disminuye la otra.
Por otro lado si el valor de r es prximo a 0 indica ausencia de correlacin lineal entre
ambas variables, puede existir otro tipo de relacin entre las mismas (por ejemplo
curvilnea). Los valores de r=+1, r=-1 y r= 0, en la prctica rara vez se presentan.
Lo enunciado anteriormente se puede representar en una grfica llamada diagrama de
dispersin de los datos que permita observar la posible relacin entre las variables.
Diagramas de dispersin que muestra los tipos de relacin entre las variables

Correlacin
12.2. positiva
Significancia Correlacinde
estadstica del coeficiente negativa Ausencia de correlacin
correlacin de Pearson

1. Planteamiento
Figura de la hiptesis
1: se puede observar los tipos de correlacin que existen entre las variables
H0: xy = 0 (las variables no estn correlacionadas)

171
H1: xy 0 (Las variables si esta correlacionadas)

2. Nivel de significancia: =0.05


3. Prueba estadstica:

r( n2)
t=
1r 2
4. Regin de rechazo

RR RA RR RR: Regin de rechazo t = T (/2; n-2)

RA: Regin de aceptacin


-t t

5. Decisin: Si el valor de la prueba estadstica cae a la derecha o a la izquierda del


punto crtico, se rechaza Ho
6. Conclusin: Si se rechaza Ho, se concluye que las variables si estn
correlacionadas.
Si las variables estn correlacionadas podemos realizar un anlisis de regresin para
establecer la forma de esa relacin

12.3. Anlisis de Regresin Lineal Simple

El anlisis de regresin lineal simple es til para estudiar la forma probable de la relacin
entre dos variables (Y: variable dependiente y X: variable independiente), y su objetivo
final es predecir o estimar el valor de la variable dependiente, conociendo un valor
especfico de la variable independiente.
Para poder desarrollar este tipo de anlisis se siguen los siguientes pasos.

Tomar una muestra de n observaciones en las que se consideran dos variables, una variable
x independiente, considerada libre de error es decir una variable fijada de antemano y una
variable y, variable dependiente, considerada variable aleatoria, o sea una de las posibles
respuestas de la variable y a la variable x. Se tienen entonces un conjunto de n pares de la
forma (x,y)
a) Realizar un diagrama de dispersin de las variables (x,y) en un sistema de coordenadas
cartesianas, ya visto anteriormente y calcula el coeficiente de correlacin.
b) En base a la informacin anterior y si se considera apropiado un modelo de recta, encontrar
la ecuacin de la recta que mejor ajuste (o represente) a todos los puntos del diagrama. A
travs de esta ecuacin es posible predecir el valor de y para un determinado valor de x.
c) La ecuacin de la recta es la siguiente:

172
y 0 1 xi i

0
Dnde : Es el intercepto o trmino independiente
1
Es la pendiente, representa el cambio en la variable y por unidad de cambio de la
variable X. Tambin se le llama coeficiente de regresin
i :
Es el error aleatorio determinado por la diferencia entre yi y el valor esperado de y
como variable aleatoria determinada para la x en particular. No se agregarn
Otros supuestos sobre estos errores que son necesarios cuando se realiza un anlisis
inferencial en regresin.
d) Los parmetros poblacionales y deben ser estimados para obtener la recta de
regresin ajustada expresada de la siguiente manera:


y 0 1 x1

y i a yb
Donde ( ) es el valor ajustado o estimado para un cierto valor de x y los valores
son los estimadores o valores que estiman a los parmetros poblacionales y y que se
calculan con los datos muestrales.

Estimacin de la recta de regresin por el mtodo de mnimos cuadrados:


Los valores estimados de 0 y 1 se encuentran utilizando el principio de mnimos
cuadrados:

n xi y i xi y i
1
n xi xi
2 2
0 y 1 x

Dnde:
y : media aritmtica de las y
x : media aritmtica de las x

12.4. Significancia Estadstica del Coeficiente de Regresin

173
Si existe una relacin lineal entre la variable Y y la variable X, el coeficiente de regresin

y 0 1 x1
de la ecuacin , debe ser diferente de cero, es decir debemos realizarse la
siguiente prueba de hiptesis:

1. Planteamiento de las hiptesis


H 0 : 1 0
H 1 : 1 0

2. Nivel de significancia
= 0.05
3. Prueba estadstica

t
S

Var ( )
Donde, un estimador para es:
2
S
2

( X t X )2
Y un estimador insesgado de la varianza del error es
n

e 2
t

(Yt 0 1 X t ) 2
2 i 1

n2 n2

Intervalo de confianza para el coeficiente de regresin:

1
Un intervalo de confianza ( )*100% para el coeficiente de regresin est dado por:


1 t1-n2 [ EE ( 1 )]
2

174
t1-n 2
2
Donde es el percentil apropiado de la distribucin t con (n-2) grados de libertad.

12.5. El coeficiente de determinacin: R2


El coeficiente de determinacin en un anlisis de regresin simple es r2, es decir el
coeficiente de correlacin al cuadrado y nos indica el porcentaje de variaciones observadas
en la variable dependiente que es explicado por las variaciones de la variable
independiente. El coeficiente de determinacin expresa la variabilidad explicada por el
modelo de regresin. A partir de l podeos calcular el coeficiente de alineacin. Este
coeficiente expresa la proporcin de la variabilidad de la variable dependiente no explicada
por el modelo y viene dado por la siguiente expresin: [1 R2 ]

Ejemplo
Se conduce un experimento en 12 sujetos para analizar si la dosis de cierta droga (en ml)
est relacionada con el tiempo de reaccin a un estmulo en segundos.

Droga (ml) 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5
Tiempo (segs) 1,0 0,8 1,8 1,4 2,1 1,8 2,2 3,0 2,75 3,0 4,1 4,9

Realizar un anlisis de correlacin de las variables en estudio. En el caso de que las


variables estn correlacionadas realizar un anlisis de regresin.

Grfico de dispersin del tiempo de reaccin a estmulo


versus dosis de droga
5

3
Tiempo de reaccin (seg)

0 R = 0.8824
0 1 2 3 4 5 6 7

Dosis de droga (ml)

Figura 2: se aprecia la correlacin positiva entre las variables


droga y tiempo.

175
12.6. Coeficiente de correlacin

n Yt X t Yt X t
r
n Yt
2 2

Yt n X t2 X t
2

12130.928.8545
r= =0.939
( 1285.7125 ) (12204.545 )
2 2

Se puede concluir de existe una alta correlacin positiva entre el tiempo de reaccin y dosis
de la droga.

Significancia estadstica del coeficiente de correlacin de Pearson


1. Planteamiento de la hiptesis
H0: xy = 0 (las variables no estn correlacionadas)
H1: xy 0 (Las variables si esta correlacionadas)
2. Nivel de significancia: =0.05
3. Prueba estadstica:
r( n2) 0.939 122
t= = =8.63399455
1r 2 1(0.939)2

4. Regin de rechazo
RR RA RR

-t t
-2.2281 +2.2281 (este valor se ha obtenido de la tabla T de Student
con 10 grados de libertad y con 0.025 de
probabilidad)
5. Decisin: Como el t calculado es mayor que el punto crtico 2.2281, se rechaza Ho
6. Conclusin: Si existe correlacin entre el tiempo de reaccin y dosis de la droga,
con un nivel de significancia de 0.05.

176
Como se observa que si existe una alta correlacin lineal directa entre las variables de
estudio, el siguiente paso es determinar un modelo que los relacione a ambas variables.
Anlisis de Regresin.

y 0 1 x1
Estimacin de la recta de regresin:
Se debe obtener los valores de a y b, mediante las siguientes relaciones:
n xi y i xi y i
1
n xi xi
2 2
0 y 1 x

^ 12 ( 130.9 )45(28.85)
1= =0.63531469
12 ( 204.5 )452

^
0 = (28.85/12) - 0,63531469 (45/12) = 0,02173658

y 0.023 0.64 x1

Significancia estadstica del coeficiente de regresin


Antes veamos algunos clculos auxiliares
x
x


Y^ e^
Y
1 0,657 0,117649 7,5625
0,8 0,97465 0,03050262 5,0625
1,8 1,2923 0,25775929 3,0625
1,4 1,60995 0,044079 1,5625
2,1 1,9276 0,02972176 0,5625
1,8 2,24525 0,19824756 0,0625
2,2 2,5629 0,13169641 0,0625
3 2,88055 0,0142683 0,5625
2,75 3,1982 0,20088324 1,5625
3 3,51585 0,26610122 3,0625
4,1 3,8335 0,07102225 5,0625
4,9 4,15115 0,56077632 7,5625

177
suma 1,92270699 35,75

1. Planteamiento de las hiptesis


H 0 : 1 0
H 1 : 1 0

2. Nivel de significancia
= 0.05
3. Prueba estadstica

t
S

0.63531469
t= =8.663
0.07333622

Var ( )
Donde, un estimador para es:
2 0.1922707
S
2
=0.0053782
( X t X )2 35.75
=

0.07333622
S

Y un estimador insesgado de la varianza del error es


n

e 2
t
(Y
t X t ) 2

2

i 1

n2 n2
1,92270699/(12-2) = 0.1922707
=

4. Regin de rechazo
RR RA RR

-t t
-2.2281 +2.2281 (este valor se ha obtenido de la tabla T de Student
con 10 grados de libertad y con 0.025 de
probabilidad)

178
5. Decisin: como el t calculado(8,66304113) es mayor que el t de tabla(2.2281), se
rechaza Ho
6. Conclusin: se concluye que si existe relacin entre tiempo de reaccin al estmulo
y dosis de la droga, con un nivel de significancia de 0.05

Como existe una relacin lineal entre las variables de estudio, se podra predecir el tiempo
de reaccin al estmulo que tendra un sujeto si la dosis fuera de 7 ml
y 0.023 0.64(7)
= 4,46893941
El tiempo de reaccin es aproximadamente de 4.5 segundos
Un intervalo de confianza del 95% para , es el siguiente:

1 t1-n2 [ EE ( 1 )]
2

0.63531469 2.2281x0.07333622
LI : 0.4719
LS : .0.7987
Como el intervalo de confianza no contiene a la unidad, el coeficiente de regresin es
diferente de cero, por lo que se concluye que el tiempo de reaccin al estmulo y la dosis de
droga estn linealmente relacionas y esta relacin es directa, con un nivel de confianza del
95%
El coeficiente de determinacin es (0.939)2 = 0.882, es decir el porcentaje de variaciones
observadas en el tiempo de reaccin al estmulo que es explicado por las variaciones de la
dosis de la droga es del 87.1%. El porcentaje de variacin del tiempo de reaccin al
estmulo que no es explicado por la dosis de la droga es del 0.118 [1 R2 ]
A continuacin se presenta los clculos realizados con el MegaStat
ANOVA
table
Source SS df MS F p-value
Regression 14,4296 1 14,4296 75,05 5,82E-06
Residual 1,9227 10 0,1923
Total 16,3523 11

Regression output confidence interval

179
coefficient std. t p- 95% 95%
variables s error (df=10) value lower upper
intercept 0,0217 0,3027 0,072 ,9442 -0,6528 0,6963
5,82E-
X 0,6353 0,0733 8,663 06
0,4719 0,7987
12.7. Anlisis de regresin lineal mltiple
En captulos anteriores tratamos el anlisis de regresin simple que trata de relacionar una
variable explicativa cuantitativa con una variable respuesta cuantitativa. Todos los
elementos de ese captulo nos van a servir ahora para continuar con el caso ms general y
de mayor utilidad prctica, que es la regresin lineal mltiple. Por regresin lineal mltiple
entenderemos el anlisis de regresin lineal pero ahora con ms de una variable explicativa.

a) Datos para regresin mltiple


Los datos para regresin lineal simple consisten en pares de observaciones (xi, yi) de dos
variables cuantitativas. Ahora tendremos mltiples variables explicativas, por lo que la
notacin ser ms elaborada. Llamaremos xij el valor de la j-sima variable del i-simo
sujeto o unidad (i=1,2,...,n ; j=1,2,...,p). Los datos se pueden organizar de la siguiente forma
en una base:
1 x11 x12 ... x1p y1
2 x21 x22 ... x2p y2
:
n xn1 xn2 ... xnp yn
Donde n es el nmero de casos o tamao muestral y p es el nmero de variables
explicatorias. Esta es una forma de organizar la base de datos, no importa el orden de las
variables.

Modelo de regresin lineal mltiple:

El modelo estadstico de regresin lineal mltiple es:

yi 0 1 xi1 2 xi 2 p xip i

para i= 1, 2, ...,n

y E (Y )
La respuesta media es una funcin lineal de las variables explicatorias:

y 0 1 x1 2 x 2 p x p

180
i
Las desviaciones son independientes y normalmente distribuidas con media 0 y
i ~ N (0, 2 )
desviacin estndar :

0 , 1 , , p
Los parmetros del modelo son: y , los coeficiente de regresin y la
estimacin de la variabilidad, es decir son en total (p + 2) parmetros.

Si suponemos que la respuesta media est relacionada con los parmetros a travs de la
y 0 1 x1 2 x 2 p x p
ecuacin: , esto quiere decir que podemos estimar la
media de la variable respuesta a travs de la estimacin de los parmetros de regresin. Si
esta ecuacin se ajusta a la realidad entonces tenemos una forma de describir cmo la
x1 , x 2 , , x p
media de la variable respuesta y vara con las variables explicatorias .

b) Estimacin de los parmetros de regresin mltiple.

En regresin lineal simple usamos el mtodo de mnimos cuadrados para obtener


estimadores del intercepto y de la pendiente. En regresin lineal mltiple el principio es el
mismo, pero necesitamos estimar ms parmetros.

b0 , b1 , , b p 0 , 1 , , p
Llamaremos a los estimadores de los parmetros

La respuesta estimada por el modelo para la i-sima observacin es:



y i 0 1 xi1 2 xi 2 p xip

El i-simo residuo es la diferencia entre la respuesta observada y la predicha:


y observado y estimado
residuo =
ei y i y i
El i-simo residuo =



ei y i 0 1 xi1 2 xi 2 p xip

181
b0 , b1 , , b p
El mtodo mnimos cuadrados elige los valores de los estimadores ptimos,
es decir, que hacen la suma de cuadrados de los residuos menor posible. En otras palabras,

0 1 2 p
los parmetros estimados minimizan la diferencia entre la respuesta

y y i
2
i

observada y la respuesta estimada, lo que equivale a minimizar: .

La frmula de los estimadores de mnimos cuadrados para regresin mltiple se complica


porque necesitamos notacin matricial, sin embargo estamos a salvo si entendemos el
concepto y dejaremos a SPSS hacer los clculos.

2
El parmetro mide la variabilidad de la respuesta alrededor de la ecuacin de
2
regresin en la poblacin. Como en regresin lineal simple estimamos como el
promedio de los residuos al cuadrado:

s 2
y x 2 e 2
i

y i y i
2

n p 1 n p 1

La cantidad (n-p-1) son los grados de libertad asociados con la estimacin de la

s 2y x
variabilidad:
s y2 / x
es entonces el estimador de la variabilidad de la respuesta y, tomando en cuenta las
variables explicatorias xj.
y yi
2
i
s 2
y
n 1
Lo distinguimos de que es la variabilidad de y sin tomar en cuenta las
variables explicativas xj.

c) Pruebas de significancia e Intervalos de confianza para los coeficientes de regresin


Podemos obtener intervalos de confianza y test de hiptesis para cada uno de los
j
coeficientes de regresin como lo hicimos en regresin simple. Los errores estndar de

182
b0 , b1 , , b p
los estadsticos muestrales tienen frmulas ms complicadas, as es que
nuevamente dejaremos que SPSS haga su trabajo.

j
Test de hiptesis para :
H0 : j 0
H1 : j 0
Para docimar la hiptesis se usa el test t:
bj
t ~ t (n p 1)
EE(b j )

EE (b j ) bj
Donde es el error estndar de

Notas:
bj
- Vamos a dejar a SPSS el clculo del error estndar de
- Tendremos entonces un test de hiptesis asociado a cada variable explicatoria en el
modelo.
j 0 j 0
- Podemos realizar hiptesis de una cola, donde H1: o H1: , pero lo
usual es hacer el test bilateral.

j
d) Intervalo de confianza para :
1 j
Un intervalo de confianza ( )*100% para est dado por:

bj t ( n p 1) EE (b j )
1
2

t
1
2
donde es el percentil apropiado de la distribucin t con (n-p-1) grados de libertad,
EE (b j ) bj
es el error estndar de

183
e) Intervalos de confianza para la respuesta media e intervalos de prediccin
individual:

Si queremos obtener intervalos de confianza para la respuesta media o intervalos de


confianza para futuras observaciones en los modelos de regresin mltiple, las ideas
bsicas son las mismas que ya vimos en regresin simple y dejaremos el clculo a SPSS.

Tabla de ANOVA para regresin mltiple

La tabla de anlisis de varianza para la regresin mltiple es la siguiente:


gl SC CM
Fuente de variacin Grados de libertad Suma de Cuadrados Cuadrados Medios

Modelo p SCMod ( y y ) 2 SCMod


p

n
SC Re s
SC Re s ( y i y i ) 2
Residuo n p 1 i 1 n p 1

n
SCT y i y
2
Total n 1 i 1

La tabla ANOVA es similar a la de regresin simple. Los grados de libertad del modelo son
ahora p en vez de 1, lo que refleja que ahora tenemos p variables explicatorias en vez de
slo una. Las sumas de cuadrados representan las fuentes de variacin. Recordemos que la
suma de cuadrados total es igual a la suma de los cuadrados del modelo de regresin ms la
suma de los cuadrados del residuo:
SCT = SCMod + SCRes

2
El estimador de la varianza de nuestro modelo est dado por la media cuadrtica
residual MCRes=SCRes/(n-p-1)
f) Estadstico F

184
F MCMod MC Re s
La razn entre el cuadrado medio del modelo y el residuo , permite
estimar si la relacin entre las variables explicatorias y la respuesta es significativa. La
hiptesis que docima el test F es:

H 0 : 1 2 p 0
H 1 : al menos un j no es cero

La hiptesis nula dice que ninguna de las variables explicatorias son predictoras de la
variable respuesta. La hiptesis alternativa dice que al menos una de las variables
explicatorias est linealmente relacionada con la respuesta. Como en regresin simple,
valores grandes de F nos dan evidencia en contra de hiptesis nula. Cuando H 0 es
verdadera, el estadstico F tiene distribucin F de Fisher con (p, n-p-1) grados de libertad.
Los grados de libertad estn asociados a los grados de libertad del modelo y del residuo en
la tabla ANOVA.
Recordemos que en regresin lineal simple el test F de la tabla ANOVA es equivalente al test t
bilateral para la hiptesis de que la pendiente es cero. Ahora, el test F de regresin mltiple
docima la hiptesis de que todos los coeficientes de regresin (con excepcin del intercepto)
son cero, hiptesis que no es de mucho inters. En el problema de regresin mltiple interesan
ms las hiptesis individuales para cada parmetro asociado a cada variable explicatoria.

g) Coeficiente de determinacin (R2)


En regresin lineal simple vimos que el cuadrado del coeficiente de correlacin era
SCReg
r2
SCTotal
y se poda interpretar como la proporcin de la variabilidad de y que poda
ser explicada por x. Un coeficiente similar se calcula en regresin mltiple:
SCMod ( y y )
2

R
2

SCTotal yi y 2

Donde R2 es la proporcin de la variabilidad de la variable respuesta y que es explicada


x1 ,x 2 , ,x p
por las variables explicatorias en la regresin lineal mltiple.
A menudo se multiplica R por 100 y se expresa como porcentaje. La raz cuadrada de R2 es
2

yi
el coeficiente de correlacin mltiple, es la correlacin entre las observaciones y los
y i
valores predichos .

185
Ejemplo
Los datos provienen de un estudio de consumo de helado que abarc las primaveras y
veranos de tres aos. El consumo de helados de midi en pintas per cpita por semana, el
precio del helado en dlares, el ingreso familiar de los consumidores en dlares por
semana y la temperatura en grados Fahrenheit.
Consumo: Y 0.386 0.374 0.393 0.425 0.406 0.344 0.327 0.288 0.269 0.256
Precio: X1 1.35 1.41 1.39 1.40 1.36 1.31 1.38 1.34 1.33 1.39
Ingreso:X2 351 356 365 360 342 351 369 356 342 356
Temperatura:X3 41 56 63 68 69 65 61 47 32 24

Utilizando EXCEL realizar un anlisis de correlacin y regresin lineal mltiple.

Resumen

Tabla 1
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,818538824
Coeficiente de determinacin R^2 0,670005806
R^2 ajustado 0,505008709
Error tpico 0,04207347
Observaciones 10
Tabla 2: anlisis de varianza para el contraste global de los coeficientes
Suma de Promedio de V
Grados de libertad cuadrados los cuadrados F
Regresin 3 0,021564539 0,00718818 4,06071269 0
Residuos 6 0,010621061 0,001770177
Total 9 0,0321856

Tabla 3: Contraste individual de los coeficientes

Coeficientes Error tpico Estadstico t Probabilidad I


Intercepcin 0,535670427 0,709074556 0,755450075 0,47857576 -
Variable X 1 1,104708497 0,528910554 2,088648993 0,08175089 -
Variable X 2 -0,005300135 0,002415974 -2,19378822 0,07070473
Variable X 3 0,003681166 0,001166714 3,155156486 0,01968554

186
Correlaciones entre variables

Figura 3: se muestra la correlacin existente entre las variables temperatura,


ingreso, precio y consumo.

Tabla 4
Correlaciones entre variables
Consumo Precio Ingreso Temperatura
Correlacin de 1 ,338 ,116 ,592
Consumo Pearson
Sig. (bilateral) ,340 ,749 ,072
N 10 10 10 10
Correlacin de ,338 1 ,567 ,180
Precio Pearson
Sig. (bilateral) ,340 ,087 ,619
N 10 10 10 10
Correlacin de ,116 ,567 1 ,585
Ingreso Pearson
Sig. (bilateral) ,749 ,087 ,076
N 10 10 10 10
Correlacin de ,592 ,180 ,585 1
Temperatura Pearson
Sig. (bilateral) ,072 ,619 ,076
N 10 10 10 10

187
De la tabla 1 se puede observar una alta correlacin entre las variables (dependiente e
independientes: 0.82). El 67% de la variacin de la variable dependiente es explicado
por las variables independientes.
Con respecto al contraste global:

H 0 : 1 2 p 0
H 1 : al menos un j no es cero

De la tabla 2 se puede observar el valor crtico F mayor que 0.05, por lo que se acepta
Ho, es decir no existe una relacin lineal entre el consumo, precio, ingreso y
temperatura.
Con respecto a los contrastes individuales

De la taba 3 se puede observar que slo la temperatura se relaciona con el consumo


(probabilidad < 0.05), los otros coeficientes no son estadsticamente significativos
(probabilidad > 0.05).
Observando la tabla de correlaciones, ninguna de las variables se encuentran
correlacionadas (Sig>0.05).
En conclusin se podra decir que no existe una relacin entre el consumo, precio,
ingreso y temperatura.

188
PROBLEMAS PROPUESTOS

En los ejercicios que se presenta a continuacin, se pide:


1. Realizar un anlisis de correlacin
2. Si las variables esta correlacionadas, realizar una anlisis de regresin.
3. Interpretar el coeficiente de regresin
4. Interpretar el coeficiente de determinacin

1. Se llev a cabo un experimento para estudiar el efecto de cierto medicamento para


disminuir la frecuencia cardiaca en adultos. La variable independiente es la dosis en
miligramos del medicamento, y la variable dependiente es la diferencia entre la
frecuencia cardiaca ms baja despus de la administracin del medicamento y un control
antes de administrarlo. Se reunieron los siguientes datos:
Dosis (mg) : 0.5 0.75 1 1.25 1.5 1.75 2 2.25 2.5 2.75
Reduc. R.C(latidos /min): 10 8 12 12 14 12 16 18 17 20

2. Para una muestra de 10 personas disponemos de informacin respecto a su grado de


extroversin, y se desea evaluar su posible relacin lineal con la dimensin de
personalidad estabilidad emocional. Ambas variables se han medido con un test y se han
obtenido las puntuaciones para cada sujeto en una escala de 0 a 10. Los valores
obtenidos se presentan en la siguiente tabla:
Sujetos X: Grado de Y: Estabilidad Emocional
Extroversin
1 5 6
2 10 6
3 4 3
4 7 8
5 6 6
6 5 3
7 4 5
8 4 9
9 4 10
10 3 9

3. Los siguientes datos se relacionan con Y: Ventas anuales en miles de dlares de un


determinado producto y X: Nmero de veces de publicidad en el ao .Los datos son los
siguientes:
X 13 16 14 11 17 9 13 17 18 12
Y 6.2 8.6 7.2 4.5 9.0 3.5 6.5 9.3 9.5 5.7
4. Una empresa de mecnica industrial, tiene informacin de 10 meses, y quiere determinar
si existe alguna relacin entre el gasto mensual en miles de dlares y el nmero de
189
piezas fabricadas. Y: Gasto mensual y X: nmero de piezas fabricadas. Los datos se
presentan a continuacin:
Y 191 170 272 155 280 173 234 116 153 178
X 40 42 53 35 56 39 48 30 37 40

5. Se tiene la hiptesis de que el nmero de expedientes tramitados esta en relacin a los


aos de experiencia del secretario de juzgado. Se tom una muestra de 10 secretarios de
juzgado y durante 15 das de trabajo, se obtuvieron los siguientes datos:
N Exp. 4 9 10 14 4 12 20 3 17 15
tramitados
Aos de 5 10 8 12 6 14 18 4 15 20
experiencia

6. Un consultor de una corporacin, est interesado en el grado de precisin con que un


nuevo ndice de desempeo laboral mide. Una forma de verificacin es analizando la
relacin entre el ndice de evaluacin en el trabajo (X) y el salario del empleado (Y).
Se tom una muestra de ocho empleados y se recabo informacin del salario y el
ndice de evaluacin en el trabajo (1 a 10, donde 10 es la mejor calificacin).
X 9 7 8 4 7 5 5 6
Y 2600 2500 2300 1500 2400 1800 1700 2200

7. En el 2011 se public un trabajo Diseando plantas en climas difciles en la revista


Field Crops Research, los datos usados en la investigacin son:
Duracin 92 92 96 100 102 102 106 106 121 143
Rendimiento 1.7 2.3 1.9 2.0 1.5 1.7 1.6 1.8 1.0 0.3
Con x = la duracin de la cosecha de porotos de soya en das, y = rendimiento de la
cosecha en toneladas por hectrea. Estime el rendimiento si la duracin de la cosecha fue
de 104 das

8. Un investigador cree que la inteligencia de los nios, medida a travs del coeficiente
intelectual (CI en puntos), depende del nmero de hermanos. Toma una muestra
aleatoria de 15 nios y ajusta una regresin lineal simple. Los resultados aparecen en la
salida adjunta.
CI 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90
Hermanos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6

190

También podría gustarte