Está en la página 1de 123

UNIVERSIDAD NACIONAL SAN ANTONIO ABAD

DEL CUSCO

ESCUELA DE POST-GRADO

MAESTRIA EN INGENERIA CIVIL.

CURSO:

ESTADISTICA APLICADA.

CUSCO PERU
2015.
CAPITULO I

INTRODUCCION

La Estadstica es la ciencia que se ocupa de los mtodos y procedimientos de


coleccin, clasificacin, organizacin, anlisis, sntesis e interpretacin de datos;
siendo su caracterstica que la distingue, la de hacer generalizaciones o inferencias
en base a una muestra. En palabras sencillas podramos decir que la estadstica es
la ciencia de los datos
En trminos generales la estadstica aborda dos tipos de problemas:
Resumir, describir y explorar datos.
Utilizar datos de una muestra para inferir la naturaleza del conjunto del cual
se escogi la muestra.

1.1 DIVISION DE LA ESTADISTICA


As, la estadstica se divide en dos partes ntimamente relacionadas:
Estadstica Descriptiva.- Esta es la parte de la estadstica que se dedica a la
organizacin, sntesis y descripcin de conjuntos de datos.
Esta es importante, ya que antes de que la mente humana pueda interpretar
(hacer inferencias) un conjunto de datos, especialmente cuando estos son
demasiados, es necesario resumirlos o representarlos de manera clara,
simplificada o reducida.
Estadstica Inferencial.- Esta rama de la estadstica trata el problema de
inferir la naturaleza de un conjunto de datos a partir de una muestra de dichos
datos.

El problema general de la Estadstica

2
Muestra Inferencias
Poblacin

Que tan reales


es.
Figura 1: Relacin entre poblacin y muestra.

1.2 CONCEPTOS BASICOS


Poblacin. Es cualquier conjunto de datos, objetivo de nuestro inters, sobre
los cuales interesa observar una o ms caractersticas. Esta puede ser finita o
infinita. El tamao de la poblacin es el nmero de individuos que tiene
Muestra. Una muestra es un conjunto de individuos de la poblacin que refleja
las caractersticas de sta lo mejor posible. Si las caractersticas quedan bien
reflejadas, se dice que la muestra es representativa. El tamao de una muestra
es el nmero de individuos que tiene, lo denotamos por n.
Unidad de estudio. Es cada elemento que va a ser estudiado. Lo ms normal
es que se trate de individuos, pero no tiene por qu ser as.
Data. Es cualquier medida resultado de haber observado una variable en una
unidad de alguna poblacin.
Parmetro es una propiedad descriptiva de una poblacin. Ejemplo media y
varianza poblacional
Estadstico es una propiedad descriptiva de una muestra., ejemplo media y
varianza muestral
Variable. Cualquier caracterstica de Inters en el estudio.
Variable cualitativa: Ordinal y Nominal
Variable cuantitativa: Discreta y continua.
Por otra parte, el reporte de las variables medidas requiere de los siguientes
conceptos:
Exactitud. Hace referencia a la cercana con la que se encuentra la medicin
realizada con el valor real de la variable medida, esta relacionado con el
concepto de la media.
Precisin. Hace referencia a la cercana con que se encuentran un conjunto de
mediciones realizadas sobre la misma variable, relacionado con el concepto de
varianza.

3
1.3 VARIABLES ESTADISTICAS
A las caractersticas objeto de estudio en la poblacin se les llama variables, ya
que pueden variar de un individuo a otro y se representara por una letra
mayscula: X, Y, Z,. . ., debemos distinguir los distintos tipos de variables que
hay, lo cual nos va a permitir utilizar las herramientas estadsticas apropiadas.

Tipos de variables.
Las variables estadsticas pueden ser de dos tipos:
Variables cualitativas o atributos: describen cualidades y no toman valores
numricos, estas a su vez pueden ser:
Nominales.- Las cualidades no presentan ningn orden.
Ejemplo.
Nombres y/o Razn Social de la empresa constructora.

Ordinales.- Este tipo de variables presentan orden


Ejemplo.
Nivel de riesgo de una obra
Nivel Socioeconmico,

Variables cuantitativas: toman valores numricos. A su vez pueden ser:


Discretas: Solo toman un nmero finito o infinito numerable de valores
distintos (generalmente nmeros naturales o enteros).
Nmero de obras ejecutadas.
Nmero de empresas que son calificadas como Micro y Pequeas
Empresas (MYPE).
Nmero de empleados de un Municipio.

Continuas: Toman valores en un intervalo. Generalmente corresponden a


medir magnitudes continuas.
Ejemplo.
Los Sueldos de los trabajadores de las Micro Empresas.
Monto de ejecucin presupuestal.

4
Saldo de balance.

Una caracterstica esencial de este tipo de variables es que sus valores nunca
son observables con exactitud, sino que dependen (las observaciones) de la
precisin del instrumento de medida.

1.4 MEDICION
Se llama medicin al proceso de atribuir nmeros a las caractersticas.
Tenemos las siguientes escalas de medicin: nominales, ordinales,
cuantitativas de intervalo y cuantitativas de razn.

Escala nominal: la clave de estas escalas de medida es que slo informan de la


igualdad o desigualdad de los individuos en una caracterstica, pero no de
posibles ordenaciones, puesto que la caracterstica a la que se refieren no se
tiene en mayor o menor medida, sino que simplemente adopta formas
cualitativamente distintas. Los nmeros solo sirven para distinguir valores o
categoras diferentes de la variable.
Ejemplo:
Nombres y/o Razn Social de la empresa ya sean Personas Naturales y
Personas Jurdicas. 1=Aries y 2=Daz, esto simplemente es un proceso de
codificacin pero no significa que la Aries sea menor que Daz, ni el doble.

Escala Ordinal: Los nmeros adems de servir para distinguir reflejan un orden
existente sobre los valores de la variable.
Se obtiene clasificando objetos o arreglndolos en un orden con respecto a
alguna variable comn. La pregunta es simplemente, si el objeto tiene ms o
menos de esta variable que algn otro objeto.
Ejemplo:
El dato representado por 5 es superior al representado por 2 en excelente=5,
bueno =4, regular =3 y malo = 2. es cierto la relacin de orden 2<3<4<5.
Escala de Intervalo: Aqu los nmeros para clasificar los objetos representan
tambin incrementos iguales del atributo que se esta midiendo . Esto significa
que los nmeros pueden ser comparados. La diferencia en 1 y 2 es la misma
que entre 2 y 3, pero es solo la mitad de la diferencia entre 2 y 4, sin embargo,

5
la ubicacin del punto no es fija, puesto que 0 no denota la ausencia del
atributo.
Las temperaturas Fahrenheit y Centgrados son medidas que tiene diferentes
escalas de intervalo y diferentes puntos de 0.

Escala de Razn: Medida numricas en las cuales cero es un valor fijo en


cualquier escala y la diferencia entre valores es diferente
Adems de la distancia de orden e intervalo, se aade un origen absoluto de
forma que no solo cabe hallar distancias (ya en la escala de intervalo), si no
tambin mltiplos exactos. En este caso, el valor representado por 4 tiene
doble cantidad medida que l representado por un 2. Este es el caso por
ejemplo de la variable edad expresado en aos.
40 aos y 20 aos son edades distintas
40 aos es superior a 20 aos
entre 40 y 20 hay una diferencia de 20, la misma que entre 50 y 20 .
El 0 tiene sentido. Una persona con 0 aos, realmente no tiene edad todava
no ha nacido. De esta forma, 40 es exactamente el doble de 20.

6
Resumen de escalas de medicin

Informacin Transform. Pruebas


Tipo Ejemplos
deducible admisibles Estadsticas
Tipo de No
Relaciones igual que Aplicaciones actividad que paramtricas
Nominal
o distinto que inyectivas realiza La
empresa.
Grado de
conocimiento de
Relaciones mayor Funciones normas de
Ordinal
que o igual que crecientes construccin ,
nivel
socioeconmico.
Igualdad o Parametricas.
Temperatura,
Intervalo desigualdad de A + b.x (b 0)
inteligencia
diferencias
Presupuesto de
Igualdad o una obra,
Razn desigualdad de B .x (b 0) Nmero de
razones obras
ejecutadas.

7
Pruebas estadsticas de acuerdo a la escala de medicin

Tipo de Escala de la Mtodo o Tcnica Estadstica.


Descripcin variable o
asociacin.
Variables Categoras Frecuencias, proporciones, o porcentajes
individuales (Nominal y Ordinal) representados por grafico de barras,
sectores o pictogramas.
Variables Numrica(Intervalo -Distribucin de frecuencias en clases,
individuales o razn) frecuencias acumuladas.
-Medidas de tendencia central, dispersin,
posicin y de forma.
Asociacin Categoras con -Tablas de contingencia.
entre variables Categoras -Calculo de riesgos.
-Pruebas de chi-cuadrado:independencia
-Grafico de barras
-Pruebas de Kendall, de Spearman.
Asociacin Categoras con -Tablas con clasificacin categrica, con
entre variables Numrica promedios, desviaciones, etc.
-Regresin Logstica.
-Diseo experimental
Asociacin Numrica con -Grafico de puntos
entre variables Numrica - Anlisis de regresin, coeficiente de
correlacin.

8
Pruebas estadsticas inferenciales de acuerdo a la escala de medicin de la
variable en estudio.
Tipo de Escala de la Mtodo o Tcnica Estadstica
Descripcin variable o
asociacin
Variables Nominal -Prueba Z para una proporcin
individuales poblacional.
-Prueba de chi-cuadrado para varias
proporciones en una sola poblacin.
-Intervalos de confianza para
proporciones.
-Prueba de McNemar,
-Prueba de Mantel Haenzel
Variables Ordinales -Prueba de signos o binomial para la
individuales o media poblacional.
mas de una -Pruebas de wilcoxon para rangos.
variable Prueba de U Mann Whitney( dos o mas
poblaciones)
-Prueba de Kruskal Wallis.
-Prueba de Friedman.
Variables Intercalar o de -Prueba de t para una media poblacional.
individuales razn. -intervalos de confianza.
Mas de una Intercalar o de -Prueba de hipotes e intervalos de
variables razn confianza para diferencia de medias.
-Prueba de varianzas

Existen varias pruebas, algunas de ellas se desarrollaran en el curso. La mayor parte


de las escalas ordinales y de razn son analizados con pruebas no paramtricas, en
cambio las escalas de razn e intercalar son analizados con estadstica paramtrica.

1.5 INVESTIGACIN CIENTFICA


La investigacin cientfica, segn Alejandro Caballero Romero se puede
entender como un conjunto de actividades que realizamos para obtener
conocimientos nuevos, sobre problemas nuevos que afectan la realidad,

9
pero que sean nuevos, respecto a la ciencia, es decir, respecto al
conjunto de conocimientos ya provisionalmente establecidos y
sistematizados por la humanidad, conocimientos nuevos que, como
aportes, se sumarn a la Ciencia.

Qu es investigar?
Es la forma ms adecuada de aproximarse al conocimiento de la verdad
mediante verdades parciales.

1.5.1 PLANTEAMIENTO Y FORMULACION DEL PROBLEMA DE


INVESTIGACIN.

QU ES UN PROBLEMA?
De manera general se considera que hay un problema cuando lo que
debera ser, difiere de lo que es.
el debera ser, es el marco referencial, el patrn comparativo, el ideal, el
modelo, el paradigma.
Lo que es, representa la realidad, es la prctica.

1.5.1.1 Planteamiento del problema


Definir el problema significa identificar la causa que motiva la investigacin, la
situacin de fondo que sugiere que una investigacin debe ser analizada.

1.5.1.2 Formulacin del problema


Primero se debe identificar y definir claramente los indicadores, luego
plantearse las preguntas fundamentales a la que la investigacin pretende
dar respuesta y que concentren la atencin del investigador.
Para la formulacin de las preguntas se debe considerar las variables y los
indicadores, teniendo una idea clara sobre los aspectos en que se debe
incidir en la investigacin.
La investigacin, en la prctica es un proceso permanente de preguntas y
respuestas, por ello son necesarias las preguntas fundamentales para una
mejor orientacin del trabajo.

10
1.5.1.3 Componentes del titulo de un problema de investigacin.
El titulo de un problema de investigacin debe tener los siguientes
componentes.

Especificidad Situacin Unidad de Espacio Tiempo


problemtica estudio

La especificidad y la situacin problemtica


Es el aspecto o los aspectos concretos que se quiere investigar acerca del
hecho o situacin problemtica. Por ejemplo: causas, consecuencias,
caractersticas, influencia, tendencia, modalidades, incidencia, implicancias,
estructura, funcin, nivel, relacin, evolucin, etc.
El hecho o situacin problemtica y la especificidad son los elementos
centrales del problema. Estos elementos constituyen las variables.

Unidades de observacin
Son aquella en las se ponen de manifiesto los hechos o situaciones
problemticas y constituyen, desde el punto de vista estadstico, la poblacin
o muestra a la que se refiere la investigacin. Son: Personas, grupos sociales,
seres, acontecimientos, instituciones, objetos, procesos.

Espacio
Esta referido al lugar en el que ocurre el hecho o situacin problemtica.
Puede ser geogrfico o administrativo. Dnde?

Tiempo
Est referido al momento en que ocurre el hecho o situacin problemtica.
Cundo?

11
1.5.2 NIVELES DE INVESTIGACIN.
El nivel o tipo de investigacin segn Victor Colque V., se clasifica en:

1.5.2.1 Investigacin Descriptiva


Orientada al descubrimiento de las propiedades particulares del hecho o
situacin problemtica y tambin a la determinacin de la frecuencia con que
ocurre el hecho o situacin problemtica.
Ejemplo 5:
Nivel de conocimiento de los protocolos de construccin por los ingenieros
civiles, de la poblacin de la ciudad de Cusco, 2009.

1.5.2.2 Investigacin Explicativa


Orientada al descubrimiento de las causas o consecuencias o condicionantes
de la situacin problemtica.
Ejemplo 6:
Principales causas de la desercin escolar en la regin andina del Per,
2009.

1.5.2.2 Investigacin Comparativa


Orientada al estudio de las semejanzas o diferencias de un hecho o situacin
problemtica en dos circunstancias diferentes.
Ejemplo 7:
Nivel de aplicacin de protocolos de seguridad en las construcciones de
las provincias A y B de Cusco, 2009.

1.5.2.3 Investigacin Relacional


Orientada al descubrimiento de la influencia de un hecho o situacin
problemtica en otro hecho o situacin problemtica.
Ejemplo 8:
Influencia de la internet en la lectura de los estudiantes de secundaria de
la Ciudad del Cusco, 2008.

12
1.5.2.4 Investigacin Correlacional
Orientada a descubrir la covariacin o correspondencia entre los valores de
dos hechos o situaciones problemticas.
Ejemplo 9:
Correlacin entre hbitos de estudio y aprendizaje en los estudiantes de
la Universidad de Nacional San Antonio Abad del Cusco, 2008.

1.5.2.5 Investigacin Experimental


Orientada a descubrir la validez de un hecho para la modificacin de una
situacin problemtica.
Ejemplo 10:
Evaluacin del efecto del uso de tres tipos de materiales de construccin
en la resistencia de vigas de las edificaciones en la ciudad de Cusco,
2009.

1.5.3 TIPOS DE VARIABLES UTILIZADAS EN LA INVESTIGACION CIENTIFICA.

1.5.3.1 Variable independiente


Es aquella que juega un rol determinante, causal o de influencia en otra u
otras variables, supone cierta autonoma con relacin a las dems
variables, pero es necesario, sealar que las variables independientes en
determinados problemas, pueden cambiar, segn sea la posicin que
ocupen en el enunciado, debido a que la realidad est en movimiento y
que todos los hechos estn concatenados.

Este tipo de variable se encuentra en las siguientes investigaciones:


1. Explicativa,
2. Relacional
3. Experimental ( en la experimental se le conoce como estmulo)

1.5.3.2 Variable dependiente


Es aquella que juega un rol de consecuencia, al ser determinada,
originada o influida por la variable independiente. Esto significa que no
pueden existir variables dependientes sin las independientes.

13
Considerando el tiempo, las independientes son ms antiguas que las
dependientes. Se encuentran en las siguientes investigaciones:
1. Explicativa
2. Relacional
3. Experimental (La variable dependiente en una investigacin
experimental se le conoce como respuesta)

Ejemplo 11:
En el problema influencia del uso de mapas mentales en el rendimiento
acadmico de los estudiantes de las I.E de la regin de Cusco, 2008.
Variable independiente: Rendimiento Acadmico
Variable dependiente: Uso de mapas mentales

1.5.3.3 Variable Intermedia


Es aquella que juega un rol de factor condicionante, pues su presencia
entre la variable independiente y variable dependiente hace que sin tener
el carcter de factor causal o determinante, modifique le resultado ms
complejas y de mayor profundidad.

Ejemplo 12:
En el estudio de formacin acadmica y rol de la experiencia en el
desempeo profesional, Quillabamba. 2008.
Variable independiente: formacin acadmica.
Variable Dependiente: Desempeo profesional
Variable Intermedia : Experiencia

1.5.3.4 Variable interviniente


Es aquella que en ciertas medida juega un rol pasivo en el problema,
pues permite medir las caractersticas, atributos, estructuras, incidencia,
elementos o aspectos que se son inherentes.

La variable interviniente, la encontramos en investigaciones:


1. Descriptiva
2. Comparativa.

14
Ejemplo 13:
En el problema: Niveles de desnutricin de los pobladores de las
provincias altas, 2008.
Variable interviniente : Nivel de desnutricin.

1.5.3.5 Variables Asociadas


Son aquellas que no guardan mayor nivel de dependencia, no hay
relacin causal entre ellas y considerando el criterio tiempo vienen a ser
ms o menos contemporneas, pues para que aparezca el problema
surgen de manera simultnea.

Este tipo de variables, se encuentra en la investigacin descriptiva


multivariable, se trata de dos o ms variables intervinientes, por lo que
nunca van acompaadas de algn otro tipo de variables.

Ejemplo 14:
En el problema: Rasgos sociales y culturales de los trabajadores de la
ciudad de Cusco , 2008.

Las variables asociadas son rasgos sociales y rasgos culturales

1.5.3.6 Variables Interdependientes


Son aquellas que indistintamente pueden ser consideradas como causa o
como consecuencia una de otra. Corresponden a la investigacin
correlacional.

Ejemplo 15:
En el problema: Correlacin entre tipo de alimentacin y obesidad de los
ingenieros de la ciudad de Cusco, 2009.
Las variables interdependientes, son tipo de alimentacin y obesidad

15
Resumen del tipo de variables segn tipo de investigacin.

Descriptiva Comparativa Explicativa


Interviniente Interviniente Independiente(s)
Asociada Dependiente(s)

Relacional Correlacional Experimental


Independiente Interdependiente Estimulo (Factor)
Dependiente Interdependiente Respuesta

Observaciones:
1. Las variables segn su naturaleza se clasifican en cuantitativas y
cualitativas.
2. Las variables segn su relacin casual se clasifican en: independiente,
dependiente, interviniente.
En el rea de las ciencias de la salud, se tiene los siguientes tipos de
investigacin biomdica.

1.6 RECOPILACIN DE DATOS.


Dentro de un proceso de investigacin una de las actividades que se realizan
es la recopilacin de datos, la cual es el acopio de informacin y se incluye
desde elaborar fichas bibliogrficas hasta la aplicacin de cuestionarios con
el empleo de tcnicas de muestreo.
Para Hernndez et.al. (2006) un instrumento de medicin es un recurso que
utiliza el investigador para registrar informacin o datos sobre las variables
que tiene en mente.
La construccin de instrumento consiste en generar un nmero suficiente de
tems para medir todas las variables con todas sus dimensiones.

La recopilacin de datos, se puede realizar mediante:


Investigacin documental
Investigacin de campo

16
La investigacin documental. Consiste en el estudio de documentos
escritos sobre un objeto determinado, es decir son todos aquellos
documentos registrados en diferentes dispositivos fsicos a los que podemos
tener acceso en forma directa o indirecta para su consulta y se puede
clasificar en:
1.- Documental bibliogrfica 4.- Documental audiogrfica
2.- Documental hemerogrfica 5.- Documental videogrfica
3.- Documental escrita 6.- Documental iconogrfica

La investigacin de campo. Consiste en obtener informacin directa


mediante diferentes actividades por contacto directo con el hecho que se
quiere investigar as como las personas relacionadas y se puede realizar:
a) Por observacin directa
b) Por interrogacin

La observacin. Es el procedimiento emprico bsico, el cual consiste en


realizar la percepcin intencionada de una actividad determinada mediante la
experimentacin la cual consiste en la obtencin de datos cuantitativos por
medio de la medicin del fenmeno que se este observando. Para realizar la
observacin se utilizan diversos instrumentos auxiliares los cuales son:
1.- La ficha de campo 3.- La entrevista
2.- Estudio de Actividades 4.- La encuesta

La Entrevista. Es una de las tcnicas ms comunes y es considerada como


la relacin directa entre el investigador y el objeto de estudio a travs de
individuos o grupos con el fin de obtener testimonios reales.
a) Entrevistas formales
b) Entrevistas informales

La Encuesta. Consiste en recopilar informacin sobre una parte de la


poblacin.
La informacin recopilada puede emplearse para un anlisis cuantitativo con
el fin de identificar las magnitudes del problema.

17
El Cuestionario. Es un eficaz auxiliar en la observacin cientfica que
contiene aspectos del fenmeno esenciales, las cuales son preguntas
formuladas por escrito y no es necesaria la presencia del investigador.
- Cuestionarios por correo
- Cuestionario administrado por el entrevistado
- Cuestionario administrado por el entrevistador

La Cedula. Tiene carcter de annimo, donde el encuestador es quien llena


la cedula de entrevista, adems de que es posible aclara la informacin sobre
las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural.

1.7 ESCALAS PARA LA CLASIFICACION DE ACTITUDES


La escala de clasificacin por categoras es la que usan ampliamente los
investigadores de ciencias de la salud y sociales.

Escala de clasificacin por categoras:


Existen cuatro categoras a partir de las cuales los entrevistados pueden elegir
para sealar su nivel general de satisfaccin.
- Muy satisfecho (+2)
- Satisfecho (+1 )
- Algo satisfecho (0)
- No del todo satisfecho (-1)

Escala De Comparacin:
Es una versin de la escala de categoras, califica a estas categoras como:
excelente, muy bueno, bueno, regular y deficiente, eliminando de esta
forma la comparacin implcita. El problema con tal escala es que el punto de
referencia es poco claro y diferentes entrevistados pueden usar diferentes
puntos de referencia o estndares.

Escala de Likert:
La escala de Likert requiere que un entrevistado indique un grado de acuerdo o
desacuerdo con respecto a una variedad de afirmaciones (reactivos)
relacionadas con el objeto de las actitudes.

18
Es un tipo de instrumento de medicin o de recoleccin de datos que
disponemos en la investigacin social.

Es una escala para medir las actitudes.

Consiste en un conjunto de tems bajo la forma de afirmaciones o juicios ante


los cuales se solicita la reaccin (favorable o desfavorable, positiva o
negativa) de los individuos.

Alternativas o puntos en la escala de Likert


Asignacin Asignacin Alternativa Alternativa Alternativa Alternativa
Numrica Numrica A B C D
I II
2 5 Muy de Totalmente Definitivamen Completame
acuerdo de acuerdo te s nte
verdadero
1 4 De acuerdo De acuerdo Probablemen Verdadero
te s
0 3 Ni de Neutral o Indeciso Ni falso, ni
acuerdo, ni indiferente verdadero
en
desacuerdo
-1 2 En En Probablemen Falso
desacuerdo desacuerdo te no
-2 1 Muy en Totalmente Definitivamen Completame
desacuerdo en te no nte falso
desacuerdo

Para obtener las puntuaciones de la escala de Likert, se suman los valores


obtenidos respecto de cada items. El puntaje mnimo resulta de la multiplicacin del
nmero de tems por 1. Una puntuacin alta est dada por el nmero de tems o
afirmaciones multiplicado por 5.

19
PM--------------------I----------------------I----------------------I------------------PA

Donde: PM: Puntaje mnimo y PA: Puntaje Mximo.

Ejemplo 16: Ha encontrado en la institucin el apoyo y las facilidades necesarias


para que usted desarrolle de modo ptimo su trabajo.

( ) Definitivamente s

( ) Probablemente s

( ) Indeciso

( ) Probablemente no

( ) Definitivamente no

Ejemplo 17: El jefe de personal se preocupa por el bienestar del recurso humano.
Categoras de Respuesta Frecuencia Porcentaje Asignacin de
puntajes
Totalmente de acuerdo (5) 2 4.4% 2(5)
De acuerdo (4) 4 9% 4(4)
Indeciso (3) 7 15.6% 7(3)
En desacuerdo (2) 9 20% 9(2)
Totalmente en desacuerdo (1) 23 51% 23(1)
n=45 100% Total=88

Para interpretar el puntaje se ubica en los tramos de la escala de likert.


Totalmente En desacuerdo Indeciso De acuerdo Totalmente de
En desacuerdo (1) (2) (3) (4) Acuerdo (5)
45*1=45 45*2=90 45*3=135 45*4=180 45*5=225

La puntuacin 88 se aproxima a 90, por lo tanto se ubica en la parte que indica en


desacuerdo.

20
BAREMACIN DEL INSTRUMENTO, UTILIZANDO ESCALA DE LIKERT.
Para medir la variable de estudio se aplico una encuesta utilizando la escala de
likert, la misma que presenta en cada tems cinco alternativas, a partir de las cuales
los entrevistados pueden elegir, con la finalidad de sealar su nivel de acuerdo.

- Alternativa a (5)
- Alternativa b (4)
- Alternativa c (3)
- Alternativa d (2)
- Alternativa e (1)

Para obtener las puntuaciones de la variable de estudio, se suman los valores


obtenidos respecto de cada tem. El puntaje mnimo (PM) resulta de la multiplicacin
del nmero de tems (x) por 1. Una puntuacin alta (PA) est dada por el nmero de
tems o afirmaciones multiplicado por 5.

PM--------------------I----------------------I----------------------I------------------PA

Para facilitar la interpretar las puntuaciones de la variable de estudio se


transforman a una escala cualitativa, segn el siguiente criterio.

Puntaje Obtenido Categora


Puntaje 1.5x Deficiente
1.5x Puntaje 2.5x Malo
2.5x Puntaje 3.5x Regular
3.5x Puntaje 4.5x Bueno
Puntaje 4.5x Muy bueno

21
CONFIABILIDAD Y VALIDEZ.
Confiabilidad.
La fiabilidad de una medida analiza si sta se halla libre de errores aleatorios y, en
consecuencia, proporciona resultados estables y consistentes (Snchez y Sarabia,
1999:367).
Para valorar la fiabilidad (consistencia interna) de la escala se calcula el coeficiente
Alpha de Cronbach para el total de la muestra. El valor mnimo aconsejable es 0,7.

Para calcular el coeficiente de confiabilidad se usa el COEFICIENTE ALFA DE

CROMBACH, definido mediante:

donde:

k: Nmero de preguntas.

S2r : Varianza de cada pregunta.

Si2 : Varianza del instrumento.

La validez de una medida analiza si el instrumento utilizado mide lo que el


investigador pretende medir. La validez tiene tres aspectos: validez de contenido,
validez de construccin y validez de criterio (Nunnally, 1987:100).

La validez de contenido se refiere al grado en el que la medida recoge el dominio del


concepto estudiado (Snchez y Sarabia, 1999:382).

La validez de construccin, medida de forma convergente, significa que un mismo


fenmeno medido de diversas formas independientes da lugar a resultados
similares. La existencia de validez convergente significa que existe una
corroboracin por procedimientos independientes del concepto bajo estudio, los
cuales pueden ser tanto un tipo diferente de escala como valoraciones procedentes

22
de diferentes tipos de sujetos sobre el mismo concepto (Snchez y Sarabia,
1999:385).

La validez de criterio se refiere al grado de eficacia con el que se puede pronosticar


una variable a partir de la medicin efectuada (Snchez y Sarabia, 1999:386).

VALIDACIN DEL INSTRUMENTO (ENCUESTA) MEDIANTE EL CRITERIO DE


EXPERTOS

INSTRUCCIONES:
El presente documento, tiene como objetivo el de recoger informacin til de
personas especializadas en el tema, acerca de la validez del instrumento de
recoleccin de datos.

Se compone de 10 tems, los que se acompaan con su respectiva escala de


estimacin que significa lo siguiente:
1. Representa una ausencia de elementos que absuelven la interrogante
planteada
2. Representa una absolucin escasa de la interrogante
3. Significa la absolucin del tem en trminos intermedios
4. Representa estimacin que el trabajo de investigacin absuelve en gran
medida la interrogante planteada.
5. Representa el mayor valor de la escala y debe ser asignado cuando se
aprecia que el tem es absuelto por el trabajo de investigacin de una
manera totalmente suficiente.

Marque con una (X) en la escala que figura a la derecha de cada tem, segn la
opcin que le merezca el instrumento de investigacin.

23
HOJA DE PREGUNTAS PARA LA VALIDACION

PREGUNTAS ESCALA DE VALORACIOiN

1. Considera usted que los tems


del instrumento miden lo que se
pretende medir? 1 2 3 4 5

2. Considera usted que la cantidad


de tems registrados en esta
versin son suficientes para tener una 1 2 3 4 5
comprensin de la materia de estudio?

3, Considera usted que los


tems contenidos en este instrumento,
son una muestra representativa del 1 2 3 4 5
universo materia del estudio?

4. Considera usted que si aplicamos


en reiteradas oportunidades este
instrumento a muestras similares, 1 2 3 4 5
obtendramos tambin datos similares?

5. Considera usted que los


conceptos utilizados en este
instrumento, son todos y cada uno de 1 2 3 4 5
ellos, propios de las variables del
estudio?
6. Considera usted que todos y cada
uno de los tems contenidos en este
instrumento tienen los mismos 1 2 3 4 5
objetivos?

7. Considera usted que el


lenguaje utilizado en el presente
instrumento es claro, sencillo y no da 1 2 3 4 5
lugar a diversas interpretaciones?

8. Considera usted que la estructura 1 2 3 4 5


del presente instrumento es adecuada
al tipo de usuario a quien se dirige el
instrumento?

9. Estima usted que las escalas 1 2 3 4 5


de medicin utilizadas son pertinentes a
los objetos materia de estudio?

10. Que aspectos habra que modificar, que aspectos tendran que incrementarse o que
aspectos habra que suprimirse?

24
EJERCICIOS PROPUESTOS.

1. Influencia del uso del tipo de cemento en la resistencia de los soportes de


construccin en la ciudad de Cusco. Especifique.
b. La poblacin.
c. La(s) variable(s) de estudio y el tipo de variable.
d. La escala de medicin a emplear.
e. Tipo de estudio.
2. Se hizo una encuesta entre los ingenieros sobre el nivel de acuerdo con la
medidas preventivas respecto a desastres naturales propuesta por el
gobierno.
Medidas preventivas respecto a desastres Frecuencia
naturales
Totalmente de acuerdo 15
De acuerdo 40
Indeciso 25
En desacuerdo 10
Totalmente en desacuerdo 6
En base a la informacin, realice el anlisis correspondiente.
3. Clasificar cada una de las siguientes variables :
a. Nivel economico (Bajo, Medio, Alto).
b. Sexo.
c. Edad.
d. Nivel educativo (primario secundario, superior).
e. Aos de experiencia.
f. Ingreso econmico.
g. Tipo de seguro (privada o pblica).
h. Estrato social (bajo, medio o alto).
i. Numero Telefnico
j. Numero de DNI de un profesor.
k. Tipo de material de construccin.
l. Caudal mximo.
m. Resistencia de materiales-

25
CAPITULO II

ORGANIZACIN Y PRESENTACIN

La presentacin de datos a travs de tablas estadsticas es una actividad importante


dentro de los sistemas de informacin, estas se fortalecen significativamente cuando
se la acompaan con grficos descriptivos ilustrativos. En el contexto de los
sistemas de informacin, en ms de una oportunidad se encontrara que un buen
grafico resume y expresa mucho ms que prrafos completos de comentarios e
interpretaciones literales.
Resumir los datos es un procedimiento til para conseguirlo y puede hacerse
mediante tablas, grficos o valores numricos. A lo largo de este tema veremos las
principales tcnicas numricas y grficas que nos permiten describir una
caracterstica de inters observada en una poblacin, poniendo en relieve sus
rasgos ms importantes.

2.1 TABLA DE FRECUENCIAS.


Un primer resumen de la informacin contenida en un conjunto de datos
observado se obtiene al organizarlos en lo que se llama una tabla de
frecuencias. En sta se recogen los distintos valores (nmeros o categoras)
que toma la variable junto con sus correspondientes frecuencias de aparicin.

2.1.1 TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS


Si en una muestra de n elementos, se observa k categoras diferentes C 1,
C2,, Ck de una variable cualitativa X.
Para resumir la informacin, previamente definimos algunos conceptos.

26
La frecuencia absoluta de un valor Ci es el nmero de veces que dicho valor
aparece en la muestra. Se representa por fi y cumple
k

f
i 1
i f 1 f 2 ...... fk n

La frecuencia relativa de un valor Ci es el cociente de la frecuencia absoluta


(fi) entre el tamao de la muestra (n), se representa por hi
k
fi
hi
n
, se cumple h 1
i 1
i

La frecuencia absoluta acumulada del valor i-simo es la suma de las


frecuencias absolutas hasta dicho valor, se denota por Fi
Fi f 1 f 2 ...... fi

La frecuencia relativa acumulada del valor i-simo es la suma de las


frecuencias relativas hasta dicho valor, se denota por F i
Fi
Hi h1 h2 ...... hi , Hi
n
Una tabla de frecuencias tiene la siguiente estructura:
Categora Frecuencias Frecuencias Frecuencias frecuencias frecuencias
de la absolutas relativas Porcentuales absolutas relativas
variable fi hi pi acumuladas acumuladas
X Fi Hi
C1 f1 h1 p1 F1 H1
C2 f2 h2 pi F2 H2
.
Ck fk hk pk Fk=n Hk=1
Total n 1.00 100.00

GRAFICAS.
Las representaciones grficas prcticamente estn orientadas de acuerdo con
las necesidades del investigador o estadstico, de todas formas se tienen
algunas normas de trabajo y representacin, que tienen por objeto facilitar la

27
lectura de los datos e informacin que se maneja estadsticamente. Las
principales representaciones son:
La calidad de un grfico estadstico consiste en comunicar ideas complejas con
precisin, claridad y eficiencia, de tal manera que:
Induzca a pensar en el contenido ms que en la apariencia
No distorsione la informacin proporcionada por los datos
Presente mucha informacin (nmeros) en poco espacio
Favorezca la comparacin de diferentes grupos de datos o de relaciones
entre los mismos (por ejemplo una secuencia temporal)

La finalidad de los grficos estadsticos es:


Organizar los datos.
Observar patrones.
Observar agrupamientos.
Observar relaciones.
Comparar distribuciones.
Visualizar rpidamente la distribucin de los datos.
Visualizar, obtener y comparar medidas estadsticas.

El cuadro anterior se puede representar utilizando los siguientes grficos;

Diagrama de barras o rectangulos


Es la representacin grfica usual para variables cuantitativas sin agrupar o
para variables cualitativas.
Para el caso de variables cualitativas se construye dibujando sobre la
categora correspondiente un rectngulo con altura igual a la frecuencia
(absoluta o relativa). Tambin es vlido para variables cuantitativas discretas,
considerando en el eje de abscisas los valores de la variable en orden
creciente en lugar de las categoras, sobre cada valor levantamos una barra de
altura igual a la frecuencia (absoluta o relativa).

Diagrama de Pareto.
Se ordenan las categoras de mayor a menor importancia y se dibujan los
rectngulos correspondientes.

28
Diagrama de sectores Es el ms usual en variables cualitativas.
Se representan mediante crculos. A cada valor de la variable se le asocia
el sector circular proporcional a su frecuencia.
Para hallar el ngulo usamos la siguiente proporcin: al tener una
circunferencia 360, el cociente entre la frecuencia absoluta (o relativa) total y
la frecuencia absoluta (o relativa) que queramos representar ser igual al
cociente entre los 360 de la circunferencia y el ngulo a determinar, as :
n 360 1 360

fi hi
Donde es el ngulo a determinar.

Pictogramas.
Expresan con dibujos alusivos al tema de estudio las frecuencias de las
modalidades de la variable. La escala de los dibujos debe ser tal que el rea de
cada uno de ellos sea proporcional a la frecuencia de la modalidad que
representa.

2.1.2 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS

DISCRETAS
Una vez obtenida una muestra de cualquier poblacin y observados los valores
que toma la variable en los individuos de la muestra, estos valores se suelen
ordenar. Si la variable es cuantitativa la ordenacin ser de menor a mayor.
Dada una variable X, consideramos una muestra de tamao n que toma k
valores distintos, x1, . . . , xk (x1 < x2 < . . . < xk).
La organizacin es en forma similar al caso cualitativo.

29
Categora Frecuencias Frecuencias Frecuencias frecuencias frecuencias
de la absolutas fi relativas hi Porcentuales absolutas relativas
variable pi acumuladas acumuladas
X Fi Hi
x1 f1 h1 p1 F1 H1
x2 f2 h2 pi F2 H2
.
xk fk hk pk Fk=n Hk=1
Total n 1.00 100.00
La grafica para representar esta informacin es Bastones.

Observaciones
Los datos iniciales se pueden representar utilizando los grficos.

Diagrama de cajas(box-plot)
Presentacin visual que describe al mismo tiempo varias caractersticas
importantes de un conjunto de datos, tales como el centro, la dispersin, el
alejamiento de la simetra, y la identificacin de valores extremos (puntos
atpicos), es decir, de valores que se alejan de una manera poco usual del
resto de los datos. Presenta los tres cuartiles, (y los valores mnimos y
mximos) alineados sobre una caja vertical u horizontalmente. El procedimiento
Para el diagrama de cajas y bigotes es:
1. Dibujar un segmento con extremos en los valores menor y mayor que
aparecen en la muestra paralelo a uno de los ejes .
2. Dibujamos una caja con extremos en el primer y tercer cuartil y marcamos
en ella la mediana.
3. Se hallan los lmites interiores (Q1 1.5 IQR y Q3 + 1.5 IQR) y los lmites
exteriores (Q1 3 IQR y Q3 + 3 IQR).
Donde Qi : Cuarteles que seran desarrollados ms adelante.
4. Se unen, con unos segmentos (bigotes), Q1 y Q3 con los valores adyacentes
de la muestra.
5. Por ltimo se indican los valores atpicos

30
Tallos y Hojas (stem & leaf)
Procedimiento semigrfico para el que se preparan los datos resumindolos en
dos o tres cifras (expresndolos en las unidades adecuadas). A continuacin se
disponen en una tabla de dos columnas del siguiente modo:
1. Si los datos son de dos dgitos, a la izquierda (en el tallo) aparece la cifra de
las decenas, a la derecha separada por una lnea aparecen las hojas y se
escriben ordenadas y todas seguidas.
2. Si hay tres dgitos el tallo est formado por los dos primeros. Las hojas son
las unidades.

2.1.3 TABLA DE FRECUENCIAS PARA VARIABLES CUANTITATIVAS


CONTINUAS.
A veces se hace necesario trabajar con datos agrupados. Definimos entonces
como clase a cada uno de los intervalos en que se agrupan los datos. Las
frecuencias harn ahora referencia al nmero de datos que hay en cada
intervalo.
Para construir distribucin de frecuencias por intervalos, se tiene los siguientes
pasos:
Elegir un numero de intervalos de clase (K)
Puede utilizar la regla de Sturges, k 1 3.3log(n)
Donde k: Numero de intervalos.
n: Numero de datos.
Determinar el rango , R xmax xmin

Determinar la amplitud de las clases A R / k


Determinacin de los intervalos:
I1 xmin , xmin A LI1 , LS1

I 2 xmin A, xmin 2 A LI 2 , LS2


..

I k xmin (k 1) A, xmin kA LI k , LSk


LIi LSi
Determinacin de las marcas de clase, mi
2
Donde LI : Limite inferior

31
LS : Limite superior.
Realizar la clasificacin y el conteo de datos en cada clase construida.
Intervalos Marcas Frecuencias Frecuencias Frecuencias Frecuencias frecuencias frecuencias
Ii de clase absolutas relativas relativas Porcentuale absolutas relativas
mi fi hi hi s acumuladas acumuladas
pi Fi Hi

I1 m1 f1 h1 h1 p1 F1 H1
I2 m2 f2 h2 h2 pi F2 H2
.
Ik mk fk hk hk pk Fk=n Hk=1
Total n 1.00 1.00 100.00

Cuando las variables son continuas, utilizamos como diagramas diferenciales


los histogramas y los polgonos de frecuencias.
Este cuadro se representa mediante los siguientes grficos:
Histograma de frecuencias
Un histograma es la representacin ms frecuente con datos agrupados, se
construye a partir de la tabla estadstica, representando sobre cada intervalo,
un rectngulo que tiene a este segmento como base. El criterio para calcular la
altura de cada rectngulo es el de mantener la proporcionalidad entre las
frecuencias absolutas (o relativas) de cada intervalo y el rea de los mismos.

Polgono de frecuencias
El polgono se construye fcilmente si tenemos representado previamente el
histograma, ya que consiste en unir mediante lneas rectas los puntos del
histograma que corresponden a las marcas de clase. Para representar el
polgono de frecuencias en el primer y ltimo intervalo, suponemos que
adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia
nula, y se unen por una lnea recta los puntos del histograma que corresponden
a sus marcas de clase.

Curva de frecuencias.
Resulta de suavizar el polgono de frecuencias, en sus puntos angulosos.

Ojivas

32
EJERCICIOS RESUELTOS

1) Se realizo un estudio sobre la precipitacin media anual en una regin del pas,
para ello se recopilo informacin histrica de los ltimos 90 aos, obtenindose los
siguientes resultados:
12.2 16.4 17.8 18.4 19 19.5 20 20.9 23
13.1 16.8 17.8 18.4 19.1 19.5 20 20.9 23
14.3 16.9 17.8 18.4 19.1 19.7 20.2 21 23.2
15.5 17.1 17.8 18.4 19.2 19.7 20.3 21.1 23.3
15.5 17.2 18 18.5 19.2 19.7 20.3 21.4 23.5
15.6 17.3 18.1 18.5 19.3 19.7 20.5 21.6 23.5
15.9 17.4 18.2 18.5 19.3 19.7 20.6 21.7 24.1
16.1 17.6 18.3 18.5 19.4 19.8 20.6 22 24.2
16.2 17.8 18.3 18.8 19.4 19.9 20.8 22.4 24.8
16.2 17.8 18.3 19 19.5 19.9 20.8 22.7 26.2

a) Construya la tabla de distribucin de frecuencias


b) Represente la informacin obtenida, mediante un grafico.

Solucin.
a) Para construir una tabla de frecuencia se tiene los siguientes pasos.
Elegir el nmero de clases.
Usando la relacin de sturges se tiene:
k 1 3.3log(n) 1 3.3log(90) 7.44 7
Determinar la amplitud de los intervalos
R xmax xmin 26.2 12.2 14

Determinar el tamao del intervalo de clases (c),


R 14
A 2
k 7
Establecimiento de los lmites y construccin de la tabla:

33
LI - LS mi fi Fi hi= fi/n pi Hi
[12.2 14.2) 13.2 2 2 0.02 2.22 0.02
[14.2 16.2) 15.2 6 8 0.07 6.67 0.09
[16.2 18.2) 17.2 18 26 0.2 20 0.29
[18.2 20.2) 19.2 36 62 0.4 40 0.69
[20.2 22.2) 21.2 16 78 0.18 17.8 0.87
[22. 2 24.2) 23.2 9 87 0.1 10 0.97
[24.2 26.2) 25.2 3 90 0.03 3.33 1
TOTAL n=90 1 100

b) Histograma de frecuencias relativas.

Histog rama

40

30
frecuencia

20

10

0
12 15 18 21 24 27

2.- Una empresa constructora pone a disposicin de sus trabajadores cuatro


nuevos planes de seguro. La gerencia desea saber si se nota alguna
preferencia por uno u otro tipo seguro. A continuacin se presenta los
resultados de la encuesta aplicada a 37 trabajadores.
D, A, D, B, C, D, D, A, D, D, A, D, B, D, D, C, A, B, A, D, D, D A, C, B, A, A, B, D,
C, B, A, B, B, D, A, D.
Represente la informacin mediante un grfico apropiado.

34
Solucin.
Tipo de capital. fi hi Pi
A 10 0.2703 27.03
C 4 0.1081 10.81
B 8 0.2162 21.62
D 15 0.4054 40.54
Total n=37 1 100

15

12
frecuencia

0
A B C D

3.- Se realizo un estudio sobre el tipo de error en la facturacin que cometen un


grupo de empresas dedicas a la construccin en la ciudad de Cusco,
registrndose los siguientes resultados.

Tipo de Error en l a facturacin

Frecuencia Porcentaje
{[}
Calculo 45 22.4
{\}
Concept o 70 34.8 {]}
Otros 86 42.8 {^}
{_}
Total 201 100.0 {`}

Represente grficamente la informacin.

35
50

40

30
Porcentaje

20

10

0
Calculo Concepto Otros

Tipo de error en la facturacin

4.- El colegio de Ingenieros realizo un estudio sobre el conocimiento que tienen sus
afiliados sobre las normas de construccin. Los resultados se muestran a
continuacin.

Conocimiento

Frecuencia Porcentaje
Def iciente 26 63.4
Regular 8 19.5
Bueno 7 17.1
Total 41 100.0

Represente la informacin mediante un grafico.

60,0%
Porcentaje

40,0%

20,0%

0,0%
Deficiente Regular Bueno

Conocimiento

36
EJERCICIOS PROPUESTOS

1. Los datos del Cuadro siguiente corresponden a las Precipitaciones Mximas.


87 106 114 120 129 140 155 183
93 107 116 122 133 141 155 194
101 107 117 122 133 146 162 197
104 109 118 125 134 146 167 204
105 110 118 125 135 148 173 212
105 114 119 128 138 152 176 230

a) Construya la tabla de frecuencias.


b) Grafique el histograma.
c) Establezca si los datos siguen una distribucin simtrica.

2. En una prueba de elasticidad de un conjunto de vigas se obtuvieron los siguientes


valores en MN/m :
6.72; 6.77; 6.82; 6.70; 6.78; 6.70; 6.74; 6.81; 6.75; 6.66; 6.66; 6.64;
6.76; 6.73; 6.80; 6.79; 6.76; 6.72; 6.76; 6.68; 6.66; 6.62; 6.72; 6.78;
6.72; 6.76; 6.70; 6.78; 6.76; 6.67; 6.70; 6.73; 6:65.
Organizar la informacin y represente grficamente.

3. Los siguientes datos corresponden al nmero de accidentes que ocurren en


construccin de viviendas en una provincia en mes.
0 2 5 0 0 1 4 1 0 2
1 5 0 1 3 0 0 2 1 3
1 4 0 0 5 1 3 6 4 2
5 1 1 2 2 1 6 5 0 3
3 0 4 2 0 0 4 1 2 1
a) Agrupe estos datos en una distribucin de frecuencias y grafique dicha
informacin
b) Interprete los resultados y redacte sus conclusiones.

37
4. Se tiene la informacin de los niveles de caudal medio de un rio para un periodo
de 50 meses.
110 110 126 112 117 113 135 107 122
113 98 122 105 103 119 100 117 113
124 118 132 108 115 120 107 123 109
117 111 112 101 112 111 119 103 100
108 120 99 102 129 115 121 130 134
118 106 128 94 114
a).- Cul es la amplitud total de la distribucin de los datos?
b).- Obtenga la distribucin de frecuencias absolutas y relativas.
c).- Obtenga la distribucin de frecuencias acumuladas, absolutas y relativas, con los
intervalos anteriores.
d).- Calcular la media y la varianza con los intervalos del apartado b y despus
calclense las mismas magnitudes sin ordenar los datos en una tabla
estadstica. Con qu mtodo se obtiene mayor precisin?
e).- Dibuje el polgono de frecuencias relativas.
f).- Dibuje el polgono de frecuencias relativas acumuladas.

5. Los siguientes datos corresponden a los nmeros de torsin que se obtuvieron al


cortar 12 barras de aleacin forjada. Determine la: media, mediana, moda,
varianza y desviacin tpica.
32, 24, 39, 48, 26, 35, 38, 54, 23, 34, 29, 37.
6. Se midi la resistencia a la compresin de 58 probetas de una nueva aleacin
de aluminio, obteniendo los siguientes resultados.
66.4; 67.7; 68; 68.3; 68.4; 68.6; 68.8; 68.9; 69; 69.1; 69.2; 69.3; 69.5; 75.3;
70.8; 73.4; 72; 71.5; 74.3; 74; 73.6; 72; 75; 72.4; 73.9; 73.6; 72.2.
Organizar la informacin y representar mediante un grafico.

38
CAPITULO III

MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIN DE DATOS.

Las tcnicas estudiadas anteriormente permiten una descripcin visual de la


distribucin de una variable. En muchos casos, el resumen puede hacerse
eficazmente de una forma ms sencilla y precisa: utilizando valores numricos que
den idea de la ubicacin o del centro de los datos -medidas de posicin- usando
cantidades que informen de la concentracin de las observaciones alrededor de
dicho centro -medidas de dispersin- y mediante nmeros que reflejen la forma
(asimetra y apuntamiento) de la distribucin -medidas de forma.
La conjuncin de tcnicas numricas y grficas permite una buena descripcin de la
variable.
Los estadsticos resmenes tratan de reflejar numricamente distintos aspectos de la
variable en estudio. Podemos distinguir 4 aspectos o caractersticas principales que
pueden resumirse en una distribucin. (Ver cuadro siguiente)

39
Media Nos dan un centro de
Centralizacin Mediana la distribucin de
Moda frecuencias
Percentiles Son valores de la
Cuartiles distribucin que
Posicin dividen en partes
Deciles iguales
Varianza Las medidas de
Medidas Desviacin tpica dispersin cuantifican
descriptivas Coeficiente de variacin la separacin, la
Rango dispersin, la
Dispersin variabilidad de los
valores de la
distribucin respecto al
Recorrido Intercuartilico valor central
Coeficiente de Asimetra Comparan la forma
Forma Coeficiente de Apuntamiento que tiene la
o Curtosis representacin grfica

3.1 Medidas de tendencia central


Los promedios o medidas de tendencia central son valores representativos de
un conjunto de datos. Pretenden resumir todos los datos en un nico valor. Las
medidas de tendencia central son fundamentales ya que permiten localizar
cuantitativamente la zona central o de mayor acumulacin de informacin de un
conjunto de datos correspondientes a una variable, obtenidos de una muestra
seleccionada de una poblacin especfica o de un conjunto de resultados del
espacio muestral de un experimento aleatorio.

Definimos tres medidas de tendencia central: media, mediana y moda.

40
Media, ( x )
Media para datos sin agrupar:
Dado un conjunto de observaciones x1, . . . , xn, la media se representa
mediante x , se obtiene mediante:
n

x1 x 2 ..... xn
xi
x i 1
n n
Media para datos agrupados
Consideremos el caso en que tenemos una distribucin de frecuencia para
variables cuantitativas discretas, en este caso la media es:

f 1x1 f 2 x 2 ..... fkxk k


x xi hi
n i 1

Si los datos estn agrupados por intervalos, para hallar la media tomamos la
marca de las clases,
f 1m1 f 2m2 ..... fkmk k
x hi mi
n i 1

La media se mide en las mismas unidades que la variable, y tiene el


inconveniente de verse muy afectada por la presencia de datos que sean
extremadamente grandes o pequeos (datos atpicos).

Mediana, (Me)
Se calcula para variables cuantitativas; es el valor de la serie de datos que se
sita justamente en el centro de la muestra una vez se ha ordenado sta,
corresponde a un 50% de valores son inferiores y otro 50% son superiores.

Mediana para datos sin agrupar


La mediana es el valor del dato central y depende del tamao de la muestra.

Me x n 1 , para n impar

2

41
x n x n
1
Me 2 2
, Si n es par.
2

Mediana para datos agrupados


Cuando trabajamos con variables agrupadas por intervalos es imposible
determinar con precisin los valores que toman los datos, ya que esa
informacin se ha perdido en privilegio del agrupamiento intervalo. Por lo tanto,
en este caso, debemos buscar otro mtodo para determinar el valor de la
mediana.
n
2 Fi 1 0.5 H i 1
Me LI A LI A
f i hi

La mediana slo tiene en cuenta la posicin de los valores en la muestra y por lo
tanto tiene mejor comportamiento que la media cuando hay observaciones
anmalas.

Moda, (Mo)
Es el valor con mayor frecuencia. Si hay ms de una moda, la variable se dice
multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o
cualitativas).
Si los datos estn agrupados hablamos de clase modal y ser aquella para la
que la frecuencia absoluta sea mayor.

1 fi fi 1
Mo LI A LI A

1 2
i f f i 1 f i f
i 1

Donde:
1 fi fi 1

1 fi fi 1

42
Cmo elegir entre las medidas de tendencia central?- En general, la media
es la medida de tendencia central ms til y ms empleada. El uso de la media
es el ms apropiado cuando y la distribucin de los datos es unimodal y
aproximadamente simtrica. Cuando valores extremos distorsionan la
distribucin de los datos, el uso de la mediana es ms apropiado pues se ve
menos afectada, pero en la prctica esta medida de tendencia central no se
utiliza demasiado. Si se trata de una variable ordinal, o slo necesitas una
descripcin rpida y aproximada de la tendencia central, puedes utilizar la moda,
que tambin es til cuando la distribucin est distorsionada por valores
extremos o la distribucin es bimodal.

Clases de Distribuciones
Distribucin Simtrica se presenta si todas las observaciones estn
concentradas en un solo valor de la variable, en este caso la media, mediana y
moda coincidiran en el mismo.
x Me Mo

Distribucin asimtrica sesgada a la izquierda


Supongamos ahora que las observaciones de la parte izquierda se alejan del
valor central ms que las observaciones de la parte derecha, generando una
distribucin asimtrica hacia la izquierda; en este caso como la media es la
suma de los valores de las observaciones dividido por la cantidad total de
observaciones, su valor se correr a la izquierda tambin y por el mismo motivo,
la media ser menor que la mediana y ambas menor que la moda, es decir:
x Me Mo

43
Distribucin asimtrica sesgada a la derecha.
En este caso la media, es mayor que la mediana y que la moda.
Mo Me x

3.2 Medidas de Posicin.


Cuartiles
Dividen la muestra, ordenada de menor a mayor, en 4 partes iguales, y se
denotan por Qi , i=1,2,3

i.n
4 Fk 1
Qi LI i A
f k

- Q1, primer cuartil, al menos el 25% de los datos son menores o iguales
que l y al menos el 75% de los datos son mayores o iguales que l.
- Q2, segundo cuartil, es la mediana, Q2 = Me.
- Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales que
l y al menos el 25% de los datos son mayores o iguales que l.

Percentiles
Dividen la muestra ordenada en 100 partes iguales.

i.n
100 Fk 1
Pi LI i A
f k

44
El i-simo percentil, Pi ( 1 i 99 ) es un valor tal que al menos el i% de los
datos son menores o iguales que l y al menos el (100-i) % de los datos son
mayores o iguales que l.

A partir de las definiciones de los cuartiles y percentiles, es claro que Q 1 = P25,


Q2 = P50 =Me y que Q3 = P75.

Deciles
Dividen el conjunto de datos en 10 partes iguales y se denota con D i , i=1,9

i.n
10 Fk 1
Di LI i A
f
k

3.3 Medidas de dispersin


Mientras los estadsticos de tendencia central nos indican los valores alrededor
de los cuales se sitan un grupo de observaciones, los estadsticos de
variabilidad o dispersin muestran si los valores de las observaciones estn
prximos entre s o estn muy separados. Dos conjuntos de datos pueden
tener la misma localizacin central y no obstante, ser muy distintos si uno se
halla ms disperso que el otro.
La dispersin es el grado en que los datos numricos tienden a extenderse
alrededor de un valor medio. La dispersin de la distribucin suministra
informacin complementaria que permite juzgar la confiabilidad de nuestra
medida de tendencia central. Si los datos estn ampliamente dispersos, la
localizacin central ser menos representativa de los datos en su conjunto de
lo que sera en el caso de datos que se acumulasen ms alrededor de la
media. Adems, si no conviene tener una amplia dispersin de valores
respecto al centro o si esa dispersin implica un riesgo inaceptable, deberemos
ser capaces de reconocerlo y no escoger las distribuciones que presentan la
mxima dispersin.
Por ejemplo, a los analistas financieros les interesa la dispersin de las
ganancias de una empresa, las utilidades con una fuerte dispersin indican un

45
riesgo mayor parar los accionistas que las utilidades que permanecen
relativamente estables.

Varianza.
Slo tienen sentido para variables cuantitativas y se define:
n n

xi x x
2 2
i
S2 i 1
i 1
x 2 , Para datos no tabulados.
n n
n n

xi x fx
2 2
fi i i
S2 i 1
i 1
x 2 , Para datos tabulados de variable discreta
n n
n n

m x fm
2 2
i fi i i
S2 i 1
i 1
x 2 , Para datos tabulados por intervalos, para
n n
variables continuas.

Observaciones sobre la varianza:


Las unidades de la varianza son los cuadrados de las unidades de los datos y
en muchas ocasiones no son fciles de interpretar.
Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.

Desviacin tpica (S)


Es la raz cuadrada positiva de la varianza

s s2
La desviacin tpica poblacional suele denotarse por .
Observaciones sobre la desviacin tpica:
Nos permite determinar con mayor grado de precisin dnde se sitan los
valores de una distribucin de frecuencia en relacin con la media.
Las unidades de la desviacin tpica se expresan en las mismas unidades de
los datos.
Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.

46
Variables tipificadas
Los distintos conjuntos de datos estn asociados por lo general a diferentes
medias, ya sea porque son de naturaleza diferente (escalas de medidas
diferentes). Con el propsito de reducir los datos a un mismo punto de
referencia y a una escala comn, se realiza entre ellos una transformacin
llamada tipificacin.
Se conoce por tipificacin de una variable x a efectuar el cambio de origen y
de escala de la variable.
xx
z para muestras
s
Frmulas:
z x - para poblacin

Esta nueva variable (z), carece de unidades de medida y permite comparar dos
o ms cantidades que en un principio no son comparables porque aluden a
conceptos diferentes. Tambin es aplicable a casos en que se quieran
comparar individuos semejantes de poblaciones diferentes. Por ejemplo, si
deseamos comparar el nivel acadmico de dos estudiantes de diferentes
universidades, nos indica cuntas desviaciones estndar est un valor por
arriba o por debajo de la media del conjunto de datos al cual pertenece.

Ejemplo:
Un Docente de la Universidad A obtuvo 84 puntos en protocolos de seguridad
en una construccin , en el que la nota media fue 76, y la desviacin tpica 10;
Otro Docente de la Universidad B obtuvo 90 puntos, siendo la media 82 y la
desviacin tpica 16. Cual de los Docentes presenta mejor nivel de
conocimientos de protocolos de construccin ?.

Docente de la Universidad A Docente de la Universidad B


x = 76 x = 82
s = 10 s = 16
x = 84 x = 90
84 76 90 82
z= 0,8 z= 0,5
10 16

47
Sobresali ms el Docente de la Universidad A.

Coeficiente de variacin Muestral de Pearson


Las medidas de dispersin anteriores dependen de las unidades de medida, el
coeficiente de variacin es, en cambio, una medida de dispersin relativa y
adimensional.
S
CV
|X|
CV es apropiado en poblaciones donde los datos son positivos.
Si 0<CV<1.5, los datos provienen de una poblacin homognea
Si CV>1.5, los datos provienen de una poblacin heterognea.

El coeficiente de variacin es til, en razn de su carcter adimensional, para


comparar muestras con medias desiguales, donde las unidades de medida de
las observaciones son diferentes. Tambin para decidir cual muestra es ms
homognea o menos variable

Recorrido o rango
Es la diferencia entre el mayor y menor valor de una muestra.

R x max x min

Rango semiintercuartlico y amplitud intercuartil


El rango semiintercuartlico es la mitad de la diferencia entre el tercer y primer
cuartil, Q = (Q3 Q1)/2.
La amplitud intercuartil es el doble del valor anterior,
2Q = IQR = (Q3 Q1).

Cmo elegir entre las medidas de dispersin?- La medida de dispersin


ms til es la desviacin tpica. Slo debes usar el rango cuando dispones de
pocas medidas o cuando todo lo que necesitas conocer es la dispersin
general de las medidas. Utiliza el coeficiente de variacin cuando quieras
tener una idea de la variabilidad relativa de dos o ms variables cuyas medias

48
son muy diferentes en magnitud. Esto se ve facilitado por su carcter
adimensional, es decir, no depende de las unidades en que se mida la media

3.4 MEDIDAS DE FORMA


Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda
y Hacen referencia a la forma de la distribucin, simtrica, asimetra a la
derecha o a la izquierda. En general la mejor manera de verlo es por la
representacin grfica, pero si no la tenemos existen coeficientes que nos
indican la forma de la distribucin. Los ms utilizados son:

Coeficiente de asimetra de Pearson,


El coeficiente de asimetra de una variable mide el grado de asimetra de la
distribucin de sus datos en torno a su media, es adimensional y se define
como sigue:
x Mo
Ap
S
Este coeficiente puede ser:
Ap 0 , entonces la media igual que la moda, distribucin simtrica

Ap 0 , entonces la media mayor que la moda, asimetra a la derecha positiva

Ap 0 , entonces la media menor que la moda, asimetra a la izquierda

negativa.

Curtosis.
hace referencia al mayor o menor apuntamiento que tiene una distribucin de
frecuencias respecto a una distribucin Normal, por lo tanto slo se estudia en
comparacin con la campana de Gauss, se determina mediante:
P75 P25
K 0.5
P90 P10

Este coeficiente puede ser:


K 0 , la curva es igual que la normal, se llama Mesocrtica
K 0 , la curva es ms puntiaguda que la normal se llama Leptocrtica
K 0 , la curva es ms aplastada que la normal, se llama Platicrtica

49
EJERCICIOS RESUELTOS.

1) La siguiente tabla muestra los salarios diarios en soles de 480 trabajadores de


una empresa.
C.I 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126

fi 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2

Calcule:
a) El salario medio de los trabajadores.
b) Su desviacin tpica.
c) Si el gerente de la empresa afirma que exactamente la mitad de los
trabajadores de la empresa tienen un salario superior al del trabajador Juan,
qu salario tiene Juan?
d) Determine el salario diario mnimo del 15% de trabajadores con mayores
salarios.

SOLUCION:
La variable de estudio es el cociente intelectual (X)
xi fi fixi fixi2 Fi Hi
70 4 280 19600 4 0.0083
74 9 666 49284 13 0.0271
78 16 1248 97344 29 0.0604
82 28 2296 188272 57 0.1188
86 45 3870 332820 102 0.2125
90 66 5940 534600 168 0.35

50
94 85 7990 751060 253 0.5271
98 72 7056 691488 325 0.6771
102 54 5508 561816 379 0.7896
106 38 4028 426968 417 0.8688
110 27 2970 326700 444 0.925
114 18 2052 233928 462 0.9625
118 11 1298 153164 473 0.9854
122 5 610 74420 478 0.9958
126 2 252 31752 480 1
1470 n=480 46064 4473216

a) Media
f 1x1 f 2 x2 ..... fkxk 46064
x 95.96
n 480

b) Varianza y desviacin.
n n

x x fx
2 2
i fi i i
4473216
95.96 110.88
2
S2 i 1
i 1
x2
n n 480
s 110.88 10.52

c) Mediana.
n=480 ( Par)
x n x n x 480 x 480


1

1 x 240 x 241 94 94
Me 2 2
2 2
94
2 2 2 2

d) Percentil 85
P85 106

2) Una empresa de construccin contrata los servicios de un corredor de bolsa, para


decidir su inversin en una de las dos acciones A y B. Los resultados de las
utilidades de estas acciones en los ltimos 7 meses en miles de dlares esta
dado en el cuadro siguiente.

51
Accin Utilidades en miles de dlares.
1 2 3 4 5 6 7
A 57 55 54 52 62 55 59
B 80 40 62 72 46 80 40

a) Halle e interprete la media, mediana y moda de las utilidades.


b) Estadsticamente Cul de las acciones es ms recomendable para la
empresa que esta interesado en una mayor utilidad? Cul de las acciones es
ms recomendable para la empresa que esta interesado en un menor riesgo
de inversin? Fundamente su respuesta.

SOLUCION:
XA XB XA2 xB2
57 80 3249 6400
55 40 3025 1600
54 62 2916 3844
52 72 2704 5184
62 46 3844 2116
55 80 3025 6400
59 40 3481 1600
394 420 22244 27144

a) Estadsticos de A.
n

x1 x 2 ..... xn
xi
394
xA i 1 56.28
n n 7
MeA x n 1 , para n impar n=7

2

MeA x n 1 x 7 1 x 4 55

2 2

MoA 55

52
Estadsticos de B.
n

x1 x 2 ..... xn
xi
420
xB i 1 60
n n 7
MeB x n 1 , para n impar n=7

2

MeB x n 1 x 7 1 x 4 62

2 2

MoB1 40

MoB 2 80

b) Calcular la varianza
n n

xi x x
2 2
i
22244
S A2 i 1
i 1
xA2 (56.28)2 10.27
n n 7

S 10.27
CVA 0.057
| X A | 56.28
n n

xi x x
2 2

602 277.7
i
27144
S B2 i 1
i 1
xB2
n n 7

S 277.7
CVB 0.277
| XB | 60

La informacin se ilustra en el grafico siguiente.

53
80,00

70,00
Utilidad

60,00

50,00

40,00

A B

Accin

3. Con el fin de realizar un estudio sobre las retenciones econmicas de quinta


categora a los trabajadores de una empresa, se selecciono aleatoriamente a 24
trabajadores, obtenindose las siguientes cantidades de retencin econmica en
cientos de soles.

Retencin Nmero de
Econmica. trabajadores
[0, 1> 2
[1, 2> 2
[2, 3> 3
[3, 4> 6
[4, 5> 7
[5, 6> 1
[6, 7> 1
[7, 8> 1
[8, 9> 1
a) Halla la media, varianza, la desviacin tpica y coeficiente de variacin.

54
b) Mediana
c) Moda.

SOLUCION:
I fi mi mifi mi2fi Fi
[0, 1> 2 0.5 1 0.5 2
[1, 2> 2 1.5 3 4.5 4
[2, 3> 3 2.5 7.5 18.75 7
[3, 4> 6 3.5 21 73.5 13
[4, 5> 7 4.5 31.5 141.75 20
[5, 6> 1 5.5 5.5 30.25 21
[6, 7> 1 6.5 6.5 42.25 22
[7, 8> 1 7.5 7.5 56.25 23
[8, 9> 1 8.5 8.5 72.25 24
Total 24 40.5 92 440

a) Media, varianza, desviacin y coeficiente de variacin.


Media.

fm i i
92
x 3.83
n 24
Varianza.

m 2
f
i i
440
S
2
x2 3.83 3.66
n 24
Desviacin.
s 3.66 1.91
Coeficiente de Variacin.
S 1.91
CV 0.498
| X | 3.83

Mediana
12 7
Me 3 *1 3.833
6

55
Moda


Mo Li 1 A
1 2

1 7 6 1

1 7 1 6

1
Mo 4 *1 4.14
1 6

4. Se realizo un estudio de Caudales mnimos instantneos anuales del ro Piura en


Puente Snchez Cerro, obteniendo los siguientes resultados.

Caudales Nro de aos


mnimos
0-5 10
5-10 15
10-13 25
13-18 8
18-20 2
a) Calcule la media, varianza y la desviacin.
b) Determine la mediana y la moda
c) Determine e interprete Q1, Q3, P10 y P90
d) Coeficiente de curtosis y de asimetra.

SOLUCION:
Intervalo fi. Fi mi mifi mi2fi
0-5 10 10 2.5 25 62.5
5 -10 15 25 7.5 112.5 843.75
10-13 25 50 11.5 287.5 3306.25
13-18 8 58 15.5 124 1922
18-20 2 60 19 38 722
60 56 587 6856.5

56
a) Media y varianza
Media.

fm i i
587
x 9.78
n 60
Varianza.

m 2
f
9.782 18.63
i i
6856.5
S2 x2
n 60

Desviacin.
s 18.63 4.31

b) Mediana y moda
Mediana
n
2 F k 1
Me Li A
fK

n 60
Determinamos 30
2 2
n
2 F k 1 30 25
Me Li A 10 3 10.6
fK 25

Moda

Mo Li 1 A
1 2

1 25 15 10

1 25 8 17

10
Mo Li 1 A 10 3 11.11
1 2 10 17

c) Determine e interprete Q1, Q3, P10 y P90

57
Para obtener los cuarteles se tiene la relacin.
i.n
4 F k 1
Qi Li A
fK

Cuartil 1
1.n
4 F k 1 15 10
Q1 Li A 5 5 6.67
fK 15

El 25% de los contadores presentan nivel de conocimientos de auditoria
menores a 6.67

Cuartil 3
3.n
4 F k 1 45 25
Q3 Li A 10 3 12.4
fK 25

Para obtener los percentiles se tiene la relacin.


i.n
100 F k 1
Pi Li A
f K

Percentil 10
10.n
100 F k 1 60
P10 Li A 0 5 3
fK 10

Percentil 90
90.n
100 F k 1 54 50
P90 Li A 13 5 15.5
f K 8

58
d) Coeficiente de Asimetra.
x M o 9.78 11.11
Ap -0.308
s 4.31

Puesto que Ap < 0 la distribucin es asimtrica negativa o a izquierdas


(desplazada hacia la izquierda).

Coeficiente de curtosis de fisher.


Q3 Q1 12.4 6.67
K 0.5 0.5 -0.0416
P90 P10 15.5 3

Si k 0 , entonces la distribucin es platicrtica.

EJERCICIOS PROPUESTOS

1. En una construccin se quiere preparar concreto con una resistencia mnima a


la comprensin de 17.2MN/m2 .El mnimo a considerar ser un valor que sea
excedido por no menos del 96% de los resultados de la prueba .Los valores de
la resistencia de 50 probetas se proporciona en la tabla siguiente.

22.3 18.2 24.8 23.5 19.8 27 25.9 29.2 24.1 24.3 21.7 23.4 23.3
28.3 23.4 20 26.1 15.2 20 22.8 32 25.6 20.8 23.2 26.9 22.8
22.1 21.2 23.4 18.1 23.4 23 23.6 25.4 22.2 17.8 28 28.8 22.1
20.1 20.8 23 28.2 23 30.4 25.1 24.8 19.9 18.2 25.1
a) Calcule la media, y el percentil 96.
b) Diga si las especificaciones requeridas son satisfactorias.

2. Una muestra de pequeas empresas se clasifica en funcin de su antigedad


en el mercado y del porcentaje de deudas sobre el capital que presentan, con
los siguientes resultados:

59
Deudas Empresas antiguas Empresas Nuevas
0-15 19 29
15-30 13 10
30-50 7 11
50-70 4 32

En base a los resultados, Puede admitirse que el porcentaje de deudas de las


empresas es independiente de su antigedad?. Fundamente su respuesta.

3. En una empresa donde los salarios tienen una media de 700 dlares y una
desviacin estndar de 150 dlares, el sindicato solicita un reajuste de 25%
ms un incentivo de 10 dlares. El Directorio acoge parcialmente la peticin
rebajando los salarios solicitados en un 10%.

a) El Sindicato se declara satisfecho en sus negociaciones si el sueldo


promedio final aumenta por lo menos en un 20% respecto de su valor actual.
Se logra esto aceptando la proposicin del Directorio? Justifique su
respuesta.
b) El Sindicato pretende con su proposicin aumentar la homogeneidad de los
sueldos de sus afiliados Se logra este objetivo aceptando la proposicin
del Directorio? Fundamente su respuesta.
c) Si en la Empresa laboran 500 funcionarios En qu porcentaje aument la
planilla de sueldos respecto a la planilla inicial?.

4. Una empresa constructora tiene 2 secciones A y B. Las distribuciones de


ingresos diarios de sus empleados son los siguientes:

60
Seccin A
Ingresos ($) Frecuencia
80-100) 30
100-120) 80
120-140) 40
140-160) 10
160-180) 4
180-200) 1

Seccin B
Ingresos ($) Frecuencia
60-90) 10
90-120) 20
120-150) 50
150-180) 20
180-210) 15
210-240) 10
240-270) 4

Calcular la media aritmtica y varianza de la seccin A y B.


Compare los ingresos.

5. El registro de precipitacin mxima en 24 horas en una estacin, desde 1948


hasta 1997 se muestra en la tabla

61
Precipitacin Precipitacin Precipitacin
Mxima Mxima Mxima
Ao en 24 hrs. Ao en 24 hrs. Ao en 24 hrs.
1948 34.3 1965 19.5 1982 50.2
1949 29.3 1966 10.5 1983 32.9
1950 6.2 1967 36.5 1984 14.8
1951 17.8 1968 15 1985 18.4
1952 11.2 1969 17.6 1986 48
1953 7 1970 16.8 1987 11.1
1954 8 1971 10.5 1988 30.8
1955 29.8 1972 55.5 1989 14
1956 8.3 1973 11.1 1990 17.1
1957 37 1974 15.3 1991 17.2
1958 22 1975 17.9 1992 73.8
1959 13.5 1976 37.3 1993 19
1960 18 1977 62 1994 17.3
1961 34.5 1978 29.5 1995 17.3
1962 31 1979 26.9 1996 7.3
1963 29 1980 16.7 1997 45.6
1964 8.6 1981 16.2

Calcule la media aritmtica, varianza y desviacin estndar.

6. En las siguientes tablas se registran los sueldos quincenales (en dolares) de


50 obreros de dos constructoras
Constructora A Constructora B
Sueldo fi sueldo fi
45 55) 18 45 55) 12
55 65) 24 55 65) 28
65 75) 26 65 75) 30
75 85) 20 75 85) 22
85 95) 12 85 95) 8

62
a) En qu constructora hay mayor dispersin relativa de suledos?
b) Un obrero que gana 140 mensuales. Dnde estara mejor remunerado con
respecto a sus compaeros?
c) Cul de las dos distribuciones es ms simtrica?

7. En enero el sueldo promedio de los obreros de una empresa era de $560000 y


el sueldo de los empleados $1270000. En septiembre debido a un reajuste,
cada obrero recibi un 15% ms que su sueldo anterior ms un bono de
$50000, mientras que cada empleado recibi un aumento de $120000.
En diciembre se produjo un nuevo reajuste y los obreros quedaron con un
sueldo promedio de un 10% superior que el sueldo promedio en septiembre y
el sueldo promedio de todos los trabajadores de la empresa es ahora de
$980260.
Si se sabe que el nmero de obreros es el triple del nmero de empleados,
proporcione la siguiente informacin al gerente general de la empresa.
a) Cul es el sueldo promedio de los empleados en diciembre y en qu
porcentaje aument con respecto a septiembre?
b) Cul es el sueldo promedio de todos los trabajadores de la empresa en
septiembre.

8. En la estacin se cuenta con los siguientes valores de precipitacin diaria


mxima en un perodo de tiempo. Obtener las caractersticas que describen la
serie (media, mediana, varianza, desvo y coeficiente de variacin).

125 143 123 562 425 316 136 143 425 465 213
143 312 480 116 259 269 425 218 312 489 476
619 524 391 425 143 432 213

63
CAPITULO IV

DISTRIBUCIONES BIDIMENSIONALES

Si resumir la informacin de una variable es de por si interesante, en investigacin lo


es mucho ms el poner de manifiesto la posible relacin entre dos de ellas.
El anlisis de la relacin de dos variables, X e Y, depende del tipo de variables y
Segn sean los tipos de cada una de ellas se usa tcnicas estadsticas diferentes.

4.1 CUALITATIVA-CUALITATIVA.
Cuando las variables de estudio son cualitativas (categricas) o cuantitativas
discretas con poca modalidades, se suele presentar las observaciones de las
variables X e Y, mediante pares ordenados (xi, yi), esta forma de presentaciones
se denomina tablas de contingencia. Las tablas de contingencia son de doble
entrada organizada por filas y columnas y donde se presenta la distribucin de
frecuencias conjuntas de las dos variables.
Dada una variable bidimensional ( X, Y ), consideramos una muestra de tamao
n en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores distintos, y1,
. . , yl, obtenemos, por tanto, observaciones del tipo (xi, yj).

La frecuencia absoluta de un valor (xi, yj) es el nmero de veces que dicho valor
aparece en la muestra. Se representa por fij , se cumple
k l

f
i 1 j 1
ij n

64
La frecuencia relativa de un valor (xi, yj) es el cociente de la frecuencia absoluta
fij entre el tamao de la muestra n, se representa por hij
k l
fij
hij
n
, se cumple: h
i 1 j 1
ij 1

Distribuciones marginales
Nos indican el comportamiento aislado de cada una de las variables X e Y
que dan lugar a una variable bidimensional.
l
Frecuencia absoluta marginal de xi, fi. fi1 fi 2 fil fij
j 1

fi .
Frecuencia relativa marginal de xi, hi.
n
k
Frecuencia absoluta marginal de yj, f. j f1 j f 2 j f kj fij
i 1

f. j
Frecuencia relativa marginal de yj, h. j
n

Una tabla de doble entrada de una variable bidimensional sigue la estructura


que se presenta a continuacin, en la que tienen cabida las frecuencias
marginales (representadas en la ltima fila y ltima columna). Puede ser de
frecuencias absolutas o relativas.

Y y1 y2 ..... yl ni.
X
x1 f11 f12 ..... f1l f1.
x2 f21 f22 ..... f2l f2.

.. .. .. ..... .. ..

xk fk1 fk2 ..... fkl fk.

n.j f.1 f.2 ..... f.l n

65
Ejemplos

1. El gerente de ventas de la firma A desea determinar el comportamiento de las


ventas de cuatro productos (I, II, III y IV), en funcin de la clase de clientes
clasificados en cuatro grupos. Una muestra aleatoria de las ventas suministro
la siguiente informacin.

Grupo de Producto
clientes I II III IV
Profesionales 30 35 55 40
Comerciantes 155 50 125 80
Obreros 130 30 105 50
Amas de 35 15 20 45
casa
Las ventas de los cuatro grupos son homogneas?

Solucin

Producto
Grupo de clientes I II III IV Total
Prof esionales Frecuencia 30 35 55 40 160
Porcentaje 18.8% 21.9% 34.4% 25.0% 100.0%
Comerciantes Frecuencia 155 50 125 80 410
Porcentaje 37.8% 12.2% 30.5% 19.5% 100.0%
Obreros Frecuencia 130 30 105 50 315
Porcentaje 41.3% 9.5% 33.3% 15.9% 100.0%
Ama de casa Frecuencia 35 15 20 45 115
Porcentaje 30.4% 13.0% 17.4% 39.1% 100.0%
Total Frecuencia 350 130 305 215 1000
Porcentaje 35.0% 13.0% 30.5% 21.5% 100.0%

66
160

140

120

100 I
80 II
III
60
IV
40

20

0
Profesionales Comerciantes Obreros Amas de casa

4.2 CUALITATIVA-CUANTITATIVA.
Supongamos que tenemos datos numricos para varias categoras, por
ejemplo en un experimento donde hacemos mediciones numricas en dos o
ms grupos. En estos casos, lo que se realiza es un estudio descriptivo de la
variable numrica en cada una de las muestras y se comparamos los
resultados.

Ejemplo
Una empresa dedica al rubro de ingeniera, decide analizar el rendimiento
econmico porcentual, obtenido en inversiones en 4 reas geogrficas. Para
ello selecciona muestras de sus ltimas inversiones, obteniendo los siguientes
resultados.

Tasas de Rendimiento (%)


C B D A
4.6 2 7 7.9
2 7.4 4.5 6.8
6.8 1.8 11.6 5.8
4.2 3.2 6 9.2
1.6 4 6.8 11

67
Son las tasas medias de rendimiento (%) en los ares A, B, C y D diferentes?
Solucin.
Nivel de
Rendimiento Mean Variance CoefVar Median
A 8.140 4.158 25.05 7.900
B 3.68 5.13 61.56 3.20
C 3.840 4.468 55.05 4.200
D 7.18 7.07 37.04 6.80

12

10
Tasas de rendimiento

A B C D
Nivel de rendimiento

4.3 CUANTITATIVA-CUANTITATIVA.
Anlisis de dos variables cuantitativas y establecimiento de una relacin entre
ellas. La forma mas sencilla de estudiar la posible asociacin entre estas
variables es el diagrama de dispersin (Nube de puntos). Si reconocemos una
tendencia, entonces el inters ahora ser el anlisis de regresin.

Media y varianza
La informacin de las dos variables X e Y se puede resumir usando la media y
la varianza como se muestra a continuacin:

Media de la variable X: x
fx i i

68
Media de la variable Y: y
fy i i

Varianza de la variable X: s 2

fx 2
i i
x
2
x
n

Varianza de la variable Y: s y2
fy i
2
i
y
2

La covarianza
Es una medida de la asociacin lineal existente entre dos variables. Resume la
informacin contenida en el diagrama de dispersin. Presenta la siguiente
expresin:

cov( x, y) sxy
fxy
i i i
x. y
n

Si la covarianza est muy prxima a cero, no existe relacin entre las variables
o si existe es marcadamente no lineal, si es positiva, hay asociacin lineal
positiva, y si es negativa, hay asociacin lineal negativa. Sin embargo, como la
covarianza depende de las unidades de medida de las variables, no nos
permite cuantificar el grado de asociacin lineal ni comparar la asociacin
existente entre distintos pares de variables. Para dar solucin a este problema
se obtiene el coeficiente de correlacin.

Correlacin
Estudia la relacin o dependencia que existe entre dos variables que
intervienen en una distribucin bidimensional.

Coeficiente de correlacin lineal


Es un nmero que mide el grado de dependencia entre las variables X e Y.
s xy
Se mide mediante la siguiente frmula: r
s x .s y

Su valor est comprendido entre 1 y 1.


Si r = -1 r = 1 todos los valores de la variable bidimensional se
encuentran situados sobre una recta.

69
Si 1< r < 0 se dice que las variables X e Y estn tambin en
dependencia aleatoria. La correlacin es negativa.
Si 0 < r < 1 la correlacin es positiva. Las variables X e Y estn tambin en
dependencia aleatoria.

La correlacin es tanto ms fuerte a medida que r se aproxima a 1 1 y es


tanto ms dbil a medida que se aproxima a 0.

Anlisis de Regresin
Regresin: conjunto de tcnicas que son usadas para establecer una relacin
entre una variable cuantitativa llamada variable dependiente y una o ms
variables independientes, llamadas predictoras. Estas tambin deberan ser
cuantitativas, sin embargo algunas de ellas podran ser cualitativas.

Modelo de regresin. Ecuacin que representa la relacin entre las variables


Y X

Estimacin de la lnea de regresin usando Mnimos Cuadrados


Se debe Minimizar el error cuadrtico medio:
n n
Q , e ( yi xi ) 2
2
i
i 1 i 1

n n n
n xi yi xi yi
S xy
i 1
n
i 1
n
i 1

n xi2 ( xi ) 2
S xx
i 1 i 1

y x

La pendiente , indica el cambio promedio en la variable de respuesta cuando


la variable predictora aumenta en una unidad adicional.
El intercepto , indica el valor promedio de la variable de respuesta cuando la
variable predictora vale 0. Sin embargo carece de interpretacin prctica si es
irrazonable pensar que el rango de valores de x incluye a cero.

70
A partir de la recta Y X podemos calcular los valores de y conocidos
los de x. La fiabilidad que podemos conceder a los clculos obtenidos viene
dada por el coeficiente de correlacin: si r es muy pequeo no tiene sentido
realizar ningn tipo de estimaciones.
Si r es prximo a 1 1, las estimaciones realizadas estarn cerca de los
valores reales.
Si r = 1 o r = -1, las estimaciones realizadas coincidirn con los valores reales.

Ejemplos;
1. Se realiza un estudio respecto de la influencia que presenta la intensidad de la
fuerza aplicada (X) al cable de acero, en el alargamiento (Y) que esta
presenta ,La informacin se muestra a continuacin.

X 14.8 15.2 14.4 15.2 13.2 14 14.4 12.4 14.8 14 14.4 14.8 13.2 16.4 12.4
Y 14 14.7 12 16 12.67 15.3 13.3 12.7 16 12.7 15.3 16 13.3 13.33 12
a) Trace un diagrama de dispersin.
b) Ajuste una recta de regresin.
c) Calcule la correlacin lineal e interprete dicho valor.
Solucin:

Scatterplot of Y vs X

16

15

14
Y

13

12

12 13 14 15 16 17
X

Resumen de calculos.

71
X Y X.Y X2 Y2
14.8 14 207.2 219.04 196
15.2 14.67 222.984 231.04 215.2089
14.4 12 172.8 207.36 144
15.2 16 243.2 231.04 256
13.2 12.67 167.244 174.24 160.5289
14 15.33 214.62 196 235.0089
14.4 13.33 191.952 207.36 177.6889
12.4 12.67 157.108 153.76 160.5289
14.8 16 236.8 219.04 256
14 12.67 177.38 196 160.5289
14.4 15.33 220.752 207.36 235.0089
14.8 16 236.8 219.04 256
13.2 13.33 175.956 174.24 177.6889
16.4 13.33 218.612 268.96 177.6889
12.4 12 148.8 153.76 144
213.6 209.33 2992.208 3058.24 2951.8801

x
x i

213.6
14.24 ;
N 15

y
y i

209.33
13.96 ;
N 15

s 2

x 2
i
x
2 3058.24
14.242 1.11
x
N 15

s 2

y 2
i
y
2 2951.88
13.962 1.91 ;
y
N 15

sxy
x y i i
x. y
2992.208
(14.24).(13.96) 0.69
N 15

Recta de regresin
n n n
n xi yi xi yi
S xy 0.69
i 1
n
i 1
n
i 1
0.62
S x2
n x ( xi ) 2 2 1.11
i
i 1 i 1

72
y x 13.96 0.62(14.24) 5.13

Y X 5.13 0.62 X

sxy 0.69
r 0.47
sx .s y 1.11. 1.91

73
Ejercicios propuestos.

1. En las siguientes tablas se presentan las remuneraciones de obreros y empleados


de la empresa El Progreso en el mes de Abril de 2010 (en dolares).

OBREROS EMPLEADOS
Remuneraciones Frecuencias Remuneraciones Frecuencias
200 - 250 30 700 - 750 10
250 - 300 50 750 - 800 25
300 - 350 85 800 - 850 15
350 - 400 55 850 - 900 5
400 - 450 30 900 - 950 5
a) Se afirma que la remuneracin promedio de los empleados es mayor en
un 30% respecto a la remuneracin promedio de los empleados. Est
usted de acuerdo?
b) Cul es la remuneracin ms frecuente de los obreros y de los
empleados?
c) Entre qu valores se encuentra el 50% central de las remuneraciones
de los empleados?
d) Si los obreros han recibido en Mayo una remuneracin promedio de
391,2 dlares por efecto de un reajuste cul fue el aumento porcentual
de reajuste?

2. Un especialista trabaja como corredor de bolsa para una empresa. Sus registros
muestran que las tasas de rendimiento ( en porcentajes) de dos acciones para 8
meses seleccionados fueron de :

Acciones A 15.5 3.6 21.7 27.2 7.8 2.2 5.0 12.2


Acciones B 4.5 6.2 5.5 7.2 3.5 4.2 4.1 12
a) En que accin invertira la empresa, si el inters es tener un rendimiento
mas alto.
b) Que accin debera aconsejar el especialista a la empresa que prefieren
menos riesgo.

74
3. Se realizo pruebas de laboratorio para determinar el contenido de asfalto sobre la
elasticidad y la permeabilidad de concreto asfaltado de clasificacin abierta. Se
prepararon 4 especimenes de concreto con cada uno de los siguientes
contenidos de asfalto (porcentaje del peso total de la mezca): 3, 4, 5, 6, 7 y 8 . Se
determino la permeabilidad al agua de cada espcimen de concreto haciendo fluir
sobre el espcimen agua al que se le extrajo el aire y midiendo la perdida de
agua. Las mediciones de permeabilidad fueron:

Contenido de asfalto (%) 3 4 5 6 7 8


Permeabilidad en pulgadas por 1440 1293 1210 822 585 208
hora
a. Estimar la ecuacin.
b. Prediga la permeabilidad para un contenido de asfalto de 6.5.

4. Los siguientes datos provienen del numero de torsiones necesarias para romper
una barra ( Y) hecha con cierto tipo de aleacin y el porcentaje (X) del metal A.
X 5 5 10 10 15 15 20
Y 68 60 40 38 31 35 18
Ajustar el modelo de regresin.

5. Una gran compaa llev a cabo un estudio para ubicar las variables que
pudieran determinar el sueldo de un egresado universitario dos aos despus de
haberse graduado como Tcnico Superior Universitario en un rea de ingeniera.
Los datos recogidos se presentan en la siguiente tabla:
(La columna del sueldo es en cientos de miles de bolvares.)

Edad Sexo E. Civil Ingls Sueldo


1 24 F C A 6,75
2 25 M C M 6,90
3 26 M S B 6,90
4 27 F C B 6,80
5 27 M D A 7,10
6 27 F C M 6,50

75
7 27 M S A 7,25
8 25 F C B 6,80
9 23 M S B 6,75
10 24 M S B 6,80
11 26 F C M 6,75
12 29 F D M 7,00
13 25 M C A 7,15
14 31 F D A 7,50
15 26 M S B 6,20
16 24 F D M 7,40
17 26 F C B 6,70
18 28 F S M 6,95
19 25 M C B 6,95
20 29 M C M 7,10
a. Utilice la tcnica de estadstica descriptiva ms apropiada para analizar
cada variable individualmente. Interprete lo obtenido.
b. Realice diagramas de cajas que le ayuden a visualizar como influye
cada una de las variables en el sueldo que gana el individuo.
c. Como futuro Tcnico Superior en el rea Administrativa, cul seria
la(s) caractersticas que usted debera tomar en consideracin para
obtener el sueldo al que usted aspirara al egresar?

6. Se desea estudiar la relacin entre los aumentos de precios y los salarios en 8


empresas tomadas al azar, tal que se define x: % de aumento de salarios e
y: % de aumento de precios

x 169.3, x2 3630.89, xy 2731.82, y 126.9, y 2 2498.01

a) Calcular la recta de ajuste e interpretar las componentes en funcin del


problema
b) Qu porcentaje del anlisis queda explicado por la recta de regresin? Que
podra Ud. Decir al respecto?
c) Estimar el porcentaje de aumento en los precios, si se produce un aumento
del 20% en los salarios, es lgico estimar dado el resultado obtenido en b)

76
7. Suponga que usted tiene a su cargo el dinero de la regin, se le dan los
siguientes datos de antecedentes sobre el suministro de dinero y el producto
nacional bruto (ambos en millones de dlares):
Suministro de Producto Nacional
dinero Bruto
2 5
2.5 5.5
3.2 6
3.6 7
3.3 7.2
4 7.7
4.2 8.4
4.6 9
4.8 9.7
5 10

(a) Desarrolle la ecuacin de estimacin para predecir el PNB del suministro de


dinero.
(b) Cmo interpreta la pendiente de la lnea de regresin?.
(c) Calcule e interprete el error estndar de la estimacin.

77
CAPITULO V

PROBABILIDADES

El Clculo de Probabilidades se ocupa de estudiar ciertos experimentos que se


denominan aleatorios, cuya caracterstica fundamental es la incertidumbre del
resultado, esto significa que es imposible predecir los resultados porque hay ms de
uno posible.
En nuestra vida cotidiana asociamos usualmente el concepto de probabilidad a su
calificativo probable, considerando probable a aquellos eventos en los que
tenemos alto grado de creencia en su ocurrencia. En esta lnea probabilidad es un
concepto asociado a una medida del azar.
El objetivo de la probabilidad es cuantificar las posibilidades que tengan ciertos
eventos inciertos.

5.1 EXPERIMENTO ALEATORIO.


Es una accin que da lugar a resultados identificables y se caracteriza por:
Todos los posibles resultados son conocidos previamente.
Repeticiones en situaciones anlogas pueden dar resultados diferentes.
No se puede predecir el resultado del mismo antes de realizarlo, es decir, no
se sabe cul de los posibles resultados aparecer al final.
Los experimentos pueden ser aleatorios o deterministas. Aleatorio significa
relativo a todo acontecimiento incierto, por depender de la suerte o del azar,
mientras que los deterministas son aquellos que se caracterizan por el hecho
de que las mismas causas producen los mismos efectos.

78
Espacio muestral.
Es el conjunto de todos los resultados posibles del experimento y se denota por
. A cada elemento de se denomina punto muestral w , es decir:
w / w es un punto muestral .

Evento o Suceso Aleatorio.


Un evento aleatorio es un subconjunto del espacio muestral y se denota con
letras maysculas.
El evento seguro , es aquel que ocurre siempre al realizar el experimento.
El evento imposible , es aquel que no ocurre nunca.
Lo s eventos elementales solo tienen un punto muestral.
El evento complementario Ac , esta dado por todo los puntos muestrales que
no estn en A

5.2 OPERACIONES DE EVENTOS.


Unin de eventos: Dados dos eventos A y B de un mismo espacio muestral su
unin se representa por A B y es el evento que contiene los elementos que
estn en A o en B o en ambos. El evento A B ocurre si al menos uno de los
dos eventos ocurre.
Interseccin de eventos: Dados dos eventos A y B de un mismo espacio
muestral su interseccin se representa por A B y es el evento que contiene
los elementos que estn en A y B al mismo tiempo.
El evento A B ocurre cuando ambos eventos ocurren simultneamente.
Evento Complemento: El complemento de un evento A se representa por Ac
y es el evento que contiene todos los elementos que no estn en A. El evento
Ac ocurre si A no ocurre.

5.3 DEFINICIN CLSICA DE PROBABILIDAD:


La probabilidad de un suceso A se calcula como el nmero de casos favorables
al suceso A, partido por el nmero de casos posibles del experimento aleatorio.
casos favorables
p( A)
casos posibles

79
5.4 DEFINICIN AXIOMTICA DE PROBABILIDAD.
La probabilidad es una funcin que asigna a cada suceso A un nmero
real que varia entre 0 a 1.
P : y que verifica:
A p(A)
i) 0 p( A) 1 A

ii) p 1

iii) Si A y B son sucesos incompatibles,


p A B p A p B

Como consecuencia de estos tres axiomas, se verifican adems las siguientes


propiedades:
iv) p( Ac ) 1 p A

v) p( ) 0
vi) Si A B , p( A) p( B)
vii) P( A \ B) P( A) P( A B) , A,B

viii) Si A 1 , A 2 , ...... , A n son incompatibles dos a dos, entonces

p A1 A2 ... An p A1 p A2 ... p An

ix) Si A, B son dos sucesos cualesquiera, entonces


p A B p A p B p A B

x) Si A, B son dos sucesos cualesquiera, entonces


p( A) p A Bc p A B

5.5 PROBABILIDAD CONDICIONADA.


Queremos estudiar como cambia la probabilidad de ocurrencia de A cuando se conoce
que otro evento B ha ocurrido. En este caso habria que referirse a la probabilidad
de A condicionada a B como la probabilidad de que ocurra A sabiendo que ha
ocurrido B, la denotamos por P(A|B)
P( A B)
P( A | B) , P(B) 0.
P( B)
En consecuencia,

p(A B) =p( A) p( B )
A

80
Independencia.
Dos sucesos A, B se dicen independientes si:
p( A) p( A | B) , o bien p( B) p( B | A)
Es decir, se cumplir que:

p( A B) p( B). p( A)

Si A y B son independientes, entonces A y B C son independientes, A C y B son


independientes, y A C y B C son independientes.

Observacin. Decimos que n sucesos A1, A2, An son independientes si para


cada par (Ai, Aj), P( Ai Aj ) P( Ai) P( Aj ) si i j , si para cada tro (Ai, Aj, Ak)
P( Ai Aj Ak ) P( Ai) P( Aj ) P( Ak ) si i j k y as sucesivamente. En general,
P( A1 A2 An) P( A1) P( A2) P( An)

Teorema de la probabilidad compuesta.


Dados n sucesos A 1 , A 2 , ......., A se verifica:
P( A1 A2 An) P( A1) P( A2 | A1) P( A3 | A1 A2) P( An | A1 A2 An 1)

Teorema de la probabilidad total.


Si suponemos que los eventos A1, A2, A3, ...., An, forman una particin de un
espacio muestral ; esto es, que los eventos A i son mutuamente excluyentes y
su unin es .

A2 An
A1

81
Si A 1 , A 2 , ......., A n son un sistema completo de sucesos tal que :

i) A1 A2 i j ( disjuntos dos a dos)


n
ii) Ai
i 1

iii) p( Ai ) 0 , i 1,....n .

La probabilidad de un suceso B cualquiera es:


n
p( B) p( Ai ) p( B | Ai )
i 1

p( B) p( A1 ) p( B ) p( A2 ) p( B ) ....... p( An ) p( B )
A1 A2 An

Teorema de Bayes.
El procedimiento que se utiliza para encontrar probabilidades posteriores, a
partir de probabilidades previas, se llama regla Bayesiana. Las probabilidades
apriori o previas se conocen antes de obtener informacin alguna del
experimento en cuestin. Las probabilidades aposteriori se determinan
despus de conocer los resultados del experimento.
El teorema de Bayes consiste en un mtodo para encontrar la probabilidad de
una causa especfica cuando se observa un efecto particular. Esto es, si el
evento B ha ocurrido, Cul es la probabilidad de que fue generado por el
evento A1 (que es una causa posible ) o por el A2 (otra causa posible)?.
Si A 1 , A 2 , ......., A n son un sistema completo de sucesos tal que p( Ai ) 0 ,

i 1,....n , entonces para un suceso B cualquiera se verifica:

p( Ai B) p( Ai ) p( B | Ai )
p( Ai | B) n , i = 1, ...., n.
p( B) p ( A i ) p (
i 1
B | Ai )

p( Ai ) p( B | Ai)
p( Ai | B)
p( A1 ) p( B ) p( A2 ) p( B ) ....... p( An ) p( B )
A1 A2 An

82
Problemas Resueltos.

1) Un municipio analiza tres proyectos de irrigacin presentados por una consultora


para confirmar o descartar la presencia de omisiones de tipo tcnico.
a) Cual es el espacio muestral.
b) Cual es la probabilidad de que dos de los proyectos presentados presenten
omisiones tcnicas.
c) Cual es la probabilidad de que el primer proyecto presente una omisin
tcnica y la ultima no presente.
d) Cual es la probabilidad de que por lo menos un proyecto presente algn tipo
de omisin tcnica.

Solucin.
Denotemos con P, si el proyecto presenta una omisin tecnica y con N, si el
proyecto no presente ningn tipo de omisin .
a) PP
1 2 N3 , PP
1 2 P3 , PN 1 2 P3 , N1P2 P3 , N1P2 N3 , N1 N 2 P3 , N1 N 2 N3
1 2 N3 , PN

b) Sea el evento A: Dos proyectos presentan omisiones tecnicas

A PP 1 2 P3 , N1 P2 P3
1 2 N3 , PN

n( A) 3
p( A)
n() 8
c) Sea el evento B: Primer proyecto presenta omisin y el ltimo no presenta.

C PP 1 2 N3
1 2 N3 , PN

83
n(C ) 2
p(C )
n() 8
d) Sea el evento D: Por lo menos un proyecto presenta omisiones tecnicas.
D PP
1 2 N3 , PP
1 2 P3 , PN 1 2 P3 , N1P2 P3 , N1P2 N3 , N1 N 2 P3
1 2 N3 , PN

n( D ) 7
p ( D)
n() 8

2) El gerente de una empresa constructora con el propsito de incrementar sus


utilidades, disea tres estrategias de marketing A, B y C. En el 40% de las
sucursales, se aplica la estrategia A , de estas en el 1% de los casos no se presentan
incrementos en las utilidades, en el 30% de las sucursales se aplica la estrategia B
y en el 2% no se presentan incrementos en las utilidades. En el resto de las filiales
se utiliza la estrategia C, observndose que en el 3% de las mismas no se presentan
incrementos en las utilidades. Si se selecciona aleatoriamente una filial de la
empresa. Cual es la probabilidad de que :
a) No presente incrementos en las utilidades.
b) No presente incrementos en la utilidad y se haya aplicada la estrategia B.
c) La filial haya empleado la estrategia C, dado que no se presento incremento
en su utilidad.
Solucin
No incrementa
1%

99%
Incrementa
A

40%
2% No incrementa

98%
Estrategia 30% B Incrementa

3%
No incrementa
30%
C

97% Incrementa

84
Sean los eventos.
A: La filial de la empresa, aplica la estrategia A
B: La filial de la empresa , aplica la estrategia B
C: La filial de la empresa , aplica la estrategia C
D: No se presenta incrementos en la utilidad.

a) p( D) p( A) p( D ) p( B) p( D ) p(C ) p( D )
A B C
p( D) 0.4*(0.01) 0.3*(0.02) 0.3*(0.03) 0.019 1.9%

b) p(B D) =p( B) p( D )
B
p(B D) =0.3*(0.02) 0.006 0.6%

p(C D) p(C ) p( D | C )
c) p(C | D)
p ( D) p( A) p( D | A) p( B) p( D | B) p(C ) p( D | C )
0.3*(0.03)
p(C | D) 0.473 47.3%
0.4*(0.01) 0.3*(0.02) 0.3*(0.03)

3) Los siguientes datos pertenecen a 50 empresas de construccion de la ciudad de


Cusco divididos en 3 categoras y clasificados segn tengan o no deudas
impositivas:
IMPUESTOS CATEGORIAS
A B C
Al da 7 6 12
En mora 9 8 8
Si se elige una empresa al azar cul es la probabilidad de que:
a) est en mora?
b) pertenezca a la categora A o B?
c) pertenezca a la categora C o est en mora?
d) pertenezca a la categora A y est en mora?
e) Dado que el pago de sus impuestos esta al da. Cual es la probabilidad de
que la empresa pertenezca a la categora B?.
Solucion.

85
Sean los eventos:
A: Empresa pertenece a la categora A.
B: Empresa pertenece a la categora B.
C: Empresa pertenece a la categora C.
D: Impuestos en mora. E: Impuestos al da.
n( D) 25
a) p( D) 0.5
n() 50
n( A) n( B) n( A B)
b) p( A B) p( A) p( B) p( A B)
n() n() n()
16 14 0 30
p( A B) 0.6
50 50 50 50
n(C ) n( D) n(C D)
c) p(C D) p(C ) p( D) p(C D)
n() n() n()
20 25 8 37
p(C D) 0.74
50 50 50 50
n( A D ) 9
d) p( A D) 0.18
n() 50
n( B E )
P( B E ) n ( ) n( B E ) 8
e) P( B | E )
P( E ) n( E ) n( E ) 25
n ( )

4) Se hizo una auditoria a las obras ejecutadas por tres municipios A, B, y C, para
tal efecto se analiza 3 obras ejecutadas por el municipio A, 2 cuentas del
municipio B y 5 obras ejecutadas por el municipio C. La probabilidad de que se
presenten irregularidades en el municipio A es de 1/3, que se presente en
municipio B es de 2/3 y que se presente en municipio C es de 1/7. Se analiza
una obra aleatoriamente y se encuentra que hay irregularidades. Cul es la
probabilidad de que se trate del municipio C?
Solucin
Sean los eventos
A: Obras ejecutadas por el Municipio A.
B: Obras ejecutadas por el Municipio A.
C: Obras ejecutadas por el Municipio A.
E: La obra ejecutada presenta irregularidades.

86
E
1/3

A D
3/10

2/3 E

2/10 B
D
1/7
5/10 E
C

p(C E ) p(C ) p( E | C )
p(C | E )
p( E ) p( A) p( E | A) p( B) p( E | B) p(C ) p( E | C )
3 1
*
10 3 21
p(C | E ) 32.8%
3 1 2 2 5 1 64
* * *
10 3 10 3 10 7

87
Problemas Propuestos.

1. En la construccin de unas determinadas obras pueden aparecer anomalas


debidas a dos causas que son independientes: Fallos de cimentacin y mala
calidad de los materiales. La primera ocurre con probabilidad del 4% y la segunda
con probabilidad del 3%.
a) Calcular la probabilidad de que en una determinada obra no aparezca ninguna
anomala.
b) Calcular la probabilidad de que aparezcan fallos de cimentacin y no mala
calidad de los materiales.
c) Si se detecta la presencia de anomalas, la construccin puede verse afectada
con un desplome en un plazo de tiempo con las siguientes probabilidades: 0.1
cuando no aparece ninguna de las anomalas y 0.8 cuando aparece alguna de
las anomalas. Interprete esta informacin adicional en trminos de sucesos y
probabilidades. Calcular la probabilidad de que el edificio se desplome. Si el
edificio se ha desplomado cual es la probabilidad de que haya sido producido
por alguna anomala?
d) Una determinada empresa realiza 5 obras cada ao Cual es la probabilidad de
que en 5 aos al menos tres obras sufran anomalas?

2. Una empresa compra cierto tipo de materiales de construccin que es


suministrada por 3 proveedores: el 45% de los materiales de construccin son
compradas al 1er proveedor resultando defectuoso el 1%, el 2do proveedor
suministra 30% de los materiales de construccin y de ellas es defectuoso el 2%.
Las restantes provienen del 3er proveedor, siendo defectuoso el 3% de las
mismas.
En un control de recepcin se selecciona un material de construccin al azar y es
defectuosa. Calcular la probabilidad de que la haya suministrado el 2do proveedor.

3. Un proceso se puede ejecutar con uno de tres maquinarias posibles, digamos A,


B y C. En el 20% de los casos se emplea la maquinaria A, mientras que las
maquinarias B y C son usados el mismo nmero de veces. En algunas ocasiones
en que se realiza el proceso se producen atrasos. Esto ocurre el 10% de las

88
ocasiones en que se usa la maquinaria A, siendo estos porcentajes del 15% en el
caso en que se aplica la maquinaria B y el 5% en el caso en que se usa la
maquinaria C.
a) En qu porcentaje de las ejecuciones del proceso no se producen atrasos?
b) Qu porcentaje de los atrasos de las ejecuciones del proceso son atribuibles
a la maquinaria B?
c) Elegida, al azar, una ejecucin Qu probabilidad hay que no tenga retraso
en su ejecucin y corresponda al uso de la maquinaria A o C?

4. Las previsiones sobre la inflacin de un determinado pas para el prximo ao la


sitan por debajo del 2% con probabilidad 0,65, entre el 2% y el 3% con
probabilidad 0,25 y por encima del 3% con probabilidad 0,1. Si la probabilidad de
crear ms de 700.000 empleos es de 0,7 con inflacin baja, de 0,4 cuando sta
se sita entre el 2% y el 3% y nula en otro caso, calcule:
a) La probabilidad de que se creen ms de 700.000 empleos.
b) Si antes de conocer el dato de inflacin anual, se sabe que se han creado
ms de 700.000 empleos, cul es la probabilidad de cada uno de los tres
niveles de inflacin considerados?

5, Una fbrica produce tres productos, 1, 2 y 3, cada uno de ellos en calidad extra y
comercial. La probabilidad de producir una unidad de calidad extra en cada uno
de esos productos es: 0,75, 0,5 y 0,8, respectivamente. A su vez esos productos
se fabrican en las siguientes proporciones: 45%, 35% y 20%, respectivamente.
Con esa informacin responda a las siguientes cuestiones:
a) Si se selecciona al azar una unidad producida, cul es la probabilidad de que
sea de calidad comercial?
b) Si se selecciona al azar una unidad producida y es de calidad comercial, de
qu producto es ms probable que sea?

6, Un sistema de abastecimiento de agua potable pasa por un dispositivo dotado de


3 compuertas A,B y C configurados tal como muestra el siguiente esquema:

89
Las compuertas A,B y C funcionan correctamente con probabilidades 0.90,
0.80 y 0.65 respectivamente. Si la compuerta A funciona correctamente, la
probabilidad de que B funcione correctamente es de 0.66. Si las compuertas
A y B funcionan correctamente, la probabilidad de que C funcione
correctamente es de 0.83. Adems existe un probabilidad de 0.10 de que A
funcione correctamente y no funcione ni B ni C correctamente.

a. Determine la probabilidad de que el sistema funcione correctamente.


b. Si el sistema falla. Cul es la probabilidad de que la compuerta A funcione
correctamente?

90
Estadstica aplicada Mgt. Cleto De La Torre Dueas

CAPITULO VI

VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD.

Definicin.- Una variable aleatoria (v.a) X es cualquier funcin, que transforma cada
elemento del espacio muestral , en un numero real.

X :
X

Al conjunto de posibles valores de X se le llama rango de X (Rx)


Si Rx es finito o enumerable (rango discreto), entonces X es una v.a Discreta.
Si Rx no es enumerable (rango continuo), entonces X es una v.a Continua.

Funcin de Probabilidad.- Si X es una v.a discreta, la funcin de probabilidad de X


viene dada por:


PX x P X x P / X x , tal que P ( x) 1
xRx
X

Funcin de densidad.- Si X es una v.a continua, la funcin de densidad de X es


b
una aplicacin f X : 0, tal que P a X b f X ( x)dx ,tal que f X ( x)dx 1
a

Funcin de distribucin.- La funcin de distribucin de una v.a X esta dada por:


FX ( x) P( X x) P( / X () x)

Propiedades.

91
Estadstica aplicada Mgt. Cleto De La Torre Dueas

F es continua por la derecha y es creciente


Si X es una v.a discreta , entonces P a X b F b F a P X a

Si X es una v.a continua , entonces P a X b F b F a

dF ( x)
Si X es una v.a continua , entonces F ' ( x) f ( x)
dx
lim x FX ( x) 0 y lim x FX ( x) 1

Definicin.
La esperanza o media de una variable aleatoria X, denotada por E ( X ) o X se

define segn sea la variable discreta o continua, mediante:

x.P X x , si X es discreta
xRx
EX
x. f ( x)dx, si X es continua
xRx
Propiedades.
El valor esperado de una constante es dicha constante
E a bX a bE X

Definicin.- La varianza de una variable aleatoria X cuya media o esperanza es


X , se define como

V X X2 E X X E X E X E X E 2 X
2 2 2

Propiedades.
La raz cuadrada de la varianza se llama desviacin estndar.

X2 E X X2
2

V aX b a 2V ( X )

Desigualdad de Chebyshev.
Si X es una variable aleatoria, entonces para cualquier k se cumple

P X X k X 1
1
k2

92
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Ejercicio resuelto.

1. Sea X la variable aleatoria definida como la suma de los valores que aparecen al
lanzar dos dados.
a) Determine la distribucin de probabilidad.
b) Calcule la probabilidad P(5<X<8)
c) La media y su varianza.
Solucin.
a)
Resultados en 1 2 3 4 5 6
los dos dados
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

X: Suma de los valores de los dos dados


Rx 2 3 4 5 6 7 8 9 10 11 12
P(X) 1/36 2/36 3/16 4/16 5/36 6/36 5/36 4/36 3/36 2/36 1/36

b) p(5 X 8) p(6) p(7) 5 / 36 6 / 36 11/ 36


c) Media
EX x.P X x , si X es discreta
xRx

1 2 3 4 5 6 5 4 3 2 1
E X 2 3 4 5 6 7 8 9 10 11 12
36 36 36 36 36 36 36 36 36 36 36
252
EX
36
Varianza.

X2 E X E 2 X
2

93
Estadstica aplicada Mgt. Cleto De La Torre Dueas

1 2 3 4 5 6 5 4 3 2 1
E X 2 22 32 42 52 62 72 82 92 102 112 122
36 36 36 36 36 36 36 36 36 36 36
EX2
1974
36
2
1974 252
X2 E X E 2 X
2

36 36

DISTRIBUCIONES IMPORTANTES.
Existen, como en el caso de la ltima variable ejemplificada, otras variables cuyas
funciones de probabilidad o densidad resultan ser modelos de mucha utilidad para
una serie de aplicaciones. Nosotros citaremos brevemente algunos de los modelos
de mayor importancia.

DISTRIBUCIONES DISCRETAS.
Un experimento de Bernoulli, es un experimento aleatorio con solo dos posibles
resultados: xito y Fracaso. Sea p = P (xito).

Distribucin Binomial.
La distribucin binomial aparece cuando se dan las condiciones siguientes:
-Tenemos un experimento aleatorio simple, con una situacin dicotmica, es
decir xito y Fracaso.
- Repetimos este experimento simple n veces de manera independiente.

X = Nmero de xitos en n experimentos independientes de Bernoulli.


Funcin de Probabilidad:

C xn p x 1 p
n x
, si x 0,1,2,..., n
PX x

0 , en otro caso.

Valor esperado: X np. Varianza: X2 np1 p .

Notacin: X B(n, p).

Distribucin de Pascal o Binomial Negativa. Notacin: X BN(r, p).

94
Estadstica aplicada Mgt. Cleto De La Torre Dueas

X = Nmero de ensayos (experimentos independientes de Bernoulli) hasta


conseguir el r-simo xito.
Funcin de Probabilidad:

Crx11 1 p p r
x r
, si x r , r 1, r 2,...
PX x

0 , en otro caso.
r r 1 p
Valor esperado: X . Varianza: X2 .
p p2
Nota: Si r = 1, X se dice que es una variable aleatoria con distribucin
geomtrica de parmetro p, y se le denota por X G(p).

Distribucin Hipergeomtrica. Notacin: X H(N, M, n).


Considrese una poblacin de N elementos, M de los cuales son de un tipo A,
y supongamos se extraen sin reemplazo una muestra de n elementos de esta
poblacin. Entonces:
X = Nmero de elementos de tipo A en la muestra.
Funcin de Probabilidad:
C xM C nNxM
, si x 0,1,2,..., n
PX x C nN

0 , en otro caso.

M M M N n
Valor esperado: X n . Varianza: X2 n 1 .
N N N N 1
Notas:

1. En PX se esta usando la convencin que Cab 0, si a > b.

2. Si la eleccin de la muestra fuera con reemplazamiento, entonces

M
X B n, p .
N

Distribucin de Poisson.
La distribucin de Poisson aparece en situaciones en las que se cuenta el
nmero de apariciones de un determinado suceso o bien en un intervalo de
tiempo dado (como el nmero de partculas emitidas en un segundo por un
material radioactivo, o el nmero de pacientes que llegan a un servicio en un

95
Estadstica aplicada Mgt. Cleto De La Torre Dueas

intervalo de tiempo dado) o bien en un recinto fsico (como el nmero de fallos


en un metro de alambre de hierro producido.
X = Nmero de eventos en 0, t .
Funcin de Probabilidad:
x e
, si x 0,1,2,...
PX x x!

0 , en otro caso.

Valor esperado: X . Varianza: X2 .

DISTRIBUCIONES CONTINUAS.

Distribucin Uniforme. Notacin: X U a,b.


Esta distribucin se da cuando la variable aleatoria X puede tomar
indistintamente cualquier valor en el intervalo a, b.
Funcin de densidad:

1
, si x a, b
f X x b a

0 , en otro caso.

Valor esperado: X
ab
. Varianza: X2
b a 2 .
2 12

Distribucin Normal. Notacin: X N(, 2).


Funcin de densidad:
1
2 x 2

f X x
1
e 2
2
Valor esperado: X . Varianza: X2 2 .

Nota: Cuando = 0 y 2 = 1, a X se le denota por Z y se le llama una variable


aleatoria con distribucin normal estndar; vale decir, Z N (0, 1). Toda v.a.
normal X N (,2) puede convertirse con una v.a. normal estndar
(estandarizarse) a travs de la transformacin:
X
Z

96
Estadstica aplicada Mgt. Cleto De La Torre Dueas

EJERCICIOS RESUELTOS

1. El rea de evaluacin de proyectos analiza 10 proyectos presentados a un


municipio, se sabe que por estudios anteriores que el 25% de los proyectos no
son aceptados por diversas causas. Calcular la probabilidad de que:
a) Exactamente 4 proyectos sean rechazados.
b) Ninguno de los proyectos presentados son rechazados.
c) Todos son rechazados.
d) Por lo menos 8 son rechazados.
e) A lo sumo 3 no son aceptados.
f) Calcular la Media y varianza

Solucin
Consideremos los sucesos
A = El proyecto es rechazado , P (A) = 0.25
A = El proyecto no es rechazado, P ( A ) = 0.75
Se trata de una distribucin Binomial de parmetros B (10, 0.25 )
Sea X la variable aleatoria que representa el nmero de proyectos rechazados
por la oficina de evaluacin de proyectos
a) P(Exactamente 4 proyectos son rechazados) =
10
PX 4 (0.25) 4 (0.75)6 0.1460
4
b ) P (Ninguno proyecto presentado es rechazado) =
10
PX 0 (0.25)0 (0.75)10 0.0563
0
10
c) P(Todo los proyectos son rechazados) = PX 10 (0.25)10 (0.75)0 0
10
d) P(Por lo menos 8 proyectos son rechazados) =
PX 8 PX 8 PX 9 PX 10

10 10
(0.25)8 (0.75) 2 (0.25)9 (0.75) 0 0.005
8 9

97
Estadstica aplicada Mgt. Cleto De La Torre Dueas

e) P( A lo sumo 3 proyectos son rechazados ) =


P X 3 PX 0 PX 1 PX 2 PX 3

10 10 10 10
(0.25)0 (0.75)10 (0.25)1 (0.75)9 (0.25) 2 (0.75)8 (0.25)3 (0.75)7 0.7759
0 1 2 3

f) Media y Varianza
np 10 (0.25) 2.5
2 np(1 p) 10(0.25)(0.75) 1.875

2, Usted es el responsable de regular el caudal de descarga de una presa. La


Comisin Nacional del Agua ha determinado que si el caudal que pasa por la
estacin supera la marca de 3 m en la estaca de aforo de la estacin, se corre el
riesgo de daar estructuras hidrulicas aguas abajo. La penalizacin por
descargar caudales mayores es muy severa y le podra costar el puesto. La
probabilidad de que se viole la norma sobre un perodo de tiempo muy grandes
es de 0.20.
Cree Usted probable que durante los ltimos 6 eventos de escurrimiento se
haya sobrepasado la norma en 4 ocasiones?.

SOLUCION.
La probabilidad de que se sobrepase la norma en 4 ocasiones durante 6 eventos
es:

P X x Cxn p x 1 p
n x

P x 4 C46 0.2 1 0.2


6 2
0.015
4

Este valor es muy pequeo y por lo tanto muy improbable que esto haya
sucedido, por lo que de haberse llevado a cabo correctamente la medicin, el
punto de aforo esta recibiendo adems de la descarga de la presa, escurrimiento
directo o bien flujo base del subsuelo.

3. La resistencia de un material est distribuido normalmente con una media de 60


kg y una desviacin tpica es 6. Cul es la probabilidad de que la resistencia de
un material:

98
Estadstica aplicada Mgt. Cleto De La Torre Dueas

a) Sea inferior a 64
b) Sea mayor o igual a 57
c) Sea superior a 63
d) Este entre 57 a 65.
e) Sea inferior a 50
f) Este entre 64 a 70
g) Si se tiene 200 materiales , .Cuantos cabe esperar que presenten resistencias
mayores a 57 y menores de 64?
Solucin.
X: Resistencia
60 (Media poblacional)
6 (Desviacin)
X 64 64 60
a) P( X 64) P( ) P( Z ) P( Z 0.67)
6

(0.67)

0 z=0.67

0.5 (0.67) 0.5 0.24857=0.74857=74.857%

X 57 57 60
b) P( X 57) P( ) P( Z ) P(Z 0.5) (0.5) 0.5
6

(0.5)

z= 0.5 0

0.19146+0.5=0.69146=69.146%
X 63 63 60
c) P( X 63) P( ) P( Z ) P(Z 0.5) 0.5 (0.5)
6

99
Estadstica aplicada Mgt. Cleto De La Torre Dueas

(0.5)

0 z=0.5

0.5 0.19146=0.30854=30.854%
57 X 65 57 60 65 60
d) P(57 X 65) P( ) P( Z )
6 6
X
P(0.50 0.83) (0.50) (0.83) 0.19146+0.29373=0.48519=48.519%

(0.5) (0.83)

z= 0.50 0 z=0.83

X 50 50 60
e) P( X 50) P( ) P( Z ) P(Z 0.167)
6

(0.167)

z= 0.167 0

0.5 (0.167) 0.5 0.0675=0.4325=43.25%


64 X 70 64 60 70 60
f) P(64 X 70) P( ) P( Z )
6 6

X
P(0.67 1.67) (1.67) (0.67) 0.45254-0.24857=0.20397=20.397%

100
Estadstica aplicada Mgt. Cleto De La Torre Dueas

0 z=0.67 z=1.67
(0.67)
(1.67)

57 X 64 57 60 64 60
g) P(57 X 64) P( ) P( Z )
6 6

X
P(0.5 0.67) (0.5) (0.67) 0.19146+0.24857=0.44003=44.003%

Cabe esperar el 44.003% de los materiales, es decir 0.44003*200 88

4. Suponga que el nivel de agua en una presa cambia su nivel mensualmente en


promedio 1 cm,de forma aleatoria, y los cambios graficados describen una
distribucin de Poisson. Cul es la probabilidad de que se presente un cambio
de 2 cm de elevacin en un mes?.

x e
P X x
x!

1 e1
2

P X 2 0.184
2!

101
Estadstica aplicada Mgt. Cleto De La Torre Dueas

EJERCICIOS PROPUESTOS

1. Suponga que la concentracin anual promedio de cloruros en el agua de un ro


es de 300 ppm (partes por milln) con una varianza de 150 ppm. Estos
promedios estn basados en mediciones semanales de muestras durante un
ao contando con datos de 35 aos. Durante un ao en el que se verti agua de
drenaje agrcola el promedio anual aument a 310 ppm.
Cul es la probabilidad de que las concentraciones anuales sean iguales o
mayores a 310 ppm?. Suponiendo que las concentraciones presentan una
distribucin normal

2. Los salarios de los trabajadores de una empresa son en promedio $11,9 por hora
y la desviacin estndar de $0,4. Si los salarios tienen una distribucin normal.
Cul es la probabilidad de que un trabajador seleccionado al azar:
a) Reciba salarios entre $10,9 y $11,9?
b) Reciba salarios inferiores a $11?
c) Reciba salarios superiores a $12,95?
d) Cul debe ser el salario menor que gana un trabajador que se encuentra entre el
10% de los trabajadores que ms ganan?
e) Si la empresa va a aumentarle el salario al 15% de los trabajadores que menos
ganan. Cul ser el salario mximo que deber ganar un trabajador para ser
beneficiado con el aumento?

3. El volumen de acciones negociadas en la Bolsa es normal con una media de 646


millones de acciones y una desviacin de 100 millones de acciones.
a) Cul es la probabilidad de que el volumen negociado sea menor de 400
millones?
b) Cul es la probabilidad de que el volumen negociado de acciones oscile entre
las 400 y las 600 acciones?
c) Si la Bolsa quiere emitir un boletn de prensa sobre el 5% de los das ms activos
Qu volumen publicar la prensa?

102
Estadstica aplicada Mgt. Cleto De La Torre Dueas

4. Se toma una muestra de 12 trabajadores de una gran empresa para estudiar su


actitud frente a un cambio en el mtodo de trabajo. Si el 60% de todos los
trabajadores de la empresa estn a favor del cambio. Cul es la probabilidad de
que menos de 5 de los miembros de la muestra estn a favor?

5. La tasa real de desempleo es de 15%. Suponga que se seleccionan al azar 15


personas en posibilidad de trabajar.
a) Cul es la cantidad esperada de desempleados?
b) Cul es la varianza y la desviacin estndar de los desempleados?
c) Cul es la probabilidad de que al menos 3 estn desempleados?
d) Cul es la probabilidad de que haya entre 3 y 5 desempleados?

6. Sabiendo que el caudal mximo anual de un rio se distribuye normalmente con


un promedio de 830 y un desvo estndar de 125:
a) Cul es la probabilidad de que al prximo ao se presente un caudal mximo
inferior a 885?
b) En qu porcentaje de los aos se presentara un caudal mximo entre 700 y
800?

7. La creciente recesin econmica lleva a las empresas a modificar, entre otras


cosas, sus condiciones de pago. En cierta industria se determin que en el ltimo
ao las cobranzas se realizaron a los 120 das fecha factura en promedio, con un
desvo tpico de 20 das (sin considerar los incobrables y clientes en gestin
judicial) y que la variable das de cobranza se distribuye normalmente.
a) Si no varan las condiciones econmicas ni comerciales para el ao prximo
cree que es muy probable que en la industria estudiada lleguen a cobrar a ms de
150 das?
b) En cuntos das como mximo se espera cobrar el 85 % de las operaciones ?
c) Si la ltima cobranza se efectiviz en un plazo inferior al promedio de das, cul
es la probabilidad de que la empresa haya cobrado despus de los 100 das ?

103
Estadstica aplicada Mgt. Cleto De La Torre Dueas

8. El costo de un producto que se procesa en forma automtica est formado por el


2
costo de los materiales del envase (0,07 m /unidad) y el costo del producto en s
mismo (5 gramos/unidad), tomndose como unidad el envase de presentacin.
Debido a ciertas fluctuaciones, dichos costos son variables aleatorias
independientes que pueden considerarse normalmente distribuidas:
2 2
- el costo de materiales (x) con media 180$/m y desvo estndar de 2$/m .
- el costo del producto (y) con media 20$/gramo, y desvo estndar de 1,5
$/gramo.
a) Cul es la probabilidad de que el costo del producto de una unidad supere los
$ 122?
b) Cul es la probabilidad de que el costo de un pack de 25 unidades supere los
2950$?

9, En un estudio sobre la capacidad del mercado de valores para absorber acciones,


se observa su comportamiento durante intervalos de 10 minutos cada uno, y se
cuenta el nmero de transacciones comerciales realizadas durante cada periodo.
Si el nmero de transacciones realizadas durante cada periodo es una variable
aleatoria X que sigue un modelo de Poisson con un promedio de 6 transacciones.
a) Determine la probabilidad de que de 10 intervalos observados en 2 se
realicen menos de 2 transacciones, en 5 se realicen entre 2 y 4 transacciones
inclusive y en 3 se realicen ms de 4 transacciones.
b) Si se observan continuamente intervalos de 10 minutos cada uno. Cul es la
probabilidad de que el sexto intervalo observado sea el primero en el cual se
realicen ms de 6 transacciones?
c) Si se observan independientemente 6 intervalos de 10 minutos cada uno.
Cul es la probabilidad de que a lo ms en 4 intervalos se realicen menos de
2 transacciones?
d) Si se observan intervalos de 10 minutos cada uno hasta que en 5 de ellos se
realicen entre 2 y 4 transacciones inclusive. Cul es la probabilidad de que
sea necesario observar 10 intervalos?
e) Si se sabe que el nmero total de intervalos observados de 10 minutos cada
uno es 100 y se toma una muestra sin reemplazo de 6 de estos intervalos.

104
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Cul es la probabilidad de que en a lo menos 2 se realicen ms de 6


transacciones?
f) Determine la probabilidad de que en un intervalo de tiempo de 4 minutos se
realice a lo ms una transaccin.

ANLISIS DE FRECUENCIA

Los sistemas hidrolgicos son afectados en ocasiones por eventos extremos, tales
como tormentas severas, crecidas y sequas. La magnitud de un evento extremo
est inversamente relacionada con su frecuencia de ocurrencia, es decir, eventos
muy severos ocurren con menor frecuencia, que eventos ms moderados.
El objetivo del anlisis de frecuencia de informacin hidrolgica es, relacionar la
magnitud de los eventos extremos con su frecuencia de ocurrencia, mediante el uso
de Funciones de Distribucin de Probabilidad.
Los requisitos que debe cumplir la informacin hidrolgica (eventos extremos) es
que:

Debe ser independiente


Est idnticamente distribuida (por ejemplo, precipitacin diaria mxima
anual)
El sistema hidrolgico que la produce (por ejemplo, un sistema de tormenta)
sea aleatorio, independiente del espacio y del tiempo

La informacin hidrolgica empleada debe ser seleccionada cuidadosamente, de


manera tal que se satisfagan las suposiciones de independencia y de distribucin
idntica.

En la prctica, esto se lleva a cabo usualmente seleccionando el mximo anual de la


variable bajo anlisis (por ejemplo, el caudal mximo anual, que puede corresponder
al flujo pico instantneo mximo o al medio diario mximo, que se haya producido en
cualquier momento o en cualquier da durante el aforo) con la expectativa de que
observaciones sucesivas de esta variable de un ao a otro sean independientes.

105
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Los resultados del anlisis de frecuencia de los caudales de crecida pueden


utilizarse para muchos propsitos en ingeniera:
diseo de presas, puentes, cauces evacuadores y estructuras de control de
crecidas
determinar el beneficio econmico de proyectos de atenuacin de crecidas
delimitar planicies de inundacin y determinar el efecto de ocupaciones o
construcciones en las mismas

MTODOS ESTADSTICOS PARA ESTIMAR VALORES EXTREMOS


Estos mtodos consisten en estimar los valores de las crecidas mximas que
pueden producirse en un ro a partir de una serie de caudales mximos conocidos,
extrapolando en dicha serie mediante el empleo de una curva de frecuencia para
diferentes probabilidades.
El problema se centra en utilizar al mximo los registros de caudales de que se
dispone en la estacin para la cual se busca evaluar la ms fuerte crecida a temer;
habr necesidad as de emplear principalmente las tcnicas estadsticas de anlisis
de crecidas, las que permitirn resolver el problema que representa calcular la
probabilidad de que un caudal, superior a un valor dado, sobrevenga al menos una
vez durante un determinado perodo de tiempo (un siglo o un milenio, por ejemplo).
Igual razonamiento es extensivo a la cuantificacin de precipitaciones mximas en
funcin de los valores de los registros disponibles.
El caudal de la crecida anual, definido como el mayor caudal del ao, puede ser
efectivamente considerado como una variable aleatoria continua e ilimitada, de la
cual puede proponerse estudiar la distribucin estadstica.
Estando esta distribucin ajustada a alguna de las leyes tericas conocidas de
probabilidad, de manera que interprete, tan fielmente como sea posible, las
observaciones disponibles, se admite que esa misma ley es vlida, tanto dentro
como fuera del perodo de observacin, permitiendo por lo tanto, calcular el caudal
que tiene una probabilidad dada de ocurrencia, aunque sta sea muy pequea
(como el de la crecida milenaria, por ejemplo).

106
Estadstica aplicada Mgt. Cleto De La Torre Dueas

DATOS A UTILIZAR
El estudio estadstico de crecidas puede orientarse de dos maneras:
si se desea conocer slo la posibilidad de que se alcance un cierto caudal en
un perodo de tiempo dado.
si interesa tambin la duracin de los caudales de crecidas que sobrepasen
uno determinado. Corresponde emplear una serie de duracin parcial.

LEYES DE DISTRIBUCIN DE VALORES EXTREMOS


Los valores extremos son valores mximos o mnimos seleccionados de conjuntos
de datos. Por ejemplo, el caudal mximo anual en un lugar dado es el mayor caudal
registrado durante un ao hidrolgico y todos los valores contenidos en el registro
histrico conforman un conjunto de valores extremos que se pueden analizar
estadsticamente.

MODELOS PROBABILISTICOS DE ANALISIS DE FRECUENCIA.


El planteamiento y el diseo se refiere a eventos del futuro cuyo tiempo de
ocurrencia o magnitud no puede predecirse, esta situacin de incertidumbre hace
necesaria el estudio de probabilidad o frecuencia
Las seguas son eventos extremos, las mismas que deben ajustarse a alguna ley de
probabilidad.

PERIODO DE RETORNO (T R).


Se dice que la variable aleatoria X es un evento extremo, cuando es mayor o igual
a un cierto valor umbral Xt .
Intervalo de tiempo o nmero de aos que en promedio es probable la ocurrencia de
un evento que iguale o exceda a una magnitud x. v La probabilidad de ocurrencia P,
es:
O

Donde P: Probabilidad de ocurrencia.


T: Periodo de retorno
Tipo de estructura Periodo de retorno n aos
Puente sobre carretera importante 50-100 aos
Alcantantarillas 5-10 aos

107
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Drenaje agrcola 5-10 aos


Muros de encauzamiento 2- 50 aos

ANALISIS DE FRECUENCIAS.
La magnitud Xt de un evento hidrolgico extremo puede representarse como la
media ms una desviacin

Donde

: Factor de frecuencia

En trminos aproximados se puede expresar

En Hidrologa las distribuciones de probabilidad ms usadas son:


Normal.
Log-Normal.
Log- Pearson III
Gumbel (Tipo I)
Gamma

ANALISIS DE FRECUENCIA

El anlisis de frecuencia es una herramienta utilizada para, predecir el


comportamiento futuro de los caudales en un sitio de inters, a partir de la
informacin histrica de caudales. Es un mtodo basado en procedimientos
estadsticos que permite calcular la magnitud del caudal asociado a un perodo de
retorno. Su confiabilidad depende de la longitud y calidad de la serie histrica,
adems de la incertidumbre propia de la distribucin de probabilidades seleccionada.
Cuando se pretende realizar extrapolaciones, perodo de retorno mayor que la
longitud de la serie disponible, el error relativo asociado a la distribucin de
probabilidades utilizada es ms importante, mientras que en interpolaciones la

108
Estadstica aplicada Mgt. Cleto De La Torre Dueas

incertidumbre est asociada principalmente a la calidad de los datos a modelar; en


ambos casos la incertidumbre es alta dependiendo de la cantidad de datos
disponibles (Ashkar, et al. 1994). La extrapolacin de frecuencias extremas en una
distribucin emprica de crecientes es extremadamente riesgosa (Garcon, 1994).

Para determinar la magnitud de eventos extremos cuando la distribucin de


probabilidades no es una funcin fcilmente invertibles se requiere conocer la
variacin de la variable respecto a la media. Chow en 1951 propus determinar esta
variacin a partir de un factor de frecuencia K T que puede ser expresado:
X T KT
y se puede estimar a partir de los datos
X T x KT s
Para una distribucin dada, puede determinarse una relacin entre K y el perodo de
retorno Tr. Esta relacin puede expresarse en trminos matemticos o por medio
del uso de una tabla.
El anlisis de frecuencia consiste en determinar los parmetros de las distribuciones
de probabilidad y determinar con el factor de frecuencia la magnitud del evento para
un perodo de retorno dado.
A continuacin se describen las principales distribuciones de probabilidad utilizadas
en hidrologa, la forma de estimar sus parmetros, el factor de frecuencia y los
lmites de confianza. Estos ltimos son indicadores de que tanta incertidumbre se
tiene con las extrapolaciones, puesto que determinar el rango de valores donde
realmente estara la variables, si el rango es muy grande la incertidumbre es muy
alta y si es pequeo, por el contrario, habr mucha confianza en el valor estimado.

DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS

DISTRIBUCION NORMAL
La distribucin normal es una distribucin simtrica en forma de campana, tambin
conocida como Campana de Gauss. Aunque muchas veces no se ajusta a los datos
hidrolgicos tiene amplia aplicacin por ejemplo a los datos transformados que
siguen la distribucin normal.

109
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Funcin de densidad:

La funcin de densidad est dada por


1 ( x ) 2
1
f ( x) exp 2 2
x
2
Los dos parmetros de la distribucin son la media y desviacin estndar para
los cuales x (media) y s (desviacin estndar) son derivados de los datos.

Estimacin de parmetros:

1 n
x xi
n i 1
1
1 n 2
i
2
s ( x x )
n 1 i 1

Factor de frecuencia:
1. Si se trabaja con los X sin transformar el K se calcula como
xT
KT

1
Este factor es el mismo de la variable normal estndar KT F (1 Tr1 )

Limites de confianza:

X Tr t(1 ) Se

Donde es el nivel de probabilidad t(1 ) es el cuantil de la distribucin normal


estandarizada para una probabilidad acumulada de 1- y Se es el error estndar
EJEMPLO.
Dada la serie histrica de caudales medios anuales en m3/s que corresponde a un
registro de 50 aos para el rio Santa.
110
Estadstica aplicada Mgt. Cleto De La Torre Dueas

95.05 98.13 100.18 101.66 101.76


105.21 105.81 106.4 107.43 107.62
108.75 110.77 114.31 116.69 119.52
123 123.22 124.31 127.82 128.15
132.49 134.1 136.22 144.22 145.79
146.08 153.64 153.97 154.8 156.8
158.48 162.29 164.35 169.18 169.64
177 182.53 183.11 183.49 184.98
193.78 193.88 197.58 207.78 208.18
212.48 217.52 239.07 256.62 266.54
a) Los caudales presenta un comportamiento normal
b) Calcular la probabilidad de que :
i) El caudal sea inferior a 180 m3/s
ii) El caudal sea superior a 100 m3/s
iii) Caudal este entre 50 m3/s a 200 m3/s
iv) Periodo de retorno para un caudal de 210 m3/s
v) El caudal para un periodo de retorno de 50 aos.
Solucin
Sea X: Caudal del rio en m3/s

Asumiendo que de la prueba de smirnov-kolmogorov se concluye que la informacin


presenta un comportamiento normal.

i)

ii)

iii)

111
Estadstica aplicada Mgt. Cleto De La Torre Dueas

iv) Periodo de retorno para un caudal de 210

0.0934

Entonces

v) Como

Como T=50 aos, entonces

Estandarizando se tiene Z=2.055

Reemplazando se tiene que X=241.87

DISTRIBUCION LOGNORMAL DE DOS PARAMETROS


Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice
que X se distribuye normalmente.
Esta distribucin es muy usada para el calculo de valores extremos por ejemplo
Qmax, Qmnimos, Pmax, Pmnima (excelentes resultados en Antioquia). Tiene la
ventaja que X>0 y que la transformacin Log tiende a reducir la asimetra positiva ya
que al sacar logaritmos se reducen en mayor proporcin los datos mayores que los
menores.
Limitaciones: tiene solamente dos parmetros, y requiere que los logaritmos de la
variables estn centrados en la media

Funcin de densidad:
1 ( y y )
1 2 y2
f ( x) exp x0
x 2
y = ln x

112
Estadstica aplicada Mgt. Cleto De La Torre Dueas

donde, y : media de los logaritmos de la poblacin (parmetro escalar), estimado y

y : Desviacin estndar de los logaritmos de la poblacin, estimado sy.

Estimacin de parmetros:

1 n
y ln( xi )
n i 1
1
1 n 2
i
2
sy (ln( x ) y )
n 1 i 1

Factor de frecuencia:
Puede trabajarse en el campo original y en el campo transformado.
2. Campo transformado: Si se trabaja en el campo transformado se trabaja con la
media y la desviacin estndar de los logaritmos, as:
Ln(XTr) = xTr+KSy
de donde,
XTr = eln (xTr)

con K con variable normal estandarizada para el Tr dado, xy media de los logaritmos
y Sy es la desviacin estndar de los logaritmos.
3. Campo original: Si se trabaja con los X sin transformar el K se calcula como
1
ln(1 Cv 2 )
Exp KT * ( Ln(1 Cv 2 )) 2 1
2
Kt
Cv
s
K es la variable normal estandarizada para el Tr dado, Cv es el coeficiente de
x
variacin, x media de los datos originales y s desviacin estndar de los datos
originales.

Limites de confianza:

En el campo transformado.
Ln( X Tr ) t(1 ) ST

113
Estadstica aplicada Mgt. Cleto De La Torre Dueas

1
( S y ) K
2
2
Se 1 T
n 2
en donde, n numero de datos, Se error estndar, KT variable normal estandarizada.

EJEMPLO: En un ro se tienen 30 aos de registros de Qmximos instantneos


anuales con x= 15 m3/s, S = 5 m3/s (media y desviacin estndar para los datos
originales). xy=2.655, sy = 0.324 (media y desviacin estndar de los datos
transformados). Encontrar el caudal para un periodo de retorno de 100 aos y los
limites de confianza para un = 5%. Calcular la probabilidad de que un caudal de
42.5 m3/s no sea igualado o excedido P(Q 4.25).
Solucin:
n=30
x= 15 m3/s xy=2.655
s = 5 m3/s sy = 0.324
En el campo original
1
ln(1 Cv 2 )
ExpK * ( Ln(1 Cv ))
2 2
1
2
Kt
Cv
s
Cv = 5/15 = 0.33
x
K = F-1(1-1/Tr) = F-1(1-1/100) = F-1(0.99)
de la tabla de la normal se obtiene KT=2.33
1
ln(1 0.332 )
Exp 2.33 * ( Ln(1 0.33 ))
2 2
1
2
KT
0.33
KT = 3.06
QTr = 15 + 5 * 3.028
QTr = 30.14 m3/s
En el campo transformado se tiene que:
LnQTr100 = 2.655 + 2.33*0.324
LnQTr100 = 3.40992
QTr100 = Exp (3.40992)
Q Tr100 = 30.26 m3/s

114
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Limites de confianza
Ln (QTr) t(1-) Se
1
( S y ) K
2
2
Se 1 T
n 2
1
2.33 2 2
1
2

= 1.93
. 0.324
193
Se 011
.
30
t(1-) = t(0.95) = 1.645 (Ledo de la tabla de la normal)
Ln(30.28) (1.645 ) (0.11)
3.41 0.18095
[3.22905 3.59095]
[e3.22905 e3.59095]

[25.26 36.29] Intervalos de confianza para QTr100


b) Calcular la probabilidad de que un caudal de 45 m3/s no se igualado o excedido
P(Q 4.25).
Ln(42.5) = 3.75
t = (3.75 - 2.655)/0.324
F(3.38) = 0.9996 Ledo de la tabla de la normal
P(Q 4.25) = 99.9%

DISTRIBUCION GUMBEL O EXTREMA TIPO I


Una familia importante de distribuciones usadas en el anlisis de frecuencia
hidrolgico es la distribucin general de valores extremos, la cual ha sido
ampliamente utilizada para representar el comportamiento de crecientes y sequas
(mximos y mnimos).

115
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Funcin de densidad:

1 (x ) ( x )
f ( x) exp exp

En donde y son los parmetros de la distribucin.
( x )
F ( x) f ( x)dx exp exp

Estimacin de parmetros

6
s

x 0.5772
donde x y s son la media y la desviacin estndar estimadas con la muestra.

Factor de frecuencia:

6 Tr
KT 0.5772 ln ln
Tr 1
Donde Tr es el periodo de retorno. Para la distribucin Gumbel se tiene que el
caudal para un perodo de retorno de 2.33 aos es igual a la media de los caudales
mximos.

Limites de confianza

Xt t(1-) Se
s
Se
n
1
[1 1.1396KT 1.1KT ] 2 2

KT es el factor de frecuencia y t(1-) es la variable normal estandarizada para una


probabilidad de no excedencia de 1-.
EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 aos de periodo de
retorno y los intervalos de confianza. x= 15 m3/s, s = 5 m3/s
QTr100 = x + KT s

KT
6
0.577 ln[ln 100 ln(99)]

116
Estadstica aplicada Mgt. Cleto De La Torre Dueas

KT = 3.14
QTr100 = 15 + 3.14*5
QTr100 = 30.7 m3/s
Intervalos de confianza
t(1-) = t(0.95) = 1.645 (Ledo de la tabla de la normal)
1
[1 11396
. . ) 11
(314 . ) 2 ]2
. (314
= 3.93
(3.93) (5)
Se
30
Se 3.58 m 3 / s

Xt t(1-) Se
30.7 m3/s (1.64) (3.58)
[24.83 m3/s 36.58 m3/s] Intervalo de confianza para QTr100

DISTRIBUCION GAMA DE TRES PARAMETROS O PEARSON TIPO 3


Esta distribucin ha sido una de las ms utilizadas en hidrologa. Como la mayora
de las variables hidrolgicas son sesgadas, la funcin Gamma se utiliza para ajustar
la distribucin de frecuencia de variables tales como crecientes mximas anuales,
Caudales mnimos, Volmenes de flujo anuales y estacionales, valores de
precipitaciones extremas y volmenes de lluvia de corta duracin. La funcin de
distribucin Gamma tiene dos o tres parmetros.

Funcin de densidad:
1
1 x x0 x x0
f ( x) exp

Donde,
x0 x para 0
x x0 para 0
y son los parmetros de escala y forma, respectivamente , y x 0 es el parmetro
de localizacin.

117
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Estimacin de parmetros:
2
2 Cs
; s ; x0 x
Cs 2
Cs es el coeficiente de asimetra, x y s son la media y la desviacin estndar de
la muestra respectivamente.

Factor de frecuencia:
2 3 4 5
Cs 1 3 Cs Cs Cs 1 Cs
K z ( z 1)
2
( z 6 z ) ( z 2 1) z
6 3 6 6 6 3 6
donde z es la variable normal estandarizada
Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la
muestra.

Intervalos de confianza:

Xt t(1-) Se
S
Se
n

Donde S es la desviacin estndar de la muestra, n es el nmero de datos y se


encuentra tabulado en funcin de Cs y Tr.

EJEMPLO: Se tiene una estacin con 30 aos de registros de caudales mximos


instantneos con Media de 4144 pie3/s y desviacin estndar de 3311 pie3/s. Si el
coeficiente de asimetra de los caudales es de 1.981 pie3/s cual es caudal para un
periodo de retorno de 100 aos y su intervalo de confianza.
QTr100 = X+ SK
K es F(1.981, 100) de tablas se obtiene K=3.595 (1.9,100) = 3.553
(2.0,100) = 3.605
QTr100 = 4144+ (3.595) (3311)
QTr100 = 16050 pie3/s

118
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Intervalos de confianza
Xt t(1-) Se
S
Se
n
= F(1.981,100) de tablas se obtiene =8.4922 (1.9,100) = 8.2196
(2.0,100) = 8.5562
( 3311) (8.4922)
Se
30
Se = 5133.56 pie3/s
t(1-) = t(0.95) = 1.645 (Ledo de la tabla de la normal)
16050 (5133.56) (1.645)
[7605.29 pie3/s 24494.71pie3/s] Intervalos de confianza para
QTr100

DISTRIBUCION LOG GAMMA O LOGPEARSON DE 3 PARAMETROS


Si los logaritmos Y de una variable aleatoria X se ajustan a una distribucin Pearson
tipo III, se dice que la variable aleatoria X se ajusta a una distribucin Log Pearson
Tipo III. Esta distribucin es ampliamente usada en el mundo para el anlisis de
frecuencia de Caudales mximos. Esta se trabaja igual que para la Pearson Tipo III
pero con Xy y Sy como la media y desviacin estndar de los logaritmos de la
variable original X.

Funcin de densidad:
1
1 ln( x) y0 ln( x) y0
f ( x) exp
x
donde,
y0 y para 0
y y0 para 0
y son los parmetros de escala y forma, respectivamente , y y0 es el parmetro
de localizacin.

119
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Estimacin de parmetros:
2
2 Cs
; s y ; x0 x y
Cs 2
Cs es el coeficiente de asimetra, , x y y s y son la media y la desviacin estndar

de los logaritmos de la muestra respectivamente.

Factor de frecuencia:

ln(YTr ) x y K s y
2 3 4 5
Cs 1 3 Cs Cs Cs 1 Cs
K z ( z 1)
2
( z 6 z ) ( z 2 1) z
6 3 6 6 6 3 6
donde z es la variable normal estandarizada

Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la


muestra.

Intervalos de confianza:

Xt t(1-) Se
Sy
Se
n
Donde Sy es la desviacin estndar de los logaritmos de la muestra, n es el nmero
de datos y se encuentra tabulado en funcin de Cs y Tr.

120
Estadstica aplicada Mgt. Cleto De La Torre Dueas

Cuadro : Precipitacion Maxima en 24 horas


(mm) - Estacion Granja Kayra
Ao Max
1964 23.0
1965 31.4
1966 38.0
1967 42.1
1968 21.6
1969 25.1
1970 44.8
1971 36.1
1972 36.6
1973 28.4
1974 22.8
1975 25.0
1976 20.0
1977 33.9
1978 27.2
1979 39.0
1980 38.2
1981 40.2
1982 29.6
1983 21.4
1984 36.5
1985 31.2
1986 27.5
1987 42.1
1988 35.2
1989 41.9
1990 26.5
1991 37.6
1992 22.6
1993 48.5

121
Estadstica aplicada Mgt. Cleto De La Torre Dueas

1994 39.6
1995 34.6
1996 31.3
1997 47.0
1998 35.9
1999 19.3
2000 51.3
2001 31.0
2002 26.7
2003 39.1
2004 30.8
2005 27.8
2006 51.6
2007 32.9
2008 27.9

Caudales mximos instantneos anuales del ro Piura en Puente


Snchez Cerro.
Q Q
Ao (m3/s) Ao (m3/s)
1926 860.0 1963 37.0
1927 610.0 1964 33.0
1928 124.0 1965 2500.0
1929 135.0 1966 49.0
1930 95.0 1967 82.0
1931 450.0 1968 21.0
1932 1900.0 1969 180.0
1933 620.0 1970 29.0
1934 438.0 1971 545.0
1935 379.0 1972 1616.0
1936 390.0 1973 845.0
1937 39.0 1974 58.0
1938 508.0 1975 272.0

122
Estadstica aplicada Mgt. Cleto De La Torre Dueas

1939 1525.0 1976 388.0


1940 185.0 1977 646.0
1941 2220.0 1978 167.0
1942 405.0 1979 74.0
1943 2250.0 1980 45.0
1944 273.0 1981 568.0
1945 220.0 1982 390.0
1946 134.0 1983 3200.0
1947 41.0 1984 980.0
1948 42.5 1985 112.0
1949 1010.0 1986 25.0
1950 0.0 1987 574.0
1951 0.0 1988 6.0
1952 153.0 1989 845.0
1953 2200.0 1990 6.0
1954 44.0 1991 14.0
1955 350.0 1992 1793.0
1956 1530.0 1993 1042.0
1957 1700.0 1994 1108.0
1958 690.0 1995 75.0
1959 900.0 1996 100.9
1960 81.0 1997 638.1
1961 88.0 1998 4424.0
1962 115.0 1999 3107.0

123

También podría gustarte