Está en la página 1de 57

UNIVERSIDAD PERUANA LOS ANDES

E.A.P: ING CIVIL


CURSO: ESTADISTICA

“AÑO DEL BUEN SERVICIO AL CIUDADANO’’

UNIVERSIDAD PERUANA LOS ANDES

TEMAS DE ESTADISTICA

ASIGNATURA: ESTADISTICA
DOCENTE: ING. WASHINGTON CORDOVA BONIFACIO
INTEGRANTES:
 ORTIZ QUILCA Stevin
 HUAMAN HUAYHUA Claudio

AULA: A1
TURNO: MAÑANA
CICLO: 3°

HUANCAYO - 2017
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

SEMANA I

INTRODUCCIÓN A LA ESTADISTICA
 ESTADÍSTICA Y SU DIVISIÓN

La Estadística para su mejor estudio se ha dividido en dos grandes ramas:


1. La Estadística Descriptiva.
2. La Estadística Inferencial.
3. La Estadística Inductiva.
4.
 CONCEPTOS BÁSICOS
1. Estadística Descriptiva:
Tienen por objeto fundamental describir y analizar las características de un
conjunto de datos, obteniéndose de esa manera conclusiones sobre las
características de dicho conjunto y sobre las relaciones existentes con otras
poblaciones, a fin de compararlas. No obstante puede no solo referirse a
la observación de todos los elementos de una población (observación
exhaustiva) sino también a la descripción de los elementos de una muestra
(observación parcial).
En relación a la estadística descriptiva, Ernesto Rivas González dice; "Para
el estudio de estas muestras, la estadística descriptiva nos provee de todos
sus medidas; medidas que cuando quieran ser aplicadas al universo total, no
tendrán la misma exactitud que tienen para la muestra, es decir al estimarse
para el universo vendrá dada con cierto margen de error; esto significa que el
valor de la medida calculada para la muestra, en el oscilará dentro de cierto
límite de confianza, que casi siempre es de un 95 a 99% de los casos.

2. Estadística Inferencial:
Se deriva de muestras, de observaciones hechas sólo acerca de una parte
de un conjunto numeroso de elementos y esto implica que su análisis
requiere de generalizaciones que van más allá de los datos. Como
consecuencia, la característica más importante del reciente crecimiento de la
estadística ha sido un cambio en el énfasis de los métodos que describen a
métodos que sirven para hacer generalizaciones. La Estadística Inferencial
investiga o analiza una población partiendo de una muestra tomada. Según
Berenson y Levine; Estadística Inferencial son procedimientos estadísticos
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

que sirven para deducir o inferir algo acerca de un conjunto de datos


numéricos (población), seleccionando un grupo menor de ellos (muestra).
El objetivo de la inferencia en investigación científica y tecnológica radica en
conocer clases numerosas de objetos, personas o eventos a partir de otras
relativamente pequeñas compuestas por los mismos elementos.

3. Estadística Inductiva: Está fundamentada en los resultados obtenidos del


análisis de una muestra de población, con el fin de inducir o inferir
el comportamiento o característica de la población, de donde procede, por lo
que recibe también el nombre de Inferencia estadística.

4. Método Estadístico: El conjunto de los métodos que se utilizan para medir


las características de la información, para resumir los valores individuales, y
para analizar los datos a fin de extraerles el máximo de información, es lo
que se llama métodos estadísticos. Los métodos de análisis para la
información cuantitativa se pueden dividir en los siguientes seis pasos:
1. Definición del problema.
2. Recopilación de la información existente.
3. Obtención de información original.
4. Clasificación.
5. Presentación.
6. Análisis.

1. Población:
El concepto de población en estadística va más allá de lo que comúnmente
se conoce como tal. Una población se precisa como un conjunto finito o
infinito de personas u objetos que presentan características comunes.
"Una población es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones". Levin &
Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica
común". Cadenas (1974).
2. Muestra:
"Se llama muestra a una parte de la población a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero
no de todos". Levin & Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las
conclusiones que se obtengan de dicha muestra solo podrán referirse a la
población en referencia", Cadenas (1974).
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

3. Muestreo:
Esto no es más que el procedimiento empleado para obtener una o más
muestras de una población; el muestreo es una técnica que sirve para
obtener una o más muestras de población.

 TIPOS DE VARIABLES

Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos
es de clase y no de cantidad.

Datos cuantitativos: cuando los valores de los datos representan diferentes


magnitudes, decimos que son datos cuantitativos.

Datos cronológicos: cuando los valores de los datos varían en diferentes


instantes o períodos de tiempo, los datos son reconocidos como cronológicos.

Datos geográficos: cuando los datos están referidos a una localidad geográfica
se dicen que son datos geográficos.

 FUENTES Y TÉCNICAS DE ACOPIO DE DATOS

Los datos estadísticos necesarios para la comprensión de los hechos pueden


obtenerse a través de fuentes primarias y fuentes secundarias.

 Fuentes de datos primarias: es la persona o institución que ha recolectado


directamente los datos.

 Fuentes secundarias: son las publicaciones y trabajos hechos por personas o


entidades que no han recolectado directamente la información.
Las fuentes primarias más confiables, son las efectuadas por oficinas
gubernamentales encargadas de tal fin. En la práctica, es aconsejable utilizar
fuentes de datos primarias y en última instancia cuando estas no existan, usar
estadísticas de fuentes secundarias. Con este último tipo no debemos pasar por
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

alto que la calidad de las conclusiones estadísticas depende en grado sumo de la


exactitud de los datos que se recaben.

SEMANA II

TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS

 CONSTRUCCIÓN DE TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS,


PARA VARIABLES CUALITATIVAS Y CUANTITATIVAS
UNIDIMENSIONALES.

A partir de una variable numérica es posible construir una distribución


de frecuencias clasificando los datos en clases o categorías definidas por el
investigador.
Las clases o intervalos de clase de una tabla de frecuencias deben ser
mutuamente excluyentes y exhaustivas, es decir, cada dato debe caer en
una y sólo una clase y todos los datos deben tener una clase a la cual
pertenecen.

¿Cómo construimos una tabla de


frecuencias?
Se divide el rango total de los datos en clases o intervalos, los que no
necesariamente deben tener la misma longitud.
Se cuenta el número de observaciones que cae en cada clase y se
determina la frecuencia en cada clase.
Se calculan las frecuencias relativas, frecuencias acumuladas y
frecuencias acumuladas relativas para cada intervalo.
Notación:
Frecuencia ⇒ fi = número de casos que cae en el intervalo i-ésimo
Frecuencia relativa porcentual ⇒ fri = (fi / n)⋅100 = porcentaje de casos
en el intervalo i-ésimo
Frecuencia acumulada ⇒ fai = f1 + f2 +. . . + fi = suma de las
frecuencias desde la primer categoría hasta la categoría i-ésima.

Frecuencia acumulada relativa porcentual ⇒ fari = (fai / n) ⋅100 =


suma de las frecuencias relativas desde la primer categoría hasta la
categoría i-ésima .
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

La Tabla muestra la tabla de frecuencias para los datos de tasas de


neumonía cada 1000 habitantes presentados en la Tabla 2 (Año 2000,
Argentina). Se definieron intervalos de longitud igual a 1.

Interva Frecuen Frecuencia Frecuenci Frecuencia


lo cia relativa a relativa
porcentual acumulada acumulada
[ 0, (f1i) (fri) 4. (fai) 1 (frai) 4.
1) [ 2 2
3 4
1, 2) 12. 16.
[ 2, 2 6
5 7
3) [ 8 14
8. 25.
3, 4) 3 0
5 19
[ 4,
5) [ 1 33. 20 58.
3 3
5, 6) 0 20
 [ 6, 20. 79.
1 8 21 2
7) [
7, 8) 1 4. 22 83.
[ 8, 1 2 23 3
9) [9,
1 0. 24 83.
10)
 GRAFICAS 0 3
[10, 4. 87.
11)
Construcción del histograma
2 5
a) Intervalos de clase todos de la misma
4. 91.
longitud.
2 7
4.
Se trazan dos ejes de coordenadas rectangulares. En 95.
el eje horizontal se
representan los valores de la2 variable y en el eje vertical
8 una medida de
frecuencia (frecuencia absoluta,
4. frecuencia relativa o100. frecuencia relativa
porcentual. 2 0

Indicamos en el eje horizontal los límites de los intervalos de clase.


Asociamos a cada clase una columna cuya base cubre el intervalo de clase y
cuya altura indica cuantos datos “caen” en un intervalo a través de la frecuencia
o la frecuencia relativa de la clase.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

El gráfico se construye sin dejar espacio horizontal entre categorías, a menos


que una clase esté vacía (es decir tenga altura cero).

¿QUÉ CARACTERÍSTICAS OBSERVAMOS EN LOS GRÁFICOS


ANTERIORES?

- La distribución es asimétrica, con mayor concentración de datos en


tasas bajas y algunas provincias con tasas altas.

- Se observan cuatro provincias con tasas de notificación de casos de


neumonía más altas que el resto. Ellas son San Luis, Formosa, La Pampa
y Chaco. Tal vez podríamos pensar en dos agrupamientos.

- En el histograma de la izquierda observamos un único pico (o moda) pero


en el de la derecha aparenta haber dos. Es importante remarcar que
características del gráfico que no se mantienen al modificar levemente la
definición de los intervalos de clase pueden ser consideradas como
artificiales.
El propósito de un histograma es mostrar la forma de la distribución de
los datos, por lo que debemos estar atentos a los aspectos visuales de la
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

representación. Como hemos observado en el ejemplo, la forma del


histograma depende del número de intervalos de clase que
seleccionemos.
¿CUÁNTAS
CLASES
USAR?

Existen distintas fórmulas que permiten calcular el número máximo de


clases apropiado para un conjunto de datos, en base al rango de datos y
al número de datos.
La decisión, tal como ocurre en el gráfico de tallo-hojas, es una solución
de compromiso. En general entre 6 y 15 clases resulta ser una buena
elección. Muchos intervalos harán que caigan muy pocas observaciones
en cada clase, por lo que las alturas de las barras variarán irregularmente.
Muy pocas clases producen una gráfica más regular, pero demasiado
agrupamiento puede hacer que se pierdan las características principales.
b) Intervalos de clase de diferente
longitud.

Los datos de la Tabla presentan los casos de rubéola notificados al SI.NA.VE


durante el año 2000 según grupos de edad. Notemos que los intervalos
de edad tienen diferente longitud.

Cuando (erróneamente) se construye un histograma considerando como


altura de la barra la frecuencia relativa se obtiene la gráfica siguiente. La última
categoría de edad se truncó arbitrariamente en 80 años para poder
representarla.

Tabla. Notificaciones de casos de rubéola. Argentina, año 2000.

Intervalo Frecuencia Frecuencia


relativa (fr)
(años) (fi)
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

[ 0, 1) 497 10.5%
[ 1, 2)
[ 2, 5) 387 8.2%

[ 5, 10) 1100 23.3%

[10, 15) 1389 29.4%


[15, Total 4720 100.00%
798 16.9%
50)
521 11.0%
 50
28 0.6%

¿CÓMO CONSTRUIMOS EL HISTOGRAMA TENIENDO EN CUENTA QUE


LOS INTERVALOS DE CLASE SON DE DISTINTA LONGITUD?

La barra debe tener una altura tal que el área (base x altura) sea igual a la
frecuencia (o a la frecuencia relativa). Es decir,
Altura de la barra = frecuencia en el
intervalo. Longitud del
intervalo

La altura de la barra definida de este modo se denomina escala densidad porque


indica el número de datos por unidad de la variable. La última columna de la
Tabla muestra la escala densidad para los datos de la Tabla y la Figura el
histograma que se obtiene usando la escala densidad.

Tabla. Escala densidad. Notificaciones de casos de rubéola. Argentina, año


2000.

Categor Frecuen Frecuen Escal


ía cia cia a
relativa densid
[(año
0, (fi 497 10.5 10.53
) (fr) ad
1)s) [ % %
1, 2) 387
[ 2, 8.2 8.20
1100
5) % %
1389
[ 5, 23.3 7.77
10) Tota 472
798
100.00
% -- %
l 0 %
[10, 521 29.4 5.89
15) % %
[15, 28
50) 16.9 3.38
% %
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

SEMANA III
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
 Construcción de tablas bidimensionales.

. Tabulación de los datos


Cuando sobre cada individuo de una población se observan
simultáneamente dos características cuantitativas, que unidimensionalmente
podríamos representar separadamente por las variables X e Y, entonces se
dice que se está observando una variable estadística bidimensional y se
representa por (X, Y). El conjunto de valores bidimensionales de la variable
junto con sus frecuencias asociadas dará lugar a la correspondiente
distribución bidimensional de frecuencias. En el caso de variables
bidimensionales podemos distinguir dos tipos principales de tablas:
a) Tabulación en dos columnas (o en dos filas)
Si el número de datos bidimensionales es pequeño, los datos se
disponen en dos columnas (o en dos filas) ˜ sobre las que se emparejan
los correspondientes valores unidimensionales de una misma realización
de la ´ variable bidimensional, como se expresa en la tabla siguiente:

Variable X Variable Y
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

X1 Y1
X2 Y2
. .
. .
. .
Xn Yn

b) Tabla de doble entrada o de contingencia


Si el número de observaciones bidimensionales es grande, clasificamos
los ´ n individuos de la muestra en r clases (A1,..., Ar) respecto de la
variable X, y en k clases (B1,..., Bk) respecto de la variable Y. Entonces
los datos suelen organizarse en una tabla, que se denomina tabla de
doble entrada o de contingencia.

SEMANA IV
 MEDIDAS DE TENDENCIA CENTRAL

 Media aritmética
Es el valor promedio de un conjunto de datos. Es uno de los estadígrafos
más importantes de la estadística que localiza el punto de equilibrio o
centro de gravedad de la distribución.

 Media para datos agrupados


Supongamos que se dispone de dos conjuntos de datos en los
que se conoce la media y el número de datos de cada uno de ellos
(X1, n1-X2, n2 ). Calculamos la media de los n1 + n2 datos como
el promedio pesado.

n1 X1 n 2 X 2
X
n1  n2

Características y propiedades de la media.


a) Se usa para datos numéricos.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

b) Representa el centro de gravedad o el punto de equilibrio de los datos.


Podemos imaginar a los datos como un sistema físico, en el que cada dato
tiene una “masa” unitaria y lo ubicamos sobre una barra en la posición
correspondiente a su valor. La media representa la posición en que
deberíamos ubicar el punto de apoyo para que el sistema esté en equilibrio.

 Mediana
Es un valor que divide a un conjunto de datos ordenados (creciente o
decreciente) en dos grupos con igual número de observaciones. La mitad
de las observaciones están por encima de la mediana y la otra mitad por
debajo de ella.
 La mediana- datos no agrupados

Para hallar la mediana se sigue los siguientes pasos:


 Se organiza los datos en forma creciente o decreciente.
 Si el número de datos es un número impar, el elemento
que se encuentra en la mitad del arreglo es la mediana.
 Si el número de datos es un número par la mediana es el
promedio de los dos.
 La mediana – datos agrupados
ECUACIÓN:

En donde:

n = número total de datos


Fa = Frecuencia acumulada del intervalo de clase que antecede al intervalo de la
Mediana

c = ancho del intervalo de clase de la Mediana

 Moda
Es el valor que se presenta con mayor frecuencia en un conjunto de datos. Es útil
cuando interesa conocer el valor más frecuente de la variable; por ejemplo cuando
se desea conocer los puntos críticos para estudiar el número de pasajeros por hora
que usan el transporte que circulan por un determinado avenida, el estudio
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

correspondiente demostrara que existen dos modas, una por la mañana alrededor
de las 8 y la otra por la tarde alrededor de las 19 horas.
Un grupo de datos puede tener una moda, dos modas, etc. En tales casos la
distribución se llama, respectivamente, unimodal, bimodal, etc.
 Datos no agrupados
Se recoge el valor que más repite.

 Datos agrupados

Li: Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).

fi :Frecuencia absoluta del intervalo modal.

fi-1 : Frecuencia absoluta del intervalo anterior al modal.

fi+1 : Frecuencia absoluta del intervalo posterior al modal.

ti :Amplitud de los intervalos.

Semana V
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

MEDIDAS DE POSICION
 CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en
cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es
precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el
tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas
partes (75%) de los datos.

 Datos Agrupados

Como los cuartiles adquieren su mayor importancia cuando contamos un número


grande de datos y tenemos en cuenta que en estos casos generalmente los datos
son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los
cuartiles cuando se trata de datos agrupados es la siguiente:
k= 1, 2,3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Si se desea calcular cada cuartil individualmente, mediante otra fórmula se tiene lo
siguiente:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los
datos; es decir, aquel valor de la variable que supera 25% de las observaciones y
es superado por el 75% de las observaciones.

 Fórmula de Q1, para series de Datos agrupados:

Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es el


menor valor que es mayor que la mitad de los datos, es decir el 50% de las
observaciones son mayores que la mediana y el 50% son menores.

 Fórmula de Q2, para series de Datos agrupados:

Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase

El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los
datos, es decir aquel valor de la variable que supera al 75% y es superado por el
25% de las observaciones.

 Fórmula de Q3, para series de Datos agrupados:

Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos
particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer
cuartil 75% percentil.
 Para Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:

- El primer cuartil:
Cuando n es par:

Cuando n es impar:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Para el tercer cuartil

Cuando n es par:

Cuando n es impar:

 DECILES
Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto
de datos ordenados en diez partes iguales, son también un caso particular de los
percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil,
segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
 Datos Agrupados
Para datos agrupados los deciles se calculan mediante la fórmula.

k= 1, 2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles:
 El cuarto decil, es aquel valor de la variable que supera al 40%, de las
observaciones y es superado por el 60% de las observaciones.

 El quinto decil corresponde a la mediana.


UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

 El noveno decil supera al 90% y es superado por el 10% restante.

Donde (para todos):


L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.

 Fórmulas Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las
siguientes fórmulas:

Cuando n es par:

Cuando n es impar:

Siendo A el número del decil.

 PERCENTIL
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de
ubicación o clasificación de las personas cuando atienden características tales
como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99),
leídos primer percentil,..., percentil 99.
 Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan
mediante la fórmula:

k= 1, 2,3,... 99
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra forma para calcular los percentiles es:
 Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.

 El 60 percentil, es aquel valor de la variable que supera al 60% de las


observaciones y es superado por el 40% de las observaciones.

 El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.

 Fórmulas Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes fórmulas:
Para los percentiles, cuando n es par:

Cuando n es impar:

Siendo A, el número del percentil.

Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con
el percentil 50 y el tercer cuartil con el percentil 75.

SEMANA VI
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

MEDIDAS DE DISPERSIÓN
 RANGO

 DESVIACIÓN MEDIA
La desviación media o desviación promedio es la media aritmética de los
valores absolutos de las desviaciones respecto a la media aritmética.
 PROPIEDADES
Guarda las mismas dimensiones que las observaciones. La suma
de valores absolutos es relativamente sencilla de calcular, pero esta simplicidad
tiene un inconveniente: Desde el punto de vista geométrico, la distancia que induce
la desviación media en el espacio de observaciones no es la natural (no permite
definir ángulos entre dos conjuntos de observaciones). Esto hace que sea muy
engorroso trabajar con ella a la hora de hacer inferencia a la población.
Cuando mayor sea el valor de la desviación media, mayor es la dispersión de los
datos. Sin embargo, no proporciona una relación matemática precisa entre su
magnitud y la posición de un dato dentro de una distribución.
La desviación media al tomar los valores absolutos mide una observación sin
mostrar si la misma está por encima o por debajo de la media aritmética.
 MÉTODOS DE CÁLCULO
 Para Datos No Agrupados
Se emplea la ecuación:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

 Para Datos Agrupados en Tablas de Frecuencia


Se emplea la ecuación:

 VARIANZA - DESVIACIÓN ESTÁNDAR

La varianza es la media aritmética de los cuadrados de las desviaciones


respecto a la media aritmética, es decir, es el promedio de las desviaciones
de la media elevadas al cuadrado. La desviación estándar o desviación típica
es la raíz de la varianza.
La varianza y la desviación estándar proporcionan una medida sobre el punto
hasta el cual se dispersan las observaciones alrededor de su media
aritmética.

 Propiedades
- La varianza y desviación estándar (o cualquier otra medida de dispersión)
indican el grado en que están dispersos los datos en una distribución. A
mayor medida, mayor dispersión.
- La varianza es un número muy grande con respecto a las observaciones,
por lo que con frecuencia se vuelve difícil para trabajar.
- Debido a que las desviaciones son elevadas al cuadrado y la varianza
siempre se expresa en términos de los datos originales elevados al
cuadrado, se obtiene unidades de medida de los datos que no tiene sentido
o interpretación lógica. Por ejemplo, si se calcula la varianza de una
distribución de datos medidos en metros, segundos, dólares, etc., se
obtendrá una varianza mediada en metros cuadrados, segundos cuadrados,
dólares cuadrados, respectivamente, unidades de medida que no tienen
significado lógico respecto a los datos originales.
- Para solucionar las complicaciones que se tiene con la varianza, se halla la
raíz cuadrada de la misma, es decir, se calcula la desviación estándar, la
cual es un número pequeño expresado en unidades de los datos originales y
que tiene un significado lógico respeto a los mismos.
 Para Datos No Agrupados
La varianza para una población se calcula con:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Para Datos Agrupados en Tablas de Frecuencia


La varianza para una población se calcula con:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

SEMANA VII
MEDIDAS DE FORMA

 ASIMETRIA
Una medida de forma de una distribución que permite identificar y describir la
manera como los datos tiende a reunirse de acuerdo con la frecuencia con que se
hallen dentro de la distribución. Permite identificar las características de la
distribución de datos sin necesidad de generar el gráfico.

 TIPOS DE ASIMETRÍA
La asimetría presenta las siguientes formas:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

 Asimetría Negativa o a la Izquierda.- Se da cuando en una


distribución la minoría de los datos está en la parte izquierda de la
media. Este tipo de distribución presenta un alargamiento o sesgo
hacia la izquierda, es decir, la distribución de los datos tiene a la
izquierda una cola más larga que a la derecha. También se dice que
una distribución es simétrica a la izquierda o tiene sesgo negativo
cuando el valor de la media aritmética es menor que la mediana y éste
valor de la mediana a su vez es menor que la moda,
en símbolos

Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto se aparta


de la simetría.

 Simétrica.- Se da cuando en una distribución se distribuyen


aproximadamente la misma cantidad de los datos a ambos lados de la media
aritmética. No tiene alargamiento o sesgo. Se representa por una curva
normal en forma de campana llamada campana de Gauss (matemático
Alemán 1777-1855) o también conocida como de Laplace (1749-
1827).También se dice que una distribución es simétrica cuando su media
aritmética, su mediana y su moda son iguales, en símbolos Md=Mo

 Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la


minoría de los datos está en la parte derecha de la media aritmética. Este
tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es
decir, la distribución de los datos tiene a la derecha una cola más larga que a
la izquierda.
También se dice que una distribución es simétrica a la derecha o tiene sesgo
positivo cuando el valor de la media aritmética es mayor que la mediana y éste a
valor de la mediana a su vez es mayor que la moda, en símbolos

 MEDIDAS DE ASIMETRÍA
Coeficiente de Karl Pearson

Donde:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

= media aritmética.
Md = Mediana.
s = desviación típica o estándar.
Nota:
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.

 Medida de Yule Bowley o Medida Cuartílica

Donde:
= Cuartil uno; = Cuartil dos = Mediana; = Cuartil tres.

Nota:
La Medida de Bowley varía entre -1 y 1
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.

 CURTOSIS

La curtosis mide el grado de agudeza o achatamiento de una distribución con


relación a la distribución normal, es decir, mide cuán puntiaguda es una distribución.
 TIPOS DE CURTOSIS
La curtosis determina el grado de concentración que presentan los valores en la
región central de la distribución. Así puede ser:

 Leptocúrtica.- Existe una gran concentración.


 Mesocúrtica.- Existe una concentración normal.
 Platicúrtica.- Existe una baja concentración.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

 MEDIDAS DE CURTOSIS

 Medida de Fisher
Para datos sin agrupar se emplea la siguiente fórmula:

Para datos agrupados en tablas de frecuencias se emplea la siguiente fórmula:

Para datos agrupados en intervalos se emplea la siguiente fórmula:

Dónde: = cada uno de los valores; n = número de datos; = media aritmética; =


Cuádruplo de la desviación estándar poblacional; f = frecuencia absoluta; xm =
marca de clase
Nota:
Si a < 3 ? la distribución es platicútica
Si a = 3 ? la distribución es normal o mesocúrtica
Si a > 3 ? la distribución es leptocúrtica
 Medida basada en Cuartiles y Percentiles

= (letra griega minúscula kappa) = Coeficiente percentil de curtosis


Nota:
Si < 0,263 ? la distribución es platicúrtica
Si = 0,263 ? la distribución es normal o mesocúrtica
Si > 0,263 ? la distribución es leptocúrtica
Esta medida no es muy utilizada.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

1. PROBABILIDADES
1.1. CONCEPTOS BÁSICOS:
En nuestra vida cotidiana asociamos usualmente el concepto de Probabilidad a su
calificativo probable, considerando probables aquellos eventos en los que tenemos
un alto grado de creencia en su ocurrencia.
En esta línea, Probabilidad es un concepto asociado a la medida del azar. También
pensamos en el azar vinculado, fundamentalmente, con los juegos de azar, pero
desde esa óptica tan reducida se nos escapan otros muchísimos ejemplos de
fenómenos de la vida cotidiana o asociados a disciplinas de distintas ciencias donde
el azar juega un papel fundamental.

1.2. DEFINICIÓN:
Tenemos, por tanto, que probabilidad es la asignación que hacemos del grado de
creencia que tenemos sobre la ocurrencia de algo. Esta asignación, sin embargo,
debe ser coherente. Esta necesidad de que asignemos probabilidades
adecuadamente se va a plasmar en esta sección en tres reglas, conocidas como
axiomas, que debe cumplir cualquier reparto de probabilidades.

1.3. PROPIEDADES:
1.3.1. Definición clásica de la probabilidad:
Espacio muestral equiprobable: “todos los sucesos elementales tienes
igual probabilidad de ocurrir”.
 En estas condiciones se define la probabilidad de suceso a como:
𝑁° 𝐶𝑎𝑠𝑜𝑠 𝐹𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑎𝑙 𝑆𝑢𝑐𝑒𝑠𝑜 𝐴 𝐶 𝐹
𝑃(𝐴) = =
𝑁° 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑃𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝐶 𝑃
1.3.2. Diagramas del árbol:
Es un método para obtener los resultados posibles de un experimento
cuando este se produce en pocas etapas.
Cada paso del experimento se representa como una ramificación de un
árbol.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

1.3.3. Definición axiomática de la probabilidad:


 Álgebra de sucesos, β: “es el conjunto de todos los sucesos del
Espacio Muestral”.
 Axiomas de la probabilidad.
Consideremos una aplicación, P, del algebra de sucesos en el
conjunto de los números reales.

 Esta aplicación es una probabilidad si verifica los tres axiomas


siguientes:

*Axioma 1
𝐴 ∈ 𝛽, 0 ≤ 𝑃(𝐴)

*Axioma 2
𝑃(𝐸) = 1

*Axioma 3
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

1.3.4. Propiedades de la Probabilidad:


1. ∀𝐴 ∈ 𝛽, 𝑃(𝐴𝐶 ) = 1 − 𝑃(𝐴)
2. 𝑃( )=0
3. 𝑆𝑖 𝐴 ⊂ 𝐵 ⇒ 𝑃(𝐴) ≤ 𝑃(𝐵)
4. 𝑃(𝐴 − 𝐵) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵)
5. 𝑃(𝐴 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 𝐵)
6. 𝑃(𝐴 𝐵 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶) − 𝑃(𝐴 𝐵) − 𝑃(𝐴 𝐶) − 𝑃(𝐵 𝐶) +
𝑃(𝐴 𝐵 𝐶)

EJEMPLOS:

1) En una pareja, cada uno de los miembros posee genes para ojos castaños y
azules. Teniendo en cuenta que cada uno tiene la misma probabilidad de
aportar un gen para ojos castaños y ojos azules y que el gen para ojos
castaños es dominante, obtener la probabilidad de que un hijo nacido de esta
pareja tenga ojos castaños.

SOLUCIÓN:

2) Una mujer es portadora de hemofilia. Aunque la mujer no tenga la enfermedad,


puede transmitirla a sus tres hijos. Obtener las trayectorias para este
experimento mediante un diagrama del árbol.

SOLUCIÓN:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Suponiendo que es igualmente probable que se transmita o no la enfermedad.


Obtener la probabilidad de los siguientes sucesos:
1. Ningún hijo tenga la enfermedad, (suceso A)
2. Dos hijos tengan la enfermedad, (suceso B)
𝐶𝐹 1 𝐶𝐹 3
𝑃(𝐴) = = 𝑃(𝐵) = =
𝐶𝑃 8 𝐶𝑃 8

3) Tres caballos, A, B y C están siendo tratados con tres métodos experimentales


distintos para aumentar la velocidad con la que puedan correr. Después del
tratamiento intervienen en una carrera. El caballo C tiene doble probabilidad
de ganar que B, y B doble de A.
Calcular las probabilidades de que gane cada uno.

SOLUCIÓN:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

4) Si al lanzar un dado y tengamos:


A: el suceso obtener un número menor que 5.
B: el suceso obtener un número par.
Calcule el P (A-B)

SOLUCIÓN:

5) En una población el 4% de las personas son daltónicas, el 18% hipertensas y


el 0.5% daltónicas e hipertensas. ¿Cuál es la probabilidad de que una persona
sea daltónica o hipertensa?

SOLUCIÓN:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

1.4. PROBABILIDADES CON LA TECNICA DEL CONTEO:


En esta técnica se analiza varios conjuntos y sus arreglos por medio de dos reglas
elementales de conteo: regla de multiplicación y regla de suma. En ocasiones
los arreglos se grafican por medio de diagramas de árbol. También se trabaja
por separado los casos especiales de los arreglos que se forman con una parte o
todos de los elementos de un conjunto cuando el orden en que se coloquen estos
sean importantes –permutaciones- y la elección de los elementos se realice con
o sin reemplazo; se aplicara el estudio de los casos con elementos iguales en un
conjunto y los casos cuando el orden entre los elementos de los arreglos no es
importante –combinaciones-
Termina con la parte numérica del cálculo de probabilidades donde se emplearan
las técnicas de conteo.

1.4.1. REGLA DE MULTIPLICACIÓN:


Dados 𝐴1 , . . . , 𝐴𝑘 , k conjuntos diferentes y 𝑛1 , 𝑛2 , . . . , 𝑛𝑘 las cantidades
respectivas de elementos de dichos conjuntos, entonces la cantidad de
arreglos diferentes que contienen un elemento de cada conjunto,
escribiendo primero los elementos del conjunto uno seguidos de los del
conjunto dos, sucesivamente hasta llegar al conjunto k, se llama regla
generalizada de multiplicación, y está dada por:
𝑛1 ∗ 𝑛2 . . . 𝑛𝑘

1.4.2. DIAGRAMAS DE ÁRBOL:


Es una forma de encontrar todos los arreglos que se pueden formar con
los diferentes elementos de los conjuntos que se tiene. Un arreglo es una
ramificación –desde su punto inicial hasta su punto final-, donde cada
ramificación debe tener un elemento de cada conjunto.

1.4.3. ARREGLOS CON Y SIN REEMPLAZO:


Al aplicar la regla de multiplicación se debe tomar en cuenta que no sólo
se emplea con diferentes conjuntos sino que puede estar aplicada a un
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

mismo conjunto en los casos que se pida realizar arreglos con todos o
alguna parte de sus elementos. Dichos arreglos, sin embargo, pueden ser
de dos tipos: cuando se permite el reemplazo (o repetición) y cuando no
se permite

1.4.3.1. ARREGLOS CON REEMPLAZO:


Dado el conjunto 𝐴 = {𝑎1 , 𝑎2 , . . . , 𝑎𝑛 } con n elementos diferentes, la
cantidad de arreglos que contengan k elementos tomados con
reemplazo del conjunto A está dada por:
𝑛𝑘
1.4.3.2. ARREGLOS SIN REEMPLAZO:
 Dado el conjunto 𝐴 = {𝑎1 , 𝑎2 , . . . , 𝑎𝑛 } con n elementos diferentes,
la cantidad de arreglos ordenados que contengan k elementos
tomados sin reemplazo del conjunto A está dado por la resultante
de:
𝑛 ∗ (𝑛 – 1) ∗ (𝑛 – 2) ∗ … ∗ (𝑛 – (𝑘 – 1))
 El factor de un numero n ϵ N se define como el producto sucesivo
𝑛(𝑛 − 1)(𝑛 − 2) … 1 y se simboliza por n!.
 Se llama permutación de k elementos escogidos de un total n
(todos diferentes) a
𝑛!
𝑃𝑘𝑛 = ,0 ≤ 𝑘 ≤ 𝑛
(𝑛 − 𝑘)!
que representa la cantidad total de arreglos ordenados de tamaño
k que se pueden formar con n elementos diferentes cuando no se
permite la repetición.

1.4.3.3. PERMUTACIONES CON ELEMENTOS IGUALES:


Para los casos en que se quieren formar arreglos con todos los
elementos de un conjunto, entre los cuales existen algunos que son
iguales, se tiene que, de forma general, cuando existen 𝑛1 elementos
iguales, 𝑛2 elementos iguales,... y 𝑛𝑚 elementos iguales, tales que
𝑛1 + 𝑛2 + . . . + 𝑛𝑚 = 𝑛, resulta la cantidad total de ordenamientos
diferentes considerando todos los n elementos por ordenamiento.
𝑛!
𝑃𝑛𝑛1𝑛2…𝑛𝑚! = ; 𝑐𝑜𝑛 𝑛1 + 𝑛2 + … + 𝑛𝑚 = 𝑛
𝑛1 ! 𝑛2 ! … 𝑛𝑚 !
1.4.3.4. COMBINACIONES:
Dado un conjunto con n elementos diferentes, se llama combinación
a cualquier subconjunto no ordenado de tamaño k. El número de
combinaciones de tamaño k que se pueden formar con los n
elementos se denota por:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

𝐶𝐾𝑁 , 0 ≤ 𝑘 ≤ 𝑛

EJEMPLOS:

1) Se tiene todas las letras del alfabeto (27 en total). ¿Cuántas palabras se
pueden formar de manera que tenga 4 vocales y 3 consonantes?

SOLUCION:
27 𝑙𝑒𝑡𝑟𝑎𝑠 = 5 𝑣𝑜𝑐𝑎𝑙𝑒𝑠 + 22𝑐𝑜𝑛𝑠𝑜𝑛𝑎𝑛𝑡𝑒𝑠
Luego:
𝐶45 ∗ 𝐶322 ∗ 𝑃7 = 𝐶45 ∗ 𝐶322 ∗ 7! = 38,808.000

2) Con 7 consonantes y 4 vocales, ¿Cuántas palabras pueden formarse


contenido cada una 3 consonantes y 2 vocales?

SOLUCION:
Elegimos 3 consonantes de las 7 que hay: 𝐶37
4
Elegimos 2 vocales de las 4 que hay: 𝐶2
𝐶37 ∗ 𝐶24 ∗ 5! = 25,200

3) Se tienen ocho libros de física, cuatro de química y siete de matemáticas,


todos ellos diferentes, ¿cuántos arreglos de tres libros, que contengan un libro
de cada tema, se pueden formar con todos los libros si primero van los de
física, seguidos por química y matemáticas?

SOLUCIÓN:
Con los datos anteriores y el uso de la regla de multiplicación, que indica el
total de arreglos de libros diferentes de cada tema, se obtiene:
8 ∗ 4 ∗ 7 = 224

4) Retomando los datos del ejemplo 1, numeral 2, es posible resolver el problema


mediante un diagrama de árbol.
Primero se representa en un punto a la ciudad A, después se trazan, a partir
de este punto, tres líneas rectas para los tres caminos de la ciudad A a la B;
de igual forma, de cada punto que representa a la ciudad B, se trazan cuatro
líneas para los cuatro caminos de la ciudad B a la C; finalmente, de cada punto
que representa la ciudad C, se trazan dos líneas para los dos caminos de la
ciudad C a la D.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Muestra todos los caminos posibles para viajar de la ciudad A a la D, pasando


por las ciudades B y C, los cuales se pueden obtener al unir rectas desde el
punto A al D sin regresar por ningún camino.
Como se observa, los diagramas de árbol son bastante sencillos y muestran
todos los arreglos posibles. Sin embargo, en los casos en que la cantidad de
elementos es grande, se tiene también una cantidad grande de ramificaciones,
y trazarlo ya no sería factible. No obstante, como se verá en la siguiente
unidad, los diagramas de árbol tienen gran aplicación al resolver problemas
de probabilidad condicional.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

5) Se tienen cuatro computadoras X, tres computadoras Y y tres computadoras


W; ¿de cuántas maneras diferentes se pueden ordenar en línea recta?

SOLUCIÓN:
Se tienen en total diez computadoras, de las cuales existen cuatro, tres y tres
de cada tipo, por la fórmula 1, se tiene
10!
= 4200 (𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑎𝑟𝑟𝑒𝑔𝑙𝑜𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠)
4! 3! 3!

1.5. PROBABILIDAD CONDICIONAL:


Las probabilidades condicionadas se calculan una vez que se ha incorporado
información adicional a la situación de partida.
Las probabilidades condicionadas se calculan aplicando la siguiente fórmula:

Donde:

P (B/A) es la probabilidad de que se de el suceso B condicionada


a que se haya dado el suceso A.

P (B A) es la probabilidad del suceso simultáneo de A y de B

P (A) es la probabilidad a priori del suceso A

1.6. PROBABILIDAD TOTAL Y TEOREMA DE BAYES:


1.6.1. PROBABILIDAD TOTAL:
Nos permite calcular la probabilidad de un suceso a partir de probabilidades
condicionadas.

La fórmula para calcular esta probabilidad es:

Es decir, la probabilidad de que ocurra el suceso B (en nuestro


ejemplo, que ocurra un accidente) es igual a la suma de multiplicar
cada una de las probabilidades condicionadas de este suceso con
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

los diferentes sucesos A (probabilidad de un accidente cuando llueve y


cuando hace buen tiempo) por la probabilidad de cada suceso A.

Para que este teorema se pueda aplicar hace falta cumplir un


requisito:

Los sucesos A tienen que formar un sistema completo,


es decir, que contemplen todas las posibilidades (la suma
de sus probabilidades debe ser el 100%).

1.6.2. TEOREMA DE BAYES:


El Teorema de Bayes viene a seguir el proceso inverso al que hemos visto
en la probabilidad total:

Probabilidad total: a partir de las probabilidades del suceso A


(probabilidad de que llueva o de que haga buen tiempo)
deducimos la probabilidad del suceso B (que ocurra un accidente).

Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha


ocurrido un accidente) deducimos las probabilidades del suceso
A (¿estaba lloviendo o hacía buen tiempo?).

La fórmula del Teorema de Bayes es:

Tratar de explicar estar fórmula con palabras es un galimatías, así que


vamos a intentar explicarla con un ejemplo. De todos modos, antes de
entrar en el ejercicio, recordar que este teorema también exige que el
suceso A forme un sistema completo.

EJEMPLOS:

1) En un estudio sanitario se ha llegado a la conclusión de que la


probabilidad de que una persona sufra problemas coronarios (suceso B)
es el 0,10 (probabilidad a priori).
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Además, la probabilidad de que una persona sufra problemas de


obesidad (suceso A) es el 0,25 y la probabilidad de que una persona
sufra a la vez problemas de obesidad y coronarios (suceso intersección
de A y B) es del 0,05.

Calcular la probabilidad de que una persona sufra problemas coronarios


si está obesa (probabilidad condicionada P(B/A)).

P (B A) = 0,05

P (A) = 0,25

P (B/A) = 0,05 / 0,25 = 0,20

Por lo tanto, la probabilidad condicionada es superior a la probabilidad a


priori. No siempre esto es así, a veces la probabilidad condicionada es
igual a la probabilidad a priori o menor.

2) En un saquito hay papeletas de tres colores, con las siguientes


probabilidades de ser elegidas:

a) Amarilla: probabilidad del 50%.

b) Verde: probabilidad del 30%

c) Roja: probabilidad del 20%.

Según el color de la papeleta elegida, podrás participar en diferentes


sorteos. Así, si la papeleta elegida es:

a) Amarilla: participas en un sorteo con una probabilidad de


ganar del 40%.

b) Verde: participas en otro sorteo con una probabilidad de


ganar del 60%

c) Roja: participas en un tercer sorteo con una probabilidad


de ganar del 80%.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Con esta información, ¿qué probabilidad tienes de ganar el sorteo en


el que participes?:

1.- Las tres papeletas forman un sistema completo: sus


probabilidades suman 100%

2.- Aplicamos la fórmula:

Luego,

P (B) = (0,50 * 0,40) + (0,30 * 0,60) + (0,20 * 0,80) = 0,54

Por tanto, la probabilidad de que ganes el sorteo es del 54%.

3) Van a cambiar a tu jefe y se barajan diversos candidatos:

a) Carlos, con una probabilidad del 60%

b) Juan, con una probabilidad del 30%

c) Luis, con una probabilidad del 10%

En función de quien sea tu próximo jefe, la probabilidad de que te suban


el sueldo es la siguiente:

a) Si sale Carlos: la probabilidad de que te suban el sueldo


es del 5%.

b) Si sale Juan: la probabilidad de que te suban el sueldo


es del 20%.

c) Si sale Luis: la probabilidad de que te suban el sueldo


es del 60%.

En definitiva, ¿cual es la probabilidad de que te suban el sueldo?:

1.- Los tres candidatos forman un sistema completo


UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

2.- Aplicamos la fórmula:

P (B) = (0,60 * 0,05) + (0,30 * 0,20) + (0,10 * 0,60) = 0,15

Por tanto, la probabilidad de que te suban el sueldo es del 15%.


Lo llevas claro amigo.

4) De una urna que contiene 9 bolas rojas y 5 negras, se extraen


sucesivamente 2 bolas. Calcular la probabilidad de los siguientes
sucesos:

a) Que las dos sean negras


b) Que las dos sean rojas
c) Que la segunda sea roja sabiendo que la primera fue negra.

Solución:

a) Sea N1 : Sacar la 1ª negra


N 2 : Sacar la 2ª negra

5 4
P  N1  N 2   P  N1   P  N 2 / N1   
14 13

b) Sea R1 : Sacar la 1ª roja


R2 : Sacar la 2ª roja

9 8
P  R1  R2   P ( R1 )  P  R2 / R1   
14 13

a. Sea N1 : Sacar la 1ª negra


R2 : Sacar la 2ª roja
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

9
P ( R2 / R1 ) 
13

5) Se tiene dos urnas, la primera tiene 3 bolas blancas y 2 negras, la segunda


tiene 2 bolas blancas y 3 negras. Se elige al azar una urna y de ella se extrae
una bola. Calcular la probabilidad de que sea blanca.

Sea A1 :”elegir la urna nº1”

A2 :”elegir la urna nº2”

B :”extraer bola blanca”

1 3 1 2 1
P ( P( B)  P( A1 )  P( B / A1 )  P( A2 )  P( B / A2 )     
2 5 2 5 2
Supongamos ahora que realizada la extracción, la bola resulta ser blanca y
queremos saber qué probabilidad hay de que la bola proceda de la urna nº1.

1 3

P( A1 ) P( B / A1 ) 2 5 3
P( Ai / B)   
P( A1 ) P( B / A1 )  P( A2 ) P( B / A2 ) 1  3  1  2 5
2 5 2 5

1.7. INTRODUCCION A LAS DISTRIBUCIONES DE PROBABILIDADES:


La probabilidad se refiere al estudio de la aleatoriedad y la incertidumbre en
cuaqlquier situación donde podría ocurrir uno de varios resultados posibles.
En algunos casos se utiliza de manera informal como por ejemplo: hay un
50% de probabilidad de que llueva.

1.7.1. VARIABLES ALEATORIAS:


Una variable aleatoria es una variable que toma valores numéricos
determinados por el resultado de un experimento aleatorio. No hay que
confundir la variable aleatoria con sus posibles valores. Ejemplos:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

- nº de caras al lanzar 6 veces una moneda (valores: 0, 1, 2…)


- nº de llamadas que recibe un teléfono en una hora
- tiempo que esperan los clientes para pagar en un supermercado…

Las variables aleatorias pueden ser discretas o continuas:


- Discretas: el conjunto de posibles valores es numerable. Suelen estar
asociadas a experimentos en que se mide el número de veces que sucede
algo.
- Continuas: el conjunto de posibles valores es no numerable. Puede tomar
todos los valores de un intervalo. Son el resultado de medir.
1.7.2. DISTRIBUCION DE PROBABILIDADES:
El resultado ofrecido en el teorema anterior nos proporciona la base
del desarrollo de procedimientos para hacer inferencias con respecto
a la media  de una población normal con una varianza 2 . En este
 
caso el teorema nos dice que n Y    /  tiene una distribución
 
normal estándar. Cuando se desconoce  se le puede estimar
mediante S  S 2 y la expresión

  
Y   
n
 S 
 

nos dará como base para el desarrollo de métodos de inferencias con


respecto a .

Sea Z una variable aleatoria normal estándar y sea  una variable


2

aleatoria ji - cuadrada con  grados de libertad.


Entonces si Z y  2 son independientes,

Z
T
 2 /

se dice que tiene una distribución t con  grados de libertad.


Si Y1, Y2, ..., Yn es una muestra aleatoria de una población normal con
media  y varianza 2, se puede aplicar el teorema para demostrar que
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

  
Z  n   Y    /  tiene una distribución normal estándar. El teorema
 
7.3 nos dice que  2  n  1S 2 /  2 tiene una distribución  2 con
v  n  1 grados de libertad y que Z y  son independientes (ya que
2


Yy  2 los son). Por lo tanto, por la definición

 
n Y    /   
Z   Y  
T   n
2 /v n  1S 2 /  2 n  1  S 
 
tiene una distribución t con (n-1) grados de libertad.

1.7.3. MEDIDAS: ESPERANZA MATEMÁTICA Y DESVIACION ESTANDAR:


Esperanza matemática y desviación típica de una variable
aleatoria discreta. Ejemplos y ejercicios resueltos variables
aleatorias discretas.

FORMULAS:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

EJEMPLOS:
1) Se lanzan tres monedas y se cuenta el número de caras obtenidas.
Haz una tabla con las probabilidades.Calcula la esperanza matemática
y la desviación típica. Representa gráficamente las probabilidades
obtenidas.

Construimos la tabla

Llamamos xi al suceso obtener cara


Tenemos tres monedas, el número de caras xi que podemos obtener
será: 0, 1, 2 y 3.
Calculamos la probabilidad pi de cada suceso
Escribimos el espacio muestral para facilitar el recuento, los casos
posibles son 2 3 = 8
E = { CCC, CCX, CXC, XCC, XCX, XXC, CXX, XXX }
- La probabilidad de no obtener ninguna cara será obtener tres cruces
{XXX} = 1/8
- La probabilidad de obtener una cara será {XCX, XXC, CXX } =
3/8
- La probabilidad de obtener dos caras será {CCX, CXC, XCC } = 3/8
- La probabilidad de obtener tres caras será {CCC} = 1/8
Escribimos los valores de xi y pi obtenidos en la tabla.
Añadimos la columnas xi·pi y pi·xi 2 para calcular la esperanza
matemática y la desviación típica.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

2) Calcular la esperanza matemática, la varianza, y la desviación típica,


de la distribución de probabilidad de las puntuaciones obtenidas al
lanzar un dado.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

3) En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De


los niños el 35% son menores de 24 meses. El 20% de las niñas tienen menos
de 24 meses. Un pediatra que ingresa a la sala selecciona un infante al azar.

a. Determine el valor de la probabilidad de que sea menor de 24 meses.

b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea


una niña.

SOLUCIÓN:

Se definen los sucesos:

Suceso H: seleccionar una niña.


UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Suceso V: seleccionar un niño.


Suceso M: infante menor de 24 meses.
En los ejercicios de probabilidad total y teorema de bayes, es importante identificar
los sucesos que forman la población y cuál es la característica que tienen en común
dichos sucesos. Estos serán los sucesos condicionados.

a. En este caso, la población es de los infantes. Y la característica en común es que


sean menores de 24 meses. Por lo tanto, la probabilidad de seleccionar un infante
menor de 24 meses es un ejemplo de probabilidad total. Su probabilidad será:

b. Para identificar cuando en un ejercicio se hace referencia al teorema de bayes,


hay que partir de reconocer esta es una probabilidad condicionada y que la
característica común de los sucesos condicionantes ya ha ocurrido. Entonces, la
probabilidad de que sea niña una infante menor de 24 meses será:

4) Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes,


el 20% se realizan correcciones faciales, un 35% implantes mamarios y el
restante en otras cirugías correctivas. Se sabe además, que son de genero
masculino el 25% de los que se realizan correcciones faciales, 15% implantes
mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente al
azar, determine:

a. Determine la probabilidad de que sea de género masculino

b. Si resulta que es de género masculino, determine la probabilidad que se haya


realizado una cirugía de implantes mamarios.

SOLUCIÓN:

Se definen los sucesos:

Suceso F: pacientes que se realizan cirugías faciales


Suceso M: pacientes que se realizan implantes mamarios
Suceso O: pacientes que se realizan otras cirugías correctivas
Suceso H: pacientes de género masculino
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

a. La probabilidad de que sea de género masculino se refiere a un problema de


probabilidad total, ya que es el suceso condicionado y las cirugías los condicionantes.
Dicho valor será:

b. Como el suceso condicionado ha ocurrido entonces se aplica el teorema de bayes,


luego, el valor de la probabilidad será:

5) Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas.


El uso que le da a cada equipo es de 25% al primero, 35% el segundo en y
40% el tercero. Se sabe que los aparatos tienen probabilidades de error de
1%, 2% y 3% respectivamente. Un paciente busca el resultado de una
ecografía y observa que tiene un error. Determine la probabilidad de que se
ha usado el primer aparato.

SOLUCIÓN:

Se definen los sucesos:

Suceso P: seleccionar el primer aparato


Suceso S: seleccionar el segundo aparato
Suceso T: seleccionar el tercer aparato
Suceso E: seleccionar un resultado con error
Se puede observar que la pregunta es sobre determinar la probabilidad de que un
examen errado sea del primer aparato, es decir, ya ha ocurrido el error. Por lo tanto,
debemos recurrir al teorema de bayes. Claro está, que es necesario de igual forma
obtener la probabilidad de que los aparatos produzcan un resultado erróneo, por lo
tanto:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

1.8. DISTRIBUCIUONES DE PROBABILIDADES PARA VARIABLES


ALEATORIAS DISCRETAS:
Una variable aleatoria (a partir de ahora va.) es un número real asociado al
resultado de un experimento aleatorio. Se trata, por tanto, de una función real
con dominio en el espacio muestral, X: Ω→ R.

1.8.1. BINOMIAL:
Sea X una v.a. discreta que toma los valores x = 0; 1;…; n, donde n es un número
natural conocido. Se dice que X sigue una distribución binomial de parámetros n
y p (y se nota X → B (n; p)) si su función masa es:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Sea X → B (n; p). Entonces:

Caracterización de la distribución binomial. Supongamos que un determinado


experimento aleatorio se repite n veces de forma independiente y que en ese
experimento hay un suceso que denominamos éxito, que ocurre con probabilidad
constante p. En ese caso, la variable aleatoria X que mide el número de éxitos sigue
una B (n; p).

1.8.2. POISSON:
Sea X una va. Discreta, que puede tomar los valores x = 0; 1; 2; … Se dice que X
sigue una distribución de Poisson de parámetro λ (y se nota X ! P (λ)) si su función
masa es:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

Sea X ! P (λ). Entonces:

Caracterización de la distribución de Poisson. Consideremos el número de éxitos en


un periodo de tiempo donde los éxitos acontecen a razón de λ veces por unidad de
tiempo (en promedio) y de forma independiente. En ese caso:

X : número de ocurrencias del suceso por unidad de tiempo:

Es una variable de Poisson de parámetro λ; y se nota X ! P (λ).P

1.8.3. HIPERGEOMETRICA:
Este modelo presenta similitudes con el Binomial, pero sin la suposición de
independencia de éste último. Veámoslo:
 Partimos de un conjunto formado por N individuos divididos en dos categorías
mutuamente excluyentes: A y Ac; de manera que N1 individuos pertenecen a
la categoría A y N2 individuos, a la categoría Ac. Por tanto, se cumple que:

N = N1 + N2

 Si del conjunto anterior extraemos n individuos sin


reemplazamiento (n ≤ N), la variable X que representa el número k de
individuos que pertenecen a la categoría A (de los n extraídos) tiene por
función de densidad:

La dependencia se debe al hecho de que N es finito y las extracciones se efectúan


sin reemplazamiento. El caso de extracciones con reemplazamiento sería
equivalente al de N infinito y se resolvería mediante el modelo Binomial.
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

El programa siguiente nos muestra la forma de la función de densidad de esta


variable y el valor de la función de densidad y de la función de distribución en el
punto que elijamos:

 Propiedades:
1) Esperanza: E(X) = n N1 / N 2.
2) Varianza: V(X) = (n N1 N2 (N-n)) / (N2 (N-1) )

 Propiedades del modelo Hipergeométrico


1) Esperanza: E(X) = n ´ N1/N
2) Varianza: V(X) = (n ´ N1 ´ N2 (N − n))/(N2 ´ (N − 1))

EJEMPLOS:
1. En una urna o recipiente hay un total de N objetos, entre los cuales hay una
cantidad a de objetos que son defectuosos, si se seleccionan de esta
urna n objetos al azar, y sin reemplazo, ¿cuál es la probabilidad de
obtener x objetos defectuosos?
Solución:

Luego;

donde:
p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados

muestras de n objetos en donde hay x que son defectuosos y n-


x buenos

todas las muestras posibles de seleccionar de n objetos tomadas de


entre N objetos en total = espacio muestral

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son


defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2
sean defectuosos?
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

SOLUCIÓN:

N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra

donde:

probabilidad asociada a cada muestra de 4 objetos que se


seleccionaron, con lo que se demuestra que las probabilidades no son constantes

formas o maneras de obtener 2 objetos defectuosos entre los 4


seleccionados = muestras de 4 objetos entre los que 2 son defectuosos

Como se observa en el desarrollo de la solución del problema, la pretensión es


demostrar que las probabilidades asociadas a cada uno de los resultados no son
constantes.

Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados


al azar sería:
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

2. Para evitar que lo descubran en la aduana, un viajero ha colocado 6


tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que
son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas
aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero
sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que
no sea arrestado por posesión de narcóticos?.

SOLUCIÓN:
a) N = 9+6 =15 total de tabletas
a = 6 tabletas de narcótico
n = 3 tabletas seleccionadas
x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas
de narcótico que se puede encontrar al seleccionar las 3 tabletas

p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas
seleccionadas haya 1 o más tabletas de narcótico)

otra forma de resolver;

p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las
tabletas seleccionadas no haya una sola de narcótico)
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

b) p(no sea arrestado por posesión de narcóticos)

3. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote


contiene 3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad
de que , a) los 4 exploten?, b) al menos 2 no exploten?

SOLUCIÓN:

a) N = 10 proyectiles en total
a = 7 proyectiles que explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número
de proyectiles que explotan entre la muestra que se dispara

b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan

p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) =


UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

4. a)¿Cuál es la probabilidad de que una mesera se rehúse a servir bebidas


alcohólicas únicamente a dos menores de edad si verifica aleatoriamente solo
5 identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad
suficiente?.
b) ¿Cúal es la probabilidad de que como máximo 2 de las identificaciones
pertenezcan a menores de edad?
SOLUCIÓN:
a) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a personas
menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad

b) N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a
personas menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

5. En la inspección de hojalata producida por un proceso electrolítico continuo,


se identifican 0.2 imperfecciones en promedio por minuto. Determine las
probabilidades de identificar a) una imperfección en 3 minutos, b) al menos
dos imperfecciones en 5 minutos, c) cuando más una imperfección en 15
minutos.
SOLUCIÓN:
a) x = variable que nos define el número de imperfecciones en la hojalata por cada
3 minutos = 0, 1, 2, 3, ...., etc., etc.
l = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

b) x = variable que nos define el número de imperfecciones en la hojalata por cada


5 minutos = 0, 1, 2, 3, ...., etc., etc.
l = 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata

=1-(0.367918+0.367918) = 0.26416
UNIVERSIDAD PERUANA LOS ANDES
E.A.P: ING CIVIL
CURSO: ESTADISTICA

c) x = variable que nos define el número de imperfecciones en la hojalata por cada


15 minutos = 0, 1, 2, 3, ....., etc., etc.
l = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

= 0.0498026 + 0.149408 = 0.1992106

También podría gustarte