Está en la página 1de 97

MEASURE

STATISTICS

No ponga su fe en lo que le dice


la estadística hasta que haya
considerado cuidadosamente lo
que no le dice.
William W. Watt
Recopilado por:
Ing. Mario Alvarado
1
• Teoría Estadística
• Medidas de posición central
• Medidas de variabilidad
• Forma de la Distribución
• Teoría de Probabilidades
• Cálculo de probabilidades
• Propiedades básicas CONTENIDO
• Probabilidad condicional
• Distribuciones de probabilidad
• Distribución normal
• Distribución binomial
• Distribución Poisson
• Distribución Multinomial
• Distribución Hipergeométrica
¿QUÉ ES LA ESTADÍSTICA?

Disciplina científica dedicada al desarrollo y aplicación


de la teoría y las técnicas apropiadas para la:


 Recolección
 Organización
 Presentación
 Análisis de los datos
 Interpretación
SURGIMIENTO HISTÓRICO

 Desde los comienzos de la civilización han existido formas


sencillas de estadísticas:
 Conteo de personas, animales, cosas
 Símbolos en pieles, rocas, cuevas
 Representaciones gráficas
 Los comienzos de la estadística pueden ser hallados en Egipto
cuyos faraones lograron recopilar hacia el 3050 a.c. datos
relativos a la población y riqueza del país con el objetivo de
prepara la construcción de las pirámides.
 El término proviene del alemán Gottfried Achenwall (1749),
quien se refería con Statistik al análisis de datos del Estado,
que lo tomó del italiano statista (estadista). La raíz de la
palabra es del latín status, que significa estado o situación.
CRONOLOGÍA DE LA ESTADÍSTICA

Antiguo Egipto Censos

Tablillas Censos
de arcilla Registros numéricos de Registros de
bienestar material Rey David ordenó un censo propiedades

Edad Contemporánea
1662: J. Graunt Primer estudio estadístico notable 1805: Laplace y Gauss Teoría de los errores
1693: E. Halley Pionero de las estadísticas sociales 1820: IDEM y Legendre Teoría Mínimos cuadrados
1691: G. Neumann Tablas de mortalidad 1835: J. Quetelet Padre de la Estadística Moderna
1760: G. Achenwall Acuñó la palabra «Estadística» 1880: W. Lexis Contribuyó con estadística social
CLASIFICACIÓN

ESTADÍSTICA DESCRIPTIVA
 Describe un conjunto de datos
 Elaboración de cuadros y gráficos
 Cálculo de medidas de resumen

ESTADÍSTICA INFERENCIAL
 Permite establecer conclusiones válidas para toda la
población con base en información proveniente de una
muestra
 Elaboración hipótesis
 Aplicación de pruebas estadísticas
 Interpretación de los parámetros estadísticos
REPRESENTACIÓN DE LOS DATOS
GENERALIDADES

Los datos recolectados por un investigador deben


organizarse apropiadamente para describir y analizar sus
características principales y comunicar su significado.
El investigador dispone de:
 Diagramas de frecuencias
 Cuadros
 Gráficos
Un gráfico presenta mejor, una idea general, a expensas de
los detalles, y resultan más atractivos cuando las cifras
deben ser interpretadas por personas no especializadas.
TIPS DE PRESENTACIÓN DE CUADROS Y
GRÁFICOS ESTADÍSTICOS
 Disposición rectangular, en una relación de 2 a 3.
 Títulos y subtítulos que describan los contenidos de
los cuadros o gráficos
 Ordenar de mayor a menor en variables nominales.
 Escalas y nombres adecuados para los ejes en
gráficos.
 Todo cuadro o gráfico debe contener la fuente de los
datos
 Debe explicarse por sí mismo.
CUADROS ESTADÍSTICOS

Cuadro 9
Costa Rica: Distribución absoluta del abstencionismo en la elección
presidencial de 1998 por provincias según sexo

Provincia TOTAL Porcentaje Hombresa) Mujeresb)


San José 241.628 39,3 125.532 116.096
Alajuela 98.495 16,0 53.188 45.307
Puntarenas 64.412 10,5 34.725 29.687
Limón 61.271 10,0 33.899 27.372
Cartago 59.173 9,6 31.435 27.738
Heredia 52.141 8,5 28.351 23.790
Guanacaste 36.947 6,0 20.334 16.613
TOTAL 614.067 100,0 327.464 286.603
a) Representa el 25% del padrón electoral de hombres
b) Representa el 32% del padrón electoral de mujeres

Fuente: Tribunal Supremo de Elecciones. Estadísticas del Sufragio 1998 . Imprenta


Nacional. San José, Costa Rica, 2001

Permiten mostrar una gran cantidad de datos.


GRÁFICOS LINEALES

Gráfico 7
Costa Rica: Porcentaje de desocupados (tasa de
desempleo abierto) por sexo, 1989-1999

6,0
Porcentaje de desocupados

5,0

4,0

3,0

2,0

1,0

0,0
1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

Fuente: Elaboración propia con base en datos del Sexto Informe del Estado de la Nación. San José, Costa Rica, 1999

Se utilizan para comparar el comportamiento de una variable en el tiempo.


GRÁFICOS DE BARRAS HORIZONTALES

Gráfico 8
Costa Rica: Distribución del total de abstencionistas en la elección
presidencial de 1998, según provincias

San José
Alajuela
Puntarenas
Limón
Cartago
Heredia
Guanacaste

- 50.000 100.000 150.000 200.000 250.000

abstencionismo

Fuente: Elaboración propia con base en datos del Tribunal Supremo de Elecciones. Estadísticas del sufragio
1988. Imprenta Nacional. San José, Costa Rica, 2001

Muy útiles cuando los nombres de las categorías son muy extensos.
GRÁFICO DE BARRAS COMPUESTAS

Gráfico 7
Costa Rica: Número de hogares según niveles de
pobreza por zona, 1998

No pobres
Nivel de pobreza

Necesidades básicas
insatisfechas
Zona Urbana
Zona Rural
Extrema pobreza

- 100.000 200.000 300.000 400.000 500.000 600.000

Hogares

Fuente: Elaboración propia con base en datos del Sexto Informe del Estado de la Nación. San José, Costa Rica, 1999

Permiten combinar dos categorías en un mismo gráfico.


GRÁFICO CIRCULAR

Permiten mostrar una cantidad limitada de categorías (no más de 6).


HISTOGRAMA

96 84 68 87 82 N° clase LI LS Frecuencia
81 80 55 74 60 1 49.5 56.5 7
80 94 76 76 90 2 56.5 63.5 4
54 83 80 59 91
3 63.5 70.5 4
91 75 81 70 87
4 70.5 77.5 7
88 83 62 95 82
53 73 77 69 51 5 77.5 84.5 11
89 73 67 51 92 6 84.5 91.5 9
62 100 97 84 56 7 91.5 98.5 7
91 96 54 91 96 8 98.5 105.5 1

El histograma es un tipo de gráfico que se


construye a partir de datos continuos
agrupados en clases, que facilita la Histograma
visualización de la forma de la distribución.
12

10
Cada clase se caracteriza por un límite 8

inferior y otro superior de clase cuyo valor Frecuencia


6

cuenta con una cifra decimal adicional a los 4

datos originales. 2

El ancho de cada clase se denomina 0


49,5
56,5
56,5
63,5
63,5 70,5
70,5
77,5
77,5
84,5
84,5
91,5
91,5
98,5
98,5
105,5
105,5

intervalo o amplitud de clase. Límites de Clase


EJEMPLO

 En un examen realizado a 50 alumnos del curso de Estadística


del TEC se obtuvieron los siguientes resultados:

Nota 2 3 4 5 6 7 8 9
# alumnos 3 4 8 11 9 7 6 2

a) ¿Cuál es la variable bajo estudio? ¿Qué tipo de variable es?

b) Construya una tabla que exprese las frecuencias absolutas,


relativas y acumuladas absolutas de la variable.

c) ¿Qué tipo de gráfico sería el más apropiado?


Elabore el gráfico.
SOLUCIÓN

a) La variable bajo estudio es la CALIFICACIÓN


Es una variable discreta pues por cada calificación se cuenta el # de alumnos.

b) Cuadro estadístico c) Gráfico de barras verticales


Distribución de calificaciones obtenidas en el curso de Estadística del
TEC Distribución de calificaciones en el
curso de Estadística del TEC
Frec. Frec. Rel. 12
Puntuación N° alumnos Frec. Relativa
Acumulada Acumulada
10
2 3 3 6% 6%
3 4 7 8% 14% N° de alumnos 8
4 8 15 16% 30% 6
5 11 26 22% 52%
6 9 35 18% 70% 4
7 7 42 14% 84% 2
8 6 48 12% 96%
9 2 50 4% 100% 0
2 3 4 5 6 7 8 9
Total 50 100%
MEDIDAS DE POSICIÓN:
¿Alrededor
de qué
LA MODA valores se
agrupan
LA MEDIANA los datos?

LA MEDIA
TÉRMINOS BÁSICOS

 Parámetro
 Valor numérico real de una población
 Población
 Todas las observaciones posibles de unidades de estudio similares.
 Estadístico
 Valor numérico tomado de una muestra para hacer una inferencia de
la población
 Datos continuos agrupados y sin agrupar
 El procesamiento de los datos continuos puede llevarse a cabo
empleando los datos en forma agrupada o sin agrupar.
 La agrupación de datos se lleva a cabo separando los datos en clases
o categorías tal y como se realiza cuando se construyen histogramas.
LA MODA

Corresponde al valor observado con mayor frecuencia

Ejemplo
Si el conjunto de datos corresponde a: La moda sería:

{Ana, Pedro, Ana, Luis, Pedro, Ana}

{333, 33, 3, 21, 12, 121}

{alto, bajo, alto, mediano, bajo}

{11, 325, 12, 45, 1, 14,1}


LA MODA: DATOS AGRUPADOS

d1
Fórmula Mo  Li  c
d1  d 2
Se debe determinar la clase modal, es decir la clase cuya
frecuencia relativa es mayor a la de las demás.

L i = límite inferior de la clase modal


d 1 = diferencia entre la frecuencia de la clase modal y la
frecuencia de la clase anterior
d 2 = diferencia entre la frecuencia de la clase modal y la
frecuencia de la clase posterior
c = inter valo de la clase modal
EJERCICIO
 Calcule la moda con base en los siguientes datos
agrupados. N° clase LI LS Frecuencia
1 49.5 56.5 7
2 56.5 63.5 4
3 63.5 70.5 4
4 70.5 77.5 7
5 77.5 84.5 11
6 84.5 91.5 9
7 91.5 98.5 7
8 98.5 105.5 1

SOLUCIÓN
La clase modal Li  77,5
corresponde a la clase d1  11 – 7  4
comprendida entre 77,5 d 2  11 – 9  2
y 84,5 pues es la clase
c  84,5 – 77,5  7
que posee la mayor
frecuencia entre todas d1 4
Mo  Li  * c  77,5  * 7  82,17  82
las clases, igual a 11 . d1  d 2 42
LA MEDIANA

Corresponde al valor que se localiza en el centro de los


datos ordenados n 1
PMe 
2
donde PMe es la posición de la mediana
y n es el número de datos
Ejemplo
Si el conjunto de datos corresponde a: La mediana sería:

{Ana, Pedro, Ana, Luis, Pedro, Ana}

{333, 33, 3, 21, 12, 121}

{alto, bajo, alto, mediano, bajo}

{11, 325, 12, 45, 1, 14,1}


LA MEDIANA: DATOS AGRUPADOS

Se debe determinar la clase mediana, es decir la clase cuya


frecuencia acumulada incluye a la mediana de los datos.

n  Fa
Me  Li  2 c
fi

Li = límite inferior de la clase mediana


n = número de datos
Fa = frecuencia acumulada de la clase anterior
fi = frecuencia absoluta donde está la mediana
c = inter valo de clase
EJERCICIO
 Calcule la mediana con base en los siguientes
datos agrupados. N° clase LI LS Frecuencia
1 49.5 56.5 7
2 56.5 63.5 4
3 63.5 70.5 4
4 70.5 77.5 7
5 77.5 84.5 11
6 84.5 91.5 9
7 91.5 98.5 7
8 98.5 105.5 1
 Para poder encontrar la clase mediana,
debemos calcular la posición de la n  Fa
mediana. Me  Li  2 c
fi
n  1 50  1
PMe    25,5 Li  77,5
2 2
n  50
 La clase mediana corresponde a la Fa  22
clase que contenga los valores que se fi  11
ubican entre la posición 25 y la
c  56,5  49,5  7
posición 26, es decir la clase 5.
 Para poder encontrar dicha posición 50  22
debemos calcular la frecuencia Me  77,5  2  7  79, 41  79, 4
11
acumulada de cada clase.
LA MEDIA ARITMÉTICA

 Datos no agrupados

x i = dato x
 x i

n = número de datos n

 Datos agrupados

x
 xf
i i

x i = punto medio de la clase i f i

f i = frecuencia de la clase i
EJERCICIO
 Calcule la media con base en los siguientes
datos agrupados. N° clase LI LS Frecuencia
1 49.5 56.5 7
2 56.5 63.5 4
3 63.5 70.5 4
4 70.5 77.5 7
5 77.5 84.5 11
6 84.5 91.5 9
7 91.5 98.5 7
8 98.5 105.5 1

N° clase Li Ls Frecuencia Punto medio xi * fi


En datos agrupados se 1 49.5 56.5 7 53 371
2 56.5 63.5 4 60 240
aplica el promedio 3 63.5 70.5 4 67 268
ponderado de los puntos 4 70.5 77.5 7 74 518
5 77.5 84.5 11 81 891
medios respecto a la 6 84.5 91.5 9 88 792
frecuencia de cada clase. 7 91.5 98.5 7 95 665
8 98.5 105.5 1 102 102
Total 50 3847

3847
La media es por tanto:   76,94
50
MEDIDAS DE VARIABILIDAD:
¿Qué tan
dispersos
RANGO están los
datos?
DESVIACIÓN ESTÁNDAR
VARIANZA
COEFICIENTE DE VARIACIÓN
FÓRMULAS PARA DATOS NO AGRUPADOS

 Rango o recorrido Max - Min

 Desviación estándar s  ( x  x)
i
2

n 1

 Varianza s2 
 i
( x  x ) 2

n 1

 Coeficiente de variación s
CV   100
x
EJERCICIO
La empresa de confites PIRULIN va a vender sus productos a una
transnacional que cuenta con altos estándares de calidad.
El Gerente de Producción ha identificado una alta variabilidad en la
longitud de los confites que produce, por lo que desea iniciar un
proyecto de 6 Sigma en alguna de las líneas de producción de
confites pero no sabe por cuál empezar.
Los datos representan la longitud de una muestra de confites.
Ayúdelo a seleccionar la línea de confite por la que empezaría a
desplegar un proyecto de 6 Sigma

Confite A Confite B Confite C Confite D Confite E


12.15 55.80 47.58 14.81 49.41
6.07 44.54 61.75 11.84 33.69
12.15 43.53 61.75 18.75 43.80
14.17 35.43 58.71 10.86 42.67
7.09 31.38 62.76 12.83 48.29
8.10 47.58 41.50 17.77 50.54
14.17 38.47 53.65 17.77 44.92
13.16 38.47 43.53 9.87 41.55
14.17 47.58 56.69 19.74 43.80
9.11 33.41 80.98 14.81 38.18
12.15 49.60 65.80 14.81 46.04
15.18 40.49 48.59 11.84 44.92
Estadístico Confite A Confite B Confite C Confite D Confite E
El complemento de Media 11.4727333 42.1894167 56.941875 14.6405 43.9841667
EXCEL denominado Error típico 0.89276468 2.08862105 3.16979633 0.94758023 1.36025468
HERRAMIENTAS DE Mediana 12.1476 42.01045 57.7011 14.805 44.3585

ANÁLISIS, genera la Moda


Desviación estándar
12.1476
3.09262758
47.5781
7.23519554
61.7503
10.9804966
14.805
3.28251421
43.797
4.71206044
siguiente tabla, a Varianza de la muestra 9.56434537 52.3480545 120.571305 10.7748995 22.2035136
través del Curtosis -1.03858998 -0.51823421 0.78285548 -1.30657459 0.91241465

procedimiento Coeficiente de asimetría -0.65465367 0.25918122 0.61681422 0.15685003 -0.80464298


Rango 9.1107 24.4182 39.4797 9.87 16.845
ESTADÍSTICAS Mínimo 6.0738 31.3813 41.5043 9.87 33.69
DESCRIPTIVAS. Máximo 15.1845 55.7995 80.984 19.74 50.535
Suma 137.6728 506.273 683.3025 175.686 527.81
Cuenta 12 12 12 12 12
COEFICIENTE DE VARIACIÓN 27% 17% 19% 22% 11%

Si cada tipo de confite se caracteriza por una longitud cuya especificación


se desconoce, las medidas de posición central no pueden compararse
entre sí, como tampoco las medidas de variabilidad, ya que se trata de
productos distintos.
La medida adecuada de comparación sería el Coeficiente de Variación, en
cuyo caso se escogería la línea que produce al Confite A, cuyo Coeficiente de
variación es el mayor entre todas las líneas: 27%.
¿Cómo es
FORMA DE LA el
compor ta
DISTRIBUCIÓN miento de
los datos?
FORMA DE DISTRIBUCIÓN

Se obtiene agrupando los datos en categorías o clases


en una distribución de frecuencias.
Corresponde a la forma en que los datos se comportan.
Permite visualizar en forma conjunta los valores
centrales, y la dispersión de los datos.
En variables cualitativas se emplean gráficos de barras o
de bastones
En variables cuantitativos se utiliza el histograma.
Existen dos medias de la forma de la distribución cuando
se sospecha que los datos siguen la forma de una
distribución normal*
 Curtosis: indica qué tan aguda (>0: leptocúrtica) o achatada
(<0: platicúrtica) es la curva
 Coeficiente de Asimetría, indica qué tan a la izquierda de la
media están los datos (<0) o qué tan a la derecha (>0)
 Si los dos indicadores están entre -1 y 1, los datos se aproximan
bastante a una distribución normal.

* Distribución caracterizada por tener la forma de una campana, conocida


también como la curva de Gauss o distribución gaussiana.
GRÁFICOS DE BARRAS VERTICALES

Gráfico 7
Costa Rica: Cantidad de desempleados, 1989-19995

140000

120000
Hombres
Número de casos

100000
Mujeres
80000

60000

40000

20000

0
1989 1990 1991 1992 1993 1994 1995

Fuente: Elaboración propia con base en datos del Sexto Informe del Estado de la Nación. San José, Costa Rica, 1999

El gráfico de barras se emplea para variables nominales y ordinales. En el


caso de variables nominales, los valores deben ordenarse de mayor a
menor frecuencia, mientras que para variables ordinales se debe respetar
el orden establecido por la variable.
HISTOGRAMAS
Histograma
12

10

8
Frecuencia

0
49,5 56,5 63,5 70,5 77,5 84,5 91,5 98,5 105,5
56,5 63,5 70,5 77,5 84,5 91,5 98,5 105,5

Límites de Clase

El Histograma se emplea para variables continuas. Se representa con barras sin


separación entre sí. Las barras se denominan «clases», cuyo ancho se determina por el
«intervalo de clase». Entre una clase y otra se establece un «límite de clase» el cual
contiene un decimal más a los datos originales para evitar dudas cuando un dato quede
en medio de dos clases.
BOXPLOTS
606.5

506.5

406.5
Variable de respuesta

306.5

206.5

106.5

6.5

Group 1 Group 2 Group 3 Group 4 Group 5

-93.5
Grupos para comparar

El gráfico Box Whisker se emplea para variables continuas, y permite comparar la distribución de los
datos entre distintas categorías o atributos, pudiendo provenir de distintas poblaciones. Los bigotes
muestran los valores máximo y mínimo del grupo, y la caja representa el 1°, el 2° y el 3° cuartil. El
2° cuartil equivale a la mediana.
Se emplean para comparar dos variables continuas con el fin
de encontrar relaciones entre ellas.
Se emplean para variables continuas, para mostrar el
comportamiento de los datos en distintos momentos
TEORÍA DE LA
PROBABILIDAD
DEFINICIÓN

La probabilidad de ocurrencia de un determinado suceso


puede definirse como la proporción de veces que ocurriría
dicho suceso si se repitiese un número grande de veces bajo
condiciones similares.
Por definición, la probabilidad se mide por un número entre
cero y uno. Si un suceso no ocurre nunca, su probabilidad es
cero, mientras que si ocurriese siempre su probabilidad es
uno.
Las probabilidades suelen venir expresadas como decimales,
fracciones o porcentajes.
CONCEPTOS CLAVE

Suceso
 Cualquier conjunto de resultado o consecuencias de
un procedimiento
Espacio muestral
 Se compone de todos los sucesos simples posibles.
Es decir, el espacio muestral se forma con todos los
resultados que ya no es posible desglosar más.
 El espacio muestral de lanzar una moneda al aire
consta de dos posibles sucesos: escudo o corona.
¿CUÁL ES EL ESPACIO MUESTRAL DE LOS
SIGUIENTES SUCESOS SIMPLES?

Lanzar un dado
Tirar dos dados
Sacar Tréboles de un
naipe
Preguntar por el
género
Preguntar por lugar
de nacimiento
NOTACIÓN DE PROBABILIDADES

 P denota una probabilidad


 A , B y C denotan sucesos específicos
 P(A) denota la probabilidad de que ocurra el suceso A

A partir de una población con N elementos, de los cuales k


presentan una característica A , se estimará la probabilidad de la
característica A como:
P(A) = k/N

Así por ejemplo, en una población de 100 pacientes, 5 de los


cuales son diabéticos, la probabilidad de padecer diabetes se
estima como el cociente de 5/100 = 0,05

Las probabilidades suelen emplearse con valores decimales de 0


a 1 (p=0,05), así como también en forma de porcentaje (p=5%),
o en la forma de a/b (p = 1/20).
CÁLCULO DE
PROBABILIDADES
REGLA 1: APROXIMACIÓN DE LA
PROBABILIDAD POR FRECUENCIAS RELATIVAS
 Realice (u obser ve) un procedimiento un gran número de
veces y cuente las ocasiones que el suceso A ocurre en
realidad. Con base en estos resultados reales, P(A) se
estima de la siguiente forma:

número de veces que ocurre A


P( A) 
número de veces que se repite el ensayo
Conforme un procedimiento se repite una y
otra vez, la probabilidad de frecuencias
Ley de los grandes números
relativas de un suceso, tiende a aproximarse
a la probabilidad real.

Ejemplo: calcular la probabilidad de que al lanzar una tachuela, ésta caiga


con la punta hacia arriba
REGLA 2: MÉTODO CLÁSICO DE LA
PROBABILIDAD

Suponga que un procedimiento dado tiene n


sucesos simples distintos (n=espacio
muestral), cada uno de los cuales tiene la
misma probabilidad de ocurrir.
Si el suceso A puede ocurrir en s de estas n
formas, entonces:
número de veces en que puede ocurrir A s
P( A)  
número de sucesos simples diferentes n
Ejemplo: al lanzar un dado balanceado, cada una de las seis caras tiene la
misma probabilidad de ocurrir
EJEMPLO

 Se seleccionan adultos al azar y se les


pregunta si están o no de acuerdo con la pena
de muerte: 319 están a favor, 133 están en
contra y 39 no tienen opinión. Estime la
probabilidad de que al seleccionar una persona
aleatoriamente, ésta esté a favor de la pena de
muerte.
El espacio muestral sería la sumatoria de todos los encuestados
(319+133+39 = 491). La probabilidad entonces vendría dada por:

319
P( A)   0, 65
491
REGLA 3: PROBABILIDADES
SUBJETIVAS

P(A), la probabilidad del suceso A, se


obtiene simplemente suponiendo o
estimando su valor con base en el
conocimiento de las circunstancias
relevantes.

Ejemplo: cuando se trata de estimar la probabilidad de que llueva mañana,


los meteorólogos usan su conocimiento experto de las condiciones del
tiempo para desarrollar un estimado de la probabilidad.
PROPIEDADES BÁSICAS

PROBABILIDAD COMPLEMENTARIA
LEY ADITIVA
LEY ADITIVA COMPLETA
LEY MULTIPLICATIVA
PROBABILIDAD COMPLEMENTARIA

 Para un suceso A, la probabilidad de que suceda su


complementario (es decir, que no suceda A) es igual a uno
menos la probabilidad de A:
P( A )  P( A )  1
 P( A )  1  P( A )

donde A denota el complement o de A

Ejemplo
En un grupo típico, hay 205 bebés recién nacidos y 105 de ellos son niños. Si
un bebé del grupo es seleccionado al azar, ¿cuál es la probabilidad de que el
bebé no sea niño?
105
P(no niño)  1  P  niño   1   1  0,51  0, 49
205
LEY ADITIVA

Si un fenómeno determinado tiene dos posibles resultados A


y B mutuamente excluyentes (es decir, que no pueden darse
en forma simultánea), la probabilidad de que una de esas
dos posibilidades ocurra se calcula como la suma de las dos
probabilidades individuales:

P( A ó B)  P( A )  P(B)
Ejemplo
En un servicio de urología, el 38,2% de las biopsias prostáticas presentan
hiperplasia benigna (HB), el 18,2% prostatitis (PR) y en un 43,6% el diagnóstico
de cáncer (C). La probabilidad de que un paciente que se someta a una biopsia
de próstata no confirme el diagnóstico de cáncer prostático es:
P(HB ó PR )  P(HB )  P(PR )  0,382  0,182  0,564
 1 P(C)  1 0,436  0,564
LEY ADITIVA COMPLETA

Si dos o más sucesos no son mutuamente excluyentes, la


probabilidad de que ocurra uno de ellos o ambos se calcula
sumando las probabilidades individuales de que ocurra una
de esas circunstancias, pero restando la probabilidad de que
ocurra lo común.

P( A ó B)  P( A )  P(B)  P( A y B)
Ejemplo
El servicio meteorológico pronosticó una probabilidad de lluvia del 60%, una
probabilidad de granizo del 20%, y una probabilidad de lluvia con granizo del
10%. ¿Cuál es la probabilidad de que llueva o caiga granizo?

P(LL ó G)  P(LL )  P(G)  P(LL y G)


 0,60  0,20  0,1 0,70
LEY MULTIPLICATIVA

Si dos sucesos A y B son independientes, la probabilidad de


que ocurran dos sucesos en forma simultánea es igual al
producto de las probabilidades individuales de ambos
sucesos.
Dos sucesos son independientes si el resultado de uno no
tiene efecto en el otro o si el que ocurra el primero de ellos
no hace variar la probabilidad de que se dé el segundo.

P( A y B)  P( A ) * P(B)
Ejemplo
La probabilidad de que un tren llegue a tiempo es de 0,80. En tanto que la
probabilidad de que salga a tiempo es de 0,95. ¿Cuál es la probabilidad de
que un tren llegue y salga a tiempo?
P( A y B)  P( A ) * P(B)
 0,80 * 0,95  0,76
PROBABILIDAD
CONDICIONAL

ARBOL DE ESPACIO MUESTRAL


PROBABILIDAD CONDICIONAL

 A veces, la probabilidad de que un determinado suceso tenga


lugar depende de que otro suceso se haya producido o no con
anterioridad.
 Este tipo de probabilidades se denota por P(A/B) y se calcula
como:
P( A y B)
P( A / B) 
P(B)
Ejemplo
La probabilidad de que un tren llegue y salga a tiempo es de 0,76. Si la
probabilidad de que llegue a tiempo es de 0,80. ¿Cuál es la probabilidad de
que un tren salga a tiempo si había llegado a tiempo?

P( A y B) 0,76
P( A / B)    0,95
P(B) 0,80
EJEMPLO

 Se quiere estudiar la incidencia del hecho de ser fumador como factor


de riesgo en el desarrollo de una enfermedad E.

80
La probabilidad de desarrollar la enfermedad E es: P( E )   0,444
180

60
La probabilidad de que un fumador padezca la enfermedad E es: P( E / F )   0,857
70

20
La probabilidad de que un no fumador padezca la enfermedad es: P( E / F )   0,182
110
ARBOL DE ESPACIO MUESTRAL

 Herramienta gráfica que se emplea cuando el


experimento consiste en extraer de un grupo
más de 2 elementos que cumplan una
característica específica.
 Particularmente útil para experimentos sin
reemplazo con más de dos eventos.
 Ejemplos:
 Extraer tres corazones rojos de un mazo de naipe
 Lanzar una moneda cinco veces y obtener solamente
escudos
 Conformar una papeleta para nombrar una junta
directiva de solo hombres de un grupo con hombres y
mujeres
EJEMPLO DE PROBABILIDADES
CONSTANTES

Determine la probabilidad 1ero 2do 3ro


de que una pareja con tres Niño Niño Niño
hijos tenga exactamente Niño Niño Niña
dos niños, suponiendo de Niño Niña Niño
que la probabilidad de niño Niño Niña Niña
o niña es la misma. Niña Niño Niño
La dificultad de este problema es determinar el Niña Niño Niña
espacio muestral, por lo que se recomienda la Niña Niña Niño
construcción de un árbol de posibilidades.
Niña Niña Niña
En este caso existen 8 posibles combinaciones
entre niños y niñas, de las cuales en 3 3
oportunidades hay 2 niños, por lo que la P( A)   0,375
probabilidad está dada por: 8
0,5

0,5 Tercero

0.125
0,5
Segundo 0.125
0,5 0,5 Tercero

Primero
0,5
0.125
Tercero
0,5 P(2 niños) = 0,375
0,5
Segundo 0,5
0,5
Niño Tercero

Niña
0,5
EJEMPLO PROBABILIDAD CONDICIONAL

 ¿Cuál es la probabilidad de seleccionar a dos niños y


una niña en la junta directiva, si en el grupo hay 10
niños y 5 niñas?

9/14 Tercero
5/13 10/15*9/14 *5/13 = 0,1648
Segundo

10/15 9/13
5/14 Tercero 10/15*9/14 *5/13 = 0,1648

Primero

10/14 Tercero
9/13 10/15*9/14 *5/13 = 0,1648
5/15
Segundo

Niño Tercero P(2 niños) = 0,4945


Niña
DISTRIBUCIONES DE
PROBABILIDAD
TÉRMINOS BÁSICOS

 Distribución discreta
 Distribución que resulta de datos contados que tienen una cantidad
finita de posibles valores. Ejm: binomial, poisson, hipergeométrica.
 Distribución continua
 Distribución que contiene una cantidad infinita de datos que pueden
ser desplegados en una escala de medición. Ejm: normal, Weibull
 Parámetro
 Valor numérico real de una población
 Población
 Todas las observaciones posibles de unidades de estudio similares.
 Estadístico
 Valor numérico tomado de una muestra para hacer una inferencia de
la población
DISTRIBUCIÓN NORMAL
DISTRIBUCIÓN NORMAL

 Desarrollada por Abraham de Moivre (1733) pero


ampliamente utilizada por Johan Carl Friedrich
Gauss (1777-1855) al punto de llegar a llamarse
la Distribución Gaussiana o Curva de Gauss.
 Es la distribución más importante para describir
una variable continua: altura, peso, puntuaciones
de un examen, mediciones científicas,
precipitaciones, etc.
 Se utiliza ampliamente en inferencia estadística.
 Permite tener una descripción de los resultados
probables obtenidos mediante el muestreo.
CARÁCTERÍSTICAS

1. La cur va tiene la forma de campana


2. Para definir la distribución se requieren dos
parámetros: la media  y la desviación estándar .
3. Debido a la simetría, la mediana, la media y la moda
tienen el mismo valor, y caen en el punto más alto de
la cur va
4. La media de la distribución puede ser cualquier valor
numérico: negativo, cero o positivo.
5. Los dos valores extremos, o colas, se extienden
indefinidamente y nunca tocan el eje horizontal.
6. La desviación estándar determina el ancho de la
cur va.
7. El área bajo la cur va siempre vale 1 , de manera que
las áreas bajo la curva representan probabilidades.
• El 68% de los datos se encuentra dentro de 1 
• El 95,5% de los datos se encuentra dentro de 2 
• El 99,7% de los datos se encuentra dentro de 3 
DISTRIBUCIÓN NORMAL
 Función de densidad:
1  x 
2

1   
f ( x;  ,  )  e 2  

2 

•Probabilidad de ocurrencia:
1  x 
2
x2
1   

e
2  
P( x1  X  x2 )  dx
donde, 2  x1

= media, = desviación estándar,  = 3,14159... y e = 2,71828


¿CÓMO RECONOCER QUE UN GRUPO DE DATOS
SE COMPORTA COMO UNA DISTRIBUCIÓN
NORMAL?
Para determinar si un grupo de datos corresponde
a una distribución normal o no:
 Histograma: permite observar si los datos se agrupan
alrededor de un valor central.
 Curtosis: indica qué tan aguda (>0: leptocúrtica) o
achatada (<0: platicúrtica) es la curva
 Coeficiente de Asimetría, indica qué tan a la izquierda
de la media están los datos (<0) o qué tan a la derecha
(>0)
 Si los dos indicadores están entre -1 y 1, los datos se
aproximan bastante a una distribución normal.
 Prueba de Bondad de Ajuste, empleando el estadístico
Chi-cuadrado o la prueba de Kolmogorov-Smirnof
(técnicas no paramétricas)
EJERCICIO

 En un estudio sobre el ingreso familiar entre dos ciudades, con base en


una muestra de cien familias obtenidas de cada ciudad, se obtuvieron
los siguientes resultados:
Estadísticos Ciudad A Ciudad B ¿En cuál ciudad el ingreso familiar es
mayor?
Media (miles $) 22,50 27,50 =>
Error típico 0,35 0,40 … existe mayor brecha social?
Mediana 25,10 26,21 =>
Moda 24,00 26,00 … hay mayor variabilidad relativa?
Desviación estándar 3,40 3,40 =>
Varianza de la muestra 11,56 11,56 … la distribución de la riqueza se distribuye
Curtosis 0,91 -0,34 normalmente?
Coeficiente de asimetría -1,40 0,75
=>
Rango 18,25 29,58
… hay más familias debajo de la media de
Mínimo 16,04 15,00
su ciudad?
Máximo 34,29 44,58
=>
DISTRIBUCIÓN NORMAL ESTÁNDAR

Se dice que una variable aleatoria que tiene


distribución normal con media cero y
desviación estándar uno tiene distribución de
probabilidad normal estándar.
Para determinar la probabilidad de una
variable dentro de un intervalo específico,
debe calcularse el área bajo la curva.
Para la distribución normal estándar se han
calculado las probabilidades y se presentan
en una tabla.
MÉTODO DE CÁLCULO

Todas las probabilidades de todas las


distribuciones normales se determinan con
la distribución normal estándar:
Sea una variable aleatoria normal x con
media  y desviación estándar . Entonces
la conversión a la distribución normal
estándar se realiza con la siguiente
fórmula:
x
z

De modo que: P( x1  x  x2 )  P( z1  z  z2 )
EJEMPLO

 Cierto tipo de bombillo dura en promedio 3 años, con una


desviación estándar de 0,5 años. Suponga que las
duraciones del bombillo se distribuyen normalmente.
Encuentre la probabilidad de que un bombillo dure menos
de 2,3 años.

Z = (2,3 - 3) / 0,5 = -1,4


P(X < 2,3) = P(Z < -1,4) = 0,0808

La probabilidad de que un bombillo dure menos de 2,3


años es de 0,0808.
TEOREMA DE LÍMITE CENTRAL

 Es quizás el teorema más importante de toda la


estadística.
 Este teorema nos dice que, sin tener en cuenta la forma
de la población que se está estudiando, podemos seguir
empleando la teoría normal para obtener inferencias
sobre la media poblacional a condición de que
obtengamos una muestra grande, porque la distribución
muestral de x será aproximadamente normal cuando n
sea grande.
 Muchos expertos sugieren que un tamaño de muestra de
30 es suficientemente grande para justificar el uso del
teorema.
ERROR ESTÁNDAR DE LA ESTADÍSTICA

La desviación estándar de la
distribución de una estadística de 
muestra se conoce como error estándar x 
de la estadística. n
 Esta variabilidad proviene de un error de muestreo
debido al azar, es decir, hay diferencias entre cada
muestra y la población así como entre las diversas
muestras.
 Indica no solo el tamaño del error de azar que se
ha cometido, sino también la probable precisión al
emplear una estadística de muestra para estimar
un parámetro de población.
DISTRIBUCIÓN
BINOMIAL
DISTRIBUCIÓN BINOMIAL

Proceso de Bernoulli

1. Cada evento tiene solamente dos resultados


posibles
2. La probabilidad del resultado de cualquier
evento permanece fija en el tiempo
3. Los eventos son estadísticamente
independientes.
Ejemplos: Escudo o Corona
Cartas rojas o negras
Pasa o no pasa
PROBABILIDAD BINOMIAL

n!
P ( r , n)   p r q nr
r!(n  r )!
donde,

P(r,n) = probabilidad de obtener r éxitos de un


grupo de tamaño n
p = probabilidad de éxito
q = probabilidad de fracaso
r = número de éxitos deseados
n = número de eventos realizados
PARÁMETROS DE UNA DISTRIBUCIÓN
BINOMIAL
 La distribución binomial requiere 2 parámetros:
 El valor de p
 El valor de n

Distribución Binomial
p=30%, n=6
35%

30%

25%
Probabilidad

20%

15%

10%

5%

0%
0 1 2 3 4 5 6
EJEMPLO

¿ Cuál es la probabilidad de que dos estudiantes de un grupo


de tres, pasen el examen parcial, si la probabilidad de que
un estudiante pase es de 0,50?

n! r nr 3!
P(r, n)  p q   0,520,532  0,375
r! (n  r )! 2! (3  2)!
MEDIDAS DE POSICIÓN Y VARIABILIDAD
EN DIST. BINOMIALES
Medida de posición
media:   np
Medida de variabilidad
desviación estándar:
  npq
donde,
n = número de ensayos
p = probabilidad de éxito
q = probabilidad de fracaso
EJEMPLO

 Una máquina empacadora produce 20% de defectuosos. Si


se toma una muestra de 10 paquetes, ¿cuál es el valor más
probable de defectuosos y cuál su posible dispersión?

  np  10  20%  2

  npq  10  20%  80%  1,265


DISTRIBUCIÓN POISSON
Concepto
 La distribución Poisson se usa con frecuencia para estimar la
cantidad de su sucesos u ocurrencias en determinado
intervalo de tiempo o espacio:
 Número de vehículos que llegan en una hora
 Número de reparaciones que necesitan 10 millas de carretera
 Número de fugas en 100 millas de un oleoducto.
 distribución de llamadas que llegan a un conmutador
 la demanda de pacientes que ingresan a un hospital
 la cantidad de accidentes en una carretera
 Las propiedades de un experimento Poisson son:
1. La probabilidad de ocurrencia es igual en dos inter valos
cualesquiera de igual longitud.
2. La ocurrencia o no ocurrencia en cualquier inter valo es
independiente de la ocurrencia o no ocurrencia en
cualquier otro inter valo.
FORMULACIÓN


 e
x
P( x) 
x!
donde,

P(x) = probabilidad de que ocurran x


sucesos
 = número de sucesos por intervalo de
tiempo, valor esperado o cantidad
promedio de ocurrencias en un
intervalo de tiempo
e = 2,71828
PARÁMETROS DE UNA DISTRIBUCIÓN
POISSON
 El único parámetro requerido es λ, es decir la media de la
variable por unidad de tiempo, distancia, volumen, o cualquier
otra unidad de medida.

Distribución Poisson
λ=4
25%

20%
Probabilidad

15%

10%

5%

0%
0 1 2 3 4 5 6 7 8 9 10 11 12

N° de éxitos
EJEMPLO

El número promedio de vehículos que


llegan a un autoservicio en un período de
15 minutos es 10. ¿Cuál es la
probabilidad de que lleguen
exactamente 5?
x  e  
P( x) 
x!
10
(10)  e5
P(5)   0,0378
5!
EJEMPLO EMPLEANDO EXCEL

 En una intersección sucede un promedio de 5 accidentes por


mes, y el depar tamento de Tránsito desea que se calcule la
probabilidad de tener 3 accidentes o menos.

P(x≤3) = 0,2650

¿Cuál es la probabilidad de tener más de 3


accidentes?
P(x>3) = 1- P(x≤3) = 1- 0,2651= 0,7349
DISTRIBUCIÓN
MULTINOMIAL
DISTRIBUCIÓN MULTINOMIAL

 El experimento binomial se convier te en un experimento


multinomial si cada intento tiene más de dos resultados
posibles.
 “¿Cuál es la probabilidad de que en una muestra de 15
personas, 8 sean de San José, 4 sean de Alajuela y 3 sean de
Cartago?”
 La fórmula está dada por

n!
P(n1, n2 ,..., nk )  p1n pn2 ...pnk
1 2 k

n1! n2!... nk !
EJEMPLO

 Supóngase que el 23% de las personas que asisten a cier to


partido de “baseball” viven a menos de 10 millas del estadio,
el 59% de ellas viven entre 10 y 50 millas del estadio, y el
18% vive a más de 50 millas. Se seleccionan 20 personas
entre los asistentes al partido (que son miles).
 Calcular la probabilidad de que siete de los seleccionados
vivan a menos de 10 millas, ocho vivan entre 10 y 50 millas,
y cinco vivan a más de 50 millas del estadio.
n!
P(n1, n2 ,..., nk )  p1n pn2 ...pnk
1 2 k

n1! n2 !... nk !
20!
P(7,8,5)  0,23 70,59 80,18 5  0,0094
7!8!5!
DISTRIBUCIÓN
HIPERGEOMÉTRICA
DISTRIBUCIÓN HIPERGEOMÉTRICA
 Distribución discreta para muestreos aleatorios en donde
los eventos pueden obtener únicamente dos posibles
resultados, tal y como sucede con la Binomial pero sin
reemplazo, por lo que la probabilidad entre ensayos no se
mantiene constante.
 La función de probabilidad se deduce a través de
razonamientos combinatorios y es igual a
 d  N  d 
  
x nx b 
P( X  x )   
b!
donde   
 a  b! (a  b)!
 N
 
n 
 El valor esperado de una variable X que sigue la
distribución hipergeométrica es

EX 
nd
N
 Y su varianza es
Nn
VarX  npq
N 1
APLICACIONES

 La distribución hipergeométrica es la distribución básica y natural


aplicable a casi todos los casos que se aplica el control de calidad.
La población está formada por todos los elementos fabricados o
comprados y es por tanto, finita, las muestras de inspección no son
demasiado pequeñas y cada elemento tiene una característica
binaria “satisfactoria” y “no satisfactoria”.
 Esta distribución es fundamental en el estudio de muestras
pequeñas y poblaciones pequeñas, en el cálculo de probabilidades
de juegos de azar y también en otros procesos experimentales en
los que no es posible retornar a la situación de par tida.
 La distribución hipergeométrica es aplicable a muestreos sin
reemplazo y la binomial a muestreos con reemplazo.
 Cuando el espacio muestral N es grande y el tamaño relativo de la
muestra extraída n/N es pequeño, la distribución hipergeométrica
puede aproximarse por la binomial.
EJEMPLO

 En una jaula hay 30 pericos rusos y 20 pericos chinos. Si


extraemos 10 pericos al azar, calcular la posibilidad de que 3
de ellos hablen chino.
N= 50 espacio muestral
n = 10 tamaño de la muestra
d = 20 población de pericos chinos
x = 3 valor buscado

 20  50  20 
   20!

30!
 3 10  3  3!17! 7!23!
P( X  3)    0,2259
 
50 50 !
 
10  10!40!
EJEMPLO CON EXCEL

 En un vagón de ferrocarril que acarrea a 60 reses, el 20% de ellas


están enfermas de vaca loca. Si extraemos con propósito de
inspección sanitaria una muestra del 10% de las reses, ¿cuál es la
probabilidad de hallar 2 vacas con dicha enfermedad?
N = 60 espac io muest ral
n = 10 % * 6 0 = 6 t amaño de la muest ra
d = 20% * 60 = 12 c ant idad de vac as lo c as
x = 2 valo r busc ado

El comando es:
=DISTR.HIPERGEOM(muestra_éxito;núm_de_muestra;población_éxito;núm_de_población)
OTRAS DISTRIBUCIONES

 Chi-cuadrado, T-Student y F se forman por combinaciones de


variables aleatorias, por lo que no se emplean para modelar
fenómenos físicos, pero sí para tomar decisiones y establecer
inter valos de confianza.
 La distribución conjunta de dos variables es llamada
distribución bivariada.
 La distribución exponencial se emplea en el ciclo de vida de
muchos productos
 Si al transformar datos mediante logaritmos, el resultado se
aproxima a una distribución normal, decimos que los datos
siguen una distribución lognormal.
 La distribución Weibull se emplea en modelar los tiempos de
falla, tiempo de reparación y resistencia de materiales.
TAREA

1. En Supermercados Amigos se llevó a cabo una investigación de las


frutas que más consumen los costarricenses con el fin de poder
abastecer adecuadamente el área de frutas. La información se tomó
con base en datos suministrados por el CENADA durante el año 2014
y está dada en miles de unidades vendidas.

Genere un nuevo gráfico en el que incorpore al menos 5 mejoras e


indique cuáles fueron esas mejoras.
2. Para evitar que lo descubran en la aduana, un viajero ha
colocado 6 tabletas de narcótico en una botella que
contiene 9 píldoras de vitamina que son similares en
apariencia. Si el oficial de la aduana selecciona 3
tabletas aleatoriamente para analizarlas, ¿cuál es la
probabilidad de que el viajero sea arrestado por posesión
de narcóticos?
a) Construya un árbol de decisiones para determinar el espacio
muestral, y realice el cálculo manual.
b) Utilice la función estadística del programa EXCEL para resolver el
problema. (Incluya en su informe las imágenes o pantallasos de
los cuadros de diálogo empleados en EXCEL)

También podría gustarte