Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Contents
1 Introducción 4
1.1 Estadı́stica descriptiva y estadı́stica inferencial . . . . . . . . . 4
1.2 Definiciones básicas . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.1 Experimento y unidad experimental . . . . . . . . . . . 6
1.2.2 Medición y dato estadı́stico . . . . . . . . . . . . . . . 7
1.2.3 Información . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.4 Estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.5 Población . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.6 Muestra . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.7 Variable . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Cantidades absolutas y relativas . . . . . . . . . . . . . . . . . 10
1.3.1 Cantidad absolutas . . . . . . . . . . . . . . . . . . . . 10
1.3.2 Cantidad relativas . . . . . . . . . . . . . . . . . . . . 10
1.3.3 Proporciones . . . . . . . . . . . . . . . . . . . . . . . 10
2 Estadı́stica descriptiva 12
2.1 Distribuciones de frecuencia . . . . . . . . . . . . . . . . . . . 12
2.1.1 Distribución de frecuencias para variables cualitativas . 13
2.1.2 Distribución de frecuencias para variables cuantitativas
discretas . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.3 Distribución de frecuencias para variables cuantitativas
continuas . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2 Medidas de concentración . . . . . . . . . . . . . . . . . . . . 22
2.2.1 Percentiles . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3 Medidas de posición o de tendencia central . . . . . . . . . . . 25
2.3.1 Media . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2 Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3.3 Modo o moda . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.4 Media ponderada . . . . . . . . . . . . . . . . . . . . . 33
2.3.5 La mejor medida de tendencia central . . . . . . . . . . 34
2.4 Medidas de variabilidad . . . . . . . . . . . . . . . . . . . . . 34
2.4.1 Desviación o desvı́o . . . . . . . . . . . . . . . . . . . . 35
2.4.2 Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4.3 Desvı́o estándar . . . . . . . . . . . . . . . . . . . . . . 36
2.4.4 Coeficiente de variación . . . . . . . . . . . . . . . . . 39
3 Probabilidad 41
3.1 Teorı́a de conjuntos . . . . . . . . . . . . . . . . . . . . . . . . 42
3.1.1 Propiedad de las operaciones . . . . . . . . . . . . . . . 45
2
3.2 Definición de probabilidad . . . . . . . . . . . . . . . . . . . . 46
3.2.1 Definición clásica . . . . . . . . . . . . . . . . . . . . . 46
3.2.2 Definición frecuentista . . . . . . . . . . . . . . . . . . 48
3.2.3 Denifición subjetiva . . . . . . . . . . . . . . . . . . . . 49
3.2.4 Axiomática . . . . . . . . . . . . . . . . . . . . . . . . 50
3.2.5 Probabilidad marginal y conjunta . . . . . . . . . . . . 52
3.2.6 Probabilidad condicional e independencia . . . . . . . . 53
3.3 Reglas de conteo . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.3.1 Variaciones y permutaciones . . . . . . . . . . . . . . . 58
3.3.2 Combinatorias . . . . . . . . . . . . . . . . . . . . . . . 62
3.4 Teorema de la probabilidad total . . . . . . . . . . . . . . . . 65
3.5 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.6 Estadı́stica Descriptiva . . . . . . . . . . . . . . . . . . . . . . 67
3
1 Introducción
1.1 Estadı́stica descriptiva y estadı́stica inferencial
Para mucha gente, estadı́stica significa descripciones numéricas. Esto
puede verificarse fácilmente al escuchar, un domingo cualquiera, a un
comentarista de televisión narrar un juego de fútbol. Sin embargo, en
términos más precisos, la estadı́stica es el estudio de los fenómenos
aleatorios. En este sentido la ciencia de la estadı́stica tiene, virtualmente,
un alcance ilimitado de aplicaciones en un espectro tan amplio de
disciplinas que van desde las ciencias y la ingenierı́a hasta las leyes y la
medicina. El aspecto más importante de la estadı́stica es la obtención de
conclusiones basadas en los datos experimentales. Este proceso se conoce
como inferencia estadı́stica. Si una conclusión dada pertenece a un
indicador económico importante o a una posible concentración peligrosa de
cierto contaminante, o bien, si se pretende establecer una relación entre la
incidencia de cáncer pulmonar y el fumar, es muy común que la conclusión
esté basada en la inferencia estadı́stica.
4
muestra.
5
población en el contexto de la probabilidad y de los modelos probabilı́sticos.
Se llama Unidad experimental son cada uno de los entes que son
observados en el experimento.
6
1.2.2 Medición y dato estadı́stico
Se llama medición a la asignación. conforme a reglas
preestablecidas - de valores (sı́mbolos, numerales o números, a cada
una de las caracterı́sticas que poseen las Unidades Experimentales.
1.2.3 Información
Se llama información al resultado de la evaluación de los Dalos
Estadı́sticos cuando se los compara con una adecuada referencia.
7
1.2.4 Estadı́stica
En aquellos casos donde los eventos son únicos e irrepetibles o, cuando
si se los repite bajo las mismas condiciones el resultado es necesariamente el
mismo; entonces, con un solo dato se puede tener información suficiente
para tomar una decisión o arribar a una conclusión.
Entonces, para que un evento sea objeto de análisis Estadı́stico, debe ser
susceptible de presentar distintos resultados, aún cuando se lo repita bajo
condiciones similares. Esto significa que la tarea Estadı́stica esta presente
cuando se necesita estudiar aquellas situaciones que requieran ser medidas en
similares condiciones y los resultados de éstas puedan presentan variabilidad.
1.2.5 Población
Se llama población al conjunto de Unidades Experimentales
que poseen caracterizaras comunes, observables, paso obtener
información sobre un hecho particular
8
determinado cuando se establece cual es el objetivo del trabajo a realizar.
Esta definición complementa a las nociones volcadas en la introducción de
la presente unidad.
1.2.6 Muestra
Se llama muestra a aquella parte de la Población que se ha
seleccionado para ser analizada con el fin de obtener conclusiones
respecto de la totalidad de los elementos de la misma.
1.2.7 Variable
Se llama variable a cualquier caracterı́stica observable que tienen
las unidades experimentales.
El importante hacer notar que los datos que presentan verdadero interés
para la tarea estadı́stica son aquellos cuantitativos, que al poseer valores
numéricos permitirán llevar a cabo incontables operaciones como se verá a
lo largo de la materia.
9
1.3 Cantidades absolutas y relativas
Los Datos Cuantitativos que se obtienen mediante la recopilación de los
datos para realizar un determinado trabajo, según el tipo de información que
se quiera proporcionar, se pueden expresar de dos maneras, a saber:
1.3.3 Proporciones
Se llama proporción estadı́stica a la cantidad relativa que se
obtiene haciendo el cociente entre una parte y su correspondiente
total.
10
Cabe notar que los números obtenidos como resultado de estos cocientes
se encontrarán siempre entre 0 y 1, ya que una parte no puede ser mayor al
total al que pertenece. Por otro lado, la proporción al ser multiplicada por
100 obtendremos un valor expresado en porcentaje.
11
2 Estadı́stica descriptiva
La Estadı́stica Descriptiva se utiliza para describir un conjunto de datos
referidos a un fenómeno.
Por otro lado, están las Medidas de Dispersión, las cuales brindan
información respecto a qué tan diseminados se encuentran los datos en
relación con su ubicación central.
12
En los casos de contar con una gran cantidad de datos o valores de cada
una de las variables, el primer paso a realizar es ordenarlos agrupándolos en
clases de equivalencia, para que puedan ser estudiados convenientemente
para obtener información que pueda resultar de interés acerca de las
caracterı́sticas en estudio.
Para poder agrupar los datos en principio se deberá definir las clases de
equivalencia en la cual se considerará cada uno de los datos obtenidos.
Poniéndolo en palabras simples, las filas que va a poseer la tabla de
distribución de frecuencias. Veremos que ésto va a estar supeditado
principalmente al tipo de variable con la que este trabajando y el recorrido
de la misma.
13
Fueron encuestados 800 alumnos que terminaron el ciclo secundario y se
les consultó acerca de la Facultad donde se inscribirán para realizar su
carrera universitaria.
De acuerdo a dicha encuesta se 230 alumnos manifestaron que se inscribirán
en Ciencias Médicas; 193 alumnos se inscribirán en Ciencias Económicas;
105 se inscribirán en Ciencias Jurı́dicas; 87 en Ciencias Sociales; 50 en la
facultad de Psicologı́a y el resto de los alumnos encuestados se inscribirán
en otras Facultades.
Se puede observar que para este tipo de datos no hay decisiones que tomar
respecto a como construir las clases de equivalencias. A cada facultad le
corresponde una clase propia (representada una por fila). Por otra parte, este
clasificación no nos permitirá realizar muchas mas operaciones con los datos
más que obtener las frecuencias relativas (realizando la sencilla operación
que se puede encontrar en la sección de cantidad relativas) y su consecuente
transformación en porcentaje.
14
2.1.2 Distribución de frecuencias para variables cuantitativas
discretas
Cuando hay que clasificar las unidades experimentales de acuerdo a una
Variables Cuantitativa Discreta, generalmente, cada valor individual de la
variable representa una clase de equivalencia. Excepcionalmente, se pueden
formar clases de equivalencia con dos o más valores consecutivos, pero estos
casos no serán analizados en este trabajo.
Este tipo de variables nos aporta una caracterı́stica que con las del tipo
cualitativas no tenı́amos: nos aporta un orden dado por la magnitud de
cada valor que puede tomar. Pongamos como ejemplo las notas de los
exámenes de un grupo de alumnos en una escala del 1 al 10. Veremos
fácilmente que quien obtuvo un 10, tuvo una nota mayor que quien tuvo 9 y
ası́ sucesivamente. Al momento de armar la tabla de distribución de
frecuencias este orden lógico e intuitivo nos permitirá también obtener mas
información de los datos con que se cuentan.
15
La frecuencia relativa, f ri , de cada valor xi , se obtiene
dividiendo la correspondiente frecuencia absoluta, fi , por el número
total de observaciones, n , e indica la proporción de observaciones
correspondientes a dicho valor.
Ejemplo
Datos de notas
1 4 5 6 8
2 4 5 6 8
2 4 5 7 8
3 4 5 7 8
3 4 5 7 8
3 5 5 7 8
4 5 6 7 9
4 5 6 7 9
4 5 6 8 9
4 5 6 8 10
Los valores que puede tomar la variable son los números enteros del 1 al
10, con lo cual se trata de una variable cuantitativa discreta.
16
Valor xi Frecuencia ni Frecuencia relativa f ri
1 1 2,0%
2 2 4,0%
3 3 6,0%
4 9 18,0%
5 11 22,0%
6 6 12,0%
7 6 12.0%
8 8 16,0%
9 3 6,0%
10 1 2,0%
En sı́mbolos:
PM PM
i=1 fi = n i=1 f ri = 1
Ejemplo
17
iguales a una determinada observación, es decir, la frecuencia acumulada
para un valor dado.
Fi
Fr i = n
Ilustremos las definiciones con los datos de las notas de los exámenes
finales del Ejemplo de más arriba.
Ejemplo
F 2 = f1 + f2 = 1 + 2 = 3
F2 3
Fr 2 = 50
= 50
= 0, 06
18
entre 50.
F4 = f1 + f2 + f3 + f4 = 1 + 2 + 3 + 9 = 15
F4 15
Fr 4 = 50
= 50
= 0, 30
F (xM ) = n
Fr i(xM ) = 1
19
Fi = Fi−1 + fi
fi = Fi − Fi−1
Ejemplo
f5 = F5 − F4 = 26 − 15 = 11
F9 = F8 − f9 = 46 − 3 = 49
20
Los intervalos en los cuales se agrupan los datos se denominan
intervalos de clase.
Ejemplo
Datos de estatura
1,594 1,640 1,680 1,729 1,760
1,594 1,642 1,687 1,731 1,763
1,612 1,652 1,687 1,737 1,781
1,614 1,652 1,691 1,738 1,787
1,622 1,653 1,702 1,738 1,796
1,624 1,658 1,704 1,738 1,797
1,633 1,660 1,704 1,740 1,801
1,635 1,675 1,705 1,752 1,817
1,640 1,679 1,715 1,753 1,818
1,640 1,680 1,717 1,753 1,859
21
Clase Frecuencia Frecuencia Frec. Relativa Frec. Relativa
Marca
LI LS n(j) Acumulada f(i) Acumulada
1,55 1,60 1,575 2 2 4,0% 4,0%
1,60 1,65 1,625 10 12 20,0% 24,0%
1,65 1,70 1,675 12 24 24,0% 48,0%
1,70 1,75 1,725 13 37 26,0% 74,0%
1,75 1,80 1,775 9 46 18,0% 92,0%
1,80 1,85 1,825 3 49 6,0% 98%
1,85 1,90 1,875 1 50 2,0% 100,0%
2.2.1 Percentiles
Cuando tenemos un conjunto de observaciones ordenadas de una
variable cuantitativa, podemos calcular fácilmente el porcentaje de
observaciones que se encuentran por debajo de un valor determinado,
simplemente observando la frecuencia relativa acumulada hasta el mismo.
En base a esta idea, se definen los percentiles, deciles y cuartiles de la
distribución de frecuencias.
22
Los percentiles dividen la distribución de frecuencias en cien
n
partes iguales. El primero, P1 , acumula 100 (1%), el segundo,
P2 , 100 (2%), y ası́ hasta el último, P99 , que acumula 99×n
2×n
100
(99%).
Ejemplo
Los datos de estatura ordenados se observan en la tabla, ordenados de
menor a mayor.
Datos de estatura
1,594 1,640 1,680 1,729 1,760
1,594 1,642 1,687 1,731 1,763
1,612 1,652 1,687 1,737 1,781
1,614 1,652 1,691 1,738 1,787
1,622 1,653 1,702 1,738 1,796
1,624 1,658 1,704 1,738 1,797
1,633 1,660 1,704 1,740 1,801
1,635 1,675 1,705 1,752 1,817
1,640 1,679 1,715 1,753 1,818
1,640 1,680 1,717 1,753 1,859
10×n
Siendo n = 50, el percentil 10 es el valor que acumula 100
= 5
observaciones. Es decir, P10 = 1, 622.
23
Ejemplo
Los datos agrupados de las estaturas de los alumnos, con sus respectivas
frecuencias simples y acumuladas, se observan en la tabla.
n×k 50×60
El cuarto intervalo es el primero que acumula 100
= 100
= 30 o más.
El percentil 60 es:
n×k 50×60
−Fj−1 −24
Pk = L i + 100
fj
× wj = 1, 70 + 100
13
× 0, 05 = 1, 702
De las definiciones anteriores, podemos ver que los cuartiles son los
percentiles 25, 50 y 75, mientas que los deciles son los percentiles 10, 20,. . . ,
90. De lo que se deduce que los últimos son un caso particular de los
primeros.
24
2.3 Medidas de posición o de tendencia central
Ya se ha insistido que para realizar un análisis estadı́stico es necesario
contar con datos obtenidos de la repetición de los experimentos bajo
condiciones similares. Por lo tanto, para una variable particular se cuenta
con varios valores observados. Éstos, generalmente, tienden a agruparse o
reunirse en torno algunos puntos importantes o centrales que permiten fijar
o ”medir” una posición en el plano o en el espacio.
2.3.1 Media
La media (aritmética) generalmente es la más importante de todas las
medidas numéricas utilizadas para describir datos; constituye lo que la
mayorı́a de la gente denomina promedio.
25
metros cuadrados considerando todos los departamentos.
Ejemplo
Consideremos los datos referidos a las notas de los exámenes finales, las
cuales se reproducen en la tabla. Si sumamos todos los valores y, luego,
dividimos dicha suma por la cantidad total de observaciones, n = 50,
obtendremos el cálculo de la media aritmética sin utilizar las frecuencias:
Datos de notas
1 4 5 6 8
2 4 5 6 8
2 4 5 7 8
3 4 5 7 8
3 4 5 7 8
3 5 5 7 8
4 5 6 7 9
4 5 6 7 9
4 5 6 8 9
4 5 6 8 10
26
serı́a:
1
P10 1×1+2×2+3×3+4×9+5×11+6×6+7×6+8×8+9×3+10×1 284
X̄ = 50 i=1 xi ∗ fi = 50 = 50 = 5, 68
Ejemplo
Datos de estatura
1,594 1,640 1,680 1,729 1,760
1,594 1,642 1,687 1,731 1,763
1,612 1,652 1,687 1,737 1,781
1,614 1,652 1,691 1,738 1,787
1,622 1,653 1,702 1,738 1,796
1,624 1,658 1,704 1,738 1,797
1,633 1,660 1,704 1,740 1,801
1,635 1,675 1,705 1,752 1,817
1,640 1,679 1,715 1,753 1,818
1,640 1,680 1,717 1,753 1,859
27
Clase Marca Frecuencia
y(j)*n(j)
LI LS y(j) n(j)
1,55 1,60 1,575 2 3,150
1,60 1,65 1,625 10 16,250
1,65 1,70 1,675 12 20,100
1,70 1,75 1,725 13 22,425
1,75 1,80 1,775 9 15,975
1,80 1,85 1,825 3 5,475
1,85 1,90 1,875 1 1,875
Suma = 85,250
P7
i=1 yi ∗ fi = 1, 575 × 2 + 1, 625 × 10...1, 875 × 1 = 3, 150 + 16, 250...1, 875 + 85, 250
1 P7 85,250
ȳ = 50 i+1 y i ∗ fi = 50
= 1, 705
2.3.2 Mediana
La media aritmética es la medida más ampliamente utilizada para
indicar el centro de una distribución. Sin embargo, el cálculo de la misma
es muy sensible a los valores extremos, entendiendo por éstos a aquéllos
muy pequeños o muy grandes.
28
estas observaciones es 1.81, pero seguramente esperarı́amos un valor central
cercano a 1.72 ó 1.73. La distorsión se debe a la observación de la estatura
2.10, la cual es muy grande en comparación con las demás.
Ejemplo
29
1,869 1,901 1,912 1,978 2,072
1,889 1,908 1,921 1,994 2,075
Xme = X n+1
2
Ejemplo
Xme = x3 = 1, 912
x5 +x6 1,912+1,921
Xme = 2
= 2
= 1, 9165
30
Ejemplo
Datos de estatura
1,594 1,640 1,680 1,729 1,760
1,594 1,642 1,687 1,731 1,763
1,612 1,652 1,687 1,737 1,781
1,614 1,652 1,691 1,738 1,787
1,622 1,653 1,702 1,738 1,796
1,624 1,658 1,704 1,738 1,797
1,633 1,660 1,704 1,740 1,801
1,635 1,675 1,705 1,752 1,817
1,640 1,679 1,715 1,753 1,818
1,640 1,680 1,717 1,753 1,859
31
La moda o el modo de un conjunto de datos, Xmo , es el valor más
frecuente. Es decir, es aquel valor que tiene mayor frecuencia (tanto
absoluta como relativa). Puede presentarse el caso en que dos (o
más) valores tienen la máxima frecuencia. En este caso decimos
que la distribución es bimodal (o multimodal).
Ejemplo
Los datos de las notas de los alumnos, con sus respectivas frecuencias
simples, son los expuestos en la tabla.
Valor xi Frecuencia ni
1 1
2 2
3 3
4 9
5 11
6 6
7 6
8 8
9 3
10 1
d1
Xmo = Li + d1 +d2
× wi
32
Ejemplo
Clase
Marca Frecuencia
LI LS
1,55 1,60 1,575 2
1,60 1,65 1,625 10
1,65 1,70 1,675 12
1,70 1,75 1,725 13
1,75 1,80 1,775 9
1,80 1,85 1,825 3
1,85 1,90 1,875 1
d1 (13−12)
Xmo = Li4 + d1 +d2
× wi = 1, 70 + (13−12)+(13−9)
× 0, 05 = 1, 71
Otro ejemplo son los promedios universitarios (que utilizan letras), que
pueden calcularse si asignamos a cada calificación con letras el número
adecuado de puntos (A = 4, B = 3, etcétera), y después asignamos a cada
33
puntaje un peso igual al número de horas crédito. Nuevamente, se utiliza la
fórmula anterior para calcular el promedio de calificaciones
¿Toma en ¿Afectado
¿Qué tan
Medida Definición Existencia cuanta por valor Ventajas y desventajas
común es?
cada valor? extremos?
”Promedio” más Se usa mucho y funciona bien
Media Siempre existe Si Si
conocido con muchos métodos estadı́sticos
Valor en el Suele ser buena opción si hay
Mediana De uso común Siempre existe No No
medio valores extremos.
Valor mas Se usa en Podrı́a no existir o Apropiada para datos de
Moda No No
frecuente ocasiones haber mas de una nivel nominal.
34
A la izquierda tenemos los tornillos fabricados por la empresa A, y a la
derecha los de la empresa B
Sin embargo, debe ser evidente que las muestras difieren mucho con
respecto a las variaciones de las longitudes de los tornillos. Los tornillos
fabricados por la fabrica A parecen tener longitudes muy similares, mientras
que las longitudes de los tornillos de la fabrica B varı́an mucho. En muchos
procesos de fabricación, este mismo aspecto tiene una gran importancia. Se
logra una mejor calidad a través de una variación menor. La idea es poder
desarrollar la habilidad para medir y comprender la variación.
35
Se llama desviación con respecto a la media aritmética, a
la diferencia entre un valor individual de la variable y su media
aritmética.
Por si solo el concepto no tiene gran utilidad, pero debemos tenerlo bien
presente por que es la base de todo que veamos sobre variabilidad.
2.4.2 Varianza
La varianza es una medida de variabilidad que es, en esencia,
el promedio al cuadrado de las distancias entre cada observación y
la media del conjunto de observaciones. Su fórmula es:
P
(xi −X̄)2
V (x) = n−1
36
El desvı́o estándar de una variable es la raı́z cuadrada positiva
de la varianza.Su fórmula es:
rP
(xi −X̄)2
S(x) = n−1
El valor del desvı́o estándar suele ser positivo. Sólo es igual a cero
cuando todos los valores de los datos son el mismo número. Además,
valores grandes de S(x) indican mayores cantidades de variación.
Paso 2: Reste la media de cada valor individual para tener una lista de
desviaciones de la forma (x − x̄).
37
Aclaración: Dividir la varianza muestral por n-1 en lugar de n
se hace para tener en cuenta la incertidumbre en la estimación de
la varianza poblacional. Cuando se toma una muestra de una
población, es posible que los datos de la muestra no sean una
representación perfecta de la población completa. Al dividir la
varianza muestral por n-1, se le quita un grado de libertad a la
muestra, lo que significa que se asume que la muestra es menos
precisa en la estimación de la varianza poblacional. De esta
manera, la estimación resultante es más robusta y menos
influenciada por valores atı́picos o extremos en la muestra. Se
desprende de lo anterior que para el caso en que se desee calcular
la varianza de una población, se deberá dividir por n
Ejemplo
1
V (x) = 2
× [(1, 70 − 1, 71)2 + (1, 71 − 1, 71)2 + (1, 72 − 1, 71)2 ]
0,0002
= 2
= 0, 0001
1
V (x) = 2
× [(1, 55 − 1, 71)2 + (1, 71 − 1, 71)2 + (1, 87 − 1, 71)2 ]
0,0512
= 2
= 0, 0256
Como era de esperar, la varianza del segundo grupo es mayor que la del
primero. Debe notarse que los los valores resultantes tiene magnitud de
centı́metros al cuadrado, que si bien tiene sentido intrı́nseco (es decir,
representa una forma de medir áreas), no sirve para realizar comparaciones
en lo que se está midiendo. Una forma sencilla de ilustrar el problema es
pensar una varianza de temperaturas que estará expresada en grados
centı́grados al cuadrado. Si bien la varianza está correctamente expresada,
grados centı́grados al cuadrado no es algo que tenga un significado per se.
38
Nos queda el último paso para obtener el desvı́o estándar, obtener la raı́z
cuadrada de las varianzas calculadas. Confiamos en que el alumno pueda
realizar tan sencilla operación por su cuenta.
Ejemplo
Desvı́o
Media
estándar
Estatura 173,58 cm 7,67 cm
Peso 77,82 kg 11,87
39
Los dos coeficientes de variación se obtienen de la siguiente manera:
S(x) 7,67cm
Estaturas: CV (x) = x̄
= 173,58cm
= 0, 0442
S(x) 11,87kg
Pesos: CV (x) = x̄
= 77,82kg
= 0, 1526
40
3 Probabilidad
En los capı́tulos anteriores se han estudiado los distintos métodos de
recopilación de datos y cómo se pueden utilizar para describir los hechos,
mediante el análisis del comportamiento de las variables observadas, y el
cálculo de las medidas que resumen la información que contienen.
41
expondremos un breve repaso de la Teorı́a de Conjuntos, la cual será una
herramienta fundamental para los desarrollos posteriores.
42
Ejemplo
Considere el lanzamiento de un dado. El espacio muestral está dado por
Ω = {1, 2, 3, 4, 5, 6}, un evento simple es A = ”el resultado es 2” y un
evento compuesto es B = ” el resultado es un número par”. Los eventos
pueden escribirse también como A = {2} y B = {2, 4, 6}.
Ejemplo
Considere el lanzamiento de dos monedas, una por vez. El espacio muestral
está dado por:
Ω = {CaraCara, CaraCeca, CecaCara, CecaCeca}.
Un suceso simple es A = {CaraCeca}, o de manera extensiva A = ”el
primer lanzamiento es cara y el segundo ceca”. Un evento compuesto es
B = {CaraCara, CecaCeca}, o de manera extensiva B = ”los dos
lanzamientos arrojan el mismo resultado”.
43
Cuando todos los elementos de un conjunto A pertenecen también a
otro conjunto B , se dice que A está incluido en B , y se denota A ⊂ B.
Ejemplo
Consideremos el lanzamiento de un dado. El espacio muestral, como ya
hemos visto, es Ω = {1, 2, 3, 4, 5, 6}. Además, definimos los eventos A = ”el
resultado es mayor a 3”, B = ”el resultado es impar”, y C = ”el resultado
es 1”. O bien, A = {4, 5, 6}, B = {1, 3, 5} y C = {1}.
Ejemplo
Supongamos que, con los datos del ejemplo anterior, deseamos hallar las
operaciones compuestas AC ∩ B y (A ∩ C C ) ∪ B. Siempre es recomendable
operar paso a paso.
44
resultado A ∩ C C = {4, 5, 6}, y finalmente, al realizar la unión con B , el
resultado es (A ∩ C C ) ∪ B = {1, 3, 4, 5, 6}.
A ∪ (B ∪ C) = (A ∪ B) ∪ C
A ∩ (B ∩ C) = (A ∩ B) ∩ C
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
45
(A ∪ B)C = AC ∩ B C )
(A ∩ B)C = AC ∪ B C
46
Cabe aclarar que el evento A puede ser simple o compuesto, y en este
segundo caso, puede resultar complicado determinar la cantidad de maneras
en que puede darse el evento. A su vez, hay ocasiones en que resulta
complicado determinar la cantidad de elementos que posee el espacio
muestral Ω. Para ambos casos, resultan útiles las reglas de conteo
(combinatoria, variaciones, etc.) que serán vistas en la sección 6 de este
capı́tulo.
Ejemplo
Un individuo está por jugar a un juego en el que se lanzan dos dados
equilibrados; gana $1 si el resultado de la suma de los números obtenidos en
ambos dados es siete.
47
posibles:
6 1
P (A) = 36
= 6
= 0, 1667
k
P (A) = limK→∞ K
Ejemplo
Consideremos un control de calidad de una empresa, en el cual se desea
saber la probabilidad de que un determinado artefacto tenga una vida útil
superior a las 1200 hs. Para ello, el departamento de control de calidad
separa 500 unidades de la producción y mide la vida útil de cada unidad.
48
Los resultados se observan en la siguiente tabla:
115+84+41
P (A) = 500
= 0, 23 + 0, 17 + 0, 08 = 0, 38
49
probabilidad de ocurrencia del mismo.
3.2.4 Axiomática
Todas las definiciones anteriores están ı́ntimamente ligadas a la parte
experimental de la Estadı́stica. Sin embargo, en los últimos años, la Teorı́a
de la Probabilidad ha evolucionado de manera sorprendente y las
definiciones se han hecho más rigurosas desde un punto de vista
matemático.
50
función de probabilidad mediante una serie de axiomas. Éstos, si bien son
válidos para cualquiera de las definiciones de probabilidad expuestas
anteriormente, amplı́an la definición incluyendo a cualquier medida que los
verifique.
P (Ω) = 1
P (AC ) = 1 − P (A)
0 ≤ P (A) ≤ 1
P (Ø) = 0
51
Si A y B son dos eventos cualesquiera, entonces la probabilidad de su
unión es:
P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
A ⊆ B ⇒ P (A) ≤ P (B)
A ⊆ B ⇒ P (A ∩ B) = P (A)
Probabilidad marginal
52
La Probabilidad Marginal es simplemente la probabilidad de ocurrencia
de un evento A, sin pensar en la existencia de otro evento B que suceda de
modo simultáneo con A.
Probabilidad conjunta
Probabilidad condicional
53
La probabilidad condicional del suceso A tal que se haya
presentado el suceso B, es el cociente entre la probabilidad
conjunta entre los dos sucesos A y B y la probabilidad marginal
del suceso condicionante B.
P (A∩B)
P (A/B) = P (B)
, conP (B) ̸= Ø
Ejemplo
Consideremos el lanzamiento de dos dados. El resultado del primero de
ellos se denotará por d1 y el resultado del segundo por d2 . La probabilidad
de que la suma sea 3 está dada por:
2 1
P (d1 + d2 = 3) = 36
= 18
1
P (d1 + d2 = 3 sabiendo que d2 = 2) = 6
↓ Dado 1 = 2
54
hacer el cálculo.
1
P (d1 +d2 =3∩d1 =2) 1
P (d1 + d2 = 3/d1 = 2) = P (d1 =2)
= 36
1 = 6
6
P (A/B) = P (A)
P (A ∩ B) = P (A) × P (B)
55
Ejemplo
Consideremos el lanzamiento de dos dados y los siguientes eventos: A1 =
”el resultado del primer dado es dos y A2 = “el resultado del segundo es
tres”. La probabilidad marginal de cada uno de ellos es:
1 1
P (A1 ) = P (d1 = 2) = 6
P (A2 ) = P (d2 = 3) = 6
1
P (A1 ∩ A2 ) = 36
A1 A2 A1 ∩ A2
Ejemplo
Consideremos el lanzamiento de dos dados y los siguientes eventos: B1 =
”el resultado del primer dado es dos” y B2 = ”la suma de los resultados de
los dos dados es cinco”. La probabilidad marginal de cada uno de ellos es:
1 4 1
P (B1 ) = P (d1 = 2) = 6
P (B2 ) = P (d1 + d2 = 5) = 36
= 9
1
P (B1 ∩ B2 ) = 36
56
B1 B2 B1 ∩ B2
57
de elementos.
V(n,r) = nr
Ejemplo
Si lanzamos una moneda al aire hay dos resultados posibles (n = 2), cara o
ceca. Si lanzamos 2 veces consecutivas una moneda (n = 2), los resultados
posibles son V(2;2) = 22 = 4
58
Ejemplo
En los ejemplos anteriores hemos visto que si lanzamos 2 veces un dado,
hay 36 resultados posibles si se tienen en cuenta el orden en que ocurren los
números (es decir, un 6 y un 1 no es lo mismo que un 1 y un 6). Esta
cantidad no es ni más ni menos que las variaciones de 6 tomados de 2 en 2:
V(6;2) = 62 = 36
n1 × n2 × ... × nr
Ejemplo
Si se lanza una moneda (n1 = 2) y un dado (n2 = 6), la cantidad de
resultados posibles es:
2 × 6 = 12
Ejemplo
Si se lanza una moneda (n1 = 2), dos dados (n2 = n3 = 6) y se extrae
una carta de una baraja española (n4 = 40), la cantidad de resultados
posibles es:
2 × 6 × 6 × 40 = 2.880
59
eventos, una vez que suceden, no vuelven a ocurrir. Es decir que, con cada
repetición del experimento, el número de eventos posibles disminuye en uno
respecto de los posibles casos del experimento anterior. Por lo tanto:
n1 = n; n2 = n − 1; n3 = n − 2;...nr = n − (r − 1)
n!
V Rn,r = n × (n − 1) × (n − 2) × ... × (n − (r − 1)) = (n−r)!
Ejemplo
Si se toma un mazo de barajas españolas (40 cartas) y quiere saberse la
cantidad de maneras posibles que existe de tomar dos cartas diferentes
(considerando importante el orden en el cual sean seleccionamos las
mismas). Debe tenerse en cuenta que, una vez tomada una carta del mazo
original, la misma ya no formará parte de él. El cálculo intuitivo de la
cantidad de posibilidades en este caso no es sencillo. Sin embargo, podemos
realizar el cálculo deseado utilizando la fórmula de variaciones sin
repetición con n = 40 y r = 2 , obteniendo un total de ¡1560 combinaciones
posibles!:
40! 40!
V R40,2 = (40−2)!
= 38!
= 1560
60
Si se poseen n elementos, la cantidad de maneras de ordenarlos es:
n! = n × (n − 1) × (n − 2) × ... × 2 × 1
n!
V Rn;n = (n−n)!=n!
Ejemplo
Puede considerarse, a modo de ejemplo, el caso en el cual cinco
deportistas deban realizar una prueba. El orden en el cual cada uno de ellos
la efectúe depende de un sorteo el cual consiste en retirar de una urna el
nombre de cada uno de ellos. La cantidad de maneras de ordenar a estos
deportistas es entonces 120 y está dado por: 5! = 5 × 4 × 3 × 2 × 1 = 120
n!
Pn;r = V R(n;r) = (n−r)!
Ejemplo
Continuando con el ejemplo anterior, podrı́a darse el caso en que el
primer dı́a realicen la prueba sólo tres de los cinco deportistas. ¿Cuántas
alternativas distintas de deportistas seleccionados y orden en el que se
realizarán las pruebas existen? Este cálculo equivale a determinar la
permutación de 5 elementos (los deportistas) tomados de a 3 (tres):
61
5!
P(5;3) = (5−3)!
= 60
3.3.2 Combinatorias
Según hemos hecho referencia en el párrafo anterior, hay casos en los
cuales no resulta relevante el orden en el cual se dan los resultados, sino
cuáles son esos resultados en sı́. Por ejemplo, en el caso en que lancemos un
dado dos veces de manera tal que avancemos en un juego tantos casilleros
como indica la suma de ellos, el orden de los resultados no resultará
relevante: si obtenemos un 5 y luego un 2 significará lo mismo que obtener
un 2 y luego un 5; en ambos casos avanzaremos 7 casilleros. Cuando
trabajamos con variaciones o permutaciones, el orden resulta relevante: por
ejemplo, en el caso en que en el juego en cuestión deban cumplirse las
”prendas” relativas al casillero al cual nos lleve el primer dado.
n!
Cn;r = (n−r)!r!
Ejemplo
Si se considera el ejemplo anterior, con la combinatoria puede calcularse
cuántos grupos de deportistas distintos realizarı́an la prueba el primer dı́a
de la competición. En esta situación no resulta relevante el orden en el que
62
participarán los tres deportistas seleccionados sino cuáles son los mismos.
La cantidad de grupos distintos que deberán realizar la prueba el primer dı́a
es la combinatoria de cinco elementos tomados de a 3:
5!
C(5;3) = (5−3)!3!
= 10
Es decir, que hay diez grupos distintos de tres deportistas que debieran
realizar la prueba el primer dı́a.
Ejemplo
Dado un grupo de cien lamparitas, quince de ellas resultan ser
defectuosas. ¿Cuál es la probabilidad de que, tomando dos lamparitas al
azar, las dos resulten ser defectuosas? Lo primero que debemos calcular, de
acuerdo a la definición clásica, es la cantidad de eventos posibles: es decir,
cuántos conjuntos de dos lamparitas pueden formarse. En este caso,
tomamos dos lamparitas ( r = 2) de entre cien (n = 100):
100!
Casosposibles = C(100;2) = 98!2!
= 4950
15!
Casosf avorables = C(15;2) = 13!2!
= 105
105
4950
= 0, 021
63
Si se consideran r elementos de un conjunto de n , la cantidad de
muestras distintas que pueden obtenerse (sin importar el orden) en
caso de que la obtención de un resultado no invalide nuevamente
su ocurrencia es:
(n+r−1)!
CRn;r = (n−1)!r!
Ejemplo
Si se considera la cantidad de combinaciones posibles que surgen de dos
lanzamientos de un dado, independientemente del orden, los resultados que
serán distintos son los sombreados con gris en el cuadro siguiente, es decir,
21 combinaciones diferentes.
64
Evento A a partir de su intersección con una partición del espacio
muestral.
Ejemplo
Consideremos una bolsa con cubitos y bolitas de madera de dos colores (rojo
y verde). Se sabe que el 20% de las piezas rojas son bolitas, es
decir,P (b/r) = 0, 2 y el 40% de las verdes son bolitas, es decir,
65
P (b/v) = 0, 4 . Además, se conoce que el 70% de las piezas son rojas
(P (r) = 0, 7 ).
P (b) = P (r ∩ b) + P (v ∩ b)
P (b) = 0, 7 × 0, 2 + 0, 3 × 0, 4
P (b) = 0, 26
Ejemplo
Consideremos el ejemplo anterior. Si en total hay 250 piezas en la bolsa,
tendremos que 175 (70% de 250) son rojas y 75 (30% de 250) son verdes.
De las piezas rojas, 35 son bolitas (20% de 175); mientras que de las
verdes, 30 son bolitas (40% de 75). Esto nos da un total de 65 bolitas sobre
las 250 piezas, es decir que:
65
P (b) = 250
= 0, 26
66
Dado un evento A y n eventos mutuamente excluyentes y
colectivamente exhaustivos B1 , B2 , ...., Bn entonces la probabilidad
de cualquiera de los eventos Bj condicionado al evento A puede
calcularse como:
Ejemplo
En un centro médico especializado en problemas respiratorios, el 80% de los
fumadores que se fueron a atender resultó tener cáncer, mientras que de los
no fumadores atendidos sólo el 10% tenı́a cáncer. Se sabe, además, que el
60% de los pacientes no son fumadores. ¿Cuál es la probabilidad de que un
paciente con cáncer sea fumador?
67
h: Cantidad de categorı́as de la variable.
P
denota la sumatoria de un conjunto de valores.
68