Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadı́stica y Probabilidad
Profesor
Carlos Gaviria.
Facultad de Ingenierı́as.
Área de Formación en Ciencias Básicas.
Universidad de San Buenaventura.
Semestre 2019-1
Ideas Generales
Estadı́stica
La estadı́stica surge como ciencia en los siglos XV I-XV II con la introducción del
cálculo de probabilidades, que es la base de la estadı́stica matemática. Si bien la
estadı́stica maneja un lenguaje matemático, sus aplicaciones pueden extenderse a
la sociologı́a, la psicologı́a, la demografı́a, la biologı́a, la fı́sica, la medicina, entre
otras, de hecho, donde se tienen datos hay estadı́stica. Se tiene entonces la
existencia de la estadı́stica teórica y la estadı́stica aplicada.
1 La estadı́stica teórica o también conocida como estadı́stica matemática es la
disciplina que se encarga de estudiar de manera teórica las leyes del
comportamiento de los fenómenos aleatorios, las extiende y las utiliza para
hacer una inferencia de los resultados. El fundamento de la estadı́stica
matemática es la teorı́a de probabilidad.
2 La estadı́stica aplicada tiene como objetivo estudiar el comportamiento de
una o más caracterı́sticas de los objetos de una población. Es ası́ como
caracterı́sticas tales como: el peso, la estatura, tiempo de falla de algún tipo
de componente electrónico, tiempo de vida de un paciente con alguna
enfermedad terminal, ruido en un barrio, el color del cabello de los niños de
cierta comunidad, entre otras, son de interés para un investigador.
Ideas Generales
Observación
La estadı́stica aplicada toma como base argumentativa la estadı́stica teórica y de
esta manera proporciona métodos y técnicas para:
1 Recoger y organizar datos que provienen de las observaciones de ciertas
caracterı́sticas asociadas a los objetos de las poblaciones.
2 Esquematizar el comportamiento de las poblaciones, con relación a
determinadas caracterı́sticas asociadas a sus objetos, mediante tablas, gráficas
o dibujos.
3 Resumir la información obtenida a partir de las observaciones mediante
algunos datos que son representativos.
4 Analizar la relación de dependencia entre los objetos de la misma población.
5 Predecir el comportamiento de una población o un conjunto de poblaciones a
partir de un subconjunto representativo de objetos de la población.
6 Resumir las poblaciones mediante algunos números representativos, llamados
parámetros.
7 Evaluar las estimaciones de los parámetros poblaciones a partir de funciones
de los datos muestrales.
8 Estudiar la fiabiliadad y validez de hipótesis estadı́sticas.
Ideas Generales
Definición. Población.
Una población P se entiende como un conjunto de elementos u objetos de interés
sobre el cual se realizan las observaciones. Dado que los objetos o cosas cuentan
con una cantidad finita o infinita de proyecciones, se entiende una población como
una caracterı́stica asociada a los objetos que pertenecen a P.
Ideas Generales
Ideas Generales
Ideas Generales
Definición. Muestra
Dada una población de interés P, una muestra M es un subconjunto
representativo de la población.
Ideas Generales
Se puede pensar en que en cada uno de los casos del ejemplo anterior el interés
principal se centra en estudiar, por ejemplo, las siguientes caracterı́sticas.
1 El nivel de estudios de una persona con nacionalidad colombiana ó el peso de
una persona con nacionalidad colombiana.
2 La precipitación en un punto (x, y) del territorio colombiano o la cantidad de
epı́fitas presentes en un árbol ubicado en un punto (x, y) de dicho territorio.
3 El tiempo de falla de un televisor cualquiera.
4 El ruido presente en un punto de coordenadas (x, y) sobre la región R.
5 El diámetro a la altura del pecho de árboles de determinada especie.
6 El tiempo de supervivencia de un enfermo sometido a un tratamiento
particular.
7 El tiempo que tarda una persona sometida a un régimen de ejercicio y
alimentación en alcanzar un ı́ndice de masa corporal.
8 El tiempo que tarda un estudiante en desertar de la universidad. En éste caso
también se estudian múltiples variables demográficas y socio económicas que
se relacionan con dicha deserción.
9 Niveles de emisión de presión sonora emitidos por las motocicletas con las
cualidades descritas.
10 El tiempo que tarda una persona con problemas de adicción y sometida a un
tratamiento particular, en volver a reincidir.
Ideas Generales
Definición. Variable.
Las caracterı́sticas asociadas a los objetos de una población, reciben el nombre de
variable. Las variables se clasifican en:
1 Cualitativas. Es una caracterı́stica que no es susceptible de medida y
describe un atributo o cualidad de los objetos de la población. La intención de
las variables cualitativas es clasificar los objetos de la población en categorı́as.
Las variables cualitativas se clasifican en nominales y ordinales. La diferencia
entre las variables cualitativas nominales y ordinales es que en las variables
ordinales existe un orden establecido en las categorı́as, mientras que en las
variables nominales no hay un orden establecido en las categorı́as.
2 Cuantitativas. Es una caracterı́stica que es susceptible de medida, esto es,
son caracterı́sticas de los objetos de la población que se pueden medir con un
número. Las variables cuantitativas se clasifican en discretas y continuas. Una
variable se dice discreta si el conjunto de todos los posibles valores que toma
es un conjunto finito o contablemente infinito. Una variable se dice continua si
el conjunto de todos los posibles valores que toma es un intervalo continuo de
los reales R.
Ideas Generales
Si se consideran de nuevo los anteriores ejemplos, se tiene que:
1 x: Nivel de estudios de una persona con nacionalidad colombiana, es una
Ideas Generales
Definición. Parámetro.
Un parámetro es un valor numérico θ que resume una población P. Un parámetro
es una caracterı́stica de la población.
Observación.
A partir de la definición anterior se tiene que cuando se hace el estudio de una
población en particular, lo que se pretende en principio es hacer una estimación de
los parámetros que la resumen. Existen poblaciones con un solo parámetro,
poblaciones con dos parámetros, en general, poblaciones con k parámetros. Debe
existir un vı́nculo entre las muestras y la población de manera que se logren
estimaciones adecuadas de dichos parámetros a partir de los datos muestrales. Es
lógico pensar que existen valores numéricos que resumen una muestra y que
además dichos valores representativos, son el vinculo entre las muestras y las
poblaciones para estimar los parámetros.
Definición. Estadı́stico
Un estadı́stico es una valor numérico que resume una muestra. Por otro lado, un
estadı́stico es una función de los datos muestrales.
Ideas Generales
Ideas Generales
Ejemplo
Considere lanzar al aire una moneda una sola vez con la intención de determinar
que cae. Para este experimento claramente se tiene que:
1 Se puede replicar las veces que se desee, bajo condiciones análogas y de
manera independiente, esto es, que caiga cara en un lanzamiento no implica
que caiga cara el siguiente lanzamiento.
2 El conjunto de todos los resultados posibles es el conjunto {C, S}, donde C
representa caer cara y S representa caer sello.
3 Cuando se lanza una moneda al aire no se puede afirmar con certeza que
caerá cara C o sello S.
Ideas Generales
Ejemplo
Considere lanzar al aire tres monedas simultaneamente y determinar que caen. Se
tiene que esta acción satisface las tres condiciones de experimento aleatorio donde
el conjunto de todos los posibles resultados es el conjunto:
Ideas Generales
Ejemplo
Considere lanzar al aire tres monedas, una a la vez, y determinar si caen cara o
sello. Al igual que en los dos ejemplos anteriores, esta acción satisface las tres
condiciones de experimento aleatorio donde el conjunto de todos los posibles
resultados, es el conjunto:
Ideas Generales
Ejemplo
Suponga que se tienen un dado y una moneda. Primero se lanza el dado al aire y
se observa que cae en la cara superior. Si el dado cae en un número impar
entonces se lanza la moneda y se determina que cae. si el dado cae en un número
par en la cara superior entonces se lanza nuevamente el dado. El conjunto de
todos los posibles resultados de este experimento aleatorio, es el conjunto:
{(x, y) : x ∈ {1, 3, 5}, y ∈ {C, S}} ∪ {(x, y) : x ∈ {2, 4, 6}, y ∈ {1, · · · , 6}}.
Ideas Generales
Ejemplo
Suponga que un restaurante de menú ejecutivo ofrece a su clientes los siguientes
ingredientes:
1 A = {Res, Cerdo, Pollo}.
2 B = {Frijoles, Sopa}.
3 C = {Arroz, Pastas}
4 D = {Limonada, Mazamorra}.
5 E = {Torta, Bocadillo}.
La condición en el momento de elegir el menú, es que el cliente debe elegir un
ingrediente y sólo un ingrediente de los conjuntos A, B, C y D, respectivamente.
El experimento consiste en elegir un cliente al azar y determinar que elige.
Claramente esta acción representa un experimento aleatorio, donde el conjunto de
todos los posibles resultados, es el conjunto:
{(x1 , x2 , x3 , x4 , x5 ) : x1 ∈ A, x2 ∈ B, x3 ∈ C, x4 ∈ D, x5 ∈ E}.
Un posible resultado de este experimento aleatorio, es el resultado
(Res, Frijoles, Arroz, Mazamorra, Bocadillo) y no se puede afirmar a priori que un
cliente lo elija.
Ideas Generales
Ejemplo
La Universidad de San Buenaventura ofrece un curso de estadı́stica 1 a los
estudiantes de la facultad de ingenierı́a. Considere que se lleva a cabo la primera
evaluación parcial de dicho curso y el interés se concentra en determinar el tiempo
que un estudiante elegido al azar gasta en desarrollar dicha prueba. En este
experimento aleatorio el conjunto de todos los posibles resultados es el intervalo
[0, tmáx ], donde tmáx denota el tiempo máximo que tiene el estudiante para
desarrollar la prueba.
Ideas Generales
Ejemplo
Considere una región R de la Universidad de San Buenaventura, sede Medellı́n.
Un estudiante de ingenierı́a de sonido selecciona al azar un punto (x, y) de dicha
región y desea medir el nivel de presión sonora presente en dicho punto.
Se sabe de la fı́sica que la presión atmosférica es constante. El experimento
aleatorio consiste en perturbar el medio y la perturbación genera variaciones de
presión sobre la presión atmosférica que son conocidas como sonido. Dichas
perturbaciones pueden ser causadas por ejemplo por la caı́da de un alfiler, que en
teorı́a no generarı́a mucha variación, hasta el despegue de un cohete u otro suceso
que generarı́a en teorı́a una variación mucho mayor. De esta manera se tiene una
acción tal que:
1 Se puede replicar de manera independiente e infinitas veces pues se parte del
hecho de que la presión atmosférica es constante.
2 Como se mencionó arriba, se conoce la gama de todos los posibles resultados.
3 No se puede afirmar con certeza la ocurrencia de un resultado en particular.
Ideas Generales
Ejemplo
Considere un bosque de Colombia que puede ser representado geométricamente
por una región R. Suponga que un estudiante de ingenierı́a ambiental de la
Universidad de San Buenaventura elige un punto (x, y) de dicha región y observa
la cantidad de epı́fitas presentes en un árbol de una especie de su interés. En este
caso el conjunto de todos los posibles resultados es el conjunto de números enteros
que empiezan en cero y alcanzan un máximo según el contexto.
Ideas Generales
Ejemplo
Suponga que se tienen 4 focos de 40W , 5 de 60W y 6 de 75W . El experimento
aleatorio consiste en elegir focos uno por uno hasta elegir uno de 75W . El
conjunto de todos los posibles resultados de este experimento aleatorio es un
conjunto formado por 1-tuplas, 2-tuplas, · · · y 10-tuplas, donde la última
componente de una k-tupla elegida al azar es un bombillo de 75W .
Ejemplo
Suponga que se tienen dos cajas, una con 8 pelotas verdes y 2 rojas y la otra con 6
pelotas rojas y 4 verdes. Se elige una pelota al azar de la primera caja y se coloca
en la segunda. Luego se elige una pelota al azar de la segunda caja y se coloca en
la primera. El experimento consiste en determinar cual es la configuración final de
pelotas en las dos cajas. De esta manera el conjunto de resultados en este
experimento es el conjunto de todas las posibles configuraciones finales de pelotas
en las dos cajas. Claramente la configuración final puede o no cambiar.