Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONCEPTO E IMPORTANCIA
DE LA ESTADÍSTICA INFERENCIAL,
DISTRIBUCIONES DE PROBABILIDAD
ASOCIADAS A VARIABLES ALEATORIAS
CONTINUAS
8 Muestreo y estimación................................................................ 42
Variables Las variables son características que pueden cambiar de una unidad
muestral a otra, como la edad de las personas, la población de cada
ciudad, el porcentaje de alumnos reprobados de una escuela, la
preferencia de una comida balanceada para un animal, la intensidad
de emisión de rayos X de cada televisor, la capacidad de
almacenamiento de un disco rígido, la longitud de un tornillo, la
duración o el consumo de una lamparita.
Población Para cualquier pregunta que interese responder, primero es
necesario dirigir la atención a un grupo particular de unidades
muestrales: personas, ciudades, animales, televisores, tornillos o
lamparitas.
¿Qué piensan los porteños sobre el Sistema de Evaluación
Permanente de Conductores? ¿Qué porcentaje de familias
de la ciudad de Manta tienen mascotas?
¿Cuál es la expectativa de vida de los diabéticos?
¿Qué porcentaje de todos los tubos de pasta dentífrica son
llenados de acuerdo a sus especificaciones?
¿Cuál es la duración promedio de las lámparas de bajo
consumo de una determinada marca?
¿Los jóvenes deportistas consumen menos alcohol que los
sedentarios
En cada uno de los ejemplos, se plantea una pregunta y se puede
identificar uno o más grupos específicos de unidades que interesa
estudiar: los porteños (habitantes de la ciudad de Buenos Aires), las
familias de la ciudad de Santa Fe, los diabéticos, los tubos de pasta
dentífrica, las lámparas de bajo consumo, los deportistas y los
sedentarios.
Se llama población a todo el grupo de unidades muestrales
(generalmente son individuos) que interesa estudiar con el fin de
responder una pregunta de investigación. Las poblaciones, sin
embargo, pueden ser difíciles de definir. En un buen estudio, los
investigadores deben definir la población con toda claridad.
Muestra ¿Qué hacemos para probar la sopa? Revolvemos la olla con una
cuchara, sacamos una porción -una muestra- la saboreamos y
sacamos una conclusión sobre toda la sopa de la olla sin haber en
realidad probado toda. Si la muestra ha sido tomada
4
Variables cualitativas
4 Variables Aleatorias
Frente al concepto de variable estadística, el concepto de variable
7
Página
10
Página
La siguiente tabla resume algunos de los conceptos planteados hasta ahora
en función de que hagan referencia a una muestra o a una población:
que = 11,83:
13
Página
El numerador de la expresión es la suma del cuadrado de las seis
desviaciones de cada valor que toma la variable, respecto a su media
aritmética, que es igual a 14,8334, que dividido por 6 es justamente 2,4722.
Su fórmula es: 15
16
Página
6.2.1 Simétrica
Una distribución es simétrica cuando sus dos mitades son imágenes
especulares una de la otra.
Por ejemplo, un histograma de las alturas de los mayores de 18 años de un
pueblo tendrá dos zonas más altas en espejo, una para los varones y otro
para las mujeres, mientras haya la misma cantidad de varones y mujeres.
Esto se debe a la superposición de dos curvas simétricas con distinto centro
e igual ancho.
6.2.5 Uniforme
22
Página
Las frecuencias de la última cifra de los resultados de una lotería muestran
una distribución pareja sobre todos los dígitos de 0 a 9. Si el mecanismo que
genera los números de la lotería funciona correctamente, ninguno de los
dígitos tiene más chances de aparecer. Este tipo de distribuciones se llama
uniforme y se representa mediante una recta:
23
Página
7 Distribución Normal a Probabilidades con variables
aleatorias discretas
7.1 Variables aleatorias discretas
Una variable aleatoria se dirá discreta si el conjunto de valores que
toma es un conjunto numerable, es decir, que solo puede tomar unos valores
concretos. Dicho conjunto lo denotaremos por: {x1, x2, x3,...., xk}
24
Página
Ejemplo 2: Obtener la función de probabilidad de la variable
"número de caras obtenidas al lanzar tres monedas"
= 3 - 2.25 = 0.75
8 Medidas resumen
Media, mediana, rango, desvío estándar, distancia intercuartil
valor central y la dispersión alrededor de ese valor. Vemos esta idea en los
siguientes histogramas hipotéticos:
Supongamos que tenemos un conjunto con n observaciones (datos), los
representamos así: x1, x2, x3, ..., xn
Se leen equis uno, equis dos, ..., equis ene y se pueden representar en una
tabla:
Veremos con detalle las dos formas principales para obtener un valor central
o promedio:
La media: Se obtiene sumando todos los valores del conjunto de datos y
dividiendo la suma por la cantidad de datos en ese conjunto.
8.1.1 La media
La media se representa por 𝑥̅ (equis raya o equis barra). Se obtiene
sumando todos los datos y dividiendo por la cantidad total n de
observaciones,
8.1.2 La mediana
La mediana es otro tipo de centro. Es el punto central de los datos,
como la línea central que divide el campo de juego de fútbol en dos partes
iguales.
29
Página
Para las cuadras que caminan por día las cinco personas elegidas al azar, el
valor central, la mediana, es 15. Quedan dos datos a cada lado de la mediana.
En este ejemplo, la media coincide con la mediana, pero puede no ocurrir.
Si la cantidad de datos es par (4, 15, 8, 17) no hay una observación central,
sino un par de observaciones centrales (8 y 15). La mediana (11,6) es el
promedio de estos dos valores.
Otro conjunto de alumnos con mediana igual a 58kg podría tener pesos
diferentes y los datos estarían más dispersos.
Además de conocer el punto central de un conjunto de datos, también nos
interesa describir su dispersión, es decir cuán lejos tienden a estar los datos
de su centro.
La variabilidad está presente en todos los conjuntos de datos. Sea cual fuere
la característica, es casi imposible que dos mediciones sean idénticas. Esto
se debe a que:
La figura representa a los siguientes conjuntos de datos {1,0 4,2 4,5 4,7 4,9
5,0 5,3 5,5 5,7 5,9 6,110,0 } y {1,0 2,9 3,5 4,0 4,7 5,9 6,4 6,9 7,7 8,4 8,9
10,0}. La mayoría de los valores del primer conjunto están más
concentrados que la mayoría del segundo conjunto pero tienen el mismo
rango. El rango en este caso no distingue dos conjuntos de datos con
diferentes dispersiones.
Mínimo C1 M C3 Máximo
Los cinco números resumen de los pesos de los alumnos de 4to. año
Página
son:
El 50% de los alumnos tiene un peso entre 51 y 67 kg.
Los cuartiles forman los bordes de la caja y la mediana está dentro de la caja.
Dos líneas - los brazos- se extienden, una desde cada borde de la caja, hasta
el dato con valor máximo y mínimo respectivamente, mientras no sean
valores atípicos (es decir, se encuentren dentro de 1,5 DIC).
36
Página
Cuanto más grande es la varianza muestral, más dispersos están los datos.
Una medida de dispersión debe tener las mismas unidades que los datos.
1. carne vacuna,
2. mezcla (carne porcina, vacuna y de pollo)
3. pollo
muy poco.
Página
Comparemos la cantidad de calorías entre los tres tipos de salchichas
utilizando gráficos caja. Recordemos que están basados en los números
resumen:
39
Página
40
Página
Tanto el diagrama tallo hoja como el histograma revelan la presencia
de dos grupos:
sí agregan mucho.
El significado de las medidas resumen está atado a la forma de la
distribución de los datos. Esto tiene especial importancia con el desvío
estándar pues se utiliza muchísimo en las descripciones de los datos.
9 Muestreo y estimación
El muestreo es una herramienta de la investigación científica. Su
función básica es determinar qué parte de una realidad en estudio
(población o universo) debe examinarse con la finalidad de hacer
inferencias sobre dicha población. Al muestrear se reducen los costos, los
gastos de recogida en recursos humanos, materiales y económicos y los de
tratamiento de los datos serán menores, se logra mayor rapidez.
Por ejemplo:
Página
Por ejemplo:
evaluaciones.
Es importante hacer notar que en este caso los criterios de selección
pueden variar de experto a experto, al determinar cuáles son las unidades
de muestreo representativas de la población
Por ejemplo:
48
Página
¿Cuál es el parámetro poblacional que nos interesa estudiar en esta
población?
¿Qué resultado muestral nos proporciona la muestra extraída acerca
de este parámetro?
¿Se parece al poblacional?
Solución
P = 7/20 = 0,35
Ejemplo:
Universidad
Curso
Género
Y otros, pero la especialidad es fundamental, pues es un factor muy
determinante de la intención emprendedora. Si al diseñar una muestra
representativa de la población para un estudio cualquiera no se tiene en
cuenta la existencia de estratos, podríamos obtener como resultado lo que
se conoce como una muestra sesgada.
Ejemplo:
Siendo:
Ejemplo:
Ejemplo:
Otros casos típicos son los que se diseñan para analizar los gastos
58
Ejemplo:
Donde:
Solución
2. Si no conocemos la varianza:
63
En este caso:
Por ejemplo:
Ejercicio
Se sabe que hace dos años un estudio similar dio un valor del 25% de
los clientes de la zona.
Solución
Sabemos que p = 0,25. Sabemos que 1-α = 0,95, por lo que los valores
66
de z son ±1,96. Sabemos que el error máximo que se quiere cometer es del
Página
5%, por lo que d = 5/100 = 0,05 (recordad que el error siempre se pone en
la fórmula en tanto por uno en el caso de estimación de proporciones)
Por consiguiente:
Ejercicio 1
Solución 1
Como se trata de estimar una media poblacional para una población finita,
aplicamos:
Ejercicio 2
Ejercicio
Solución
satisfacción
Para este cálculo, deciden aplicar un nivel de confianza del 95% y un
error muestral de ±0,5 puntos en la escala de 9. Como no se conoce la
desviación estándar, se decide aplicar una de 3 puntos, en base a la
experiencia de otros estudios de satisfacción de clientes, pues, aunque
pueda haber algún caso extremo de puntuación baja o alta, la mayoría de
clientes suele estar más satisfecho que insatisfecho, a menos que una
empresa lo haga muy mal, cosa que no parece aplicable al caso de la empresa
de reciclaje.
realmente sería necesario para estimar una proporción. Sin embargo, como
empresa de trabajo de campo o profesionales, siempre deberemos hacer lo
Página
Ejemplo:
75
Página