Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE CIENCIAS
ADMINISTRATIVAS Y CONTABLES
Y
FACULTAD DE CIENCIAS DE LA
INFORMÁTICA
Material Elaborado
Para la Cátedra de:
ESTADÍSTICA I
Introducción
Iniciamos este material con la definición de algunos conceptos elementales y básicos, si
embargo, pilares fundamentales para la comprensión intuitiva y real de la estadística.
Con este material pretendo introducir al estudiante en los primeros pasos sobre el uso y
manejo de datos numéricos, los gráficos estadísticos: concepto, característica, clasificación y
uso correcto e incorrecto; siguiendo con la organización de datos y posterior análisis. La
probabilidad: su concepto, definición, clasificación, cálculo e importancia en la actualidad son
temas que también se abordan.
¿Qué es la estadística?
5) La parte de la estadística que sólo se ocupa de describir y analizar un grupo dado, sin
sacar conclusiones sobre un grupo mayor, se denomina estadística descriptiva o
deductiva. Sin embargo la fase de la estadística que trata con las condiciones bajo las
cuales tal diferencia es válida se llama estadística inductiva o inferencia estadística.
Ejercicios:
2) Talla de camisetas.
5) Calidad de un producto.
6) Días de la semana.
GRÁFICOS ESTADÍSTICOS
a) Ser sencillo.
b) Ser autoexplicativo.
Existen muchos tipos de gráficos que aparecen en estadística, según la naturaleza de los datos
involucrados y el propósito entre ellos están los gráficos en barras, circulares, trazos, etc.
Gráfico en barra: pueden estar representados en forma vertical u horizontal, el ancho debe ser
constante y puede elegirse cualquier tamaño con tal que las barras no se superpongan. Puede
haber variaciones de las barra, como las barras agrupadas o compuestas.
Barras Horizontales
Barras Verticales
Plantacione
s Superficie (Millones de Hectáreas)
Soja 35
Maiz 15
Algodón 25
Trigo 30
Otros 4,5
Gráfico lineal o trazos: muestras tendencias y como varían los valores de los datos a través del
tiempo. Se recomienda utilizar dos o tres líneas como máximo en un mismo plano para evitar
confusiones, se deben presentar cada línea con diferentes colores.
Plantacione
s Superficie (Millones de Hectáreas)
Soja 35
Maiz 15
Algodón 25
Trigo 30
Poroto 0,3
Arveja 0,1
Mandioca 1,2
Tomate 0,8
Locote 0,6
Ejercicios:
1) Según los registros históricos de una empresa, las ganancias anuales de los últimos
cinco años son:
2) Los datos en relación a la población mundial en un año específico en los países más
poblados están en la siguiente tabla:
DISTRIBUCIÓN DE FRECUENCIAS
Ejemplo: Tiempo que un cliente tarda en la fila en ser atendido en una caja de
supermercado.
3) Distribución de Frecuencias:
Al resumir grandes colecciones de datos, es útil distribuirlos en clase o
categorías y determinar el número de individua que pertenece a cada clase, llamado
frecuencia de clase. Una disposición tabular de los datos por clases junto a las
correspondientes frecuencias de clase, se llama distribución de frecuencias (o tabla de
frecuencias). Por ejemplo la tabla siguiente es una tabla de distribución de frecuencia
de los puntajes en un examen de 50 alumnos/as de una universidad.
Número de
Puntaje
Alumnos/as
21 - 25 5
26 - 30 10
31 - 35 21
36 - 40 9
41 - 45 5
Si se dan edades con una cierta precisión en un intervalo de clase 60-65 años
incluye teóricamente todas las edades 59,5 y 65,5 años. Estos números indicados, se
llaman frontera de clase (59,5) es la frontera inferior de clase y (65,5) es frontera
superior de clase.
Ejercicios
I) Los salarios mensuales (dólares) de 33 trabajadores de una empresa, son
las siguientes:
412 320 251 322 450 550 250 452 532 333
250 345 476 333 251 354 350 454 267 350
445 367 440 371 461 365 341 410 450 370
1.738 1.729 1.743 1.740 1.736 1.741 1.735 1.731 1.726 1.737
1.728 1.737 1.736 1.735 1.724 1.733 1.742 1.736 1.739 1.735
1.745 1.736 1.742 1.740 1.728 1.738 1.725 1.733 1.734 1.732
1.733 1.730 1.732 1.730 1.739 1.734 1.738 1.739 1.727 1.735
1.735 1.732 1.735 1.727 1.734 1.732 1.736 1.741 1.736 1.744
1.732 1.737 1.731 1.746 1.735 1.735 1.729 1.734 1.730 1.740
Ejemplo: Una distribución de frecuencia de los salarios semanales de 100 trabajadores por
nivel de ingresos:
25
20
15
Histograma de Frecuencia
10
5
Universidad Privada del Este Ciudad del Este
0
X
289,5
269,5
309,5
349,5
249,5
329,5
Lic. Gilberto Carbajal Cardozo Estadística I
Ojiva
Frecuencia Acumulada
105
90
75
60
45
30
15
0
259,5
299,5
279,5
239,5
319,5
339,5
359,5
Menor que:
Ejercicios
Determine:
a) El límite real de cada clase.
b) El límite superior de la cuarta categoría.
c) La marca de cada clase.
d) Representar los datos en un histograma de frecuencias.
270 - 289 10
290 - 309 16
310 - 329 14
330 – 349 10
350 - 369 5
370 - 390 2
Determine:
a) La marca de cada clase.
b) Representar los datos en un histograma de frecuencias.
Se definen varios tipos, siendo algunos la media aritmética, la mediana, la moda, la media
geométrica, la media cuadrática y la media armónica. Cada una tiene ventajas y desventajas,
según los datos y el objetivo perseguido.
aritmética es:
Las ventajas que tienen son: fácil de calcular y de interpretar, siempre existe y es único para un
conjunto de datos. Sin embargo tiene una desventaja de que si los datos de los extremos son
desproporcionados con respecto al resto, el resultado se aleja de la realidad.
Se puede definir a la mediana como el valor que divide a una distribución, de modo que quede
a ambos lados con un número igual de datos.
La moda de un conjunto de números es el valor que ocurre con mayor frecuencia; es decir, el
valor más frecuente. La moda puede no existir, incluso no ser única en caso de existir. La moda
no tienen otras propiedades matemáticas valiosas para usarlas en otros cálculos.
Medidas de Posición
Las medidas de posición son los valores de la distribución que dividen en partes iguales, es
decir, en intervalos que comprenden un mismo número de valores. Cuando la distribución
contiene un número alto de intervalos y se requiere un promedio de una parte de ella, se
puede dividir la distribución en cuatro, diez y cien partes iguales. Los más usados son los
cuartiles que divide a los datos en cuatro partes iguales , cada parte abarca 25% de
los datos; deciles que divide a los datos en diez partes iguales , en donde cada
decil abarca 10% y percentiles que divide en cien partes iguales y cada parte
Ejercicios:
3) Una concesionaria de autos reporta las siguientes ventas mensuales 15, 25, 17, 20, 22,
19, 22, 15, 22, 30, 17, 23. Calcular
a) La media aritmética.
b) La moda.
c) La mediana.
d) El primer cuartil.
e) El octavo decil.
f) El percentil 75.
Datos Agrupados
La Media Aritmética
La Mediana
; donde
La Moda
; donde
Cuartiles
; donde
es la suma de la frecuencia.
Deciles
; donde
es la suma de la frecuencia.
Percentiles
; donde
es la suma de la frecuencia.
Ejercicios:
Determine:
a) La frontera superior de la segunda clase.
Determine:
a) La media aritmética.
La dispersión indica el grado de alejamiento que tienen los diferentes valores con respecto a la
media aritmética. Un menor grado de dispersión indica que los datos están más agrupados
alrededor de la media que otra serie de datos con mayor dispersión.
Las principales medidas de dispersión son: el rango, la varianza, la desviación típica o estándar,
la desviación media, el coeficiente de variación, etc.
Rango
Es la diferencia entre el valor más alto y el menor de todo el conjunto de datos considerado.
Pese a que tiene la evidente ventaja de la facilidad de calcular y de interpretar no ofrece una
medida útil de desviación en una gamma muy grande de problemas estadísticos. Como se
consideran solo los valores extremos no nos dice nada sobre los datos que quedan entre los
extremos. Se utiliza generalmente en situaciones en que se quiere una visión rápida y no
necesariamente una medida precisa de la variabilidad del conjunto de datos.
A veces se define la desviación típica de los datos de la muestra con (N-1) reemplazando a N en
los denominadores, porque el valor resultante da un mejor estimación de la desviación típica
de la población total. Para grandes valores de N( N > 30), no hay prácticamente diferencia
entre ambas definiciones. Además, cuando se necesita esa mejor estimación, siempre
Varianza
Es el promedio ajustado del cuadrado de las diferencias entre valores de datos y la media.
Cuando sea necesario distinguir la desviación típica de una población de la de una muestra de
dicha población, usaremos “s” para la desviación típica de la muestra y “ ” (sigma griega
Donde “c” es la anchura del intervalo de clase. La corrección se llama corrección de Sheppard.
Desviación Media
Es una medida de variabilidad que toma en cuenta todos los valores observados y que
caracteriza la dispersión de los valores individuales partiendo de su tendencia central.
Ejercicios:
2) El siguiente conjunto de datos son los ingresos en dólares de un comercio durante una
semana 631, 1054, 1854, 2012, 1514, 1315. Hallar el rango, la desviación típica y la
desviación media de los ingresos de ese comercio.
muestras que son: 20, 15, 25, 10, 27, 10, 30, 12, 17 y su compañero 27, 15, 22, 30, 16,
19, 22. Calcule la varianza combinada de las dos muestras.
Salario Nº de
(Dólares) Empleados
250 – 259 8
260 – 269 10
270 – 279 16
280 – 289 14
290 – 299 10
300 – 309 5
310 – 319 2
Calcule:
a) La desviación típica de los sueldos de los empleados.
e) El rango.
6) Los datos siguientes representan las alturas de estudiantes de una universidad, que
aparecen distribuidas en la siguiente tabla en pulgadas.
Altura Frecuencia
60 – 62 5
63 – 65 18
66 – 68 42
69 – 71 27
72 – 74 8
c) La varianza corregida
Probabilidad
Todos estamos familiarizados con la importancia de los experimentos en ciencias e ingeniería.
La experimentación es útil porque si suponemos que llevamos a cabo ciertos experimentos
bajo condiciones esencialmente idénticas, llegaremos a los mismos resultados. En estas
circunstancias, estamos en capacidad de controlar el valor de las variables que afectan el
resultado del experimento.
Sin embargo, en algunos experimentos, no somos capaces de indagar o controlar el
valor de determinadas variables, de manera que resultado cambiará de un experimento al
otro, a pesar de que la mayoría de las condiciones son las mismas. Estos experimentos se
describen como aleatorios. Que se puede definir como: un proceso que produce uno de
varios resultados posibles.
Los experimentos aleatorios clásicos son el lanzamiento de una moneda, el
lanzamiento de un dado, la extracción de una tarjeta en un mazo bien barajado y otros. En la
vida diaria existen muchos procesos aleatorios menos obvios. Algunos procesos de
manufactura originan productos defectuosos en una forma aleatoria. Se ha dado también a
los tiempos que transcurren entre la llegada de las llamadas telefónicas a una central
telefónica, a los automóviles en las casetas de cobro y a los clientes de un supermercado.
La definición clásica de la probabilidad se define como el cociente entre los casos favorables y
los casos posibles.
Simbólicamente
a)
b)
c)
Eventos Mutuamente Excluyentes
Se denomina si la ocurrencia de uno cualquiera de ellos excluye la posibilidad o probabilidad
de ocurrencia de otro. La regla que se utiliza en este caso es la regla de la adición
Eventos Independientes
Cuando la ocurrencia o no ocurrencia de un evento de ninguna manera afecta la posibilidad o
probabilidad de ocurrencia del otro evento. La probabilidad conjunta de que dos eventos
independientes acontezcan al mismo tiempo se puede utilizar la regla de la
multiplicación:
Eventos Dependientes
Sucede cuando la probabilidad de ocurrencia de uno es afectada por la ocurrencia o no
ocurrencia del otro.
Eventos Condicionales
Sucede cuando un evento , afecta para la ocurrencia o no ocurrencia de otro evento ,y
además se conoce de que el primer evento ya ocurrió; y viene dada por:
Ejercicios:
1) Un experimento consiste en sacar una esfera de una caja que contiene 6 esferas azul,
3 negras y 5 blancas. Calcular la probabilidad de que la esfera sacada sea:
a) Blanca.
b) Negra.
c) No sea blanca.
d) azul
e) Blanca o azul.
2) Un experimento consiste en sacar dos esferas de una caja que contiene 6 esferas azul,
3 negras y 5 blancas. Calcular la probabilidad de que las esferas sacadas sean:
f) Una blanca y la otra azul.
g) Una negra y la otra blanca.
h) La primera sea azul y la otra negra.
i) La primera sea blanca y la segunda no.
3) Un grupo de 2000 personas fue entrevistado respecto a las políticas que podrían
implantarse para conservar el petróleo. De ellas 1000 dijeron que estarían dispuestos a
aceptar el racionamiento de gasolina, 500 dijeron que un impuesto adicional por galón
sería aceptable para ellas y 275 indicaron que estaría dispuestas a aceptar tanto el
racionamiento como el impuesto adicional. Si se escoge a una persona aleatoriamente
en este grupo, ¿Qué probabilidades habrá de que:
a) Considere aceptable el impuesto adicional.
b) Considere aceptable uno o pero no ambas alternativas?
c) Juzgue inaceptable las dos?
que a) las dos piezas consecutivas sean defectuosa, b) las tres primeras no sean
defectuosa y la cuarta lo sea, c) cinco piezas consecutivas no sean defectuosa.
8) En una sala de clase hay 9 alumnos de varones y 13 mujeres, se eligen 3 alumnos para
un juego. Calcule la probabilidad de que los elegidos sean: a) los 3 varones, b) las tres
sean mujeres, c) salgan en el orden alternado de acuerdo al sexo.
9) Una muestra de 500 piezas se escogió de tres líneas de productos y fue inspeccionada
por el departamento de control de calidad. La tabla siguiente resume los resultados de
la inspección.
10) La probabilidad de que un nuevo método de mercadotecnia tenga éxito se calcula que
es 0,60. La probabilidad de que el gasto en el desarrollo del método pueda conservarse
dentro del presupuesto original es 0,50. La probabilidad de que estos dos objetivos
sean alcanzados se estima que es 0,30. ¿Cuál es la probabilidad de que se alcance uno
de estos dos objetivos?
DISTRIBUCIÓN DE PROBABILIDADES
Ej: Hallar la distribución de probabilidades para una familia con 3 hijos, siendo x la variable
aleatoria de la cantidad de varones que tiene la familia
X 0 1 2 3
Ejercicios:
1) Suponga que se va alanzar un par de dados balanceados y la variable aleatoria X
denota la suma de los puntos. Calcule la distribución de probabilidad para la variable
aleatoria X.
3) Una urna contiene 5 esferas blancas y 3 negras. Si se sacan al azar sin remplazo y X
indica el número de esferas blancas, calcule la función de probabilidad.
4) Sea Z la variable aleatoria que indica el número de caras menos el número de cruz en
dos lanzamientos de una moneda balanceada. Encuentre la distribución de
probabilidad de Z.
Análisis Combinatorio
Al hallar probabilidades de sucesos suele resultar difícil y tediosa una enumeración de los
casos. El análisis combinatorio facilita mucho esa tarea.
Principio Fundamental
Si un suceso puede ocurrir de n1 maneras, y si cuando éste ha ocurrido otro suceso puede
ocurrir de n2 maneras, entonces el número de maneras en que ambos pueden ocurrir en el
orden especificado es n1 . n2
Ejemplo:
Si hay 3 candidatos para gobernador y 5 para intendente, los dos cargos pueden ocuparse de
3 . 5 = 15 maneras.
Factorial de n
Permutación
Combinaciones
Ejercicio:
1) ¿Cuántos números de 2 cifras pueden formarse con los dígitos 2, 5, 6, 8, 7 (sin repetir
dígitos)?
2) ¿Cuántas señales se pueden formar con los colores rojo, amarillo, verde, azul, negro
utilizando 3 colores para formar una señal y disponiendo los colores de la misma
manera?
3) ¿De cuántas formas se pueden mezclar los colores del ejercicio anterior, mezclando 3
colores a la vez?
Distribución Binomial
Ejercicios:
2) Un banco muy importante emite tarjetas de crédito. Se ha averiguado que 40% de las
cuentas de todas las tarjetas se liquida completamente después de la primera factura.
Es decir, 40% de las cuentas nunca presentan cargos de interés. Si una muestra de 6
cuentas se selecciona aleatoriamente en los registros correspondientes a años
anteriores. Calcule la probabilidad de que:
a) 2,
b) al menos 3,
c) a lo sumo 4; cuentas que no haya incurrido en gastos por interés.
4) Si el 20% de los tornillos producidos por una máquina son defectuosos, determinar la
probabilidad de que, entre 4 tornillos elegidos al azar. a) 3 sean defectuosas b) 2 sean
defectuosa c) al menos 2 sean defectuosa d) a lo sumo 2 sean defectuosa.
6) Un psicólogo afirma que una nueva técnica de tratamiento de una enfermedad cura
en un 80% . La asociación de salud mental decide poner a prueba la afirmación del
psicólogo. Calcule la probabilidad de que de los 10 pacientes elegidos al azar para el
experimento:
a) 7 se curen.
b) Menos de la mitad se curen.
c) Más de la mitad se curen.
7) Una empresa que lleva a cabo una encuesta entre consumidores por correo descubrió
que 40% de las familias que reciben un cuestionario lo devuelven con respuesta. En
una encuesta de 10 familias, ¿Qué probabilidades hay de que exactamente 8 lo
devuelvan?, ¿Que lo retornen al menos 8 familias?, ¿Qué lo devuelvan a lo sumo 3
familias?
Distribución de Poisson
Este tipo de distribución de probabilidad es para variable discreta y se usa para
determinar la probabilidad de ocurrencia de un número de determinado de eventos,
cuando éstos ocurren en un continuo de espacio o tiempo, el proceso se considera no
estacionario e independientes los eventos unos de otros y que no hay ensayo explícito.
A un proceso de este tipo se llama proceso de Poisson. Ej.: Cantidad de llamadas
entrante en una central telefónica durante un intervalo de tiempo o cantidad de
vehículos registrados en un estacionamiento.
Ejercicios:
3) En una tienda de departamentos, seis personas por hora en promedio usan un cajero
automático durante las horas pico. ¿Cuál es la probabilidad de que:
a) Exactamente seis personas usen el cajero durante una hora tomada al azar?
b) Nadie use la instalación durante una hora específica?
c) Al menos 5 personas usen el cajero durante una hora cualquiera?
Ejercicios:
3) Si el 0,1% de las válvulas manufacturadas por una compañía son defectuosas, hallar
la probabilidad de que en una muestra de 100 válvulas: a) 0 sean defectuosa, b) a lo
sumo 3 sean defectuosa, c) como mínimo 3 sean defectuosa; Utilizando la
aproximación de Poisson.
Distribución Normal
. El área limitada por la curva “Y” y el eje “X” es 1; por tanto el área bajo
En tal caso, decimos que z esta normalmente distribuida con media 0 y varianza 1. Como es
difícil de calcular el área bajo esa curva, la tabla adjunta muestran las áreas bajo esta curva
acotadas por las ordenadas z = 0 y cualquier valor positivo de z, de esa tabla se puede deducir
el área entre toda las coordenadas usando la simetría de la curva respecto de z = 0.
Ejercicio:
1) Hallar el área bajo la curva normal en cada uno de los siguientes casos.
a) Entre z = 0 y z = 1,2
b) Entre z =-1, 6 y z = 0
c) A la izquierda de z = - 0,6
d) A la izquierda de z = 1,25
e) A la derecha de z = 2,14
f) A la derecha de z = -1,56
b) Z ≤ - 0,5
c) Z ≥ - 2,7
d) Z ≤ 3,05
3) Se sabe que la vida útil de un componente eléctrico se ajusta a una distribución normal
con media 2 000 hs. y una desviación típica de 200 hs. La probabilidad de que un
componente tomado al azar dure:
a) 1 800 hs. y 2 200 hs.
b) Más de 2 200 hs.
c) Menos de 1 800 hs.
5) Si los diámetros de las esferas que produce una máquina están normalmente
distribuidas con media 0,6140 pulgada y desviación típica 0,0025 pulgada, determinar
el porcentaje de ellas con diámetro.
a) Entre 0,610 y 0,618; pulgadas
b) Mayores que 0,617; pulgada
c) Menores que 0,608; pulgada
6) Una encuesta reveló que el ingreso anual per cápita de los habitantes de un estado
tiene una distribución normal con una media de 9800 dólares y una desviación
estándar de 1600 dólares. Si se selecciona una persona aleatoriamente, ¿Qué
probabilidades hay de que sus ingresos anuales, a) sean mayores que 5000 dólares, b)
mayores que 12 000 dólares, c) Fluctúen entre 8520 dólares y 12 200, d) entre 11 400
dólares y 13 000 dólares?
En clase anteriores hemos hecho uso de que para muestras de tamaño N>30, llamadas
grandes muestra, tales distribuciones de muestreo de muchos estadísticos son
aproximadamente normales, siendo tanto mejor la aproximación cuanto mayor sea N. para
muestras de tamaños menor que 30, llamadas pequeñas muestras, esa aproximación no es
buena y empeora al decrecer N de modo que es necesario hacer algunas modificaciones.
Distribución t de Student
Definimos el estadístico t:
En general podemos representar los límites de confianza para medias poblacionales por
Donde los valores ± llamados valores críticos o coeficientes de confianza, que depende
del nivel de confianza deseado y del tamaño de la muestra. Puede usar el cuadro siguiente.
1) Medias: para contrastar la hipótesis nula de que una población normal tiene media
usamos el estadístico t
donde
Ejercicios:
1) Una muestra de 10 medidas de diámetro de una esfera dan una medida media de
4,38 cm y una desviación típica de 0,06 cm. Hallar los límites de confianza a) 95% y
b) 99% para el diámetro verdadero, utilizando la distribución de student.
2) Cinco medidas del tiempo de reacción de un individuo ante cierto estímulo se han
registrado como 0,28 ; 0,30 ; 0,27 ; 0,33 ; 0,31 segundos. Hallar los límites de
confianza a) 95% y b) 99% para el tiempo real de reacción.
4) Hace tiempo una máquina producía arandelas de 0,05 pulgadas de espesor. Para
determinar si sigue funcionando bien, se toma una muestra de 10 arandelas, que
dan un espesor medio de 0,053 pulgadas con una desviación típica de 0,003
pulgadas. Contrastar la hipótesis de que la máquina sigue funcionando bien, con
nivel de confianza a) 95% y b) 99%, utilizando la distribución de student.
5) Una prueba de 6 sogas de un cierto fabricante dio una tensión media de ruptura
de 7750 lb y una desviación típica de 145 lb, mientras que el fabricante anunciaba
que era de 8000 lb. ¿Puede sostenerse esta afirmación del fabricante a nivel de
significación a) 0,05 y b) 0,01? Utilizando la distribución de student.
Distribución de Ji-Cuadrado
Definimos el estadístico
Como se hizo con la distribución normal y con la distribución de student, podemos definir los
intervalos y los límites de confianza, usando la tabla de distribución ji-cuadrado en la tabla del
Apéndice IV. De este modo podemos estimar, dentro de los límites especificados, la desviación
típica de la población en términos de una desviación típica muestral s.
Ejercicios:
2) Tiempo atrás, la desviación típica de los pesos de ciertos envases llenados por una
máquina era 0,25 onza. Una muestra aleatoria de 20 envases ha dado una desviación
típica de 0,32 onza. ¿Es significativo el aparente aumento en la variabilidad al nivel de
significación a) 0,05 y b) 0,01?
3) La desviación típica y la vida media de 10 bombillas son 120 h y 1366h. hallar los
límites de confianza a) 95% y b) 99% para la desviación típica de las bombillas de esa
clase.
4) La desviación típica de las temperaturas anuales en una ciudad a lo largo de 100 años
es 16°F. Usando la temperatura media del día 15 de cada mes durante los últimos 15
meses, ha resultado una desviación típica de 10 °F. Contrastar la hipótesis de que las
temperaturas en esa ciudad son menos variables que en el pasado, con nivel de
significación a) 0,05 y b) 0,01.