Está en la página 1de 64

Lic.

Gilberto Carbajal Cardozo Estadística I

UNIVERSIDAD PRIVADA DEL ESTE

FACULTAD DE CIENCIAS
ADMINISTRATIVAS Y CONTABLES
Y
FACULTAD DE CIENCIAS DE LA
INFORMÁTICA

SEDE CIUDAD DEL ESTE

Material Elaborado
Para la Cátedra de:

ESTADÍSTICA I

PROFESOR : Lic. Gilberto Carbajal Cardozo

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Introducción
Iniciamos este material con la definición de algunos conceptos elementales y básicos, si
embargo, pilares fundamentales para la comprensión intuitiva y real de la estadística.
Con este material pretendo introducir al estudiante en los primeros pasos sobre el uso y
manejo de datos numéricos, los gráficos estadísticos: concepto, característica, clasificación y
uso correcto e incorrecto; siguiendo con la organización de datos y posterior análisis. La
probabilidad: su concepto, definición, clasificación, cálculo e importancia en la actualidad son
temas que también se abordan.

¿Qué es la estadística?

Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos


numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia del
concepto popular que existe sobre el término y que cada vez está más extendido debido a la
influencia de nuestro entorno como: radio, televisión, periódico, revista, etc. Nos aborda
diariamente con cualquier tipo de información estadística, tales como: accidente de tránsito,
índice de crecimiento poblacional, turismo, tendencia política y otros.
Solo cuando nos adentramos en un mundo más específico como es el campo de la
investigación en ciencias como: la medicina, psicología, ingeniería, etc. Empezamos a percibir
que la estadística no es una ciencia más, sino que se convierte en una herramienta
preponderante que permite dar luz y obtener resultados en casi cualquier tipo de estudio.

1) La estadística estudia los métodos científicos para recoger, organizar, resumir y


analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables
basadas en tal análisis.

2) Se denomina población o universo a todos los elementos que interviene en un


estudio.
3) Muestra, se denomina a una parte representativa de la población; o sea una parte que
tenga todas las características de una población.

4) Una variable estadística, es un símbolo, tal como X, Y, x que puede tomar un


conjunto prefijado de valores, llamado dominio de esa variable. Las variables se
clasifican en dos grupos grandes; Cualitativas que se utiliza para nominar algo sin valor
numérico y que se subclasifica en nominales y ordinales; y Cuantitativas que utiliza
valores numéricos para nominar y que se subdivide en continuas y discretas. Si la
variable puede tomar cualquier valor entre dos valores prefijados se dice que es
variable continua; en otro caso se dice que es variable discreta.

5) La parte de la estadística que sólo se ocupa de describir y analizar un grupo dado, sin
sacar conclusiones sobre un grupo mayor, se denomina estadística descriptiva o
deductiva. Sin embargo la fase de la estadística que trata con las condiciones bajo las
cuales tal diferencia es válida se llama estadística inductiva o inferencia estadística.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Ejercicios:

Clasifica las siguientes variables en cualitativas, cuantitativa discreta y cuantitativa continuas.

1) Cantidad de bolsas de semillas utilizadas.

2) Talla de camisetas.

3) Número de calzado vendido.

4) Temperatura corporal de un paciente.

5) Calidad de un producto.

6) Días de la semana.

7) Marca de café preferida.

8) Número de asignaturas aprobadas.

9) Número de hijos en una familia.

10) Número de hectáreas plantadas.

GRÁFICOS ESTADÍSTICOS

Los datos presentados en una tabla pueden ser representados en un gráfico


permitiendo una rápida impresión visual del conjunto, para cumplir con este requisito un
gráfico necesita cumplir con ciertos requisitos, como ser:

a) Ser sencillo.

b) Ser autoexplicativo.

c) No contener demasiadas informaciones.

d) Tener un diseño atractivo pero sin deformar los hechos.

e) Ser adecuado al tipo de escala en que están clasificados los datos.

Existen muchos tipos de gráficos que aparecen en estadística, según la naturaleza de los datos
involucrados y el propósito entre ellos están los gráficos en barras, circulares, trazos, etc.

Gráfico en barra: pueden estar representados en forma vertical u horizontal, el ancho debe ser
constante y puede elegirse cualquier tamaño con tal que las barras no se superpongan. Puede
haber variaciones de las barra, como las barras agrupadas o compuestas.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Barras Horizontales

Plantaciones Superficie (Millones de Hectáreas)


Soja 35
Maiz 15
Algodón 25
Trigo 30
Otros 4,5

Barras Verticales

Plantaciones Superficie (Millones de Hectáreas)


Soja 35
Maiz 15
Algodón 25
Trigo 30
Otros 4,5

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Barras Verticales Compuestas

Plantaciones Superficie (Millones de Hectáreas) Producción (millones de toneladas)


Soja 35 97,5
Maíz 15 30,5
Algodón 25 60,6
Trigo 30 85,7
Otros 4,5 10,5

Barras Verticales Compuestas

Barras Horizontales Compuestas

Gráficos Circulares o Sectores: se utiliza para demostrar la proporción de cada componente


dentro de un todo. Se utiliza generalmente para analizar datos de un sólo periodo de
tiempo, dos gráficos circulares pueden servir para mostrar los cambios en dos periodos
diferentes. No se recomienda utilizar un número grande de ítems, pues la diferencia entre
ellas será muy pequeña que visualmente sería difícil detectar la diferencia entre sectores.

Plantacione
s Superficie (Millones de Hectáreas)
Soja 35
Maiz 15
Algodón 25
Trigo 30
Otros 4,5

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Gráfico lineal o trazos: muestras tendencias y como varían los valores de los datos a través del
tiempo. Se recomienda utilizar dos o tres líneas como máximo en un mismo plano para evitar
confusiones, se deben presentar cada línea con diferentes colores.

Plantacione
s Superficie (Millones de Hectáreas)
Soja 35
Maiz 15
Algodón 25
Trigo 30
Poroto 0,3
Arveja 0,1
Mandioca 1,2
Tomate 0,8
Locote 0,6

Gráfico Lineal o de Trazos

Tiempo Exportación de Soja Exportación de Trigo

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

(Millones de Toneladas) (Millones de Toneladas)


2010 30,1 20
2011 25 22
2012 23 17
2013 26 17,5
2014 27,4 19
2015 30,5 21,4
2016 35,7 22,3
2017 41 25,7

Formas Incorrectas de Utilización de los Gráficos Estadísticos

Superficie Producción Exportación Consumo


(Millones de (millones de (millones de (millones de
Plantaciones Hectáreas) toneladas) toneladas) toneladas)
Soja 35 97,5 95 2,5
Maiz 15 30,5 15 15,5
Algodón 25 60,6 50 10,5
Trigo 30 85,7 70 15,7
Otros 4,5 10,5 1,5 9

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Plantaciones Superficie (Millones de Hectáreas)


Soja 35
Maiz 15
Algodón 25
Trigo 30
Poroto 0,3
Arveja 0,1
Mandioca 1,2
Tomate 0,8
Locote 0,6

Ejercicios:

1) Según los registros históricos de una empresa, las ganancias anuales de los últimos
cinco años son:

Tiempo Ganancias (en millones


de Guaraníes)
2015 63
2016 97
2017 102,3
2018 150,5
2019 110,7
a) Represente los datos en un gráfico de barras horizontales.

b) Represente los datos en un gráfico de barras verticales.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

2) Los datos en relación a la población mundial en un año específico en los países más
poblados están en la siguiente tabla:

País Población (en millones)


China 1420
India 1368
Estados Unidos 329
Indonesia 269
Brasil 212
Pakistán 204
a) Represente los datos en un gráfico circular.

3) En la tabla siguiente se presenta la cantidad de gimnasios y la cantidad de miembros


en millones para algunos años. Representar los datos en gráficos adecuados.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Año Cantidad de Gimnasios Cantidad de Miembros


(Miles) (Millones)
2014 13 32,5
2015 13,2 35
2016 15 36,5
2017 20 39
2018 25,5 41
2019 28,5 41,3

DISTRIBUCIÓN DE FRECUENCIAS

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Una distribución de frecuencias indica cómo un conjunto de datos se dividen en clases o


categorías, al listar todas las clases o categorías con sus respectivos valores de los datos
(frecuencias) que hay en cada una de las clases.

1) Fila de Datos o Datos en Bruto:


Una fila de datos consiste en datos recogidos que no han sido organizados
numéricamente, por ejemplo, las edades de los alumnos de una institución educativa,
los puntajes de los alumnos de un curso en una materia, las ventas diarias en un
negocio, los cambios instantáneos de la cotización de una moneda, cantidad diaria de
vehículos que pagan el peaje, etc.

2) Tabla de Distribución de Frecuencias:


La frecuencia para una clase particular es el número de valores reales que cae en cada
clase. En el cuadro siguiente, en la segunda clase la frecuencia es 244, lo que significa
que existen 244 clientes que tardaron entre 02 y 03 minutos en ser atendidos en caja
después de formar la fila.

Ejemplo: Tiempo que un cliente tarda en la fila en ser atendido en una caja de
supermercado.

Tiempo Tardado Cantidad de Clientes


en la Fila (minuto) (Frecuencia)
0,5 - 01 97
02 - 03 244
04 - 05 153
06 - 07 51

3) Distribución de Frecuencias:
Al resumir grandes colecciones de datos, es útil distribuirlos en clase o
categorías y determinar el número de individua que pertenece a cada clase, llamado
frecuencia de clase. Una disposición tabular de los datos por clases junto a las
correspondientes frecuencias de clase, se llama distribución de frecuencias (o tabla de
frecuencias). Por ejemplo la tabla siguiente es una tabla de distribución de frecuencia
de los puntajes en un examen de 50 alumnos/as de una universidad.

Número de
Puntaje
Alumnos/as

21 - 25 5

26 - 30 10

31 - 35 21

36 - 40 9

41 - 45 5

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Algunos Términos y Conceptos Utilizados en la Confección de una Tabla de


Distribución de Frecuencias

4) Intervalo de Clases y límites de Clases.


El símbolo que define una clase, se llama intervalo clase, como 26-30 y 36–40
en el ejemplo anterior. Los números extremos de cada intervalo de clase, por ej. 26 y
30 se denominan límites de clase, a (26) se denomina límite inferior de clase y a (30)
límite superior de clase.
Los intervalos de clase que, al menos en teoría carece de límites especificados
se denominan intervalo de clase abierto. Ej.: refiriéndonos a precio de un producto,
30 000 Gs. o más ó 50 000 Gs. o menos.

5) Frontera de Clase o Límite Real de Clase

Si se dan edades con una cierta precisión en un intervalo de clase 60-65 años
incluye teóricamente todas las edades 59,5 y 65,5 años. Estos números indicados, se
llaman frontera de clase (59,5) es la frontera inferior de clase y (65,5) es frontera
superior de clase.

En la práctica, las fronteras de clases se obtienen promediando el límite


superior de una clase y el límite inferior de la siguiente.

Ej. La frontera inferior de la tercera clase es (30+31)/2 = 30,5

6) Tamaño o Anchura de un Intervalo de Clase (C)

El tamaño o anchura de un intervalo de clase es la diferencia entre la frontera


superior de clase e inferior y se calcula dividiendo, el rango más la unidad con la
cantidad de clases o categorías en que se quiere distribuir los datos. Si todos los
intervalos los intervalos de clases de una distribución de frecuencias son iguales, lo
denotaremos por “c”.

7) Marca de Clase (x)

La marca de clase es el punto medio del intervalo de clase y se obtiene promediando


los límites inferior y superior de clase.
Ej. La marca de clase del quinto intervalo es (41+45)/2 = 43; el de la tercera es
(31+35)/2 = 33.

8) Reglas Generales Para Formar Distribuciones de Frecuencias.

 Determinar el mayor y el menor de todos los datos, hallando así el rango


(diferencia de ambos).

 Dividir el rango en un número adecuado de intervalo de clase del mismo


tamaño. Si ello no es factible, usar intervalo de clase de distintos tamaños o

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

intervalo de clase abierto. Se suelen tomar entre 5 y 20 intervalo de clase,


según los datos. Los intervalos de clase se eligen también de modo que las
marcas de clase coincidan con datos realmente observados.
Ello tiende a disminuir el llamado error de agrupamiento que se produce en
análisis ulteriores. No obstante, las fronteras de clase no debieran coincidir
con datos realmente observados.

 Determinar el número de observaciones que caen dentro de cada intervalo de


clase; esto es hallar las frecuencias de clase. Esto se logra mejor con una hoja
de recuentos.

Ejercicios
I) Los salarios mensuales (dólares) de 33 trabajadores de una empresa, son
las siguientes:

412 320 251 322 450 550 250 452 532 333

250 345 476 333 251 354 350 454 267 350

445 367 440 371 461 365 341 410 450 370

370 400 360

Organice los datos en una distribución de frecuencia con 6 intervalos de clase.

II) La puntuación media en una carrera de un grupo de estudiante de una


universidad son:
55 70 67 78 57 81 95 46 75 94
58 79 82 54 67 67 74 83 46 99
85 79 75 46 52 68 69 77 89 42
78 45 69 78 75 48 79 56 55 85
75 89 79 97 87 67 84 87 95 53

Organice los datos en una distribución de frecuencia con 8 intervalos de clase.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

I) La tabla adjunta muestra los diámetros en centímetros de una muestra de 60 esferas


de cojinete manufacturadas por una fábrica. Construir una distribución de frecuencias
con intervalos de clase apropiados.

1.738 1.729 1.743 1.740 1.736 1.741 1.735 1.731 1.726 1.737
1.728 1.737 1.736 1.735 1.724 1.733 1.742 1.736 1.739 1.735
1.745 1.736 1.742 1.740 1.728 1.738 1.725 1.733 1.734 1.732
1.733 1.730 1.732 1.730 1.739 1.734 1.738 1.739 1.727 1.735
1.735 1.732 1.735 1.727 1.734 1.732 1.736 1.741 1.736 1.744
1.732 1.737 1.731 1.746 1.735 1.735 1.729 1.734 1.730 1.740

Frecuencia Relativa, Porcentual, Acumulada, Histograma de Frecuencia y Ojiva

Histograma de frecuencia: es una gráfica de barras de una distribución de frecuencias que


consiste en una serie de rectángulo, que tiene su base coincidiendo con los límites real o
exacto de clase (o sea la longitud de la base del rectángulo representa la amplitud de la clase)
en el eje horizontal y cuya marca de clase es el punto medio de cada rectángulo. Las áreas de
cada rectángulo son proporcionales a sus respectivas frecuencias.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Distribuciones de frecuencias acumulativas o acumuladas y ojivas: a la suma de todas las


frecuencias anteriores que el límite real superior o la frontera superior de un intervalo de clase
dado, se denomina frecuencia acumulada, hasta ese intervalo inclusive. Y la representación
gráfica de las frecuencias acumuladas se llama ojiva.

Frecuencia relativa: es el valor de la frecuencia obtenida, dividiendo la frecuencia absoluta de


una clase dada con el total de datos. Cada frecuencia relativa es una proporción.

Frecuencia porcentual: es la frecuencia relativa expresada en porcentaje.

Ejemplo: Una distribución de frecuencia de los salarios semanales de 100 trabajadores por
nivel de ingresos:

Límite de Clases Frecuencia


Límites reales o
(Salario Semanal (Número de Marca de clase (x) Frecuencia Acumulada
frontera de clase
en dólares) trabajadores)
240 - 259 7 239,5 - 259,5 249,5 menor a 239,5 = 0
260 - 279 20 259,5 - 279,5 269,5 menor a 259,5 = 7
280 - 299 33 279,5 - 299,5 289,5 menor a 279,5 = 27
300 - 319 25 299,5 - 319,5 309,5 menor a 299,5 = 60
320 - 339 11 319,5 - 339,5 329,5 menor a 319,5 = 85
340 - 359 4 339,5 - 359,5 349,5 menor a 339,5 = 96
Total 100 menor a 339,5 = 100

Límite de Clases Frecuencia


Frecuencia
(Salario Semanal en (Número de Frecuencia Relativa
Porcentual
dólares) trabajadores)
240 - 259 7 7/100 = 0,07 0,07*100 = 7%
260 - 279 20 20/100 = 0,20 0,20*100 = 20%
280 - 299 33 33/100 = 0,33 0,33*100 = 33%
F
300 - 319 25 25/100 = 0,25 0,25*100 = 25%
320 - 339 11 11/100 = 0,11 0,11*100 = 11%
35 - 359
340 4 4/100 = 0,04 0,04*100 = 4%
Total 100
30

25

20

15
Histograma de Frecuencia
10

5
Universidad Privada del Este Ciudad del Este
0
X
289,5
269,5

309,5

349,5
249,5

329,5
Lic. Gilberto Carbajal Cardozo Estadística I

Ojiva

Frecuencia Acumulada

105

90

75

60

45

30

15

0
259,5

299,5
279,5
239,5

319,5

339,5

359,5

Menor que:

Ejercicios

1) La tabla siguiente muestra la distribución de las edades de los trabajadores de cierta


empresa muy grande

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Edades Nro. de Trab.


20 - 24 12
25 - 29 50
30 - 34 55
35 - 39 95
40 - 44 31
45 - 50 20

Determine:
a) El límite real de cada clase.
b) El límite superior de la cuarta categoría.
c) La marca de cada clase.
d) Representar los datos en un histograma de frecuencias.

e) La frecuencia relativa de cada clase.


f) La frecuencia porcentual.
g) La frecuencia acumulada.
h) Representar los en una ojiva o menos.

2) La tabla siguiente muestra una distribución de frecuencias de los salarios mensuales de


65 empleados de una empresa. De acuerdo con la tabla.
Salarios Nro. de
(Dólares) Empleados
250 – 269 8

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

270 - 289 10
290 - 309 16
310 - 329 14
330 – 349 10
350 - 369 5
370 - 390 2

Determine:
a) La marca de cada clase.
b) Representar los datos en un histograma de frecuencias.

c) La frecuencia relativa de cada clase.


d) La frecuencia porcentual.
e) La frecuencia acumulada.
f) Representar los en una ojiva o menos.

Medidas de Tendencia Central

Promedios o medidas de Tendencia Central

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Un promedio es un valor típico o representativo de un conjunto de datos. Como tales valores


suelen situarse hacia el centro del conjunto de datos ordenados por magnitud, los promedios
se conocen como medidas de tendencia central.

Se definen varios tipos, siendo algunos la media aritmética, la mediana, la moda, la media
geométrica, la media cuadrática y la media armónica. Cada una tiene ventajas y desventajas,
según los datos y el objetivo perseguido.

La Media Aritmética Para Datos Simple

La media aritmética, o simplemente media, de un conjunto de N números se

denota por (Léase x barra) y se define por:

Si los números ocurren veces, respectivamente, la media

aritmética es:

La Media Aritmética Ponderada Para Datos Simple

A veces asociamos con los números ciertos factores peso o (pesos)

dependientes de la relevancia asignada a cada número. En tal caso,

Las ventajas que tienen son: fácil de calcular y de interpretar, siempre existe y es único para un
conjunto de datos. Sin embargo tiene una desventaja de que si los datos de los extremos son
desproporcionados con respecto al resto, el resultado se aleja de la realidad.

La Mediana Para Datos Simple

Se puede definir a la mediana como el valor que divide a una distribución, de modo que quede
a ambos lados con un número igual de datos.

La mediana de un conjunto de números ordenados en magnitud es o el valor central o la


media de los valores centrales.

La mediana es fácil de calcular y siempre existe, en algunos casos la mediana es más


importante que la media aritmética como cuando los valores extremos son muy grandes o
pequeños, caso en que la media aritmética puede llevarnos a confusiones.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

La moda Para Datos Simple

La moda de un conjunto de números es el valor que ocurre con mayor frecuencia; es decir, el
valor más frecuente. La moda puede no existir, incluso no ser única en caso de existir. La moda
no tienen otras propiedades matemáticas valiosas para usarlas en otros cálculos.

Medidas de Posición

Las medidas de posición son los valores de la distribución que dividen en partes iguales, es
decir, en intervalos que comprenden un mismo número de valores. Cuando la distribución
contiene un número alto de intervalos y se requiere un promedio de una parte de ella, se
puede dividir la distribución en cuatro, diez y cien partes iguales. Los más usados son los
cuartiles que divide a los datos en cuatro partes iguales , cada parte abarca 25% de

los datos; deciles que divide a los datos en diez partes iguales , en donde cada

decil abarca 10% y percentiles que divide en cien partes iguales y cada parte

abarca 1% del estero.

Cuartiles Para Datos Simple

Si se tiene una serie de valores , se localiza de la siguiente manera.

El primer cuartil si n es par si n es impar

El segundo cuartil si n es par si n es impar

El tercer cuartil si n es par si n es impar

Deciles Para Datos Simple

Si se tiene una serie de valores , se localiza de la siguiente manera.

Si n es par si n es impar siendo N el número del decil.

Percentil Para Datos Simple

Si se tiene una serie de valores , se localiza de la siguiente manera.

Si n es par ; si n es impar siendo N el número del percentil.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Ejercicios:

1) Un estudiante obtuvo las siguientes calificaciones 85, 76, 93, 82 y 96 en 5 materias.


Encuentre la media aritmética, la mediana y la moda de las calificaciones.

2) Un psicólogo midió los tiempos de reacción de un individuo a ciertos estímulos siendo


estos 0,53 ; 0,46 ; 0,50 ; 0,49 ; 0,52 ; 0,53 ; 0,50 ; 0,44 y 0,55 segundos, en ese orden.
Determine la media aritmética, la moda, el primer cuartil, el percentil 60 del tiempo de
reacción del individuo a los estímulos.

3) Una concesionaria de autos reporta las siguientes ventas mensuales 15, 25, 17, 20, 22,
19, 22, 15, 22, 30, 17, 23. Calcular
a) La media aritmética.
b) La moda.
c) La mediana.
d) El primer cuartil.
e) El octavo decil.
f) El percentil 75.

4) Las calificaciones obtenidas por un estudiante en laboratorio, teoría y práctica de un


curso de física son 71, 78 y 89 respectivamente.
a) Si los pesos asignados a las calificaciones son 2, 4 y 5, ¿Cuál es la calificación
promedio?
b) ¿Cuál es la calificación promedio si se utiliza el mismo peso para los tres?

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

5) En un turno de una institución educativa se obtuvieron los siguientes resultados de un


examen:

Calificación Nro. Alumnos


1 8
2 15
3 43
4 19
5 10
Determine la calificación promedio, el tercer cuartil, el quinto decil, el percentil 75 de
ese grupo de alumnos.

Datos Agrupados

La Media Aritmética

La media aritmética para datos agrupados se define como:

Donde representa la marca de cada clase y N la sumatoria de las frecuencias.

La Mediana

La mediana para datos agrupados se define de la siguiente manera:

; donde

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

es la frontera inferior de la clase de la mediana.

N es el número de datos o sea la frecuencia total.

suma de las frecuencias de las clases anteriores a la clase de la mediana.

frecuencia de la clase de la mediana.

c anchura o amplitud del intervalo de clase de la mediana.

La Moda

La moda para datos agrupados, se define de la siguiente manera:

; donde

es la frontera inferior de la clase modal.

exceso de la frecuencia modal sobre la frecuencia de la clase anterior inmediata.

exceso de la frecuencia modal sobre la frecuencia de la clase posterior inmediata.

c anchura o amplitud del intervalo de la clase modal.

Cuartiles

Los cuartiles se definen de la siguiente manera:

; donde

es la frontera inferior de la clase donde cae el cuartil.

es la suma de la frecuencia.

N es el orden del cuartil que se quiere calcular.

es la suma de todas las frecuencias anteriores de donde cae el cuartil.

es la frecuencia en donde cae el cuartil.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

c es la anchura o amplitud de la clase en donde cae el cuartil.

es el valor del cuartil de orden n

Deciles

Los deciles se definen de la siguiente manera:

; donde

es la frontera inferior de la clase donde cae el decil.

es la suma de la frecuencia.

N es el orden del decil que se quiere calcular.

es la suma de todas las frecuencias anteriores de donde cae el decil.

es la frecuencia en donde cae el decil.

c es la anchura o amplitud de la clase en donde cae el decil.

es el valor del decil de orden n

Percentiles

Los deciles se definen de la siguiente manera:

; donde

es la frontera inferior de la clase donde cae el percentil.

es la suma de la frecuencia.

N es el orden del decil que se quiere calcular.

es la suma de todas las frecuencias anteriores de donde cae el percentil.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

es la frecuencia en donde cae el percentil.

c es la anchura o amplitud de la clase en donde cae el percentil.

es el valor del percentil de orden n

Ejercicios:

3) La tabla siguiente muestra la distribución de las edades de los trabajadores de cierta


empresa muy grande

Edades Nro. de Trab.


20 - 24 72
25 - 29 150
30 - 34 255
35 - 39 195
40 - 44 53
45 - 50 20

Determine:
a) La frontera superior de la segunda clase.

b) El límite inferior de la cuarta categoría.

c) La marca de la sexta clase.

d) La frontera inferior de quinta clase.

e) El límite superior de la segunda clase.

f) La marca de la tercera clase.

g) La media aritmética de las edades.

h) El primer y tercer cuartil e interprete el resultado.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

i) La mediana de las edades de los trabajadores de esa empresa.

j) El quinto y octavo decil e interprete el resultado.

k) La moda de las edades de los trabajadores de esa empresa.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

l) El percentil 50 y 75 e interprete el resultado.

4) La tabla siguiente muestra una distribución de frecuencias de los salarios mensuales de


los empleados de una empresa. De acuerdo con la tabla.
Salarios Nro. de
(Dólares) Empleados
250 - 269,99 8
270 - 289,99 10
290 - 309,99 16
310 - 329,99 14
330 – 349,99 10
350 - 369,99 5
370 - 390 2

Determine:
a) La media aritmética.

b) La moda de los salarios.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

c) La mediana de los salarios de los trabajadores.

d) El séptimo decil e interprete el resultado.

e) El segundo cuartil e interprete el resultado.

f) El percentil 43 e interprete el resultado.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Medidas de Dispersión o Variabilidad


Unas de las características más importantes de un conjunto de datos es que los valores son
generalmente diferentes; hasta qué grado necesariamente varían entre sí, es algo que en la
estadística es de gran importancia. Las distintas medidas de tendencia central describen una
propiedad importante de un conjunto de datos, que es su centro o valor característico. Un
promedio por sí solo puede ser engañoso si es que no va acompañado de otra medida que
señale su amplitud y sus desviaciones respecto a su promedio.

La dispersión indica el grado de alejamiento que tienen los diferentes valores con respecto a la
media aritmética. Un menor grado de dispersión indica que los datos están más agrupados
alrededor de la media que otra serie de datos con mayor dispersión.

Las principales medidas de dispersión son: el rango, la varianza, la desviación típica o estándar,
la desviación media, el coeficiente de variación, etc.

Rango
Es la diferencia entre el valor más alto y el menor de todo el conjunto de datos considerado.
Pese a que tiene la evidente ventaja de la facilidad de calcular y de interpretar no ofrece una
medida útil de desviación en una gamma muy grande de problemas estadísticos. Como se
consideran solo los valores extremos no nos dice nada sobre los datos que quedan entre los
extremos. Se utiliza generalmente en situaciones en que se quiere una visión rápida y no
necesariamente una medida precisa de la variabilidad del conjunto de datos.

Rango = N° Mayor – N° Menor

Desviación Típica o Desviación Estándar


Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la
media.

Desviación Típica Para Datos Simple

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

La desviación típica de un conjunto de N números se denota pos “s” y se define


como:

Método Corto Para Calcular la Desviación Típica Datos Simple


La ecuación siguiente es la ecuación para el cálculo de la desviación típica para datos simple

Donde x representa a cada uno de los datos.

Desviación Típica para Datos Agrupados

Si ocurren con una frecuencia respectivamente, la desviación típica

puede expresarse como:

; donde , “x” la marca de clase.

A veces se define la desviación típica de los datos de la muestra con (N-1) reemplazando a N en
los denominadores, porque el valor resultante da un mejor estimación de la desviación típica
de la población total. Para grandes valores de N( N > 30), no hay prácticamente diferencia
entre ambas definiciones. Además, cuando se necesita esa mejor estimación, siempre

podemos obtenerlas multiplicando por

Desviación Típica Para Datos Agrupados Método Corto


Y la siguiente ecuación representa la ecuación de la desviación típica para datos agrupados

Donde X es la marca de cada clase de la distribución.

Varianza

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Es el promedio ajustado del cuadrado de las diferencias entre valores de datos y la media.

La varianza de un conjunto de datos se define como el cuadrado de la desviación típica y viene


dado por en las ecuaciones anteriores.

Cuando sea necesario distinguir la desviación típica de una población de la de una muestra de
dicha población, usaremos “s” para la desviación típica de la muestra y “ ” (sigma griega

minúscula) para la desviación típica de la población. De modo que y representarían la


varianza de la muestra y la varianza de la población.

Corrección de Sheppard para la varianza


El cálculo de la desviación típica es algo erróneo como resultado del agrupamiento de datos en
clases (error de agrupamiento). Para corregirlo, se usa la fórmula:

Donde “c” es la anchura del intervalo de clase. La corrección se llama corrección de Sheppard.

Propiedades de la Desviación Típica


1) La desviación típica puede definirse como

Donde ”a” es un promedio distinto de la media aritmética. De tales desviaciones


típicas, la mínima es aquella para la cual a = X̄. Esta propiedad da buena razón para
adoptar la definición del comienzo.

2) Para distribuciones normales, resulta.


a) 68,27% de los casos están entre X̄ - s y X̄ + s (o sea, una desviación típica a cada
lado de la media).
b) 95,45% de los casos están entre X̄ - 2s y X̄ + 2s (0 sea, dos desviaciones típicas a
cada lado de la media).
c) 99,73% de los casos están entre X̄ - 3s y X̄ + 3s (o sea, tres desviaciones típicas a
cada lado de la media.

3) Supongamos que dos conjuntos de números (o dos distribuciones de

frecuencias con frecuencias totales tiene varianza dadas por ,

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

respectivamente, y tienen la misma media X̄ . Entonces la varianza combinada de


ambos conjuntos (o de ambas distribuciones de frecuencias) vendrán dad por.

El resultado admite generalizaciones a más conjuntos.

Desviación Media
Es una medida de variabilidad que toma en cuenta todos los valores observados y que
caracteriza la dispersión de los valores individuales partiendo de su tendencia central.

Desviación Media Para Datos Simple

La desviación típica de un conjunto de N números se denota pos “s” y se define


como:

Desviación Media Para Datos Agrupados

Si ocurren con una frecuencia respectivamente, la desviación típica

puede expresarse como:

; donde y “x” la marca de clase.

Ejercicios:

1) Un comercio minorista reporta las ventas semanales de un producto en particular y


son las siguientes: 25, 13, 24, 15, 17, 10, 16. Calcular el rango, la desviación estándar,
la varianza, la desviación media de las ventas de ese producto.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

2) El siguiente conjunto de datos son los ingresos en dólares de un comercio durante una
semana 631, 1054, 1854, 2012, 1514, 1315. Hallar el rango, la desviación típica y la
desviación media de los ingresos de ese comercio.

3) Dos personas está investigando separadamente un mismo grupo de personas, la


primera investigó a 20 persona con varianza 2,3; mientras que la otra persona
investigó a 15 persona con varianza 2,7. ¿Cuál es la varianza combinada de los dos
grupos de personas, sabiendo que la media para los dos investigadores son iguales?

4) Un estudiante y otro compañero de clases están analizando de forma independiente el


rendimiento que tuvieron en un examen de matemáticas, el primero tomó sus

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

muestras que son: 20, 15, 25, 10, 27, 10, 30, 12, 17 y su compañero 27, 15, 22, 30, 16,
19, 22. Calcule la varianza combinada de las dos muestras.

5) La tabla muestra una distribución de frecuencias de los salarios semanales de 65


empleados de una empresa:

Salario Nº de
(Dólares) Empleados
250 – 259 8
260 – 269 10
270 – 279 16
280 – 289 14
290 – 299 10
300 – 309 5
310 – 319 2

Calcule:
a) La desviación típica de los sueldos de los empleados.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

b) La varianza de los datos.

c) La varianza corregida de los datos.

d) La desviación media de los datos.

e) El rango.

6) Los datos siguientes representan las alturas de estudiantes de una universidad, que
aparecen distribuidas en la siguiente tabla en pulgadas.

Altura Frecuencia
60 – 62 5
63 – 65 18
66 – 68 42
69 – 71 27
72 – 74 8

Calcular el valor de:


a) La desviación media

b) La varianza sin corregir

c) La varianza corregida

d) El rango de las alturas

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Probabilidad
Todos estamos familiarizados con la importancia de los experimentos en ciencias e ingeniería.
La experimentación es útil porque si suponemos que llevamos a cabo ciertos experimentos
bajo condiciones esencialmente idénticas, llegaremos a los mismos resultados. En estas
circunstancias, estamos en capacidad de controlar el valor de las variables que afectan el
resultado del experimento.
Sin embargo, en algunos experimentos, no somos capaces de indagar o controlar el
valor de determinadas variables, de manera que resultado cambiará de un experimento al
otro, a pesar de que la mayoría de las condiciones son las mismas. Estos experimentos se
describen como aleatorios. Que se puede definir como: un proceso que produce uno de
varios resultados posibles.
Los experimentos aleatorios clásicos son el lanzamiento de una moneda, el
lanzamiento de un dado, la extracción de una tarjeta en un mazo bien barajado y otros. En la
vida diaria existen muchos procesos aleatorios menos obvios. Algunos procesos de
manufactura originan productos defectuosos en una forma aleatoria. Se ha dado también a
los tiempos que transcurren entre la llegada de las llamadas telefónicas a una central
telefónica, a los automóviles en las casetas de cobro y a los clientes de un supermercado.

La definición clásica de la probabilidad se define como el cociente entre los casos favorables y
los casos posibles.

Simbólicamente

Propiedades Fundamentales de Probabilidad

a)

b)

c)
Eventos Mutuamente Excluyentes
Se denomina si la ocurrencia de uno cualquiera de ellos excluye la posibilidad o probabilidad
de ocurrencia de otro. La regla que se utiliza en este caso es la regla de la adición

; si la probabilidad de ocurrencia de o de ambos a la vez,


viene dado por:

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

OBS: la probabilidad de la ocurrencia simultánea de dos o más eventos recibe el nombre de


probabilidad conjunta.

Además de la clasificación anterior, los eventos pueden clasificarse en:

Eventos Independientes
Cuando la ocurrencia o no ocurrencia de un evento de ninguna manera afecta la posibilidad o
probabilidad de ocurrencia del otro evento. La probabilidad conjunta de que dos eventos
independientes acontezcan al mismo tiempo se puede utilizar la regla de la
multiplicación:

Eventos Dependientes
Sucede cuando la probabilidad de ocurrencia de uno es afectada por la ocurrencia o no
ocurrencia del otro.

Eventos Condicionales
Sucede cuando un evento , afecta para la ocurrencia o no ocurrencia de otro evento ,y
además se conoce de que el primer evento ya ocurrió; y viene dada por:

Ejercicios:

1) Un experimento consiste en sacar una esfera de una caja que contiene 6 esferas azul,
3 negras y 5 blancas. Calcular la probabilidad de que la esfera sacada sea:
a) Blanca.
b) Negra.
c) No sea blanca.
d) azul
e) Blanca o azul.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

2) Un experimento consiste en sacar dos esferas de una caja que contiene 6 esferas azul,
3 negras y 5 blancas. Calcular la probabilidad de que las esferas sacadas sean:
f) Una blanca y la otra azul.
g) Una negra y la otra blanca.
h) La primera sea azul y la otra negra.
i) La primera sea blanca y la segunda no.

3) Un grupo de 2000 personas fue entrevistado respecto a las políticas que podrían
implantarse para conservar el petróleo. De ellas 1000 dijeron que estarían dispuestos a
aceptar el racionamiento de gasolina, 500 dijeron que un impuesto adicional por galón
sería aceptable para ellas y 275 indicaron que estaría dispuestas a aceptar tanto el
racionamiento como el impuesto adicional. Si se escoge a una persona aleatoriamente
en este grupo, ¿Qué probabilidades habrá de que:
a) Considere aceptable el impuesto adicional.
b) Considere aceptable uno o pero no ambas alternativas?
c) Juzgue inaceptable las dos?

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

4) Durante cierta semana la probabilidad de que una emisión de específica de acciones


suba, permanezca sin cambios o disminuya de precio se estima que es 0,30; 0,20 y
0,50 respectivamente.
a) ¿Cuál es la probabilidad de que la emisión de acciones aumente o no cambie de
precio?
b) ¿cuál es la probabilidad de que el precio de la emisión cambie durante la semana?

5) En una bolsa se tiene 5 monedas de 1 dólar y 4 monedas de 0.5 dólar. Cuál es la


probabilidad de al retirar sucesivamente 2 monedas, obtengamos la suma 1.5 dólar?

6) La proporción general de los artículos defectuosos en un proceso continuo de


producción es 0,10 ¿Cuál es la probabilidad de que?
a) Dos artículos escogidos al azar salgan sin defecto.
b) Dos artículos escogidos al azar estén defectuoso.
c) Por lo menos un artículo escogido en forma aleatoria salgan sin defecto.

7) La probabilidad de que una máquina produzca una pieza defectuosa es de 0,12. Si el


proceso se caracteriza por la independencia estadística. ¿qué probabilidad habrá de

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

que a) las dos piezas consecutivas sean defectuosa, b) las tres primeras no sean
defectuosa y la cuarta lo sea, c) cinco piezas consecutivas no sean defectuosa.

8) En una sala de clase hay 9 alumnos de varones y 13 mujeres, se eligen 3 alumnos para
un juego. Calcule la probabilidad de que los elegidos sean: a) los 3 varones, b) las tres
sean mujeres, c) salgan en el orden alternado de acuerdo al sexo.

9) Una muestra de 500 piezas se escogió de tres líneas de productos y fue inspeccionada
por el departamento de control de calidad. La tabla siguiente resume los resultados de
la inspección.

Producto 1 Producto 2 Producto 3 Total


Aceptable 96 220 144 460
Inaceptable 4 20 16 40
Total 100 240 160 500

Si se escoge una pieza aleatoriamente en la muestra, ¿Qué probabilidad hay de que:


a) La pieza sea de tipo de producto 1?
b) La pieza sea inaceptable?
c) La pieza sea una unidad aceptable del producto 2?

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

10) La probabilidad de que un nuevo método de mercadotecnia tenga éxito se calcula que
es 0,60. La probabilidad de que el gasto en el desarrollo del método pueda conservarse
dentro del presupuesto original es 0,50. La probabilidad de que estos dos objetivos
sean alcanzados se estima que es 0,30. ¿Cuál es la probabilidad de que se alcance uno
de estos dos objetivos?

DISTRIBUCIÓN DE PROBABILIDADES

Si una variable X puede tomar un conjunto de valores discretos X 1 , X2 , X3 ,…, Xn con


probabilidades respectivas p1 , p2 , p3 ,…, pn , donde la suma de las probabilidades es igual a 1,
decimos que tenemos que tenemos definida una distribución de probabilidad discreta para X.
la función p(X) que tiene valores p1 , p2 , p3 ,…, pn para X = X1 , X2 , X3 ,…, Xn se llama función de
probabilidad o función de frecuencia de X.

Ej: Hallar la distribución de probabilidades para una familia con 3 hijos, siendo x la variable
aleatoria de la cantidad de varones que tiene la familia

Por medio de la distribución Binomial, tenemos:

X 0 1 2 3

P(x) 1/8 3/8 3/8 1/8

Ejercicios:
1) Suponga que se va alanzar un par de dados balanceados y la variable aleatoria X
denota la suma de los puntos. Calcule la distribución de probabilidad para la variable
aleatoria X.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

2) Encuentre la distribución de probabilidad para niños en familia con tres hijos,


suponiendo una probabilidad igual para niños y niñas.

3) Una urna contiene 5 esferas blancas y 3 negras. Si se sacan al azar sin remplazo y X
indica el número de esferas blancas, calcule la función de probabilidad.

4) Sea Z la variable aleatoria que indica el número de caras menos el número de cruz en
dos lanzamientos de una moneda balanceada. Encuentre la distribución de
probabilidad de Z.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Análisis Combinatorio

Al hallar probabilidades de sucesos suele resultar difícil y tediosa una enumeración de los
casos. El análisis combinatorio facilita mucho esa tarea.

Principio Fundamental

Si un suceso puede ocurrir de n1 maneras, y si cuando éste ha ocurrido otro suceso puede
ocurrir de n2 maneras, entonces el número de maneras en que ambos pueden ocurrir en el
orden especificado es n1 . n2

Ejemplo:

Si hay 3 candidatos para gobernador y 5 para intendente, los dos cargos pueden ocuparse de

3 . 5 = 15 maneras.

Factorial de n

El factorial de n, se denota por n y se define como n = n (n-1) (n-2) (n-3 )… 1

Permutación

Una permutación de n objetos tomados de r en r es una elección ordenada de r objetos de


entre n. el número de permutaciones de n objetos tomados de r en r es:

Combinaciones

Una combinación de n objetos tomados de r en r es una selección de r de ellos, sin importar el


orden de los r elegidos. El número de combinaciones de n objetos, tomados de r en r es:

Ejercicio:

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

1) ¿Cuántos números de 2 cifras pueden formarse con los dígitos 2, 5, 6, 8, 7 (sin repetir
dígitos)?

2) ¿Cuántas señales se pueden formar con los colores rojo, amarillo, verde, azul, negro
utilizando 3 colores para formar una señal y disponiendo los colores de la misma
manera?

3) ¿De cuántas formas se pueden mezclar los colores del ejercicio anterior, mezclando 3
colores a la vez?

Distribución Binomial

Es una distribución para variable discreta de probabilidad, es aplicable como un modelo de


situaciones de toma de decisiones en la que se supone que el proceso de muestreo se ha
realizado conforme a un proceso de Bernoulli. El proceso de Bernoulli es un proceso de
muestreo en el cual:

a) En cada ensayo sólo pueden presentarse dos resultados u observaciones mutuamente


excluyentes.
b) Los resultados de una serie de ensayos u observaciones constituyen eventos
independientes.
c) La probabilidad de éxito en cada ensayo denotada por “p”, permanece constante de
un ensayo a otro. Es decir, el proceso es estacionario.

Si “p” es la probabilidad de que ocurra un suceso en cada prueba (llamada probabilidad de


éxito) y q=1-p es la probabilidad de que no ocurra en cada prueba (llamada probabilidad de
fracaso), entonces la probabilidad de que el suceso ocurra X veces en N pruebas viene dada
por:

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

La distribución se llama también distribución de Bernoulli.

Ejercicios:

1) Hallar la probabilidad de que en 5 tiradas de un dado aparezca el 3: a) ninguna vez,


b) 1 vez, c) 4 veces, d) 5 veces, e) al menos 4 veces, f) a lo sumo 2 veces.

2) Un banco muy importante emite tarjetas de crédito. Se ha averiguado que 40% de las
cuentas de todas las tarjetas se liquida completamente después de la primera factura.
Es decir, 40% de las cuentas nunca presentan cargos de interés. Si una muestra de 6
cuentas se selecciona aleatoriamente en los registros correspondientes a años
anteriores. Calcule la probabilidad de que:
a) 2,
b) al menos 3,
c) a lo sumo 4; cuentas que no haya incurrido en gastos por interés.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

3) Se ha comprobado que el 90% de las familias estadounidenses tiene por lo menos un


televisor. Si se seleccionan aleatoriamente 10 residencias. Determine la probabilidad
de que:
a) Como mínimo 8 familias; tengan por lo menos un televisor.
b) Como máximo 2 familias; tengan por lo menos un televisor.
c) 5 familias; tengan por lo menos un televisor.

4) Si el 20% de los tornillos producidos por una máquina son defectuosos, determinar la
probabilidad de que, entre 4 tornillos elegidos al azar. a) 3 sean defectuosas b) 2 sean
defectuosa c) al menos 2 sean defectuosa d) a lo sumo 2 sean defectuosa.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

5) La probabilidad de que un estudiante que ingresa en la Universidad se licencie es 0,4.


Hallar la probabilidad de que entre 5 estudiantes elegidos al azar a) ninguno se
licencie, b) todos se licencie, c) al menos 2 se licencie.

6) Un psicólogo afirma que una nueva técnica de tratamiento de una enfermedad cura
en un 80% . La asociación de salud mental decide poner a prueba la afirmación del
psicólogo. Calcule la probabilidad de que de los 10 pacientes elegidos al azar para el
experimento:
a) 7 se curen.
b) Menos de la mitad se curen.
c) Más de la mitad se curen.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

7) Una empresa que lleva a cabo una encuesta entre consumidores por correo descubrió
que 40% de las familias que reciben un cuestionario lo devuelven con respuesta. En
una encuesta de 10 familias, ¿Qué probabilidades hay de que exactamente 8 lo
devuelvan?, ¿Que lo retornen al menos 8 familias?, ¿Qué lo devuelvan a lo sumo 3
familias?

Distribución de Poisson
Este tipo de distribución de probabilidad es para variable discreta y se usa para
determinar la probabilidad de ocurrencia de un número de determinado de eventos,
cuando éstos ocurren en un continuo de espacio o tiempo, el proceso se considera no
estacionario e independientes los eventos unos de otros y que no hay ensayo explícito.
A un proceso de este tipo se llama proceso de Poisson. Ej.: Cantidad de llamadas
entrante en una central telefónica durante un intervalo de tiempo o cantidad de
vehículos registrados en un estacionamiento.

Para determinar la probabilidad de que ocurra un número determinado de eventos en


un proceso de Poisson se requiere un solo valor: el número medio de eventos a largo
plazo en un lapso específico o en una dimensión de espacio que interese. Por lo
general la media se representa por la letra griega lambda ( ) .Las fórmula para
determinar la probabilidad de un número determinado “x” de éxitos en una

distribución de Poisson es:

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Ejercicios:

1) En un departamento de reparación de maquinaria se recibe un promedio de 5


solicitudes de servicios por hora. La probabilidad de que se reciban al azar:
a) Exactamente 3 solicitudes de servicio por hora.
b) Exactamente 2 solicitudes de servicio por hora.
c) Al menos 2 solicitudes de servicio por hora.
d) A lo sumo 3 solicitudes de servicio por hora.

2) En promedio, 12 personas realizan consultas cada hora a un consultor de decoración


en una tienda de telas. Eligiendo una hora al azar, determine la probabilidad de que:
a) 7 personas haga consulta.
b) Más de la mitad consulte.
c) A lo sumo 3 haga consulta.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

3) En una tienda de departamentos, seis personas por hora en promedio usan un cajero
automático durante las horas pico. ¿Cuál es la probabilidad de que:
a) Exactamente seis personas usen el cajero durante una hora tomada al azar?
b) Nadie use la instalación durante una hora específica?
c) Al menos 5 personas usen el cajero durante una hora cualquiera?

Aproximación de Poisson a Probabilidades Binomiales

Cuando el número “N” de observaciones o en ensayos en un proceso de Bernoulli es


grande los cálculos son muy tediosos y por lo general no se disponen de tabla de
probabilidad para valores pequeños de “p”. Por estas razones la distribución de
Poisson se puede usar como aproximación a las probabilidades binomiales cuando “N”
es grande y “p” o “q” son pequeños. Una regla útil es que esta aproximación se puede
emplear cuando y N . p ≤ 5 o N . q ≤ 5 .Donde la media de la distribución de

probabilidad de Poisson que se usa para aproximar las probabilidades binomiales es

y “p” es la probabilidad de ocurrencia del evento. Y “e”


es la base del logaritmo neperiano cuyo valor es aproximadamente 2,71828182849…

Ejercicios:

1) El 1% de los tornillos producidos por una máquina son defectuosas. Hallar la


probabilidad de que en una muestra de 30 tornillos tomadas al azar a)

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

exactamente 2 sean defectuosas, b) a lo sumo 2 sean defectuosas; Utilizando la


aproximación de Poisson.

2) Un lote grande de transistores provenientes de un determinado proveedor, se sabe


que el 1% de las piezas tienen defectos. Si se toma una muestra de 30 transistores al
azar. Aproxime por medio de la distribución de Poisson la probabilidad de que:

a) Al menos dos transistores tengan defectos.

b) A lo sumo 27 transistores tengan defectos.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

3) Si el 0,1% de las válvulas manufacturadas por una compañía son defectuosas, hallar
la probabilidad de que en una muestra de 100 válvulas: a) 0 sean defectuosa, b) a lo
sumo 3 sean defectuosa, c) como mínimo 3 sean defectuosa; Utilizando la
aproximación de Poisson.

Distribución Normal

Uno de la más importante distribución de probabilidad continua es la distribución normal,


curva normal o distribución gaussiana; como la distribución normal es para variables
continuas se representa por medio de una función, donde la gráfica es conocida como
campana de Gauss y definida por la expresión:

Donde: es la media poblacional, es la desviación típica poblacional, y

. El área limitada por la curva “Y” y el eje “X” es 1; por tanto el área bajo

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

la curva entre X = a y X = b, con a < b, representa la probabilidad de que X esté entre a y b.


esta probabilidad se denota por P(a < x < b).

Cuando se expresa la variable X en unidades estándar , la ecuación anterior se

convierte por la llamada forma canónica.

En tal caso, decimos que z esta normalmente distribuida con media 0 y varianza 1. Como es
difícil de calcular el área bajo esa curva, la tabla adjunta muestran las áreas bajo esta curva
acotadas por las ordenadas z = 0 y cualquier valor positivo de z, de esa tabla se puede deducir
el área entre toda las coordenadas usando la simetría de la curva respecto de z = 0.

Ejercicio:

1) Hallar el área bajo la curva normal en cada uno de los siguientes casos.
a) Entre z = 0 y z = 1,2

b) Entre z =-1, 6 y z = 0

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

c) A la izquierda de z = - 0,6

d) A la izquierda de z = 1,25

e) A la derecha de z = 2,14

f) A la derecha de z = -1,56

2) Hallar el área bajo la curva normal para los casos:


a) Z ≥ 2,16

b) Z ≤ - 0,5

c) Z ≥ - 2,7

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

d) Z ≤ 3,05

3) Se sabe que la vida útil de un componente eléctrico se ajusta a una distribución normal
con media 2 000 hs. y una desviación típica de 200 hs. La probabilidad de que un
componente tomado al azar dure:
a) 1 800 hs. y 2 200 hs.
b) Más de 2 200 hs.
c) Menos de 1 800 hs.

4) Se ha encontrado que la vida útil de ciertas marcas de llantas de alto rendimiento se


ajusta a una distribución normal con media de 42 000 km. Y una desviación estándar
de 4 500 km. a) ¿Cuál es la probabilidad de que una llanta elegida al azar tenga una
vida útil de por lo menos 40 000 km.? b) ¿Cuál es la probabilidad de que dure más de
45 000 km.? y c) ¿Cuál es la probabilidad de que dure a lo sumo 38 000 km.?

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

5) Si los diámetros de las esferas que produce una máquina están normalmente
distribuidas con media 0,6140 pulgada y desviación típica 0,0025 pulgada, determinar
el porcentaje de ellas con diámetro.
a) Entre 0,610 y 0,618; pulgadas
b) Mayores que 0,617; pulgada
c) Menores que 0,608; pulgada

6) Una encuesta reveló que el ingreso anual per cápita de los habitantes de un estado
tiene una distribución normal con una media de 9800 dólares y una desviación
estándar de 1600 dólares. Si se selecciona una persona aleatoriamente, ¿Qué
probabilidades hay de que sus ingresos anuales, a) sean mayores que 5000 dólares, b)
mayores que 12 000 dólares, c) Fluctúen entre 8520 dólares y 12 200, d) entre 11 400
dólares y 13 000 dólares?

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

7) Un fabricante efectuó un estudio sobre la vida útil de determinado tipo de lámpara. El


estudio llegó a la conclusión de que la vida útil, medida en horas, es una variable
aleatoria con una distribución normal. La vida útil es de 700 hs. con desviación
estándar de 100 hs. ¿Qué probabilidad hay de que la lámpara seleccionada al azar
tenga una vida útil que oscile entre 800 y 900 hs? ¿Más de 850 hs.?

Teoría de Pequeñas Muestras

En clase anteriores hemos hecho uso de que para muestras de tamaño N>30, llamadas
grandes muestra, tales distribuciones de muestreo de muchos estadísticos son
aproximadamente normales, siendo tanto mejor la aproximación cuanto mayor sea N. para
muestras de tamaños menor que 30, llamadas pequeñas muestras, esa aproximación no es
buena y empeora al decrecer N de modo que es necesario hacer algunas modificaciones.

El estudio de la distribución de muestreo de estadísticos para pequeñas muestras se llama


teoría de pequeñas muestras. Sin embargo un nombre más apropiado sería teoría exacta del
muestreo, pues sus resultados son válidos tanto para pequeñas y grandes muestras. En las
siguientes clases analizaremos dos distribuciones importantes:

Distribución t de Student

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Definimos el estadístico t:

Grados de libertad : se domina grados de libertad a la diferencia v = N-1.

En general podemos representar los límites de confianza para medias poblacionales por

Donde los valores ± llamados valores críticos o coeficientes de confianza, que depende

del nivel de confianza deseado y del tamaño de la muestra. Puede usar el cuadro siguiente.

Contraste de Hipótesis y Significación

Los contraste de de hipótesis y significación o regla de de decisión, se extiende fácilmente


a pequeñas muestras. La única diferencia es que z queda sustituida por el estadístico t.

1) Medias: para contrastar la hipótesis nula de que una población normal tiene media
usamos el estadístico t

Donde x̅ es la media muestral de tamaño N.

2) Diferencia de medias: supongamos que se toman dos muestras aleatorias de tamaños

de dos poblaciones normales cuyas desviaciones típicas son iguales .

Y supongamos además que estas dos muestras tienen medias y desviaciones

típicas , respectivamente. Para contrastar la hipótesis nula de que las

muestras provienen de la misma población o sea .

donde

Esta distribución es una distribución de student con grados de libertad

Ejercicios:

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

1) Una muestra de 10 medidas de diámetro de una esfera dan una medida media de
4,38 cm y una desviación típica de 0,06 cm. Hallar los límites de confianza a) 95% y
b) 99% para el diámetro verdadero, utilizando la distribución de student.

2) Cinco medidas del tiempo de reacción de un individuo ante cierto estímulo se han
registrado como 0,28 ; 0,30 ; 0,27 ; 0,33 ; 0,31 segundos. Hallar los límites de
confianza a) 95% y b) 99% para el tiempo real de reacción.

3) Una muestra de 12 medidas de tensión de ruptura de hilos de algodón da una


media de 7,38 gramos y una desviación típica de 1,24 gramos. Hallar los límites de
confianza a) 95% y b) 99% para la verdadera tensión de ruptura.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

4) Hace tiempo una máquina producía arandelas de 0,05 pulgadas de espesor. Para
determinar si sigue funcionando bien, se toma una muestra de 10 arandelas, que
dan un espesor medio de 0,053 pulgadas con una desviación típica de 0,003
pulgadas. Contrastar la hipótesis de que la máquina sigue funcionando bien, con
nivel de confianza a) 95% y b) 99%, utilizando la distribución de student.

5) Una prueba de 6 sogas de un cierto fabricante dio una tensión media de ruptura
de 7750 lb y una desviación típica de 145 lb, mientras que el fabricante anunciaba
que era de 8000 lb. ¿Puede sostenerse esta afirmación del fabricante a nivel de
significación a) 0,05 y b) 0,01? Utilizando la distribución de student.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

6) Con el fin de probar un fertilizante, se tomaron 24 parcelas de las mismas áreas,


de las que la mitad se trataron con ese fertilizante y las otras no; por lo demás, las
condiciones fueron idénticas para todas ellas. La producción media de trigo en las
parcelas sin tratar fue 2,8 toneladas con desviación típica de 0,3 toneladas, y las
tratadas fue de 3,1 toneladas con desviación típica de 0,26 toneladas. ¿Podemos
concluir que se produjo una mejora a causa del fertilizante de significación a) 1% y
b) 5%?

7) En un examen de psicología, 12 estudiantes de una clase obtuvieron media 78 con


desviación típica 6, y 15 de otra clase consiguieron media 74 con desviación típica
8. Mediante un nivel de significación 0,01 determinar si el primer grupo es
superior al segundo.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

Distribución de Ji-Cuadrado

Definimos el estadístico

Donde χ es la letra griega ji y se lee “Ji - Cuadrado”

Intervalos de Confianza para la distribución JI-Cuadrado

Como se hizo con la distribución normal y con la distribución de student, podemos definir los
intervalos y los límites de confianza, usando la tabla de distribución ji-cuadrado en la tabla del
Apéndice IV. De este modo podemos estimar, dentro de los límites especificados, la desviación
típica de la población en términos de una desviación típica muestral s.

Donde el grado de libertad es v = N – 1 y c es el nivel de significación.

Ejercicios:

1) La desviación típica de las alturas de 16 estudiantes varones tomados en un colegio es


2,40 pulgada. Hallar los límites de confianza a) 95% y b) 99% de la desviación típica
para todos los estudiantes de ese colegio usando la distribución de ji-cuadrado.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

2) Tiempo atrás, la desviación típica de los pesos de ciertos envases llenados por una
máquina era 0,25 onza. Una muestra aleatoria de 20 envases ha dado una desviación
típica de 0,32 onza. ¿Es significativo el aparente aumento en la variabilidad al nivel de
significación a) 0,05 y b) 0,01?

3) La desviación típica y la vida media de 10 bombillas son 120 h y 1366h. hallar los
límites de confianza a) 95% y b) 99% para la desviación típica de las bombillas de esa
clase.

Universidad Privada del Este Ciudad del Este


Lic. Gilberto Carbajal Cardozo Estadística I

4) La desviación típica de las temperaturas anuales en una ciudad a lo largo de 100 años
es 16°F. Usando la temperatura media del día 15 de cada mes durante los últimos 15
meses, ha resultado una desviación típica de 10 °F. Contrastar la hipótesis de que las
temperaturas en esa ciudad son menos variables que en el pasado, con nivel de
significación a) 0,05 y b) 0,01.

Universidad Privada del Este Ciudad del Este

También podría gustarte