Está en la página 1de 71

UNIVERSIDAD ESTATAL DE MILAGRO

CARRERAS EN LÍNEA

PROBABILIDAD Y ESTADISTICA
DOCUMENTO BASE DE LECTURA DEL TEMA Nº 1
“ESTADISTICA DESCRIPTIVA”
Universidad Estatal de Milagro – UNEMI

Este compendio recoge textualmente documentos e información de varias fuentes debidamente citadas, así
como referencias elaboradas por el autor para conectar los diferentes temas.
Se lo utilizará únicamente con fines educativos
CARRERAS EN LÍNEA

Unidad 1.- Estadistica Descriptiva 3


Tema 1: Estadistica Descriptiva 3
Objetivo 3
Subtema 1: Introducción e Importancia de la Estadística 3
Introducción 3
Importancia 4
Estadística Descriptiva 5
Estadística Inferencial 6
Subtema 2. Población, muestra, Tipos de Variables (cuantitativas y cualitativas), niveles de
medición (nominal, ordinal, de intervalo o razón). 8
Población. 8
Muestra 9
Tipos de Variables 9
Niveles de Medicion. 9
Escala nominal. 10
Escala ordinal. 10
Escala de intervalo. 10
Escala de razón. 10
Subtema 3: Presentación de datos: tablas de frecuencia. 11
Presentación de datos. 11
Tablas de Frecuencia. 11
Gráficos estadísticos 12
Gráficos de Barra 12
Diagrama de Puntos 13
Histogramas 14
Polígonos de frecuencia 15
Diagrama Circular 15
Ojivas: Ascendente y Descendente 16
Ejemplo #2 16
Recursos complementarios: 20
Bibliografía: 21
CARRERAS EN LÍNEA

Probabilidad y Estadística
Unidad 1.- Estadística Descriptiva

Tema 1: Estadística Descriptiva


Subtemas:
1. Introducción e Importancia de la Estadística.
2. Población, muestra, Tipos de Variables (cuantitativas y cualitativas), niveles de
medición (nominal, ordinal, de intervalo o razón).
3. Presentación de datos: tablas de frecuencia.
4. Gráficos estadísticos.

Objetivo

Identificar los principales conceptos de estadística mediante mapas conceptuales y


obtener información confiable a partir de un conjunto de datos, presentándolos de una
manera clara y confiable en cuadros de distribución de frecuencias.

Desarrollo de subtemas:

Subtema 1: Introducción e Importancia de la Estadística

Introducción

En el Ecuador existen eventos electorales cada cierto intervalo de tiempo, y estos son
realizados por organismos del gobierno, de tal forma que los partidos políticos inscriben
sus candidaturas para poder tener sus representantes como candidatos, esto deriva a que
en las vísperas de las elecciones existan estudios previos para conocer el posible
ganador y estos resultados aunque en muchos casos son usados para captar mayor
cantidad de votos, son obtenidos de acuerdo a la aceptación del candidato y le dará una
idea general de su situación y preferencia de sus electores. Las preguntas que se podrían
generar de estos estudios es: ¿Cuál fue el tamaño de la muestra para poder tener un
criterio de validez del estudio? ¿Qué niveles de tolerancia manejo el estudio? ¿Qué tipo
de muestreo se utilizó para ello? ¿Se manejó muestras de reposición? Y así existirán un
sin número de interrogantes que mediante el uso de la Estadística se pudieran responder,
una vez que existan resultados oficiales se podrían analizar que el estudio tuvo el mayor
acercamiento a los resultados reales y se podría definir quien uso o encontró el modelo
que permitiría poder predecir un posible resultado electoral, sin embargo, para llegar a
CARRERAS EN LÍNEA

estos modelos deberían ser validados con relación al tiempo y contrastados con más
resultados reales.

En ingeniería, esto incluye tareas tan diversas como calcular la longitud promedio
de los tiempos muertos en una computadora, recabar y presentar datos acerca
del número de individuos que asisten a un seminario sobre energía solar, evaluar
la efectividad de productos comerciales, predecir la confiabilidad de un vehículo
de lanzamiento y estudiar las vibraciones en las alas de una aeronave.(Miller &
Freund, 1993)

Importancia

¿Por qué se requiere la estadística en muchas empresas importantes? La primera


razón consiste en que la información numérica prolifera por todas partes. Revise
los periódicos (USA Today), revistas de noticias (Time, Newsweek, U.S. News y
World Report), revistas de negocios (BusinessWeek, Forbes), revistas de interés
general (People), revistas para mujeres (Ladies, Home Journal o Elle) o revistas
deportivas (Sports Illustrated, ESPN The Magazine), y quedará abrumado con la
cantidad de información numérica que contienen. (Lind, Marchal, & Wathen, 2012)

La importancia de la estadística radica principalmente en el uso que se le dé, y de


acuerdo al grupo donde se le aplique, la importancia de la estadística significa
cosas diferentes para personas diferentes, para un aficionado al futbol se trata del
número de goles y asistencias de gol, para el administrador de una planta de
energía es la cantidad de contaminantes que se liberan de las atmosferas. Para el
director del departamento de Alimentos y Medicina, es el porcentaje posible de
efectos secundarios no deseados con el uso generalizado de una nueva medicina
para curar el cáncer de próstata. Para un banco la estadística es importante para
medir la posibilidad de que un cliente pague a tiempo un préstamo. Para el
estudiante que toma este curso, se trata de la calificación que obtenga en los tres
exámenes parciales y en el final de la materia y con esto tenga alta posibilidad de
aprobar la materia.

A mediados del siglo XVIII motivado en la descripción numérica de ciudades,


provincias, poblados, etc., se logró llevar a cabo lo que ahora se conoce como
estadística descriptiva. Al principio este método se basaba solo en la presentación
CARRERAS EN LÍNEA

de datos en modo de tablas y gráficas, luego paso a ser una técnica muy útil para
la realización de investigaciones que contengan valores descriptivos. (Johnson,
2012)

Estadística Descriptiva

La finalidad de la estadística descriptiva es describir sus datos, es decir si se


requiere el estudio de diferentes aspectos, lo primero que se debería realizar es
tomar medidas de los aspectos o variables para posteriormente investigar en lo
que realmente nos interesa.

Este método al ser básicamente la descripción de los datos no puede asumir que
estos tengan algún tipo de propiedad más allá de la que la misma descripción
menciona, debido a que se dedica únicamente a describir y analizar los datos de
un grupo dado, sin argumentar ninguna conclusión ni tampoco hacer inferencia de
grupos más grandes. Es probable que sea utilizada al inicio del análisis, es decir
cuando se tiene contacto por primera vez con los datos.

Mediante la recolección de datos dependiendo de las características que tiene


cada grupo de individuo u objetos, utilizan esta técnica para resumir la información
contenida por cada conjunto para que el oyente pueda llegar a una conclusión y
así evitar problemas que puedan abrumar su habilidad de comprensión, su
aplicación exactamente se basa en el término “descripción de datos”, mediante el
cual se emplean métodos descriptivos, los cuales se encargan de la tabulación,
descripción, visualización, recolección, presentación y reducción de la
información. (Taylor R. A., 2008)

Al sustituir o reducir el grupo de datos que se han obtenido por un mínimo número
dentro de los valores descriptivos como: el promedio, la mediana, la media
geométrica, la varianza, la desviación típica, etc. Esta ayuda brindaría las
propiedades relevantes de todos los datos que se han observado, así como
también las principales características que podrían ser clave dentro del grupo de
investigación.

En general toda la información proporcionada por medio de esta técnica va a


otorgar facilidad y eficacia a través de un conjunto de herramientas mediante
CARRERAS EN LÍNEA

gráficos: de tendencia, de dispersión, histograma, polígonos de frecuencia,


pictogramas, diagramas circulares. Mediante la utilización de estas herramientas
gráficas se pretende entender claramente el grupo que fue analizado.

Utiliza parámetros que ayudan a organizar toda la información proporcionada por


cualquiera de las herramientas antes mencionadas, los más utilizados son:
» Centralización
» Posición
» Dispersión

De esta manera seria posible que las personas encargadas de realizar la


investigación estarían aptas para obtener con mayor facilidad los resúmenes de
los datos estadísticos que relacionan a todos los elementos.

Con frecuencia esta técnica propone una metodología sencilla y con una gran
eficiencia para poder caracterizar los datos resumidos, además de ofrecer un
modelo sencillo de presentación de toda dicha información recopilada.

Y esa así se considera un método con un potencial alto que se podría aplicar en
las diversas situaciones que pueden presentarse en la que se involucraría la
utilización de los datos, además de la ayuda en la comprensión e interpretación de
los diferentes datos siendo de mucha utilidad al momento de la toma de
decisiones.

Las aplicaciones de la estadística descriptiva podrían realizarse en la mayoría de


las áreas encargadas de recopilar datos cuantitativos, en los cuales se deberá de
obtener la información necesaria de los datos a analizar. (Rubin, 2010)

Una vez obtenido el conocimiento de esta técnica en los diferentes ámbitos


debemos priorizar que estas no dejan de evolucionar, así como las distintas
ciencias, sin embargo, tenemos el conocimiento necesario de su aplicación y
utilización, por ello tenemos claro en qué área se puede llevar a cabo y el proceso
a realizar.

Estadística Inferencial
CARRERAS EN LÍNEA

En décadas actuales, el crecimiento de la estadística se observó en la mayoría de


áreas de actividades importantes, la característica más relevante de este
crecimiento se realizó en el cambio del énfasis de la estadística descriptiva a la
inferencial. La estadística inferencial es derivada de los datos de muestra, de
visualizaciones de ciertas partes de un grupo abundante de elementos y esto
comprometió a realizar un análisis extenso donde se sugiere ir más allá de la
información contenida en un grupo de datos, por ello es conveniente actuar con
precaución. Habrá que decidir qué tan lejos se quiere llegar en cuanto a la
generalización partiendo de un grupo determinado de datos que permitan que
estas generalizaciones sean prudentes y comprensibles, o más bien sea
recomendable esperar a que existan datos adicionales. (Johnson, 2012)

De tal manera ciertos problemas de mayor importancia de estadística inferencial


se relacionan con la evaluación de los peligros y las consecuencias que podrían
darse al momento de realizar las generalizaciones mediante datos de muestra.
Además de la probabilidad de tomar decisiones equivocadas, así como también un
alto grado erróneo en cuanto a las predicciones y la valoración de no reflejar las
situaciones reales, es decir no ofrece una seguridad absoluta, pero si una solución
probabilística.

Si se obtiene una muestra representativa de la población, el análisis de dicha


muestra es la que va a permitir sustentar las conclusiones válidas acerca de dicha
población cuando no pueden ser absolutamente ciertas se utiliza el lenguaje de
probabilidad. (Taylor R. A., 2008)

Al principio suelen formarse ciertas interrogantes como: ¿hay alguna relación entre
estas dos poblaciones?, ¿Cuál sería la mediana de esta población de acuerdo a
sus características?, aquí es donde se define claramente lo que se va proceder a
estudiar en una determinada población sean las variables, etc.

A partir de esto se puede analizar los medios a disposición y el procedimiento que


se desea seguir.

La estadística inferencial ofrece un sinnúmero de modelos que están puestos a


nuestra disposición, para poder hacer uso de uno de estos modelos primero
CARRERAS EN LÍNEA

formularemos una pregunta en terminología estadística, a continuación, se debería


comprobar que dicha situación se adapta a algún modelo (en caso de no ser así,
no tendría ningún sentía utilizarlo), en cuanto se ajuste el modelo ofrecerá una
respuesta estadística a la pregunta antes formulada. (Murray R. Spiegel & Larry J.
Stephens, 2009)

Un buen argumento da credibilidad a una afirmación, en este caso cualquier tipo


de estudio necesitara al menos dos argumentos sólidos: el estadístico y el
diseñado para una investigación.
La estadística inferencial se puede dar por:
a) Estimulación: puntual y por intervalos.
b) Prueba de Hipótesis:
1. Pruebas paramétricas: normal, T-student, Fisher, Anova….
2. Pruebas no paramétricas: Del Signo, U-MANN WITNEY,
Prueba de bondad de ajuste….

En muchas ocasiones las personas adquieren diferentes conclusiones de los


mismos datos, esto es de gran importancia porque se puede visualizar que la
estadística no decide sino más bien da argumentos para que el investigador o
lector puedan decidir y fundamentar sus propias conclusiones.

En el ámbito científico, la estadística inferencial es el lapso que se da desde una


pregunta hasta llegar a la respuesta apropiada, es decir cuando nos interesan
grupos demasiado grandes ahí es cuando la estadística diferencial nos va a
permitir dar ese salto de los resultados obtenidos para un conjunto en su totalidad.
En conclusión, esta no es más que una técnica que nos permite defender nuestras
ideas. (Triola, 2004)

Es importante saber que este método es utilizado cuando se requiere ejecutar una
afirmación por encima de los elementos a medir.

Subtema 2: Población, muestra, Tipos de Variables (cuantitativas y


cualitativas), niveles de medición (nominal, ordinal, de intervalo o razón).

Población
CARRERAS EN LÍNEA

Es la agrupación de medidas o el conteo de elementos y personas que poseen


una propiedad en común. Esta terminología es usada para indicar el grupo de
componentes de los cuales se extrae la muestra.

Los elementos que constituyen la población o muestra pueden ser: individuos,


animales, objetos o cosas.

También es importante mencionar que el elemento puede ser un sujeto simple


(estudiantes) o un sujeto complejo (un curso) y es designada como unidad de
investigación. Es considerable destacar que a pesar de que una población se
encuentre establecida por un conjunto de componentes, lo único realmente
importante y que le interesa a la Estadística es la característica del elemento.
(Babativa, 2004)

Muestra

Definido como un subconjunto de medidas o el conteo de una parte determinada


de una población. Los elementos son seleccionados al azar, es decir cualquier
elemento dentro de la población tiene la oportunidad de ser seleccionado.

Las muestras y poblaciones asignan distintas propiedades a las cuales se las


conoce como variables. (Taylor R. C., 2008)

Tipos de variables
a) Cualitativas: Los valores que determinan esta variable son cualidades, no
números. Ejemplo: sexo, color, religión, etc.
b) Cuantitativa: los valores que determinan esta variable son números. Estas
se dividen en:
» Discretas: En cada lapso, la variable solo puede ser designada por un
número definido de valores. Ejemplo: número de caras de una moneda,
número de hijos, etc.
» Continuas: en cada lapso, la variable puede ser asignada por valores
infinitos. Ejemplo: peso, estatura, etc.

Niveles de medición
CARRERAS EN LÍNEA

Anteriormente citamos que las poblaciones y muestras están constituidas por


variables, están también son propiedades que se pueden observar y medir sean
personas o cosas tomando distintos valores, estos una vez que han sido tomados
se registran las mediciones y el resultado está establecido por datos. (Taylor R. A.,
2012)
Las escalas que describiremos fueron escritas por S.S. Stevens y de acuerdo con
esto se puede estimar que este proceso se da en cuatro niveles: escala nominal,
escala ordinal, escala de intervalo y escala de razón.

a) Escala nominal
Entre los cuatro niveles esta es la menos elaborada y posee básicamente dos
propiedades primordiales.
Primero permite clasificar personas o cosas con fundamento a una evaluación de
las cualidades sometidas a consideración; segundo la utilización de esta no
proporciona información en relación a la cantidad.
Las mediciones en escala nominal no permiten hacer comparaciones de “mas” o
“menos” sino más bien de “similar” o “distinto”.

b) Escala ordinal
Es parecida a la escala nominal clasifica a personas o cosas de acuerdo a sus
cualidades y características evaluadas. Sin embargo, la diferencia radica en que la
escala ordinal en sus clasificaciones incorpora características muy importantes de
“mayor que” o “menor que”.

c) Escala de intervalo
Esta escala agrega características de “cuánto más” y “cuánto menos” a aquellos
de la escala ordinal.
El defecto de esta escala es la carencia de un punto cero verdadero, es decir el
cero no significa que no exista determinada característica, sino sencillamente es
otro punto más en la escala.

d) Escala de razón
CARRERAS EN LÍNEA

Esta escala es semejante a la de intervalo con la única diferencia de que posee un


verídico punto cero. Su utilización más común es en mediciones de estatura y
peso, cuando existan un peso cero esto señala que no hay peso presente.

Subtema 3: Presentación de datos: tablas de frecuencia

Presentación de datos
Los datos estadísticos del resultado de una investigación, experimento o cualquier
tipo de mediciones a menudo son tan numerosos que resultan inservibles a menos
que estas se reduzcan de una manera adecuada. A continuación, conoceremos
como realizar las tablas de frecuencia. (Taylor R. C., 2008)

Tabla de frecuencia
Es la representación de un grupo de datos a manera de tabla o subconjunto de
datos que corresponden a un tema de investigación y que son ordenados en base
al número de observaciones correspondientes a cada uno de los datos o a cada
grupo de datos, los cuales se adecuan a un estudio cualitativo o cuantitativo,
cronología, geografía. Estas tablas se pueden elaborar mediante datos agrupados

Debido a que el tamaño de la muestra es notable o extenso y los datos numéricos


son distintos, recomienda agrupar los datos de forma que este permita tendencias
o patrones de los valores visualizados. De tal modo podemos ordenar todos los
datos de acuerdo a la tabulación de sus frecuencias asociados a algunos
intervalos de los valores visualizados.

Ejemplo #1: Se dan datos del peso(kg) de los alumnos del tercer año de una
institución educativa: 75, 52, 36, 45, 75, 52, 36, 45, 75, 52, 36, 45, 75, 52, 45, 75,
36, 52, 45, 75. Elaborar una tabla de frecuencia para datos agrupados.

Primeramente vamos a ordenar de manera ascendente los datos:


36 36 36 36 45 45 45 45 45 52 52 52 52
52 75 75 75 75 75 75
CARRERAS EN LÍNEA

Seguidamente se realiza la tabla de frecuencias:

M clase fi Xi Fi

1 [36 ; 43.8) 4 39.9 4

2 [43.8 ; 51.6) 5 47.7 9

3 [51.6 ; 59.4) 5 55.5 14

4 [59.4 ; 67.2) 0 63.3 14

5 [67.2 ; 75] 6 71.1 20

20

Tabla 1. Tabla de frecuencia para datos agrupados.


Dónde:
m: Es el número total de clases o intervalos. Y se obtiene de tres maneras:
a) La proporciona el ejercicio.
b) 𝑚 = 1 + 3.3log⁡(𝑛)
c) 𝑚 = √𝑛
En este caso se utilizó la fórmula del literal b) 𝑚 = 1 + 3.3log⁡(𝑛)

Clases: son intervalos en los cuales se presenta una propiedad en común


𝑅
cuantificable del grupo de dato. Y se obtiene primero sacando la amplitud; 𝑎 =
𝑚

donde R es el rango siendo el resultado de la resta del máximo y mínimo(de todos


los datos);𝑅 = 𝑀𝑎𝑥 − 𝑀𝑖𝑛.

𝑓𝑖 : Frecuenta absoluta. Es la cantidad de veces que se repite los números que se


encuentran en el intervalo de las clases.

𝑥𝑖 : Es la marca de clase, se refiere al punto medio dentro de un intervalo de clase,


lo que vendría a ser igual a la mitad de la sumatoria de las fronteras de clases, es
(𝐶1 +𝐶2)
decir .
2
CARRERAS EN LÍNEA

𝐹𝑖 : Frecuencia absoluta acumulada. Es la sumatoria de las frecuencias absolutas


acumuladas para cada clase.

Gráficos estadísticos

Los gráficos estadísticos son parte de las herramientas de presentación de datos y


son utilizados para presentar el resultado de un estudio, experimento o cualquier
otro tipo de dato que se requiera presentar mediante gráficas, los más usados son:
gráfica de barras, diagrama de puntos, histogramas, polígonos de frecuencia,
diagrama circular, ojiva: ascendente y descendente

1. Gráfica de barras

Este tipo de grafica se utilizan con frecuencia para describir datos, consiste
básicamente en ordenar los sucesos de mayor a menor, necesitarían
generalmente de dos o tres elementos que representen más de la mitad de la
frecuencia total. (Taylor R. C., 2008)

Ejemplo 1: En un curso escolar 45 estudiantes son llevados a un campamento, a


los cuales se les concede elegir un deporte al azar: 11 juegan fútbol, 9 juegan
básquetbol, 5 juegan tenis, 10 juegan hockey, 7 deciden nadar y 3 no hacen nada
mediante la gráfica de barras presentar estos datos:

12

10

0
fútbol hockey basketball nadar tennis no hacen
deporte
CARRERAS EN LÍNEA

2. Diagrama de puntos

El diagrama de puntos resume visualmente toda la información de la proporción y


distribución de una variable y valorar el desvió de la normalidad.

En este grafico se comparan las proporciones acumuladas de una variable con las
de una distribución normal, si la variable escogida corresponde con la de la
distribución de prueba, los puntos se consolidan alrededor a una línea recta.
(Taylor R. A., 2012)

Ejemplo 2: con los datos de la tabla 1. Elabore un diagrama de puntos

71.1; 6

47.7; 5 55.5; 5

39.9; 4

63.3; 0
0 1 2 3 4 5 6

3. Histogramas
Es el diseño más frecuentemente usado de presentación grafica dentro de una
distribución de frecuencias debido a que nos permite observar las pautas, este
proporciona un resumen de la variación de un grupo de datos. Se realizan con
rectángulos adyacentes, la altura de estos representa las frecuencias de la clase y
las bases de los mismos se esparcen entre límites de clases sucesivas. (Taylor R.
C., 2008)
Ejemplo 3: con los datos de la tabla 1. Elabore un histograma
CARRERAS EN LÍNEA

Histograma
7

0
[36;43.8) [43.8;51.6) [51.6;59.4) [59.4;67.2) [67.2;75]

4. Polígonos de frecuencia

Es un gráfico creado por la unión de rectas, partiendo desde el origen del grafico
de histograma y prolongándose con la unión de los puntos medios de cada clase
del gráfico.
Ejemplo 4: Con el uso de los datos de la tabla 1. Elabore un polígono de
frecuencia

Polígono de frecuencia
7
6
5
4
3
2
1
0
0 39.9 47.7 55.5 63.3 71.1 y mayor …

5. Diagrama circular
Conocido comúnmente como pastel, pie o manzana. Es un círculo divido en varias
partes dependiendo de las clases que tenga la variable, de manera que a cada
una le corresponda un arco de circulo proporcional a su frecuencia absoluta o
relativa.
CARRERAS EN LÍNEA

Ejemplo 5: Tomando los datos del ejercicio 1, realizar un gráfico de pastel

DEPORTES
no hacen deporte futbol
nadar
10% 22%
14%
basketball
hockey 18%
20% tennis
correr
6% 10%

futbol basketball tennis correr hockey nadar no hacen deporte

6. Ojiva

Semejante a los polígonos de frecuencia acumulada, básicamente relacionan el


límite inferior con los valores almacenados de frecuencia; dentro de su aplicación
responde a interrogantes como: ¿qué dato pertenece a dicha proporción
acumulada? Para construirlas debemos tomar en cuenta dos criterios:

» Ojiva ascendente

Es una curva creciente que tiene en su inicio frecuencia cero y su término se da en


el total de las observaciones.

Ejemplo 6: Con el uso de los datos de la tabla 1. Elabore una ojiva ascendente

Ojiva ascendente
25

20

15

10

0
0 39.9 47.7 55.5 63.3 71.1
CARRERAS EN LÍNEA

» Ojiva descendente

Es una curva decreciente; es decir es puesta a la ojiva ascendente, su inicio se da


en el total de las observaciones y culmina en cero.

Ejemplo 7: Con el uso de los datos de la tabla 1 elabore el grafico.

Ojiva descendente
25

20

15

10

0
39.9 47.7 55.5 63.3 71.1

Ejemplo #2: Se ha aplicado una encuesta a 40 centros educativos con el fin de


observar el número de niños que estudian en ellos, obteniéndose:

42 58 79 86 98 120 134 120 59 62

85 89 76 110 104 78 84 96 90 75

120 130 122 95 82 94 108 79 105 115

102 80 56 78 84 66 69 78 84 98
CARRERAS EN LÍNEA

a) Realice una tabla de frecuencia


b) Grafique el histograma, polígono de frecuencia y ojiva

Primeramente vamos a ordenar de manera ascendente los datos:

42 56 58 59 62 66 69 75 76 78

78 78 79 79 80 82 84 84 84 85

86 89 90 94 95 96 98 98 102 104

105 108 110 115 120 120 120 122 130 134

m: Es el número total de clases o intervalos.


a) 𝑚 = √𝑛
𝑚 = √40 = 𝟔

𝑅 = 𝑅𝑎𝑛𝑔𝑜 = 𝑀𝑎𝑥 − 𝑀𝑖𝑛.

𝑅𝑎𝑛𝑔𝑜 134−42
Amplitud: 𝑎 = = = 15,33⁡ ≈ 𝟏𝟔
𝑚 6

𝑓𝑖 : Frecuenta absoluta. Es la cantidad de veces que se repite los números que se


encuentran en el intervalo de las clases.

𝑥𝑖 : Es la marca de clase, se refiere al punto medio dentro de un intervalo de clase,


lo que vendría a ser igual a la mitad de la sumatoria de las fronteras de clases, es
(𝐶1 +𝐶2)
decir .
2

𝐹𝑖 : Frecuencia absoluta acumulada. Es la sumatoria de las frecuencias absolutas


acumuladas para cada clase.
CARRERAS EN LÍNEA

# de Intervalos Menor que Mayor que


Xi fi hi
clases de clase
Fi Hi Fi Hi

1 [42 – 58) 50 2 0,05 2 0,05 40 1

2 [58 – 74) 66 5 0,125 7 0,175 38 0,95

3 [74 – 90) 82 15 0,375 22 0,55 33 0,825

4 [90 – 106) 98 9 0,225 31 0,775 18 0,45

5 [106 – 122) 114 6 0,15 37 0,925 9 0,225

6 [122 – 138) 130 3 0,075 40 1 3 0,075

40

Tabla 2. Tabla de frecuencia para datos agrupados.

Histograma
16

14

12
Frecuencia Absoluta

10

0
[40 – 58) [58 – 74) [74 – 90) [90 – 106) [106 – 122) [122 – 138)
Intervalos de clase
CARRERAS EN LÍNEA

Poligono de Frecuencia
16
14
12
Frecuencia Absoluta

10
8
6
4
2
0
[40 – 58) [58 – 74) [74 – 90) [90 – 106) [106 – 122) [122 – 138)
Intervalos de clase

Ojiva - menor que


45
40
35
Frecuencia Absoluta

30
25
20
15
10
5
0
[40 – 58) [58 – 74) [74 – 90) [90 – 106) [106 – 122) [122 – 138)
Intervalos de clase
CARRERAS EN LÍNEA

Ojiva - mayor que


45
40
35
Frecuencia Absoluta

30
25
20
15
10
5
0
[40 – 58) [58 – 74) [74 – 90) [90 – 106) [106 – 122) [122 – 138)
Intervalos de clase

Recursos complementarios:
Los siguientes recursos complementarios son sugerencias para que se pueda ampliar la
información sobre el tema trabajado, como parte de su proceso de aprendizaje
autónomo:

● Ponteville, Christiane Cynthia “¿Para Qué Enseñamos Estadística?” Recuperado


de https://core.ac.uk/download/pdf/33251013.pdf
● Barreto-Villanueva, Adán “El progreso de la Estadística y su utilidad en la
evaluación del desarrollo” Recuperado de
https://www.redalyc.org/pdf/112/11224638010.pdf
● Rendón-Macías, Villasís-Keever, & Miranda-Novales “Estadística descriptiva”
Recuperado de https://www.redalyc.org/pdf/4867/486755026009.pdf
● Gutiérrez Álvarez, Babativa, & Lozano “Presentación de datos” Recuperado de
https://www.redalyc.org/pdf/562/56220111.pdf
● Wackerly, Mendenhall, Scheaffer “Estadística Matemática con Aplicaciones”
Recuperado de
https://www.cimat.mx/ciencia_para_jovenes/bachillerato/libros/[Wackerly,Mendenh
all,Scheaffer]Estadistica_Matematica_con_Aplicaciones.pdf
CARRERAS EN LÍNEA

Referencias:

Lind, D., Marchal, W., & Wathen, S. (2012). Estadistica aplicada a los negocios y la
economía. Estadistica aplicada a los negocios y la economía (Vol. 15).
https://doi.org/10.1007/s13398-014-0173-7.2

Miller, I., & Freund, J. E. (1993). Probabilidad y estadística para ingenieros.

Johnson, R. A. (2012). Probabilidad y estadística para ingenieros. México: Pearson


Educacion

Babativa, Á. M. (2004). Estadística aplicada a la educación. Bogotá: Pearson Educación.

Taylor, R. A. (2012). Probabilidad y estadística para ingenieros. México: Pearson


Educación.

Triola, M. F. (2004). Probabilidad y estadística. México: Pearson Educacion

Taylor, R. A. (2008). Bioestadística. México: PEARSON

Murray R. Spiegel & Larry J. Stephens. (2009). México: Mc Graw Hill.

Rubin, R. I. (2010). Estadística para administación y economía. México: Pearson Educación.


UNIVERSIDAD ESTATAL DE MILAGRO
CARRERAS EN LÍNEA

PROBABILIDAD Y ESTADISTICA
DOCUMENTO BASE DE LECTURA DEL TEMA Nº 1
“ESTADISTICA DESCRIPTIVA”
Universidad Estatal de Milagro – UNEMI

Este compendio recoge textualmente documentos e información de varias fuentes debidamente citadas, así
como referencias elaboradas por el autor para conectar los diferentes temas.
Se lo utilizará únicamente con fines educativos
CARRERAS EN LÍNEA

Unidad 1.- Estadistica Descriptiva 3


Tema 1: Medidas de tendencia central 3
La media aritmética datos no agrupados y agrupados 3
La mediana para datos no agrupados y agrupados 4
La moda para datos no agrupados y agrupados 5
Calculo de la media aritmética 7
Calculo de la mediana 7
Calculo de la moda 7
Medidas de Dispersion para datos no agrupados y agrupados 11
Varianza para datos no agrupados y agrupados 11
Desviación Estándar para datos no agrupados y agrupados 11
Cuartiles, Deciles y percentiles 15
Cuartiles 10
Deciles 16
percentiles 16
Coeficiente de variación 20
Bibliografía: 21
CARRERAS EN LÍNEA

Probabilidad y Estadística
Unidad 1.- Estadística Descriptiva

Tema 2: Medidas de tendencia central y medidas de dispersión


Subtemas:
1. Medidas de Tendencia Central para datos agrupados y no agrupados.
2. Medidas de Dispersión para datos agrupados y no agrupados.
3. Medidas de posición: Cuartiles, Deciles y percentiles.
4. Coeficiente de variación.

Objetivo

Diferenciar la aplicación de las medidas de tendencia central y dispersión para datos


agrupados y no agrupados.

Desarrollo de subtemas:

Subtema 1: Medidas de Tendencia Central para datos agrupados y no agrupados.


La media aritmética datos no agrupados y agrupados.
Es una medida de tendencia central frecuentemente utilizada cuando hacemos
referencia al promedio de algo en ese caso estamos hablando de media aritmética.

Para datos no agrupados

Para realizar el cálculo de la media aritmética de datos no agrupados realizamos la


suma de todas las observaciones y se las divide para el total de datos analizados.

∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛

𝑥̅ = Es la media aritmética

n= cantidad total de datos u observaciones

𝑥𝑖 = Cada uno de los datos u observaciones.

Utilizada para tamaño de muestra pequeños

Para datos agrupados

Para realizar el cálculo de la media aritmética en datos agrupados primero se procede


a calcular el punto medio de clase y los multiplicamos por cada frecuencia absoluta y
CARRERAS EN LÍNEA

procedemos a realizar la suma de todos los resultados y dividimos la suma para el


total de datos analizados.

∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖
𝑥̅ =
𝑛

Donde

𝑥𝑖 = es el punto medio de cada clase

𝑓𝑖 = es la frecuencia absoluta de cada clase

m= número total de clases o intervalos

n= es el total de los datos analizados

La mediana para datos no agrupados y agrupados


Es otra medida de tendencia central (MTC) pero muy diferente a cualquier MTC, esta
es un único valor del grupo de datos dedicada a medir la observación central del
grupo o conjunto; en una observación se la determina como la que se encuentra más
al centro del conjunto de datos; es decir la mitad de los datos se encuentra por
encima y la otra mitad por debajo. (Stephens, Estadística, 2009)

Para datos no agrupados

Para realizar el cálculo de la mediana en datos no agrupados primero se procede a


organizar los datos de forma ascendente o descendente; si el conjunto de datos
analizados es un número impar la mediana será el dato de en medio del arreglo y si
por el contrario es un número par la mediana será el promedio de los dos elementos
de en medio.

𝑥(𝑛⁄2) + 𝑥(𝑛+1)
2
𝑛 𝑝𝑎𝑟 𝑀𝑒 =
𝑀𝑒 = 2
𝑛+1
{ 𝑛 𝑖𝑚𝑝𝑎𝑟 𝑀𝑒 = 𝑥 ( )
2

Donde

𝑥(𝑛⁄2) = es el valor que se selecciona de los datos ordenados conforme a la ubicación


obtenida de la operación n dividido para 2.

n= es el total de los datos analizados


CARRERAS EN LÍNEA

Para datos agrupados

Frecuentemente no se tiene un acceso a los datos hasta después de haber sido


agrupados, es ahí cuando procedemos a realizar el cálculo para datos agrupados.
(Rubin, 2010)

Para realizar el cálculo de la clase que contiene a la mediana en datos agrupados se


debe comparar el valor de 𝑛⁄2 con cada uno de los elementos de la columna de
frecuencia acumulada absoluta (F i) y se debe seleccionar aquel elemento que cumpla
o satisfaga que el 𝑛⁄2 este incluido en dicho valor.

𝑛+1
( ) − (∑ 𝑓𝑐 + 1)
𝑀𝑒 = 𝐿1 + [ 2 ]∗𝑎
𝑓𝑑

Dónde:

𝑳𝟏 = es el mínimo de la clase que contiene a la mediana

𝒏
= es la cantidad de los datos dividida para 2
𝟐

∑ 𝒇𝒄 = es la sumatoria de las frecuencias antes de la clase que contiene a la mediana

𝒇𝒅 = es la frecuencia absoluta de la clase que contiene a la mediana

a= amplitud de cada una de las clases

La moda para datos no agrupados y agrupados


Según Triola (2004) En una distribución se la denominada como el valor de una
variable que se repite con mayor frecuencia. Un conjunto de datos puede tener una
moda (unimodal), dos o más modas (polimodal) o a su vez puede no tener moda
(amodal). A nivel nominal de medición de datos es la única que puede usarse,
recordando que el nivel nominal de medición es aplicable a datos que contengan
únicamente nombres, etiquetas o categorías. La moda se presenta en:

a) Datos no agrupados
Cuando los datos ya han sido ordenados de manera ascendente y descendente se
visualiza los datos repetidos con mayor frecuencia, estos son los que contienen a la
moda (Mo).

b) Datos agrupados
En los datos agrupados la moda (Mo) es la marca de la clase que incluya la mayor
frecuencia absoluta (fi). Y se calcula mediante la fórmula:
CARRERAS EN LÍNEA

Δ1
𝑀𝑜 = 𝐿1 + ∗𝑎
Δ1 + Δ2

Dónde:

L1= Es el mínimo que contiene la clase de la moda

Δ1= Es la diferencia entre la frecuencia absoluta de la clase que contiene a la moda con la
anterior.

Δ2= Es la diferencia de la frecuencia absoluta de la clase que contiene a la moda con la


siguiente.

a= Amplitud.

Ejercicio #1: Se toma una muestra a 150 estudiantes de la porción de proteínas que
consumen a la semana. Obteniendo los siguientes resultados:

4,6 21 15 23,8 9,5 2,3 13,5 20,7 5,2 22,9 18.,2 22,4 21,7 7,3 23,4
21,9 10 1,5 14,5 17,3 16,2 5,3 8,2 9,1 4,7 1,6 9,8 5,4 21 17,5
12,7 15 4,7 17,3 2,8 9,7 21 2,6 10,1 5,8 8,9 18,4 11 3,9 19,9
23,7 21 15 6,4 17,7 17,5 2 10,7 14,7 15 19,5 4,9 18,3 21 23,5
11,2 3,1 16 21,1 3,5 17,6 5,5 15,6 6 15 4,2 16,3 22,7 4 24,7
8 15 7,9 8,6 10,5 24,3 8,4 18,5 9,3 19,8 17,1 11,1 24,4 13,3 22,3
22,9 21 1,9 10,8 1,3 6,7 5 16,5 3 4,8 17,1 17,8 21,9 7,8 20,5
24,1 5,3 21 14,9 8,5 15 9 15,3 15 20,2 17 2,7 17,9 21 12,5
1,8 15 15 7,8 24,2 3,4 6,3 19,2 4,5 7,5 23,8 20,3 7 13,8 21,5
14,4 21 21 11,7 9,4 21,9 21,3 15,4 23,2 14,3 7,4 24,7 11,5 14,2 22,9
Fuente: Creación propia

Calcular la media aritmética, mediana y moda para datos no agrupados.

Solución:

Primero ordenamos los datos de forma ascendente o descendente. Es este caso será
de forma ascendente

1,3 1,5 1,6 1,8 1,9 2 2,3 2,6 2,7 2,8 3 3,1 3,4 3,5 3,9

4 4,2 4,5 4,6 4,7 4,7 4,8 4,9 5 5,2 5,3 5,3 5,4 5,5 5,8

6 6,3 6,4 6,7 7 7,3 7,4 7,5 7,8 7,8 7,9 8 8,2 8,4 8,5

8,6 8,9 9 9,1 9,3 9,4 9,5 9,7 9,8 10 10,1 10,5 10,7 10,8 11

11,1 11,2 11,5 11,7 12,5 12,7 13,3 13,5 13,8 14,2 14,3 14,4 14,5 14,7 14,9
CARRERAS EN LÍNEA

15 15 15 15 15 15 15 15 15 15 15,3 15,4 15,6 16 16,2

16,3 16,5 17 17,1 17,1 17,3 17,3 17,5 17,5 17,6 17,7 17,8 17,9 18,2 18,3

18,4 18,5 19,2 19,5 19,8 19,9 20,2 20,3 20,5 20,7 21 21 21 21 21

21 21 21 21 21 21,1 21,3 21,5 21,7 21,9 21,9 21,9 22,3 22,4 22,7

22,9 22,9 22,9 23,2 23,4 23,5 23,7 23,8 23,8 24,1 24,2 24,3 24,4 24,4 24,42

» Calculo de la media aritmética


Procedemos a sumar todos los datos que ordenamos y lo dividimos para el número
total de datos.
∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛

2038.42
𝑥̅ =
150

𝑥̅ = 13,5894

» Calculo de la mediana
Para este ejercicio utilizamos la fórmula de mediana para datos pares debido a que la
cantidad de nuestros datos es 150 un número par. Procedemos a colocar 150 en “n”
obteniendo
𝑥(𝑛⁄2) + 𝑥(𝑛+1)
2
𝑀𝑒 =
2
𝑥(150⁄2) + 𝑥 150
(
2
+1) 𝑥75 + 𝑥76
𝑀𝑒 = =
2 2
Visualizamos en la tabla cual es el valor del dato número 75 y 76; para este ejercicio
es 14,9 y 15, procedemos a sumarlos y dividirlos para 2 obteniendo:
14,9 + 15
𝑀𝑒 =
2
𝑀𝑒 = 14.95

» Calculo de la moda
Cuando los datos ya han sido ordenados, procedemos a visualizar el dato que se
repite con mayor frecuencia.
Para este ejercicio la moda es 15 y 21, debido a que ambos valores se repiten con
una frecuencia igual a 10, por lo tanto, los resultados sería Mo1=15 y Mo2=21.
CARRERAS EN LÍNEA

Con los mismos datos de ejercicio 1 elabore una tabla de frecuencia para datos
agrupados y determine la media aritmética, mediana, moda desarrollar la tabla de
datos agrupados con m = 1 + 3.3 log(n).

Solución:

Primeros elaboramos y completamos la tabla de frecuencia. Debido a que el ejercicio


nos indica la fórmula a aplicar para el número de clases y obtenemos lo siguiente:
𝑚 = 1 + 3.3 log(𝑛)
𝑚 = 1 + 3.3 log(150)
𝑚=8
Ahora calculamos la amplitud

𝑟𝑎𝑛𝑔𝑜 𝑚𝑎𝑥 − min 24,4 − 1.3


𝑎= = = = 2,88
𝑚 m 8
Completamos las clases, sumándole al mínimo la amplitud (2,88) y así
consecutivamente hasta llegar a la clase 8 con el valor máximo completando los
intervalos. Luego de tener los intervalos visualizamos los datos que nos dieron
anteriormente y completamos la columna de la frecuencia absoluta (fi) con los valores
que se encuentran dentro de cada uno de los intervalos. A continuación, procedemos
a sumar de cada clase los intervalos y dividirlos para 2 completando la columna de
los x i.

Xi
1,3 + 4,19
= 2.75
2
4,19 + 7,08
= 5,64
2
7,08 + 9,97
= 8,53
2
9,97 + 12,86
= 11,42
2
12,86 + 15,75
= 14,31
2
15,75 + 18,64
= 17,20
2
CARRERAS EN LÍNEA

18,64 + 21,53
= 20,09
2
21,53 + 24,42
= 22,98
2
Sumatoria 102,92
Luego multiplicamos los fi*xi. y por ultimo para completar la columna de la frecuencia
absoluta acumulada, vamos a sumar cada frecuencia absoluta más la siguiente.

Procedemos a completar la tabla.

m Clases fi Xi fi*xi Fi
1 [1.3;4.19) 16 2.75 44 16
2 [4.19;7.08) 19 5.64 107.16 35
3 [7.08;9.97) 19 8.53 162.07 54
4 [9.97;12.86) 12 11.42 137.04 66
5 [12.86;15.75) 22 14.31 314.82 88
6 [15.75; 18.64) 19 17.20 326.8 107
7 [18.64; 21.53) 22 20.09 441.98 129
8 [21.53; 24.42] 21 22.98 482.58 150

Ahora procedemos a realizar los cálculos que nos piden en el ejercicio

» Calculo de la media aritmética


∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖
𝑥̅ =
𝑛
Procedemos a sumar todos los valores de la columna fi*xi y los dividimos para el
número total de datos analizados (n)

2016,45
𝑥̅ =
150

𝑥̅ = 13.443

» Calculo de la mediana
𝑛+1
( 2 ) − (∑ 𝑓𝑐 + 1)
𝑀𝑒 = 𝐿1 + [ ]∗𝑎
𝑓𝑑
CARRERAS EN LÍNEA

Primero calculamos la clase que contiene a la mediana

𝑛 150
= = 75
2 2
Buscamos en la frecuencia absoluta acumulada (Fi) el valor que contenga a 75 esta
será la clase que contiene la mediana en este caso es la clase 5.

Procedemos a buscar L1 es el mínimo de la clase que contiene a la mediana (5) en


este caso es 12,86. Calculamos la suma de las frecuencia absolutas antes de la clase
que contiene a la mediana, es decir la suma de la clase 1 hasta la clase 4; ∑ fc =
16+19+19+12 = 66; para fd se escoge el valor de la frecuencia absoluta que contiene
a la mediana para este ejercicio es 22. La amplitud la encontramos anteriormente
siendo 2.89

Colocamos todos los datos en la fórmula y obtenemos la mediana

75 − 66
𝑀𝑒 = 12,86 + ∗ 2,89
22
𝑀𝑒 = 14,04
» Calculo de la moda
Δ1
𝑀𝑜 = 𝐿1 + ∗𝑎
Δ1 + Δ2
La clase que contiene a la moda es el mayor valor de las frecuencias absolutas, este
ejercicio tiene dos modas: en la clase 5 y en la clase 7 debido a que en estas dos
clases el valor de la frecuencia absoluta es 22.

Moda 1 en la clase 5

Procedemos a observar el valor de mínimo de la clase que contiene a la moda ( L1 ) en


este caso es 12,86, luego calculamos Δ1 que es la diferencia entre la frecuencia
absoluta que contiene a la moda con la anterior Δ1 = 22 − 12 = 10; para calcular Δ2
calculamos la diferencia entre la frecuencia absoluta que contiene a la moda con la
siguiente Δ2 = 22 − 19 = 3 con resultado de la misma amplitud (a) que calculamos la
mediana. Procedemos a introducir los datos en la fórmula.

10
𝑀𝑜 = 12,86 + ∗ 3,3
10 + 3
𝑀𝑜 = 15,39
Moda 2 en la clase 7

Procedemos a realizar los mismos cálculos de la moda uno obteniendo:


CARRERAS EN LÍNEA

𝐿1 = 18,64

Δ1 = 22 − 19 = 3

Δ2 = 22 − 21 = 1

a = 2,89

Procedemos a introducir los datos en la fórmula

3
𝑀𝑜 = 18,64 + ∗ 2,89
3+1
𝑀𝑜 = 20,81

Subtema 2: Medidas de Dispersión para datos agrupados y no agrupados.


Medidas de Dispersión para datos agrupados y no agrupados.

Varianza para datos no agrupados y agrupados


La varianza es una medida de dispersión donde las mediciones son el resultado de
los cuadrados de las distancias entre cada observación (datos no agrupados) o cada
clase (datos agrupados) y la media respectiva del conjunto de observaciones. Por
reglas aritméticas la varianza y la desviación estándar siempre serán no negativas,
aunque si no existe variación dentro del conjunto de datos y de la misma manera la
totalidad de los valores de la muestra son los mismos, los dos estadísticos serán igual
a cero. (Murray R. Spiegel & Larry J. Stephens, 2009)
Se la obtiene mediante la siguiente formula:
Para datos no agrupados:
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎2 =
𝑛
Para datos agrupados:

2
∑𝑚
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )
2
𝜎 =
𝑛
La mayoría de las ocasiones, no se tiene la totalidad de las mediciones de una
determinada población disponibles, por ello será de utilidad realizar el cálculo de la
varianza de una muestra de n mediciones.
CARRERAS EN LÍNEA

Desviación Estándar para datos no agrupados y agrupados

La desviación estándar conocida también como desviación típica es definida como


una medida de dispersión para variables de razón y de intervalo, es de gran utilidad
para distribuir los datos de su media debido a ello se mide en las mismas unidades de
la variable. (Johnson, 2012) Para encontrar la varianza y desviación estándar
procedemos a seguir los siguientes pasos:
1. Calcular la sumatoria de todos los valores (datos no agrupados) o clases
(datos agrupados) y la diferencia entre estos y la media.
2. Elevar al cuadrado el resultado.
3. Dividir el total entre n, para obtener la varianza de la muestra.
4. Extraer la raíz cuadrada de la varianza para obtener la desviación estándar de
la muestra

Para entrar en detalle no es suficiente con conocer las medidas de tendencia central,
sino también las medidas de dispersión como lo es la desviación estándar la cua l
representa los datos en su distribución, con el único objetivo de tener una proyección
a la realidad para poder tener una buena descripción e interpretación para la toma de
decisiones (Triola, 2004)
Para datos no agrupados:

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎=√
𝑛

Para datos agrupados:

∑𝑚
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )
2
𝜎=√
𝑛
Donde
» fi = frecuencia absoluta de cada clase.
» xi = puntos medios de cada clase.
» x̅= media aritmética de los datos.
» n= número total de datos.
» m= número total de clases.

Ejercicios de aplicación
1. Dada los siguientes datos calcular la desviación estándar y varianza para
datos no agrupados. Sabiendo que su media aritmética es 163,67
CARRERAS EN LÍNEA

147 149 149,5 152 155

155,2 163,4 166,65 168 169

170 171 171,5 179,8 188

Fuente: Creación propia


Resolvemos:

Procedemos a realizar la resta de cada uno de los valores con la media y los
elevamos al cuadrado (xi − x̅)2 ; obteniendo

|𝒙𝒊 − 𝒙
̅| 16,67 14,67 14,17 11,67 8,67 8,47 0,27 2,98
̅)𝟐
(𝒙𝒊 − 𝒙 277,88 215,20 200,78 136,15 75,16 71,74 0,07 8,88
Fuente: Creación propia

|𝒙𝒊 − 𝒙
̅| 4,33 5,33 6,33 7,33 7,83 16,13 24,33
̅)𝟐
(𝒙𝒊 − 𝒙 18,74 28,40 40,06 53,72 61,30 260,17 591,94
Fuente: Creación propia

» Calculamos la varianza
Sumamos todos los valores de (xi − x̅)2 y los dividimos para la cantidad de datos

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎2 =
𝑛
2040,19
𝜎2 =
15
𝜎 2 = 136,01

» Calculamos la desviación estándar


Le sacamos la raíz cuadrada a la varianza.

∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝜎= √
𝑛

2040,19
𝜎=√ = √163,01
15

𝜎 = 11,66

2. Se conoce que la media aritmética de una tabla de frecuencia es 163,67. Para


15 datos analizados. Dada la tabla: calcular la varianza, la desviación
estándar.
CARRERAS EN LÍNEA

M Clases 𝒇𝒊 𝒙𝒊
1 [147 ; 155,2) 5 151,1

2 [155,2 ; 163,4) 1 159,3


3 [163,4 ; 171,6) 7 167,5
4 [171,6 ; 179,8) 0 175,7
5 [179,8 ; 188] 2 183.9

Sumatoria 15
Fuente: creación propia
Para el cálculo de la varianza y desviación estándar restamos los puntos medios de
cada clase con la media dada (163,67), los elevamos al cuadrado y los multiplicamos
por su frecuencia absoluta respectiva. fi (xi − x̅)2
Realizamos el mismo cálculo para el coeficiente de asimetría con la diferencia que
elevemos al cubo el resultado de la multiplicación de la frecuencia absoluta con la
resta de los puntos medios de cada clase y su media. fi (xi − x̅)3
Al final calculamos el coeficiente de apuntamiento, pero en este caso elevemos a la
cuarta la resta de los puntos medios de cada clase y su media. fi (xi − x̅)4
Hacemos la sumatoria de todos los valores y completamos la tabla y calculamos los
ítems del enunciado.

m clases 𝒇𝒊 𝒙𝒊 |𝒙𝒊 − 𝒙
̅| ̅)𝟐
𝒇𝒊 (𝒙𝒊 − 𝒙 ̅)𝟑
𝒇𝒊 (𝒙𝒊 − 𝒙 ̅)𝟒
𝒇𝒊 (𝒙𝒊 − 𝒙
1 [147 ; 155,2) 5 151,1 12,57 790,02 9930,60 124827,74

2 [155,2 ; 163,4) 1 159,3 4,37 19,09 83,45 364,69


3 [163,4 ; 171,6) 7 167,5 3,83 102,68 393,27 1506,23
4 [171,6 ; 179,8) 0 175,7 12,03 0 0 0
5 [179,8 ; 188] 2 183.9 20,23 818,50 16558,37 334975,87

sumatoria 15 1730,29 26965,69 461674,53


Fuente: creación propia.

» Calculo de la varianza

Restamos los puntos medios de cada clase y los elevamos al cuadrado.

∑𝑚
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )
2
𝜎2 =
𝑛
CARRERAS EN LÍNEA

1730,29
𝜎2 =
15
𝜎 2 = 115,35
» Calculo de la desviación estándar
Le sacamos la raíz cuadrada a la varianza

∑𝑚
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )
2
𝜎=√
𝑛

𝜎 = √115,35
𝜎 = 10,74

Subtema 3: Medidas de posición: Cuartiles, Deciles y percentiles.


Cuartiles, Deciles y percentiles.
A los cuartiles, deciles, percentiles y otros valores que se obtienen a partir de la
división del conjunto de datos en partes iguales se les denomina conjunto de
cuartiles.

Cuartiles (𝑸𝒌 )

Son medidas estadísticas que se encargan de dividir un conjunto de datos en cuatro


partes iguales.

El valor del Q 2 es el valor de la mediana, es decir ambos valores coinciden.

“Existen tres reglas básicas para realizar el cálculo de los cuartiles:

Regla 1: Si el número resultante es un valor entero, entonces este cuartil será igual al
valor clasificado.

Regla 2: Si el número resultante es una fracción a mitad (3.5, 4.5.etc), entonces el


cuartil será igual al promedio de los valores clasificados.

Regla 3: Si el número resultante no ese encuentra entre un valor entero o una


fracción a mitad, se procede a redondear al número más próximo y se elige ese valor
clasificado.” (Stephens, Estadística, 2009)

Se lo realiza mediante la siguiente fórmula:


CARRERAS EN LÍNEA

𝑛
𝑘 (4 ) − 𝐹𝑘
𝑄𝑘 = 𝐿𝑘 + ∗𝑎
𝑓𝑘

Dónde:

k= para los cuartiles, van a ser los elementos 1, 2, 3

𝑳𝒌 = el mínimo de la clase que contiene el cuartil

𝒏
𝒌 ( )=clase que contiene el cuartil
𝟒

𝑭𝒌 = representa la sumatoria de las frecuencias absolutas antes de la clase que contiene


el cuartil

𝒇𝒌 = representa a la frecuencia absoluta de la clase que contiene el cuartil

a= amplitud de cada una de las clases

Deciles (𝑫𝒌 )

De manera similar a los cuartiles, pero en este caso los deciles son medidas
estadísticas que dividen a un conjunto de datos en diez partes iguales, a partir de la
siguiente formula:

𝑛
𝑘 (10) − 𝐹𝑘
𝐷𝑘 = 𝐿𝑘 + ×𝑎
𝑓𝑘

El valor del D5 coincide con el valor de la mediana.

Percentiles (𝑷𝒌)

Son medidas estadísticas que separan un conjunto de datos en cien partes iguales. El
P50 coincide con la mediana y los percentiles 25 y 75 coinciden con el primer y tercer
cuartil (Johnson, 2012).

𝑛
𝑘 (100) − 𝐹𝑘
𝑃𝑘 = 𝐿𝑘 + ∗𝑎
𝑓𝑘

Con los mismos datos de ejercicio 1 donde está elaborada la tabla de frecuencia
para datos agrupados determine P56, D8, Q3.

» Calculamos el 𝑸𝟑
𝑛
𝑘 (4 ) − 𝐹𝑘
𝑄𝑘 = 𝐿𝑘 + ×𝑎
𝑓𝑘
CARRERAS EN LÍNEA

Primero calculamos la ubicación del cuartil (Q)

Donde k será el cuartil que deseamos buscar y n el total de los datos analizados

𝑛 150
𝑘 (4 ) = 3 ( ) = 112,5.
4

Buscamos la clase que contenga en su frecuencia absoluta acumulada el valor de la


ubicación del cuartil (112,5) para este ejercicio será la clase 7 la que contenga el
Q3. Lk es mínimo de la clase que contiene al cuartil para este ejercicio es 18,64. Para
Fk es el valor de la frecuencia absoluta acumulada antes de la clase que contiene al
cuartil en este caso es 107; para fk será el valor de la frecuencia absoluta de la clase
que contiene al cuartil para este ejercicio es 22 y la amplitud será la misma que
calculamos para la mediana y moda a=2,89. Procedemos a ingresar los datos en la
fórmula:
150
3 ( 4 ) − 𝐹3
𝑄3 = 𝐿3 + ×𝑎
𝑓3

112.5 − 107
𝑄3 = 18,64 + × 2,89
22
𝑄3 = 19.36
Para calcular el Decil y Percentil se siguen los mismos pasos del cálculo del cuartil
con la diferencial que para la ubicación del decil lo dividimos para 10 y el percentil
para 100.

» Calculamos el D8
𝑛 150
𝑘( ) = 8( ) = 120 Ubicación del cuartil 8.
10 10

𝑛
𝑘 (10) − 𝐹𝑘
𝐷𝑘 = 𝐿𝑘 + ×𝑎
𝑓𝑘

120 − 107
𝐷8 = 18,64 + × 2,89
22
𝐷8 = 20.35
» Calculamos el P 56
𝑛 150
𝑘 (100) = 56 (100) = 84 Ubicación del percentil 56 .
𝑛
𝑘( ) − 𝐹𝑘
100
𝑃𝑘 = 𝐿𝑘 + ×𝑎
𝑓𝑘
CARRERAS EN LÍNEA

84 − 66
𝑃56 = 12,86 + × 2,89
22
𝑃56 = 15,22
Procedemos a completar la tabla con los valores encontrados y las clases
correspondiente a la mediana, moda, cuartil 3, decil 8 y percentil 56.

m Clases fi Xi fi*xi Fi
1 [1.3;4.19) 16 2.75 44 16
2 [4.19;7.08) 19 5.64 107.16 35
3 [7.08;9.97) 19 8.53 162.07 54
4 [9.97;12.86) 12 11.42 137.04 66
clase que contiene 5 [12.86;15.75) 22 14.31 314.82 88
a la mediana, moda
1 y P56

6 [15.75; 18.64) 19 17.20 326.8 107


Clase que contiene 7 [18.64; 21.53) 22 20.09 441.98 129
la moda 2, D8 y Q3

8 [21.53; 24.42] 21 22.98 482.58 150

SUMATORIA 150 2016,45

1. Se conoce que la media aritmética de una tabla de frecuencia es 25 para


100 datos analizados. Encontrar los valores que faltan en la tabla:
m Clases fi xi fi * xi
1 [2,2- A
2 16
3 21
4 4
5 B
6 -62,2] 8
Sumatoria 100

Calculamos la amplitud

𝑟𝑎𝑛𝑔𝑜 𝑀𝑎𝑥 − 𝑀𝑖𝑛 62,2 − 2,2 60


𝑎= = = = = 10
𝑚 𝑚 6 6
CARRERAS EN LÍNEA

Completamos las clases y procedemos a buscar los puntos medios de cada clase (xi).
Sumando los intervalos de cada clase y dividiendo para dos:

Xi
14,4
2,2 + 12,2 = = 7,2
2
34,4
12,2 + 22,2 = = 17,2
2
54,4
22,2 + 32,2 = = 27,2
2
74,2
32,2 + 42,2 = = 37,2
2
94,4
42,2 + 52,2 = = 47,2
2
114,4
52,2 + 62,2 =
2
= 57,2

Procedemos a multiplicar los valores xi * fi:

xi * fi
𝑎 × 7,2 = 7,2 𝑎
16 × 17,2 = 275,2
21 × 27,2 = 571,2
4 × 37,2 = 148,8
× 47,2 = 47,2 𝑏
8 × 57,2 = 457,6

Nos dicen que la media aritmética es 25.

𝑛 = 100

∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖
𝑥̅ =
𝑛
𝑛
∑𝑖=1 𝑓𝑖 𝑥𝑖
25 =
100
CARRERAS EN LÍNEA

∑ 𝑓𝑖 𝑥𝑖 = 25 × 100 = 2500
𝑖=1

Vas a encontrar los valores que faltan por el método de igualación:

Sumamos los valores de xi y lo igualamos al total de datos analizados.

𝑎 + 16 + 21 + 4 + 𝑏 + 8 = 100

49 + 𝑎 + 𝑏 = 100

𝑎 = 100 − 49 − 𝑏

𝑎 = 51 − 𝑏

Ahora sumamos los valores de xi * fi y los igualamos a la sumatoria de los valores xi


* fi

7,2𝑎 + 275,2 + 571,2 + 148,8 + 47,2𝑏 + 457,6 = 2500

7,2𝑎 + 47,2𝑏 + 1452,8 = 2500

Remplazamos el valor de a

7,2(51 − 𝑏) + 47,2𝑏 + 1452,8 = 2500

367,2 − 7,2𝑏 + 47,2𝑏 + 1452,8 = 2500

40𝑏 = 2500 − 1820

680
𝑏= = 17
40

Reemplazamos en a: a = 51 − 17 = 34

Colocamos todos los valores en la tabla:

m clases fi xi fi * xi
1 [2,2 ; 12,2) 34 7,2 244,8
2 [12,2 ; 22,2) 16 17,2 275,2
3 [22,2 ; 32,2) 21 27,2 571,2
4 [32,2 ; 42,2) 4 37,2 148,8
5 [42,2 ; 52,2) 17 47,2 802,4
6 52,2 ; 62,2] 8 57,2 457,6
CARRERAS EN LÍNEA

Totales 100 2500

Subtema 4: Coeficiente de Variación.


Coeficiente de variación
Definida como una medida de dispersión relativa de la variación expresada en su fórmula
como un porcentaje, no tanto en términos de las unidades de los datos sino en particular;
es denotado con la simbología CV y se encarga de medir la dispersión de los datos con
respecto a la media; es adimensional dentro de un conjunto de datos, presentando un
mejor entendimiento porcentual del grado de variabilidad de la desviación estándar; es
recomendable e importante que la totalidad de sus valores sean positivos, por ende, de
acuerdo a esto su media será positiva. (Rubin, 2010) Se la realiza mediante la fórmula:
𝜎
𝐶𝑉 = ( ) 100%
𝑥̅
Dónde:
σ= desviación estándar de la muestra.
𝑥̅ = media de la muestra.
El valor del coeficiente de variación ayuda a comparar la dispersión entre un conjunto de
datos.
» Calculamos el coeficiente de variación del ejercicio de aplicación #2 del tema de
medidas de dispersión para datos agrupados.
𝜎
𝐶𝑉 = ( ) 100%
𝑥̅

10,74
𝐶𝑉 = (̅̅̅̅̅̅̅̅̅̅) 100%
163,67}
𝐶𝑉 = 6.56 %

Bibliografía

Johnson, R. A. (2012). Probabilidad y estadística para ingenieros. México: Pearson Educación.

Rubin, R. I. (2010). Estadística para administración y economía. México: Pearson Educación.

Stephens, M. R. (2009). Estadística. México: Mc Graw Hill.

Triola, M. F. (2004). Probabilidasd y Estadística. México: Pearson Edacación.


UNIVERSIDAD ESTATAL DE MILAGRO
CARRERAS EN LÍNEA

PROBABILIDAD Y ESTADISTICA
DOCUMENTO BASE DE LECTURA DEL TEMA Nº 1
“NOCIONES DE PROBABILIDAD”
Universidad Estatal de Milagro – UNEMI

Este compendio recoge textualmente documentos e información de varias fuentes debidamente citadas, así
como referencias elaboradas por el autor para conectar los diferentes temas.
Se lo utilizará únicamente con fines educativos
CARRERAS EN LÍNEA

Unidad 2.- Probabilidades 3


Tema 1: Nociones de Probabilidad 3
Permutación sin repetición 3
Permutación con repetición 3
Permutación circulares 4
Combinación sin repetición 4
Combinación con repetición 4
Espacio Muestral 4
Evento y Sucesos 5
Regla de la Adición para eventos mutuamente excluyentes 5
Regla de la Adición para eventos no mutuamente excluyentes 6
Ejercicios de Aplicación 6
Probabilidad Condicional 7
Teorema de Bayes 7
Ejercicios de Aplicación 8
Bibliografía: 11
CARRERAS EN LÍNEA

Probabilidad y Estadística
Unidad 2.- Probabilidades

Tema 1: Nociones de probabilidad


Subtemas:
1. Técnicas de Conteo: Permutación y Combinación.
2. Probabilidad de eventos: Sucesos, eventos, espacio muestral.
3. Reglas de Probabilidad: Adición y Multiplicación.
4. Probabilidad Condicional y Teorema de Bayes.
Objetivo
Calcula e interpreta probabilidades mediante la aplicación de fórmulas pertinentes.

Desarrollo de subtemas:
Subtema 1: Técnicas de Conteo: Permutación y Combinación.

Permutación
Según Levine (2006) La terminología permutar significa variar la distribución u orden en el
que permanecían dos o más cosas, en este caso es indispensable precisar si estas cosas
son o no indistinguibles para estar totalmente seguros que la nueva estructura sea en
esencia distinta a la antigua. Las permutaciones pueden ser:

a) Permutaciones sin repetición


La cantidad probable de ordenaciones que se puedan conseguir con objetos distintos
(n≥2) se da del producto de la n primeros términos al que se denota por n!, leída como
“factorial de n”, es igual a: n! =
𝑛 × (𝑛 − 1) × (𝑛 − 2) … ..
b) Permutaciones con repetición
Es el elemento que se repite n veces, es decir en las que el primer elemento se repite a
veces, el segundo b y el último se repite c, esto sucede en los diferentes grupos de
elementos en donde se puede hacer que en cada grupo dicho elemento aparezca el
número de veces indicado y que la diferencia se presente solo en el orden de colocación.
Es representado por: 𝑃𝑛 𝑎,𝑏,𝑐 . La fórmula que nos permitirá calcular el número de
permutaciones con repetición es:
𝑛!
𝑃𝑅𝑛 𝑎,𝑏,𝑐 =
𝑎! × 𝑏! × 𝑐!
CARRERAS EN LÍNEA

c) Permutaciones circulares
Estas permutaciones se aplican a conjuntos que ordenaremos de manera circular, ya que
no poseen ni un principio ni un final, es decir no tienen ni primer ni último término debido
a que todos los términos se encuentran en una línea cerrada. Para encontrar en número
de permutaciones circulares que se pueden crear, fijar la posición de un elemento, los
restantes pueden cambiar el lugar de distintas formas pudiendo así tomar todas las
posiciones dentro de la circunferencia relativa al primer punto. (Johnson, 2012) Para
hallar las permutaciones circulares utilizaremos la siguiente fórmula:
𝑃𝐶𝑛 = (𝑛 − 1)!

Combinación
Según Johnson (2012) Generalmente combinar significa unir varias cosas, de forma que
constituyan un mismo conjunto, en este caso la denominaremos como el número de
conjuntos de un determinado número de elementos que se puedan constituir en un
universo de objetos, no importa el orden de selección sino más bien los elementos que se
toman. Estas pueden ser:
1. Combinaciones sin repetición
Son los n elementos que se toman de r en r, denotada en 𝐶𝑛𝑟 a los distintos grupos de r
elementos diferentes, esto quiere decir un grupo se puede diferenciar de otro en al menos
un elemento. (Sin importar el orden de selección o colocación). Se lo halla mediante la
fórmula:
𝑛 𝑛!
𝐶𝑛𝑟 = ( ) =
𝑟 (𝑛 − 𝑟)! 𝑟!
2. Combinaciones con repetición
Los n elementos tomados de r en r, son de distintos grupos constituidos por n elementos
de forma que no permite que, entre todos los elementos, no importa el orden y permite
que se repitan los elementos, mediante la siguiente fórmula:
(𝑛 + 𝑟 − 1)
𝐶𝑅𝑛𝑟 =
𝑟! (𝑛 − 1)!

Subtema 2: Probabilidad de eventos: Sucesos, eventos, espacio muestral.


Espacio muestral (Ѕ)
Es el resultado o un grupo de resultados posibles al realizar un experimento,
generalmente consiste en todo aquello que podría ocurrir cuando se toma una muestra.
Ejemplo: Se lanza una moneda S= {cara, sello} existen dos eventos. (David M. Levine,
2006)
CARRERAS EN LÍNEA

Eventos y sucesos
Es una aseveración relacionada al producto de un evento aleatorio, se lo puede entender
como un subconjunto del espacio muestral que se ha conformado por los resultados del
experimento que hace que el suceso sea seguro. (Paula Rodas, 2009)
Luego de haber realizado el experimento de un suceso si este ocurre se procede a
verificar y sino ocurre respectivamente no se verifica. Un suceso acontece cuando el
resultado del experimento forma parte del conjunto. Se clasifican en:
» Elementales: Consta de un solo resultado
» Compuestos: Es la unión de varios elementales
Es llamado un suceso seguro al que tiene de todos los sucesos elementales Ω y suceso
imposible al que no contiene ningún elemento del espacio muestral Ø, esto da a entender
que el suceso seguro ocurre siempre y el suceso imposible no ocurre nunca.
Entre los sucesos se pueden dar operaciones que permiten que estos se unan, se corten
o se complementen de la misma manera que los subconjuntos de cualquier conjunto.
» “Unión de sucesos (𝑨 ∪ 𝑩): Es el producto del experimento que se encuentran en los
conjuntos A o en B.
» Intersección de sucesos (𝑨 ∩ 𝑩) : Son los puntos pertenecientes de A y B.
» Complementación de sucesos (Ā): Se refiere a los puntos que no se encuentran en
A.
» ̅ ) : Son los puntos que pertenecen al conjunto
Diferencia de sucesos (𝑨 − 𝑩 = 𝑨 ∩ 𝑩
A y no a B” (David M. Levine, 2006).
La diferencia entre un evento y un suceso es que los eventos son más estadísticos y
tienen más probabilidad de ocurrencia.

Subtema 3: Reglas de Probabilidad: Adición y Multiplicación.

Regla de la Adición para eventos mutuamente excluyentes


Mutuamente excluyentes significa que cuando un evento ocurre, ninguno de los demás
eventos puede ocurrir al mismo tiempo (Lind, Marchal, & Wathen, 2012).
Si dos eventos A y B son mutuamente excluyentes, la regla especial de la adición
establece que la probabilidad de que ocurra uno u otro es igual a la suma de sus
probabilidades. Esta regla se expresa mediante la siguiente fórmula:

𝑃 (𝐴 𝑜 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
CARRERAS EN LÍNEA

Regla de la Adición para eventos que no son mutuamente excluyentes

Según (Levin & Rubin, 2010) Si dos eventos no son mutuamente excluyentes, es posible
que ambos se presenten al mismo tiempo. Esta regla para dos eventos designados A y B
se escribe:
𝑃 (𝐴 𝑜 𝐵) = 𝑃 (𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
La probabilidad de que se presenten A o B cuando A y B no son mutuamente excluyentes
es igual a la probabilidad de que suceda A más la probabilidad de que suceda B menos la
probabilidad de que A y B sucedan juntos.

Ejercicios de Aplicación
 El departamento de policía de un campus necesita bicicletas nuevas para su personal de
patrullaje; las probabilidades son 0.17, 0.22, 0.03, 0.29, 0.21 y 0.08 de que comprará Bianshe,
Cannonhill, Fishim, Giante, Trec o HT. Encuentre las probabilidades de que:
a.- Cannonhill o Trec
𝑃(𝐶 𝑜 𝑇) = 𝑃(𝐶) + 𝑃(𝑇)
𝑃(𝐶 𝑜 𝑇) = 0.22 + 0.21 = 0.43
b.- Bianshe, Giante , Trec
𝑃𝑃(𝐵 𝑜 𝐺 𝑜 𝑇) = 𝑃(𝐵) + 𝑃(𝐺) + 𝑃(𝑇)
𝑃(𝐵 𝑜 𝐺 𝑜 𝑇) = 0.17 + 0.29 + 0.21 = 0.67

 El 60% de los individuos de una población están vacunados contra una cierta enfermedad.
Durante una epidemia se sabe que el 20% la ha contraído y que 2 de cada 100 individuos están
vacunados y son enfermos. Calcular el porcentaje de individuos que estén vacunados o
enfermos.
𝑃(𝐴 𝑜 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴 𝑜 𝐵) = 0.60 + 0.20 − 0.02
𝑃(𝐴 𝑜 𝐵) = 0.78
CARRERAS EN LÍNEA

Subtema 4: Probabilidad Condicional y Teorema de Bayes.

Probabilidad Condicional
Al utilizar la simbología P(A) para la probabilidad de un evento A, es significativo
determinar que se está hablando de la probabilidad de A dada en algún espacio muestral
(S), es decir que la propiedad viene dada por la notación P(A/Ѕ) y sirve para referirse a
que se está trabajando en un espacio muestral determinado; así esta notación P(A/Ѕ) se
lee como la probabilidad condicional de A sobre un determinado espacio muestral,
además la manera de utilizarla de una forma simplificada P(A) siempre que se tenga claro
que se está trabajando sobre un espacio muestral.
La probabilidad condicional ocurre al tener un conocimiento previo de los escenarios de
un evento, es decir la manera de como renovar o cambiar la probabilidad de un evento, si
se sabe que otro a ocurrido; estos pueden ser eventos dependientes o independientes, de
esta manera sean A y B dos eventos, si la probabilidad de que ocurra o no ocurra el
evento A no afecta la ocurrencia del evento B , entonces 𝑃(𝐴/𝐵) = 𝑃(𝐴) y se denota que
A y B son eventos independientes, caso contrario decimos que son eventos dependientes.
Así también si se requiere que ambos eventos ocurran (A y B) el evento suele
denominarse evento compuesto 𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴)𝑃(𝐴/𝐵). (Johnson, 2012)
Formalmente expresamos que un evento B ve ya ocurrió y queremos conocer la
probabilidad que ocurra un evento A, entonces esta probabilidad condicional viene dada
por:
𝑃(𝐴 ∩ 𝐵)
P(𝐴/𝐵) =
𝑃(𝐵)
Con P (B) > 0, es un evento dependiente.
“Regla del producto: Dado dos eventos A y B, tales que
» 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵/𝐴)𝑃(𝐴) cuando P(A)>0.
» 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴/𝐵)𝑃(𝐵) cuando P(B)>0.
Esta regla es de utilidad cuando el problema contenga varias etapas, las cuales puedan
ser generalizadas.” (Taylor, 2008)

La Probabilidad Condicional también se la puede trabajar mediante diagramas de Venn.

Teorema de Bayes
El teorema de Bayes fue desarrollada por el reverendo Thomas Bayes en el siglo XVIII y
es denominado como la prolongación de la probabilidad condicional, utilizado para
comprobar las probabilidades que se han calculado con anticipación y de las cuales se
posee nueva información. (David M. Levine, 2006)
CARRERAS EN LÍNEA

Es importante mencionar que las reglas de multiplicación sirven de gran utilidad en la


resolución de problemas, donde el producto final de un experimento va a depender de sus
etapas intermedias.

“La regla o teorema de Bayes es importante en el esquema general de la estadística, esta


regla permite utilizar P(A/B) para el cálculo de P(B/A) y se la denota como:

𝑃(𝐴𝑗 )𝑃(𝐵/𝐴𝑗 )
𝑃(𝐴𝑗 /𝐵) = 𝑘
∑𝑖=1 𝑃(𝐴𝑖 )𝑃(𝐵/𝐴𝑖 )

Siendo 𝐴𝑗 ,……,𝐴𝑘 los eventos que participan en el espacio S, de modo que P(𝐴𝐽 ) >0 para
i=1,2,3….,k y A sea un evento de manera que P(A) >0 para j=1,2,3….,k

Demostración:

𝑃(𝐴𝑗 ∩ 𝐵) 𝑃(𝐴𝑗 )𝑃(𝐵/𝐴𝑗 )


𝑃(𝐴𝑗 /𝐵) = = 𝑘
𝑃(𝐵) ∑𝑖=1 𝑃(𝐴𝑖 )𝑃(𝐵/𝐴𝑖 )

Para demostrar este resultado nos basamos para el numerador el concepto de


probabilidad condicionada y para el denominador el teorema de las probabilidades
totales.” (Taylor, 2008)

Ejercicios de aplicación
1. Suponga que 5 personas parquean su motocicleta en el mismo estacionamiento cada día.
a) ¿Cuántos cambios pueden hacerse con las cinco motocicletas?
b) ¿Cuál es la probabilidad de que una motocicleta este estacionada en el tercer lugar?

Resolvemos:
a) 𝑃5 = 5! = 5 × 4 × 3 × 2 × 1 = 𝟏𝟐𝟎
b) Una motocicleta está en el lugar determinado, la tercera, solo faltarían ordenar al azar 4
motocicletas:
𝑃4 = 4! = 4 × 3 × 2 × 1 = 24
A= una motocicleta especifica en un determinado lugar.
24 1
𝑃(𝐴) = = = 𝟎, 𝟐
120 5
CARRERAS EN LÍNEA

2. Se lanza un dado obteniendo el espacio muestral Ѕ = {1, 2, 3, 4, 5, 6}. Sean los sucesos
𝐴 = {1, 2} y 𝐵 = {3, 4}. Determine
a) 𝐴 ∩ 𝐵
b) 𝐴̅
c) 𝐵̅
d) 𝐴̅ ∩ 𝐵̅
e) 𝐴 ∩ 𝐵̅
f) 𝑃(𝐴/𝐵)
g) 𝑃(𝐴̅/𝐵̅)

Resolvemos:
a) 𝑨 ∩ 𝑩 = ∅ . no existen valores semejantes en A y B.
̅ = 3, 4, 5, 6 . Debido a que 1 y 2 si pertenecer a “A”.
b) 𝑨
̅ = 1, 2, 5, 6 . Debido a que 3 y 4 si pertenecer a “B”.
c) 𝑩
̅∩𝑩
d) 𝑨 ̅ = 5, 6 . debido a que solo 5 y 6 no pertenecen ni al suceso “A” ni al suceso “B”.
̅ = 1,2 . porque 1 y 2 pertenecen al suceso “A” y no pertenecen a “B”.
e) 𝑨 ∩ 𝑩
𝑃(𝐴∩𝐵) 0
f) 𝑷(𝑨⁄𝑩) = = =0
𝑃(𝐵) 2⁄6
2
𝑃(𝐵) = Porque solo 2 de 6 pertenecen al conjunto B.
6
2
̅
𝑨 𝑃(𝐴̅∩𝐵̅) 6 12 1
g) 𝑷 ( ̅ ) = = 4 = =
𝑩 𝑃(𝐵̅) 24 2
6

𝑃(𝐵̅ ) Porque 4 de 6 no pertenecen al conjunto B


3. Un estudiante decide presentar 3 de 5 tareas que tiene pendiente en su colegio. ¿De
cuántas maneras diferentes puede elegir esas tareas?
𝑛 𝑛!
𝐶𝑛𝑟 = ( ) =
𝑟 (𝑛 − 𝑟)! 𝑟!

n=5; r=3
5 5!
𝐶𝑛𝑟 = ( ) =
3 (5 − 3)! 3!
5 5×4×3×2×1 120
𝐶53 = ( ) = =
3 (2 × 1)(3 × 2 × 1) 12
𝑪𝟓𝟑 = 𝟏𝟎
4. Para tres autos A, B, C. se fabrican piezas del mismo material. El porcentaje de piezas que
resulta defectuosa en cada máquina es, respectivamente, 1%, 2%, 3%. Se mezclan 300
piezas 100 de cada auto y se elige una pieza al azar, que resulta ser defectuosa. ¿Cuál es la
probabilidad de que haya sido fabricada en la máquina A?
CARRERAS EN LÍNEA

D= defectuosos

̅ = no defectuosos
𝐷

D
A ̅
𝐷
100
300
D
Auto B
s ̅
𝐷
D
C
̅
𝐷
𝑃(𝐴 ∩ 𝐷) 𝑃(𝐴)𝑃(𝐷/𝐴)
𝑃(𝐴/𝐷 ) = = 𝑘
𝑃(𝐷) ∑𝑖=1 𝑃(𝐴)𝑃(𝐷/𝐴)
100 1
×
𝑃 (𝐴/𝐷 ) = 300 100
100 1 100 2 100 3
300 × 100 + 300 × 100 + 300 × 100
1
1
𝑃(𝐴/𝐷 ) = 300 =
6 6
300
𝑃(𝐴/𝐷 ) = 0.1667
5. En campeonato consta de 6 equipos de mujeres y 12 de hombres. Se desea escoger un
comité para que rinda cuentas de la participación de los equipos. Hallar la probabilidad de
a) Seleccionar 3 jóvenes de los equipos de hombre
b) Seleccionar exactamente 2 jóvenes del equipo de hombre y 1 del equipo de
mujeres
c) Seleccionar por lo menos 1 del equipo de mujeres.

Resolvemos
Eh= jóvenes equipo hombre
Em= jóvenes equoi mujeres
12 11 10 1320
a) 𝑃(3𝐸ℎ) = × × = = 0.2696
18 17 16 4896
CARRERAS EN LÍNEA

12 11 6 6 12 11 12 6 110
b) 𝑃(2𝐸ℎ 𝑦 1𝐸𝑚) = × × + × × + × × = 0.1617 +
18 17 16 18 17 16 18 17 16

0.1617 + 0.1617 = 0.4851


6 5 4 120
c) 𝑃(1 𝐸ℎ) = 1 − 𝑃(𝑠𝑜𝑙𝑜 𝑛𝑖ñ𝑎𝑠) = 1 − [ × × ] = 1−[ ] = 0.9754
18 17 16 4896

Bibliografía

David M. Levine, T. C. (2006). Estadística para la administración. México: Pearson Educación.

Johnson, R. A. (2012). Probabilidad y estadística para ingenieros. México: Pearson Educación.

Paula Rodas, L. M. (2009). Regla de la suma para calculas probabilidades de dos o más eventos.
Redalyc, 6.

Levin, R., & Rubin, D. (2010). Estadistica pra Administracion y Economía.

Lind, D., Marchal, W., & Wathen, S. (2012). Estadistica aplicada a los negocios y la economía.
Estadistica aplicada a los negocios y la economía (Vol. 15).
UNIVERSIDAD ESTATAL DE MILAGRO
CARRERAS EN LÍNEA

PROBABILIDAD Y ESTADISTICA
DOCUMENTO BASE DE LECTURA DEL TEMA Nº 2
“VARIABLE ALEATORIA DISCRETA Y CONTINUA”
Universidad Estatal de Milagro – UNEMI

Este compendio recoge textualmente documentos e información de varias fuentes debidamente citadas, así
como referencias elaboradas por el autor para conectar los diferentes temas.
Se lo utilizará únicamente con fines educativos
CARRERAS EN LÍNEA

Unidad 2.- Probabilidades 3


Tema 2: Variable aleatoria discreta y continua 3
Variable Aleatoria 3
Distribución de Probabilidad 3
Distribución de Probabilidad Binomial 4
Distribución de Probabilidad Hipergeometrica 7
Distribución de Probabilidad Poisson 8
Distribucion Normal 10
Aproximacion de la Binomial a la Normal 12
Bibliografía: 17
CARRERAS EN LÍNEA

Probabilidad y Estadística
Unidad 2.- Probabilidades

Tema 2: Variable aleatoria discreta y continua


Subtemas:
1. Conceptos de variable aleatoria, Distribución de probabilidad.
2. Distribución Binomial, Hipergeométrica y Poisson.
3. Distribución normal
Objetivo
Identificar las distribuciones de probabilidad de acuerdo a los tipos de variables discretas
o aleatorias para determinar los resultados de éxito en los ensayos.

Desarrollo de subtemas:
Subtema 1: Conceptos de variable aleatoria, Distribución de probabilidad.
Variable aleatoria
En cualquier experimento aleatorio, los resultados se presentan al azar; así, a éste se le
denomina variable aleatoria. Por ejemplo, lanzar un dado constituye un experimento:
puede ocurrir cualquiera de los seis posibles resultados. Cada valor de la variable
aleatoria se relaciona con una probabilidad que indica la posibilidad de un resultado
determinado (Lind, Marchal, & Wathen, 2012).

Según (Menhenhall, Beaver, & Beaver, 2016) una variable x es variable aleatoria si el
valor que toma, correspondiente al resultado de un experimento, es una probabilidad o
evento aleatorio. Se pueden considerar numerosos ejemplos de variables aleatorias:
 x = Número de defectos en una pieza de mueble seleccionada al azar.
 x = Calificación de examen de aptitud escolar (SAT) para un solicitando universitario
seleccionado al azar.
 x = Número de llamadas telefónicas recibidas por una línea directa de intervención en
crisis durante un periodo seleccionado al azar.

Distribución de probabilidad
Las distribuciones de probabilidad están relacionadas con las distribuciones de
frecuencias. De hecho, podemos pensar que una distribución de probabilidad es una
distribución de frecuencias teórica. Una distribución de frecuencias teórica es una
distribución de probabilidades que describe la forma en que se espera varíen los
resultados (Levin & Rubin, 2010).
CARRERAS EN LÍNEA

Según (Lind et al., 2012) dice que una distribución de probabilidad lista de todos los
resultados de un experimento y la probabilidad asociada a cada uno de ellos donde se
mencionan las principales características de una distribución de probabilidad.
1.) La probabilidad de un resultado en particular se encuentra entre 0 y 1, ósea
0 ≤ 𝑝(𝑥) ≤ 1
2.) Los resultados son eventos mutuamente excluyentes.
3.) La lista es exhaustiva. Por lo tanto, la suma de las probabilidades de los diversos
eventos es igual a 1, ósea ∑ 𝑝(𝑥) = 1

Subtema 2: Distribución Binomial, Hipergeométrica y Poisson..


Distribución Binomial
Según Richard A. y Johnson (2016) la distribución Binomial es una distribución discreta
que calcula la cantidad de éxito en una secuencia de n ensayos Bernoulli independientes
entre sí, si p determina la probabilidad de que en un solo experimento suceda un evento
(probabilidad de éxito) y q determina la probabilidad de que dicho evento no suceda en un
solo experimento (probabilidad de fracaso), por lo tanto la probabilidad de aquel evento
ocurra x veces en n experimentos, es decir que sucedan x éxitos y n-x fracasos. “Viene
dada por la siguiente fórmula:

𝑛 𝑛!
𝑃(𝑥 = 𝑘) = ( ) 𝑝 𝑘 (1 − 𝑝)𝑛−𝑘 = ∗ 𝑝𝑘 (1 − 𝑝)𝑛−𝑘
𝑘 𝑘! (𝑛 − 𝑘)!

Donde x=k= 0, 1, 2,…., n; 𝑛! = 𝑛(𝑛 − 1)(𝑛 − 2)…..1; y 0! = por definición. Donde:

n= cantidad de eventos.

X = k= cantidad de éxitos.

f(x) = probabilidad de que en un ensayo exista x éxitos en un numero n de ensayos.

Sus propiedades vienen dadas por:

Media= 𝑛 × 𝑝

Varianza= 𝑛 × 𝑝 × 𝑞

Desviación estándar: √𝑛. 𝑝. 𝑞” (Rubin, 2004)

Características
CARRERAS EN LÍNEA

“Las características más comunes de dicha serie de ensayos conocidos como ensayos
Bernoulli son:

1. La probabilidad de éxito es la misma para cada ensayo


2. El producto de los distintos ensayos es independiente.” (Aldana, 2009)
Ejercicios de aplicación
1. Se realiza el lanzamiento de una moneda 10 veces. Se solicita:
a. Obtener la probabilidad de tener 7 caras exactamente.
b. Obtener entre 4 y 7 caras.
c. A lo sumo 3 caras.
d. Al menos 2 caras.
Resolución:

n=10

p caras= 0.5

p sellos= 0.5

a. x= obtener caras
k= 7

𝑝𝑥 = 0.5

Aplicamos la fórmula:

𝑛
𝑃(𝑥 = 𝑘) = ( ) 𝑝 𝑘 (1 − 𝑝)𝑛−𝑘
𝑘

10 10
𝑃(𝑥 = 7) = ( ) 0.57 (1 − 0.5)10−7 = ( ) 0.57 (0.5)3
7 7

Resolvemos mediante combinación:

10! 1 1 10 ∗ 9 ∗ 8 ∗ 7! 1 1
𝑃(𝑥 = 7) = ( )( ) = ( )( )
3! 7! 128 8 3 ∗ 2 ∗ 1 ∗ 7! 128 8

𝑃(𝑥 = 7) = 0.117

b. X= Obtener caras
𝑝𝑥 = 0.5

K Є [4,7]
𝑃(4 ≤ 𝑥 ≤ 7) = 𝑃(𝑥 = 4) + 𝑃(𝑥 = 5) + 𝑃(𝑥 = 6) + 𝑃(𝑥 = 7)
CARRERAS EN LÍNEA

10 10 10
𝑃(4 ≤ 𝑥 ≤ 7) = ( ) (0.5)4 (0.5)6 + ( ) (0.5)5 (0.5)5 + ( ) (0.5)6 (0.5)4
4 5 6
10
+ ( ) (0.5)7 (0.5)3
7

𝑃(4 ≤ 𝑥 ≤ 7) = 0.7734

c. x= obtener caras
k= 3

𝑝𝑥 = 0.5

𝑃(𝑥 ≤ 3) = 𝑃(𝑥 = 0) + 𝑃(𝑥 = 1) + 𝑃(𝑥 = 2) + 𝑃(𝑥 = 3)

El mismo procedimiento del ítem b

𝑃(𝑥 ≤ 3) = 0.1718

d. x= obtener caras
k= 2

𝑝𝑥 = 0.5

𝑃(𝑥 ≥ 2) = 𝑃(𝑥 = 2) + 𝑃(𝑥 = 3) + … … . +𝑃(𝑥 = 10)


𝑃(𝑥 ≥ 2) = 1 − [𝑃(𝑥 = 0) + 𝑃(𝑥 = 1)

Realizamos el procedimiento de ítem b, luego 1- resultado

𝑃(𝑥 ≥ 2) = 1 − 0.0107 = 0.9892

2. Se construye una casa con cierta cantidad de departamentos. Un departamento tiene


cuatro habitaciones, cada uno con una probabilidad de 0.2 de destrucción en menos
de 1000 días. El departamento va a ser alquiló si dos de las cuatro habitaciones están
ordenados. Suponga que las habitaciones son ordenadas de manera independiente.
Encuentre la probabilidad de que:
a) Exactamente dos de las cuatro habitaciones dure más de 1000 días.
b) El departamento sea alquilado por más de 1000 días.
Resolución

q=0.2 se destruya en menos de 1000 días

a) x= “no se destruya una habitación”


𝑝𝑥 = 0.8 éxito
Aplicamos la fórmula:
CARRERAS EN LÍNEA

𝑛
𝑃(𝑥 = 𝑘) = ( ) 𝑝 𝑘 (1 − 𝑝)𝑛−𝑘
𝑘

4
𝑃(𝑥 = 2) = ( ) (0.8)2 (1 − 0.8)4−2
2

Resolvemos por combinación

𝑃(𝑥 = 2) = 0.1536

b) x= el departamento se alquile
𝑝𝑥 = 0.8 éxito
𝑃(𝑋 ≥ 2) = 𝑃(𝑥 = 2) + 𝑃(𝑥 = 3) + 𝑃(𝑥 = 4)
4 4 4
𝑃(𝑥 ≥ 2) = ( ) (0.8)2 (0.2)2 + ( ) (0.8)3 (0.2)1 + ( ) (0.8)4 (0.5)0
2 3 3

𝑃(𝑋 ≥ 2) = 0.1536 + 0.4096 + 0.4096


𝑃(𝑥 ≥ 2) = 0.972

Distribución Hipergeometrica
Según (Lind et al., 2012) la probabilidad de éxito no es la misma en todos los ensayos
cuando se realiza un muestreo sin reemplazo en una población relativamente pequeña,
no debe aplicarse la distribución binomial. En lugar de ésta se aplica la distribución
hipergeométrica. Por lo tanto, 1) si se selecciona una muestra de una población finita sin
reemplazo y 2) si el tamaño de la muestra n es mayor que 5% del tamaño de la población
N, se aplica la distribución hipergeométrica para determinar la probabilidad de un número
específico de éxitos o fracasos. Esto resulta especialmente apropiado cuando el tamaño
de la población es pequeño.
𝑀 𝑁−𝑀
( )( )
𝑃(𝑥 = 𝑘) = 𝑘 𝑛−𝑘
𝑁
( )
𝑛
Donde.
N representa el tamaño de la población.
M es el número de éxitos en la población.
k es el número de éxitos en la muestra; éste puede asumir los valores 0, 1, 2, 3…
n es el tamaño de la muestra o el número de ensayos

Una distribución de probabilidad hipergeométrica tiene las siguientes características:


1.) Los resultados de cada ensayo de un experimento se clasifican en dos categorías
exclusivas: éxito o fracaso.
CARRERAS EN LÍNEA

2.) La variable aleatoria es el número de éxitos de un número fijo de ensayos.


3.) Los ensayos no son independientes.
4.) Los muestreos se realizan con una población finita sin reemplazo y n/N > 0.05. Por lo
tanto, la probabilidad de éxito cambia en cada ensayo.

Ejercicios de aplicación
En una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad
de que sean 3 bolas blancas?
N = 12
n=4
k=3
M=7
7 5
( )( )
𝑃(𝑥 = 3) = 3 1 = 0,3535 = 35,35%
12
( )
4

De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene 3


proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que, a) los 4
exploten?, b) al menos 2 no exploten?
N = 10
n=4
k=2
M=7
7 3
( )( )
𝑃 (𝑥 = 4) = 4 0 = 0,1667 = 16,67%
10
( )
4

3 7 3 7
( )( ) ( )( )
𝑃(𝑥 ≥ 2) = 𝑃(𝑥 = 2) + 𝑃 (𝑥 = 3) = 2 2 + 3 1 = 0,3333 = 33,33%
10 10
( ) ( )
4 4

Distribución Poisson
La distribución de probabilidad de Poisson describe el número de veces que se presenta
un evento durante un intervalo específico. El intervalo puede ser de tiempo, distancia,
área o volumen (Lind et al., 2012).
𝜇 𝑥 𝑒−𝜇
𝑃(𝑥 = 𝑘) =
𝑥!
Dónde:
CARRERAS EN LÍNEA

𝜇 (mu) es la media de la cantidad de veces (éxitos) que se presenta un evento en un


intervalo particular.

𝑒 Es la constante 2.71828 (base del sistema de logaritmos neperianos).


“x” es el número de veces que se presenta un evento.
P(x) es la probabilidad de un valor específico de x.

La media de número de éxitos 𝜇, puede determinarse con n𝜋; en este caso, n es el


número total de ensayos, y 𝜋, la probabilidad de éxito.

Una distribución de probabilidad hipergeométrica tiene las siguientes características:


1. La variable aleatoria es el número de veces que ocurre un evento durante un intervalo
definido.
2. La probabilidad de que ocurra el evento es proporcional al tamaño del intervalo.
3. Los intervalos no se superponen y son independientes.

Según (Lind et al., 2012) el modelo se utiliza para describir la distribución de errores en
una entrada de datos, el número de rayones y otras imperfecciones en las cabinas de
automóviles recién pintados, el número de partes defectuosas en envíos, el número de
clientes que esperan mesa en un restaurante o que esperan entrar en una de las
atracciones de Disney World y el número de accidentes en la carretera federal I-75 en un
periodo de tres meses.

Ejercicios de aplicación
Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques
sin fondos en cualquiera de dos días consecutivos?
𝜇 = 6 cheques sin fondo por día
64 𝑒−6
𝑃(𝑥 = 4) = = 0,1339 = 13,39%
4!

𝜇 = 6 x 2 = 12 cheques sin fondo por dos días consecutivos


1210 𝑒−12
𝑃(𝑥 = 10) = = 0,1048 = 10,48%
10!

En la inspección de hojalata producida por un proceso electrolítico continuo, se identifican


0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a)
CARRERAS EN LÍNEA

una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando


más una imperfección en 15 minutos.
𝜇 = 0,2 x 3 = 0,6 imperfecciones en promedio cada 3 minutos
0,61 𝑒−0,6
𝑃(𝑥 = 1) = = 0,3293 = 32,93%
1!
𝜇 = 0,2 x 5 = 1 imperfecciones en promedio cada 5 minutos
𝑃(𝑥 ≥ 2) = 1 − 𝑃(𝑥 < 2) = 1 − [𝑃(𝑥 = 0) + 𝑃(𝑥 = 1)]
10 𝑒−1 11 𝑒−1
=1−[ + ] = 0,2642 = 26,42%
0! 1!

𝜇 = 0,2 x 15 = 3 imperfecciones en promedio cada 15 minutos


𝑃(𝑥 ≤ 1) = 𝑃(𝑥 = 0) + 𝑃(𝑥 = 1)
30 𝑒−3 31 𝑒−3
=[ + ] = 0,1992 = 19,92%
0! 1!

Subtema 3: Distribución normal

Distribución normal
La distribución normal es una distribución continua en ella la variable aleatoria logra tomar
cualquier valor dentro de un intervalo de valores dados, es muy utilizada debido a su
aporte ajustable a las distribuciones de frecuencia reales que se visualiza en muchos
fenómenos incluyendo características humanas. Para su resolución se hace uso de
curvas de frecuencia, esta curva solo tiene un pico en su forma de campana de modo que
es unimodal, la media de una población distribuida frecuentemente se encuentra en el
centro de la curva normal, además por su asimetría la mediana y la moda también están
en el centro, es decir la media, mediana y la moda tienen el mismo valor. (Auchay, 2016)

Generalmente para hallar el área bajo la curva se hace uso de las integrales, debido a
que no es un curso de Integrales, para proceder hallar el área bajo la curva de una
distribución normal lo haremos mediante una tabla de distribución normal; esta tabla solo
da los valores de la mitad del área bajo la curva normal, comenzando de 0.0 en la media,
como es de conocimiento la distribución normal es simétrica es decir los valores
correspondientes a una mitad de la curva también corresponden a la otra. Para hacer uso
de la tabla en la columna de x buscamos el numero entero y el primer decimal; en el
reglón horizontal buscamos el segundo decimal; ejemplo: para encontrar el área bajo la
CARRERAS EN LÍNEA

curva entre la media y un punto que está a 2.05 desviaciones estándar a la derecha de la
media el valor que me da la tabla es:

𝑃(𝑧 ≥ 2.05) = 0.0202

Tabla 1. Distribución Normal Estandarizada.

* Tomado de Auchay, J. W. (2016). Estadística aplicada a la educación con actividades de


aprendizaje. Riobamba: EDG-FIE.
NORMALIZACIÓN
Según Rubín (2004) La normalización sucede al partir de una distribución normal y llegar
a un a distribución normal estandarizada, mediante la fórmula:
CARRERAS EN LÍNEA

𝑥−𝜇
𝑧=
𝜎

Dónde:

z= número de desviaciones estándar

x= valor de la variable aleatoria que nos ocupa

μ= media proporcional de la distribución variable aleatoria

σ= desviación estándar.

Para la normalización es necesario el uso de la tabla de distribución normal estándar para


así lograr encontrar el área bajo cualquier curva normal, es importante porque mediante
esta tabla podemos definir el área o la probabilidad de que la variable aleatoria distribuida
normalmente se encuentre entre algunas distancias a partir de la media. La definición de
estas distancias viene dada en terminología de desviación estándar. Los resultados se
presentan mediante curvas de frecuencia (Aldana, 2009)

Fuente: creación propia.


El extremo izquierdo se extiende de forma indefinida y nunca toca el eje horizontal.
La distribución normal de probabilidad es simétrica con respecto a una línea vertical que
pase por la media.

El extremo derecho se extiende de forma indefinida y nunca toca el eje horizontal.

Aproximación de la Binomial a la Normal


Como ya tenemos conocimiento la distribución normal es continua, por ello resulta
interesante que en ciertas ocasiones sea utilizada para aproximar distribuciones discretas;
muchas veces la distribución normal es requerida como medio para dar una aproximación
a la distribución binomial. Debemos destacar que esto se realiza siempre que p no este
cercana a 0 o 1. (Johnson, México).Mediante la fórmula:

1
(𝑥 ± ) − 𝜇
𝑧= 2
𝜎
CARRERAS EN LÍNEA

1
Los dos “ " que agregamos y restamos son conocidos como factores de corrección de
2

continuidad, su utilidad se da debido a que se está evaluando una variable discreta con
una continua.

Es importante recordar que se debe tener cuidado al hacer uso de esta aproximación, es
bastante buena y sencilla siempre y cuando “np” y “nq” sean al menos cinco.
Características de factores de corrección de continuidad

𝑃(𝑥 = 2) = 𝑃(2 − 0.5 < 𝑥 < 2 + 0.5)

𝑃(𝑥 ≤ 4) = 𝑃(𝑥 ≤ 4 + 0.5)

𝑃(𝑥 < 4) = 𝑃(𝑥 < 4 − 0.5)

𝑃(𝑥 ≥ 4) = 𝑃(𝑥 ≥ 4 − 0.5)

𝑃(𝑥 > 4) = 𝑃(𝑥 > 4 + 0.5)

Es solo en estos casos que se hace uso del factor de corrección de continuidad.

Ejercicios de aplicación
1. Use la tabla 1 para hallar las siguientes probabilidades para una variable Z
aleatoria normal estándar.
a) 𝑃(0 ≤ 𝑍 ≤ 1,2)
b) 𝑃(−0.9 ≤ 𝑍 ≤ 0)
c) 𝑃(0.3 ≤ 𝑍 ≤ 1,56)
Resolvemos

a) 𝑷(𝟎 ≤ 𝒁 ≤ 𝟏, 𝟐)
0.5 − 𝑃(𝑍 ≥ 1.2)
0.5 − 0.1151 = 𝟎. 𝟑𝟖𝟒𝟗

𝒁 ≤ 𝟎)
0.5 − 𝑃(𝑍 ≥ 0.9)
0.5 − 0.1841 = 𝟎. 𝟑𝟏𝟓𝟗
0 0,9

c) 𝑷(𝟎. 𝟑 ≤ 𝒁 ≤ 𝟏, 𝟓𝟔)
𝑃(𝑍 ≥ 0.3) − 𝑃(𝑍 ≥ 1.56)

0 0,3 1.56
CARRERAS EN LÍNEA

0.3821 − 0.0594 = 𝟎. 𝟑𝟐𝟗𝟕

2. Se conoce que una población el 30% de la población está a favor de un candidato


A, se seleccionan 35 personas al azar, y se pide calcular la probabilidad
a) A lo mucho 5 estén a favor del candidato A.
𝑃(𝑥 ≤ 5) = 𝑃(𝑥 = 0) + 𝑃(𝑥 = 1) + 𝑃(𝑥 = 2) + 𝑃(𝑥 = 3)𝑃(𝑥 = 4)𝑃(𝑥 = 5)
35 35 35
𝑃(𝑥 ≤ 5) = ( ) (0.3)0 (0.7)35 + ( ) (0.3)1 (0.7)34 + ( ) (0.3)2 (0.7)33
0 1 2
35 35 35
+ ( ) (0.3)3 (0.7)32 + ( ) (0.3)4 (0.7)31 + ( ) (0.3)5 (0.7)30
3 4 5
Resolvemos mediante combinación:

𝑃(𝑥 ≤ 5) = 0.02689

Aproximamos a una binomial mediante una normal

n=35

p=0.3

𝜇 = 𝑛𝑝 = 35 × 0.3 = 10.5

𝜎 = √𝑛𝑝𝑞 = √35 × 0.3 × 0.7 = 2.71

N (μ, σ) ~N (0,1)

𝑥−𝜇 𝑧−𝜇
𝑃(𝑥 ≤ 5) = 𝑃 ( )≤( )
𝜎 𝜎

5 − 10,5
𝑃(𝑥 ≤ 5) = 𝑃 (𝑧 ≤ )
2.71

𝑃(𝑧 ≤ −2.02)

Buscamos ese valor en la tabla:

𝑃(𝑧 ≤ −2.02) = 𝟎. 𝟎𝟐𝟏𝟕


CARRERAS EN LÍNEA

3. La temperatura en el mes de diciembre está distribuida normalmente con media de


19,5°C y una desviación estándar de 6°. Calcular la probabilidad de que durante el
mes de septiembre la temperatura este a 22°C.
Resolvemos:
𝜇 = 19,5 ; 𝜎 = 6 ; 𝑥 = 22
𝑥−𝜇
𝑧=
𝜎

22 − 19,5
𝑧=
6

𝒛 = 𝟎, 𝟒𝟐

Teniendo una mínima probabilidad de ocurrencia.

4. Las ventas mensuales de silenciadores en el área Richmond, Virginia, tiene una


distribución normal, con una media de $1200 y una desviación estándar de $225.
Al fabricante le gustaría establecer niveles de inventario de manera que solo haya
5% de probabilidad de que se agoten las existencias. ¿Dónde se deben establecer
los niveles de inventario?
Solución
Datos:
µ= 1200
α= 0.05
σ=225
En este ejemplo ya no se tiene que calcular la probabilidad (área) entre valores
dados de x, sino que se tiene que calcular el o los valores de x a partir de
porcentajes o probabilidades que representan el valor de z
𝑥−𝜇
𝑧=
𝜎
0,05
(𝑧 ∗ 𝜎) + 𝜇 = 𝑥

µ=1200 x=?

Al conocerse el porcentaje del cual queremos obtener un valor x, en este caso 5%,
se debe tomar en cuenta que este 5% también representa una probabilidad de
0.05, esta probabilidad se la vamos a restar a 1 porque lo que queremos saber es
a partir de qué valor de x empieza ese 5% de observaciones, es decir por encima
de ese valor.
CARRERAS EN LÍNEA

Entonces tenemos que: 1 − 0.05 = 0.95


Este resultado que también es una probabilidad la tenemos que localizar en una
tabla de probabilidades acumuladas de la distribución normal estándar, y así
encontraremos el valor z que le corresponde, al ubicar este valor lo podemos
sustituir en la formula y encontrar x.
El valor de z que proporciona la tabla para 0,95 es 1,65.
Procedemos a ingresar los datos al a fórmula previamente despejada
𝑥 = (𝑧 ∗ 𝜎) + 𝜇

𝑥 = (1,65 ∗ 225) + 1200

𝒙 = 𝟏𝟓𝟕𝟏, 𝟐𝟓

5. Una maquina llenadora automática se gradúa para dispensar 1000 c.c. sin
embargo al realizar un control de calidad se encontró que el 10% de las botellas
contenían más de 1000 c.c. y el 5% contenían menos de 985 c.c. se pregunta el
contenido medio de llenados de botellas
Solución
Datos:
X1=1000 ; z1=0.10
X2= 985 ;z2=0.05

𝑥−𝜇
𝑧=
𝜎

Despejamos 𝜎 para cada uno de los datos e igualamos las ecuaciones:

𝑥1 − 𝜇
𝜎=
𝑧1

𝑥2 − 𝜇
𝜎=
𝑧2

Igualamos las dos ecuaciones

𝑥1 − 𝜇 𝑥2 − 𝜇
=
𝑧1 𝑧2

Despejamos 𝜇 que representa el valor que se nos está pidiendo hallar

𝑧2∗𝑥1−𝑧1+𝑥2
𝜇=
𝑧2−𝑧1

Reemplazamos los datos


CARRERAS EN LÍNEA

0.05 ∗ 1000 − 0.10 + 985


𝜇=
0.05 − 0.10

La media es:

𝜇 = 4.8743

Entonces el contenido medio de llenado de las botellas es de 4.8743

Bibliografía

David M. Levine, T. C. (2006). Estadística para la administración. México: Pearson


Educación.
Johnson, R. A. (2012). Probabilidad y estadística para ingenieros. México: Pearson
Educación.
Paula Rodas, L. M. (2009). Regla de la suma para calculas probabilidades de dos o más
eventos. Redalyc, 6.
Levin, R., & Rubin, D. (2010). Estadistica pra Administracion y Economía. ‫הנוטע עלון‬.
Lind, D., Marchal, W., & Wathen, S. (2012). Estadistica aplicada a los negocios y la
economía. Estadistica aplicada a los negocios y la economía (Vol. 15).
https://doi.org/10.1007/s13398-014-0173-7.2
Menhenhall, W., Beaver, R., & Beaver, B. (2016). Introducción a la probabilidad y
estadística. Cengage Learning. https://doi.org/10.1177/1533210110392951

También podría gustarte