Está en la página 1de 32

Portafolio de

Carlos Daniel Chavez Ramirez


202103006
Universidad Tecnológica de Acapulco
Evidencias
T.S.U. En Mantenimiento Industrial
Probabilidad y Estadística

Prof. Bernardo David Solís Cruz


Probabilidad y Estadística.
Unidad 1 – Estadística Descriptiva.

1.1 Introducción a la estadística.


1.2 Población, muestra y muestreo.
1.3 Distribución de frecuencia.
1.4 Medidas de Tendencia Central, localización y dispersión.

Unidad 2 – Probabilidad.

2.1 Conjunto.

2.2 Probabilidad Básica y Condicional.

2.3 Distribución Discreta de Probabilidad.

2.4 Distribución Continua de Probabilidad.

2.5 Distribuciones Muestrales.

Unidad 3 – Estadística.

3.1 Estimación.

3.2 Prueba de Hipótesis.

3.3 Regresión Lineal y Correlación.

3.4 Diseño de Experimentos.

Criterios de Evaluación

Asistencia 20%

Tareas 20%

Trabajo en Equipo 20%

Examen 25%

Portafolio 15%

Total 100%
Definición de Probabilidad
La probabilidad es la posibilidad de que suceda un fenómeno o un hecho, dadas determinadas
circunstancias. Se expresa como un porcentaje.

En cuanto a la historia de la probabilidad, podemos afirmar que este término surge en en el año
1553 con el escrito realizado por Gerolamo Cardano (1501-1576), en el que la menciona por
primera vez. En cambio, Pierre Fermat (1601-1665) y Blaise Pascal (1623-1662) son conocidos
como los padres de la teoría de la probabilidad debido las grandes aportaciones que realizaron
sobre este campo.

La probabilidad es entonces el nivel de certeza que tenemos sobre la ocurrencia de cierto evento.
Esto, en base a un valor de entre 0 y 1, y cuando más cerca esté de la unidad, significa mayor
certidumbre. Por el contrario, cuando se aproxima a cero, existe menor seguridad en el resultado
final.

 Simple: La probabilidad simple es el número de veces que puede ocurrir un determinado


suceso en función del número de elementos pueden dar lugar a dicho suceso.
 Compuesta: Se trata de la probabilidad que existe de que se produzcan de forma
simultánea dos sucesos.
 Condicionada: Es la probabilidad que existe de que ocurra un suceso si ya se ha producido
otro suceso previamente.
 Clásica: Es de las probabilidades más utilizadas. Consiste en dividir el número de
resultados favorables entre los resultados posibles.
 De espacio muestral: Es el conjunto de posibilidades de cada uno de los sucesos que
forman parte del espacio muestral.
 De la unión: Es la probabilidad de que se produzca alguno de los sucesos de dos espacios
muestrales diferentes.
 De la intersección: Se trata de la probabilidad de que se produzca alguno de los sucesos
que tienen en común dos espacios muestrales diferentes.
 Frecuencial: Consiste en dividir el número de resultados favorables entre el número de
veces que se ha realizado un experimento aleatorio.
 Lógica: Se basa en asignar probabilidades en función de la lógica y la evidencia de que se
produzca un determinado suceso.
 Geométrica: Cuantifica la probabilidad de que el resultado de un suceso aleatorio se
encuentre dentro del espacio muestral.
 Hipergeométrica: Es la probabilidad de que suceda un suceso sin reemplazar ninguno de
sus elementos.
 Objetiva: Es la probabilidad que se ha obtenido en base a un experimento que la acredite.
 Subjetiva: Esta probabilidad tiene mucha relación con la probabilidad lógica mencionada
anteriormente. Extrae el valor de la probabilidad través de experiencias personales o
creencias.
 Poisson: Esta probabilidad se calcula en base al espacio y al tiempo.
 Binomial: Muestra la probabilidad tras estudiar el número de éxitos una secuencia de
ensayos independientes entre sí.
Definición de Estadística
La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un
conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos
observados.

La estadística consiste en métodos, procedimientos y fórmulas que permiten recolectar


información para luego analizarla y extraer de ella conclusiones relevantes. Se puede decir que es
la Ciencia de los Datos y que su principal objetivo es mejorar la comprensión de los hechos a partir
de la información disponible.

El origen de la palabra estadística se suele atribuir al economista Gottfried Achenwall (prusiano,


1719-1772) que entendía la estadística como “ciencia de las cosas que pertenecen al Estado”.

Conviene saber que la estadística NO es una rama de las matemáticas. Utiliza herramientas de las
matemáticas del mismo modo que lo hace la física, la ingeniería o la economía, pero eso no las
hace ser parte de las matemáticas. Es cierto que tienen una relación estrecha, pero la estadística y
las matemáticas son disciplinas diferentes.
4 de Abril del 2022

Muestra: una muestra estadística o muestra es un subconjunto de elementos de la población


estadística.

El mejor resultado para el resultado estadístico seria estudiar a toda la población. Pero esto
generalmente resulta imposible, ya sea porque supone un costo económico alto o por que
requiere demasiado tiempo. Frente a la dificultad de hacer un censo (estudio de toda la
población), se examina una muestra estadística que representara a la totalidad de los sujetos.

Con los resultados obtenidos mediante la muestra, se intentará inferir las propiedades de todos
los elementos, mediante la estadística inferencial. La muestra elegida debe ser representativa de
la población. Las muestras tienen un nivel de confianza de la bondad que representan a todos los
sujetos, generalmente del 95% o superior.

Muestreo: En la estadística, se conoce como muestreo a la técnica para la selección de una


muestra aleatoria a partir de una población estadística. Al elegir una muestra aleatoria se espera
conseguir que sus propiedades sean extrapolables a la población.

Técnica de Muestreo

Probabilístico No Probabilístico

Aleatorio simple

Aleatorio Sistemático

Aleatorio Estratificado

Aleatorio Por Conglomerados

Población Finita Población Infinita


2 2
z ∙ p∙q∙ N z ∙ p∙q
n= 2 2 n=
e ∙ ( N −1 )+ z ∙ p ∙ q e2

z= nivel de confianza
p= nivel de éxito (50%)
q= nivel de fracaso (50%)
e= error admisible
N= Población
n= Tamaño de la muestra
Nivel de confianza y nivel de error
Nivel de Error % Nivel de Confianza %
Precisión de Confianza (Z)
Error (q)
0.01 1% 99% 2.58
0.02 2% 98% 2.38
0.025 2.5% 97.5% 2.24
0.03 3% 97% 2.17
0.035 3.5% 96.5% 2.14
0.04 4% 96% 2.12
0.05 5% 95% 1.96
0.06 6% 94% 1.89
0.07 7% 93% 1.865
0.08 8% 92% 1.76
0.09 9% 91% 1.7
0.1 10% 90% 1.645
5 de mayo del 2022

Población Finita

Se requiere estimar la proporción de un determinado parámetro en una población de N= 1500,


con un nivel de confianza del 95% (z= 1.96). Adoptamos un margen de error de e= 6% (0.06) y,
como no tenemos datos previos estimamos una proporción del 50% (0.5).
2
N ∙ z ∙ p ∙(1− p)
n= 2 2
e ∙ ( N −1 )+ z ∙ p ∙ q

1.96 2 ∙ 0.5 ∙(1−0.5)∙1500


n= 2 2
=227
e ∙ ( N−1 ) + z ∙ p∙ q
El tamaño muestral es de 227

Población Infinita

Calcular el tamaño muestral para la población N= 200,000 con nivel de confianza del 95% (z= 1.96)
y con la misma estimación conservadora de la proporción esperada del 50% pero esta vez con mas
exigencia, fijando un margen de error del e= 3% (0.03).
2
z ∙ p ∙(1− p)
n= 2
e

1.96 2 ∙ 0.5 ∙0.5


n= =1067
0.032
El tamaño muestral es de 1067
5 de mayo del 2022

Ejercicio #1

Se lanzo una nueva marca de aire acondicionado, en un evento en el cual asistieron 20345
personas de todo el mundo, se desea conocer si la nueva marca fue del agrado de los asistentes.
En esta investigación se tiene un nivel de confianza del 98% y un margen de error de 2%. Calcular
el tamaño de la muestra.

N= 20345

Z= 98% = 2.38

E= 2% = 0.02%

P=0.5

N= 3540

N ∙ z 2 ∙ p ∙(1− p)
n= 2 2
e ∙ ( N −1 )+ z ∙ p ∙(1−p)
2
20345∙ 2.38 ∙ 0.5∙(1−0.5)
n=
0.022 ∙ ( 20345−1 ) +2.382 ∙0.5 ∙ ¿ ¿
Ejercicio #2

Se dese saber la proporción de los jóvenes de Acapulco que deciden estudiar una carrera en la
UTA para dicho estudio se mantiene un nivel de confianza del 97.5% y un margen de error de 2.5%
con una probabilidad de fracaso del 12.5%

N=

Z= 97.5% = 2.24

E= 2.5% = 0.025%

P=12.5

2
z ∙ p ∙(1− p)
n= 2
e
2
2.24 ∙ 0.0125 ∙(1−0.0125)
n= 2
=877
0.025

Ejercicio #3
En la construcción de una nueva fabrica de acero en la ciudad de México, hay 8977 trabajadores,
se requiere saber cuantos trabajadores son mayores de 50 años, para este estudio se tiene un
nivel de confianza del 97.5% y un margen de error del 2.5%. Calcular el tamaño de la muestra
para llevar a cabo dicho estudio.

N= 8977

Z= 97.5% = 2.24

E= 2.5% = 0.025%

P=0.5

N= 3540
2
N ∙ z ∙ p ∙(1− p)
n= 2
e ∙ ( N −1 )+ z2 ∙ p ∙(1−p)
2
8977 ∙ 2.24 ∙0.5 ∙(1−0.5)
n= 2 2
=1804
0.025 ∙ ( 8977−1 )+2.24 ∙ 0.5 ∙(1−0.5)
5 de mayo de 2022

Distribución de Frecuencia

Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por
filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La
finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que
contienen los datos. La distribución de frecuencias es la forma en la que un conjunto de datos se
clasifica en distintos grupos excluyentes entre sí. Es decir, si un dato pertenece a un grupo no
puede pertenecer a otro. La distribución de frecuencias, en otras palabras, es la manera en la que
se ordena una serie de observaciones en diferentes grupos, y normalmente en modo ascendente o
descendente.

Los tipos de distribuciones de frecuencia son los siguientes:

 Clase: Es el número de subconjuntos en que se han agrupado los datos. Cada  clase se
puede denominar mediante una letra, un número o alguna característica del subconjunto.
 Límite de Clase: Cada clase está delimitada por el límite inferior de la clase y
el límite superior de la clase. En una distribución de frecuencias agrupadas
el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece
intervalo, se cuenta en el siguiente intervalo.
 Amplitud: La amplitud de clase en estadística es el rango de valores que son posibles
encontrar en la clase. Este valor se obtiene restando el valor superior que se pueden
encontrar en la muestra y el valor inferior. La amplitud o longitud de una clase es el
número de valores o variables que concurren a una clase determinada.
 Marca de clase: La marca de clase es el punto medio de cada intervalo. La marca de
clase es el valor que representa a todo el intervalo para el cálculo de algunos parámetros
como la media aritmética o la desviación típica.
 Frecuencia Absoluta: Es la cantidad de observaciones que pertenecen a cada grupo.
También, se interpreta como la cantidad de veces que se repite un suceso. Por ejemplo,
continuando con el caso anterior, puede ser que de un grupo de 100 personas, 20 de ellos
tengan entre 26 y 40 años.
 Frecuencia Relativa: Se calcula dividiendo la frecuencia absoluta entre el número de datos,
por ejemplo, volviendo a la situación planteada líneas arriba, 20/100 es igual a 0,2 o 20%.
 Frecuencia Relativa Porcentual: resultado de la frecuencia relativa convertida a
porcentaje.
 Frecuencia Acumulada: Resulta de sumar las frecuencias absolutas de una clase o grupo de
la muestra (o población) con la anterior o las anteriores. Por ejemplo, para calcular la
frecuencia absoluta acumulada del tercer grupo se suman las frecuencias absolutas del
primer, segundo y tercer grupo.
 Histograma: Los histogramas muestran la forma de los datos. Los histogramas muestran la
forma de sus datos. El eje horizontal muestra sus valores de datos, con cada barra
correspondiendo a un rango de valores. El eje vertical muestra cuántos puntos de datos
tienen valores en el rango de cada barra.
 Polígono de Frecuencia: Un polígono de frecuencias es una herramienta gráfica que se
emplea a partir de un histograma de frecuencia (es decir, otro tipo de gráfico que expresa
las frecuencias mediante columnas verticales). Para ello, se unen con una línea los
distintos puntos medios de las columnas del histograma, sin dejar espacio entre una y
otra, logrando así una forma geométrica o polígono. Con esta herramienta gráfica pueden
representarse variables cuantitativas o distribuciones diferentes, cosa que
tradicionalmente no hace un histograma, de un modo rápido y sencillo. Además, cuenta
con la virtud de ser apreciable a simple vista. Por esta razón es sumamente empleado
dentro de las ciencias sociales y ciencias económicas, permitiendo así
establecer comparaciones.
 Ojiva: En estadística, una ojiva es un gráfico que muestra la curva de una función de
distribución acumulativa dibujada a mano o en software de computadora. Los puntos
trazados son el límite de la clase superior y la frecuencia acumulativa correspondiente.
 Pareto: El diagrama de Pareto, también llamado curva cerrada o Distribución A-B-C, es una
gráfica para organizar datos de forma que estos queden en orden descendente, de
izquierda a derecha y separados por barras. Permite asignar un orden de prioridades.
 Pastel: Un gráfico circular o gráfica circular, también llamado gráfico de pastel, gráfica de
pizza, gráfico de tarta, gráfico de torta, gráfico de quesitos o gráfica de 360 grados, es un
recurso estadístico que se utiliza para representar porcentajes y proporciones.
 Barras: Un diagrama de barras, gráfico de barras o gráfico de columnas, es una forma de
representar gráficamente un conjunto de datos o valores mediante barras rectangulares
de longitud proporcional a los valores representados.
 Tallo y Hoja: El diagrama "tallo y hojas" (Stem-and-Leaf Diagram) permite obtener
simultáneamente una distribución de frecuencias de la variable y su representación
gráfica. Para construirlo basta separar en cada dato el último dígito de la derecha (que
constituye la hoja) del bloque de cifras restantes (que formará el tallo). Esta
representación de los datos es semejante a la de un histograma, pero además de ser
fáciles de elaborar, presentan más información que estos.
11 de mayo de 2022

Tabla de frecuencia

Los siguientes datos representan las ventas de lunes a viernes de máquinas para instalación de
maquinaria que se utiliza para instalaciones eléctricas, dichas maquinas son:

1. Taladro
2. Esmeriladora
3. Sierra circular
4. Rotomartillo
5. Sopladora

lunes martes miércoles jueves viernes


1 4 3 3 4
5 4 1 4 2
1 4 2 3 3
1 5 5 3 2
3 1 4 1 2
5 4 2 2 1
3 3 2 4 4
Realizar la tabla de frecuencia de los siguientes lunes Marte Miércoles Jueve Viernes Sábado
datos proporcionados en un estudio de ventas de s s
maquinaria eléctrica. 5 3 8 8 3 4
datos Frecuencia Frecuencia Frecuencia Frecuencia
1 7 absoluta 6 acumulada
7 relativa
2 relativa
6 1 1
porcentual
2 7 1 7 17 3 1
0.20 4
20% 4 5
3 8 2 7 3 14 3 0.20
4 20%
1 1 7
3 8 22 0.22 22%
4 9 5 8 4 6 7 1
4 9 31 0.25 25%
5 4 5 4 2 35 8 1
0.11 7
11% 1 1
n 35 35 2 1 0.98
1 98%
1 1 1
8 7 4 2 4 5
8 7 3 3 4 7
2 6 7 1 1 4

Ventas de los3 productos


8 1 5 5 1
10 4 1 4 3 7 4
9
8 4 8 1 3 2 4
7
6 1 4 3 3 2
6
5 1 7 7 7 7 1
12 de 4mayo de 2022
3
6 4 8 4 4 2
Agencia
2 de Autos 6 8 6 3 6 6
1
0 2 1 6 5 8 5
1 2 3 4 5
5 2 3 8 4 3
producto Columna2 2
7 7 1 1 3 1
1. Servicio
2. Transmisión
3. Aire Acondicionado
4. Sistema Eléctrico
5. Hojalatería/Pintura
6. Motor
7. Sistema de Frenos
8. Diagnóstico

Entrada al Talles 20 unidades por día

Datos F.Absoluta F.Acumulada F.relativa Porcentaje


¿Por qué frecuentan el taller?
1 28 28 0.23 23%
R= por servicio
2 10 38 0.08 8%

3 16 54 0.13 13% agencia de Autos


4 19 73 0.15 15% 30

5 9 82 0.07 7% 25

6 11 93 0.09 9% 20

15
7 15 108 0.125 12.5%
10
8 12 120 0.1 10%
5
120 0.975 97.5%
11 de mayo de 2022
0
0 1 2 3 4 5 6 7
Tabla de Frecuencia Por Intervalos

58 50 56 56 58

58 56 53 50 63
68 63 64 64 53

60 68 65 63 61
55 65 56 63 52

57 60 59 58 64
n=30
rango=68−50=18
intervalo=1+3.322 log ( 30 )=6.7563=7
R 18
amplitud= = =2.53=3
k 7
Clase Marca de Frecuencia Frecuencia Frecuencia Frecuencia
clase absoluta acumulada relativa relativa
porcentual
50-52 51 3 3 0.1 10%
53-55 54 2 5 0.06 6%

56-58 57 9 14 0.3 30%


59-61 60 4 18 0.13 13%

62-64 63 8 26 0.26 26%


65-67 66 2 28 0.06 6%

68-70 69 2 30 0.06 6%

30 0.97 97%

frecuencia
Serie 3 Serie 2 Serie 1

65-67

62-64

59-61

56-58
12 de mayo de 2022
53-55
Ejercicio
50-52
65 0 63 1 65 2 63 3 694 67
5 653 7 58 8 60 9 61 10

64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62

63 65 63 70 67 66 57 59 61 62

64 64 63 69 67 66 58 60 61 62

Realizar una tabla de frecuencia por intervalos y usar grafica de barras

rango=72−53=19
clase=1+3.322 log (50 )=6.6439=7
19
intervalo= =2.71=3
7
Clase Marca de Frecuencia Frecuencia Frecuencia Frecuencia
clase absoluta acumulada relativa relativa
porcentual
53-55 54 2 3 0.04 4%
56-58 57 5 5 0.10 10%
59-61 60 9 16 0.18 18%
62-64 63 15 31 0.30 30%
65-67 66 12 43 0.24 24%
68-70 69 5 48 0.10 10%
71-73 72 2 50 0.04 4%
50 1 100%

Chart Title
16 15
14
12
12
10 9
8
6 5 5
4
2 2
2
0 0 0 0 0 0 0 0
12 de mayo del 0202253-55 56-58 59-61 62-64 65-67 68-70 71-73

Medidas de tendencia central Serie 1 Serie 2 Serie 3

Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor
a un conjunto de valores. Representan un centro en torno al cual se encuentra ubicado el conjunto
de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda. Las
medidas de dispersión en cambio miden el grado de dispersión de los valores de la variable. Dicho
en otros términos las medidas de dispersión pretenden evaluar en qué medida los datos difieren
entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un
conjunto de datos entregando información acerca de su posición y su dispersión. Los
procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la
forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla
estadística diremos que se encuentran “agrupados” y si los datos no están en una tabla
hablaremos de datos “no agrupados”.

La media, la mediana y la moda son las tres medidas de tendencia central más usadas para
poblaciones que no cuentan con demasiados datos, es decir, que no necesitan agruparse. Al hablar
de medidas de tendencia central, nos referimos a medidas estadísticas que pretenden resumir en
un único valor a un conjunto de valores.  La media, mediana y moda se expresan en la misma
unidad que los datos originales.

Media:

La medida de tendencia central más conocida y utilizada es la media aritmética o promedio


aritmético. Se representa por la letra griega µ cuando se trata del promedio del universo o
población y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante
destacar que µ es una cantidad fija mientras que el promedio de la muestra es variable puesto que
diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media
se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc.

Mediana:

Otra medida de tendencia central es la mediana. La mediana es el valor de la variable que ocupa la
posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las
observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o
superiores a la mediana. Si el número de observaciones es par, la mediana corresponde al
promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es
(9+11)/2=10.

Moda:

La moda de una distribución se define como el valor de la variable que más se repite. En un
polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto
del gráfico. Una muestra puede tener más de una moda.

18 de mayo de 2022

Impar

22 19 16 13 18 15 20 14 15 9 15 16 7 11 4 3 15 22 25
x 1+ x 2+ x 3+ xn …
m=
n
22+19+16+13+18+ 15+ 20+14+15+ 9+15+16+7+ 11+ 4+ 3+15+22+25
m= =14.68
19
3 4 7 9 11 13 14 15 15 15 15 16 16 18 19 20 22 22 25

Me=14.68

Med=15
Moda=15

Par

8 13 20 13 10 18 11 13 21 13

Media 25.21

Media 24.5
Moda 26

8+13+20+ 13+10+18+11+13+21+13
m= =14
10
8 10 12 13 13 13 13 13 20 21
Me=14

Med=13

Mo=13

n 10
med= + 1= =5
2 2
10
med= =5+1=6
2
13+13 26
med= = =13
2 2

18 de mayo de 2022

Calcular la media, mediana y moda del siguiente conjunto de datos:

27,23,30,23,24,26,21,15,19,26,26,29,28,20,26,17,40,26,18,23,26,15,25,23,45,23,20,42

15,15,17,18,19,20,20,21,23,23,23,23,23,24,25,26,26,26,26,26,26,27,28,29,30,40,42,45

x 1+ x 2+ x 3+ xn … .. 706
m= = =25.21
n 28
n 28
mediana= +1= +1=14 +1=15
2 2
24 +25
mediana= =24.5
2
Calcular la media, mediana y moda de los siguientes datos:

100, 70, 63, 95, 100, 54, 77, 95, 30, 48, 95, 95, Media 25.21
100, 85, 25, 87, 72, 45, 68, 89, 100, 45, 68, 89, Media 24.5
100, 65, 88, 80, 40, 23, 20, 42, 100, 95, 95, 100,
68, 77, 95, 100, 84, 95, 100, 100 Moda 26

20, 23, 25, 30, 40, 42, 45, 48, 54, 63, 65, 68, 68, 70, 72, 77, 77, 80, 84, 85, 87, 88, 89, 95, 95, 95,
95, 95, 95, 95, 95,100, 100, 100, Media 76.5
100,100,100,100,100,100
Mediana 86
x 1+ x 2+ x 3+ xn … .. 3060
m= = =76.5
n 40 moda 100
n 40
mediana= +1= +1=20+1=21
2 2
85+87
mediana= =86
2

19 de mayo de 2022

media
( ∑ x ∙ fi )
m=
n
Mediana

n
∙ Fi−1
2
me=Li+ ∙a
fi
Moda

Mo=Li ∙
[ fi− ( fi−1 ) ]
¿¿
Ejercicio

22 19 16 13 18 15 20 19 15 16

15 16 20 13 15 18 15 13 18 15

n=20
rango=22−13=9
No . Intervalos(k)=1+ 3.322 log ( 20 ) =5.32=5
r 9
amplitud= = =1.8=2
k 5
Clase Marca de clase Frecuencia Frecuencia (xi*fi)
(x) absoluta (fi) acumulada (Fi)
13-15 14 4 4 14x4=56

16-18 17 9 13 16x9=144

19-21 20 3 16 18x3=54

22-24 23 3 19 20x3=60

25-27 26 1 20 22x1=22

∑ fi=20 ∑ x i ∙ fi=336

( ∑ x ∙ fi ) 336
m= = =16.8
n 20
n
∙ Fi−1
2 10−4 6
me=Li+ ∙ a=15+ ∙2=16+ ∙ 2=15+1.333=16.333
fi 9 9

Mo=Li ∙
[ fi− ( fi−1 ) ]
¿¿
5
¿ 15+ ∙2=15+0.9=15.9
11
Media 16.8

Mediana 16.33

moda 15.9

19 de mayo de 2022
Clase Marca de clase Frecuencia Frecuencia (xi*fi)
(x) absoluta (fi) acumulada (Fi)
0-1 0.5 1 13 13x1=13

2-3 2.5 3 20 7x3=21

4-5 4.5 5 35 15x5=75

6-7 6.5 10 45 7x10=70

8-9 8.5 3 48 9x3=27

∑ fi=48 ∑ x i ∙ fi=206

( ∑ x ∙ fi ) 206
m= = =4.29
n 48
n
∙ Fi−1
2 24−20 4
me=Li+ ∙ a=4 + ∙ 2=4+ ∙ 2=4+0.5333=4.5333
fi 15 15

Mo=Li ∙
[ fi− ( fi−1 ) ]
¿¿
8
¿4+ ∙ 2=4 +1.2307=5.2307
13
Media 4.29

Mediana 4.53333

moda 5.2307

26 de mayo
Medidas de dispersión
Las medidas de dispersión tratan a través del calculo de diferentes formulas de arrojar un
valor numérico que ofrezcan información sobre el grado de variabilidad de una variable.
Son parámetros que miden la separación de los datos de una distribución respecto a su
media.
Rango (R)
Se calcula como la diferencia entre el limite superior del ultimo intervalo y el limite
inferior del primer intervalo.
Rango=lim ¿max −lim ¿min ¿ ¿

Varianza de población σ 2muestra S2

Es la media aritmética de los cuadrados de desviaciones respecto de la media de una


distribución estadística.

σ
2
=
∑ 2
(x 1−x 2) f i
σ=
∑ 2
x fi
−x 2
n n
x=marca de clase de cada intervalo
x 2=media aritmetica promedio

f =frecuencia
Desviación típica o estándar (población σ ) (muestra s) la desviación típica es la raíz de la
varianza

σ=
√ ∑ ( x 1−x 2)2 f i
n
σ=
√ ∑ x 2 f i −x
n 2

Formulario
Población
Rango:
Muestra
Rango=lim ¿max −lim ¿min ¿ ¿ Varianza:
Coeficiente de Variación: 2
s=
∑ (x1 −x2 )2 f i
n−1
σ
CV = × 100
x Desviación estándar:


Varianza:
s=
∑ ( x 1−x 2 )2 f i
σ
2
=
∑ ( x 1−x 2)2 f i n−1
n−1
Desviación media:
Desviación Estandar:
D x=
∑ f i|x−x 2|

√ ∑ (x 1−x 2) f i
2
n−1
σ=
n
Coeficiente de variación:
Desviación Media:
s
CV = ×100
Dμ=
∑ f i|x−μ| x
N Rango:
Rango=x max −x min
Coeficiente de Variación (CV):
Es la relación entre la desviación típica de una muestra y su media.
El coeficiente de variación se suele expresar en porcentaje.
σ
CV = × 100
x
Si el CV es menor o igual al 80%, significa que la media aritmética es la representativa del
conjunto de datos, por ende, el conjunto de datos es “homogéneo”. Por el contrario, si el
CV supera al 80%, el promedio no será representativo del conjunto de datos, por lo que el
resultado será “Heterogéneo”.

Medidas de dispersión aplicadas a población.


clase marca f|.| marca de x 1−x 2 |x 1−μ| (x−x )2 (x−x )2 fi
de clase clase f i
15-18 16.5 4 66 -9.47 9.47 89.68 358.72
18-21 19.5 9 175.5 -6.47 6.47 41.86 376.71
21-24 22.5 22 495 -3.47 3.47 12.04 264.88
24-27 25.5 10 255 -0.47 0.47 0.22 2.2
27-30 28.5 5 142.5 2.53 2.53 6.40 32
30-33 31.5 7 220.5 5.53 5.53 30.58 214.06
33-36 34.5 8 276 8.53 8.53 72.76 582.08
36-39 37.5 5 187.5 11.53 11.53 132.94 664.7
∑ f i=70 ∑ f i=1818 ∑|x1 −μ|=354.4 ∑ (x−x)2 fi=2495.38
Desviación media:

Dμ=
∑ f i|x−μ|=Dμ= 354.4 =5.06
N 70

Rango:
Rango=lim ¿max −lim ¿min =39−15=24 ¿ ¿

Cálculo de desviación estándar:

σ=
√ ∑ ( x 1−x 2)2 f i =σ =√ 35.64=5.96
n

Cálculo de Media:
x−f i 1818
x=∑ = =25.97
n 70

Coeficiente de variación:
σ 5.96
CV = × 100= × 100=22.94
x 25.97

Cálculo de varianza:

σ
2
=
∑ (x 1−x 2)2 f i 2495.38
= =35.64
N 70

Muestra
2 9 8 12 21 25
xi x i−μ 2
(x i−μ) |x i−μ|
3 -10 100 10
9 -4 16 4
8 -5 25 5
12 -1 1 1
21 8 64 8
25 12 144 12
∑ x =78 ∑ ( x i−μ)2=350 ∑|xi −μ|=40
Muestra
Desviación estándar: σ 2= ∑
x −μ 2 350
= =70
n−1 5
Varianza: σ =√ σ 2= √70=8.36
σ 8.36
Coeficiente de variación: CV = x × 100= 13 ×100=64

Desviación media: Dx=


∑ f i|x−μ|= 40 =8
n−1 5

μ= μ=
∑ x i = 78 =13
n 6
Población
Desviación estándar:
x=
∑ x−μ = 350 =58.33
N 6
Varianza:
σ =√ σ 2= √ 58.33=7.6 3
Coeficiente de variación:
σ 7.63
CV = × 100= × 100=58.6 9
x 13
Desviación media:
Dx =
∑ f i|x−x| 40 =
=6.6
N 6

X= μ= μ=
∑ x i = 78 =13
N 6
8 de junio de 2022
Clase Marca de Frecuencia x−μ x−μ
2
|x−μ|
clase absoluta
15-18 16.5 4 13.42 180.09 13.42
18-21 19.5 9 15.92 237.77 15.92
21-24 22.5 22 19.42 377.13 19.42
24-27 25.5 10 22.42 502.65 22.42
27-30 28.5 5 25.42 646.17 25.42
30-33 31.5 7 28.42 807.69 28.42
33-36 34.5 8 31.42 987.21 31.42
36-39 37.5 5 34.42 1184.73 34.42
70 4923.44 190.36

Desviación estándar:
x=
∑ x−μ = 4923.44 =70.33
N 70
Varianza:
σ =√ σ 2= √ 70 .33=8.38
Coeficiente de variación:
σ 8 .3 8
CV = × 100= × 100=272.07
x 3.08
Desviación media:
Dx=
∑ f i|x−x| 190.36
= =2.71
N 70

X= x=
∑ x i = 78 =3.08
N 6

9 de junio de 2022
Clase Marca de Frecuencia x−μ x−μ
2
|x−μ|
clase absoluta
12-16 14 7 -14 196 14
16-20 18 9 -10 100 10
20-24 22 22 -6 36 6
24-28 26 10 -2 4 2
28-32 30 15 2 4 2
32-36 34 9 6 36 6
36-40 38 8 8 100 8
40-44 42 5 10 196 10
85 672 68

Desviación estándar:
x=
∑ x−μ = 224 =28
N 8
Varianza:
σ =√ σ = √ 96=9.79
2

Coeficiente de variación:
σ 9.79
CV = × 100= × 100=34.96
x 29
Desviación media:
Dx =
∑ f i|x−x| 6 8
= =9 .71
N 7

X= x=
∑ x i = 224 =28
N 8
28 de junio del 2022
Distribuciones muestrales
La probabilidad de cada uno de los posibles valores que puede tomar un estadístico en
muestras extraídas al azar viene dada por una función matemática
denominada distribución muestral, que depende del estadístico en cuestión. Se habla así,
por ejemplo, de la distribución muestral de la media aritmética o de la distribución
muestral de la proporción.
Una distribución muestral es una función de probabilidad, ya que asigna a cada posible
valor de un estadístico su probabilidad de aparecer en una muestra extraída al azar. En
realidad, esta definición es estrictamente cierta solo cuando la variable toma valores
discretos; por ejemplo, cuando procede de un contaje y sus posibles valores son 0, 1, 2, 3,
etc. Cuando el valor del estadístico muestral es una variable continua, la distribución
muestral correspondiente se denomina función de densidad de probabilidad. La
probabilidad en este caso corresponde gráficamente a un área bajo la curva de esa
función, delimitada por un cierto intervalo de la variable. Analíticamente, esa área se
calcula como la integral de la función entre los límites del intervalo de la variable, que en
la práctica se obtiene con un ordenador o se consulta en una tabla. El área total bajo la
curva, que se extiende a todos los posibles valores de la variable, es siempre uno, que
corresponde a la probabilidad de un suceso seguro.
28 de junio del 2022
Distribución binominal
Una distribución binomial es una distribución de probabilidad discreta que describe el
número de éxitos al realizar n experimentos independientes entre sí, acerca de una
variable aleatoria.
Existen una gran diversidad de experimentos o sucesos que pueden ser caracterizados
bajo esta distribución de probabilidad. Imaginemos el lanzamiento de una moneda en el
que definimos el suceso “sacar cara” como el éxito. Si lanzamos 5 veces la moneda y
contamos los éxitos (sacar cara) que obtenemos, nuestra distribución de probabilidades se
ajustaría a una distribución binomial.
Por lo tanto, la distribución binomial se entiende como una serie de pruebas o ensayos en
la que solo podemos tener 2 resultados (éxito o fracaso), siendo el éxito nuestra variable
aleatoria.
En teoría de la probabilidad y estadística, la distribución binomial o distribución binómica
es una distribución de probabilidad discreta que cuenta el número de éxitos en una
secuencia de n ensayos de Bernoulli independientes entre sí con una probabilidad fija p de
ocurrencia de éxito entre los ensayos. 
28 de junio del 2022
Probabilidad Clásica
Se llama probabilidad a los números que reflejan la posibilidad de ocurrencia de hechos o
sucesos. A un suceso muy probable, o altamente probable como, por ejemplo, la
posibilidad de que llueva, se le considera muy ocurrente o viable y le correspondería una
probabilidad muy alta. Mientras algo poco probable, por ejemplo, un incendio, es algo que
no se espera que ocurra y en consecuencia le correspondería una probabilidad muy baja.
En una definición más formal, es medir el grado de certidumbre que existe sobre el
resultado de un experimento, evaluado entre 0 y 1.
La probabilidad clásica o “a priori” (la primera causa) se expresa como una fracción de
número de casos favorables al evento entre el número de casos totales del espacio
muestral. 
La probabilidad clásica es una medida estadística que indica la probabilidad de que suceda
un evento. La probabilidad clásica es igual al número de casos favorables de dicho evento
dividido entre el número total de casos posibles. La probabilidad clásica también se
conoce como probabilidad teórica o probabilidad a priori.
La probabilidad clásica es un número entre 0 y 1. Cuanto más probable de que ocurra un
evento, mayor será la probabilidad clásica, por contra, cuanto menos probable sea de que
suceda un evento, menor será el valor de la probabilidad clásica.
A diferencia de otros tipos de probabilidades, no hace falta hacer ningún experimento
para hallar la probabilidad clásica de un evento, sino que se trata de un cálculo teórico.

También podría gustarte