Está en la página 1de 15

Trabajo individual

Identificación del trabajo

a. Módulo: 3.
b. Asignatura: Estadística para las Ciencia Sociales.
c. RA: Calcular probabilidades a asociadas a las distribuciones
binomial y normal en el programa SPSS. Realizar gráficos
e histogramas en SPSS.
d. Docente Online: Claudio Valderrama Contreras.
e. Fecha de entrega: 22 de Diciembre 2021.

Identificación del/los estudiante/s

Nombre y apellido Carrera


Stephanie Daniela Donoso Gutiérrez Servicio Social
Ximena Judith Zapata León Servicio Social
Andrea Olivia Oporto Saavedra Servicio Social
Celin Enrique Hormazábal Urzúa Servicio Social

1
INTRODUCCIÓN

Para comenzar mencionaremos que las estadísticas de la


probabilidad es una herramienta matemática que establece un conjunto de reglas o
principios útiles para calcular la ocurrencia de los fenómenos aleatorios y procesos
estocásticos.
La incorporación a teoría de probabilidad dará herramientas
necesarias para poder resolver problemas de probabilidad de variables aleatorias
discretas o continuas y definir claramente la distribución de probabilidad correspondiente.
Se estudiarán distribuciones conocidas como binomial y normal, se aplicarán en la vida
cotidiana y se obtendrán sus respectivas probabilidades.
Los conceptos de variables aleatorias y distribuciones de probabilidades conocidas, son la
entrada para internalizarnos en uno de los objetivos fundamentales de la estadística,
poder inferir resultados a la población por medio de una muestra aleatoria.

2
Actividad
Ejercicio 1. Se sabe que la probabilidad de que una persona haya sido asaltada en un
barrio determinado es de p=0.2. Se realiza un estudio, entrevistando a 10 personas, en el
que se quiere responder las siguientes preguntas:
a. ¿Cuál es la probabilidad de que exactamente 3 personas hayan sido asaltadas?
b. ¿Cuál es la probabilidad de que 7 o menos personas hayan sido asaltadas?
c. ¿Cuál es la probabilidad de que al menos una persona haya sido asaltada?
d. Realice un gráfico de la función de probabilidad de X. Recuerde que la función de
probabilidad está dada por f(k)= P(X=k). Según el gráfico, para que valor de k la función
de probabilidad alcanza su mayor valor.
Ejercicio 2. Se está haciendo un estudio acerca de la alimentación de estudiantes de un
centro educacional infantil. Una de las variables a estudiar es el peso, y se sabe distribuye
normal con media 45 y varianza 4 medida en kilogramos. A partir de esta información
responda las siguientes preguntas:
Si se toma un estudiante al azar:
a. ¿Cuál es la probabilidad de que pese menos de 50 kilogramos?
b. ¿Cuál es la probabilidad de que pese más de 50 kilogramos?
c. ¿Cuál es la probabilidad de que su peso este entre 40 y 50 kilogramos?
d. Se toma ahora un estudiante que se sabe que pesa más de 45 kilogramos ¿Cuál es la
probabilidad de que dicho estudiante pese menos de 50 kilogramos?
Ejercicio 3. El siguiente ejercicio tiene por objetivo mostrar que para valores de n grandes,
una distribución binomial B(n,p) se aproxima a una distribución normal N(np,np(1-p)). Para
ello vamos a generar valores aleatorios que sigan una distribución binomial. Para esto
siga los siguientes pasos:
i. Defina una variable llamada RBinom.
ii. En la vista de datos rellene la columna de la variable RBinom con 10 unos. Para no
hacerlo manualmente, puede copiar directamente desde excel con la función de auto-
relleno.
iii. Seleccione la variable RBinom y luego en la ventana de transformar seleccione calcular
variable. En el grupo de funciones, seleccione números aleatorios y luego abajo,
seleccione Rv.Binom. SPSS solicitar parámetros de una distribución binomial, coloque
n=10 y p=0.2. Esto generará 10 valores distribuidos B(10,0.2).
iv. Realice un histograma para RBinom agregando la curva normal.
v. Repita el proceso para n=50,100 y 500 y responda las siguientes preguntas:
a. ¿Qué sucede con la curva normal respecto al histograma?
b. ¿Cómo varían la media y la varianza a medida que n aumenta? ¿A qué valores se
acercan? Recuerde que estos valores aparecen a la esquina superior derecha del
histograma.

3
DESARROLLO
1-.
Datos entregados

Probabilidad :0,2

Número de asaltos: x

a) P(X=3)=( 10 3 )∗¿

P(X=3)=( 10 3 )∗¿

P(X=3)=120∗( 0,008 )∗(0,2097)

P(X=3)=0,2013

La probabilidad de que exactamente 3 personas sean asaltadas en un espacio de 10 personas


es de un 0,2013 o de un 20,13% de la muestra.

b) P(X≤7)= P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4) + P(X=5) + P(X=6) + P(X=7)

P(X=0)=( 10 0 )∗¿= 1*1*0,1074 ≈ 0,1074

P(X=1)=( 10 1 )∗¿ = 10*0,2*0,1342 ≈ 0,2684

P(X=2)=( 10 2 )∗¿ =45*0,04*0,1678 ≈ 0,3020

P(X=3) ≈ 0,2013

P(X=4)=( 10 4 )∗¿ =120*0,0016*0,2621 ≈ 0,0881

P(X=5)=( 10 5 )∗¿ =252*0,00032*0.328 ≈ 0,0264

P(X=6)=( 10 6 )∗¿=210*0.000064*0,4096 ≈ 0,0055

P(X=7)=( 10 7 )∗¿=120*0,0000128*0,512 ≈ 0,0007864

P(X≤7) ≈ 0,9999

4
La probabilidad de que 7 o menos personas hayan sido asaltadas es de 0.9999 o el 99,99% de
la muestra.

c) P(X≥1) = P(X=1) + P(X=2) + P(X=3) + P(X=4) + P(X=5) + P(X=6) + P(X=7) + P(X=8) +


P(X=9) + P(X=10) ó

P(X≥1) = 1 - P(X=0) ≈ 0,8926


De modo que, la probabilidad de que al menos 1 persona haya sido asaltada es de 0,8926 ó
89,26% de la muestra.

d)

0.35000000
PROBABILIDAD DE OCURREnCIA DE
0.30000000
ASALTOS
PROBABILIDAD

0.25000000

0.20000000

0.15000000

0.10000000

0.05000000

0.00000000
p( p( p( p( p( p( p( p( p( p( p

2.-
Datos entregados

Media 45

Varianza 4

X 40-45 y 50

Los datos aportados son que la media es de 45 y la desviación estándar es 2 (la raíz cuadrada de la
varianza, que es 4) se denota como N (45,4). Además, los valores de X (son los pesos o kilogramos
consultados) son 40, 45 y 50. Estos datos en general son los que utilizaremos para dar respuesta a
las preguntas.
Primeramente, se creó en el programa SPSS una variable llamada “peso”, utilizando como datos los
valores de X 40,45y 50. Posteriormente se ingresa a transformar y calcular la variable. Una vez que
se abre el cuadro de “calcular variables” se ingresa la formula “Cdf Normal”, la cual nos permite

5
calcular las probabilidades acumuladas de cada número de la variable seleccionada, asumiendo una
distribución de probabilidad normal. Para este proceso del SPSS no es necesario el estandarizar
primero la variable y luego calcular la probabilidad, ya que el programa lo realiza automáticamente.
Como paso final, se ingresa la variable a utilizar “peso”, luego u=45 y o=2 que son los datos
entregados en el ejercicio. La variable de destino se nombró “PNormal”.
Una vez terminado este procedimiento, el programa crea la variable “PNormal”, la cual fue dejada
con 4 decimales para facilitar la conversión de la probabilidad a porcentaje.
Con todo este procedimiento realizado, estamos en condiciones de entregar las siguientes
respuestas:

a) La probabilidad de que un estudiante elegido al azar pese menos de 50 kilogramos es de


99,38%. Se toma directamente el valor de probabilidad obtenido de 50, ya que este
representa el área bajo la curva de la probabilidad acumulada hasta 50.
Para demostrar la utilización de la formula al transformar el valor X en un valor de
distribución normal estándar se mostrará el siguiente cálculo:
x −μ 50−45
Z= = =2,50
σ Z

b) La probabilidad de que un estudiante elegido al azar pese más de 50 kilogramos es de


0,62%. A la probabilidad total (100%) se le resta la probabilidad acumulada de 50 (99,38%)
para obtener así el resultado. Esto porque buscamos el valor del área bajo la curva de la
probabilidad que sea mayor a 50.

c) La probabilidad de que un estudiante elegido al azar pese entre 40 y 50 kilogramos es de


98,76%. Como buscamos un intervalo del área bajo la curva se deben restar las
probabilidades de ambos valores, es decir, a la probabilidad de 50 (99,38%) se le resta la
probabilidad de 40 (0,62%), obteniéndose así el resultado.

d) La probabilidad de que al elegir al azar un estudiante que se sabe que pesa más de 45
kilogramos, la probabilidad de que pese menos de 50 es de 98,76 %. Lo primero es una
probabilidad condicional, ya que se le pide elegir un alumno que pese menos de 50
kilogramos, pero con la condición de que se sabe que pesa más de 45 kilogramos.

3.-

a. Con relación, a la curva normal del Histograma, se puede ver que n es igual a 10, la curva normal
presenta una forma de distribución asimétrica positiva. Cuando el valor de n aumenta (50, 100 y
500) observamos que la curva normal tiende a la simetría, es decir la campana de Gauss tiene una
forma simétrica con respecto a la medida.

b. La media aumenta y varía acercándose al 20% de n, indicando que a medida que aumenta n la
media se acerca al valor de la probabilidad de ocurrencia (p=0,2) de la cantidad total de datos (n).
Con relación, a la varianza, se puede ver que a medida que n aumenta, la varianza se acerca a ser la
mitad del valor de la media (50% de la media), debido a que al ser cada vez más simétrica el 50%
de los datos hacia la izquierda y el 50% hacia la derecha se aproximan más a la cantidad.

6
En síntesis, podemos decir que a medida que aumenta n en una variable con distribución de
probabilidad binominal, efectivamente se aproxima a una distribución de probabilidad normal.

NEW FILE.
DATASET NAME ConjuntoDatos2 WINDOW=FRONT.
DATASET ACTIVATE ConjuntoDatos2.
DATASET CLOSE ConjuntoDatos1.
COMPUTE Aleatorio=RV.BINOM(10,0.2).
EXECUTE.
FREQUENCIES VARIABLES=Aleatorio
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.

Frecuencias
Notas
Salida creada 15-DEC-2019 23:14:37
Comentarios

Entrada Conjunto de datos activo ConjuntoDatos2


Filtro <ninguno>
Ponderación <ninguno>
Segmentar archivo <ninguno>
N de filas en el archivo de datos 10
de trabajo
Manejo de valores perdidos Definición de perdidos Los valores perdidos definidos por
el usuario se tratan como
perdidos.
Casos utilizados Las estadísticas se basan en
todos los casos con datos válidos.

Sintaxis FREQUENCIES
VARIABLES=Aleatorio
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.
Recursos Tiempo de procesador 00:00:02,25
Tiempo transcurrido 00:00:03,37

Estadísticos
Aleatorio
N Válido 10
Perdidos 0

Aleatorio
Porcentaje
Frecuencia Porcentaje Porcentaje válido acumulado
Válido 1,00 2 20,0 20,0 20,0
2,00 3 30,0 30,0 50,0
3,00 2 20,0 20,0 70,0
4,00 3 30,0 30,0 100,0
Total 10 100,0 100,0

7
FREQUENCIES VARIABLES=Aleatorio
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.

Frecuencias
Notas
Salida creada 15-DEC-2019 23:36:17
Comentarios

Entrada Conjunto de datos activo ConjuntoDatos3


Filtro <ninguno>
Ponderación <ninguno>
Segmentar archivo <ninguno>
N de filas en el archivo de datos 50
de trabajo
Manejo de valores perdidos Definición de perdidos Los valores perdidos definidos por
el usuario se tratan como
perdidos.
Casos utilizados Las estadísticas se basan en
todos los casos con datos válidos.
Sintaxis FREQUENCIES
VARIABLES=Aleatorio
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.
Recursos Tiempo de procesador 00:00:00,37
Tiempo transcurrido 00:00:00,25

Estadísticos
Aleatorio
N Válido 50
Perdidos 0

8
Aleatorio
Porcentaje
Frecuencia Porcentaje Porcentaje válido acumulado
Válido 5,00 3 6,0 6,0 6,0
6,00 3 6,0 6,0 12,0
7,00 6 12,0 12,0 24,0
8,00 5 10,0 10,0 34,0
9,00 5 10,0 10,0 44,0
10,00 7 14,0 14,0 58,0
11,00 5 10,0 10,0 68,0
12,00 5 10,0 10,0 78,0
13,00 5 10,0 10,0 88,0
14,00 3 6,0 6,0 94,0
15,00 2 4,0 4,0 98,0
17,00 1 2,0 2,0 100,0
Total 50 100,0 100,0

DATASET NAME ConjuntoDatos4 WINDOW=FRONT.


COMPUTE Aleatorio=RV.BINOM(100,0.2).
EXECUTE.
FREQUENCIES VARIABLES=Aleatorio
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.

9
Frecuencias
Notas
Salida creada 15-DEC-2019 23:41:13
Comentarios

Entrada Conjunto de datos activo ConjuntoDatos4


Filtro <ninguno>
Ponderación <ninguno>
Segmentar archivo <ninguno>
N de filas en el archivo de datos 100
de trabajo
Manejo de valores perdidos Definición de perdidos Los valores perdidos definidos por
el usuario se tratan como
perdidos.
Casos utilizados Las estadísticas se basan en
todos los casos con datos válidos.
Sintaxis FREQUENCIES
VARIABLES=Aleatorio
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.
Recursos Tiempo de procesador 00:00:00,25
Tiempo transcurrido 00:00:00,23

[ConjuntoDatos4]

Estadísticos
Aleatorio
N Válido 100
Perdidos 0

Aleatorio
Porcentaje
Frecuencia Porcentaje Porcentaje válido acumulado
Válido 9,00 1 1,0 1,0 1,0
10,00 1 1,0 1,0 2,0
12,00 3 3,0 3,0 5,0
13,00 3 3,0 3,0 8,0
14,00 3 3,0 3,0 11,0
15,00 3 3,0 3,0 14,0
16,00 8 8,0 8,0 22,0
17,00 8 8,0 8,0 30,0
18,00 3 3,0 3,0 33,0
19,00 14 14,0 14,0 47,0
20,00 7 7,0 7,0 54,0
21,00 5 5,0 5,0 59,0
22,00 12 12,0 12,0 71,0
23,00 7 7,0 7,0 78,0
24,00 10 10,0 10,0 88,0
25,00 2 2,0 2,0 90,0
26,00 5 5,0 5,0 95,0
28,00 3 3,0 3,0 98,0
29,00 2 2,0 2,0 100,0
Total 100 100,0 100,0

10
DATASET ACTIVATE ConjuntoDatos3.
DATASET CLOSE ConjuntoDatos2.
DATASET ACTIVATE ConjuntoDatos5.
FREQUENCIES VARIABLES=Aleatorio
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.

Frecuencias
Notas
Salida creada 15-DEC-2019 23:54:10
Comentarios

Entrada Conjunto de datos activo ConjuntoDatos5


Filtro <ninguno>
Ponderación <ninguno>
Segmentar archivo <ninguno>
N de filas en el archivo de datos 500
de trabajo
Manejo de valores perdidos Definición de perdidos Los valores perdidos definidos por
el usuario se tratan como
perdidos.
Casos utilizados Las estadísticas se basan en
todos los casos con datos válidos.
Sintaxis FREQUENCIES
VARIABLES=Aleatorio
/HISTOGRAM NORMAL
/ORDER=ANALYSIS.
Recursos Tiempo de procesador 00:00:00,36
Tiempo transcurrido 00:00:00,26

[ConjuntoDatos5]

11
Estadísticos
Aleatorio
N Válido 500
Perdidos 0

Aleatorio
Porcentaje
Frecuencia Porcentaje Porcentaje válido acumulado
Válido 74,00 1 ,2 ,2 ,2
75,00 1 ,2 ,2 ,4
78,00 2 ,4 ,4 ,8
79,00 2 ,4 ,4 1,2
80,00 1 ,2 ,2 1,4
81,00 4 ,8 ,8 2,2
82,00 3 ,6 ,6 2,8
83,00 4 ,8 ,8 3,6
84,00 4 ,8 ,8 4,4
85,00 4 ,8 ,8 5,2
86,00 6 1,2 1,2 6,4
87,00 12 2,4 2,4 8,8
88,00 10 2,0 2,0 10,8
89,00 9 1,8 1,8 12,6
90,00 7 1,4 1,4 14,0
91,00 14 2,8 2,8 16,8
92,00 16 3,2 3,2 20,0
93,00 17 3,4 3,4 23,4
94,00 16 3,2 3,2 26,6
95,00 22 4,4 4,4 31,0
96,00 24 4,8 4,8 35,8
97,00 22 4,4 4,4 40,2
98,00 27 5,4 5,4 45,6
99,00 31 6,2 6,2 51,8
100,00 21 4,2 4,2 56,0
101,00 18 3,6 3,6 59,6
102,00 20 4,0 4,0 63,6
103,00 19 3,8 3,8 67,4
104,00 17 3,4 3,4 70,8
105,00 18 3,6 3,6 74,4
106,00 17 3,4 3,4 77,8
107,00 17 3,4 3,4 81,2
108,00 15 3,0 3,0 84,2
109,00 11 2,2 2,2 86,4
110,00 7 1,4 1,4 87,8
111,00 11 2,2 2,2 90,0
112,00 4 ,8 ,8 90,8
113,00 6 1,2 1,2 92,0
114,00 6 1,2 1,2 93,2
115,00 6 1,2 1,2 94,4
116,00 5 1,0 1,0 95,4
117,00 2 ,4 ,4 95,8
118,00 5 1,0 1,0 96,8
119,00 3 ,6 ,6 97,4
120,00 1 ,2 ,2 97,6
121,00 5 1,0 1,0 98,6
122,00 1 ,2 ,2 98,8
123,00 1 ,2 ,2 99,0
124,00 1 ,2 ,2 99,2
125,00 1 ,2 ,2 99,4
126,00 2 ,4 ,4 99,8
134,00 1 ,2 ,2 100,0
Total 500 100,0 100,0

12
CONCLUSIÓN

13
Para concluir mencionaremos que la teoría de la probabilidad nos interioriza al
cálculo de las probabilidades básicas y necesarias para luego comenzar y ver las 2
variables aleatorias más comunes y que nos darán paso para el módulo de inferencia
estadística.
Con las técnicas de probabilidad podrán enfrentarse a diferentes escenarios en los
cuales la incertidumbre estará presente ,podrán hablar de probabilidades y asignar
probabilidades a eventos desconocidos, de tal modo que ayude en la toma de
decisiones .Las variables aleatorias y en particular la distribución de la probabilidad serán
un pilar para seguir en el módulo de inferencia ,el saber sobre la distribución binomial y la
distribución normal ,nos dejara más interiorizados hacia el siguiente eje académico.

14
BIBLIOGRAFÍA

Módulos 1, 2 y 3 Asignatura de Estadística

15

También podría gustarte