Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Materia
Estadística II
Integrantes:
Ariana Sarahi Castillo Iñiguez
Yesica Karina Martínez Valerio
Marcos Oswaldo Becerra Gutiérrez
Oscar Alberto Sosa Gutiérrez
Leonardo Yasser Vallin Jacobo
Tabla de contenido
Introducción........................................................................................................................... 3
Marco Teórico......................................................................................................................... 3
Desarrollo............................................................................................................................... 5
Determinación del tamaño de la muestra...........................................................................5
Determinación del método de muestreo............................................................................ 6
Media y desviación estándar de los ingresos y habitantes por casa................................. 7
Preguntas........................................................................................................................... 8
Planteamiento de hipótesis.............................................................................................. 10
Cuadro de contingencia................................................................................................... 10
Determinación de dependencia entre ambas variables................................................... 11
Reporte de la comunidad................................................................................................. 11
Comparación y aplicación de análisis de varianza (ANOVA)...........................................13
Recta de regresión........................................................................................................... 13
Conclusiones........................................................................................................................13
Bibliografía........................................................................................................................... 14
2
Introducción
Y posteriormente hacer una comparación de los sueldos con otro equipo aplicando
el análisis de varianza (ANOVA) con el fin de determinar si existe o no una similitud
entre estas dos poblaciones.
Actualmente Balcones de la Calera es una colonia qué pocas personas saben de su
existencia y por ese motivo fue qué se eligió para ser parte de nuestro proyecto ya
que buscamos darle visibilidad debido a que el ayuntamiento pasa por alto algunas
de sus necesidades básicas, esperemos que con los datos obtenidos, se le de la
relevancia qué se merece y se tomen cartas en el asunto.
Marco Teórico
Se dará una breve explicación de los conceptos base qué se han obtenido durante
el curso, con la finalidad de que su entendimiento sea efectivo para este documento.
En el proyecto se entiende que desviación estándar es la medida de dispersión de
una distribución de datos, por lo que este concepto será clave para comprender la
dispersión qué hay entre los datos obtenidos en la investigación, para poder explicar
mejor los datos en el proyecto también se utilizaron diferentes medidas de
concentración de datos en este caso se optó por utilizar cuadro de contingencia.
1. Población
Es el conjunto de todos los elementos que presentan una característica común
determinada, observable y medible.
3
1.1 Población finita
cuando el número de elementos o individuos es determinado que comparten una
característica en común.
1.2 Muestra
Una muestra poblacional es un subconjunto representativo de una población más
grande que se selecciona con el fin de realizar inferencias sobre esa población en
su conjunto.
Función; su función principal es proporcionar información sobre una población
extensa sin tener que estudiar a todos los miembros.
Método de muestreo
1.3 Variable
Se llama variable a una característica que se observa en una población o muestra, y
a la cual se desea estudiar.
2. Método de muestreo probabilístico
Se refiere a la técnica en la que se selecciona a los miembros de la población y en
la que cada elemento tiene una probabilidad para ser seleccionado para formar
parte de una muestra.
3. Media
La media aritmética de una variable es la suma ponderada de los valores de la
variable por sus frecuencias relativas y dividido por la cantidad de elementos del
conjunto.
3.1 Desviación estándar
indica la dispersión o variabilidad de un conjunto de datos con respecto a su medio,
la cual proporciona una idea de uniformidad de los datos y entre más alta la
desviación mayor es la variabilidad en los datos.
4. Planteamiento de hipótesis
Formulación clara y precisa de posibles respuestas a una pregunta dentro de la
investigación y evaluar su validez.
5. Cuadro de contingencia
Herramienta que organiza y resume la distribución conjunta de dos a más variables,
mostrando cómo se distribuyen las frecuencias en las intersecciones de las
categorías de las variables.
Función; proporciona una visualización clara de la relación entre las variables
categóricas y analizar cómo se distribuyen las frecuencias de estas.
4
6. Dependencia de variables
cuando el valor de una variable afecta o está relacionada con otra variable.
7. Análisis ANOVA
indican diferencias significativas entre poblaciones, su análisis se basa en
varianzas.
8. Recta de regresión
Es un modelo matemático que describe la relación estadística entre dos variables,
se ajusta a los datos de manera que minimiza la suma de los cuadrados de las
diferencias entre los valores observados y los valores predichos por la línea.
Desarrollo
Fórmula aplicada: n= z2 p q N
e2 (N-1) + z2 p q
5
(0.1)2 (551-1) + (1.65)2 (0.5) (0.5)
n= 374.68
6.18 = 60
por lo tanto el tamaño de la muestra es de 60
6
En cuanto al nivel de estudios de los 60 encuestados se obtuvo que el 75%, ósea 45
de ellos declararon tener un nivel educativo superior, 9 respondieron tener el nivel
medio superior y 6 de ellos contar con el nivel básico.
Para obtener la media de los ingresos y los habitantes por casa se utilizó la
siguiente fórmula: x̄= ∑ (xi * fi)
N
xi representa los datos obtenidos y fi la frecuencia de ellos.
xi fi xi*fi
$22,000 7 154,000
$30,000 15 450,000
La siguiente tabla representa los datos respecto a los habitantes por casa.
xi fi xi*fi
1 1 1
2 10 20
3 35 105
4 15 56
Para obtener la desviación estándar primero se calculó la varianza y en base a ella
se saca la raíz cuadrada. la siguiente fórmula es para determinar la varianza;
s2 = √∑ (xi - x̄)2
N-1
7
donde al tratarse de una muestra se representa como la sumatoria de los datos
menos la media al cuadrado dividido entre la cantidad de elementos menos uno.
3 3-3=0 0
4 4 - 3 =1 1
Desviaciones estándar:
Ingresos Habitantes por casa
s= √5,844,745.76 = σ = 2,417.59 s= √6 = σ= 2.44
Preguntas
8
¿Cuál es la probabilidad de obtener ingresos entre $15,000 y $20,000 al mes?
En base a nuestra muestra vemos qué
7 $22,000
15 $30,000
20 $40,000
18 $45,00
1 1
10 2
35 3
14 4
Ahora bien si lo hacemos de la población total quedaría de la siguiente manera
10/60 se simplifica 5/30
5/30×551= 88.16
Como el resultado no se puede poner en decimal, redondeados el resultado al
número más cercano
Que seria= 88
Por cada 551 habitantes en Balcones de Calera en 88 casas habitan 2 personas.
9
Planteamiento de hipótesis
Cuadro de contingencia
10
Básico Media superior Superior Total de las personas con
ingresos en particular.
$22,000 2 1 4 7
$30,000 2 3 10 15
$40,000 1 2 17 20
$45,000 1 3 14 18
Total de personas 6 9 45 60
con N. Edu.
Fórmula de Ji cuadrada:
(fo - fe)2
fe
11
Esto resultados es haciendo la fórmula del modelo de frecuencia que se encuentra
al inicio de este apartado y podemos observar que los resultados son mayores a lo
encontrado de la tabla de JI queriendo decir que supera la hipótesis a lo que se
rechaza.
Reporte de la comunidad
12
En base a estos datos obtenidos, pudimos darnos cuenta que en esta población una
gran mayoría cuentan con un alto nivel de estudios, llegando al nivel superior, y
vimos también que esto se veía reflejado en los ingresos que recibían, ya que a
comparación de otras colonias de Tlajomulco de Zúñiga, su nivel de ingresos se
podría considerar como alto. Ya con esta información se podía asumir que el
ingreso económico de las personas si tenía dependencia de su nivel de estudios; ya
que una comunidad con alto nivel académico percibía un alto ingreso económico.
Sin embargo, no quisimos quedarnos solamente con estas deducciones, así que
hicimos una tabla de dos entradas (ya mostrada anteriormente) en la que
plasmamos las respuestas de ingreso mensual según el nivel de educación de cada
persona, esto para ver de forma más clara qué tan relacionados están entre sí
ambos factores.
Gracias a esto, pudimos darnos cuenta que el 66.6% de las personas con nivel de
educación básica se encontraban en las dos opciones más bajas, y solamente el
16.6% se encontraba en cada uno de los dos rangos altos. Después veíamos que
las personas con educación media superior tenían su mayor porcentaje de
repetición (33% cada una) tanto en el segundo nivel y el cuarto, que es el más alto;
promediando un ingreso medio en la tabla. Y por último pudimos observar que de
las personas con nivel de educación superior solamente un 8.8% se encontraba en
el nivel de ingreso más bajo (el cual sigue siendo considerado bueno en
perspectiva), un 22.2% se encontraba en el segundo nivel que se considera medio,
y el 69% por ciento restante, que es la gran mayoría se encontraba en los dos
rangos más altos.
Esto nos deja ver que, si bien, hay personas de todos los niveles de educación en
todos los rangos de ingresos, existe una clara inclinación en la que las personas de
menor nivel académico suelen estar en los niveles de ingreso más bajos, los de
educación media superior tienden a mantenerse en el nivel central de los ingresos; y
las personas de alto nivel académico suelen encontrarse en los niveles más altos de
ingresos económicos.
Con esta información podemos concluir que el nivel de ingreso económico
estadísticamente sí tiene una dependencia del nivel de formación educativa.
13
Comparación y aplicación de análisis de varianza (ANOVA)
Fórmula:
σb2 = ∑ n (x - x̄)2
k-1
Hipótesis
No existe diferencia
Si existe diferencia
Población 1: $22,000 $30,000 $40,000 $45,000.
Población 2: $14,200 $14,200 $20,000 $20,000.
22,000 +30,000+40,000+45,000÷4
137,000%4=34,250
14,200+14,200+20,000+20,000÷4
68,400÷4=17,100
Media
163,000÷8=20,475
3,229,220,000÷2=1,614,610,000
14
40,000 33,062,5 34,250 20,000 3,000 9,000,00
00 0
Recta de regresión
σxy = ∑ xi * yi
N
Datos: xi yi xi * yi
N = 60 desviaciones: σx= 2,417.59 σy= 2.44
$22,000 1 22,000
x̄ = 36,900
$30,000 2 60,000
$40,000 3 120,000
σxy = 382,000 $45,000 4 180,000
60
15
estimación de la tendencia general de x (ingresos) a medida que y (habitantes)
cambia.
Fórmula de x sobre y:
σxy
x- x̄ = σ2y
lo único que se mantiene como incógnita es la x y la y dentro del entre paréntesis,
el resto de datos ya se obtuvieron anteriormente así que solo se hace la sustitución.
- 104,334
x - 36,900 = 6
x - 36,900 = -17,389 (y - 3)
x- 36,900 = -y + 3
x= -y + 3 + 36,900
16
17
Conclusiones
18
resolución de los mismos para evitar equivocarnos, pero en nuestro día a día no
tendremos al profesor para que nos ayude, por lo que este proyecto nos deja a mi y
a mi equipo con la iniciativa de tomar decisiones por nosotros mismos y seguridad
para tomar decisiones. Un reto al qué mayormente nos enfrentamos fue a la
organización de la resolución de los ejercicios ya que la virtualidad fue un factor qué
nos detuvo un poco, más sin embargo supimos tomar las riendas de la situación y
logramos tener una mejor comunicación entre nosotros, podría decirse que la
adaptabilidad ante esta situación fue un poco difícil, pero eso no nos detuvo para
lograr nuestros objetivos.
19
Y así como en esta situación, las herramientas estadísticas nos pueden ayudar en
muchas situaciones diferentes.
20
Para resumir esto me siento seguro y capaz de resolver esta clase de problemas en
la hora que se presente un problema de esta clase en mi vida diaria y esto se lo
debo a mis compañeros de equipo que sin ellos no entendería gran parte de detalles
de la materia y lo de que es el trabajo en equipo, y también al profesor le agradezco
su paciencia y su gran técnica de enseñar ya que funciona de forma adecuada y
para gran parte del aula.
Bibliografía
https://es.khanacademy.org/math/probability/data-distributions-a1/summarizing-spre
ad-distributions/a/introduction-to-standard-deviation#:~:text=La%20desviaci%C3%B
3n%20est%C3%A1ndar%20mide%20la,grande%20es%20su%20desviaci%C3%B3
n%20est%C3%A1ndar
Estrella, S., & Olfos, R. (2015, March). Transnumeración de los datos: el caso de las
tablas de frecuencia. In XIV Conferencia Interamericana de Educación Matemática.
21