Está en la página 1de 32

AVANCE DEL INFORME FINAL DEL CURSO DE

ESTADÍSTICA INFERENCIAL
Examinar cómo el uso de varios lenguajes de programación
afecta a estudiantes de ingeniería universitarios en Lima en 2023

GRUPO: 12
INTEGRANTES:

● Chávez Garrido, Cesar Antonio U2222968


1
● Santillán Valdiviezo, Fabrizio Miguel U2022981
4
● Rojas Villaroel Xiomara Mildredth U1921334
1
● Sanchez Sullo,Dariana Jireh U2131504
3

DOCENTE: Jonathan Jose Silva

LIMA – PERÚ

2023
RESUMEN

El objetivo de este estudio es un análisis exhaustivo de la situación actual respecto


al uso de los lenguajes de programación más dominantes. Además, busca
identificar posibles soluciones para los estudiantes a corto y largo plazo,
incluyendo inversiones y retornos relacionados con la programación, tiempo
dedicado a habilidades, satisfacción con el lenguaje utilizado y mayor práctica
durante la universidad. El objetivo principal es resolver el desafío de evaluar cómo
el uso de lenguajes de programación mejora el conocimiento y beneficia a los
estudiantes que cursan ingeniería.

Para realizar este estudio, realizamos una encuesta exhaustiva de 384


participantes utilizando métodos probabilísticos para obtener datos que reflejen las
preferencias de los encuestados. Este enfoque permite comprender con precisión
las tendencias y preferencias actuales en el uso de lenguajes de programación en
educación.

En un contexto más amplio, las crecientes demandas en la industria, la ingeniería


y la educación han llevado a una creciente demanda de profesionales con
habilidades en varios lenguajes de programación. Según las estadísticas, esta
tendencia seguirá aumentando con el tiempo. Por lo tanto, adquirir conocimientos
de lenguajes de programación no sólo significa salida laboral, sino que también te
abre la puerta al mundo industrial y te da la oportunidad de convertirte en
estudiante de ingeniería en este campo en crecimiento.
CONTENIDO

RESUMEN 2

CAPÍTULO 1 4

I. Antecedentes 4
II. Descripción del proyecto 4
III. Problema central del proyecto 4
IV. Objetivo General 5
V. Objetivos Específicos 5

CAPÍTULO 2 5

VI. Conceptos estadísticos 5


VII. Variables y tipos de variables 7
VIII. Muestra estadística y tipo de muestreo 8
IX. Gráficos y tablas estadísticas por variable 9
X. Medidas de tendencia central y dispersión 11
XI. Distribución muestral para la media con varianza poblacional desconocida, pero
tamaño de muestra grande 12
XII. Intervalos de confianza 13

CAPÍTULO 3 18

XIII. Prueba de hipótesis estadística y análisis de los resultados 18


CAPÍTULO 1

I. Antecedentes

La utilización de computadoras en una variedad de contextos posibilita la resolución


de numerosos problemas, abarcando desde entretenidos juegos para niños hasta la
solución de complejas operaciones matemáticas, como lo indicaba Goldfinger en
1961. A través de investigaciones, se ha mejorado el diseño de múltiples lenguajes
de programación, introduciendo estructuras de alto nivel y definiendo
macroinstrucciones para los lenguajes contemporáneos.

Conforme al licenciado Vicente Hernández, un lenguaje de programación consiste en


un conjunto de instrucciones o comandos que describen el proceso deseado. Cada
lenguaje posee sus propias instrucciones y declaraciones verbales, las cuales se
combinan para formar programas informáticos. Estos lenguajes no son aplicaciones
en sí, sino herramientas que permiten crear y adaptar aplicaciones.

El Instituto de Ingenieros Eléctricos y Electrónicos (IEEE) publicó estándares para el


desarrollo de software en 1992 (IEEE Std 1045, 1992), donde los lenguajes de
programación demostraron ser altamente productivos, confiables y ejercieron una
gran influencia en la productividad.

Abelson, según su perspectiva en 1996, considera que los lenguajes de


programación facilitan la organización de conceptos relacionados con los procesos a
fin de proporcionar soluciones simples y eficientes.

Por otro lado, en 1995, una investigación publicada en la revista SIGCSE señala la
importancia de enseñar matemática discreta, algoritmos y otros conceptos para
mejorar la comprensión de diversos lenguajes de programación, además de la
inclusión de paradigmas de programación en el proceso de aprendizaje de
programación.

II. Descripción del proyecto

El objetivo de este informe es el impacto de los lenguajes de programación en los


estudiantes universitarios. Para ello utilizaremos métodos estadísticos, es decir,
procesamiento de datos cualitativos y cuantitativos. Además, los datos obtenidos
serán recopilados, contados, presentados, sintetizados y analizados.
III. Problema central del proyecto

Hoy en día, los lenguajes de programación ofrecen diversas soluciones para abordar
problemas y contribuyen al progreso y desarrollo de la ingeniería. En nuestra
perspectiva, planteamos una única interrogante que nos permitirá analizar el impacto
de los lenguajes de programación en estudiantes universitarios: ¿El uso de lenguajes
de programación fortalece el conocimiento y beneficia a los estudiantes que cursan
carreras de ingeniería? Para abordar esta cuestión, exploramos diversos aspectos,
como el lenguaje de programación más ampliamente empleado, la cantidad de
tiempo dedicada a la programación, el nivel de satisfacción con el lenguaje utilizado,
el aumento en las horas de práctica en el entorno académico, la inversión realizada y
las ganancias obtenidas al trabajar con lenguajes de programación, a lo largo del año
universitario 2023.

IV. Objetivo General

Calcular el provecho derivado del conocimiento de lenguajes de programación


adquirido por los estudiantes de ingeniería.

V. Objetivos Específicos

• Establecer cuál es el lenguaje de programación más frecuentemente empleado


por los estudiantes.

• Identificar en qué campo desearían los estudiantes ofrecer soluciones a corto o


largo plazo mediante sus conocimientos en programación.

• Analizar la inversión promedio necesaria para que un estudiante aprenda un


nuevo lenguaje de programación.

• Evaluar el ingreso medio asociado al uso de lenguajes de programación por


parte de los estudiantes.

• Evaluar el nivel de progreso y desempeño actual de los lenguajes de


programación en el contexto cotidiano de la ingeniería.

• Investigar el interés en la enseñanza de lenguajes de programación para


aumentar las horas de práctica en las carreras de ingeniería.

• Determinar cuántos lenguajes de programación domina cada estudiante.

• Analizar la frecuencia semanal con la que los estudiantes dedican tiempo a la


programación.
CAPÍTULO 2

VI. Conceptos estadísticos

1. Muestra:
En el campo de la estadística, una muestra se define como un grupo selecto de
casos o individuos extraídos de una población más amplia. En diversas aplicaciones,
es crucial que esta muestra sea representativa, lo que implica elegir una técnica de
muestreo adecuada para garantizar que sea verdaderamente aleatoria. La muestra
no solo es un subgrupo de la población, sino que también debe reflejar las mismas
características que se encuentran en la población general. Para que una muestra sea
verdaderamente representativa, debe contener toda la información necesaria que se
busca extraer. Este objetivo solo puede lograrse mediante una cuidadosa selección
de la muestra y una meticulosa y de alta calidad recolección de datos.

2. Población:
Una población estadística comprende la totalidad de individuos, o un grupo de
individuos, que poseen o podrían tener la característica específica que se quiere
investigar.

3. Media Estadística:
En estadística, el término "media" se emplea en dos contextos distintos aunque
numéricamente parecidos

La media muestral es una variable aleatoria que depende de la muestra y tiene una
variación menor que las variables originales utilizadas en su cálculo. Por otro lado, la
media poblacional no es exactamente una media, sino más bien un parámetro
constante que se corresponde con la esperanza matemática de una variable aleatoria.

4. Varianza:
Es un indicador de dispersión que se emplea para mostrar la variación de un conjunto
de datos con respecto a la media aritmética. Se calcula sumando los cuadrados de
las diferencias entre cada valor y la media, y luego dividiendo esta suma por el
número total de observaciones. Sin embargo, esta medida también puede expresarse
como la desviación estándar al cuadrado.

5. Distribución Muestral:
La distribución muestral es el resultado de examinar todas las muestras posibles que
pueden obtenerse de una población. Analizarla posibilita calcular la probabilidad de
que, al tomar una sola muestra, esta se aproxime al parámetro de la población. Esta
distribución es útil para estimar el margen de error asociado a un tamaño específico
de muestra.
6. Parámetro Estadístico:
Un parámetro estadístico o un estadístico muestral se refiere a cualquier valor
derivado de una muestra, como la media, la varianza o una proporción, que describe
una población y puede estimarse a partir de dicha muestra. Estos estadísticos
muestrales son variables aleatorias y, como tal, tienen una distribución de
probabilidad específica, a menudo definida por un conjunto limitado de parámetros.

7. Estimación Estadística:
Se refiere a cualquier método empleado para obtener una estimación aproximada de
un parámetro poblacional, considerando los estadísticos calculados a partir de los
elementos de una muestra. Al estimar un número adecuado de parámetros, es
posible aproximar de manera precisa la distribución de probabilidad de la población
para ciertas variables aleatorias.

8. Nivel de Confianza:
La inferencia estadística evalúa la calidad de una estimación basada en estadísticas
obtenidas de muestras. Usualmente, se emplean niveles de confianza para
establecer intervalos o valores que indican la probabilidad de cometer errores de tipo
I (rechazar una hipótesis que es verdadera).

9. Intervalo de Confianza:
Un intervalo de confianza se define como uno o varios pares de números que se
estima que contienen un valor desconocido asociado a un parámetro poblacional, con
un cierto nivel de confianza. De manera formal, estos números delimitan un intervalo,
calculado a partir de los datos de una muestra, y el valor desconocido corresponde a
un parámetro de la población.

10. Prueba de Hipótesis:


Una prueba de hipótesis es una regla que determina si se puede aceptar o rechazar
una afirmación hecha sobre una población, basándose en la evidencia proveniente
de una muestra de datos. Este proceso implica evaluar dos afirmaciones opuestas
sobre la población: la hipótesis nula y la hipótesis alternativa. La hipótesis nula es la
declaración que se someterá a prueba, la cual afirma la ausencia de un efecto o
diferencia. Por otro lado, la hipótesis alternativa es la afirmación que se espera
demostrar como verdadera, respaldada por la evidencia proporcionada por los datos
muestrales.
VII. Variables y tipos de variables

VARIABLES TIPOS DE VARIABLES


¿Qué lenguaje de programación
Cualitativa nominal
suele usar?
¿Para qué sector le gustaría
ofrecer soluciones en corto o
Cualitativa nominal
largo plazo con sus
conocimientos en programación?
¿Cuánto dinero invierte al mes,
para aprender un lenguaje de Cuantitativa continua
programación? (Soles)
¿Cuánto es su ingreso mensual,
haciendo uso de los lenguajes de Cuantitativa continua
programación? (Soles)
¿Cómo calificaría el avance y
desempeño actual de los
Cualitativa ordinal
lenguajes de programación en el
uso cotidiano de la ingeniería?
¿Cree usted que se debería
enseñar más lenguajes de
programación y aumentar las
Cualitativa ordinal
horas de práctica en las carreras
de ingeniería, teniendo en cuenta
la demanda tecnológica?
¿Cuántos lenguajes de
Cuantitativa discreta
programación dominas?
¿Cuántos días a la semana, usted
Cuantitativa discreta
se dedica a la programación?

VIII. Muestra estadística y tipo de muestreo.

La estrategia de muestreo utilizada en el proyecto actual se conoce como muestreo


aleatorio simple o probabilístico. En esta técnica, todos los elementos de la población
tienen una igualdad de oportunidad para ser seleccionados de manera imparcial.

Tamaño de la muestra
Cálculo de la muestra cuando no se conoce la población:
Z𝛼 =1.96 (Nivel de Confianza = 95%)
Z𝑝: = probabilidad de éxito o proporción esperada (0.5)
Z𝑞 : probabilidad de fracaso (0.5)
𝑑 : error máximo permisible en la estimación (0.05)

Población:
El conjunto completo de estudiantes de ingeniería que hicieron uso de lenguajes de
programación en Lima durante el año 2023.

Muestra:
Un subgrupo de esta población, compuesto por 384 estudiantes de ingeniería que
emplean lenguajes de programación en Lima durante el año 2023.

Unidad de análisis:
Cada persona dentro de este conjunto de estudiantes de ingeniería que utilizan
lenguajes de programación en Lima durante el año 2023.

Tipo de muestreo:
La selección de la muestra se llevó a cabo mediante un muestreo aleatorio simple y
probabilístico, garantizando que todos los individuos tenían la misma probabilidad de
ser seleccionados para formar parte de la muestra.

IX. Gráficos y tablas estadísticas por variable

GRÁFICA Y TABLA DE LA VARIABLE CUANTITATIVA NOMINAL:


1.- ¿Qué lenguaje de programación suele usar?

Variable 𝒇𝒊 𝑭𝒊 𝒉𝒊 𝑯𝒊

C 87 87 0.227 0.227
C++ 80 16 0.208 0.435
7
Java 78 24 0.203 0.638
5
JavaScript 50 29 0.130 0.768
5
Python 89 38 0.232 1
4
38
4

Gráfico circular

23% 23%

13% 21%
20%

C C++ Java JavaScript Python

Fuente: Elaboración Propia

GRÁFICA Y TABLA PARA LA VARIABLE CUANTITATIVA CONTINUA:


¿Cuánto invierte al mes en soles, para aprender un lenguaje de programación?
1) Medida de la inversión mensual que realizan los estudiantes universitarios para
aprender un lenguaje de programación.

Intervalo 𝑿𝒊 𝒇 𝑭 𝒉𝒊 𝑯𝒊 𝑯𝒊 𝑿𝒊 ∗ 𝒇𝒊 (𝑿𝒊 − 𝑿)𝟐 ∗


s 𝒊 𝒊 % 𝒇𝒊
[0; 150> 75 1 1 0.50 0.50 50. 14625 4784575.65
9 9 78 78 8% 3
5 5
[150; 22 8 2 0.21 0.72 72. 18450 3616.028
300> 5 2 7 35 14 1%
7
[300; 37 4 3 0.11 0.84 84. 17250 945387.878
450> 5 6 2 98 11 1%
3
[450; 52 3 3 0.08 0.92 92. 16800 2753911.13
600> 5 2 5 33 45 4% 3
5
[600; 67 1 3 0.04 0.97 97. 12150 3538215.63
750> 5 8 7 69 14 1% 7
3
[750; 82 1 3 0.02 0.99 99. 8250 3520753.47
900> 5 0 8 60 74 7% 9
3
[900; 97 0 3 0 0.99 99. 0 0
1050> 5 8 74 7%
3
[1050; 11 0 3 0 0.99 99. 0 0
1200> 25 8 74 7%
3
[1200;135 12 0 3 0 0.99 99. 0 0
0> 75 8 74 7%
3
[1350; 14 1 3 0.00 1 100 1425 1424106.59
1500> 25 8 26 % 8
4
3 16970566.4 16970566.4
8 06 06
4

Polígono de frecuencias
250

200 195

150

Histograma de frecuencias
Polígono de frecuencias

100
82

50 46

32

18
10
0 0 0 1
0
75 225 375 525 675 825 975 1125 1275 1425

𝒇𝒊𝟑: Se nota que un total de 46 estudiantes universitarios invierten una cantidad que
oscila entre 300 y 400 soles para aprender un lenguaje de programación. Asimismo,
se dispone de un conjunto de 46 datos en total que se encuentran dentro del intervalo
de 300 a 450 soles.
𝑭𝟑: 323 alumnos que estudian ingeniería invierten mensualmente como máximo 450
soles.
X. Medidas de tendencia central y dispersión

Variable cuantitativa continua Media:

∑𝑛𝑖=1 𝑥𝑖 ∗ 𝑓𝑖 88950
𝑥̅ =
𝑛

El promedio de dinero de los estudiantes de ingeniería que invirtieron para aprender


un nuevo lenguaje de programación es 231.641 soles.

Mediana:
Paso 1: Calcular frecuencia absoluta acumulada ( 𝑭𝒊) Paso 2:

Ubicar posición donde se encontrará la mediana 𝑛/2

𝑛 384
= = 192
2 2

Reemplazar en la fórmula:

𝐿𝑖𝑛𝑓:

Límite inferior

𝐹𝑖−1: Frecuencia absoluta cumulada anterior


𝑓𝑖: Frecuencia absoluta de la clase mediana
𝐶: Amplitud Moda:

Paso 1: Identificar la clase modal (Mayor 𝑓𝑖)


Mayor 𝑓𝑖: 195
Paso 2: Reemplazar en la fórmula
𝐿𝑖𝑛𝑓: Límite inferior

𝐶: Amplitud

Medidas de dispersión:
Variable cuantitativa continua:
Varianza:

𝑺𝟐
Desviación estándar:

𝑺=

XI. Distribución muestral para la media con varianza poblacional desconocida,


pero tamaño de muestra grande.

El precio promedio mensual para que los estudiantes de ingeniería aprendan


lenguajes de programación es de 252.695 soles. ¿Podríamos seleccionar 384
estudiantes de ingeniería con un costo de inversión mensual promedio de 231,641 o
más? La desviación estándar muestral es de 210,498 soles mensuales.

POBLACIÓN MUESTRA
𝜎 = Desconocido 𝑛 = 384
𝜇 = 252.695 𝑆 = 210.498

𝑃 =
Varianza poblacional desconocida y tamaño de muestra grande ( ), TLC
Es muy probable, con un 97.5% de confianza, que la inversión promedio realizada por
los estudiantes de ingeniería sea igual o superior a 231.641 nuevos soles.

XII. Intervalos de confianza

Intervalo de confianza para la media poblacional, se desconoce la varianza


poblacional, pero el tamaño de la muestra es grande:

Cuando se pidió a una muestra aleatoria de 384 estudiantes universitarios de ingeniería


que estimaron la inversión mensual promedio requerida para aprender un lenguaje de
programación, el resultado fue una media de 231,641 soles y una desviación estándar
de 850,809 soles. Luego calcule un intervalo de confianza del 95% para el valor real
medio de la inversión de los estudiantes universitarios en aprender un lenguaje de
programación.

Datos:

𝑥̅ = 231.641,𝑛 = 384, 𝑆 = 210.498,∝ = 95% Nivel de confianza:

Confianza: 1 − 𝛼 = 0.95, 𝛼 = 0.05

𝑍(1−𝛼) = 𝑍(0.975) = 1.96


2
Reemplazando y calculando los datos en la fórmula:

Interpretación:

Con un nivel de confianza del 95%, el gasto mensual promedio de un estudiante


universitario para adquirir competencias en un nuevo lenguaje de programación varía
entre 210.587 y 252.695 soles.
Un intervalo de confianza entre dos poblaciones significa que se desconoce la
varianza de la población pero el tamaño de la muestra es grande:

Primera población (A)


Rango: Valor máximo – valor mínimo; 880 − 0 = 880
Número de intervalos (𝑘): Ley de Sturges = 1 + 3.322𝐿𝑜𝑔(𝑛) = 8.58 ≅ 9

Ancho del intervalo (𝑐): 98


𝑘 9

Intervalos 𝑿 𝒇 𝑭𝒊 𝒉𝒊 𝑯𝒊 𝑯𝒊 𝑿𝒊 (𝑿𝒊 − 𝑿)𝟐


𝒊 𝒊 % ∗ 𝒇𝒊 ∗ 𝒇𝒊
0 98 49 4 4 0.21 0.21 22 2058 2255333.0
2 2 88 88 % 81
98 196 14 4 8 0.21 0.43 43 6027 733223.09
7 1 3 35 23 % 1
196 294 24 3 1 0.19 0.63 63 9310 48509.787
5 8 2 79 02 %
1
294 392 34 1 1 0.08 0.71 72 5831 65920.164
3 7 3 85 88 %
8
392 490 44 2 1 0.10 0.82 83 9261 539421.54
1 1 5 94 81 % 0
9
490 588 53 1 1 0.06 0.89 90 7007 867149.70
9 3 7
2 77 58 % 4
588 686 63 6 1 0.03 0.92 93 3822 761573.44
7 7 13 71 % 0
8
686 784 73 1 1 0.05 0.98 98 8085 2269981.8
5 1 8 73 44 % 90
9
784 882 83 3 1 0.01 1 10 2499 915009.22
3 9 56 0% 0
2
1 5390 8456121.9
9 0 17
2

𝑥̅ = 280.729, 𝑛 = 192, 𝑆2 = 44272.890,𝑆 = 210.411


Segunda población (B)

Rango: Valor máximo – valor mínimo; 1500 − 0 = 1500


Número de intervalos (𝑘): Ley de Sturges = 1 + 3.322𝐿𝑜𝑔(𝑛) = 8.58 ≅ 9

Ancho del intervalo (𝑐): 167


𝑘 9

Intervalos 𝑿𝒊 � � 𝒉𝒊 𝑯𝒊 𝑯𝒊% 𝑿𝒊 ∗ 𝒇𝒊 (𝑿𝒊 − 𝑿)𝟐 ∗


� � 𝒇𝒊
𝒊 𝒊

0 167 83.500 1 1 0.68 0.68 68.23 10938.5 1499381.00


3 3 23 23 % 00 1
1 1
167 334 250.50 2 1 0.14 0.82 82.81 7014 100852.507
0 8 5 58 81 %
9
334 501 417.50 1 1 0.08 0.91 91.15 6680 824577.504
0 6 7 33 15 %
5
501 668 584.50 1 1 0.05 0.96 96.88 6429.5 1707731.44
0 1 8 73 88 % 0
6
668 835 751.50 3 1 0.01 0.98 98.44 2254.5 944215.594
0 8 56 44 %
9
835 100 918.50 2 1 0.01 0.99 99.48 1837 1060013.50
2 0 9 04 48 % 0
1
100 116 1085.5 0 1 0 0.99 99.48 0 0
2 9 00 9 48 %
1
116 133 1252.5 0 1 0 0.99 99.48 0 0
9 6 00 9 48 %
1
133 150 1419.5 1 1 0.00 1 100. 1419.5 1510479.40
6 3 00 9 52 % 6
2
1 36573 7647250.95
9 3
2

𝑥̅ = 190.484, 𝑛 = 192, 𝑆2 = 40037.963,𝑆 = 200.095

MEDIDAS
POBLACIÓN 1 (A) POBLACIÓN 2 (B)
𝑥̅1 = 280.729 𝑥̅2 = 190.484
𝑆12 = 44272.890 𝑆22 = 40037.363
𝑆1 = 210.411 𝑆2 = 200.095
𝑛1 = 192 𝑛2 = 192

Intervalo de confianza para la diferencia de medias:


Se llevó a cabo un estudio con el propósito de calcular el promedio de inversión en
soles por parte de estudiantes universitarios que estudian ingeniería para aprender
lenguajes de programación. Se tomaron dos muestras al azar, y los valores promedio
encontrados fueron de 280,729 soles y 190,484 soles, con desviaciones estándar de
44,272.890 y 40,037.363, respectivamente. Se requiere determinar la diferencia entre
las dos muestras en términos de inversión promedio en soles de estudiantes
universitarios para aprender lenguajes de programación, con un nivel de confianza
del 95%.
1) Nivel de confianza:

2) Reemplazando y calculando los datos en la fórmula:


3) Interpretación:
Con un nivel de confianza del 95%, se puede afirmar que existe evidencia estadística
para sugerir que la diferencia de medias en la inversión realizada por los estudiantes
universitarios para aprender un lenguaje de programación cae dentro del rango de
49,713 a 131,317 soles.
SI IC = (+, +)

𝑃(+< 𝜇1 − 𝜇2 < +) = 1 − 𝛼 → 𝜇1 > 𝜇2


Dado que 𝜇1 - 𝜇2 no puede ser igual a cero, podemos concluir que la inversión
promedio mensual en estudiantes universitarios para aprender un lenguaje de
programación es diferente en ambas muestras. En otras palabras, hay una diferencia
significativa entre los montos promedio invertidos por estos dos grupos de
estudiantes.
Intervalo de confianza para la proporción de una población

Se preguntó a 384 estudiantes de ingeniería qué lenguaje de programación utilizan


habitualmente y el 23,18% de ellos dijo que prefiere usar Python sobre otros
lenguajes de programación. Calcule e interprete un intervalo de confianza del 95%
para la proporción real de estudiantes que eligen Python como lenguaje de
programación.

Variable 𝒙 𝒑 𝑞
C 87 0.2266 0.7734
C++ 80 0.2083 0.7917
Java 78 0.2031 0.7969
JavaScript 50 0.1302 0.8698
Python 89 0.2318 0.7682
384
Datos: 𝑛 = 384 𝑝5 = 0.2318 𝑞5 = 0.7682

1) Nivel de confianza: 𝛼 = 95%

𝑍(1−0.05 )= 𝑍(0.975)=1.96

2) Reemplazando los datos a la fórmula:

3)Interpretación:
Con un nivel de confianza del 95%, se estima que la proporción real de estudiantes
universitarios que estudian ingeniería en Lima y utilizan Python como lenguaje de
programación está comprendida entre 0.1896 y 0.274.

Intervalo de confianza para la diferencia de las proporciones de dos poblaciones

En un estudio para determinar la proporción de estudiantes de ingeniería que suelen usar Python
como lenguaje de programación se tomaron 2 muestras aleatorias de 192 alumnos cada una.
Encontrándose que el 20.8% (40 estudiantes) de la primera muestra suelen usar Python, y en el
caso de la segunda muestra dio como resultado que el 25.5% (49 estudiantes) suelen usar Python.
Construya un intervalo de confianza del 95% para la diferencia de proporciones de las 2 muestras
aleatorias que suelen usar Python.

MUESTRA 1 MUESTRA 2
Variable 𝒙 𝒑 𝒒 Variable 𝒙 𝒑 𝒒
C 4 0.24 0.75 C 4 0.20 0.79
7 5 5 0 8 2
C++ 4 0.21 0.78 C++ 3 0.19 0.80
2 9 1 8 8 2
Java 3 0.20 0.79 Java 3 0.20 0.79
9 3 7 9 3 7
JavaScript 2 0.12 0.87 JavaScript 2 0.13 0.86
4 5 5 6 5 5
Python 4 0.20 0.79 Python 4 0.25 0.74
0 8 2 9 5 5
1 1
9 9
2 2

𝑛1 = 192 𝑛2 = 192
𝑝1 = 0.208 𝑝2 = 0.255
𝑞1 = 0.792 𝑞2 = 0.745

1) Nivel de confianza:

2) Reemplazando los datos a la forma:

3) Interpretación
Con un nivel de confianza del 95% el verdadero valor de las proporciones de las 2:00 muestras
aleatorias de estudiantes que suelen usar Python está comprendido entre -0.131 a 0.037.

𝑆𝑖: 𝐼𝐶 = (−, +), 𝑃(−< 𝜋1 − 𝜋2 < +) → 𝜋1 = 𝜋2

No existe diferencia significativa entre las proporciones poblacionales. La proporción de la Muestra


1 es igual a la proporción de la Muestra 2.

Intervalo de confianza para la varianza de una población.

Un estudiante de ingeniería sabe que la inversión exacta para aprender un lenguaje de


programación varía, pues hay múltiples factores que influyen en los pagos mensuales, el pago
mensual que realizan los alumnos es importante, pero también la variación. A fin de estimar la
variabilidad del pago mensual, se escoge al azar 384 alumnos de ingeniería, y se les pregunta por
el pago mensual promedio que es 231.6441 soles, con desviación estándar de 210.498 soles.
Tomando en cuenta, lo antes mencionado se establecerá un intervalo de confianza del 95% para
averiguar la variación del pago mensual de inversión de los estudiantes de ingeniería.
POBLACIÓN MUESTRA
𝜎 = Desconocida 𝑛 = 384
𝑆 = 210.498
𝑆2 = 44309.573

1) Nivel de confianza: 𝜶 = 𝟗𝟓%

1 − 𝜶 = 𝟎. 𝟗𝟓

𝜶 = 𝟎. 𝟎𝟓
2) Reemplazando los datos en la fórmula:

3) Interpretación:

Con una confianza del 95%, se puede afirmar que la varianza real de la inversión
promedio realizada por los estudiantes de ingeniería para aprender un lenguaje de
programación está en el rango de 38,8812.552 a 51,540.754.
CAPÍTULO 3

XIII. Prueba de hipótesis estadística y análisis de los resultados.

Prueba de hipótesis para la media de una población con varianza poblacional desconocida
y tamaño de muestras grandes.
Según experiencias pasadas, se conoce que los estudiantes universitarios invierten en promedio,
para aprender un lenguaje de programación 252.695 soles. Sin embargo, un docente de
Ingeniería de Sistemas sospecha que la inversión media realizada por los alumnos de ingeniería
para aprender un lenguaje de programación es menor y desea verificar dicha sospecha usando
una muestra de 384 alumnos universitarios de ingeniería, con media de 231.641 soles, un nivel
de significancia de 5% y desviación estándar de la muestra de 210.489 soles. ¿Se puede verificar
dicha sospecha del docente de Ingeniería de Sistemas?

POBLACIÓN MUESTRA
𝜇0 = 252.695 𝑥̅ = 231.641
𝜎 = Desconocido 𝑆 = 210.498
𝑛 = 384

Planteamiento de la hipótesis
𝐻

Nivel de significancia: 𝛼 = 0.05 𝑍𝛼


Se establece el estadístico de prueba:
Varianza poblacional desconocida y tamaño de muestra grande ( )
Región crítica dada por 𝛼:

-1.645

Decisión:

𝑍𝑐: -1.96 se encuentra en la región de rechazo. Por ello, se rechaza 𝐻0.

Conclusión
A un nivel de confianza del 95%, los datos estadísticos respaldan la afirmación de que el gasto
promedio mensual que los estudiantes universitarios destinan para aprender un lenguaje de
programación no excede los 252.695 soles. La sospecha del profesor de ingeniería ha sido
confirmada.
Prueba de hipótesis para la diferencia de medias con varianza poblacional
desconocida y tamaño de muestras grandes
Para determinar la inversión media que realizan los estudiantes universitarios de ingeniería, en
aprender un lenguaje de programación de dos poblaciones A y B, se toma una muestra al azar de
192 alumnos de la población A, evidenciándose un costo medio mensual de 280.729 soles y una
desviación estándar de 210.411. Para la segunda muestra, obtenida de la población B, el número
de estudiantes seleccionados es 192, con una inversión media mensual de 190.484 soles y
desviación estándar de 200.095. En ambos casos el nivel de significancia a usar será de 5%, se
desea probar si la inversión media mensual que realizan los alumnos de ingeniería para aprender
un lenguaje de programación en la población A es mayor a la población B.

MEDIDAS
POBLACIÓN 1 MUESTRA 1 (A) MUESTRA 1 (A) POBLACIÓN 2
(A) (B)
𝜎1 = Desconocido 𝑥̅1 = 280.729 𝜎2 = Desconocido 𝑥̅2 = 190.484
𝑆12 = 44272.890 𝑆22 = 40037.363
𝑆1 = 210.411 𝑆2 = 200.095
𝑛1 = 192 𝑛2 = 192

1) Planteamiento de la hipótesis
𝐻

2) Nivel de significancia: 𝛼 = 0.01 𝑍1−𝛼 = 𝑍(0.95) = 1.645

3) Se establece el estadístico de prueba:


Varianzas poblacionales desconocidas y tamaño de muestra grande (𝑛
)

Región crítica dada por 𝛼:


1.645

4) Decisión:

𝑍𝑐: 4.31 se encuentra en la región de rechazo. Por ello, se rechaza 𝐻0.

5) Conclusión
Con un grado de desconfianza del 0,5%, las pruebas estadísticas confirman que el
gasto mensual promedio de los estudiantes universitarios en aprender un lenguaje de
programación es más alto en la población A comparado con la población B.

Prueba de hipótesis para la proporción de una población

Según estudios anteriores se sabe que la proporción de estudiantes de la carrera de


ingeniería que suelen usar el lenguaje de programación Python es 0.274. Para
comprobar dicho estudio se realizó una muestra de 384 estudiantes aleatoriamente
donde se encontró que la proporción de los que usan Python es 0.2318. Con un nivel
de significancia de 5% ¿Existe evidencia suficiente para concluir que la proporción de
estudiantes que usan Python es menor que la de los estudios anteriores?
Datos:

𝑛 = 384 𝑝 = 0.2318 𝜋 = 0.274

1) Planteo de Hipótesis:
(Es mayor que estudios anteriores)
(Es menor que estudios anteriores)

2) Nivel de Significancia: 𝛼 = 0.05

3) Reemplazando los datos en la fórmula:


4) Gráfica y puntos críticos:

𝑅𝑒𝑐ℎ𝑎𝑧𝑎 ℎ0 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 ℎ0
𝑍𝑐 =−1.854

1− 𝛼
𝛼
𝑍(0.05)= −1,645

5) Interpretación:
Con un nivel de significancia del 5% existe evidencia estadística para rechazar la
hipótesis nula. Se concluye que la proporción de estudiantes que usan Python es
menor a 0.274.

Prueba de hipótesis para la diferencia de dos proporciones de dos poblaciones.

Se realizó una encuesta en la UTP a los estudiantes de la carrera de ingeniería con


la finalidad de saber la proporción de estudiantes que utiliza como lenguaje de
programación Python, para ello se tomó como muestra aleatoria a dos grupos de
estudiantes. En el grupo 1 con una muestra de 192 estudiantes se encontró que 40
estudiantes suelen usar el lenguaje de programación Python. En el grupo 2 con una
muestra de 192 estudiantes se obtuvo que 49 estudiantes suelen usar Python como
lenguaje de programación. ¿Existe evidencia estadística suficiente para afirmar que
el grupo 2 tiene mayor proporción de estudiantes donde suelen usar el lenguaje de
programación Python que el grupo 1 de estudiantes?

Datos:
Grupo 1 Grupo 2
𝑛1 = 192 𝑛2 = 192
𝑝1 = 0.208 𝑝2 = 0.255
𝑞2 = 0.792 𝑞2 = 0.745

1) Planteo de Hipótesis:
𝐻0: 𝜋1 ≥ 𝜋2
𝐻1: 𝜋1 < 𝜋2

2) Nivel de Significancia: 𝛼 = 0.05 𝑍𝛼 = -1.645

3) Reemplazando los
datos en la fórmula:

4) Gráfica y puntos críticos:

𝑅𝑒𝑐ℎ𝑎𝑧𝑎 ℎ0 𝑁𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 ℎ0 𝑍𝑐 =−1.093

1− 𝛼

𝑍(0.05)= −1,645

5) Interpretación: Con un nivel de significancia del 5% existe suficiente evidencia


estadística para no rechazar la hipótesis nula. Por ello, se concluye que la proporción de
estudiantes que suelen usar el lenguaje de programación Python del grupo 2 es menor
que la proporción de estudiantes que suelen usar el lenguaje de programación Python
del grupo 1.
Prueba de hipótesis para la varianza de una población

Se demostró que la inversión que deben realizar los estudiantes de ingeniería para
aprender un lenguaje de programación tiene una varianza poblacional de 51321.494
soles. Por lo tanto, se desea comprobar la disminución de la variabilidad del pago
mensual de inversión en los estudiantes de ingeniería, para lo cual se realizó un
muestreo aleatorio de 384 alumnos, encontrándose una varianza muestral de
44309.573 soles, con un nivel de significancia del 5%

Datos:
𝑆2 = 44309.573 𝜎2 = 51321.494 𝑛 = 384

1) Planteo de Hipótesis:

2) Nivel de significancia: 𝛼 = 0.05

3) Reemplazando los datos en la fórmula:

4) Estadístico de prueba

𝝌 =𝝌
𝟐(𝜶,𝒏−𝟏) 𝟐( 𝟎.𝟎𝟓 , 𝟑𝟖𝟑 ) = 338.641

5) Gráfica y puntos críticos:


6) Interpretación:

Con un nivel de significancia del 5% existe evidencia estadística para rechazar la


hipótesis nula. La variabilidad de la inversión mensual en soles es menor que
51321.494 soles. Se concluye que la inversión de los estudiantes de ingeniería ha
disminuido.

Prueba no paramétrica de Signos


En la siguiente tabla se muestran los ingresos que se obtienen haciendo uso de los
lenguajes de programación de una muestra aleatoria de 20 estudiantes de ingeniería.
Se desea probar la hipótesis de que la mediana de ingresos de los estudiantes es de
915 soles. Utilizando un nivel de significancia del 5%.
ESTUDIANTE INGRESO
1 1460
2 370
3 950
4 1450
5 140
6 220
7 850
8 1840
9 1590
10 1920
11 1860
12 1870
13 160
14 460
15 690
16 1470
17 1080
18 100
19 1530
20 2000 20
1) Planteamiento de la hipótesis:

𝐻0: 𝑀𝑒 = 915

𝐻1: 𝑀𝑒 ≠ 915

2) Nivel de significancia: 𝛼 = 0.05


A continuación, se colocará el signo positivo (+) cuando los ingresos sean mayores a
la mediana y negativo (-), cuando este sea menor.

INGRESOS SIGNO
ESTUDIANTE
𝑿𝒊 𝑿𝒊 − 𝟗𝟏𝟓
1 1460 +
2 370 -
3 950 +
4 1450 +
5 140 -
6 220 -
7 850 -
8 1840 +
9 1590 +
10 1920 +
11 1860 +
12 1870 +
13 160 -
14 460 -
15 690 -
16 1470 +
17 1080 +
18 100 -
19 1530 +
20 2000 +

3) Estadístico de prueba:
4) P valor:

5) Decisión:

𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻 P = 0.503 > 0.05

Por lo tanto, no se rechaza Ho.


6) Conclusión:
Con una confianza del 95%, se concluye que la mediana de los ingresos mensuales
de los estudiantes de ingeniería que estudian lenguajes de programación no es igual
a 915 soles, con un nivel de significancia del 0.05.

También podría gustarte