Está en la página 1de 2

ESCUELA POLITÉCNICA DEL EJÉRCITO

Ingeniería en Biotecnología: Quinto Nivel


P R U E B A D E L S O F T W A R E E S T A D Í S T I C O “R”
Diseño de Experimentos
INDICACIONES:
Cada uno de los cuatro programas, completamente documentados (con comentarios), debe ir en el script de
nombre programa1, programa2, programa3 o programa4, según corresponda; los cuatro scripts se colocarán
en la carpeta llamada 39 NRC3356 Apellido Nombre o 39 NRC3359 Apellido Nombre ‒de acuerdo al NRC‒
que se comprimirá y se enviará a pedroromerosaker@gmail.com considerando el protocolo establecido.
Programa 1 (seis puntos)
Realizar con el software R una función para estimar por intervalo y mediante MAC (muestreo aleatorio
conglomerado), a los parámetros  ,  o  . Las entradas de la función deben ser:
 param, que contiene el nombre del parámetro a estimar (tau, mu o pi).
 datos, un vector con N, n, M y NDC (nivel de confianza).
 m.i, un vector con m1 , m2 , mn .
 y.i, un vector con y1 , y2 , yn . Notar que las yi son las mi cuando se va a estimar a la proporción
poblacional  .
Programa 2 (cinco puntos)
Realizar con el software R una función para calcular el tamaño de la muestra necesaria a fin de estimar  ,  o
 mediante MAC (muestreo aleatorio conglomerado). Las entradas de la función deben ser:
 param que contiene el nombre del parámetro a estimar (tau, mu o pi).
 datos, un vector con el número N de conglomerados en la población, el número M de elementos en los
conglomerados de la población, el error máximo de estimación E que corresponda, la varianza
muestral y el NDC.
Programa 3 (tres puntos)
1. Generar en R tres poblaciones con distribución normal:
1.1. La población1 de tamaño N1  5000 , con media 1  20 y desviación estándar 1  1 .
1.2. La población2 de tamaño N2  3000 , con media 2  30 y desviación estándar  2  3 .
1.3. La población3 de tamaño N3  4000 , con media 3  50 y desviación estándar  3  2 .
Para cada una de las poblaciones anteriores, extraer una muestra sin reposición de tamaños n1  50 , n2  30
y n3  40 , respectivamente.
2. Construir un IDC 3 1  , donde  3 es la proporción de valores en población3 mayores que y3  51.
3. Construir un IDC 1  , donde  es el promedio de aquella población que agrupa a las tres poblaciones
consideradas como estratos.
Programa 4 (cinco puntos la parte 1, un punto la parte 2)
El coeficiente de curtosis g2 para un conjunto de datos distintos yi i  1, 2, , k  que se repiten ni veces,
respectivamente, se calcula así:
k

n  y  y 
4
i i n
g2  i 1
2
3
k 
 ni  yi  y  n 
2

 i 1 
En la fórmula anterior n es el tamaño muestral y y es el promedio muestral ponderado, donde:
k k
n   ni , y   ni yi n
i 1 i 1

Dado un radio de convergencia   0 :

1
 Si g2    ,   entonces se puede aceptar que la población de la cual se extraen los datos tiene una
distribución mesocúrtica.
 Si g2   entonces se puede aceptar que la población de la cual se extraen los datos se ajusta a una
distribución leptocúrtica.
 Si g2   entonces se puede aceptar que la población de la cual se extraen los datos sigue una
distribución platicúrtica.
1. Realizar una función en R que calcule g2 y determine el tipo aceptable de distribución poblacional. Las
entradas de la función deben ser:
 eps, el radio de convergencia.
 datos, un vector que contenga al conjunto de datos distintos yi .
 frecuencias, el vector de las frecuencias absolutas ni .
2. Correr el programa, primero con   2.0 y luego con   0.5 , utilizando la siguiente evidencia muestral:
yi 1.20 1.21 1.22 1.23 1.24 1.25 1.26 1.27 1.28 1.29 1.30
ni 1 4 4 2 1 2 3 3 4 3 3
En cada corrida, tanto el resultado numérico de g2 como el tipo aceptable de distribución poblacional
(distribución mesocúrtica, distribución leptocúrtica o distribución platicúrtica) se deben ubicar como
comentario en el script, dos líneas después del final de la función programada, es decir, dos líneas después
del símbolo “}”.
OBSERVACIONES:
 Distribución mesocúrtica: Presenta un grado de concentración medio de sus valores (el mismo que presenta
una distribución normal) alrededor de la esperanza  de la variable.
 Distribución leptocúrtica: Tiene un elevado grado de concentración de sus valores alrededor de la esperanza
 de la variable.
 Distribución platicúrtica: Manifiesta un reducido grado de concentración de sus valores alrededor de la
esperanza  de la variable.

¡Éxitos!
2

También podría gustarte