Está en la página 1de 14

“AÑO DE LA UNIVERSALIZACION DE LA SALUD”

UNIVERSIDAD NACIONAL AUTONÓMA DE TAYACAJA

“DANIEL HERNÁNDEZ MORILLO”

FACULTAD DE INGENIERÍA FORESTAL Y AMBIENTAL

DOCENTE: M.Sc. GARCÍA MENDOZA, Pedro José

CURSO: ESTADISTICA GENERAL

CICLO: III

INTEGRANTES:

 DE LA TORRE BENDEZU, Cristian


 QUISPE QUINCHO, Liz Norma
 ROMERO QUILCA, Mirella Mayde

PAMPAS - 2020
Tarea 2 Unidad I para estudiantes de Ingeniería Forestal y Ambiental

Pá gina 1
El trabajo contempla lo relacionado a fundamentos del muestreo y a la distribución
de probabilidades. El objetivo principal es darle la oportunidad al alumno para que
aplique alguno de los conocimientos discutidos en las sesiones de clases
sincrónicas y asincrónicas.

A continuación se dan una serie de situaciones en las cuales se plantean algunas


interrogantes que deben ser analizadas y respondidas de acuerdo al
planteamiento realizado.

1. En las siguientes situaciones seleccione el tipo de escala utilizado para


medir la variable estudiada, marcando con una X la respuesta correcta.

1.1 Se plantea un experimento para averiguar el nivel de satisfacción que


manifiestan los trabajadores de una empresa, los cuales poseen diferentes
nacionalidades, siendo provenientes de 5 países: Perú, Colombia, Ecuador,
Chile y Brasil. Se utiliza una escala de 1 a 5 para identificar la nacionalidad
de los trabajadores, donde 1= Peruanos, 2= Colombianos, 3=Ecuatorianos,
4= Chilenos y 5= Brasileños. Esta escala de medición es del tipo:

a. Nominal x b. De Intervalo
c. Ordinal d. De Razón

 Es de escala NOMINAL, porque posee solo la característica de


descripción, y esto significa que posee etiquetas únicas que sirven para
identificar o delegar valores a los artículos en este caso las
nacionalidades de los trabajadores, donde 1= Peruanos, 2=
Colombianos 3=Ecuatorianos, 4= Chilenos y 5= Brasileños.

1.2 En la población de Pampas, Tayacaja, Huancavelica, se desea conocer el


nivel de instrucción de la población, para lo cual se hace un estudio
considerando una muestra representativa de la población, a quienes se les
aplica una encuesta y registra el nivel de instrucción con una escala de 1 a
5, donde 1 significa sin ningún tipo de estudio (analfabeto), 2 instrucción
primaria, 3 significa estudios a nivel de secundaria, 4 formación técnica y 5
formación universitaria. Esta escala de medición la podríamos clasificar del
tipo:

a. Nominal b. De Intervalo
c. Ordinal x d. De Razón

Pá gina 2
 Es de escala ORDINAL, porque se establecen categorías que posee
etiquetas únicas que sirven para identificar, pero siguiendo un orden
específico, en este caso el nivel de instrucción de la población con una
escala de 1 a 5, donde 1 significa sin ningún tipo de estudio (analfabeto)
2 instrucción primaria, 3 significa estudios a nivel de secundaria, 4
formación técnica y 5 formación universitaria, se tiene una relación de
orden, aunque no hay una distancia específica entre una categoría y
otra.

1.3 En una población de una especie de árbol, se desea conocer si la misma


está en condiciones para ser cosechada, siendo unos de los parámetros
utilizados para tomar la decisión, la media del diámetro tomada en la base
del tronco de cada árbol. Para tomar la decisión se diseña un estudio
considerando una muestra representativa de la población, a quienes se les
registra el diámetro (cm) de la base del tronco. Esta escala de medición la
podríamos clasificar del tipo:

a. Nominal b. De Intervalo
c. Ordinal d. De Razón x

 Es de escala DE RAZÓN, porque cumple las relaciones de igualdad,


orden y distancia, además corresponde al nivel de medición más
completo y el valor cero no es arbitrario, por lo cual representa la
ausencia total de la magnitud que se está midiendo, en este caso se
utilizara el parámetro del diámetro (cm) de la base del tronco del árbol
para conocer las condiciones para ser cosechadas.

2. Ud. ha sido seleccionado para realizar un estudio que permita determinar si


una plantación de árboles está óptima para ser cosechada. Uno de los
parámetros utilizados para tomar la decisión es el diámetro medio (cm) del
tronco en la base del árbol. La población total de árboles de la plantación
está alrededor de los 5000 árboles. Un sondeo realizado en una muestra de
30 árboles, produjo una desviación muestral de 25,41 cm.

2.1 Calcule el tamaño de muestra definitivo, utilizando un valor de K=2 (para un


95% de confianza) y un error máximo admisible de e=8 cm.

Pá gina 3
2.2 Cuál sería el tamaño de muestra definitivo para realizar el estudio
asumiendo una población de 10000 árboles?.

2.3 Cuál sería el tamaño de muestra definitivo para realizar el estudio


asumiendo una población de 50 mil árboles?

Pá gina 4
2.4 Cuál sería el tamaño de muestra definitivo para realizar el estudio
considerando que no se conoce el tamaño de la población, pero se asume
que es muy grande?.

2.5 Qué puede concluir con los resultados obtenidos considerando diferentes
tamaños de la población?

Conclusión: El tamaño de las muestras definitivo obtenidas con los


diferentes tamaños de la población, se obtuvo que son 41 árboles que
están aptos para ser cosechados en la cual se realizó con todos los
parámetros necesarios como: el diámetro medio (cm) del tronco en la base
del árbol, población total de árboles, desviación muestral de 25,41 cm y
utilizando un valor de K=2 (para un 95% de confianza) y un error máximo
admisible de e=8 cm.

3. Cuáles considera Ud. sean las principales diferencias entre el muestreo


estratificado, por conglomerados y por etapas y cuál será el objetivo de
todas estas herramientas de muestreo?.

TIPOS DE DIFERENCIAS OBJETIVO


MUESTREO

Este tipo de muestreo consiste en dividir N Controlar el error de


en L subconjuntos o estratos, de acuerdo a muestreo y lograr la
MUESTREO variables de control (Variables claves de mayor precisión de las
ESTRATIFICADO
estratificación) correlacionadas con la estimaciones que en el
variable de estudio, luego, en cada estrato muestreo aleatorio
se aplica muestreo aleatorio simple. simple.

Pá gina 5
Este tipo de muestreo consiste en dividir la Lograr homogeneidad
población en conglomerados (Grupos entre conglomerados y
representativos de la población), luego se heterogeneidad dentro
MUESTREO POR
CONGLOMERADOS
seleccionan al azar 1 o varios del conglomerado.
conglomerados según lo deseado y Este muestreo es muy
finalmente, los conglomerados útil cuando se realiza
seleccionados, se evalúan completos muestreo por
(todos los elementos). encuestas.

Este tipo de muestreo consiste en dividir la Facilitar la elección de


población en etapas dentro de los elementos de la
conglomerados mayores: muestra aleatoria,
MUESTREO POR
1ra división Conglomerados mayores especialmente cuando
ETAPAS (Unidades primarias de muestreo) no se dispone de una
2da división Conglomerados de segunda lista de las unidades de
etapa (Unidades Secundarias) la población.
Se continúa de esta manera hasta llegar a
la unidad elemental que es el individuo o
elemento al que se quiere evaluar.

4. Cuál considera Ud. que sea la principal diferencia entre el muestreo


probabilístico y el no probabilístico?

 La diferencia que consideramos es que el muestreo probabilístico siendo


una técnica de muestreo, en la que los sujetos de la población tienen la
misma oportunidad de ser seleccionados como muestra representativa y
el muestreo no probabilístico siendo un método de muestreo en el que
no se sabe qué individuo de la población se seleccionará como muestra .

5. Qué utilidad le ve al muestreo no probabilístico y en qué situación particular


considera que lo podría utilizar?.

 La utilidad que vemos en el muestreo no probabilístico es que te permite


obtener resultados más rápido y más rentable ya que como investigador
conocemos la muestra por lo cual así podemos realizar estudios
cualitativos, estudios piloto o investigación exploratoria y además para
observar si un aspecto en particular (Diagnóstico) necesita un análisis
con más profundidad.

 La situación donde podríamos utilizar el muestreo no probabilístico es


realizar un estudio para identificar las amenazas y vulnerabilidades en
Riesgos Ambientales de las 22 municipalidades de los Distritos de la
provincia de Tayacaja.

Pá gina 6
6. En una región de la provincia de Tayacaja se desea conocer la edad de los
árboles de diferentes plantaciones establecidas con varias especies bien
adaptadas a las diferentes zonas de producción. En la región existen
plantaciones recientes, de apenas un año de edad, hasta plantaciones
antiguas de alrededor de 50 años.

6.1. Cómo definiría el espacio muestral para la variable edad de las


plantaciones?.

Datos:
 Plantaciones: 1 año – 50 años
 E= edad de los árboles de diferentes plantaciones.

Los valores que asume E (en su rango), van del 1 al 50 (1, 2, 3, 4……50).
El rango lo expresaríamos de la siguiente manera:

Solución:

 La variable aleatoria E asume un número contable de valores, por ello,


es una variable aleatoria discreta.
 
6.2. Cómo clasificaría a esta variable (discreta o continúa), considerando que
sólo utilizaría números enteros para definir la edad de los árboles y por
qué?.

 Variable discreta porque puede tomar valores en un conjunto numerable


entre dos valores y aun que se trata de años(edad) deben ser números
enteros ya que no puede haber años(edad) en números decimales
irracionales

6.3. Consideraría la variable igual si sabe que existen registros que pueden
indicar la fecha exacta de la siembra de cada plantación y por ende
determinar la edad considerando años y meses e incluso días?

 Sabiendo que existen registros que pueden indicar la fecha exacta de


cada plantación, consideramos que si es igual la variable ya que

Pá gina 7
determinaremos edades con los parámetros del año, mes y días estos
que son valores en un conjunto numerable enteros.
7. Para una variable aleatoria discreta X se dice que para que F(x) sea función de


probabilidad, se debe cumplir que x 1 P(X=x)= 1. Indique por qué se hace esta
aseveración?
 Porque la distribución de probabilidades de una variable aleatoria
discreta es lo que nos va dar la forma como esa variable discreta se
distribuye en el espacio muestral donde va a depender de la posibilidad
de que X ocurra cada vez que hagamos un experimento y esto se
cumple a la sumatoria de todas la probabilidades de X sea igual a 1.

8. Del mismo modo que en el caso anterior, para una variable aleatoria continua
X, se dice que para que F(x) sea una función de densidad de probabilidad, se

debe cumplir que 


f ( x)dx  1
. Explique la razón de esta aseveración.
 Porque la distribución de probabilidades de una variable aleatoria
continua donde son todos los eventos posibles que van a ocurrir en un
intervalo y esto se cumple a la integral que es el área que existe bajo la
curva de (-) infinito hasta (+) infinito de dx sea igual a 1.

9. Para una variable X, que toma valores entre dos puntos definidos como “a” y

“b”, de tal forma que P(a  X b) = a


f ( x )dx
; ¿qué representa la integral
definida entre los puntos a y b?
 La integral definida entre los puntos a y b representa a la variable
continua porque tiene su punto de inicio y su punto de final, ya que el
área entre 2 puntos son áreas que abarcan 2 puntos determinados de la
variable cuando hablamos de (-) infinito hasta (+) infinito la sumatoria
sea igual a 1.

10. Si X es una variable aleatoria y “C” representa a una constante, se dice que la
varianza de la variable X ± la constante es igual a la varianza de la variable X,
o sea: V (X ±C) =V ( X ). ¿Por qué ocurre este resultado?

Pá gina 8
 Porque es la suma entre la varianza de la variable (X) y la varianza de la
constante (C), donde da como resultado la varianza de la variable (X) y
además la varianza de la constante (C) es igual a 0 y esto es porque
una constante no varía o no tiene una varianza (cabe mencionar que la
media de una constante es la constante el mismo valor que equivale a
0).

11. En una plantación de Eucaliptus en algunos árboles se observan daños


ocasionados por un insecto perteneciente a la clase Coleóptera, conocido
vulgarmente como aserrador arlequín (Acrocinus longimanus), que produce
daños en las ramas, caracterizado por el aserrado de las mismas. Se diseña
un experimento para evaluar los daños y se establece un protocolo para
evaluar una muestra representativa de árboles de la plantación, en donde se
determina si el daño está presente o ausente, en cada árbol evaluado. El
proceso se registra en una hoja de datos diseñada para tal fin, en donde se
anota un número uno si el daño está presente y un dos si la planta no presenta
daños por el coleóptero. Dentro de las distribuciones referidas en clase, ¿a
cuál tipo de distribución pertenece la variable evaluada en este tipo de
experimentos y por qué?.

12. En la misma plantación anterior, también se desea conocer el número de


árboles que son afectados en la plantación por el coleóptero en un período de
tiempo determinado, digamos que durante el primer semestre del año. Dentro
de las distribuciones referidas en clase, ¿a cuál tipo de distribución pertenece
la variable evaluada en este tipo de experimentos y por qué?.

13. Una variable aleatoria X N ( μ ; σ 2 ). La figura que caracteriza a esta distribución


de la variable X se encuentra representada en la Figura 1. Por favor indique:

13.1. ¿Cómo se llama la distribución de probabilidades que caracteriza a esta


variable?.
 Distribución normal (CAMPANA DE GAUSS).

Pá gina 9
13.2. ¿Cuáles son los aspectos fundamentales que caracterizan a esta
distribución de probabilidad de la variable X.

Figura 1. Distribución de probabilidad que caracteriza a la variable aleatoria X.

Los aspectos fundamentales que caracterizan a la distribución de probabilidad


de la variable X representada en la figura 1 es:
 El área total bajo la curva es 1
 El área entre dos puntos a y b, donde a < b, corresponde a la P (a< x <
b).
 Es una curva simétrica campaniforme
 Es Asintótica con respecto al eje x (ambos lados)
 Presenta un máximo que coincide con μ
 Presenta dos puntos de inflexión que corresponde a μ - σ y μ + σ
 La media = mediana = moda
 El área entre:
μ - σ y μ + σ = 68.27%
μ - 2σ y μ + 2σ = 95.44%
μ - 3σ y μ + 3σ = 99.72%
13.3. Qué importancia considera que tiene este tipo de distribución en su área
profesional.
 La importancia que consideramos acerca del modelo de distribución
normal en la carrera profesional de Ingeniería forestal y ambiental ya
que esta distribución nos permite analizar los datos respecto a su media
y se determinara la probabilidad del evento en base a la desviación de
su media ya que se comporta como una distribución simétrica en la
gráfica, podemos desarrollar y crear modelos con esta distribución como
la temperatura ambiental de la cuidad de Pampas, la estimación de la
probabilidad de morbilidad humana por contacto con agua contaminada,
la probabilidad de vulnerabilidad de la deforestación en la región

Pá gina 10
amazónica, la probabilidad de los efectos de los riesgos ambientales en
la provincia de Tayacaja y la probabilidad de los causantes y efectos en
la pérdida de la biodiversidad de Tayacaja.

14. Si X es una variable aleatoria continua tal que X N (60 ; 144), o lo que es lo
mismo, µ= 60 y σ2= 144 encontrar.

14.1. P ( x ˃ 80).

14.2. P ( X < 50).

Pá gina 11
15. Si los diámetros del tronco de una población de plantas de una especie
maderable tienen distribución normal con un promedio µ= 23.6 cm y una
varianza σ2=164.8 cm2, encontrar las siguientes probabilidades:
15.1. Encontrar la probabilidad de que un árbol seleccionado al azar de la
población tenga un diámetro que varíe entre 21 y 29 cm de diámetro.
15.2. Encontrar la probabilidad de que un árbol seleccionado al azar de la
población tenga un diámetro superior a 40 cm de diámetro.
16. ¿En qué situaciones Ud. podría tomar la decisión de utilizar el modelo de
distribución de probabilidad teórico t de Student?
 Las situaciones en donde tomaríamos la decisión de utilizar el modelo de
distribución de probabilidad teórico t de Student, es donde yo pueda
desarrollar la estimación de la probabilidad de morbilidad humana por
contacto con agua contaminada, la probabilidad de vulnerabilidad de la
deforestación en la región amazónica, la probabilidad de los efectos de los
riesgos ambientales en la provincia de Tayacaja y la probabilidad de los
causantes y efectos en la pérdida de biodiversidad.

17. En el modelo de distribución de probabilidad teórico t de Student se introduce


el término grados de libertad. ¿Qué importancia considera posee este factor
introducido en el modelo?
 La importancia que consideramos acerca del termino Grados de Libertad en
el modelo de distribución de probabilidad teórico t de Student, conociendo
que una población que tiene una distribución normal, el tamaño de muestra
es pequeño y se desconoce la desviación típica, donde la desviación puede
variar considerablemente de una muestra a otra, entonces el término
¨Grados de libertad¨ se encarga de poder garantizar la no subestimación de
la desviación típica.

18. Encuentre los valores críticos de t para que el área de la cola de la derecha de
la distribución sea 0,01, para los siguientes grados de libertad:
18.1. 15 grados de libertad.
18.2. 29 grados de libertad.
18.3. 150 grados de libertad.
19. ¿Cuáles son las principales propiedades que caracterizan a la distribución de
Ji Cuadrado (X2).

Pá gina 12
20. Para una distribución de χ 2 con 14 gl. Encuentre las siguientes probabilidades
de χ 2:
20.1. La probabilidad de que χ2 sea superior a 6,571.
20.2. La probabilidad de que χ2 esté entre 7,790 y 29,141.
20.3. Sea inferior a 23,685.
21. La distribución de probabilidades de la razón de varianzas, también conocida
como la distribución F de Fisher – Snedecor, definida como la razón de dos
varianzas, se asemeja mucho a la distribución de Ji Cuadrado. En relación a
esta distribución de probabilidades teóricas señale lo siguiente:
21.1. ¿Cuál considera que sea la principal diferencia entre este modelo y el
modelo de Ji Cuadrado (X2).
21.2. ¿Cuáles son las principales propiedades que caracterizan a esta
distribución?.
22. Para una distribución de F con 20 grados de libertad (GL) para el numerador y
10 GL para el denominador, se pide encontrar:
22.1. P(F > 2,77).

22.2. P(2,77 < F < 4,41).

Pá gina 13
22.3. P(F < 2,77).

Pá gina 14