Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística
Guía didáctica
CARRERA CICLO
Turismo 2
ÁREA
ADMINISTRATIVA
Departamento de Economía
Estadística
Guía didáctica
Autora:
Luz María Castro Quezada
Asesoría virtual
www.utpl.edu.ec
ESTADÍSTICA
Guía didáctica
Luz María Castro Quezada
4.0, CC BY-NY-SA
Primera edición
ISBN digital - 978-9942-25-459-7
La versión digital ha sido acreditada bajo la licencia Creative Commons 4.0, CC BY-NY-SA:
Reconocimiento-No comercial-Compartir igual; la cual permite: copiar, distribuir y comunicar
públicamente la obra, mientras se reconozca la autoría original, no se utilice con fines comerciales
y se permiten obras derivadas, siempre que mantenga la misma licencia al ser divulgada. https://
creativecommons.org/licenses/by-nc-sa/4.0/deed.es
12 de marzo, 2019
2. Índice
2. Índice 4
3. Introducción 6
4. Bibliografía 8
4.1. Básica 8
4.2. Complementaria 8
PRIMER BIMESTRE
1.1. Definiciones 12
Autoevaluación 1 20
Autoevaluación 2 35
Autoevaluación 3 48
UNIDAD 4. MEDIDAS DE DISPERSIÓN, DE POSICIÓN Y DE FORMA 51
Autoevaluación 4 62
SEGUNDO BIMESTRE
Autoevaluación 5 82
UNIDAD 6. MUESTREO 85
Autoevaluación 6 98
Autoevaluación 7 107
7. Solucionario 111
8. Glosario 118
3. Introducción
¡Éxitos en su estudio!
4. Bibliografía
4.1. Básica
4.2. Complementaria
Este texto ayuda al estudiante a reforzar los contenidos teóricos por medio
de aplicaciones en Excel. Esta aplicación para análisis de datos de Microsoft
Office permite realizar procesos estadísticos en hojas de cálculo facilitando
el trabajo del estudiante.
Para el desarrollo de esta asignatura se han seleccionado textos que ponen gran
énfasis en explicaciones detalladas de los problemas y de las metodologías para
lectores que tengan una limitada experiencia en el campo de las ciencias exactas.
Tanto la bibliografía básica (Lind tal. 2015) como la complementaria (Anderson et
al. 2016 y Martínez 2012) se encuentran disponibles en la biblioteca de la UTPL o
a través de recursos educativos abiertos, a los que se puede acceder por medio
de los enlaces dispuestos en esta guía didáctica. La guía didáctica Estadística ha
sido diseñada para facilitar el estudio de la asignatura en forma ordenada, para
facilitar el proceso enseñanza-aprendizaje, por lo tanto es el elemento esencial
para tutelar el estudio de los contenidos propuestos para su formación.
Estudiar a distancia exige una excelente organización del tiempo. Para evitar
inconvenientes, les animo a estar pendientes del plan docente y las fechas
planificadas para cumplir con las actividades ahí propuestas. Recuerde planificar
el tiempo dedicado a la asignatura de tal forma que puedan cumplir con todas las
actividades programadas ya sean de tipo colaborativo (síncronas y asíncronas)
como el trabajo autónomo (tarea y evaluación presencial). Las actividades
planificadas en la asignatura como foros, chats, wikis, cuestionarios y video-
colaboraciones son obligatorias, por lo que no participar en alguna de ellas implica
la pérdida de importantes puntos.
PRIMER BIMESTRE
George Herbert
1.1. Definiciones
Actividad recomendada
Lo invito a revisar el texto básico de Lind et al. (2015) en la Unidad I recoge las
características más importantes de las poblaciones. También le recomiendo
revisar el siguiente REA para profundizar en estos conceptos.
Actividad recomendada
¿Cuáles serían las opciones que propondría para la variable “nivel de estudios”?
Una vez que haya cumplido con esta actividad, usted estará en capacidad de
identificar variables de tipo cualitativo aplicables a sus futuras investigaciones y
las posibles formas de representación que estas tendrían.
Actividad recomendada
▪▪ Ingresos mensuales
▪▪ Religión
▪▪ Número de teléfonos vendidos
▪▪ Nombre
▪▪ Temperatura
▪▪ Vehículos en un parqueadero
▪▪ Edad
▪▪ Raza
▪▪ Estado civil
▪▪ Libros en una biblioteca
Una vez que se han introducido los tipos de variables más usados en el análisis
estadístico, es importante conocer los tipos de medición existentes y en qué casos
aplican. Existen cuatro niveles de medición:
▪▪ Nominal
▪▪ Ordinal
▪▪ Intervalo
▪▪ Razón
Para ampliar los conceptos abordados en esta guía didactica, les recomiendo
revisar el Capítulo 1: ¿Qué es la Estadística? del texto básico de Lind et al. (2012)
referentes a introducción a la estadística. En el libro se citan otros ejemplos que
les permitirán comprender a cabalidad las definiciones estudiadas.
Autoevaluación 1
Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje de la presente unidad. Recuerde que la autoevaluación
no es obligatoria, sin embargo, le apoya para la resolución de la evaluación a
distancia y lo prepara para la evaluación presencial.
1. Estadística es:
a. Temperatura.
b. Género.
c. Distancia.
a. Edad.
b. Género.
c. Salario.
Actividad recomendada
Al observar este video, usted tendrá una idea más clara de la organización de
datos cualitativos. Así, podrá aplicar los conocimientos para levantar información
cualitativa relacionada al campo turístico, como el lugar de procedencia de los
turistas que visitan la ciudad de Loja durante el Festival de las Artes Vivas.
N° # de Instituciones educativas
1 4230
2 3239
3 1951
4 1342
5 1265
6 1264
7 977
8 950
9 731
10 695
11 677
12 607
13 572
14 501
15 499
16 465
17 458
18 427
19 388
20 381
21 348
22 307
23 305
24 87
25 22
Fuente: Ministerio de Educación (2015)
Con base en este ejemplo se detallan los pasos a seguir para organizar tablas de
frecuencia en variables cuantitativas. Para facilitar la organización de los datos se
recomienda organizar los valores de menor a mayor.
2K> n
2^(5 )=32
k=1+3,3 (log n)
k= 5,6
El intervalo de clase debe ser el mismo para todas las clases y la fórmula que
utilizamos para su cálculo es la siguiente:
Donde
i: intervalo de clase
H: valor máximo de los datos
L: valor mínimo de los datos
k: número de clases
En la Tabla 3 se presentan las cinco clases con sus límites superior e inferior.
Esto implica que todos aquellos datos comprendidos entre ambos valores
corresponderán a esta clase, de ahí la importancia de organizar los datos en
forma correcta.
Una vez se han organizado las clases, el siguiente paso es clasificar los datos
que corresponden a cada una de ellas. El número de elementos que hay en cada
clase recibe el nombre de frecuencia absoluta. La sumatoria de las frecuencias
absolutas debe ser igual a n.
a. Histogramas de frecuencias
b. Polígono de frecuencias
Actividad recomendada
Revise los videos cuyo enlace se incluye a continuación, para que conozca cómo
elaborar tablas con datos cualitativos y a representarlos en forma gráfica.
Al observar estos videos, usted tendrá una idea más clara de la organización de
datos cuantitativos. Así, podrá aplicar los conocimientos para levantar información
cualitativa relacionada al campo turístico. Un ejemplo de variable discreta es el
número de miembros de las familias y un ejemplo de variable cuantitativa es el
valor que gastan los visitantes durante el Festival de las Artes Vivas.
Autoevaluación 2
Estoy segura que resolverán estas preguntas en forma correcta ¡Vamos por ellas!
a. El número de frecuencias.
b. El grado de variabilidad de los datos.
c. El valor inferior de los datos.
a. Variable.
b. Dependiendo del número de datos.
c. Constante.
a. Igual a uno.
b. Igual a n.
c. Un valor entre cero y uno.
a. Ojiva ascendente.
b. Histograma.
c. Gráfico de pastel.
a. Datos constantes.
b. Datos cualitativos.
c. Variables continuas.
Como aplicación vamos a considerar los siguientes cantones con sus respectivos
datos de analfabetismo.
a. Media Poblacional
Donde:
Si calculamos la media poblacional del ejercicio práctico planteado con los datos
de la Tabla 6 será de la siguiente manera:
N = 15
∑x = 126,23
b. Media de la muestra
Donde:
: media de la muestra
n: número de valores de la muestra
x: representa cualquier valor particular
∑: Indica Sumatoria (Letra mayúscula Sigma)
∑x: Suma de x valores de la muestra
x
N Muestra
(%)
1 El Chaco 7,19
2 Olmedo 7,54
3 Palora 7,85
4 Jaramijo 9,69
5 Cayambe 11,11
Total (∑x) 43,38
Fuente: Ministerio de Educación (2018)
Dónde:
n=5
∑x = 43,38
c. Mediana
La mediana Me es el punto medio de los valores una vez que se hayan ordenado
de menor a mayor. Se calcula mediante la siguiente fórmula:
d. Moda
Actividad recomendada
Revise el video cuyo enlace se incluye a continuación, para que conozca en forma
explicativa cómo calcular medidas de tendencia central.
Al observar este video, usted tendrá una idea más clara con ejemplos adicionales
de cómo llevar a cabo este importante procedimiento en el análisis de datos.
Para trabajar con datos agrupados vamos a hacer uso de los pasos para la
elaboración de una distribución de frecuencias. Para ejemplificar el proceso
vamos a usar los datos de la Tabla 6, calculamos con estos datos el número de
clase, el intervalo de clase, las frecuencias absolutas y acumuladas y la marca de
clase. Y obtenemos lo siguiente:
a. Media
Donde:
: símbolo de media
n: es el número total de frecuencias (observaciones)
M: es el punto medio de cada clase
fM: frecuencia absoluta de cada clase multiplicada por el punto medio de la
clase.
∑fM: suma de estos productos
Así calculamos:
Frecuencia Marca de
Clase Frecuencia (f) Acumulada clase f*M
(F) (M)
4,18 - 7,54 9 9 5,86 52,74
7,54 - 10,9 2 11 9,22 18,44
10,9 - 14,26 3 14 12,58 37,74
14,26 - 17,63 1 15 15,95 15,95
Total 15 124,87
b. Mediana
En el siguiente ejemplo n es 15, por tanto, 15/2= 7,5. Para cumplir con la
condición se requiere un número > a 7,5. Siendo la frecuencia acumulada en
la primera fila 9, y dado que es mayor a 7,5 se determina que esta es la clase
mediana.
Frecuencia Marca de
Clase Frecuencia (f)
Acumulada (F) clase (M)
4,18 - 7,54 9 9 5,86
7,54 - 10,9 2 11 9,22
10,9 - 14,26 3 14 12,58
14,26 - 17,63 1 15 15,95
TOTAL 15
Dónde:
c. Moda
Frecuencia Marca de
Frecuencia
Clase Acumulada clase
(f)
(F) (M)
4,18 - 7,54 9 9 5,86
7,54 - 10,9 2 11 9,22
10,9 - 14,26 3 14 12,58
14,26 - 17,63 1 15 15,95
TOTAL 15
El valor de la moda para el ejercicio propuesto es 8,5 por ciento, que resultaría ser
el valor más común.
Actividad recomendada
Revise el video cuyo enlace se incluye a continuación, para que conozca en forma
explicativa cómo calcular medidas de tendencia central en datos agrupados.
Al observar este video, usted tendrá una idea más clara, con ejemplos adicionales
de cómo llevar a cabo el cálculo de la media, mediana y moda en datos
organizados en tablas de frecuencia. Recuerde revisar la literatura básica de Lind
et al. (2015) y complementaria de Anderson et al. (2016) si requieren una mayor
explicación sobre el capítulo de medidas de tendencia central.
Autoevaluación 3
Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje. Recuerde que la autoevaluación no es obligatoria, sin
embargo, le apoya para la resolución de la evaluación a distancia y lo prepara
para la evaluación presencial.
a. Dispersión.
b. Tendencia central.
c. Forma.
3. ¿Cuál es la media aritmética del siguiente conjunto de datos 16, 17, 18,
19, 20?
a. 16.
b. 18.
c. 21.
a. 72,1 kg.
b. 63,5 kg.
c. 68,0 kg.
a. 3.
b. 4.
c. 5.
a. 85.
b. 100.
c. 61.
a. Rango
b. Varianza
Fórmula:
Donde:
µ = 8,42
N = 15
N X (x - µ) (x -µ )²
1 4,18 -4,24 17,98
2 5,5 -2,92 8,53
3 5,75 -2,67 7,13
4 6,04 -2,38 5,66
5 6,16 -2,26 5,11
6 6,3 -2,12 4,49
7 7,06 -1,36 1,85
8 7,19 -1,23 1,51
9 7,54 -0,88 0,77
10 7,85 -0,57 0,32
11 9,69 1,27 1,61
12 11,11 2,69 7,24
13 11,69 3,27 10,69
14 12,54 4,12 16,97
15 17,63 9,21 84,82
∑ (X) 126,23 ∑ (X -µ)2 174,70
La varianza que hemos calculado es de 11,65. Este valor nos indica el grado de
variabilidad de los datos.
Actividad recomendada
Revise el video cuyo enlace se incluye a continuación, para que conozca en forma
explicativa cómo calcular medidas de dispersión.
Como habíamos visto en la Unidad 3, es posible realizar cálculos con datos que
han sido resumidos en tablas de distribución de frecuencias. Lo mismo ocurre con
las medidas de dispersión, como la varianza y la desviación estándar, por lo que
se explica en esta sección cómo calcularlas.
a. Varianza
Frecuencia
Frecuencia Marca
Clase Acumulada
Absoluta (f) clase (M)
(F)
4,18 - 7,54 9 9 5,86 6,05 54,46
7,54 - 10,9 2 11 9,22 0,81 1,62
10,9 - 14,26 3 14 12,58 18,15 54,44
14,26 - 17,63 1 15 15,95 58,22 58,22
TOTAL 15 168,74
La varianza resultó ser 11,24. Este valor es similar al que se obtuvo cuando se
calculó la varianza sin agrupar los datos, por lo cual podemos ver que ambos
procedimientos son adecuados y pueden ser usados en forma indistinta.
b. Desviación Estándar
a. Cuartiles
n: número de observaciones
Cuartil 1
Cuartil 2
Cuartil 3
Actividad recomendada
b. Percentiles
Aunque los cuartiles son generalmente los elementos más usados para ubicar
la posición de un valor de un conjunto de datos, en ocasiones los investigadores
requieren conocer otras posiciones. Para este propósito se puede usar la fórmula
general de los percentiles, los mismos que dividen un conjunto de observaciones
en 100 partes iguales.
Donde
Por ejemplo si queremos conocer qué valor ocupa el percentil 80, procedemos a
aplicar la fórmula tomando como ejemplo los datos de la Tabla 6.
P80 =(11,69+11,11)/
P80 = 11,4
Las medidas de forma son indicadores estadísticos que permiten identificar si una
distribución de frecuencia presenta uniformidad. Son necesarias para determinar
el comportamiento de los datos y así, poder adaptar herramientas para el análisis
probabilístico.
a. Sesgo
b. Regla empírica
Actividad recomendada
Autoevaluación 4
Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje. Recuerde que la autoevaluación no es obligatoria, sin
embargo, le apoya para la resolución de la evaluación a distancia y lo prepara
para la evaluación presencial.
a. Desviación típica.
b. La media geométrica.
c. Varianza.
a. 10.5 kg
b. 9 kg2
c. 9 kg
a. 0,02
b. 5,00
c. 0,20
a. Primer decil.
b. Primer cuartil.
c. Percentil.
10. En una distribución de datos, aquel valor que supera al 70% de las
observaciones y a la vez es superado por el 30% se denomina:
a. Mediana
b. Séptimo decil
c. Primer cuartil
SEGUNDO BIMESTRE
Anónimo
En esta sección abordaremos los conceptos más importantes que deben manejar
en el campo de las distribuciones de probabilidad.
Probabilidad: valor entre cero y uno que describe la posibilidad relativa que
ocurra un evento. La fórmula clásica para calcular la probabilidad de un evento es
la siguiente:
Variable aleatoria discreta: se considera así cuando los valores que asume se
pueden contar y pueden organizarse en una secuencia al igual que los números
enteros positivos; por tanto, solo podrá asumir un valor finito de valores. Ejemplo:
número de turistas que visitan la playa en temporada.
Espacio muestral: son todos los posibles resultados que pueden producirse de
un experimento.
Por ejemplo, si lanzamos un dado por una ocasión los resultados posibles
serían:
E= {1, 2, 3, 4, 5, 6}
b. Combinaciones
Donde:
C: número de combinaciones
N: número total de elementos del espacio muestral
n: número de elementos seleccionados
c. Permutaciones
Actividad recomendada
Los videos anteriores le permitirán afianzar sus conocimientos sobre las bases del
estudio de probabilidades.
n: número de ensayos
x: número de éxitos
p: probabilidad de éxito de cada ensayo
q: probabilidad de fracaso de cada ensayo
n= 5
x= 3
p = 0.10
q= 0.90
E(x)= np
Varianza de x (σ²)
σ²= np(q)
q=1-p
E(x)=5*0,1=0,5
Var(x)=5*0,1*0,9=0,45
Actividad recomendada
Revise los videos cuyo enlace se incluye a continuación, para que conozca más
sobre distribución de probabilidad binomial.
Al observar estos videos, usted tendrá una idea más clara con ejemplos
adicionales de cómo llevar a cabo este importante procedimiento en el análisis de
datos.
Una diferencia fundamental entre las variables aleatorias discretas y las variables
aleatorias continuas es cómo se calculan las probabilidades. En las variables
discretas se calcula la probabilidad de que la variable tome un valor determinado.
En cambio cuando se calculan probabilidades de variables aleatorias continuas,
se calcula la probabilidad de que la variable aleatoria tome alguno de los valores
dentro de un intervalo que se calcula como el área bajo la curva normal.
Es importante el cálculo del valor normal estándar z, y por esta razón se indica la
fórmula a continuación:
z=(x-μ)/σ
Donde,
a. µ= 3,9
σ= 0,35
P (x> 4,4)
z=x-μ/σ
Una vez que se ha calculado la probabilidad del primer caso, procedemos con el
segundo literal del ejemplo anterior, en donde se quiere conocer la probabilidad
de obtener una calificación menor a 3,2.
b. μ = 3,9
σ = 0,35
P (x< 3,2)
z=x-μ/σ
Actividad recomendada
Revise los videos cuyos enlaces se incluye a continuación, para que conozca más
sobre distribución de probabilidad normal.
VIDEO: Píldoras matemáticas (2017) Como usar una tabla de distribución normal
(video). Recuperado de enlace web.
Al observar estos videos, usted tendrá una idea más clara con ejemplos
adicionales de cómo llevar a cabo este importante procedimiento en el análisis de
datos.
E(x)=np
σ²= np(q)
E(x)=1000*0,02=20
σ² (x)=1000*0,02*0,98=19,6
σ² (x)= 4,42
μ = 20
σ = 4,42
P (x> 15)
z=x-μ/σ
probabilidad que sea un valor mayor a 15 debemos sumar ambas áreas el área
que acabamos de calcular y el área a la derecha del promedio. Como el valor a la
derecha del promedio es 0,5 (recordemos que el área total bajo la curva normal
es 1), tenemos que:
Autoevaluación 5
Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje de la presente unidad. Recuerde que la autoevaluación
no es obligatoria, sin embargo, le apoya para la resolución de la evaluación a
distancia y lo prepara para la evaluación presencial.
a. Binomial
b. De Poisson
c. Normal
a. (p)n+ (q)n-x
b. (1) – (p)n
c. (1) – (q)n
a. Fija.
b. Variable.
c. Cero.
a. De Poisson.
b. Normal.
c. t de Student
a. Un evento específico x.
b. El área bajo la curva entre dos valores.
c. La ocurrencia de un evento binomial.
a. Cero.
b. Positiva.
c. Negativa.
a. 3.
b. 1.
c. 0.
a. +2.
b. -2.
c. 0.
a. 0,4772
b. 0,0228
c. 0,5000
UNIDAD 6. MUESTREO
Existen diferentes tipos de muestreo que pueden ser utilizados para realizar
investigaciones. El tipo de muestreo que se seleccione depende en gran medida
de los objetivos de la investigación, del presupuesto y tiempo disponibles que
tenga el investigador. A continuación les presento un esquema de los diferentes
tipos de muestreo que existen para su conocimiento y la descripción de cada uno
de ellos.
a. Muestreo no probabilístico
Una muestra es no aleatoria cuando los elementos son elegidos por métodos
dirigidos (no aleatorios). Una desventaja de este procedimiento es que como es
de carácter subjetivo está sujeto a errores. La muestra dirigida está constituida
por una parte de la población, que el investigador considera representativa del
universo. Si se recogen características homogéneas, la representatividad de la
muestra puede ser satisfactoria. Otro tipo de muestreo dirigido es bola de nieve,
en la que el sujeto en estudio sugiere quien podría ser el próximo sujeto de
muestreo.
Actividad recomendada
Revise los videos cuyo enlace se incluye a continuación, para que conozca en
forma explicativa cómo llevar a cabo un muestro no probabilístico.
b. Muestreo aleatorio
Población finita
Población infinita
b. Distribución muestral de
Donde
E()=p
Población finita
Población infinita
np≥5
Actividad recomendada
Revise los siguientes videos para conocer el procedimiento para conocer sobre
la distribución muestral de la media y de la proporción poblacional. Los videos
presentan ejemplos prácticos sobre la aplicación de los conocimientos adquiridos
en esta sección.
a. De la media poblacional
± Margen de error
Tabla 15. Valores de z α/2 para los niveles de confianza más usados
Tamaño de la muestra
Despejando n se tiene,
3. Use su juicio para el valor de σ. Por ejemplo, se puede empezar por estimar
el mayor y el menor valor en los datos de la población. Esta diferencia
entre el mayor y el menor valor proporciona una estimación del rango de
los datos. Por último, este valor dividido entre 4 suele considerarse como
una aproximación burda a la desviación estándar y tomarse como un valor
planeado aceptable de σ.
d. De la proporción poblacional
De manera similar, la fórmula general para obtener una estimación por intervalo
para la proporción poblacional es
±Margen de error
Tamaño de la muestra
El margen de error deseado para calcular una proporción poblacional casi siempre
es 0,10 o menos. En las encuestas de opinión pública un margen de error de
0.03 o 0,04 es común. Con dichos márgenes de error, la ecuación suministra un
tamaño de la muestra que es suficiente para satisfacer los requerimientos de np
>5 y n(1 - p) > 5 para usar una distribución normal como una aproximación de la
distribución muestral de .
Actividad recomendada
Revise los siguientes videos para conocer el procedimiento para conocer sobre
estimación de intervalos de confianza de la media y de la proporción poblacional y
determinación del tamaño de la muestra. Los videos presentan ejemplos prácticos
sobre la aplicación de los conocimientos adquiridos en esta sección.
VIDEO: Maestro Gustavo (2015) Cálculo del tamaño de una muestra (video).
Recuperado de enlace web.
Luego de revisar los videos usted tendrá más claros los procesos para calcular un
intervalo de confianza de la media y la proporción poblacional.
Autoevaluación 6
Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje de la presente unidad. Recuerde que la autoevaluación
no es obligatoria, sin embargo, le apoya para la resolución de la evaluación a
distancia y lo prepara para la evaluación presencial.
a. Aleatoria
b. Intencional
c. Por conveniencia
a. Simple aleatorio
b. Sistemático
c. Estratificado
a. Simple aleatorio.
b. Sistemático.
c. Estratificado.
a. Estimadores muestrales.
b. Errores muestrales.
c. Estimadores sesgados.
a. Error muestral.
b. Intervalo de confianza.
c. Coeficiente de confianza.
a. La media poblacional.
b. La media muestral.
c. La media aritmética.
a. μ=8
b. μ=5
c. μ=7
Actividad recomendada
de una muestra, cuales son las recomendaciones para plantear hipótesis y los
tipos de hipótesis que existen y los errores tipo I y II.
a la población. Para ello utilizamos una prueba a dos colas pues la hipótesis
alternativa no indica dirección alguna.
Ho: μ=9,8
Ha: μ≠9,8
Como se trata de una prueba de dos colas, se calcula el valor de α= 0,05 dividido
por dos, así tenemos = 0,025 que será el valor-p de referencia.
Por consiguiente el área en la que no se rechaza Ho que se ubica entre las dos
colas es de 0,475 a la derecha e izquierda del promedio cuyo valor es 1,96.
El valor de z para nuestro ejemplo fue de -1,11. Dado que la curva normal es
simétrica consideramos en la cola superior un valor igual a 1,11. De acuerdo a la
De acuerdo al método del valor crítico para rechazar la hipótesis nula el valor
calculado debe ser mayor al valor de alpha. En nuestro ejemplo vemos que 1,11.
Por tanto no rechazamos la hipótesis nula.
En esta sección el estudio de las inferencias sobre la diferencia entre dos medias
poblacionales se extiende al caso en el que las dos desviaciones estándar
poblacionales no se conocen. En este caso, para estimar las desviaciones
estándar poblacionales desconocidas se emplean las desviaciones estándar
muestrales.
Muestra 1 Muestra 2
Tamaño de la muestra 30 30
Promedio 9,75 10,22
Varianza 17,69 51,27
Desviación estándar 4,21 7,16
H0: μ1 - μ2 0
Ha: μ1 - μ2 0
Actividad recomendada
Autoevaluación 7
Estoy segura que resolverán estas preguntas en forma correcta ¡Vamos por ellas!
a. 1,96
b. 2,58
c. 1,65
a.
b.
c.
a. H0: μ μ0
Ha: μ μ0
b. H0: μ μ0
Ha: μ μ0
c. H0: μ μ0
Ha: μ μ0
a. H0: μ 800
Ha: μ 800
b. H0: μ 800
Ha: μ 800
c. H0: μ 800
Ha: μ 800
a. Normal.
b. t de Student.
c. Chi cuadrado.
7. Solucionario
Autoevaluación 1
N° Respuesta Retroalimentación
1 A La estadística es el método usado para recoger,
procesar, analizar y presentar datos.
2 A La estadística descriptiva solamente describe la
muestra o población de donde es obtenida, pero no
permite hacer inferencias posteriores.
3 A La población debe tener un característica que la
diferencia de otras unidades, puede ser de tipo
geográfico, etnia, nacionalidad etc.
4 C Es una variable discreta contable finita.
5 B Es un atributo que define a las unidades en forma
cualitativa
6 B Es una variable cuyas unidades se pueden contar en
valores enteros.
7 B Es un atributo, no es una variable cuantitativa.
8 A No es comparable, solamente de carácter descriptivo.
9 C La variable velocidad es de tipo cuantitativo continuo.
10 A Es una variable cuantitativa cuyo punto inicial no es el
cero absoluto, sino un valor de referencia.
Autoevaluación 2
N° Respuesta Retroalimentación
1 B Si existe una gran variabilidad de los datos colectados
el rango de la distribución de datos será mayor.
2 C Una vez que se han calculado la amplitud de los
intervalos, esta se mantiene constante para todas las
clases calculadas.
3 B Todas las observaciones deben estar registradas en
un clase en particular y la sumatoria debe ser igual al
número total de observaciones.
4 A Porque resultan de dividir el valor de la frecuencia de la
clase para n.
5 C Son diagramas muy versátiles para representar todo
tipo de información.
6 B Los intervalos de la variable están dados por las clases
de la distribución de frecuencias, por lo tanto son
constantes.
7 A En este tipo de graficas se representa las frecuencias
acumuladas.
8 B Los gráficos circulares son óptimos para representar
variables nominales y sus frecuencias.
9 B Facilitan la comprensión visual del comportamiento de
la variable a lo largo del tiempo.
10 A Es importante que contenga la información de los ejes
en forma correcta y un título que indique que tipo de
información se está presentando.
Autoevaluación 3
N° Respuesta Retroalimentación
1 B Este tipo de medidas comprenden la media, mediana y
moda.
2 A En aquellos casos cuando se ha seleccionado bien la
muestra, la media es el valor más estable.
3 B Se calcula sumando los valores de cada observación y
dividiendo para n.
4 B Se calcula sumando los valores de cada observación y
dividiendo para n.
5 B Se calcula multiplicando el valor de la observación por
la frecuencia, luego se suman estos valores, y se divide
para n.
6 C Es la diferencia que existe entre cada observación y el
promedio calculado.
7 A En toda distribución de datos la suma de las
desviaciones respecto a la media es cero.
8 B Solamente se puede calcular un valor por grupo y no se
permiten hacer generalizaciones para otras muestras.
9 A Luego de haber organizado los valores de menor a
mayor, es el valor que ocupa la cuarta posición, siendo
n=7.
10 B Ya que no existe un valor particular para la mediana,
es necesario calcular el promedio entre los valores que
ocupen la posición n y n+1.
Autoevaluación 4
N° Respuesta Retroalimentación
1 C El rango, o sea la diferencia entre el valor menor
y el mayor es la menor, es el menor entre las tres
distribuciones.
2 C La varianza es la media de los cuadrados de las
diferencias entre el valor de x y el promedio de la
distribución.
3 B Ya que la varianza solamente se calcula para variables,
en constantes no debe existir variabilidad.
4 C La varianza calculada siempre tiene las unidades de la
variable al cuadrado.
5 A La desviación estándar es la raíz cuadrada de la
varianza, por lo tanto en la misma unidad de la variable.
6 A Este procedimiento se realiza para obtener un
verdadero peso del valor medio de la clase, ya que la
frecuencia indica cuantas observaciones se reportaron
para esa clase, y por tanto requiere más peso que otras
con menor frecuencia.
7 B La varianza es el cuadrado de la desviación estándar.
8 C El coeficiente de variación es el cociente entre la
desviación estándar y la media.
9 B Es el valor ubicado en la vigésima quinta posición.
10 B Es el valor ubicado en la septuagésima posición.
Autoevaluación 5
N° Respuesta Retroalimentación
1 C Los modelos binomial y de Poisson corresponden de
distribuciones de probabilidad de variables discretas.
2 A Es la fórmula de la distribución binomial.
3 A Es una de las características de los experimentos
binomiales, la probabilidad de éxito no puede cambiar
de ensayo en ensayo.
4 B Cuando (n*p) es mayor o igual a 5.
5 B Siempre se requiere un área bajo la curva, pueden
haber tres casos P (a<x<b); P(a<x); P(x>b).
6 A La probabilidad de un valor específico x no se puede
calcular bajo una curva, por lo tanto sería igual a cero.
7 B Constituye la suma de las probabilidades de todos los
eventos posibles.
8 B El valor de la variable aleatoria es menor que el
promedio el valor será negativo.
9 B Es el valor que se obtiene del valor de la tabla para
distribución normal, el valor se ubica a la izquierda del
promedio.
10 A El valor que provee la tabla es el área entre x=10 y el
promedio, pero el área de interés es x<10, por lo tanto
es el área que queda por fuera del valor que nos da la
tabla de probabilidad normal.
Autoevaluación 6
N° Respuesta Retroalimentación
1 A Cuando una muestra es aleatoria, cada elemento tiene
la posibilidad de ser seleccionado con una probabilidad
determinada.
2 C Se divide la población en estratos de acuerdo a
características específicas y diferenciables.
3 A Es el tipo de muestreo más básico, se recomienda
cuando la población es homogénea.
4 B Es un tipo de error común en muestreos.
5 A En este procedimiento se determina un rango dentro del
cual puede presentarse el parámetro poblacional.
6 B El intervalo de confianza depende de la probabilidad
utilizada para estimar el valor.
7 A La media de los promedios muestrales ofrece una
perspectiva sobre la población.
8 B Es la media de las medias muestrales y se calcula con
el procedimiento general para el cálculo de medias
9 A En toda muestra mayor a 30 observaciones se puede
considerar que seguiría un patrón de distribución
normal.
10 A Se considera todos los individuos que cumplen con
la característica y el número total de individuos que
componen la muestra.
Autoevaluación 7
N° Respuesta Retroalimentación
1 A Lo primero es establecer lo que se quiere evaluar o
probar por medio de una prueba de hipótesis.
2 B Al buscar en la tabla de distribución normal el valor que
corresponde a Za/2 para un área bajo la curva de 0,495;
el valor que corresponde es 2,58.
3 A Se trata de un ejemplo con desviación estándar
poblacional conocida.
4 C Se trata de una prueba de hipótesis que mide si existen
diferencias entre el promedio muestral y poblacional, es
una prueba a dos colas.
5 A El error tipo I consiste en rechazar una hipótesis nula
cuando es verdadera.
6 B Es una prueba de hipótesis de la cola superior.
7 A Se debe usar z, ya que se tiene información de la
población.
8 C El error tipo II implica que se acepta la hipótesis nula
cuando es falsa.
9 B Se rechaza la hipótesis si el valor crítico calculado es
mayor que el valor z del alpha del nivel de significancia.
10 A Se rechaza la hipótesis si el valor-p calculado es menor
que el alpha del nivel de significancia.
8. Glosario
Media: Medida de localización central que se calcula sumando los valores de los
datos y dividiendo entre el número de observaciones.
Moda: Medida de localización central, definida como el valor que se presenta con
mayor frecuencia.
Percentil: Un valor tal que, por lo menos p por ciento de las observaciones
son menores o iguales que este valor, y por lo menos (100 -p) por ciento de
las observaciones son mayores o iguales que este valor. El percentil 50 es la
mediana.
Cuartiles: Los percentiles 25, 50 y 75, llamados cada uno primer cuartil, segundo
cuartil (mediana) y tercer cuartil. Los cuartiles sirven para dividir al conjunto de
datos en cuatro partes; cada una contiene aproximadamente 25% de los datos.
Rango: Una medida de la variabilidad, que se define como el valor mayor menos
el menor.
Margen de error: Valor que se resta y se suma a la estimación puntual con objeto
de obtener un intervalo de estimación para el parámetro poblacional.
9. Referencias bibliográficas
Lind, D., Marchal,W., Wathen, S., (2012). Estadística aplicada a los negocios y la
economía. México, Mc Graw Hill.
Maestro Gustavo (2015) Cálculo del tamaño de una muestra (video). Recuperado
de enlace web.
Píldoras matemáticas (2017) Como usar una tabla de distribución normal (video).
Recuperado de enlace web.
ÁREA
sociohumanística