Está en la página 1de 125

Modalidad Abierta y a Distancia

Estadística
Guía didáctica

CARRERA CICLO

Turismo 2

ÁREA
ADMINISTRATIVA
Departamento de Economía

Sección Métodos Cuantitativos

Estadística

Guía didáctica

Autora:
Luz María Castro Quezada

Asesoría virtual
www.utpl.edu.ec
ESTADÍSTICA
Guía didáctica
Luz María Castro Quezada

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA

4.0, CC BY-NY-SA

Diagramación y diseño digital:


EDILOJA Cía. Ltda.
Telefax: 593-7-2611418
San Cayetano Alto s/n
www.ediloja.com.ec
edilojainfo@ediloja.com.ec
Loja-Ecuador

Primera edición
ISBN digital - 978-9942-25-459-7

La versión digital ha sido acreditada bajo la licencia Creative Commons 4.0, CC BY-NY-SA:
Reconocimiento-No comercial-Compartir igual; la cual permite: copiar, distribuir y comunicar
públicamente la obra, mientras se reconozca la autoría original, no se utilice con fines comerciales
y se permiten obras derivadas, siempre que mantenga la misma licencia al ser divulgada. https://
creativecommons.org/licenses/by-nc-sa/4.0/deed.es

12 de marzo, 2019
2. Índice

2. Índice 4

3. Introducción 6

4. Bibliografía 8

4.1. Básica 8

4.2. Complementaria 8

5. Orientaciones generales para el estudio 10

6. Proceso de enseñanza-aprendizaje para el logro de competencias 12

PRIMER BIMESTRE

UNIDAD 1. FUNDAMENTOS DE LA TEORÍA ESTADÍSTICA 12

1.1. Definiciones 12

1.2. Tipos de variables 14

1.3. Niveles de medición 18

Autoevaluación 1 20

UNIDAD 2. RECOLECCIÓN, ORGANIZACIÓN Y PRESENTACIÓN DE


INFORMACIÓN ESTADÍSTICA 23

2.1. Elaboración de tablas de distribución de frecuencia de datos 23

2.2. Distribución de frecuencias de variables cuantitativas 26

2.3. Representación gráfica de variables cuantitativas 31

Autoevaluación 2 35

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 38

3.1. Medidas de tendencia central en datos no agrupados 39

3.2. Medidas de tendencia central para datos agrupados 43

Autoevaluación 3 48
UNIDAD 4. MEDIDAS DE DISPERSIÓN, DE POSICIÓN Y DE FORMA 51

4.1. Medidas de dispersión 51

4.2. Medidas de dispersión en datos agrupados 55

4.3. Medidas de ubicación 57

4.4. Medidas de forma 59

Autoevaluación 4 62

SEGUNDO BIMESTRE

UNIDAD 5. DISTRIBUCIONES DE PROBABILIDADES 65

5.1. Conceptos generales 65

5.2. Reglas de conteo 67

5.3. Distribución binomial: Variable aleatoria discreta 70

5.4. Distribución de probabilidad normal: variables continuas 74

5.5. Aproximación de la distribución normal a la binomial 79

Autoevaluación 5 82

UNIDAD 6. MUESTREO 85

6.1. Tipos de muestreo 85

6.2. Distribuciones muestrales 89

6.3. Estimación por intervalo 93

Autoevaluación 6 98

UNIDAD 7. PRUEBA DE HIPÓTESIS 101

7.1. Prueba de hipótesis 101

7.2. Prueba de hipótesis de dos muestras 104

Autoevaluación 7 107

7. Solucionario 111

8. Glosario 118

9. Referencias bibliográficas 122


Guía didáctica: Estadística

3. Introducción

Estadística es una asignatura que oferta la carrera de Turismo de la Universidad


Técnica Particular de Loja, de la Modalidad Abierta y a Distancia. Se dicta en el
segundo ciclo, es parte de la unidad de organización curricular básica, cuenta con
160 horas distribuidas en componente de docencia (32), prácticas de aplicación y
experimentación de aprendizajes (32) y aprendizaje autónomo (96). Su campo de
formación es Epistemología y Metodología de la Investigación.

Uno de los principios básicos de formación de la Titulación de Turismo es el


impulso a la actividad turística, la cual pretende cambiar de una estructura de
turismo convencional a un turismo sostenible, articulando los sectores público,
privado y la sociedad en su conjunto para brindar destinos sostenibles. La
planificación integrada de todos los actores, permitirá un desarrollo espacial
armonizado del territorio, utilizando los recursos existentes en el país, por medio
de mecanismos participativos y democráticos para lograr un beneficio común
entre los actores involucrados. En este sentido, el estudio de la Estadística es
crucial en la formación profesional de los estudiantes de la carrera. En esta
asignatura los estudiantes tendrán la posibilidad de mejorar el manejo de las
herramientas estadísticas más frecuentemente usadas en el campo profesional
y su aplicación práctica. Por lo tanto, es importante que el estudiante analice los
conceptos básicos y fórmulas que se usarán frecuentemente a lo largo de esta
guía didáctica.

El propósito de la asignatura y la presente guía didáctica de Estadística es


dotar al alumno de una introducción a la Estadística y de sus aplicaciones, así
como desarrollar competencias que le permitan aplicar técnicas de análisis de
datos para situaciones en su campo de formación profesional. La Estadística
nos proporciona elementos básicos para la planificación, para la obtención y
análisis de datos, así como para concluir sobre procesos y eventos. Los datos
son información cualitativa y cuantitativa que facilita los procesos de toma de
decisiones para la planificación y óptimo desarrollo de la actividad turística.

6 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

El estudio de esta asignatura se ha estructurado en 7 unidades temáticas. Cada


unidad consta de una parte fundamental en la que se precisa, conceptos, leyes,
principios, fórmulas, problemas resueltos, ejercicios propuestos, cuestionarios
y autoevaluaciones. Para un mejor estudio de los contenidos, en el primer
bimestre se abordan los contenidos relacionados a la Estadística Descriptiva. En
la Unidad I se aborda la base conceptual requerida para facilitar la comprensión
de las unidades subsecuentes. La Unidad II desarrolla los contenidos referentes
a distribuciones de frecuencia y representación de datos, esto implica la forma
de organizarlos y analizarlos para obtener las mejores conclusiones respecto
a los mismos. La Unidad III trata de medidas de tendencia central en datos
agrupados y no agrupados. La Unidad IV presenta medidas de dispersión,
de ubicación y forma, de esta manera se analiza todo el análisis descriptivo
de información cualitativa y cuantitativa. En el segundo bimestre se abordan
los contenidos referentes a Inferencia Estadística. La Unidad V analiza los
contenidos referentes a probabilidades, esto implica la ocurrencia de un evento
y los tipos de probabilidad principales para variables discretas y continuas.
Además, en este bimestre se estudiarán los métodos de muestreo y algunas
técnicas y procedimientos para obtener muestras representativas de la población
en la Unidad VI. Finalmente, la Unidad VII contiene los contenidos que permitirán
al estudiante plantear y llevar a cabo una prueba de hipótesis, esencial para el
desarrollo de investigaciones en el campo del turismo. El profesional en formación
debe revisar los contenidos de las siete unidades temáticas de forma secuencial y
permanente para mantener el hilo conductor.

Ya que la visión de la UTPL se basa en el humanismo de Cristo, aspiro que su


formación científica y en valores sea el pilar de su desempeño profesional, por
esta razón les invito a cursar esta asignatura con responsabilidad y dedicación.
Ser estudiante de la Modalidad Abierta y a Distancia implica un gran reto y
ustedes son muy valientes en asumirlo, cuentan con nuestro apoyo en todo el
proceso de formación profesional.

¡Éxitos en su estudio!

7 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

4. Bibliografía

4.1. Básica

Lind, D., Marchal,W. y Wathen, S. (2015) Estadística aplicada a los negocios y la


economía. México, Mc Graw Hill.

El texto básico para el estudio de la Estadística Descriptiva e Inferencial.


Posee ejemplos didácticos de casos prácticos en donde se aplican teorías y
técnicas estadísticas.

Castro, L. M. (2018) Guía didáctica de Estadística. Ecuador, Editorial Universidad


Técnica Particular de Loja.

La guía didáctica está elaborada con el propósito de ayudar al estudiante a


encontrar la mejor manera de comprender las temáticas y lograr un estudio
exitoso del texto básico, realizar un acompañamiento en el desarrollo de los
procesos enseñanza- aprendizaje y evitar algunos embotellamientos que son
propios de la asignatura por su naturaleza.

4.2. Complementaria

Anderson, D., Sweeney D. y Williams, T. (2016). Estadística para administración y


economía. México, Cengage Learning.

El texto está conformado por contenidos correspondientes a la Estadística


Descriptiva e Inferencial. Posee ejemplos muy prácticos para lectores con
formación básica en matemáticas.

8 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

Martínez, C. (2012) Estadística y muestreo. Colombia, Ecoe Ediciones.

Este texto ayuda al estudiante a reforzar los contenidos teóricos por medio
de aplicaciones en Excel. Esta aplicación para análisis de datos de Microsoft
Office permite realizar procesos estadísticos en hojas de cálculo facilitando
el trabajo del estudiante.

9 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

5. Orientaciones generales para el estudio

Para el desarrollo de esta asignatura se han seleccionado textos que ponen gran
énfasis en explicaciones detalladas de los problemas y de las metodologías para
lectores que tengan una limitada experiencia en el campo de las ciencias exactas.
Tanto la bibliografía básica (Lind tal. 2015) como la complementaria (Anderson et
al. 2016 y Martínez 2012) se encuentran disponibles en la biblioteca de la UTPL o
a través de recursos educativos abiertos, a los que se puede acceder por medio
de los enlaces dispuestos en esta guía didáctica. La guía didáctica Estadística ha
sido diseñada para facilitar el estudio de la asignatura en forma ordenada, para
facilitar el proceso enseñanza-aprendizaje, por lo tanto es el elemento esencial
para tutelar el estudio de los contenidos propuestos para su formación.

La técnica de aprendizaje sugerida para el estudio de la asignatura es el


aprendizaje por descubrimiento. Esta técnica se ajusta adecuadamente para
la modalidad de estudios a distancia, en donde, conforme se avanza en los
contenidos se provee de recursos educativos abiertos (REAs) para sustento
de los aspectos abordados. Los ejemplos que ofrecen los textos y los videos
sugeridos son explicados a detalle para facilitar la comprensión del estudiante en
formación, por lo que les recomiendo hacer revisión permanente de los recursos
para evitar confusiones.

Estudiar a distancia exige una excelente organización del tiempo. Para evitar
inconvenientes, les animo a estar pendientes del plan docente y las fechas
planificadas para cumplir con las actividades ahí propuestas. Recuerde planificar
el tiempo dedicado a la asignatura de tal forma que puedan cumplir con todas las
actividades programadas ya sean de tipo colaborativo (síncronas y asíncronas)
como el trabajo autónomo (tarea y evaluación presencial). Las actividades
planificadas en la asignatura como foros, chats, wikis, cuestionarios y video-
colaboraciones son obligatorias, por lo que no participar en alguna de ellas implica
la pérdida de importantes puntos.

10 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

Es importante que realice las autoevaluaciones y evaluaciones parciales ya


que se basan en los conocimientos teóricos y prácticos que debe conocer en la
asignatura. Si usted responde de forma favorable, siéntase con la tranquilidad
de haber adquirido los conocimientos pertinentes sobre estadística y de estar
preparado para sus evaluaciones presenciales.

Con el objetivo de no acumular actividades al final del ciclo, les sugiero el


desarrollo progresivo de la tarea semana a semana, así tendrá tiempo suficiente
para la preparación de la evaluación presencial al final del bimestre. El desarrollo
de la tarea es fundamental para que usted ponga en práctica sus cocimientos
y demuestre que ha alcanzado los resultados de aprendizaje propuestos en la
asignatura.

Es importante mantener el contacto permanente con el tutor para aclarar las


dudas que se presentan en el trascurso del ciclo. Para ello ustedes pueden
acudir a la mensajería electrónica, al correo electrónico y al dialogo directo con el
docente en las tutorías planificadas por vía telefónica en forma semanal.

11 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

6. Proceso de enseñanza-aprendizaje para el logro de competencias

PRIMER BIMESTRE

UNIDAD 1. FUNDAMENTOS DE LA TEORÍA ESTADÍSTICA

“Si esperas a que llegue el momento perfecto,


acabarás esperando toda tu vida. Es mejor que
tomes lo que tienes y empieces ya”

George Herbert

Queridos estudiantes, vamos a dar inicio a nuestra asignatura. Un buen punto


de partida para iniciar el estudio de la estadística es el conocimiento de los
aspectos básicos. Una vez tengamos claros estos conceptos será mucho más
fácil comenzar con la parte metodológica. En esta sección vamos a conocer los
elementos clave que les permitirán entender las bases de la estadística.

1.1. Definiciones

Las definiciones más importantes para avanzar en el estudio de la asignatura son


las siguientes:

Estadística es la ciencia que recoge, organiza, presenta, analiza e interpreta


datos con el fin de propiciar una toma de decisiones más eficaz. Existen dos tipos
de estadística: descriptiva e inferencial.

La estadística descriptiva comprende métodos para describir las características


importantes de un conjunto de datos. Dentro de este segmento de técnicas
se incluyen los procedimientos para conocer la distribución de frecuencias y

12 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

su representación gráfica y el cálculo de las medidas de tendencia central, de


ubicación, dispersión y simetría. La estadística inferencial consiste en métodos
que se emplean para determinar una propiedad de una población con base en la
información obtenida a través de una muestra.

Población es el conjunto de individuos u objetos que tienen propiedades


comunes. Les propongo un ejemplo de población y muestra. Como se visualiza
en la Figura 1, la población está conformada por individuos de una región
identificados por sus tipos de sombreros. Vemos que aquellos individuos con
características diferentes (sombreros rojos) son excluidos de la población elegible,
pues no cumplen las características requeridas. La muestra consiste de una
porción o subconjunto de la población que se estudia y sobre la cual se colectará
y procesará información que luego será presentada en estudios de investigación o
de mercado.

Figura 1. Población y Muestra


Adaptada de: Banco Interamericano de Desarrollo (2019)

13 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Actividad recomendada

Lo invito a revisar el texto básico de Lind et al. (2015) en la Unidad I recoge las
características más importantes de las poblaciones. También le recomiendo
revisar el siguiente REA para profundizar en estos conceptos.

VIDEO: Matemáticas Profe Alex (2017). Conceptos básicos de Estadística [video].


Colombia. Recuperado de enlace web.

Luego puede proceder a identificar las características de las poblaciones y dar


respuesta a la siguiente interrogante.

¿Qué otras características debe poseer una población?

1.2. Tipos de variables

Otro aspecto de gran importancia en los estudios estadísticos es identificar el tipo


de variables con las que trabajaremos. En estudios sociales es muy frecuente
usar variables para describir las características o atributos de los individuos así
como sus comportamientos o patrones de preferencia. En estudios técnicos es
muy común usar variables que describen funcionamiento de sistemas (biológicos,
químicos, matemáticos etc.) Esta sección, por lo tanto, busca desarrollar sus
habilidades para identificar los tipos de variables que se utilizan de acuerdo a
los estudios ya que este aspecto es esencial para decidir qué tipo de análisis
estadístico se ajusta de mejor forma a la investigación que se va a realizar.

Una variable estadística es una característica que puede fluctuar


y cuya variación es susceptible de adoptar diferentes valores, los
cuales pueden medirse u observarse.

14 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Las variables de estudio generalmente se clasifican en variables cualitativas y


cuantitativas (ver Figura 2). A continuación se presentan las definiciones de los
tipos de variables.

Figura 2. Tipos de variables


Adaptada de: Lind et al. (2015)

▪▪ Variable cualitativa o atributo: Analiza características descriptivas de los


objetos o individuos de estudio como la procedencia, nivel de estudios,
género, estado civil filiación religiosa, características étnicas, situación de
pobreza, etc. Generalmente se ofrecen algunas opciones sobre las cuales se
puede seleccionar el atributo. Por ejemplo, al considerar la variable estado
civil las opciones a elegir serían ser soltero, casado, divorciado, viudo, unión
libre, etc.

15 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Con base en lo explicado, propongo desarrollar su creatividad en la selección de


variables:

Actividad recomendada

Estimado estudiante responda a las siguientes preguntas sobre tipos de variables


cualitativas. Recuerde que las opciones serían posibles atributos que puede
adoptar una variable.

¿Cuáles serían las opciones a que propondría para la variable “género”?

¿Cuáles serían las opciones que propondría para la variable “nivel de estudios”?

¿Cuáles serían las opciones a que propondría para la variable “religión”?

Una vez que haya cumplido con esta actividad, usted estará en capacidad de
identificar variables de tipo cualitativo aplicables a sus futuras investigaciones y
las posibles formas de representación que estas tendrían.

▪▪ Variable cuantitativa: describe características de tipo numérico, pueden ser


discretas o continuas.

▪▪ Variable discreta: son aquellas que se refieren a elementos que se pueden


contar, como el número de personas en una fila del cine o de autos en un
peaje. Asumen el valor de números enteros ya que no pueden tomar valores
fraccionarios. Otros ejemplos de variables discretas son el número de
estudiantes que aprueban un cuestionario o el número de personas con que
supera la mayoría de edad, en un salón de clase.

▪▪ Variable Continua: son aquellas que se expresan en cualquier valor


dentro de un intervalo, o sea pueden asumir valores decimales. Ejemplos

16 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

de variables continuas son el peso de las personas, la distancia entre dos


objetos, ingresos mensuales, ingesta calórica diaria, etc.

Actividad recomendada

Del siguiente listado, clasifique aquellas variables que son cualitativas o


cuantitativas, considerando si las últimas son discretas o continuas.

▪▪ Ingresos mensuales
▪▪ Religión
▪▪ Número de teléfonos vendidos
▪▪ Nombre
▪▪ Temperatura
▪▪ Vehículos en un parqueadero
▪▪ Edad
▪▪ Raza
▪▪ Estado civil
▪▪ Libros en una biblioteca

17 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Al cumplir con esta actividad, usted afinará sus destrezas en la identificación


y selección de variables, este paso es esencial para plantear temas de
investigación.

1.3. Niveles de medición

Una vez que se han introducido los tipos de variables más usados en el análisis
estadístico, es importante conocer los tipos de medición existentes y en qué casos
aplican. Existen cuatro niveles de medición:

▪▪ Nominal
▪▪ Ordinal
▪▪ Intervalo
▪▪ Razón

Generalmente, los niveles nominal y ordinal aplican a las variables de tipo


cualitativo (Figura 3). El nivel nominal cumple la función de describir la variable
sin establecer ningún tipo de comparación entre los elementos; por ejemplo si
nos referimos a la religión, no existe una jerarquía que permita calificar si una
religión es superior o inferior a otra. Otro tipo de variables que cumple esta función
nominal es el estado civil.

En el caso del nivel de medición ordinal, sí se considera un orden de las


características descritas por la variable de acuerdo a una escala de valor. Un
ejemplo sería la promoción de un curso con una valoración deficiente, aceptable o
sobresaliente.

18 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Figura 3. Niveles de Medición


Adaptada de: Lind et al. (2012)

En cuanto a las variables cuantitativas, estas pueden adoptar niveles de intervalo


y razón; el nivel de medición no está directamente ligado al hecho que la variable
sea discreta o continua (Figura 3). El nivel de intervalo se utiliza en aquellos casos
en los que no existen un valor absoluto, como la temperatura dada en grados
Celsius (en esta escala el cero no implica la ausencia de temperatura) o la altitud
en metros sobre el nivel del mar, en ambos casos los valores son referenciales.

En cambio, al hablar del nivel de razón siempre se debe considerar valores


referenciales absolutos, como el cero en la medición de temperatura en grados
Kelvin (cero absoluto). Vale la pena señalar que la mayor parte de variables
continuas tienen una escala de medición de razón.

Para ampliar los conceptos abordados en esta guía didactica, les recomiendo
revisar el Capítulo 1: ¿Qué es la Estadística? del texto básico de Lind et al. (2012)
referentes a introducción a la estadística. En el libro se citan otros ejemplos que
les permitirán comprender a cabalidad las definiciones estudiadas.

19 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Autoevaluación 1

Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje de la presente unidad. Recuerde que la autoevaluación
no es obligatoria, sin embargo, le apoya para la resolución de la evaluación a
distancia y lo prepara para la evaluación presencial.

Antes de empezar, ¡revise sus apuntes una vez más!

Considerando el siguiente enunciado, seleccione la alternativa correcta.

1. Estadística es:

a. El sistema o método usado en la recolección, organización, análisis y


descripción numérica de la información
b. Comportamiento de hechos o fenómenos de grupo
c. Reglas o principios para el análisis de fenómenos

2. La estadística descriptiva consiste en:

a. La descripción de un conjunto de datos sin llegar a conclusiones con


respecto a un grupo mayor.
b. Interpretación de resultados.
c. El análisis para llegar a conclusiones sobre una población.

20 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

3. Se entiende por población a:

a. Un recuento de las unidades que tienen una característica común.


b. Un recuento de unidades.
c. Un conjunto de datos.

4. Un ejemplo de población finita es:

a. Células del cuerpo.


b. Conjunto de números reales.
c. Estudiantes del componente académico matemáticas.

5. Un ejemplo de característica cualitativa puede ser:

a. Temperatura.
b. Género.
c. Distancia.

6. Un ejemplo de variable discreta es:

a. Presión del aire.


b. Número de clientes en una tienda.
c. Peso de una lata en un proceso de fabricación.

7. ¿Cuál de las siguientes opciones describe una característica


cualitativa?

a. Edad.
b. Género.
c. Salario.

21 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

8. ¿Cuál de las siguientes opciones describe una variable nominal?

a. Profesión de los entrevistados.


b. Posición de llegada en una competencia.
c. Velocidad a la que circula un vehículo.

9. Escoja cuál de las siguientes opciones describe una característica


cuantitativa de razón:

a. Raza de las personas.


b. Temperatura en grados centígrados.
c. Velocidad a la que viaja un vehículo.

10. Escoja cuál de las siguientes opciones describe una característica


cuantitativa de intervalo:

a. Temperatura en grados centígrados.


b. Género de las personas.
c. Número de vehículos que circulan en un peaje.

No olvide que para evaluar su desempeño en el desarrollo de esta autoevaluación


puede revisar el solucionario al final de la guía didáctica, en donde se indican las
respuestas correctas de los ítems.

22 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

UNIDAD 2. RECOLECCIÓN, ORGANIZACIÓN Y PRESENTACIÓN DE


INFORMACIÓN ESTADÍSTICA

2.1. Elaboración de tablas de distribución de frecuencia de datos

Estimados profesionales en formación, la organización y procesamiento de


datos es un paso muy importante para los posteriores análisis estadísticos. La
organización depende del tipo de variables que se utiliza, tal como se había
explicado en la unidad anterior. En esta unidad analizaremos como recoger,
organizar y presentar los datos recogidos en una investigación.

Las fuentes de información pueden ser primarias y secundarias. Las fuentes


primarias son aquellas que generan datos a partir del levantamiento de
información a través de medios como encuestas y entrevistas. La información
secundaria es aquella que encontramos en bases de datos o fuentes de consulta
y que ha sido generada por otra persona o grupos de personas.

Una vez que hemos levantado la información, requerimos procesarla.


Primeramente, analizaremos el tratamiento que se da a datos cualitativos. En
el ejemplo que les propongo, los estudiantes de Gastronomía levantaron una
encuesta para conocer las preferencias de restaurantes en la ciudad de Loja.
En este caso, la organización de los datos consiste en agrupar la información de
acuerdo con las categorías propuestas y contabilizar la frecuencia con la que se
presentaron.

23 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Tabla 1. Tipos de restaurantes preferidos en una encuesta a 100 personas en la


ciudad de Loja

Tipo de restaurante # de personas


Italiano 15
Mexicano 12
Asaderos 29
Comida rápida 30
Comida típica 14
Fuente: Encuesta realizada por estudiantes de Estadística II de Gastronomía-UTPL (2017)

La Tabla 1 nos presenta en forma organizada la información, así corresponden


a la categoría comida rápida el mayor número de frecuencias, en este caso 30,
por lo que conclusión es que es el tipo de restaurante preferido en la ciudad. En
cambio, el tipo de restaurante que la gente prefiere en menor medida es el de
comida mexicana con 12 individuos.

Nota: en variables de tipo cualitativo no es posible calcular medidas


estadísticas como promedio, mediana o moda, solo la frecuencia con la
que ocurre el resultado.

Para presentar este tipo de variables se utilizan diagramas de barras o pasteles.


Como se observa en el gráfico a continuación, cada categoría representada es
independiente, ya que se trata de variables cualitativas de tipo nominal. A través
del siguiente ejemplo vamos a observar cómo se grafica este tipo de información,
tomando como referencia los tipos de restaurantes preferidos por un grupo de 100
personas encuestadas en la ciudad de Loja.

24 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Figura 4. Preferencia de restaurantes en la ciudad de Loja


Fuente: Encuesta realizada por estudiantes de Estadística II de Gastronomía-UTPL (2017)

Nota: Todo gráfico debe contar con un título que explique la


información que se presenta. Cuando elabore gráficas estadísticas
siempre debe indicar con rótulos las variables que se representan en
los ejes de las ordenadas y abscisas.

Actividad recomendada

Revise el video cuyo enlace se incluye a continuación, en donde se explica cómo


elaborar tablas con datos cualitativos y a representarlos en forma gráfica.

VIDEO: Academia Internet (2016) Tabla de frecuencias para variable cualitativa,


diagrama de sectores (video). Recuperado de enlace web.

Al observar este video, usted tendrá una idea más clara de la organización de
datos cualitativos. Así, podrá aplicar los conocimientos para levantar información
cualitativa relacionada al campo turístico, como el lugar de procedencia de los
turistas que visitan la ciudad de Loja durante el Festival de las Artes Vivas.

25 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

2.2. Distribución de frecuencias de variables cuantitativas

Cuando se trata de variables cuantitativas, los datos se deben organizar en tablas


de distribución de frecuencias. En esta sección se muestra el procedimiento
que deben seguir para tabular y procesar sus datos. Para ello tomaremos el
siguiente ejemplo como referencia en la Tabla 2, en la que se indica el número de
instituciones educativas en 25 provincias del Ecuador.

Tabla 2. Número de instituciones educativas por unidad de análisis en Ecuador

N° # de Instituciones educativas
1 4230
2 3239
3 1951
4 1342
5 1265
6 1264
7 977
8 950
9 731
10 695
11 677
12 607
13 572
14 501
15 499
16 465
17 458
18 427
19 388
20 381
21 348
22 307
23 305
24 87
25 22
Fuente: Ministerio de Educación (2015)

26 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Con base en este ejemplo se detallan los pasos a seguir para organizar tablas de
frecuencia en variables cuantitativas. Para facilitar la organización de los datos se
recomienda organizar los valores de menor a mayor.

Paso 1: Determinar el número de clases

Existen varios enfoques para determinar el número de clases en la literatura, en


esta guía didáctica les presentare dos formas de hacerlo. Vamos a aplicar ambos
métodos para determinar el número de clases.

En la primera metodología se utiliza el concepto

2K> n

Donde k es el número de clases recomendable y n el número total de


observaciones. El objetivo de esta metodología es buscar un valor de ‘k’ al que se
eleve la base 2, y que dé como resultado un número mayor a n, o sea al número
de elementos que conforman el conjunto de datos. El valor de k será el número de
clases recomendadas para ese conjunto de datos.

En el ejemplo de la tabla 2 tenemos 25 observaciones (n=25), por lo tanto se


requiere un valor de k, que siendo la potencia a la que se eleve 2, genere un valor
mayor a 25

Así tenemos que,

2^(5 )=32

y siendo 32 > 25 se cumple la regla básica, por lo cual el número de clases


recomendadas será 5.

Otro procedimiento para determinar el número de clases es la fórmula Sturges:

k=1+3,3 (log n)

27 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Así, remplazando por el valor de n tenemos k=1+3,3 (log 25)

Al aplicar la fórmula obtenemos

k= 5,6

Considerando que la fórmula Sturges sugiere usar el número entero como


un referente para el número de clases, tendríamos que, lo recomendable son
5 clases, siendo el resultado similar al de la fórmula anterior. Una completa
explicación de la fórmula Sturges se puede encontrar en Martínez (2012).

Paso 2: Determinar el intervalo o ancho de clase

El intervalo de clase debe ser el mismo para todas las clases y la fórmula que
utilizamos para su cálculo es la siguiente:

Donde

i: intervalo de clase
H: valor máximo de los datos
L: valor mínimo de los datos
k: número de clases

Aplicando la fórmula obtenemos:

Con este resultado conocemos que el intervalo de clase recomendado es 842.

28 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Paso 3: Establecer los límites de cada clase

En este paso tomamos como referencia el valor mínimo de la tabla 2 que


corresponde a 22, este será el límite inferior de la primera clase. Luego sumamos
el intervalo de clase calculado en el paso 2 obteniendo un valor de 864 (22+842),
este valor constituye el límite superior para la primera clase. Como vamos a
determinar clases excluyentes el límite inferior de la segunda clase es el valor
inmediatamente superior. Procedemos así sucesivamente hasta obtener las 5
clases establecidas en el primer paso (k=5).

Tabla 3. Límites de clase del número de instituciones educativas en el Ecuador

N° de clase Límite inferior Límite superior


1 22 864
2 865 1706
3 1707 2548
4 2549 3390
5 3391 4232
Fuente: Ministerio de Educación (2015)

En la Tabla 3 se presentan las cinco clases con sus límites superior e inferior.
Esto implica que todos aquellos datos comprendidos entre ambos valores
corresponderán a esta clase, de ahí la importancia de organizar los datos en
forma correcta.

Paso 4: Elaborar la distribución de frecuencias

Una vez se han organizado las clases, el siguiente paso es clasificar los datos
que corresponden a cada una de ellas. El número de elementos que hay en cada
clase recibe el nombre de frecuencia absoluta. La sumatoria de las frecuencias
absolutas debe ser igual a n.

29 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

La frecuencia acumulada es la suma de las frecuencias absolutas de cada clase


con el inmediato superior. Este tipo de valores son muy importantes cuando se
trabaja con datos agrupados, como se verá más adelante.

Otro factor importante en la construcción de distribución valores es la frecuencia


relativa. Lo que hacemos es dividir la frecuencia absoluta de cada clase para n.
La sumatoria de las frecuencias relativas debe ser igual a 1.

Para conocer el procedimiento para calcular la frecuencia relativa revisar el texto


básico Lind et al (2015), que en su Capítulo 2: Descripción de datos, aborda la
descripción de datos en tablas de frecuencias, distribuciones de frecuencias y su
representación gráfica.

Tabla 4. Distribución de frecuencias absolutas y relativas del número de


instituciones educativas en Ecuador

Frecuencia Frecuencia Frecuencia


Límite Límite
N° de clase Absoluta Acumulada Relativa
inferior superior
(f) (F) (fr)
1 22 864 17 17 0,68
2 865 1706 5 22 0,20
3 1707 2548 1 23 0,04
4 2549 3390 1 24 0,04
5 3391 4232 1 25 0,04
Sumatoria 25 1

La Tabla 4 muestra en el apartado frecuencia absoluta el número de


observaciones que corresponden a cada clase, vemos que en el ejemplo la mayor
parte de observaciones pertenece a la primera clase, por lo tanto la mayor parte
de provincias tendrían un número reducido de instituciones educativas.

30 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Paso 5: Marca de clase

La marca de clase es el punto medio de la clase o promedio aritmético de la clase.


Se calcula sumando el límite inferior más el límite superior, y dividirlo luego para 2.
La marca de clase es muy importante cuando se calculan medidas de tendencia
central en datos agrupados, como se verá más adelante en la Unidad 3.

Tabla 5. Marca de clase del número de instituciones educativas en el Ecuador

N° de clase Límite inferior Límite superior Marca de clase x


1 22 864 443
2 865 1706 1285,5
3 1707 2548 2127,5
4 2549 3390 2969,5
5 3391 4232 3811,5
Fuente: Ministerio de Educación (2015)

En la Tabla 5, se incluye la marca de clase, misma que es el punto medio de la


clase o el promedio aritmético.

Lectura recomendada: Con la finalidad que tenga un ejemplo


adicional de organización de datos cuantitativos, revise el Capítulo 2:
Descripción de datos: tablas de frecuencia del texto básico de Lind et al
(2015), donde se indican ejemplos sobre organización de datos paso a
paso.

2.3. Representación gráfica de variables cuantitativas

a. Histogramas de frecuencias

Las variables cuantitativas se representan mediante histogramas. En el


histograma de frecuencia se representa la marca de clase en el eje de las
abscisas y la frecuencia absoluta en el eje de las ordenadas. Como se puede
observar, en el gráfico no existe separación entre clases, esto se realiza con

31 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

la finalidad de representar variables de tipo continuo, esto lo diferencia de las


variables de tipo cualitativo, que se representaban en barras.

Figura 5. Histograma de frecuencias de instituciones educativas en Ecuador


Fuente: Ministerio de Educación (2016)

La Figura 5 muestra el histograma del número de instituciones educativas, como


se aprecia en la gráfica la mayor cantidad de unidades corresponden a las clases
inferiores. Esto implica que la distribución de datos tiene asimetría positiva, ya
que la cola se extiende a la derecha, este tema se abordará en detalle en la
Unidad 4 de la guía didáctica, cuando estudiemos las medidas de forma de las
distribuciones de datos.

b. Polígono de frecuencias

El polígono de frecuencia es aquel que se forma a partir de la unión de los


distintos puntos medios de las cimas de las columnas que configuran lo que es un
histograma de frecuencia. Este se caracteriza porque utiliza siempre columnas de
tipo vertical y porque nunca debe haber espacios entre lo que son unas y otras.
Se conoce como polígonos de frecuencia para datos agrupados a aquellos que se
desarrollan mediante la marca de clase que tiene coincidencia con el punto medio
de las distintas columnas del histograma. En el momento de la representación
de todas las frecuencias que forman parte de una tabla de datos agrupados, se

32 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

genera el histograma de frecuencias acumuladas que posibilita la diagramación


del polígono correspondiente.

Figura 6. Polígono de frecuencias de instituciones educativas en Ecuador


Fuente: Ministerio de Educación (2016)

Para conocer otros métodos de presentación de variables cualitativas y


cuantitativas revise el Capítulo 2: Descripción de datos del texto básico de Lind et
al. (2015) y el Capítulo 2: Estadística descriptiva de la literatura complementaria
de Anderson et al. (2016). En estas fuentes encontrará otras alternativas
para representar sus datos en forma gráfica. Una vez que hemos repasado la
organización de datos en tablas de frecuencias y gráficos, vamos a evaluar el
avance de su aprendizaje.

33 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Actividad recomendada

Revise los videos cuyo enlace se incluye a continuación, para que conozca cómo
elaborar tablas con datos cualitativos y a representarlos en forma gráfica.

VIDEO: Tuto Mate (2016) Elaboración de una tabla de frecuencias (variable


discreta) (video). España. Recuperado de enlace web.

VIDEO: Tuto Mate (2016) Elaboración de una tabla de frecuencias (variable


continua) (video). España. Recuperado de enlace web.

Al observar estos videos, usted tendrá una idea más clara de la organización de
datos cuantitativos. Así, podrá aplicar los conocimientos para levantar información
cualitativa relacionada al campo turístico. Un ejemplo de variable discreta es el
número de miembros de las familias y un ejemplo de variable cuantitativa es el
valor que gastan los visitantes durante el Festival de las Artes Vivas.

34 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Autoevaluación 2

Una vez revisados los conceptos, vamos a realizar la autoevaluación para


comprobar su aprendizaje. Recuerde que la autoevaluación no es obligatoria, sin
embargo, le apoya para la resolución de la evaluación a distancia y lo prepara
para la evaluación presencial.

Estoy segura que resolverán estas preguntas en forma correcta ¡Vamos por ellas!

Considerando el siguiente enunciado, seleccione la alternativa correcta.

1. El número de intervalos i está determinado por algunos factores tales


como:

a. El número de frecuencias.
b. El grado de variabilidad de los datos.
c. El valor inferior de los datos.

2. La amplitud de los intervalos de una distribución organizada en una


tabla de distribución de frecuencias debe ser:

a. Variable.
b. Dependiendo del número de datos.
c. Constante.

35 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

3. La suma de las frecuencias absolutas es:

a. Igual a uno.
b. Igual a n.
c. Un valor entre cero y uno.

4. Escoja el enunciado correcto sobre las propiedades de las frecuencias


relativas,

a. Las frecuencias relativas son siempre valores fraccionarios.


b. La suma de las frecuencias relativas es igual a 0.
c. El último valor de las frecuencias relativas acumuladas es igual a n.

5. Los diagramas de frecuencia se utilizan para representar:

a. Frecuencias absolutas y relativas.


b. Frecuencias acumuladas y absolutas.
c. Frecuencias absolutas, relativas y acumuladas.

6. Los histogramas son diagramas de frecuencias unidimensionales,


utilizados para representar variables:

a. Aleatorias con amplitud constante.


b. Continuas con amplitud constante.
c. Continuas con amplitud variable.

7. La representación gráfica de las frecuencias absolutas y relativas


acumuladas de una variable se realiza usando:

a. Ojiva ascendente.
b. Histograma.
c. Gráfico de pastel.

36 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

8. Los gráficos circulares o de pastel son utilizados para representar:

a. Datos constantes.
b. Datos cualitativos.
c. Variables continuas.

9. Los gráficos de líneas son recomendables cuando se quiere


representar:

a. Correlación entre dos variables.


b. Series de tiempo o cronológicas.
c. Datos logarítmicos.

10. ¿Cuándo consideraría usted que una gráfica es confiable?

a. Si presenta escalas reales.


b. Si presenta información sesgada.
c. Si usa valores atípicos.

No olvide que para evaluar su desempeño en el desarrollo de esta autoevaluación


puede revisar el solucionario al final de la guía didáctica, en donde se indican las
respuestas correctas de los ítems.

37 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL

Estimados estudiantes, en esta unidad se presentan medidas numéricas


para describir datos cuantitativos. Primeramente, tenemos las medidas de
tendencia central que indican un valor típico de los datos. Vamos a conocer
los procedimientos para calcular las medidas más comunes tanto en datos no
agrupados, como en datos agrupados en tablas de distribución de frecuencias.

Vamos a calcular datos de la población total y datos de la muestra considerando:

▪▪ Parámetro: característica de una población. ( µ )


▪▪ Estadístico: característica de una muestra. ()

Como aplicación vamos a considerar los siguientes cantones con sus respectivos
datos de analfabetismo.

Tabla 6. Porcentaje de analfabetismo en cantones de la Región Amazónica-


Ecuador
x
N
(%)
1 4,18
2 5,5
3 5,75
4 6,04
5 6,16
6 6,3
7 7,06
8 7,19
9 7,54
10 7,85
11 9,69
12 11,11
13 11,69
14 12,54
15 17,63
Fuente: Ministerio de Educación (2018)

38 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

La Tabla 6 nos presenta datos del porcentaje de analfabetismo en la región


amazónica del Ecuador de quince cantones.

3.1. Medidas de tendencia central en datos no agrupados

a. Media Poblacional

También conocida como promedio, la media es la suma de los valores de los


elementos, dividida por la cantidad de estos, N. La fórmula para el cálculo de la
media poblacional es la siguiente:

Donde:

µ: media poblacional (letra minúscula griega mu)


N: número de valores en la población
x: cualquier valor de la variable aleatoria
∑: sumatoria (Letra griega Zigma)
∑x: suma de x valores en la población

Si calculamos la media poblacional del ejercicio práctico planteado con los datos
de la Tabla 6 será de la siguiente manera:

N = 15
∑x = 126,23

El valor de la media poblacional del porcentaje de analfabetismo en cantones de


la región amazónica es 8,42. Lo que implica que 8,42 por ciento de la población
amazónica es analfabeta.

39 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

b. Media de la muestra

En forma similar, la media de la muestra se calcula mediante la aplicación de la


siguiente fórmula:

Donde:

: media de la muestra
n: número de valores de la muestra
x: representa cualquier valor particular
∑: Indica Sumatoria (Letra mayúscula Sigma)
∑x: Suma de x valores de la muestra

A partir de la Tabla 7 seleccionamos una muestra.

Tabla 7. Muestra de cantones con el porcentaje de analfabetismo que posee su


población

x
N Muestra
(%)
1 El Chaco 7,19
2 Olmedo 7,54
3 Palora 7,85
4 Jaramijo 9,69
5 Cayambe 11,11
Total (∑x) 43,38
Fuente: Ministerio de Educación (2018)

40 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Dónde:

n=5
∑x = 43,38

Vemos que el promedio que hemos obtenido de la muestra 8,68 es similar al


que obtuvimos de la población en la sección anterior. La diferencia está dada
en función de que el número de observaciones en la muestra es menor que en
la población y esto puede generar un sesgo cuando la muestra no es tomada
en forma aleatoria. Más adelante cuando estudiemos muestreo analizaremos el
tamaño mínimo de la muestra para representar adecuadamente a la población.

c. Mediana

La mediana Me es el punto medio de los valores una vez que se hayan ordenado
de menor a mayor. Se calcula mediante la siguiente fórmula:

Si tomamos como referencia los datos de la Tabla 6 la posición de la mediana se


calcula de la siguiente manera:
N = 15

Como el resultado es un número decimal, este valor se redondea al inmediato


superior, es decir, a 8. Por tanto, la mediana de la distribución de datos ocupará
la octava posición. Siendo la mediana de esta distribución de datos el valor
correspondiente a 7,19 (ver Tabla 6).

41 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

En cambio, si al aplicar la fórmula obtenemos como resultado un número entero,


la mediana se calcula como el promedio aritmético entre los valores que ocupan la
posición calculada i y el inmediato superior i+1. En el siguiente ejemplo se explica
con mayor detalle.

Tenemos 16 observaciones, aplicando la siguiente fórmula se tiene que:

El valor de la media será el promedio de los valores ubicados en la octava y


novena posición.

Nota: La fórmula empleada para conocer la mediana nos permite


determinar la posición del valor que representa la mediana, siempre
tenemos que buscar el valor de la mediana en la distribución de datos,
la misma que debe estar ordenada de menor a mayor.

d. Moda

La moda Mo es el valor que se presenta con mayor frecuencia en un conjunto de


datos. Algunas distribuciones de frecuencias pueden tener más de una moda, en
este caso se conocen como bimodales y en otros casos no existe moda. En el
ejemplo de la Tabla 6, podemos apreciar que se trata del último caso, ya que no
existe un valor que represente a la moda.

Actividad recomendada

Revise el video cuyo enlace se incluye a continuación, para que conozca en forma
explicativa cómo calcular medidas de tendencia central.

42 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

VIDEO: Academia Internet (2015) Como calcular la Media, Moda y Mediana,


medidas de tendencia central (video). Recuperado de enlace web.

Al observar este video, usted tendrá una idea más clara con ejemplos adicionales
de cómo llevar a cabo este importante procedimiento en el análisis de datos.

3.2. Medidas de tendencia central para datos agrupados

Para trabajar con datos agrupados vamos a hacer uso de los pasos para la
elaboración de una distribución de frecuencias. Para ejemplificar el proceso
vamos a usar los datos de la Tabla 6, calculamos con estos datos el número de
clase, el intervalo de clase, las frecuencias absolutas y acumuladas y la marca de
clase. Y obtenemos lo siguiente:

Tabla 8. Distribución de frecuencias y marca de clase

Frecuencia Frecuencia Marca de clase


Clase
(f) Acumulada (F) (M)

4,18 - 7,54 9 9 5,86


7,54 - 10,9 2 11 9,22
10,9 - 14,26 3 14 12,58
14,26 - 17,63 1 15 15,95
TOTAL 15

a. Media

Para calcular la media en una distribución de datos organizada en una tabla de


frecuencias, se debe hacer uso de la siguiente fórmula.

43 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Donde:

: símbolo de media
n: es el número total de frecuencias (observaciones)
M: es el punto medio de cada clase
fM: frecuencia absoluta de cada clase multiplicada por el punto medio de la
clase.
∑fM: suma de estos productos
Así calculamos:

Tabla 9. Distribución de frecuencias y marca de clase

Frecuencia Marca de
Clase Frecuencia (f) Acumulada clase f*M
(F) (M)
4,18 - 7,54 9 9 5,86 52,74
7,54 - 10,9 2 11 9,22 18,44
10,9 - 14,26 3 14 12,58 37,74
14,26 - 17,63 1 15 15,95 15,95
Total 15 124,87

La media calculada a partir de datos agrupados resultó ser 8,32 % de


analfabetismo en la región amazónica, este valor es similar al que se tuvo
al calcular la media para datos no agrupados. Con esto comprobamos que
se puede usar cualquiera de las dos metodologías para hacer los cálculos
correspondientes.

Recuerde que la frecuencia acumulada se obtiene sumando la frecuencia


absoluta de la clase y la frecuencia absoluta de la clase siguiente. Así la
frecuencia acumulada de la primera clase es 9, mientras que la frecuencia
absoluta de la segunda clase es 11 (9+2).

44 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

b. Mediana

En el caso de datos agrupados para calcular la mediana es necesario determinar


la clase mediana mediante la siguiente condición:

Clase mediana → Frecuencia acumulada ≥ n/2

En el siguiente ejemplo n es 15, por tanto, 15/2= 7,5. Para cumplir con la
condición se requiere un número > a 7,5. Siendo la frecuencia acumulada en
la primera fila 9, y dado que es mayor a 7,5 se determina que esta es la clase
mediana.

Tabla 10. Distribución de frecuencias y marca de clase

Frecuencia Marca de
Clase Frecuencia (f)
Acumulada (F) clase (M)
4,18 - 7,54 9 9 5,86
7,54 - 10,9 2 11 9,22
10,9 - 14,26 3 14 12,58
14,26 - 17,63 1 15 15,95
TOTAL 15

La fórmula para el cálculo de la mediana en datos agrupados es:

Dónde:

L i - j me: límite inferior de la clase mediana


F: frecuencia acumulada de la clase que antecede a la clase mediana
fme: frecuencia de la clase de la mediana
i: intervalo de clase mediana

45 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Al aplicar la fórmula al ejercicio, obtenemos lo siguiente:

De esta forma el valor de la media es 6,98 por ciento.

c. Moda

Para calcular la moda, es necesario determinar la clase modal de la tabla 8c


mediante la siguiente condición:

Clase modal → Mayor número de frecuencias.

Tabla 11. Distribución de frecuencias y marca de clase

Frecuencia Marca de
Frecuencia
Clase Acumulada clase
(f)
(F) (M)
4,18 - 7,54 9 9 5,86
7,54 - 10,9 2 11 9,22
10,9 - 14,26 3 14 12,58
14,26 - 17,63 1 15 15,95
TOTAL 15

La fórmula para calcular la moda en datos agrupados es la siguiente:

L i - j mo: límite inferior de la clase modal


Da: diferencia entre la frecuencia de la clase modal y la anterior
Db: diferencia entre la frecuencia de la clase modal y la siguiente
i: intervalo de clase

46 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Al aplicar la fórmula, obtenemos lo siguiente:

El valor de la moda para el ejercicio propuesto es 8,5 por ciento, que resultaría ser
el valor más común.

Luego de haber aplicado las fórmulas recomendadas para el cálculo de la media,


mediana y moda para datos agrupados podemos darnos cuenta que es muy útil
cuando estamos trabajando con una gran cantidad de datos. El uso de tablas de
frecuencias facilita el cálculo de medidas de tendencia central.

Actividad recomendada

Revise el video cuyo enlace se incluye a continuación, para que conozca en forma
explicativa cómo calcular medidas de tendencia central en datos agrupados.

VIDEO: Academia Internet (2015) Como calcular la Media, Moda y Mediana,


medidas de tendencia central (video). Recuperado de enlace web.

Al observar este video, usted tendrá una idea más clara, con ejemplos adicionales
de cómo llevar a cabo el cálculo de la media, mediana y moda en datos
organizados en tablas de frecuencia. Recuerde revisar la literatura básica de Lind
et al. (2015) y complementaria de Anderson et al. (2016) si requieren una mayor
explicación sobre el capítulo de medidas de tendencia central.

47 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Autoevaluación 3

Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje. Recuerde que la autoevaluación no es obligatoria, sin
embargo, le apoya para la resolución de la evaluación a distancia y lo prepara
para la evaluación presencial.

¡Ahora vamos a evaluar sus aprendizajes!

Seleccione la opción correcta, a partir de los siguientes enunciados:

1. Las medidas que nos permiten determinar la posición de un valor con


respecto al total de las observaciones se denomina medidas de:

a. Dispersión.
b. Tendencia central.
c. Forma.

2. La media aritmética es la medida de posición más utilizada debido a


que,

a. Es extraordinariamente estable en el muestreo.


b. No es sensible a los cambios en las observaciones.
c. Es el valor más común en la distribución de datos.

48 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

3. ¿Cuál es la media aritmética del siguiente conjunto de datos 16, 17, 18,
19, 20?

a. 16.
b. 18.
c. 21.

4. ¿Cuál el peso promedio del siguiente grupo de individuos: Carlos 76


kg, Rosario 62 kg, Esteban 72 kg, Mónica 44 kg?

a. 72,1 kg.
b. 63,5 kg.
c. 68,0 kg.

5. Considerando la siguiente información, determinar el promedio


ponderado del número de hijos por familia. Número de hijos
(frecuencia): 5(3), 4(4), 6(2), 3(7).

a. 3.
b. 4.
c. 5.

6. ¿Cuáles son las desviaciones con respecto al promedio, de los


siguientes ingresos mensuales: 480, 460, 340, 340, 800?

a. -10; -5; 6, 40; 200.


b. -58; -32; 0; 56; 180.
c. -4; -24; -144; -144; 316.

49 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

7. Indique, ¿cuál de las siguientes opciones es una característica de la


media?

a. La suma de las desviaciones respecto a la media, siempre serán


iguales a cero.
b. La media aritmética de una variable por una constante, es igual a la
constante.
c. La media aritmética de una constante es cero.

8. ¿Cuáles son las desventajas del uso de la mediana?

a. No es necesario ordenar los datos para calcularla.


b. Cuando se trabajan con diferentes grupos no se puede obtener una
mediana para el conjunto.
c. Corresponde al valor más frecuente de la distribución.

9. El número de niños atendidos en los principales hospitales de un


territorio es 50, 100, 74, 61, 112, 100 y 85. La mediana de esta variables
es,

a. 85.
b. 100.
c. 61.

10. Cuando una distribución de datos n es par, la mediana corresponde a:

a. El valor ubicado en el centro de la distribución.


b. El promedio de los dos valores ubicados en el centro de la distribución.
c. El valor máximo de la distribución.

Al final de la guía didáctica se encuentra el solucionario con las respuestas


correctas y su respectiva retroalimentación (si tiene un 80% o más de respuestas
correctas concluya el estudio de esta unidad, caso contrario revise nuevamente
los contenidos).

50 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

UNIDAD 4. MEDIDAS DE DISPERSIÓN, DE POSICIÓN Y DE FORMA

4.1. Medidas de dispersión

Estimados estudiantes, en esta sección vamos a conocer las medidas de


dispersión de una distribución de datos, como calcularlas e interpretarlas. Para
que se facilite la comprensión del mismo les recomiendo la revisión de la literatura
básica de Lind et al. (2015) en el Capítulo 3, Descripción de datos: medidas
numéricas y la complementaria de Anderson et al. (2016) Capítulo 3, Estadística
descriptiva: medidas numéricas.

a. Rango

Es la medida más simple de dispersión, representa la diferencia entre los valores


máximo y mínimo de un conjunto de datos.

La fórmula para calcular el rango es:

Rango = Valor Máximo – Valor mínimo

Vamos a tomar como referencia la Tabla 6 de la Unidad 3 para calcular el rango:

Valor máximo: 17,63


Valor mínimo: 4,18

Rango = 17,63 – 4,18 = 13,45

El valor del rango para los datos de analfabetismo en la amazonia es de 13,45.

b. Varianza

La varianza es una medida de dispersión definida como la esperanza del


cuadrado de la desviación de dicha variable respecto a su media. O en pocas

51 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

palabras, es la media de los residuos al cuadrado. Su unidad de medida


corresponde al cuadrado de la unidad de medida de la variable: por ejemplo, si
la variable mide una distancia en metros, la varianza se expresa en metros al
cuadrado.

Fórmula:

Donde:

σ² : es la varianza de la población (letra minúscula sigma)


X : valor de una observación de la población
µ: media aritmética de la población
N: número de observaciones de la población

Si calculamos la varianza tomando como referencia los 15 datos poblacionales de


la Tabla 2 de la Unidad 1 se obtiene:

µ = 8,42
N = 15

A continuación se explica el procedimiento para calcular la varianza usando el


ejemplo de la Tabla 6. Recuerde que primero debe sustraer a cada observación
el valor de la media. A este resultado debe elevarlo al cuadrado y realizar una
sumatoria al final.

La tercera columna de la Tabla 9 presenta la diferencia entre el valor de la variable


x y el promedio que se calculó en la Unidad 3 en la sección 3.1 Medidas de
ubicación en datos no agrupados, este valor es conocido como desviación de
la media. La cuarta columna muestra el valor de la desviación media elevado al
cuadrado.

52 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Tabla 12. Cálculo de la varianza de la tasa de analfabetismo cantonal

N X (x - µ) (x -µ )²
1 4,18 -4,24 17,98
2 5,5 -2,92 8,53
3 5,75 -2,67 7,13
4 6,04 -2,38 5,66
5 6,16 -2,26 5,11
6 6,3 -2,12 4,49
7 7,06 -1,36 1,85
8 7,19 -1,23 1,51
9 7,54 -0,88 0,77
10 7,85 -0,57 0,32
11 9,69 1,27 1,61
12 11,11 2,69 7,24
13 11,69 3,27 10,69
14 12,54 4,12 16,97
15 17,63 9,21 84,82
∑ (X) 126,23 ∑ (X -µ)2 174,70

Con la sumatoria de los cuadrados de las desviaciones medias procedemos a


aplicar la fórmula para calcular la varianza y obtenemos:

La varianza que hemos calculado es de 11,65. Este valor nos indica el grado de
variabilidad de los datos.

c. Desviación estándar de la población

La desviación estándar es la raíz cuadrada de la varianza de la población, misma


que se calculó en la sección anterior. La fórmula de la desviación estándar es la
siguiente:

53 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Aplicando la fórmula para el ejercicio anterior tenemos que la desviación estándar


es 3,41.

La desviación estándar permite conocer la dispersión de un conjunto de datos con


respecto a su media.

Actividad recomendada

Revise el video cuyo enlace se incluye a continuación, para que conozca en forma
explicativa cómo calcular medidas de dispersión.

VIDEO: EBC Academia (2017) Medidas de dispersión (video). Recuperado de


enlace web.

El video explica paso a paso el procedimiento para calcular medidas de


dispersión. Los ejemplos que se desarrollan son ilustrativos para que usted
aplique el proceso en ejercicios similares que podrá encontrar en el Capítulo 3:
Descripción de datos del texto básico de Lind et al. (2015).

54 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

4.2. Medidas de dispersión en datos agrupados

Como habíamos visto en la Unidad 3, es posible realizar cálculos con datos que
han sido resumidos en tablas de distribución de frecuencias. Lo mismo ocurre con
las medidas de dispersión, como la varianza y la desviación estándar, por lo que
se explica en esta sección cómo calcularlas.

a. Varianza

La fórmula para calcular la varianza en datos agrupados es la siguiente:

S²: varianza muestral


M: punto medio de la clase
µ: media poblacional
N: número de observaciones

Tomando como ejemplo los datos agrupados de la Tabla 8, agregamos al final


una columna en la cual se multiplica los residuos al cuadrado por la frecuencia
de clase. Recuerde que es muy importante contar con la frecuencia absoluta y
la marca de clase para empezar con los cálculos. También debemos calcular la
media en datos agrupados como se indicó en la Unidad 3. En la Tabla 8d, en
la quinta columna se presenta la diferencia entre la marca de cada clase y el
promedio (desviación media), luego en la columna seis se muestra el resultado de
elevar el valor de la desviación media al cuadrado y multiplicarlo por su frecuencia
absoluta (f).

55 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Tabla 13. Distribución de frecuencias y marca de clase

Frecuencia
Frecuencia Marca
Clase Acumulada
Absoluta (f) clase (M)
(F)
4,18 - 7,54 9 9 5,86 6,05 54,46
7,54 - 10,9 2 11 9,22 0,81 1,62
10,9 - 14,26 3 14 12,58 18,15 54,44
14,26 - 17,63 1 15 15,95 58,22 58,22

TOTAL 15 168,74

Una vez realizada la sumatoria de los valores obtenidos en la última columna,


procedemos a dividir este valor para el número total de observaciones, como se
muestra en la fórmula a continuación:

La varianza resultó ser 11,24. Este valor es similar al que se obtuvo cuando se
calculó la varianza sin agrupar los datos, por lo cual podemos ver que ambos
procedimientos son adecuados y pueden ser usados en forma indistinta.

b. Desviación Estándar

Se calcula la raíz cuadrada de la varianza y determinamos la desviación estándar.

56 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

La desviación estándar se expresa como + 3,35 que se considera el rango de


fluctuación de los datos. Cuando la desviación estándar resulta alta podemos
concluir que existe gran variabilidad.

4.3. Medidas de ubicación

Las medidas de localización dividen la distribución en partes iguales, sirven


para clasificar a un individuo o elemento dentro de una determinada población o
muestra. Las más conocidas son los percentiles, deciles y cuartiles

a. Cuartiles

Dividen a un conjunto de observaciones en cuatro partes iguales. Un primer paso


consiste en ordenar los datos de menor a mayor. Luego procedemos a ubicar las
posiciones que representan a los cuartiles 1, 2 y 3. Vamos a usar como referencia
los datos contenidos en la Tabla 2 de la Unidad 2.

n: número de observaciones

Cuartil 1

Cuartil 2

Cuartil 3

57 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

*OBSERVACIÓN: Los resultados obtenidos corresponden a las POSICIONES de


los números que representan los cuartiles (ver Tabla 2). La posición 4 indica la
posición del primer cuartil que corresponde a 6,04.

El proceso para encontrar el valor que corresponde al cuartil de interés es similar


al cálculo de la mediana, como habíamos visto en la Unidad 3. Cuando el cálculo
de la posición del cuartil arroja un número decimal, se recomienda redondear el
valor al inmediato superior.

Vamos a realizar el ejercicio de Q1, siendo el valor 3,75 procedemos a redondear


a 4 y buscamos el valor que ocupa la cuarta posición en la tabla, obteniendo el
valor de 6,04. Cuando son números enteros para encontrar el valor del cuartil se
debe obtener el promedio entre los valores que ocupan la posición i y i+1.

Actividad recomendada

Calcule los cuartiles Q2 y Q3 del ejemplo anterior, siga la misma instrucción


empleada en la resolución del ejemplo. Al realizar este ejercicio, usted estará en
capacidad de calcular medidas de posición de una distribución de datos.

b. Percentiles

Aunque los cuartiles son generalmente los elementos más usados para ubicar
la posición de un valor de un conjunto de datos, en ocasiones los investigadores
requieren conocer otras posiciones. Para este propósito se puede usar la fórmula
general de los percentiles, los mismos que dividen un conjunto de observaciones
en 100 partes iguales.

La fórmula para calcular cualquier percentil es la siguiente:

58 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Donde

P: Es el percentil que buscamos y se reemplaza en la fórmula.


n: número de observaciones

Por ejemplo si queremos conocer qué valor ocupa el percentil 80, procedemos a
aplicar la fórmula tomando como ejemplo los datos de la Tabla 6.

Ubicamos el valor que ocupa la posición 12 y 13 en el extracto de la Tabla 6,


procedemos a realizar el cálculo.

P80 =(11,69+11,11)/
P80 = 11,4

El percentil 80 que hemos calculado corresponde a 11,4.

4.4. Medidas de forma

Las medidas de forma son indicadores estadísticos que permiten identificar si una
distribución de frecuencia presenta uniformidad. Son necesarias para determinar
el comportamiento de los datos y así, poder adaptar herramientas para el análisis
probabilístico.

a. Sesgo

Muestra la falta de simetría en un grupo de observaciones, se refiere a la forma


de un conjunto de datos y se distinguen tres formas:

▪▪ Simétrica: la media y la mediana son iguales, y los valores de datos se


dispersan uniformemente en torno a estos valores.

59 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

▪▪ Sesgo positivo o sesgo a la derecha: son mucho más comunes; existe un


solo pico y los valores se extienden mucho a la derecha que a la izquierda
de este. En este caso la media es más grande que la mediana.

▪▪ Sesgo negativo: existe un solo pico y las observaciones se extienden más a


la izquierda, en dirección negativa. La media es menor que la mediana.

Figura 7. Formas de las distribuciones de frecuencias de datos.


Tomada de: Lind et al. (2012)

b. Regla empírica

En cualquier distribución de frecuencias simétrica con forma de campana,


aproximadamente 68% de las observaciones se encontrarán entre más y menos
una desviación estándar de la media; cerca de 95% de las observaciones se
encontrarán entre más y menos dos desviaciones estándares de la media y, de
hecho todas (99.7%), estarán entre más y menos tres desviaciones estándares de
la media.

En la Figura 8 se demuestra el caso de una distribución con forma de campana


con una media de 100 y una desviación estándar de 10 demostrando la regla
empírica.

60 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Figura 8. Porcentaje de datos que se encuentran a n desviaciones estándar de


la media.
Tomado de: Lind et al. (2012)

Actividad recomendada

Revise el video cuyo enlace se incluye a continuación sobre medidas de forma.

VIDEO: Montero Espinoza (2018) Coeficiente de simetría (video). Recuperado de


enlace web.

El video muestra como calcular el coeficiente de simetría y la forma de


interpretarlo. Además, se observa cómo se ven los datos en forma gráfica, como
campana de Gauss si es simétrica o con asimetría izquierda o derecha.

Si desea ampliar la información sobre el cálculo de medidas de posición en datos


agrupados y no agrupados puede revisar el texto básico de Lind et al. (2015)
Capítulo 4: Descripción de datos: presentación y análisis de datos.

61 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

Autoevaluación 4

Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje. Recuerde que la autoevaluación no es obligatoria, sin
embargo, le apoya para la resolución de la evaluación a distancia y lo prepara
para la evaluación presencial.

¡Ahora vamos a evaluar sus aprendizajes!

Seleccione la opción correcta, a partir de los siguientes enunciados:

1. Supongamos que tres distribuciones tienen igual media pero diferentes


grados de dispersión, seleccione la distribución que presenta la menor
dispersión.

a. Media= 50 valor máximo= 100 valor mínimo=15


b. Media= 50 valor máximo= 80 valor mínimo=30
c. Media= 50 valor máximo= 80 valor mínimo=40

2. La media aritmética de los cuadrados de las diferencias entre los


valores que toma la variable y su media aritmética es conocida como:

a. Desviación típica.
b. La media geométrica.
c. Varianza.

62 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

3. La varianza tiene varias propiedades, una de las cuales es que:

a. Es siempre un valor negativo.


b. En el caso de las constantes es igual a cero.
c. Es distributiva.

4. ¿Cuál de las siguientes expresiones no corresponde a las propiedades


de la varianza?

a. Debe ser siempre un valor positivo


b. En el caso de las constantes es igual a cero
c. Se representa en la misma unidad que la variable

5. La razón principal para usar la desviación típica en lugar de la varianza


es que:

a. Utiliza la misma unidad de medida que la variable x


b. Es una medida de tendencia central
c. Define la forma de la distribución

6. Cuando se calcula la varianza de una distribución cuyos datos han sido


agrupados se usan valores ponderados, esto significa que los valores
se multiplican,

a. Por las frecuencias absolutas


b. Por el número total de observaciones
c. Por el rango

7. En una distribución cuya media es 45 kg y la desviación típica es ±3 kg,


la varianza sería:

a. 10.5 kg
b. 9 kg2
c. 9 kg

63 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Primer bimestre

8. El coeficiente de variación de una distribución cuya media es 10 y la


desviación típica 2, es:

a. 0,02
b. 5,00
c. 0,20

9. En una distribución de datos, aquel valor que supera al 25% de las


observaciones y a la vez es superado por el 75% se denomina:

a. Primer decil.
b. Primer cuartil.
c. Percentil.

10. En una distribución de datos, aquel valor que supera al 70% de las
observaciones y a la vez es superado por el 30% se denomina:

a. Mediana
b. Séptimo decil
c. Primer cuartil

Al final de esta guía didáctica se encuentra el solucionario con las respuestas


correctas y su respectiva retroalimentación (si tiene un 80% o más de respuestas
correctas concluya el estudio de esta unidad, caso contrario revise nuevamente
los contenidos).

64 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

SEGUNDO BIMESTRE

UNIDAD 5. DISTRIBUCIONES DE PROBABILIDADES

“La clave está en ver a cada uno de los muros que


te encuentras en el camino como escalones que
se dirigen hacia tu objetivo”

Anónimo

Estimados estudiantes, en este bimestre vamos a abordar los contenidos


referentes a estadística inferencial. Los temas a tratar presentan mayor
complejidad que los que abordamos en el primer bimestre. Sin embargo, estoy
convencida que con su trabajo organizado y la colaboración que tendremos
durante el bimestre, vamos a tener éxito en el proceso enseñanza-aprendizaje.
¡Vamos a iniciar positivamente estas unidades!

5.1. Conceptos generales

En esta sección abordaremos los conceptos más importantes que deben manejar
en el campo de las distribuciones de probabilidad.

Probabilidad: valor entre cero y uno que describe la posibilidad relativa que
ocurra un evento. La fórmula clásica para calcular la probabilidad de un evento es
la siguiente:

Vamos a ver un ejemplo ¿Cuál es la probabilidad de que al lanzar un dado salga


el número 2?

65 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Los resultados posibles del lanzamiento de un dado son 1, 2, 3, 4, 5, y 6. El caso


favorable es tan sólo uno (que salga el dos), mientras que los casos posibles (n)
son seis.

Entonces se tendría que:


Probabilidad=1/6 = 0,16

La probabilidad de obtener un 2 en el lanzamiento de un dado es 0,16 o del 16%


si multiplicamos el valor obtenido por 100.

Distribución de probabilidad: Son todos los valores posibles que resultan de un


experimento aleatorio, junto con la probabilidad asignada a cada valor.

Es importante también conocer el concepto de variable aleatoria, que pueden ser


de tipo discreta y continua.

Variable aleatoria discreta: se considera así cuando los valores que asume se
pueden contar y pueden organizarse en una secuencia al igual que los números
enteros positivos; por tanto, solo podrá asumir un valor finito de valores. Ejemplo:
número de turistas que visitan la playa en temporada.

Variable aleatoria continua: se considera así cuando puede asumir cualquier


valor dentro de un intervalo. Se pueden considerar el resultado de mediciones de
longitud, tiempo ya que estas variables admiten fracciones. Ejemplo: valor que
gastan los turistas en alimentación (dólares)

Espacio muestral: son todos los posibles resultados que pueden producirse de
un experimento.

Por ejemplo, si lanzamos un dado por una ocasión los resultados posibles
serían:

E= {1, 2, 3, 4, 5, 6}

66 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Si lo lanzamos en dos ocasiones, o en pasos múltiples, los resultados posibles


serían:

5.2. Reglas de conteo

La regla de conteo para experimentos de varias etapas permite determinar el


número de resultados experimentales sin enlistarlos.

a. Experimentos de pasos múltiples

La regla de conteo para experimentos de pasos múltiples permite determinar el


número de resultados experimentales sin tener que enumerarlos.

Para conocer el número de elementos que componen un espacio muestral cuando


se cuenta con experimentos con pasos múltiples k, se recomienda considerar el
número de resultados posibles en el primer paso n1, resultados posibles en el
segundo paso n2 y así en lo sucesivo, entonces el número total de resultados
experimentales serán (n1)x (n2) . . .x (nk).

En el caso del lanzamiento del dado en el primer lanzamiento se tienen 6


resultados posibles, y en el segundo lanzamiento también se tienen 6 resultados
posibles, para determinar el número de elementos que integran el espacio
muestral se recomienda multiplicar los resultados posibles de n1 por el número
de resultados posibles de n2. Así tendríamos 6x6= 36, lo que implica que 36
elementos conformarían el espacio muestral.

67 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Si consideramos el experimento del lanzamiento de un dado y una moneda


tenemos que en el primer caso se tienen 6 resultados posibles, mientras que en
el segundo 2, por lo tanto, el espacio muestral será 6x2=12. Para visualizar la
conformación del esapcio muestral en forma gráfica, vamos a revisar el Capítulo 5
Estudio de los conceptos de la probabilidad del texto básico de Lind et al. (2015).

b. Combinaciones

La regla de conteo para combinaciones permite contar el número de resultados


experimentales cuando el experimento consiste en seleccionar n objetos de un
conjunto (usualmente mayor) de N objetos. La fórmula para calcular el número de
combinaciones posibles en un experimento es:

Donde:

C: número de combinaciones
N: número total de elementos del espacio muestral
n: número de elementos seleccionados

El siguiente ejemplo ha sido tomado de la sección ejercicios del texto básico de


Lind et al. (2015). Vamos a desarrollarlo:

Una representante de la Agencia de Protección Ambiental piensa seleccionar


muestras de 10 terrenos para un estudio. El director tiene 15 terrenos, de los
cuales la representante puede recoger las muestras. ¿Cuántas diferentes
muestras son posibles?

Recuerde que la expresión factorial se resuelve de la siguiente manera,


10!= 10x 9x 8x 7x 6x 5x 4x 3x 2x 1
0!= 1

68 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

c. Permutaciones

Esta regla permite calcular el número de resultados experimentales cuando se


seleccionan n objetos de un conjunto de N objetos y el orden de selección es
relevante. Los mismos objetos n seleccionados en orden diferente se consideran
un resultado experimental diferente. La fórmula para calcular el número de
permutaciones posibles en un experimento es:

Considerando el ejemplo anterior, sobre la agencia de protección ambiental, si el


inspector calcula el número de permutaciones posibles, se tendría

Como se aprecia en el ejemplo, el número de permutaciones es mucho mayor que


el de combinaciones. Esto se debe a que los elementos seleccionados se cuentan
como un resultado nuevo si el orden en el que son seleccionados cambia.

Actividad recomendada

Para apoyar su comprensión he seleccionado algunos videos en donde se


muestra en forma didáctica las bases del estudio de las probabilidades:

VIDEO: Carreon D. (2016) Probabilidad (video). Recuperado de enlace web.

VIDEO: Tuto Mate (2016) Cálculo de probabilidades (video). Recuperado de


enlace web.

69 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

VIDEO: Macias A. (2017) La probabilidad y sus reglas (video). Recuperado de


enlace web.

Los videos anteriores le permitirán afianzar sus conocimientos sobre las bases del
estudio de probabilidades.

5.3. Distribución binomial: Variable aleatoria discreta

La distribución de probabilidad binomial es una distribución de probabilidad


que tiene muchas aplicaciones. Está relacionada con un experimento de pasos
múltiples al que se le llama experimento binomial. Un experimento binomial tiene
las cuatro propiedades siguientes.

1. El experimento consiste en una serie de n ensayos idénticos.

2. En cada ensayo hay dos resultados posibles. A uno de estos resultados se le


llama éxito y al otro se le llama fracaso.

3. La probabilidad de éxito, que se denota p, no cambia de un ensayo a otro.


Por ende, la probabilidad de fracaso, que se denota q (1 – p), tampoco
cambia de un ensayo a otro.

4. Los ensayos son independientes.

En un experimento binomial lo que interesa es el número de éxitos en n ensayos.


Si x denota el número de éxitos en n ensayos, es claro que x tomará los valores
0, 1, 2, 3, ... n. Dado que el número de estos valores es finito, x es una variable
aleatoria discreta. A la distribución de probabilidad correspondiente a esta variable
aleatoria se le llama distribución de probabilidad binomial.

70 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

La fórmula general de la probabilidad binomial es:

n: número de ensayos
x: número de éxitos
p: probabilidad de éxito de cada ensayo
q: probabilidad de fracaso de cada ensayo

: número de combinaciones posibles

Vamos a considerar el siguiente caso para ejemplificar como funciona un


experimento binomial. Los registros hospitalarios indican que 10% de los casos
de enfermedades vasculares resultan fatales, si 5 pacientes son tratados
actualmente por esta condición ¿cuál es la probabilidad que tres de los pacientes
no sanen?

Vamos a plantear el problema:

n= 5
x= 3
p = 0.10
q= 0.90

Lo primero que hacemos es resolver el número de combinaciones posibles para


luego remplazarlo en la fórmula general de la probabilidad binomial. Tenemos así
que,

71 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Por lo tanto tendríamos 10 posibles combinaciones. Luego se remplaza en la


fórmula general,

Como conclusión tendríamos que existe una probabilidad de 0,0081 (0,81%) de


que 3 de los cinco pacientes en tratamiento no sanen.

Valor esperado y varianza en la distribución binomial

En el caso especial de que la variable aleatoria tenga una distribución binomial


para la que se conoce el número de ensayos n y la probabilidad de éxito p, las
fórmulas generales para el valor esperado y la varianza son las siguientes:

Valor esperado de x E(x)

E(x)= np

Varianza de x (σ²)

σ²= np(q)

Siendo q la diferencia entre la probabilidad de ocurrencia del evento y 1.

q=1-p

72 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Tomado el ejemplo anterior tendríamos que:

E(x)=5*0,1=0,5

Var(x)=5*0,1*0,9=0,45

Esto significa que el valor esperado de la variable aleatoria x es 0,5 y su varianza


es 0,45.

Actividad recomendada

Revise los videos cuyo enlace se incluye a continuación, para que conozca más
sobre distribución de probabilidad binomial.

VIDEO: Montero Esponisa (2017) Distribución binomial (video). Recuperado de


enlace web.

VIDEO: Física y Mates (2015) Distribución Binomial (video). Recuperado de


enlace web.

VIDEO: Física y Mates (2015) Distribución Binomial: media y varianza (video).


Recuperado de enlace web.

Al observar estos videos, usted tendrá una idea más clara con ejemplos
adicionales de cómo llevar a cabo este importante procedimiento en el análisis de
datos.

73 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

5.4. Distribución de probabilidad normal: variables continuas

Una diferencia fundamental entre las variables aleatorias discretas y las variables
aleatorias continuas es cómo se calculan las probabilidades. En las variables
discretas se calcula la probabilidad de que la variable tome un valor determinado.
En cambio cuando se calculan probabilidades de variables aleatorias continuas,
se calcula la probabilidad de que la variable aleatoria tome alguno de los valores
dentro de un intervalo que se calcula como el área bajo la curva normal.

La distribución normal tiene gran cantidad de aplicaciones prácticas, en las cuales


la variable aleatoria puede ser el peso o la estatura de las personas, puntuaciones
de exámenes, resultados de mediciones científicas, precipitación pluvial u otras
cantidades similares.

La distribución normal es simétrica, por tanto su sesgo es cero. Las colas de la


curva normal se extienden al infinito en ambas direcciones y en teoría jamás tocan
el eje horizontal. La desviación estándar determina qué tan plana y ancha es la
curva normal. Desviaciones estándar grandes corresponden a curvas más planas
y más anchas, lo cual indica mayor variabilidad en los datos.

Figura 9. Características de una distribución normal.


Tomado de: Anderson et al. (2016)

La figura 9 presenta el área bajo la curva normal, como se observa en la gráfica


aproximadamente el 68% de los datos se ubican a 1 desviación estándar del
promedio, aproximadamente el 95% se ubican a dos desviaciones estándar del

74 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

promedio y aproximadamente el 99% de las observaciones a 3 desviaciones


estándar del promedio. Esto se conoce como teorema central del límite que
habíamos revisado al final de la Unidad 4 de esta guía didáctica.

Como ocurre con otras variables aleatorias continuas, los cálculos de la


probabilidad en cualquier distribución normal se realizan calculando el área bajo
la gráfica de la función de densidad de probabilidad. Por tanto, para hallar la
probabilidad de que una variable aleatoria normal esté dentro de un determinado
intervalo, se tiene que calcular el área que se encuentra bajo la curva normal y
sobre ese intervalo.

Para la distribución normal estándar ya se encuentran calculadas las áreas bajo


la curva normal y se cuenta con tablas que dan estas áreas y que se usan para
calcular las probabilidades. Estas tablas generalmente se encuentran al final de
los textos de estadística.

Es importante el cálculo del valor normal estándar z, y por esta razón se indica la
fórmula a continuación:

z=(x-μ)/σ

Donde,

z: valor normal estándar


x: Cualquier observación i
μ: Media de la distribución
σ: Desviación estándar de la distribución

Los tres casos más comunes para calcular probabilidades de distribuciones


normales son: (1) la probabilidad de que la variable aleatoria normal estándar z
sea menor o igual que un valor dado; (2) la probabilidad de que z esté entre dos
valores dados, y (3) la probabilidad de que z sea mayor o igual que un valor dado.
Para mostrar el uso de las tablas de probabilidad acumulada de la distribución

75 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

normal estándar en el cálculo de estos tres tipos de probabilidades, se consideran


algunos ejemplos tomados de Martínez (2012, p. 251).

Un profesor manifiesta que el promedio de estudiantes obtienen en una


asignatura 3,9 con una desviación estándar de 0,35. ¿Cuál es la probabilidad que
uno de sus alumnos obtenga?

a. Una calificación superior a 4,4


b. Inferior a 3,2

Desarrollamos el ejercicio, para ello planteamos el primer caso, calculamos el


valor z, y procedemos a hacer la interpretación de los resultados.

a. µ= 3,9
σ= 0,35
P (x> 4,4)
z=x-μ/σ

Procedemos a buscar el valor en la Tabla de Probabilidad Normal al final del


texto básico de Lind et al. (2015), y obtenemos que la probabilidad es de 0,4222.
Recuerde que en la primera columna se hace lectura del entero y el primer
decimal, este valor va desde el 0,0 al 3,9. Mientras que en la fila superior se hace
lectura del segundo decimal, este valor va desde el 0 al 9.

Siguiendo el caso planteado z= 1,42, en la primera columna debemos buscar


el valor de 1,4; mientras que en la primera fila buscamos el valor 2, que es la
centésima de nuestro resultado.

Así tenemos que el valor que corresponde al z calculado es de 0,4222.

76 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Tabla 14. Áreas bajo la curva normal

Fuente: Lind et al. (2015)

Para facilitar la comprensión de este ejercicio vamos a graficarlo.

Figura 10. Área de la curva indicando la probabilidad de que un estudiante


obtenga una calificación superior a 4,4.

Como ya se había mencionado antes el área total de la curva es 1, por lo tanto a


la izquierda y a la derecha del promedio corresponde un área de 0,5 (Ver figura 9).
Para obtener la probabilidad del evento de interés debemos sustraer 0,5 menos el
área que se ha calculado previamente.

P(x> 4,4)= 0,5- 0,4222= 0,0778

77 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Por lo tanto la probabilidad que tiene un estudiante de obtener una calificación


superior a 4,4 es de 0,0778 (7,78 %).

Una vez que se ha calculado la probabilidad del primer caso, procedemos con el
segundo literal del ejemplo anterior, en donde se quiere conocer la probabilidad
de obtener una calificación menor a 3,2.

b. μ = 3,9
σ = 0,35
P (x< 3,2)
z=x-μ/σ

Siguiendo el procedimiento anterior, procedemos a buscar el valor de la


probabilidad en la tabla de distribución normal y obtenemos que la probabilidad es
de 0,4772. Como el área a la izquierda del promedio es 0,5 (recordemos que el
área total bajo la curva normal es 1), debemos realizar la sustracción de las áreas.

Figura 11. Área de la curva indicando la probabilidad de que un estudiante


obtenga una calificación inferior a 3,2.

Entonces tenemos que,

P(x<3,2)= 0,5- 0,4772= 0, 0228

78 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

La probabilidad de que un estudiante obtenga una calificación inferior a 3,2 es de


0,0228 (2,28%).

Actividad recomendada

Revise los videos cuyos enlaces se incluye a continuación, para que conozca más
sobre distribución de probabilidad normal.

VIDEO: Píldoras matemáticas (2017) Tipificar la variable (video). Recuperado de


enlace web.

VIDEO: Píldoras matemáticas (2017) Como usar una tabla de distribución normal
(video). Recuperado de enlace web.

VIDEO: Píldoras matemáticas (2017) ¿Qué es la distribución normal? (video).


Recuperado de enlace web.

VIDEO: Píldoras matemáticas (2017) Función de distribución normal (video).


Recuperado de enlace web.

Al observar estos videos, usted tendrá una idea más clara con ejemplos
adicionales de cómo llevar a cabo este importante procedimiento en el análisis de
datos.

5.5. Aproximación de la distribución normal a la binomial

Recuerde que un experimento binomial consiste en una serie de n ensayos


idénticos e independientes, habiendo para cada ensayo dos resultados posibles,
éxito o fracaso. La probabilidad de éxito en un ensayo es la misma que en
cualquier otro de los ensayos y se denota p. La variable aleatoria binomial es el
número de éxitos en n ensayos y lo que se quiere saber es la probabilidad de

79 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

x éxitos en n ensayos. Sin embargo, se dificulta cuando el número de ensayos


es muy grande. En los casos en que np > 5 y nq > 5, la distribución normal
proporciona una aproximación a las probabilidades binomiales que es fácil de
usar. Cuando se usa la aproximación normal a la binomial, es importante recordar
el valor esperado y la varianza presentados en la sección 5.3 de esta guía
didáctica, por lo tanto les sugiero revisar las fórmulas ahí recomendadas.

Consideremos el siguiente ejemplo. Un fabricante de bombillas eléctricas ha


encontrado que 2% son defectuosas en promedio, ¿cuál es la probabilidad que en
1000 bombillas seleccionadas al azar se encuentren 15 o más defectuosas?

Planteamos el ejercicio considerando los siguiente,

E(x)=np
σ²= np(q)

Por lo cual tendríamos que:

E(x)=1000*0,02=20
σ² (x)=1000*0,02*0,98=19,6
σ² (x)= 4,42

Al aplicar la fórmula para distribución de probabilidad normal tendríamos que:

μ = 20
σ = 4,42
P (x> 15)
z=x-μ/σ

Procedemos a buscar el valor en la tabla de distribución normal en Lind et al


(2015) y obtenemos que la probabilidad es igual a 0,3708. Como el valor de z es
negativo se asume que se encuentra a la izquierda del promedio. Para calcular la

80 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

probabilidad que sea un valor mayor a 15 debemos sumar ambas áreas el área
que acabamos de calcular y el área a la derecha del promedio. Como el valor a la
derecha del promedio es 0,5 (recordemos que el área total bajo la curva normal
es 1), tenemos que:

P(x> 15)= 0,5 +0,3708= 0,8708

Figura 12. Área de la curva indicando la probabilidad de que 15 o más bombillas


sean defectuosas.

Por lo tanto la probabilidad de que 15 o más bombillas resulten defectuosas es de


0,8708 (87%).

81 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Autoevaluación 5

Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje de la presente unidad. Recuerde que la autoevaluación
no es obligatoria, sin embargo, le apoya para la resolución de la evaluación a
distancia y lo prepara para la evaluación presencial.

Antes de empezar, ¡revise sus apuntes una vez más!

Considerando el siguiente enunciado, seleccione la alternativa correcta.

1. Algunos modelos de probabilidad que utilizan de variables aleatorias


continuas son:

a. Binomial
b. De Poisson
c. Normal

2. Identifique la función binomial en un experimento en el cual p es la


probabilidad de éxito, y q la probabilidad de fracaso, entonces la
probabilidad que se obtenga x en n ensayos.

a. (p)n+ (q)n-x
b. (1) – (p)n
c. (1) – (q)n

82 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

3. La probabilidad de éxito de un acontecimiento en la distribución


binomial es:

a. Fija.
b. Variable.
c. Cero.

4. Si en un ejercicio planteado como binomial el número de experimentos


realizados es grande se recomienda usar la distribución:

a. De Poisson.
b. Normal.
c. t de Student

5. La probabilidad de la variable aleatoria continua se calcula


considerando:

a. Un evento específico x.
b. El área bajo la curva entre dos valores.
c. La ocurrencia de un evento binomial.

6. La probabilidad de la variable aleatoria continua de un valor puntual x=


5 es:

a. Cero.
b. Positiva.
c. Negativa.

7. El área bajo la curva normal es igual a:

a. 3.
b. 1.
c. 0.

83 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

8. Una variable aleatoria x tiene una media de 5 y una desviación típica


de +1. El valor z calculado para determinar la probabilidad de que la
variable aleatoria sea inferior a 3, es:

a. +2.
b. -2.
c. 0.

9. La probabilidad que la variable aleatoria del ejemplo anterior sea


inferior a 3 es de:

a. 0,4772
b. 0,0228
c. 0,5000

10. El promedio de las calificaciones en una asignatura es 12 con una


desviación típica de 3. Para calcular la probabilidad de que un
estudiante obtenga una calificación menor a 10 (x<10), necesitamos
calcular:

a. El valor z, buscar el valor correspondiente en la tabla, y restar dicho


valor a 0.5 que es el área bajo la mitad de la curva.
b. El valor z, buscar el valor correspondiente en la tabla, esa es la
probabilidad.
c. El valor z, buscar el valor correspondiente en la tabla, y sumar dicho
valor a 0.5 que es el área bajo la mitad de la curva.

Al final de esta guía didáctica se encuentra el solucionario con las respuestas


correctas y su respectiva retroalimentación (si tiene un 80% o más de respuestas
correctas concluya el estudio de esta unidad, caso contrario revise nuevamente
los contenidos).

84 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

UNIDAD 6. MUESTREO

6.1. Tipos de muestreo

Existen diferentes tipos de muestreo que pueden ser utilizados para realizar
investigaciones. El tipo de muestreo que se seleccione depende en gran medida
de los objetivos de la investigación, del presupuesto y tiempo disponibles que
tenga el investigador. A continuación les presento un esquema de los diferentes
tipos de muestreo que existen para su conocimiento y la descripción de cada uno
de ellos.

Figura 13. Tipos de muestreo


Tomado de: Lind et al. (2012)

a. Muestreo no probabilístico

Una muestra es no aleatoria cuando los elementos son elegidos por métodos
dirigidos (no aleatorios). Una desventaja de este procedimiento es que como es
de carácter subjetivo está sujeto a errores. La muestra dirigida está constituida
por una parte de la población, que el investigador considera representativa del
universo. Si se recogen características homogéneas, la representatividad de la

85 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

muestra puede ser satisfactoria. Otro tipo de muestreo dirigido es bola de nieve,
en la que el sujeto en estudio sugiere quien podría ser el próximo sujeto de
muestreo.

Actividad recomendada

Revise los videos cuyo enlace se incluye a continuación, para que conozca en
forma explicativa cómo llevar a cabo un muestro no probabilístico.

VIDEO: Monasterio, A. (2014) Tipos de muestreo (video). Recuperado de enlace


web.

VIDEO: Academia EBC (2016) Técnicas de muestreo (video). Recuperado de


enlace web.

Luego de haber mirado los videos recomendados estará en capacidad de


distinguir en qué condiciones aplicar un tipo de muestreo.

b. Muestreo aleatorio

Una muestra es aleatoria cuando los elementos que constituyen la población o


universo tienen la misma posibilidad de ser seleccionados. Para escoger una
muestra de una población hay diversos métodos que se detallan a continuación.

▪▪ Muestreo aleatorio simple

Se recomienda cuando la población no es numerosa y se concentra en un área


no extensa; tampoco debería tener gran variabilidad porque implicaría un tamaño
muestral muy amplio, que a su vez incrementa costos y tiempo. La definición de
muestreo aleatorio simple y del proceso de seleccionar una muestra aleatoria
simple depende de si la población es finita o infinita.

86 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Nota: MUESTREO ALEATORIO SIMPLE (POBLACIÓN FINITA)

Una muestra aleatoria simple de tamaño n de una población finita de tamaño N


es una muestra seleccionada de manera que cada posible muestra de tamaño n
tenga la misma probabilidad de ser seleccionada.

Un procedimiento para seleccionar una muestra aleatoria simple de una población


finita es elegir los elementos para la muestra de uno en uno, de manera que,
en cada paso, cada uno de los elementos que quedan en la población tengan
la misma probabilidad de ser seleccionado. Al seleccionar n elementos de esta
manera, será satisfecha la definición de muestra aleatoria simple seleccionada a
partir de una población finita.

Importante: Los números aleatorios generados por computadora


también sirven para realizar el proceso de selección de una muestra
aleatoria. Excel proporciona una función para generar números
aleatorios en sus hojas de cálculo.

En algunas situaciones la población o bien es infinita o tan grande que, para


fines prácticos, se considera infinita. En la práctica, la población en estudio se
considera infinita si se tiene un proceso continuo en el que sea imposible contar
o enumerar cada uno de los elementos de la población, como los vehículos que
pasan por un peaje o el número de clientes de un restaurante.

En poblaciones infinitas un procedimiento para la selección de una muestra


debe ser concebido especialmente para cada situación, de manera que permita
seleccionar los elementos de forma independiente y evitar así un sesgo de otorgar
mayores probabilidades a ciertos tipos de elementos.

▪▪ Muestreo aleatorio estratificado

Este procedimiento implica una división de la población en grupos, denominados


estratos. Cada elemento debe poseer una característica tan definida que le

87 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

permita pertenecer a un solo estrato. La base para la formación de los estratos,


que puede ser departamento, edad, tipo de industria, etc., está a discreción de
la persona que diseña la muestra. Sin embargo, se obtienen mejores resultados
cuando los elementos que forman un estrato son lo más parecido posible. Una
vez formados los estratos, se toma una muestra aleatoria simple de cada estrato.

El valor del muestreo aleatorio estratificado depende de qué tan homogéneos


sean los elementos dentro de cada estrato. Si los elementos son homogéneos,
el estrato tendrá una varianza pequeña. Esto implica que con muestras
relativamente pequeñas se obtienen buenas estimaciones de las características
de los estratos. Si los estratos son homogéneos, el muestreo aleatorio
estratificado, proporciona resultados tan precisos como los de un muestreo
aleatorio simple, pero con una muestra de tamaño total menor.

▪▪ Muestreo aleatorio sistemático

Para ciertos muestreos, en especial en aquellos con poblaciones grandes, se


necesita mucho tiempo para tomar una muestra aleatoria simple. Una alternativa
al muestreo aleatorio simple es el muestreo sistemático. Se selecciona un
punto aleatorio de inicio y posteriormente se elige cada k-ésimo miembro de la
población. Primero se calcula k, que es el resultado de dividir el tamaño de la
población entre el tamaño de la muestra.

Como el primer elemento que se selecciona es elegido en forma aleatoria, se


supone que una muestra sistemática tiene las propiedades de una muestra
aleatoria simple. Esta suposición es aplicable, en especial, cuando la lista de los
elementos de la población es un orden aleatorio de los elementos.

▪▪ Muestreo por conglomerados

La población se divide generalmente en conglomerados a partir de límites


geográficos. A continuación se seleccionan los conglomerados al azar y se
toma una muestra de forma aleatoria con elementos de cada conglomerado. El
muestreo por conglomerados tiende a proporcionar mejores resultados cuando los

88 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

elementos dentro de los conglomerados no son semejantes. Lo ideal es que cada


conglomerado sea una representación, a pequeña escala, de la población. Si
todos los conglomerados son semejantes en este aspecto, tomando en la muestra
un número pequeño de conglomerados se obtendrá una buena estimación de los
parámetros poblacionales.

El muestreo por conglomerados requiere, por lo general, tamaños de muestra


mayores que los requeridos en el muestreo aleatorio simple o en el muestreo
aleatorio estratificado. Sin embargo, es posible reducir costos debido a
que cuando se envía a un entrevistador a uno de los conglomerados de la
muestra (por ejemplo, a un barrio de una ciudad), es posible obtener muchas
observaciones en poco tiempo. Por tanto, se obtiene una muestra de tamaño
grande a un costo significantemente menor.

6.2. Distribuciones muestrales

a. Distribución muestral de la media 

Es la distribución de probabilidad de todos los valores de la media muestral . La


distribución muestral de tiene un valor esperado, una desviación estándar y una
forma característica.

El valor esperado de  es igual a la media de la población de la que se tomó la


muestra.
E()=μ

La desviación estándar de la distribución muestral de , es posible demostrar que


usando el muestreo aleatorio simple, la desviación estándar depende de si la
población es finita o infinita. Las dos fórmulas para la desviación estándar son las
siguientes:

Población finita

89 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

El factor se requiere cuando la población es finita, pero no cuando es


infinita. A este factor se le conoce como factor de corrección para una población
finita.

Población infinita

Esta fórmula también se recomiendo en aquellos casos cuando la población


es finita y el tamaño de la muestra sea menor o igual a 5% del tamaño de la
población; es decir, n/N < 0.05, ya que en estos casos el factor de corrección será
casi igual a 1.

Los resultados respecto al valor esperado y a la desviación estándar en la


distribución muestral son aplicables a cualquier población. El paso final en la
identificación de las características de la distribución muestral de es determinar
la forma de la distribución muestral. Se considerarán dos casos: a) la población
tiene distribución normal y, b) la población no tiene distribución normal. Cuando
la población tiene distribución normal, la distribución muestral de está distribuida
normalmente, sea cual sea el tamaño de la muestra. Cuando la población de la
que se tomó la muestra aleatoria simple no tiene distribución normal, el teorema
del límite central ayuda a determinar la forma de la distribución muestral de . El
enunciado del teorema del límite central aplicado a la distribución muestral de dice
lo siguiente.

TEOREMA DEL LÍMITE CENTRAL

Cuando se seleccionan muestras aleatorias simples de tamaño


n de una población, la distribución muestral de la media muestral
puede aproximarse a una distribución normal a medida que el
tamaño de la muestra se hace grande.

90 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Se sugiere la lectura del Capítulo 8: Métodos de muestreo y teorema central del


límite del texto básico de Lind et al. (2015) con la finalidad que ustedes puedan
identificar diferentes tipos de formas de las distribuciones muestrales. De acuerdo
con estos autores, la mayoría de los especialistas en estadística consideran que
una muestra de 30 o mayor es lo bastante grande para aplicar el teorema del
límite central.

b. Distribución muestral de 

La proporción muestral es el estimador puntual de la proporción poblacional p. la


proporción muestral es una variable aleatoria y su distribución de probabilidad se
conoce como distribución muestral de .

La fórmula para calcular la proporción muestral es:

Donde

x: número de elementos de la muestra que poseen la característica de interés


n: tamaño de la muestra

Para determinar qué tan cerca está la proporción muestral  de la proporción


poblacional p, se necesita entender las propiedades de la distribución muestral de
: el valor esperado de , la desviación estándar de  y la forma de la distribución
muestral de .

El valor esperado de , la media de todos los posibles valores de , es igual a la


proporción poblacional p.

E()=p

91 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Las dos fórmulas para calcular la desviación estándar de se presentan a


continuación.

Población finita

El factor se requiere cuando la población es finita, pero no cuando es infinita.


A este factor se le conoce como factor de corrección para una población finita.

Población infinita

Ahora que se conoce la media y la desviación estándar de la distribución muestral


de , el último paso es determinar la forma de la distribución muestral. La
proporción muestral es  = x/n. En una muestra aleatoria simple de una población
grande, el valor de x es una variable aleatoria binomial que indica el número
de los elementos de la muestra que tienen la característica de interés. Como n
es una constante, la probabilidad de x/n es la misma que la probabilidad de x,
lo cual significa que la distribución muestral de también es una distribución de
probabilidad discreta.

Una distribución binomial se aproxima mediante una distribución normal siempre


que el tamaño de la muestra sea lo suficientemente grande para satisfacer la
siguiente condición.

np≥5

Entonces, la distribución de probabilidad de x en la proporción muestral, x/n,


puede aproximarse por medio de una distribución normal. Y como n es una

92 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

constante, la distribución muestral también se aproxima mediante una distribución


normal.

Actividad recomendada

Revise los siguientes videos para conocer el procedimiento para conocer sobre
la distribución muestral de la media y de la proporción poblacional. Los videos
presentan ejemplos prácticos sobre la aplicación de los conocimientos adquiridos
en esta sección.

VIDEO: Moreno, Y. (2018) Distribución muestral de medias muestrales (video)


Recuperado de enlace web.

VIDEO: Facultad de estudios a distancia UMNG (2015). Distribución muestral de


la proporción (video) Recuperado de enlace web.

6.3. Estimación por intervalo

a. De la media poblacional

El objetivo de la estimación por intervalo es aportar información de qué tan


cerca se encuentra la estimación puntual, obtenida de la muestra, del valor del
parámetro poblacional. En esta sección se muestra cómo obtener una estimación
por intervalo para la media poblacional μ y para la proporción poblacional p.
La fórmula general para obtener una estimación por intervalo para la media
poblacional es

 ± Margen de error

En el caso de la media poblacional, la estimación por intervalos considera dos


casos:

93 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

▪▪ Desviación estándar poblacional es conocida

Donde (1- α) es el coeficiente de confianza y zα/2 es el valor de z que proporciona


un área α/2 en la cola superior de la distribución de probabilidad normal estándar.
Los niveles de confianza más recomendados son 90%, 95% y 99%. En la Tabla 11
se presenta los valores de z recomendados para estos niveles de confianza.

Tabla 15. Valores de z α/2 para los niveles de confianza más usados

Nivel de confianza Α α/2 zα/2


90% 0,10 0,05 1,64
95% 0,05 0,025 1,96
99% 0,01 0,005 2,58

▪▪ Desviación estándar poblacional es desconocida

Cuando se desconoce la desviación estándar de la población es necesario


recurrir a la distribución t. La distribución t es una familia de distribuciones de
probabilidad similares; cada distribución t depende de un parámetro conocido
como grados de libertad.

Donde s es la desviación estándar muestral, (1- α) es el coeficiente de confianza


y tα/2 es el valor de t que proporciona un área de α/2 en la cola superior de la
distribución t para n - 1 grados de libertad.

94 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Tamaño de la muestra

Como se mencionó anteriormente es el margen de error. Sea,

Despejando n se tiene,

Para usar la ecuación anterior es necesario contar con el valor de la desviación


estándar poblacional σ. Sin embargo, aun cuando este valor no se conozca,
puede usarse la ecuación siempre que se tenga un valor preliminar. En la práctica,
se suele usar alguno de los procedimientos siguientes para obtener este valor
planeado de σ:

1. Usar como valor planeado de σ una estimación de la desviación estándar


poblacional calculada a partir de datos de estudios anteriores.

2. Emplear un estudio piloto seleccionando una muestra preliminar. La


desviación estándar muestral obtenida de la muestra preliminar puede
usarse como valor planeado de σ.

3. Use su juicio para el valor de σ. Por ejemplo, se puede empezar por estimar
el mayor y el menor valor en los datos de la población. Esta diferencia
entre el mayor y el menor valor proporciona una estimación del rango de
los datos. Por último, este valor dividido entre 4 suele considerarse como
una aproximación burda a la desviación estándar y tomarse como un valor
planeado aceptable de σ.

95 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

d. De la proporción poblacional

De manera similar, la fórmula general para obtener una estimación por intervalo
para la proporción poblacional es

 ±Margen de error

Siendo el margen de error:

Donde (1- α) es el coeficiente de confianza, y zα/2 es el valor de z que deja un área


α/2 en la cola superior de la distribución normal estándar.

Tamaño de la muestra

Ahora vamos a revisar cómo calcular el tamaño de la muestra para obtener


una estimación de la proporción poblacional con una precisión determinada. La
función que tiene el tamaño de la muestra en la determinación de la estimación
por intervalo de p es semejante a la que tiene en la estimación de la media
poblacional, ya estudiada en la sección anterior.

Despejando n de la fórmula del margen de error, se obtiene la fórmula para


calcular el tamaño de la muestra con el que se tendrá el margen de error
deseado, E.

Como generalmente no se conoce el valor poblacional de la proporción


se recomienda usar algunos de los métodos siguientes para realizar una
aproximación.

96 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

1. Utilizar la proporción poblacional de una muestra previa de las mismas


unidades o de unidades similares.

2. Utilizar un estudio piloto y elegir una muestra preliminar.

3. Si no aplica ninguna de las alternativas anteriores, emplear como valor


planeado p= 0.50.

El margen de error deseado para calcular una proporción poblacional casi siempre
es 0,10 o menos. En las encuestas de opinión pública un margen de error de
0.03 o 0,04 es común. Con dichos márgenes de error, la ecuación suministra un
tamaño de la muestra que es suficiente para satisfacer los requerimientos de np
>5 y n(1 - p) > 5 para usar una distribución normal como una aproximación de la
distribución muestral de .

Actividad recomendada

Revise los siguientes videos para conocer el procedimiento para conocer sobre
estimación de intervalos de confianza de la media y de la proporción poblacional y
determinación del tamaño de la muestra. Los videos presentan ejemplos prácticos
sobre la aplicación de los conocimientos adquiridos en esta sección.

VIDEO: Píldoras matemáticas (2017) Intervalo de confianza para la media


poblacional (video). Recuperado de enlace web.

VIDEO: Maestro Gustavo (2015) Cálculo del tamaño de una muestra (video).
Recuperado de enlace web.

Luego de revisar los videos usted tendrá más claros los procesos para calcular un
intervalo de confianza de la media y la proporción poblacional.

97 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Autoevaluación 6

Una vez revisados los conceptos básicos vamos a realizar la autoevaluación para
comprobar su aprendizaje de la presente unidad. Recuerde que la autoevaluación
no es obligatoria, sin embargo, le apoya para la resolución de la evaluación a
distancia y lo prepara para la evaluación presencial.

Antes de empezar, ¡revise sus apuntes una vez más!

Considerando el siguiente enunciado, seleccione la alternativa correcta.

1. Cuando se escoge una muestra y se requiere que todas las unidades


de la población tengan la misma probabilidad de ser seleccionadas, la
muestra es:

a. Aleatoria
b. Intencional
c. Por conveniencia

2. El tipo de muestreo que requiere formar grupos o subpoblaciones


homogéneas entre sí y heterogéneas entre ellas se denomina
muestreo:

a. Simple aleatorio
b. Sistemático
c. Estratificado

98 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

3. El tipo de muestreo que da igual oportunidad de selección a cada


elemento o unidad dentro de la población se denomina muestreo:

a. Simple aleatorio.
b. Sistemático.
c. Estratificado.

4. Cuando la estimación no representa bien al parámetro, a pesar de estar


perfectamente diseñada, nos referimos a:

a. Estimadores muestrales.
b. Errores muestrales.
c. Estimadores sesgados.

5. La estimación del parámetro mediante la especificación de un intervalo


de valores, determinado por un valor inferior y otro superior, dentro del
cual se encuentra el verdadero valor poblacional se conoce cómo:

a. Estimación por intervalos.


b. Valores estandarizados.
c. Estimadores muestrales.

6. El rango de valores, dentro de los cuales se espera que esté el


parámetro con cierto grado de confianza o con riesgo de error
conocido se denomina:

a. Error muestral.
b. Intervalo de confianza.
c. Coeficiente de confianza.

99 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

7. Dada una población, si extraemos todas las muestras posibles de


un mismo tamaño, entonces la media de la distribución de todas las
medias muestrales posibles, será igual a,

a. La media poblacional.
b. La media muestral.
c. La media aritmética.

8. Supongamos que las medias muestrales obtenidas por medio de un


muestreo son x1=7, x2=3, x3=5, x4=8, x5=2. La media poblacional será:

a. μ=8
b. μ=5
c. μ=7

9. El teorema del límite central indica que:

a. Cuando en una muestra n tiende al infinito la distribución es normal.


b. Si una muestra n es menor a 30 la distribución es normal.
c. Una muestra n es normal solamente si la población es normal.

10. Matemáticamente, la distribución muestral de una proporción p, se


define como:

a. El cociente entre el número de elementos con el atributo en la muestra


y el tamaño de la muestra.
b. El producto del número de elementos con el atributo en la muestra y el
tamaño de la muestra.
c. El cociente de la sumatoria de los valores xi y el tamaño de la muestra.

Al final de esta guía didáctica se encuentra el solucionario con las respuestas


correctas y su respectiva retroalimentación (si tiene un 80% o más de respuestas
correctas concluya el estudio de esta unidad, caso contrario revise nuevamente
los contenidos).

100 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

UNIDAD 7. PRUEBA DE HIPÓTESIS

7.1. Prueba de hipótesis

Las pruebas de hipótesis se basan en la diferencia entre el estadístico muestral y


el parámetro poblacional. Los pasos básicos para probar una hipótesis son:

Figura 14. Pasos para la prueba de hipótesis


Adaptado de: Lind et al. (2015)

Actividad recomendada

Revise en el libro de Lind et al. (2015) Capítulo 10: Pruebas de hipótesis

de una muestra, cuales son las recomendaciones para plantear hipótesis y los
tipos de hipótesis que existen y los errores tipo I y II.

Con base en el ejemplo que desarrollamos sobre la tasa a alfabetismo a nivel


cantonal en el Ecuador se realizará una prueba de hipótesis (Tabla 6) . En
el estudio de caso se busca conocer si la media de la muestra es diferente

101 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

a la población. Para ello utilizamos una prueba a dos colas pues la hipótesis
alternativa no indica dirección alguna.

Como se calculó en las Unidades 3 y 4 de esta guía didáctica, conocemos la


desviación estándar de la población (4,99) cuya media es 9,8 por tanto es posible
utilizar el valor z como estadístico de prueba. Si no se conoce la desviación
estándar de la población debería usarse el estadístico t de Student.

Paso 1. Planteamos las hipótesis nula y alternativa

Ho: μ=9,8
Ha: μ≠9,8

Paso 2. Selección del nivel de significancia

El nivel de significancia que se utilizará es de α 0,05.

* Recuerde que el nivel de significancia, que se denota α, es la probabilidad de


cometer un error tipo I al rechazar la hipótesis nula cuando ésta es verdadera.

Paso 3. Identificamos el estadístico de prueba

Como se conoce la desviación estándar de la población utilizamos el estadístico z.

Paso 4: Formular una regla se decisión para rechazar o no la hipótesis nula.

La regla de decisión se formula al encontrar los valores de z en la tabla de


distribución normal (Lind et al. 2015). Para determinar si se rechaza la hipótesis
nula se usa el método del valor-p o el método del valor crítico como se indica en
el Capítulo 9: Prueba de hipótesis en Anderson et al. (2016).

102 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Paso cinco. Tomamos una muestra

En este caso conocemos que la media muestral es de 9,75 conforme al cálculo


realizado en la Unidad 3 de esta guía didáctica y calculamos el estadístico de
prueba.

Como se trata de una prueba de dos colas, se calcula el valor de α= 0,05 dividido
por dos, así tenemos = 0,025 que será el valor-p de referencia.

Por consiguiente el área en la que no se rechaza Ho que se ubica entre las dos
colas es de 0,475 a la derecha e izquierda del promedio cuyo valor es 1,96.

Figura 15. Valores críticos en la prueba de hipótesis de dos colas


Tomado de: Lind et al. 2015

El valor de z para nuestro ejemplo fue de -1,11. Dado que la curva normal es
simétrica consideramos en la cola superior un valor igual a 1,11. De acuerdo a la

103 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

tabla de distribución normal este valor corresponde a una probabilidad de 0,3665.


Para determinar la probabilidad restamos 0,5 - 0,3665= 0,1335. Este valor se
ubica en la zona de no rechazo. Y podemos demostrarlo usando el método del
valor crítico o el método del valor-p.

De acuerdo al método del valor crítico para rechazar la hipótesis nula el valor
calculado debe ser mayor al valor de alpha. En nuestro ejemplo vemos que 1,11.
Por tanto no rechazamos la hipótesis nula.

Usando el valor-p, la hipótesis nula se rechaza si el valor-p calculado es menor


que el valor de alpha. En nuestro caso tenemos que el valor-p calculado es
0.13350,025. Por lo tanto no se rechaza la hipótesis siguiendo este método.

Conclusión: como no se puede rechazar la hipótesis nula, no existe evidencia


para concluir que existen diferencias significativas entre la muestra y la población.

7.2. Prueba de hipótesis de dos muestras

Inferencias acerca de la diferencia entre dos medias poblacionales: σ1 y σ2


desconocidas

En esta sección el estudio de las inferencias sobre la diferencia entre dos medias
poblacionales se extiende al caso en el que las dos desviaciones estándar
poblacionales no se conocen. En este caso, para estimar las desviaciones
estándar poblacionales desconocidas se emplean las desviaciones estándar
muestrales.

Tabla 16. Datos de dos muestras para prueba de hipótesis

Muestra 1 Muestra 2
Tamaño de la muestra 30 30
Promedio 9,75 10,22
Varianza 17,69 51,27
Desviación estándar 4,21 7,16

104 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Cuando no se conocen los datos poblacionales se utiliza la distribución t como


estadístico de prueba para pruebas de hipótesis acerca de μ1 y μ2: σ1 y σ2
desconocidas:

Un aspecto importante a considerar al utilizar la distribución t son los grados de


libertad. Los grados de libertad para la prueba de hipótesis usando la distribución t
se obtienen con la ecuación:

La prueba de hipótesis será

H0: μ1 - μ2 0
Ha: μ1 - μ2 0

Como nivel de significancia se usará α =0.05

Usando los datos del ejemplo tenemos:

105 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

De acuerdo con la ecuación los grados de libertad son:

Revisamos en la tabla t de Student (Lind et al. 2015) el valor correspondiente a la


cola superior y se tiene que con un nivel de significancia de 0,05 y 46 grados de
libertad tenemos un valor de 1,679. Dado que 0,2051,679 no se puede rechazar la
Ho usando el método del valor crítico.

Actividad recomendada

Para reforzar los contenidos descritos en la Guía Didáctica, revise el siguiente


video.

VIDEO: Maestro Gustavo (2016) Prueba de hipótesis (video). Recuperado de


enlace web.

Este video le permitirá conocer sobre el procedimiento para realizar pruebas de


hipótesis para una muestra.

106 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

Autoevaluación 7

Una vez revisados los conceptos, vamos a realizar la autoevaluación para


comprobar su aprendizaje. Recuerde que la autoevaluación no es obligatoria, sin
embargo, le apoya para la resolución de la evaluación a distancia y lo prepara
para la evaluación presencial.

Estoy segura que resolverán estas preguntas en forma correcta ¡Vamos por ellas!

Considerando el siguiente enunciado, seleccione la alternativa correcta.

1. El primer paso en una prueba de hipótesis es:

a. Establecer la hipótesis nula y alternativa.


b. Definir el nivel de significancia.
c. Seleccionar el estadístico de prueba.

2. El valor de zα⁄2 para un nivel de confianza del 99% es:

a. 1,96
b. 2,58
c. 1,65

107 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

3. En una muestra aleatoria simple de 60 artículos la media muestral fue


80. La desviación estándar poblacional es 15. Seleccione la fórmula con
la que calcularía el intervalo de confianza.

a.

b.

c.

4. El promedio de bonificaciones de fin de año por empleado en el sector


público es de $1200. Suponga que se desea tomar una muestra de los
empleados para ver si la media de la bonificación es diferente de la
media reportada para la población. La forma correcta de plantear la
hipótesis sería:

a. H0: μ μ0
Ha: μ μ0

b. H0: μ μ0
Ha: μ μ0

c. H0: μ μ0
Ha: μ μ0

5. La definición de Error Tipo I en una prueba de hipótesis es la siguiente:

a. Se rechaza la hipótesis nula cuando es verdadera.


b. Se rechaza la hipótesis nula cuando la hipótesis alternativa es
verdadera.
c. Se acepta la hipótesis nula cuando es verdadera.

108 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

6. De acuerdo al sindicato de comunicadores los ingresos siguen una


distribución normal, con media de 800 y una desviación estándar
poblacional de 150. En una muestra tomada a un grupo de 120
conductores su ingreso medio ascendió a 825. Si quiere determinar
que el ingreso medio es mayor a la media poblacional, ¿de qué forma
plantearía las hipótesis?

a. H0: μ 800
Ha: μ 800

b. H0: μ 800
Ha: μ 800

c. H0: μ 800
Ha: μ 800

7. En el ejemplo anterior, el estadístico de prueba que elegiría debería


seguir una distribución:

a. Normal.
b. t de Student.
c. Chi cuadrado.

8. La definición de Error Tipo II en una prueba de hipótesis es la siguiente:

a. Se rechaza la hipótesis nula cuando es verdadera.


b. Se rechaza la hipótesis nula cuando la hipótesis alternativa es
verdadera.
c. Se acepta la hipótesis nula cuando es falsa.

109 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Segundo bimestre

9. El método del valor crítico en una prueba de hipótesis de la cola


superior en una variable que sigue una distribución normal, implica
que, si el valor z calculado es:

a. Menor al valor z del nivel alpha seleccionado, se rechaza la hipótesis


nula.
b. Mayor al valor z del nivel alpha seleccionado, se rechaza la hipótesis
nula.
c. Mayor al valor z del nivel alpha seleccionado, no se rechaza la
hipótesis nula.

10. El método del valor-p en una prueba de hipótesis de la cola inferior


en una variable que sigue una distribución normal, implica que, si el
valor-p calculado es menor al alpha seleccionado,

a. se rechaza la hipótesis nula.


b. se rechaza la hipótesis nula.
c. no se rechaza la hipótesis nula.

No olvide que para evaluar su desempeño en el desarrollo de esta autoevaluación


puede revisar el solucionario al final de la guía didáctica, en donde se indican las
respuestas correctas de los ítems.

110 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

7. Solucionario

Autoevaluación 1
N° Respuesta Retroalimentación
1 A La estadística es el método usado para recoger,
procesar, analizar y presentar datos.
2 A La estadística descriptiva solamente describe la
muestra o población de donde es obtenida, pero no
permite hacer inferencias posteriores.
3 A La población debe tener un característica que la
diferencia de otras unidades, puede ser de tipo
geográfico, etnia, nacionalidad etc.
4 C Es una variable discreta contable finita.
5 B Es un atributo que define a las unidades en forma
cualitativa
6 B Es una variable cuyas unidades se pueden contar en
valores enteros.
7 B Es un atributo, no es una variable cuantitativa.
8 A No es comparable, solamente de carácter descriptivo.
9 C La variable velocidad es de tipo cuantitativo continuo.
10 A Es una variable cuantitativa cuyo punto inicial no es el
cero absoluto, sino un valor de referencia.

111 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Solucionario

Autoevaluación 2
N° Respuesta Retroalimentación
1 B Si existe una gran variabilidad de los datos colectados
el rango de la distribución de datos será mayor.
2 C Una vez que se han calculado la amplitud de los
intervalos, esta se mantiene constante para todas las
clases calculadas.
3 B Todas las observaciones deben estar registradas en
un clase en particular y la sumatoria debe ser igual al
número total de observaciones.
4 A Porque resultan de dividir el valor de la frecuencia de la
clase para n.
5 C Son diagramas muy versátiles para representar todo
tipo de información.
6 B Los intervalos de la variable están dados por las clases
de la distribución de frecuencias, por lo tanto son
constantes.
7 A En este tipo de graficas se representa las frecuencias
acumuladas.
8 B Los gráficos circulares son óptimos para representar
variables nominales y sus frecuencias.
9 B Facilitan la comprensión visual del comportamiento de
la variable a lo largo del tiempo.
10 A Es importante que contenga la información de los ejes
en forma correcta y un título que indique que tipo de
información se está presentando.

112 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Solucionario

Autoevaluación 3
N° Respuesta Retroalimentación
1 B Este tipo de medidas comprenden la media, mediana y
moda.
2 A En aquellos casos cuando se ha seleccionado bien la
muestra, la media es el valor más estable.
3 B Se calcula sumando los valores de cada observación y
dividiendo para n.
4 B Se calcula sumando los valores de cada observación y
dividiendo para n.
5 B Se calcula multiplicando el valor de la observación por
la frecuencia, luego se suman estos valores, y se divide
para n.
6 C Es la diferencia que existe entre cada observación y el
promedio calculado.
7 A En toda distribución de datos la suma de las
desviaciones respecto a la media es cero.
8 B Solamente se puede calcular un valor por grupo y no se
permiten hacer generalizaciones para otras muestras.
9 A Luego de haber organizado los valores de menor a
mayor, es el valor que ocupa la cuarta posición, siendo
n=7.
10 B Ya que no existe un valor particular para la mediana,
es necesario calcular el promedio entre los valores que
ocupen la posición n y n+1.

113 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Solucionario

Autoevaluación 4
N° Respuesta Retroalimentación
1 C El rango, o sea la diferencia entre el valor menor
y el mayor es la menor, es el menor entre las tres
distribuciones.
2 C La varianza es la media de los cuadrados de las
diferencias entre el valor de x y el promedio de la
distribución.
3 B Ya que la varianza solamente se calcula para variables,
en constantes no debe existir variabilidad.
4 C La varianza calculada siempre tiene las unidades de la
variable al cuadrado.
5 A La desviación estándar es la raíz cuadrada de la
varianza, por lo tanto en la misma unidad de la variable.
6 A Este procedimiento se realiza para obtener un
verdadero peso del valor medio de la clase, ya que la
frecuencia indica cuantas observaciones se reportaron
para esa clase, y por tanto requiere más peso que otras
con menor frecuencia.
7 B La varianza es el cuadrado de la desviación estándar.
8 C El coeficiente de variación es el cociente entre la
desviación estándar y la media.
9 B Es el valor ubicado en la vigésima quinta posición.
10 B Es el valor ubicado en la septuagésima posición.

114 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Solucionario

Autoevaluación 5
N° Respuesta Retroalimentación
1 C Los modelos binomial y de Poisson corresponden de
distribuciones de probabilidad de variables discretas.
2 A Es la fórmula de la distribución binomial.
3 A Es una de las características de los experimentos
binomiales, la probabilidad de éxito no puede cambiar
de ensayo en ensayo.
4 B Cuando (n*p) es mayor o igual a 5.
5 B Siempre se requiere un área bajo la curva, pueden
haber tres casos P (a<x<b); P(a<x); P(x>b).
6 A La probabilidad de un valor específico x no se puede
calcular bajo una curva, por lo tanto sería igual a cero.
7 B Constituye la suma de las probabilidades de todos los
eventos posibles.
8 B El valor de la variable aleatoria es menor que el
promedio el valor será negativo.
9 B Es el valor que se obtiene del valor de la tabla para
distribución normal, el valor se ubica a la izquierda del
promedio.
10 A El valor que provee la tabla es el área entre x=10 y el
promedio, pero el área de interés es x<10, por lo tanto
es el área que queda por fuera del valor que nos da la
tabla de probabilidad normal.

115 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Solucionario

Autoevaluación 6
N° Respuesta Retroalimentación
1 A Cuando una muestra es aleatoria, cada elemento tiene
la posibilidad de ser seleccionado con una probabilidad
determinada.
2 C Se divide la población en estratos de acuerdo a
características específicas y diferenciables.
3 A Es el tipo de muestreo más básico, se recomienda
cuando la población es homogénea.
4 B Es un tipo de error común en muestreos.
5 A En este procedimiento se determina un rango dentro del
cual puede presentarse el parámetro poblacional.
6 B El intervalo de confianza depende de la probabilidad
utilizada para estimar el valor.
7 A La media de los promedios muestrales ofrece una
perspectiva sobre la población.
8 B Es la media de las medias muestrales y se calcula con
el procedimiento general para el cálculo de medias
9 A En toda muestra mayor a 30 observaciones se puede
considerar que seguiría un patrón de distribución
normal.
10 A Se considera todos los individuos que cumplen con
la característica y el número total de individuos que
componen la muestra.

116 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Solucionario

Autoevaluación 7
N° Respuesta Retroalimentación
1 A Lo primero es establecer lo que se quiere evaluar o
probar por medio de una prueba de hipótesis.
2 B Al buscar en la tabla de distribución normal el valor que
corresponde a Za/2 para un área bajo la curva de 0,495;
el valor que corresponde es 2,58.
3 A Se trata de un ejemplo con desviación estándar
poblacional conocida.
4 C Se trata de una prueba de hipótesis que mide si existen
diferencias entre el promedio muestral y poblacional, es
una prueba a dos colas.
5 A El error tipo I consiste en rechazar una hipótesis nula
cuando es verdadera.
6 B Es una prueba de hipótesis de la cola superior.
7 A Se debe usar z, ya que se tiene información de la
población.
8 C El error tipo II implica que se acepta la hipótesis nula
cuando es falsa.
9 B Se rechaza la hipótesis si el valor crítico calculado es
mayor que el valor z del alpha del nivel de significancia.
10 A Se rechaza la hipótesis si el valor-p calculado es menor
que el alpha del nivel de significancia.

117 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

8. Glosario

A continuación se presentan una serie de conceptos claves para el estudio de


la estadística. Se introducen en el mismo orden de aparición que en la guía
didáctica.

Media: Medida de localización central que se calcula sumando los valores de los
datos y dividiendo entre el número de observaciones.

Mediana: Medida de localización central proporcionada por el valor central de los


datos cuando éstos se han ordenado de menor a mayor.

Moda: Medida de localización central, definida como el valor que se presenta con
mayor frecuencia.

Percentil: Un valor tal que, por lo menos p por ciento de las observaciones
son menores o iguales que este valor, y por lo menos (100 -p) por ciento de
las observaciones son mayores o iguales que este valor. El percentil 50 es la
mediana.

Cuartiles: Los percentiles 25, 50 y 75, llamados cada uno primer cuartil, segundo
cuartil (mediana) y tercer cuartil. Los cuartiles sirven para dividir al conjunto de
datos en cuatro partes; cada una contiene aproximadamente 25% de los datos.

Rango: Una medida de la variabilidad, que se define como el valor mayor menos
el menor.

Rango intercuartílico: Una medida de la variabilidad, que se define como la


diferencia entre el tercer y primer cuartil.

Varianza: Una medida de la variabilidad que se basa en los cuadrados de las


desviaciones de los datos respecto a la media.

118 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Glosario

Desviación estándar: Una medida de variabilidad obtenida de la raíz cuadrada


de la varianza.

Coeficiente de variación: Medida de variabilidad relativa que se obtiene al dividir


la desviación estándar entre la media y multiplicando el resultado por 100.

Sesgo: Medida de la forma de la distribución de los datos. Datos sesgados a


la izquierda tienen un sesgo negativo; una distribución de datos simétrica tiene
sesgo cero, y datos sesgados a la derecha tienen sesgo positivo.

Probabilidad: Medida numérica de la posibilidad de que ocurra un evento.

Experimento: Proceso para generar resultados bien definidos.

Distribución de probabilidad normal: Una distribución de probabilidad


continua. Su función de densidad de probabilidad tiene forma de campana y está
determinada por la media μ y la desviación estándar σ.

Parámetro: Característica numérica de una población, por ejemplo, la media


poblacional μ, la desviación estándar poblacional σ, la proporción poblacional p,
etcétera.

Muestreo aleatorio simple: Poblaciones finitas: muestra seleccionada de manera


que cada una de las muestras de tamaño n tenga la misma probabilidad de ser
seleccionada. Poblaciones infinitas: muestra seleccionada de manera que todos
los elementos provengan de la misma población y los elementos se seleccionen
de manera independiente.

Muestreo sin reemplazo: Una vez que un elemento ha sido incluido en la


muestra, se retira de la población y ya no se selecciona una vez más.

Muestreo con reemplazo: Una vez que un elemento se ha incluido en la


muestra, se regresa a la población. Un elemento ya seleccionado para la muestra

119 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Glosario

puede ser seleccionado nuevamente y puede aparecer más de una vez en la


muestra.

Estadístico muestral: Característica muestral, por ejemplo, la media muestral,


la desviación estándar muestral s, la proporción muestral, etc. El valor del
estadístico muestral se usa para estimar el valor del correspondiente parámetro
poblacional.

Estimador puntual: Un estadístico muestral como, s, o que proporciona una


estimación puntual del parámetro poblacional correspondiente.

Estimación puntual: Valor de un estimador que se usa en una situación


particular como estimación del parámetro poblacional.

Distribución muestral: Distribución de probabilidad que consta de todos los


posibles valores de un estadístico muestral.

Teorema del límite central: Permite usar la distribución de probabilidad normal


para aproximar la distribución muestral de siempre que la muestra sea grande.

Estimación por intervalo: Estimación de un parámetro poblacional que


suministra un intervalo que se cree contiene el valor del parámetro. Para las
estimaciones por intervalo vistas en este capítulo tiene la forma: estimación
puntual margen de error.

Margen de error: Valor que se resta y se suma a la estimación puntual con objeto
de obtener un intervalo de estimación para el parámetro poblacional.

σ conocida: Caso en el que datos históricos u alguna otra información


proporciona un buen valor para ser considerado como desviación estándar
poblacional antes de tomar la muestra. Este valor conocido de σ se usa en la
estimación por intervalo para calcular el margen de error.

120 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Glosario

Nivel de confianza: Confianza correspondiente a la estimación por intervalo.


Por ejemplo, si un procedimiento para obtener una estimación por intervalo
proporciona intervalos tales que, 95%de ellos contendrán al parámetro
poblacional, se dice que esa estimación por intervalo tiene un nivel de confianza
de 95%.

Coeficiente de confianza: El nivel de confianza expresado como valor decimal.


Por ejemplo 0.95 es el coeficiente de confianza correspondiente al nivel de
confianza de 95%.

Intervalo de confianza: Otro nombre para una estimación por intervalo.

σ desconocida: El caso más común cuando no existen bases sólidas para


estimar la desviación estándar poblacional antes de tomar la muestra. En la
estimación por intervalo se usa la desviación estándar muestral para calcular el
margen de error.

Distribución t: Una familia de distribuciones de probabilidad que se usa para


obtener una estimación por intervalo de la media poblacional cuando la desviación
estándar poblacional σ no se conoce y se estima mediante la desviación estándar
muestral s.

Grados de libertad: Parámetro de las distribuciones t. Cuando se usa una


distribución t para calcular una estimación por intervalo de la media poblacional, la
distribución t correspondiente tiene n - 1 grados de libertad, donde n es el tamaño
de la muestra aleatoria simple.

121 Modalidad Abierta y a Distancia


Guía didáctica: Estadística

9. Referencias bibliográficas

Anderson, D.R., Sweeney D.J. y Williams, T.A. (2008). Estadística para


administración y economía. México, Cengage Learning.

Academia Internet (2015) Como calcular la Media, Moda y Mediana, medidas de


tendencia central (video). Recuperado de enlace web.

Academia Internet (2015) Como calcular la Media, Moda y Mediana, medidas de


tendencia central (video). Recuperado de enlace web.

Academia Internet (2016) Tabla de frecuencias para variable cualitativa, diagrama


de sectores (video). Recuperado de enlace web.

Academia EBC (2016) Técnicas de muestreo (video). Recuperado de enlace web

Banco Interamericano de Desarrollo (2018). Midiendo el impacto: aplicaciones


comunes de asignación aleatoria. Recuperado de enlace web.

Carreon D. (2016) Probabilidad (video). Recuperado de enlace web.

EBC Academia (2017) Medidas de dispersión (video). Recuperado de enlace web

Facultad de estudios a distancia UMNG (2015). Distribución muestral de la


proporción (video) Recuperado de enlace web.

Física y Mates (2015) Distribución Binomial (video). Recuperado de enlace web.

Física y Mates (2015) Distribución Binomial: media y varianza (video).


Recuperado de enlace web.

122 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Referencias bibliográficas

Lind, D., Marchal,W., Wathen, S., (2012). Estadística aplicada a los negocios y la
economía. México, Mc Graw Hill.

Macías, A. (2017) La probabilidad y sus reglas (video). Recuperado de enlace


web.

Maestro Gustavo (2015) Cálculo del tamaño de una muestra (video). Recuperado
de enlace web.

Maestro Gustavo (2016) Prueba de hipótesis (video). Recuperado de enlace web.

Matemáticas Profe Alex (2017). Conceptos básicos de Estadística [video].


Colombia. Recuperado de enlace web.

Martínez, C., (2012) Estadística y muestreo. Colombia, Ecoe Ediciones.

Ministerio de Educación (2018). Estadística Educativa. Reporte de indicadores.


Recuperado de enlace web.

Montero Espinoza (2018) Coeficiente de simetría (video). Recuperado de enlace


web.

Montero Espinoza (2017) Distribución binomial (video). Recuperado de enlace


web.

Monasterio, A. (2014) Tipos de muestreo (video). Recuperado de enlace web.

Moreno, Y. (2018) Distribución muestral de medias muestrales (video) Recuperado


de enlace web.

Píldoras matemáticas (2017) Tipificar la variable (video). Recuperado de enlace


web.

123 Modalidad Abierta y a Distancia


Guía didáctica: Estadística
Referencias bibliográficas

Píldoras matemáticas (2017) Como usar una tabla de distribución normal (video).
Recuperado de enlace web.

Píldoras matemáticas (2017) ¿Qué es la distribución normal? (video). Recuperado


de enlace web.

Píldoras matemáticas (2017) Función de distribución normal (video). Recuperado


de enlace web.

Píldoras matemáticas (2017) Intervalo de confianza para la media poblacional


(video). Recuperado de enlace web.

Tuto Mate (2016) Elaboración de una tabla de frecuencias (variable discreta)


(video). España. Recuperado de enlace web.

Tuto Mate (2016) Elaboración de una tabla de frecuencias (variable continua)


(video). España. Recuperado de enlace web.

Tuto Mate (2016) Cálculo de probabilidades (video). Recuperado de enlace web.

124 Modalidad Abierta y a Distancia


www.utpl.edu.ec

ÁREA
sociohumanística

También podría gustarte