Está en la página 1de 233

Estadística para Comunicadores

Material de enseñanza

C
O M A R K E T I N G
M S
U F O T O G R A F Í A
N A
I P E R I O D I S M O
C Í
A U D I O V I S U A L Y M E D I O S
C T I N T E R A C T I V O S
I P U B L I C I D A D
Ó C
N I M A G E N E M P R E S A R I A L

Área de Ciencias

Marzo 2020
La siguiente guía de trabajo contiene el material necesario
para seguir las clases del curso Estadística para Comunicadores de la
Universidad Peruana de Ciencias Aplicadas. Contiene la teoría,
ejercicios resueltos y propuestos de todo el curso.

Este material de enseñanza está basado en el trabajo de la


profesora Silvia Gutiérrez y de muchos otros profesores del curso
que lo han desarrollado y corregido a lo largo de varios ciclos.

Esperamos que este material le sea de utilidad.

Los profesores del curso


Contenido
Unidad 1. Conceptos básicos. Medidas descriptivas. Tablas de doble entrada...........................7
La Estadística........................................................................................................................................7
Clasificación de la Estadística................................................................................................................8
Estadística descriptiva........................................................................................................................8
Estadística inferencial.........................................................................................................................8
Conceptos básicos................................................................................................................................9
Población............................................................................................................................................9
Muestra..............................................................................................................................................9
Unidad elemental...............................................................................................................................9
Dato....................................................................................................................................................9
Observación........................................................................................................................................9
Técnicas de recolección de datos.......................................................................................................12
Censo................................................................................................................................................12
Muestreo..........................................................................................................................................12
Registro administrativo....................................................................................................................13
Variable..............................................................................................................................................14
Tipos de variables.............................................................................................................................14
Variable cualitativa...........................................................................................................................14
Variable cuantitativa........................................................................................................................14
Escalas de medición..........................................................................................................................17
Parámetro y estadístico....................................................................................................................21
Presentación tabular y gráfica de variables........................................................................................27
Frecuencias absolutas, relativas y porcentuales...............................................................................27
Distribución de frecuencias para variables cualitativas....................................................................27
Representación gráfica de variables cualitativas..............................................................................29
Representación gráfica de variables discretas..................................................................................29
Representación gráfica de variables continuas................................................................................29
Medidas de tendencia central............................................................................................................36
Media...............................................................................................................................................36
Mediana...........................................................................................................................................40
Moda................................................................................................................................................43
Forma de la distribución de los datos.................................................................................................46
Medidas de posición: Cuantiles..........................................................................................................48
Medidas de variabilidad o dispersión.................................................................................................53
Varianza............................................................................................................................................54
Desviación estándar.........................................................................................................................54
Coeficiente de variación...................................................................................................................56
Rango...............................................................................................................................................58
Tabulaciones cruzadas........................................................................................................................63
Gráfico de barras comparativas........................................................................................................65

Unidad 2. Probabilidad y variable aleatoria.............................................................................74


Eventos mutuamente excluyentes...................................................................................................74
Axiomas de la probabilidad..............................................................................................................75
Definición clásica de probabilidad....................................................................................................75
Teoremas básicos de probabilidad...................................................................................................75
Variable aleatoria...............................................................................................................................82
Rango o recorrido.............................................................................................................................82
Variable aleatoria continua: Distribución normal.............................................................................82

Unidad 3. Muestreo.................................................................................................................93
Censo................................................................................................................................................94
Muestreo..........................................................................................................................................94
Tamaño de muestra para estimar el valor de la media o proporción poblacional...........................96
Muestreo probabilístico...................................................................................................................111
Ficha técnica...................................................................................................................................112
Elección de la muestra....................................................................................................................113
Muestreo aleatorio simple.............................................................................................................113
Muestreo estratificado...................................................................................................................120
Muestreo sistemático.....................................................................................................................130

Unidad 4. Inferencia estadística.............................................................................................141


Distribución t-Student....................................................................................................................141
Prueba de hipótesis..........................................................................................................................142
Tipos de errores..............................................................................................................................142
Nivel de significación......................................................................................................................143
Pasos a seguir en una prueba de hipótesis.....................................................................................143
Prueba de hipótesis para la media poblacional..............................................................................144
Prueba de hipótesis para una proporción poblacional...................................................................149

Unidad 5. Regresión lineal y correlación.................................................................................159


Análisis de regresión lineal simple y de correlación.........................................................................159
El diagrama de dispersión..............................................................................................................159
La ecuación de la recta estimada....................................................................................................160
El método de mínimos cuadrados..................................................................................................160
Validación del modelo de regresión lineal......................................................................................162
Supuestos de la regresión lineal.....................................................................................................162
Coeficiente de determinación..........................................................................................................163
Coeficiente de correlación................................................................................................................163
Introducción al SPSS.........................................................................................................................173
Segmentar un archivo....................................................................................................................173
Seleccionar casos de un archivo.....................................................................................................174
Recodificar una variable en una nueva variable.............................................................................175
Tabla de distribución de frecuencias y gráficos de una variable cualitativa...................................176
Gráficos de una variable cualitativa................................................................................................177
Tabla de distribución de frecuencias de dos variables cualitativas (tablas de doble entrada).......178
Tabla de distribución de frecuencias y gráficos de dos variables cualitativas.................................179
Tabla de distribución de frecuencias y medidas de resumen de una variable cuantitativa............180
Tabla de distribución de frecuencias y gráficos de una variable discreta (gráfico de bastones).....181
Tabla de distribución de frecuencias y gráficos de una variable cuantitativa (histograma)............182
Prueba de hipótesis para la media.................................................................................................183
Proceso para realizar una prueba de hipótesis con el reporte de SPSS..........................................184
Prueba de hipótesis para la proporción (versión 1)........................................................................190
Prueba de hipótesis para la proporción (versión 2)........................................................................191
Regresión lineal simple...................................................................................................................192
Unidad 1
Conceptos básicos
Medidas descriptivas
Tablas de doble entrada
Logro
Al finalizar la unidad 1,
el estudiante aplica
las herramientas descriptivas
usando datos numéricos e información gráfica.

Temario
 Conceptos básicos: Población, muestra y elemento. Variables, tipos
de variable y escalas de medida. Parámetro y estadístico. Dato y
observación. Análisis de variables cualitativas y cuantitativas
 Medidas de resumen: Medidas de tendencia central y concepto de
asimetría. Medidas de posición. Medidas de dispersión.
 Tablas cruzadas: Tablas de frecuencias absolutas y porcentuales.
Gráficos comparativos: agrupados y apilados.
Estadística para Comunicadores 7

Unidad 1. Conceptos básicos. Medidas


descriptivas. Tablas de doble entrada

La Estadística
Es una ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar,
organizar, presentar y analizar datos.

Recopilar datos Organizar datos

Presentar datos Analizar datos

La finalidad y utilidad es describir, numérica o gráficamente, al conjunto de datos, así como también
realizar inferencias entendidas como generalizaciones de lo medido, de manera que se puedan
obtener conclusiones adecuadas. Es una herramienta útil para la toma de decisiones.
Estadística para Comunicadores 2020 01 8

Clasificación de la Estadística

Estadística

Descriptiva Inferencial

Estadística descriptiva
Son métodos y técnicas de recolección, caracterización, resumen y presentación que permite describir
las características de un conjunto de datos.
Comprende el uso de gráficos, tablas e indicadores para el análisis.
Existen diversos tipos de gráficos adecuados a los tipos de variables que se desean representar.

Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más características de una población o tomar
decisiones referentes a la población basados en el resultado de muestras seleccionadas al azar.
Estas conclusiones no tienen que ser totalmente válidas, pueden tener cierto margen de error, por eso
se dan con una medida de confiabilidad o probabilidad.

Ejercicio
1. Indique qué gráfico fue realizado usando estadística inferencial.

Fuente: https://elcomercio.pe/elecciones-2020/
elecciones-2020-a-quienes-prefieren-los-ciudadanos-para-formar-parte-del-nuevo-congreso-noticia/
Estadística para Comunicadores 2020 01 9

Conceptos básicos

Población
Es el conjunto de todos los elementos de interés en un determinado estudio.
Pueden ser personas, animales, objetos, conceptos, entre otros, de los cuales sacamos conclusiones a
partir de una o más características observables de naturaleza cualitativa o cuantitativa.
Suele llamarse población objetivo porque se selecciona en función al objetivo de estudio.

Muestra
Es una parte representativa de la población que se selecciona adecuadamente para su análisis y así
obtener información acerca de la población de la que proviene.
En estadística se suele trabajar con muestras representativas, es decir, que son elegidas de forma
aleatoria.

Unidad elemental
Es el objeto sobre el cual se hace el conjunto de mediciones
También se le denomina unidad de análisis, unidad estadística, caso o elemento.
En estudios longitudinales, de series de tiempo, la unidad elemental es la unidad de tiempo. Por
ejemplo, un día, un mes, un año, etc.

Dato
Es la respuesta o el resultado de medir una característica de una unidad elemental.

Observación
Es el conjunto de datos de una unidad elemental
En una base de datos, una observación es el conjunto de datos de cada unidad elemental.

Por ejemplo, para una vivienda se pueden registrar los siguientes datos, que conforman una
observación.
Estadística para Comunicadores 2020 01 10
Estadística para Comunicadores 2020 01 11

Ejemplo
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea
invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes
extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es
conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115
huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación, se
presenta parte de la base de datos:

Precio dispuesto Número de


País de a pagar por acompañantes
N° Edad Género Criterio de selección del hotel
procedencia habitación
(en dólares) por viaje
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
11
20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
5

a. Determine la población, la muestra y la unidad elemental.

Todos los huéspedes extranjeros que se hospedaron en el hotel la Posada entre


Población
enero y mayo del presente año.

115 huéspedes extranjeros que se hospedaron en el hotel la Posada entre enero


Muestra
y mayo del presente año.

Un huésped extranjero que se hospedó en el hotel la Posada entre enero y mayo


Elemento
del presente año.

b. De la base de datos, proporcione un ejemplo de dato y uno de observación.

Dato Francia

Observación 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio.


Estadística para Comunicadores 2020 01 12

Ejercicios

1. De los universitarios que viven en Lima, se quiere estimar el porcentaje que trabaja. Determine la
población, la muestra y la unidad elemental.

Población

Muestra

Unidad elemental

2. Un diario publicó lo siguiente: “En la ciudad de Lima existen 313 608 mujeres que son trabajadoras
del hogar, el 72% labora en hogares del sector socioeconómico A, la mayoría no cuenta con seguro
social, la jornada laboral media es de 12,3 horas diarias y el sueldo medio es de 655 soles
mensuales.” Identifique la población, muestra y unidad elemental. Además, proporcione un ejemplo
de observación.

Población

Muestra

Unidad elemental

Observación

3. Una empresa tiene un total de 30 trabajadores y ha registrado información acerca del ingreso
mensual (en soles) y de los años cumplidos en la empresa.
N Ingreso Años en la Ingreso Años en la Ingreso Años en la
Nº Nº
º (en soles) empresa (en soles) empresa (en soles) empresa
1 2300 5 11 2100 13 21 2400 16
2 2800 11 12 2100 9 22 1700 0
3 2400 4 13 1800 1 23 2500 12
4 2500 2 14 2000 9 24 1700 3
5 2300 3 15 2100 10 25 2400 17
6 2100 2 16 1900 4 26 2400 16
7 1700 2 17 2000 10 27 1900 7
8 2000 0 18 2300 11 28 1700 1
9 2200 7 19 2000 7 29 2100 6
10 2100 4 20 1700 1 30 2000 5
Identifique a partir del enunciado la población y la unidad elemental. Además, proporcione un
ejemplo de dato y un ejemplo de observación.

Población

Unidad elemental

Dato

Observación
Estadística para Comunicadores 2020 01 13
Estadística para Comunicadores 2020 01 14

Técnicas de recolección de datos


La forma de obtener la información original de las unidades elementales que componen la población a
investigar puede ser efectuada a través de:

Censo Muestreo Registros administrativos

Censo
Se llama censo cuando se recolecta la información de todas las unidades de la población. El método
para recolectar los datos de toda la población es a través de una encuesta y es necesario que se
especifique el espacio y el tiempo al que se refiere el recuento.

Muestreo
Se realiza cuando se mide las características de una parte de la población. Es llevado a cabo,
generalmente, a través de algún cuestionario que puede ser por teléfono, virtual o a través de un
encuestador. Se prefiere el uso de muestreo en vez de un censo principalmente por dos razones: costo
y tiempo.
Estadística para Comunicadores 2020 01 15
Estadística para Comunicadores 2020 01 16

Registro administrativo
Los registros administrativos son …”información referida a una unidad individual –persona física,
hogar, empresa, etc. – que ha sido diseñada, recogida y mantenida por una determinada
administración pública con el propósito de controlar o tomar decisiones relativas a esa unidad
individual.”. Begoña (2006). Los registros administrativos pueden ser privados también, de hecho gran
cantidad de información agropecuaria, petrolera, económica, etc., tiene como fuente RRAA
procedentes de corporaciones privadas.
Son una forma económica de obtener información estadística. Sin embargo, se obtiene tal como está
disponible. Los fines del registro administrativo no siempre coinciden con los de nuestra investigación.
Es de fuente secundaria porque el investigador no la toma directamente ni bajo criterios
metodológicos propios sino debido a criterios de la institución dueña del registro.
El registro administrativo posee propiedades que hacen que pueda convertirse en dato estadístico a un
bajo costo y sin perder los requisitos de calidad del dato estadístico.
Existen oficinas públicas que llevan registros administrativos para sus propios fines. Por ejemplo:
 los Registros Civiles registran nacimientos, casamientos o defunciones,
 el Ministerio de Educación que lleva registros sobre matrícula de alumnos o deserción escolar,
 la Aduana que registra las importaciones y exportaciones.

Por ejemplo, se puede consultar las páginas web de las siguientes instituciones:
Estadística para Comunicadores 2020 01 17

Variable

Se define así a una característica que presentan los elementos de una población y que puede asumir
diferentes valores cuando se realiza su medición.

Tipos de variables

cualitativa

Variable discreta

cuantitativa

continua

Variable cualitativa
Es aquella variable que al ser medida queda expresada por etiquetas o nombres que se utilizan para
identificar una característica o atributo.

Variable cuantitativa
Es aquella variable que al ser medida queda expresada por números que se utilizan para identificar una
característica o atributo.

Estas a su vez pueden clasificarse en discretas o continuas.


Variable cuantitativa discreta
Las mediciones de este tipo de variable son el resultado del conteo, es decir, los valores que puede
tomar son números enteros (finitos o infinitos).
Variable cuantitativa continua
Las mediciones de este tipo de variable pueden ser decimales o fracciones; es decir, para dos valores
cualesquiera, siempre se podrá encontrar un tercer valor entre los dos primeros.

 Son ejemplos de variable cualitativa, el distrito de residencia o el grado de instrucción.


 Son ejemplos de variable cuantitativa discreta, el número de capacitaciones realizadas en el año o
el número de errores cometidos en la redacción de un informe.
 Son ejemplos de variable cuantitativa continua, el ingreso mensual (en soles) o el tiempo que
demora una llamada telefónica (en minutos).
Estadística para Comunicadores 2020 01 18

Ejemplo
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea
invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes
extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es
conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115
huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación se
presenta parte de la base de datos:

Precio dispuesto Número de


País de a pagar por acompañantes
N° Edad Género Criterio de selección del hotel
procedencia habitación
(en dólares) por viaje
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
11
20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
5

Identifique el tipo de variable que se presenta en la base de datos.

Solución

Variable Tipo de variable

Edad Cuantitativa continua

Género Cualitativa

País de procedencia Cualitativa

Precio dispuesto a pagar por habitación,


Cuantitativa continua
en dólares

Número de acompañantes por viaje Cuantitativa discreta

Criterio de selección del hotel Cualitativa


Estadística para Comunicadores 2020 01 19

Ejercicios

1. Clasifique las siguientes variables de acuerdo con su tipo.

Variable Tipo de variable

Nombre de la radio preferida por el oyente

Nivel educativo del oyente

Cantidad de horas que escucha dicha radio al día

Número de días que escuchó radio en la última semana

Dispositivo por el que escucha radio (radio, celular, etc)

2. Se desea conocer la opinión de las mujeres que usan el servicio Metropolitano. Para ello se
encuestó, el primer trimestre del año 2018, a 300 mujeres que usaron dicho medio de transporte.
Se obtuvo los siguientes resultados:
 El 65% opinó que el servicio es bueno, el 30% que es regular y el resto manifestó que es
deficiente.
 El 60% manifestó que es muy lenta la recarga de la tarjeta “Bus Card”.
 La edad promedio es de 42,5 años con una desviación estándar de 2,3 años.
 El 50% demora a lo más 25 minutos en llegar a su destino.
 El 85% usa el servicio como máximo cuatro veces al día.

a. Del enunciado anterior identifique: población, muestra, unidad elemental.

Población

Muestra

Elemento

b. Identifique las variables e indique su tipo.

Nombre de la variable Tipo de variable


Estadística para Comunicadores 2020 01 20
Estadística para Comunicadores 2020 01 21

Escalas de medición
La medición de una variable consiste en asignar un valor a la característica observada.

Por ejemplo, si la característica observada es el género de las personas, al clasificar a una persona
como de sexo femenino, le asignamos un valor, y hacemos una medición de la característica.

El proceso de medición utiliza diversas escalas: nominal, ordinal, intervalo y razón.

Nominal Ordinal Intervalo Razón

Nominal
Sólo permite asignar un nombre, etiqueta o valor al elemento sometido a medición.
Los números que se puedan asignar a las propiedades de los elementos se utilizan sólo como etiquetas
con la finalidad de clasificarlos.
Con esta escala no tiene sentido realizar operaciones aritméticas.
Ordinal
Los datos son etiquetas y además el orden es significativo.
Los datos se pueden ordenar en forma ascendente o descendente, de tal manera que puedan expresar
grados de la característica medida.
Intervalo
Además de asignar un nombre o etiqueta y establecer un orden entre los elementos, esta escala
permite calcular diferencias entre los números asignados a las mediciones (el intervalo entre
observaciones que se expresa en términos de una unidad fija de medida). Los datos son numéricos.
Razón
Los datos tienen todas las propiedades de los datos de intervalo y el cociente de los dos valores es
significativo. Tiene un punto cero absoluto, es decir, el cero indica la ausencia de la característica
medida.
Se puede realizar las operaciones aritméticas a los números asignados.

Las siguientes son ejemplos de variables medidas en las diversas escalas de medición:

Sexo El orden de mérito de Temperatura en °C. Sueldo de los


Marca de celular los alumnos de la UPC Ubicación en una trabajadores
Nacionalidad Grado de instrucción carretera respecto de Peso de una persona
Religión Opinión (bueno, un punto de referencia Velocidad de un auto en
Número de DNI regular, malo) Año de nacimiento la carretera

Nominal Ordinal Intervalo Razón


Estadística para Comunicadores 2020 01 22

Ejemplo
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea
invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes
extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es
conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115
huéspedes extranjeros que se hospedaron entre enero y marzo del presente año. A continuación, se
presenta parte de la base de datos:

Precio dispuesto Número de


País de a pagar por acompañantes
N° Edad Género Criterio de selección del hotel
procedencia habitación
(en dólares) por viaje
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
11
20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
5

Identifique el tipo y la escala de medición de cada una de las variables que se presenta en la base de
datos.

Variable Tipo de variable Escala de medición

Edad Cuantitativa continua Razón

Género Cualitativa Nominal

País de procedencia Cualitativa Nominal

Precio dispuesto a pagar por habitación, en


Cuantitativa continua Razón
dólares

Número de acompañantes por viaje Cuantitativa discreta Razón

Criterio de selección del hotel Cualitativa Nominal


Estadística para Comunicadores 2020 01 23

Ejercicios

1. Indique el tipo y la escala de medida que corresponde a cada una de las siguientes variables.

Variable Tipo de variable Escala de medida

Nombre de un paciente

Temperatura corporal de un
paciente en grados centígrados
Número de pacientes que
tienen coronavirus en el Perú

Fase de la epidemia (1, 2, 3, 4)

Ciudad de contagio del paciente


cero
Cantidad de dinero destinado a
curar un enfermo

2. Los clientes que se suscriben a la revista “Buena Vida” deben llenar un formato con información
personal. Clasifique cada uno de los datos solicitados indicando el tipo de variable y su respectiva
escala de medida.

Variable Tipo de variable Escala de medida

Profesión

Distrito de residencia

Ingreso mensual familiar

Edad, en años

Número telefónico

Estado civil

Gasto semanal en alimentos


(en soles)

Centro laboral
Estadística para Comunicadores 2020 01 24
3. Un diario desea saber si sus suscriptores están interesados en que se ofrezcan recetas de comidas
típicas de diferentes regiones del país. El diario tiene 2 100 suscritores, de los cuales el 74% son
hombres. Se seleccionó al azar 352 personas y se encontró que el 60% tiene interés en recetas de
comida típica, la edad media de los entrevistados es de 31 años y el 10% procede de la selva.
a. Identifique la población, la muestra y el elemento.

Población

Muestra

Elemento

b. Identifique qué variables se están estudiando, indique su tipo y escala de medida.

Nombre de la variable Tipo de variable Escala de medida

4. La revista A empezó a circular en Lima en enero del año 2016, siendo una de las más sólidas en su
rubro. Cuenta actualmente con 1 450 suscriptores, de los cuales el 30% reside fuera de Lima. Los
directivos han decidido aplicar una encuesta a una muestra de 120 suscriptores para poder
implementar un programa de impacto, con la finalidad, de incrementar el número de
suscriptores. Los resultados obtenidos después de la aplicación son:
5.

 El 80% está muy satisfecho, el 12% está satisfecho y sólo un 8% está insatisfecho.
 El 65% de los suscriptores solicita se agregue información referente a actividades recreativas
para programarlas en su tiempo libre.
 El 70% realiza compras por computadora. Esta información revela a los directivos que los
avances en computación serán de interés para sus suscriptores.
a. En base al enunciado anterior identifique la población y la muestra.

Población

Muestra

b. Complete los espacios en blanco, según el enunciado.

Defina la variable Tipo de variable Escala de medida

Ordinal

Cualitativa

Nominal
Estadística para Comunicadores 2020 01 25

Parámetro y estadístico
Un parámetro resume una característica de la población. Para obtener su valor se hace necesario
contar con toda la información que brindan los elementos de una población.

Un estadístico resume una característica de la muestra, para obtener su valor se utiliza la información
muestral. El valor obtenido de un estimador se conoce como estimación. Al estimador se le llama
estadígrafo o estadístico.

Algunos parámetros y estadísticos:

Nombre Parámetro Estadístico


N n

Promedio ∑ xi ∑ xi
μ= i =1 x̄= i=1
N n

Moda Mo mo
A a
Proporción p= ^p=
N n

Distribución de votantes según organización política en la segunda vuelta electoral 2016


Organización política Total Porcentaje de votos válidos
50,120%
8 596 937
Peruanos por el Kambio

8 555 880 49,880%


Fuerza Popular
Fuente: ONPE. Resultado definitivo al 100% de actas

En el ejemplo, el parámetro es <proporción de votantes que lo hicieron por PPK>, su notación es p y su


valor es 0,5012. Este valor multiplicado por 100% nos da 50,12% obtenido a partir de todos los votos
válidos.
En este ejemplo, el estadístico es <proporción de votantes que
lo hicieron por PPK> , su notación o estimador es ^py su valor o
estimación es 0,469. Es estadístico porque este porcentaje fue
calculado de una muestra obtenida antes de la votación.
Estadística para Comunicadores 2020 01 26

Ejemplo
El hotel La Posada es nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en la
realización de una publicidad agresiva para incrementar la cantidad de huéspedes extranjeros por
temporada en el hotel. Para ello, desea conocer que características del hotel es conveniente resaltar
en la publicidad aplicando una encuesta a una muestra aleatoria de 115 huéspedes extranjeros que se
hospedaron entre enero y marzo del presente año.

A continuación, se presenta parte de la base de datos:

Precio dispuesto Número de


País de a pagar por acompañantes
N° Edad Género Criterio de selección del hotel
procedencia habitación
(en dólares) por viaje
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
115 20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados

Después de procesar la información se obtuvieron los siguientes resultados:

 El 34% de los huéspedes extranjeros procede de los Estados Unidos.


 La edad promedio de los huéspedes es de 35,2 años.
 El número de acompañantes por huésped extranjero más frecuente es de dos personas.
 El criterio de selección más frecuente es el precio.

Identifique el estimador y el valor del estimador para cada una de las variables de la base de datos.

Variable Estadístico Valor del estadístico


Lugar de procedencia Proporción 34%, Estados Unidos

Edad de los huéspedes Promedio 35,2 años

Número de acompañantes Moda 2

Criterio de selección del hotel Moda Precio


Estadística para Comunicadores 2020 01 27

Ejercicios de aplicación

1. Con la intención de conocer la opinión de los pacientes de los hospitales, que fueron afectados por
la última huelga médica, se contrató los servicios de la consultora Access Data S.A. la cual encuestó
a 500 pacientes que acudieron a los diferentes hospitales de Lima y Callao el presente mes. Entre
los principales resultados se obtuvieron los siguientes:

· El 67,4% de los encuestados afirmó que se vieron perjudicados por la huelga médica.
· La respuesta más frecuente a la pregunta ¿Cómo calificaría la calidad de la atención que
recibe?, fue regular.
· La media del número de veces que debe acudir mensualmente al hospital es de 3,4 veces.
· El 25% de los encuestados afirmó que recibe del hospital hasta dos medicamentos por
atención.

Identifique y complete:

Variable Estadístico Valor del estadístico

Perjudicados por huelga médica proporción 67,4% de encuestados

Calidad de atención moda regular

Número de veces que debe ir mensualmente


promedio 3,4 veces
al hospital

Reciben 2 medicamentos por atención proporción 25% de encuestados

2. Un diario local publicó en su última edición dominical, un estudio realizado sobre el manejo y
desarrollo de la publicidad actual. Mencionamos a continuación algunos párrafos publicados en
este artículo:

 “...se realizó una encuesta en la ciudad de Lima a 1102 personas de 18 a 70 años elegidas al
azar...”
 “…el 52% de los encuestados señalaron que los anunciantes sí sobrepasan los límites de lo
aceptable desde el punto de vista ético y social al realizar sus campañas de publicidad…”
 “… el 40,2% de los encuestados señaló recordar el nombre del producto luego de ver el
comercial por TV…”
 “… el 51,6% de los encuestados no están de acuerdo con el horario en que transmiten algunos
comerciales por TV...”
 “... el ingreso promedio de los encuestados es de 2403 soles...”
 El encargado de este estudio, publicista peruano de 50 años mencionó: “… la publicidad es
comunicación aplaudida y criticada no sólo por su función de venta de productos, sino también
por su influencia en la economía y en la sociedad…”

Identifique a partir del enunciado:

Muestra 1102 personas


Estadística para Comunicadores 2020 01 28

Variable Tipo de variable

Ingreso en soles Cuantitativo continuo

edad Cuantitativo continuo

Nombre del producto cualitativo

horario en que transmiten algunos comerciales por TV Cuantitativo discreto

Estadístico Notación Valor del estadístico


52% de los encuestados
moda mo

40,2% de los encuestados


proporción p

51,6% de los encuestados


moda mo

3. Una empresa de bebidas gaseosas está pensando lanzar una nueva bebida al mercado local. “Ice
Tea” es un producto bajo en calorías y dirigido a personas en edad universitaria. Se sabe que la
ciudad donde se piensa lanzar el producto cuenta con 100 000 habitantes en edad universitaria, el
65% son mujeres, el 30% consume sólo agua mineral y el 20% estudia en universidades particulares.

Para tal estudio se consideró seleccionar una muestra de tamaño 400 donde los resultados
obtenidos luego de procesar la información fueron:

 La edad promedio de los encuestados es de 21,6 años.


 El 52% de los encuestados son mujeres.
 El precio promedio que pagarían por el nuevo producto es 1,70 soles.
 El 80% de los encuestados calificó al sabor de la bebida como “Muy bueno”, el 10% como
“Bueno”, el 5% como “Malo” y el resto como “Muy malo”.

Identifique y complete a partir del enunciado:

Población

Muestra
Estadística para Comunicadores 2020 01 29

Defina la variable Tipo de variable

Estadístico Notación Valor del estadístico

4. Con la finalidad de determinar en qué medida la población urbana de cierta ciudad identifica
elementos sexistas o machistas en la publicidad comercial actual, un sociólogo cultural tomó una
muestra de 590 personas, de los cuales encontró que:
 el 60% de los encuestados reconocía elementos sexistas en la publicidad,
 la edad promedio de los entrevistados fue de 37,5 años,
 el 20% pertenecía a la clase socioeconómica A-B, el 45% a la clase C-D y los restantes a la clase
E.
 A la pregunta respecto a la marca comercial con mayor contenido machista en su publicidad, el
45% reconoce a la marca de cerveza “SENPIL”, el 25% a la marca de artículos de cuidado
personal “GOE”, el 10% a la marca de detergente “CEA” y el resto a otras marcas.
Relacione cada elemento que se describe a continuación con los conceptos dados en el párrafo.

Conceptos dados en el párrafo Elementos que se describen


A. Todos los ciudadanos de cierta ciudad ( ) Variable cuantitativa continua
B. 32 años ( ) Muestra
C. 45% pertenecen a la clase C-D ( ) Población
D. 590 personas de cierta ciudad ( ) Variable cualitativa
E. Un ciudadano ( ) Estadístico
F. Cerveza “SENPIL” ( ) Dato cuantitativo
G. Nivel socioeconómico registrado y medido como ( ) Dato cualitativo
A-B, C-D y E ( ) Unidad elemental
H. Edad del entrevistado ( ) Escala de medida ordinal
I. Marca con mayor contenido sexista
Estadística para Comunicadores 2020 01 30

5. Complete la siguiente tabla:

Variable Tipo de variable Escala de medición


Horas destinadas a ver Netflix a la
semana

Serie favorita de Netflix

Número de capítulos de una serie


por temporada en Netflix

6. Hace un mes, una empresa de servicios realizó una encuesta a una muestra de 60 profesionales que
asistieron a una conferencia en el Colegio de Comunicadores Sociales del Perú con la finalidad de
recoger información encomendada por ciertas empresas que alquilan locales para la organización
de eventos culturales tales como: congresos, coloquios, conversatorios, etc.

Parte del cuestionario que se le pidió completar a los asistentes se presenta a continuación:

1. Sexo: Masculino  Femenino 


2. Edad: ……..... años
3. Ingreso mensual: ........... soles
4. Profesión: ....................
5. Cargo que ocupa en su empres: .........................................
6. ¿Cuánto suele gastar por asistir a un evento cultural? .............. soles
7. ¿A cuántos congresos asistió el mes pasado? ...........
8. ¿Su empresa organiza con regularidad eventos profesionales y/o culturales? Sí  No 
9. ¿Su empresa alquila locales para organizar eventos culturales? Sí  No 

En base al enunciado anterior y analizando la encuesta complete lo siguiente:

Población

Elemento

Variable Tipo de variable Escala de medición

Razón

Número de congresos asistidos el


mes pasado
Estadística para Comunicadores 2020 01 31

Presentación tabular y gráfica de variables

Una vez recopilada la información, con las variables consideradas de mayor importancia, el siguiente
paso es presentarla a través de una tabla de frecuencias o un gráfico que describa adecuadamente las
características más importantes.

Un gráfico es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de
un fenómeno en estudio y facilita el análisis estadístico de las variables.

Un gráfico, al igual que un cuadro o una tabla, debe contar con un título y una fuente.

Frecuencias absolutas, relativas y porcentuales


 La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa clase.

 La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa clase.

frecuencia absoluta f i
Frecuencia relativa ( h i )= =
número de datos n

 La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.

Frecuencia porcentual ( pi ) =hi ×100 %

Distribución de frecuencias para variables cualitativas


Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la
columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la variable.

 Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias absolutas y
relativas.
 Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las frecuencias
acumuladas absolutas y relativas.

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi
f1
Categoría 1 f1 h1 = p1 =h1 ×100
n
f2
Categoría 2 f2 h2 = p2 =h2 ×100
n
… … … …
fk
Categoría k fk hk = pi=hi×100
n
Fuente: ……………………………………..
Estadística para Comunicadores 2020 01 32
Estadística para Comunicadores 2020 01 33

Título de una tabla de distribución de frecuencias


De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:
Distribución de <unidades elementales> según <variable>

Representación gráfica de variables cualitativas

Gráfico de barras
En el eje horizontal se representa las categorías de la variable y
en el eje de ordenadas las frecuencias absolutas, relativas o
porcentuales.

Gráfico circular, pye o torta


En este caso las categorías de la variable cualitativa ocupan un
espacio en el círculo que es proporcional a la frecuencia que
representan. También se denomina diagrama de sector circular,
gráfico tipo torta o pastel.

Si la variable cualitativa es de escala ordinal se recomienda usar el


gráfico de barras.

Representación gráfica de variables discretas


Gráfico de bastones o de varas
En el eje horizontal se representa las categorías de la variable y en
el eje de ordenadas las frecuencias absolutas, relativas o
porcentuales.
Cada frecuencia de clase se representa trazando un bastón a la
altura de cada valor de la variable sobre el eje horizontal y cuya
altura es proporcional a la frecuencia correspondiente.

Representación gráfica de variables continuas


Histograma
Este gráfico se realiza a partir de una tabla de frecuencias
absolutas, relativas o porcentuales.

Se traza colocando la variable sobre el eje horizontal y las


frecuencias sobre el eje vertical.
Cada frecuencia de clase se representa trazando un rectángulo,
cuya base es el intervalo de clase sobre el eje horizontal y cuya
altura es proporcional a la frecuencia correspondiente.
Los rectángulos adyacentes se tocan entre sí.
Estadística para Comunicadores 2020 01 34

Ejercicio
El diario estadounidense The New York Times reportó la muerte de los dos empleados adolescentes en
McDonald's en el Perú. Usted desea redactar una noticia sobre las condiciones laborales de los
trabajadores en dicha franquicia, para lo cual desea hacer algunos gráficos para poder subrayar sus
opiniones.

Complete el siguiente cuadro con posibles variables que quisiera estudiar, siendo la unidad elemental
igual a un trabajador de McDonald's en el Perú.

Variable Gráfico adecuado

Cuenta con la indumentaria necesaria para su labor Gráfico circular

Gráfico de barras

Gráfico de bastones

Histograma
Estadística para Comunicadores 2020 01 35

Ejemplo
El hotel La Posada es relativamente nuevo en el mercado hotelero de Puno. La gerencia general desea
invertir en la realización de una publicidad agresiva para incrementar la cantidad de huéspedes
extranjeros por temporada en el hotel. Para ello, desea conocer que características del hotel es
conveniente resaltar en la publicidad aplicando una encuesta a una muestra aleatoria de 115
huéspedes extranjeros que se hospedaron entre enero y marzo del presente año.

A continuación se presenta parte de la base de datos:

Precio dispuesto Número de


País de a pagar por acompañantes
N° Edad Género Criterio de selección del hotel
procedencia habitación
(en dólares) por viaje
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
8 85 Masculino China 70 2 Precio
9 25 Masculino Inglaterra 65 3 Limpieza del dormitorio
10 35 Femenino Francia 45 1 Precio
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
11
20 Masculino Estados Unidos 55 2 Amigable y cordial staff de empleados
5

Realice la tabla de distribución de frecuencias de las variables: criterio de selección del hotel, precio
que estaría dispuesto a pagar por habitación y número de acompañantes por viaje. Además, realice los
gráficos adecuados con el software SPSS.

Solución

Tabla de distribución de frecuencias de una variable cualitativa

Distribución de huéspedes extranjeros según criterio de selección del hotel


Criterio de selección del hotel Frecuencia Porcentaje Porcentaje válido Porcentaje acumulado
Amigable y cordial staff de empleados 25 21,7 21,7 21,7
Buena calidad de las toallas y sábanas 12 10,4 10,4 32,2
Limpieza del dormitorio 13 11,3 11,3 43,5
Opciones del Preferred guest card 6 5,2 5,2 48,7
Precio 39 33,9 33,9 82,6
Servicios "In room" 10 8,7 8,7 91,3
Servicios adicionales 10 8,7 8,7 100,0
Total 115 100,0 100,0
Fuente: Hotel La Posada. Puno
Estadística para Comunicadores 2020 01 36
Grafico cirlular, pye o torta

Distribución de huéspedes extranjeros según criterio de selección del hotel

Fuente: Hotel La Posada. Puno

Gráfico de barras
Distribución de huéspedes extranjeros según criterio de selección del hotel

Fuente: Hotel La Posada. Puno

Tabla de distribución de frecuencias de una variable cuantitativa continua


Distribución de huéspedes extranjeros según precio que estaría dispuesto a pagar por habitación (en dólares)
Frecuencia Frecuencia
Límite Límite Marca Frecuencia Frecuencia
absoluta relativa
inferior superior de clase absoluta relativa
acumulada acumulada
40 54 47 15 0.1304 15 0.1304
54 68 61 47 0.4087 62 0.5391
68 82 75 23 0.2000 85 0.7391
82 96 89 16 0.1391 101 0.8783
96 110 103 8 0.0696 109 0.9478
110 124 117 3 0.0261 112 0.9739
124 138 131 2 0.0174 114 0.9913
138 152 145 1 0.0087 115 1,0000
Fuente: Hotel La Posada. Puno
Estadística para Comunicadores 2020 01 37
Histograma
Distribución de huéspedes extranjeros según precio dispuesto a pagar por habitación (en dólares)

Fuente: Hotel La Posada. Puno

Tabla de distribución de frecuencias de una variable cuantitativa discreta


Distribución de huéspedes extranjeros según número de acompañantes por viaje
Número de acompañantes Frecuencia Porcentaje Porcentaje válido Porcentaje acumulado
0 21 18,3 18,3 18,3
1 26 22,6 22,6 40,9
2 37 32,2 32,2 73,0
3 22 19,1 19,1 92,2
4 9 7,8 7,8 100,0
Total 115 100,0 100,0
Fuente: Hotel La Posada. Puno

Gráfico de bastones

Distribución de huéspedes extranjeros según número de acompañantes por viaje

Fuente: Hotel La Posada. Puno


Estadística para Comunicadores 2020 01 38
Ejercicio

1. El siguiente gráfico se refiere a la intención de quedarse en el Perú de la población venezolana. Ponga título
al gráfico.

Título: ……………………………………………………………………………………………………………………………..

2. El siguiente gráfico porcentual se refiere a la cantidad de horas de trabajo a la semana que la población
venezolana realiza en el Perú.

Título: ……………………………………………………………………………………………………………………………..

Fuente. Encuesta "Condiciones de Vida de la población venezolana que reside en el Perú" INEI 2018.
Estadística para Comunicadores 2020 01 39

Medidas de resumen
Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que
constituyen una muestra tomada de alguna población.

Podemos clasificar las medidas de resumen en: las medidas de tendencia central, las medidas de
posición y medidas de dispersión.

En esta unidad trabajaremos las medidas descriptivas únicamente con datos simples o no agrupados;
es decir, con valores que no están agrupados en tablas de distribución de frecuencia.

Medidas Medidas de tendencia Media


de central

resumen Mediana

Moda

Medidas de posición o Percentil


cuantiles

Cuartil

Decil

Medidas de dispersión Rango

Varianza

Desviación estándar

Coeficiente de variación
Estadística para Comunicadores 2020 01 40

Medidas de tendencia central


Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del cual
tienden a concentrarse o distribuirse las demás observaciones.

Media Mediana Moda


El objetivo es conseguir un valor que sea representativo del conjunto de datos que se está analizando.

Media
La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de
dichos valores dividida entre el número de valores.
N
∑ xi
μ= i =1
La media poblacional se calcula con N
n
∑ xi
x̄= i=1
La media muestral se calcula con n
Características de la media
 Se puede calcular para datos medidos en escala de intervalo o razón.
 El valor de la media es sensible a los valores extremos o atípicos que la distorsionan.
 El cálculo de la media es sencillo y fácil de entender e interpretar.
Ejemplo
El Instituto Nacional de Estadística e Informática informó hoy que en el segundo trimestre del 2019 el
ingreso medio mensual proveniente del trabajo es de 1 701,8 soles en Lima Metropolitana. El ingreso
medio de los hombres es de 1 953,5 soles y el de las mujeres es 1 393,2 soles, los hombres ganan en
promedio 560,3 soles.

Ejemplo
La siguiente información corresponde al número de notas publicadas por un grupo de periodistas del
diario Popular durante el último mes.

12 9 8 11 10 16 14 7 10 10 6 13

Calcule e interprete el valor del promedio del número de notas publicadas.Solución


Media = 10,5 notas.
Interpretación: El número promedio de notas publicadas por los periodistas del Popular es igual a
10,5.
Estadística para Comunicadores 2020 01 41
Estadística para Comunicadores 2020 01 42

Ejercicio

1. La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más importante
de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación Internacional de
Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas jugadoras de la selección serbia.
Calcule la media de la estatura de estas jugadoras.

2. Carlos, estudia por las mañanas en la UPC en la Facultad de Comunicaciones y por las tardes trabaja
en el diario El Comercio. En una muestra de 10 días del último mes transcurrido registró su gasto diario, en
soles. Los resultados se muestran a continuación:

Gasto diario (soles) 40 35 32 48 25 25 30 33 42 50

Calcule e interprete la media del gasto diario de Carlos.


Estadística para Comunicadores 2020 01 43
3. A continuación, se presenta la información de una muestra de empleados de la compañía A.

Empleado Ingreso mensual (soles) Experiencia laboral (años)


1 2020 4,6
2 3410 8,8
3 1967 2,1
4 1630 1,2
5 2502 5,2
6 1677 1,1
7 4286 4,9
8 2952 2,8

Calcule e interprete el valor de la media de cada una de las variables.

Variable Valor Interpretación

Ingreso mensual, en
soles

Experiencia laboral,
en años
Estadística para Comunicadores 2020 01 44

Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto.
El 50% de las observaciones son menores o iguales a la mediana.

El 50% de las observaciones son El 50% de las observaciones son


menores o igual a la mediana. mayores a la mediana.

Mínimo Mediana Máximo

Cálculo de la mediana

Si i es un valor decimal, se
redondea. El valor entero
inmediato mayor que i indica la
Calcule la posición i de la posición de la mediana.
mediana usando la
Se ordenan los datos
siguiente fórmula: i = 0,5n
en orden ascendente.
donde n es el tamaño de
muestra Si i es un valor entero, la
mediana es el promedio de los
valores de los datos ubicados en
los lugares i e i+1.

Características de la mediana
 Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
 El valor de la mediana depende del número de datos observados.
 La mediana es un estadístico que no se ve afectado por valores extremos (mínimo y máximo). Por
eso se le utiliza cuando hay datos inusuales o el polígono de frecuencias no es simétrico.
Ejemplo
La siguiente información corresponde al número de notas publicadas por un grupo de periodistas del
diario Popular durante el último mes.

Diario Popular
12 9 8 11 10 16 14 7 10 10 6 13
Calcule e interprete el valor de la mediana del número de notas publicadas por los periodistas del
diario Popular.
Solución
10+10
Ordenando los datos. Como n = 12, entonces i = 0,5 x 12 = 6. Como i es entero, entonces Me = .
2
6 7 8 9 10 10 10 11 12 13 14 16
Mediana = 10
Estadística para Comunicadores 2020 01 45
Interpretación: El 50% de los periodistas del diario Popular publicaron, durante el último mes, como
máximo diez notas periodísticas.
Estadística para Comunicadores 2020 01 46

Ejercicios
1. La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más importante
de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación Internacional
de Voleibol (FIVB). En la figura se muestra algunas jugadoras de la selección de República Dominicana.
Calcule e interprete la mediana de la estatura de estas jugadoras.

Solución
Primero, …………………………….………………………………………………

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15


Estatura 16 18 17 18 17 5 12 19 14 17 14 10 21

Luego, calculamos la posición de la mediana.

Finalmente, calculamos e interpretemos el valor de la mediana.


Estadística para Comunicadores 2020 01 47
2. Carlos estudia por las mañanas en la UPC en la facultad de Comunicaciones y por las tardes
trabaja en un diario local. En una muestra de 10 días del mes enero y siete del mes de febrero
registró su gasto diario, en soles. Los resultados se muestran a continuación:

Gasto diario enero 40 35 32 48 25 25 30 33 42 50


Gasto diario febrero 27 35 32 48 25 25 30

Calcule e interprete el valor de la mediana del gasto diario de enero y febrero.

Gasto diario enero


Gasto diario febrero

Meses Valor de la variable Interpretación

Enero

Febrero

3. A continuación, se presenta la información de la experiencia laboral, en años, de una muestra de


nueve empleados la editorial Kero y seis empleados de la editorial Esparta.

Experiencia laboral en Kero 10,5 6,3 2,5 1,2 3,4 4,9 7,8 5,5 0,9
Experiencia laboral en Esparta 4,6 8,8 2,1 1,2 5,2 1,1

Calcule e interprete el valor de la mediana de la experiencia laboral para cada editorial.

Experiencia laboral en Kero

Experiencia laboral en Esparta

Empleados Valor de la variable Interpretación

Editorial
Kero

Editorial
Esparta
Estadística para Comunicadores 2020 01 48

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia. Agrupe los datos de acuerdo con sus respectivas frecuencias, el dato con mayor frecuencia
es la moda.
Características de la moda
 La moda se puede calcular para cualquier escala de medición.
 El valor de la moda no se ve afectada por valores extremos.
 La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o más
de dos modas (multimodal). Algunas series de datos no tienen moda.
 La moda es una medida menos importante que la mediana o la media debido a su ambigüedad.
Ejercicio
A partir del siguiente gráfico, indique el valor de la moda de la variable <material predominante en los
pisos> para el censo del año 2017.

Solución

Ejemplo
La siguiente información corresponde al número de notas publicadas por un grupo de periodistas del
diario Popular durante el último mes:
Diario Popular
12 9 8 10 10 16 14 7 10 10 6 13
Calcule e interprete el valor de la moda del número de notas publicadas por los periodistas del diario
Popular.
Moda = 10
Interpretación: El número de notas publicadas con mayor frecuencia por los periodistas del diario
Popular es igual a diez.
Estadística para Comunicadores 2020 01 49
Estadística para Comunicadores 2020 01 50

Ejercicios
1. La Liga de Naciones de Voleibol Femenino de 2019 fue la segunda edición del torneo anual más importante
de selecciones nacionales de voleibol femenino, el evento fue organizado por la Federación Internacional de
Voleibol (FIVB) y contó con 16 equipos. En la figura se muestra algunas jugadoras de la selección de China.
Calcule e interprete la moda de la estatura de estas jugadoras.

2. Calcule e interprete la moda de la edad de un grupo de trabajadores clasificados por género.

Hombres 35 28 24 35 28 24 35 23 30 20
Mujeres 22 31 20 30 22 27 28 20 34 22

Calcule e interprete la moda de la edad para cada grupo.


Solución
En este caso, la moda de los hombres es igual a ………………….. años y la moda de las mujeres es igual
a ………………………….. años.
Esto significa que……………………………………………………………………………...………………………………………………
…………………………………………………....…………………………………………………………………………………………………...
Estadística para Comunicadores 2020 01 51
3. A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados
de la carrera de Administración.

Estatura
Número Género Edad
(en cm)
1 Femenino 15 154
2 Femenino 19 154
3 Femenino 21 156
4 Femenino 34 184
5 Femenino 21 173
6 Femenino 24 170
7 Femenino 30 176
8 Femenino 26 188
9 Femenino 22 168
10 Masculino 31 161
11 Masculino 31 171
12 Masculino 28 175
13 Masculino 31 187
14 Masculino 28 161
15 Masculino 24 172

Calcule e interprete la moda de la estatura.

Solución

En este caso, el resultado son dos modas, la primera moda es igual a ………………….. cm. y la segunda
moda es igual a ………………………….. cm.

Esto significa que …………………………………………………………………………………………………………………………...


…………………………………………………………………………………………………………………………………………………….....
….…………………………………………………………………………………………………………………………………………………....
Estadística para Comunicadores 2020 01 52

Forma de la distribución de los datos SEMANA 2 SESION 2


Además de las medidas de tendencia central y dispersión, podemos estar interesados en saber la
forma que presenta el conjunto de datos que se está analizando.

 Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la media,
se dice que la distribución es simétrica.
 Si los datos por debajo de la media son más frecuentes que aquellos por encima de la media o
viceversa, se dice que la distribución es asimétrica.

Relación entre media, mediana y moda


Para una distribución unimodal, es decir, que tenga una sola moda, se cumplen de manera general las
siguientes relaciones.

media < mediana < moda media = mediana = moda moda < mediana < media

Sesgo izquierdo o negativo Simetría o sesgo nulo Sesgo derecho o positivo


Datos concentrados en Datos concentrados Datos concentrados en
valores altos alrededor de la media valores bajos

Ejercicio
Indique la forma de la distribución (sesgo positivo o sesgo negativo) que seguramente deben tener las
siguientes variables:

a. Sueldos mensuales en el Perú


Positiv
a

b. Tiempo dedicado en dar el examen final de este curso


Negativ
o

c. Horas de dormir los peruanos


Estadística para Comunicadores 2020 01 53

Ejercicio
Un grupo de alumnos de la facultad de Ciencias de la Comunicación de la carrera de Publicidad se
interesó en analizar el tiempo, en segundos, que tardan las personas en recordar al supermercado
cuyo eslogan es “Precios más bajos siempre”.

Este trabajo se aplicó en el distrito A de la ciudad de Lima, los resultados obtenidos se muestran a
continuación.

Tiempo (en segundos) 9,0 7,8 10,3 9,2 5,6 7,4 7,3 5,0 12,4 5,1 11,8 3,4 5,0

Determine la forma de la distribución de los tiempos de recordación del slogan en este distrito
Presente la gráfica e interprete en términos del problema.
Solución

Media: 7.64 Mediana: 7.4 Moda: 5

11.
Tiempo (en segundos) 3.4 5 5 5.1 5.6 7.3 7.4 7.8 9 9.2 10.3 12.4
8

ASIMETRÍ POSITIV
A A

Ejemplo
Un estudiante de la carrera de Comunicaciones revisó durante 11 días el ranking del Instituto Peruano
de Marketing (IPM) de la industria publicitaria en Internet. A continuación, se presenta el listado que
elaboró de acuerdo con el número de visitas por día a la página web www.netjoven.pe
Número de visitas por
4000 3200 3600 3500 3000 3250 2900 3400 3450 2800 3200
día a la página web
A partir de las medidas de tendencia central indique la relación y grafique
la forma de la distribución del número de visitas.
Solución
La media es 3300, la mediana es 3250 y la moda es 3200.
Estadística para Comunicadores 2020 01 54
Como el valor de la moda = 3200 < mediana = 3250 < media = 3300, entonces la distribución del
número de visitas por día es asimétrica positiva.
Estadística para Comunicadores 2020 01 55

Medidas de posición: Cuantiles

Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos
que comprenden el mismo número de valores.

Percentiles Dividen el conjunto de datos en 100 partes porcentualmente iguales.


(en 100) El percentil k, Pk, es el valor tal que aproximadamente el k% de los datos
ordenados es menor o igual a ese valor y el (100 – k)% de los datos es mayor
a ese valor.

Cuartiles Dividen el conjunto de datos en cuatro partes porcentualmente iguales.


(en 4) Se les denota como Q1, Q2 y Q3 respectivamente.
Su equivalente en percentiles es, respectivamente, P25, P50, P75.

Deciles Dividen el conjunto de datos en 10 partes porcentualmente iguales.


(en 10) Se les denota como D1 , D2, D3, …, D9 respectivamente.
Su equivalente en percentiles es, respectivamente, P10, P20, ..., P90.
Estadística para Comunicadores 2020 01 56

Cálculo de un percentil

Si i es un valor decimal, se
redondea. El valor entero
Calcule la posición i del inmediato mayor que i indica la
percentil usando la posición del percentil.
Se ordenan los datos siguiente fórmula:
en orden ascendente i = kn/100
donde k es el percentil y n Si i es un valor entero, el
es el tamaño de muestra percentil es el promedio de los
valores de los datos ubicados en
los lugares i e i+1

Ejemplo
A continuación, se presentan los sueldos mensuales, en soles, de 12 periodistas.

2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

a. Determine el percentil 25
b. Determine el percentil 85
Solución

Observe que los datos ya se encuentran ordenados.

a. Determine el percentil 25.


i= ( 25100 )×12=3
El valor de i es un número entero, entonces el percentil buscado será el promedio de los valores de
los datos ubicados en los lugares 3 y 4.

P25= ( 2850+2880
2 )=2865
Interpretación: El 25% de los periodistas tiene un sueldo máximo de 2865 soles.

b. Determine el percentil 85.


85
i=( )100
×12=10 , 2

Redondeando a más se tiene que i = 11, por tanto, su valor será P85 = 3130.

Interpretación: El 85% de los periodistas tiene un sueldo máximo de 3130 soles.


Estadística para Comunicadores 2020 01 57

Ejercicio
1. La Copa América 2019 fue la XLVI edición de la principal competencia futbolística entre selecciones de
América del Sur y la más antigua del mundo. El torneo fue organizado por la Conmebol. En la figura se
muestran los datos de algunos jugadores de la selección peruana, que llegó a ser finalista.

Calcule e interprete el percentil 70 del tiempo de minutos disputados estos jugadores en la selección
nacional.
Solución
Primero, …………………………….………………………………………………

Posición 1 2 3 4 5 6 7 8 9 10 11 12


Tiempo 16 18 17 18 17 5 12 19 14 17 14 10

Luego, calculamos la posición del percentil 70.

Finalmente, calculamos e interpretemos el valor del percentil 70.


Estadística para Comunicadores 2020 01 58
2. Una compañía publicitaria solicitó al área de recursos humanos información sobre las ventas (en miles de
soles) obtenidas durante el último mes de los 10 nuevos vendedores. Los datos son:
1300 1210 950 1200 1910 700 1300 1020 1500 870
a. Calcule e interprete el valor del cuartil 1.

b. Calcule e interprete el valor del percentil 80.

c. Calcule e interprete el valor del decil 6.

d. ¿Cuál debe ser el valor de la venta mínima que debe tener el vendedor nuevo para pertenecer al
25% de los que más venden?

e. ¿Cuál debe ser el valor de la venta máxima de un vendedor nuevo para pertenecer al 10% de los
vendedores con las más bajas ventas?
Estadística para Comunicadores 2020 01 59

Medidas de variabilidad o dispersión SEMANA 2 SESIÓN 2

Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero
no indican qué tan cercanos o alejados están los datos de dicho valor central.

Las medidas de variabilidad indican cuán alejados están los valores de una variable del valor que los
representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.

Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de la
medida central, en cambio si la medida de dispersión tiene un valor grande, los datos no están
concentrados alrededor de la medida central.

Las medidas de dispersión son las siguientes:

Rango El rango es la diferencia entre el dato mayor y el dato menor.

Varianza Es el promedio de los cuadrados de las desviaciones de los datos respecto


de su media aritmética.

Desviación Es la raíz cuadrada positiva de la varianza.


estándar

Coeficiente de Indica el porcentaje que es la desviación estándar en comparación con la


variación media.
Estadística para Comunicadores 2020 01 60

Varianza
Se define como el promedio de los cuadrados de las desviaciones de los datos respecto de su media
aritmética.

La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su
media aritmética.

Las unidades de la varianza son las unidades originales de los datos al cuadrado. Por ejemplo, si la
variable tiene unidades cm. entonces la varianza tendrá como unidades cm 2.

Se denota por V(X), 2 (varianza poblacional), s2 (varianza muestral).


N
∑ ( x i−μ )2
σ 2 = i=1
La varianza poblacional se calcula con la siguiente fórmula: N
n
∑ ( xi − x̄ )2
s 2 = i=1
La varianza muestral se calcula con la siguiente fórmula: n−1

Desviación estándar
Es la raíz cuadrada de la varianza.

Las unidades de la desviación estándar son las mismas unidades de la variable. Por ejemplo, si la
variable tiene unidades centímetros, entonces, la desviación estándar tendrá como unidades
centímetros.

Se denota por  (desviación estándar poblacional), s (desviación estándar muestral).


N

La desviación estándar poblacional se calcula con la siguiente fórmula:


σ=
√ ∑ ( x i −μ )2
i =1

n
N

La desviación estándar muestral se calcula con la siguiente fórmula:


Características de la varianza y la desviación estándar
s=

∑ ( x i− x̄ )2
i=1
n−1

 La varianza y la desviación estándar son números reales no negativos.


 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos o atípicos.
 La varianza es expresada en unidades cuadráticas a las unidades originales de los datos, mientras
que la desviación estándar es expresada en las mismas unidades originales de los datos.
Estadística para Comunicadores 2020 01 61
Estadística para Comunicadores 2020 01 62

Ejemplo
Un estudiante de la carrera de Comunicaciones revisó durante once días el ranking del Instituto
Peruano de Marketing (IPM) de la industria publicitaria en Internet. A continuación, se presenta el
listado que elaboró de acuerdo con el número de visitas por día a la página web: www.netjoven.pe
Número de visitas por día a
4000 3200 3600 3500 3000 3250 2900 3400 3450 2800 3200
la web www.netjoven.pe

Además, la cantidad de visitas a la página web www.mujeractiva.com se presenta a continuación:


Número de visitas por día a la 320 430
4700 4400 4200 4200 4200 4100 4100 4300
web www.mujeractiva.com 0 0

Calcule el valor de la desviación estándar de ambas páginas web.


Solución
La desviación estándar del número de visitas por día a la web www.netjoven.pe es 342,78 y la
desviación estándar del número de visitas por día a la web www.mujeractiva.com es 383,12.
Ejercicio
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados de
la carrera de Ciencias de la Comunicación.

Nº Género Edad Estatura Nº Género Edad Estatura


1 Masculino 22 154 9 Femenino 33 154
2 Masculino 21 156 10 Femenino 34 184
3 Masculino 21 173 11 Femenino 24 170
4 Masculino 30 176 12 Femenino 27 168
5 Masculino 26 188 13 Femenino 18 182
6 Masculino 31 161 14 Femenino 39 172
7 Masculino 28 173 15 Femenino 33 154
8 Masculino 35 187

Calcule el valor de la desviación estándar de la edad y de la estatura, en centímetros, para cada


género.
Estadística para Comunicadores 2020 01 63

Coeficiente de variación
Las medidas de variación estudiadas son medidas de variación absolutas pues estas se expresan en las
mismas unidades que la variable original (excepto la varianza que se expresa en unidades al cuadrado).

El coeficiente de variación es una medida de dispersión relativa libre de unidades por lo que es útil
para comparar la variabilidad de dos o más grupos de datos expresados en distintas unidades de
medida.

σ
CV = ×100 %
El coeficiente de variación poblacional se calcula por la siguiente fórmula: μ
s
cv= ×100 %
El coeficiente de variación muestral se calcula por la siguiente fórmula: x̄

Características del coeficiente de variación


 Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones estándar no
es muy útil, por ejemplo, cuando las medias están muy distantes.
 El coeficiente de variación se calcula en variables medidas en escala de razón.

Ejercicio
Observe las dos imágenes siguientes.

Tomado de http://gastronomiaycia.republica.com/

Complete los siguientes textos, con respecto a la variabilidad de los tamaños de las manzanas.

 En el grupo de la izquierda hay mayor ……………..…………..……………..………. en el peso de las


manzanas.
 En el grupo de la izquierda hay menor …………………………….………….…………. en el peso de las
manzanas.
 En el grupo de la derecha hay mayor ………………………………..........…………. en el peso de las
manzanas.
 En el grupo de la derecha hay menor ……………………………..……...……………. en el peso de las
manzanas.
Estadística para Comunicadores 2020 01 64
 Seguramente en el grupo de manzanas a la izquierda, el coeficiente de variación del peso de las
manzanas es ……………...……….…….. al coeficiente de variación del grupo a la derecha.
Estadística para Comunicadores 2020 01 65

Ejercicio
1. A continuación, se presenta la información de una muestra aleatoria de 15 profesionales
egresados de la carrera de Ciencias de la Comunicación.

Género Edad Estatura Género Edad Estatura Género Edad Estatura


Masculino 22 154 Masculino 31 161 Femenino 24 170
Masculino 21 156 Masculino 28 173 Femenino 27 168
Masculino 21 173 Masculino 35 187 Femenino 18 182
Masculino 30 176 Femenino 33 154 Femenino 39 172
Masculino 26 188 Femenino 34 184 Femenino 33 154

Solución

a. ¿Qué género presenta mayor variabilidad en la estatura?

Género Promedio Desviación estándar Coeficiente de variación

Masculino

Femenino

Por lo tanto, el género que presenta mayor variabilidad es……………………………………………..….. porque

………………………………………………………………………………………………………………………………………………………….

b. ¿Qué género presenta menor dispersión en la edad?

Género Promedio Desviación estándar Coeficiente de variación

Masculino

Femenino

Por lo tanto, el género que presenta menor dispersión es………………………………….…………..….. porque

………………………………………………………………………………………………………………………………….……………………….
Estadística para Comunicadores 2020 01 66

Ejemplo
Un estudiante de la carrera de Comunicaciones revisó durante 11 días el ranking del Instituto Peruano
de Marketing (IPM) de la industria publicitaria en Internet. A continuación, se presenta el listado que
elaboró de acuerdo con el número de visitas por día a la página web www.netjoven.pe
Número de visitas por día a la
4000 3200 3600 3500 3000 3250 2900 3400 3450 2800 3200
página web www.netjoven.pe

Número de visitas por día a la


3200 4300 4700 4400 4200 4200 4200 4100 4100 4300
página web www.mujeractiva.com

Si decide comparar la cantidad de visitas a la página web www.mujeractiva.com ¿Cuál de las dos
páginas web tiene datos más homogéneos? Justifique numéricamente.

Solución
Páginas web Promedio Desviación estándar Coeficiente de variación
www.netjoven.pe 3300 342,78 10,39%
www.mujeractiva.com 4170 383,12 9,19%

Los datos más homogéneos, en cuanto al número de visitas por día, se encuentra en la página web
www.mujeractiva.com, por tener menor valor de coeficiente de variabilidad.

Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre
dato mayor (Xmax) y el dato menor (Xmin)
R = Xmáx - Xmín

Características del rango


 Se puede calcular en variables medidas en escala de intervalo o razón
 Se ve muy afectado por valores extremos.

Ejemplo
Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las
respuestas mostradas a continuación:
2 1 2 4 1 3 2 3 2 0 5 1
Calcule e interprete el valor del rango.

Solución
El rango R = máximo – mínimo = 5 - 0 = 5. La dispersión para el número de hijos por familia es de cinco
hijos.
Estadística para Comunicadores 2020 01 67
Estadística para Comunicadores 2020 01 68

Ejercicio

Complete la infografía con la siguiente información:

 El percentil 17 de la edad de los trabajadores es 25 años


 El percentil 83 de la edad de los trabajadores es 45 años
 El 8% tiene primaria completa o menos, el 10% tiene educación secundaria incompleta, el 65% tienen
secundaria completa y el resto tiene educación superior
 El 18,3% de los trabajadores labora en más de un lugar
 El ingreso mensual de un trabajador peruano está alrededor de 1366 soles
 La mediana del ingreso mensual de un trabajador peruano es 1100 soles
 La moda del ingreso mensual de un trabajador peruano es 895 soles.
 El percentil 25 del número de horas semanales de trabajo es de 48 horas
 El percentil 75 del número de horas semanales de trabajo es de 60 horas
 El 23% no tienen ningún seguro de salud
 El 45% son obreros, el 40% son empleados y el resto tiene otros cargos.
Estadística para Comunicadores 2020 01 69

Ejercicios de aplicación

1. A continuación, se presentan los costos de producción (en dólares) por segundo de animación en
2D del último trabajo encargado a una empresa nacional.

Los datos obtenidos de una muestra de comerciales de TV y otra de películas se muestran a


continuación:

Comerciales de TV 28 25 30 21 27 22 23 29 26 24
Películas 34 33 32 29 36 37 35 34 31  

¿Son los costos de producción por segundo de animación más homogéneos en los comerciales de
TV que en las películas?

2. Los siguientes datos representan resúmenes del puntaje asignado a dos comerciales del mismo
producto.

Medida de resumen Media Mediana Moda Desviación estándar Tamaño de muestra


Comercial 1 5 4 3 1,0 10
Comercial 2 3 4 5 1,6 15

Identifique verdadero (V) o falso (F) según corresponda, de ser falso indique dónde está el error.

a. La forma de la distribución del comercial 2 es asimétrica negativa. Rpta. V


b. Sí la forma de la distribución de uno de los comerciales es asimétrica negativa, entonces quiere
decir que existe mayor concentración de datos con valores bajos. Rpta. F
c. La medida de tendencia central más representativa en el comercial 1 es la mediana.
Rpta. V
d. El puntaje recibido en el comercial 2 es menos disperso que el comercial 1.
Rpta. F

3. Un grupo de alumnos de publicidad se interesó en analizar el tiempo de recordación, en segundos,


que tardan las personas en recordar al supermercado cuyo eslogan es “Precios más bajos siempre”.
Este trabajo se aplicó a tres distritos de Lima. Los resultados obtenidos se muestran a continuación:

Distrito América 9,0 7,80 10,3 9,2 5,6 7,4 7,3 5,0 12,4 5,1 11,8 3,4 5,1

Medida de resumen Media Mediana Moda Desviación estándar Tamaño de muestra

Distrito Esperanza 4,252 4,96 5,10 2,979 17

Distrito Central 5,338 4,85 3,86 2,593 16


Estadística para Comunicadores 2020 01 70
a. Interprete las medidas de tendencia central del tiempo de recordación en el distrito
Esperanza.
b. ¿Qué distrito presenta mayor variabilidad en los tiempos de recordación?
Rpta: El que tenga mayor cv
c. Calcule e interprete el valor del tercer cuartil para el tiempo de recordación del eslogan en el
distrito América. Rpta: Percentil 75
d. ¿Cuál es el tiempo máximo que tardó el 25% de las personas que recordaron más rápidamente
el eslogan en el distrito América? Rpta: Percentil 25
e. Indique la forma de la distribución de los tiempos de recordación en el distrito Central.
Rpta: Asimetría positiva

4. A continuación, se muestran los resultados obtenidos del número de notas publicadas por un grupo
de periodistas de tres diarios locales durante el último mes:

Siglo XXI Actualidad


Media 9,5 Media 13,3
Mediana 10,3 Mediana 12,0
Moda 12,0 Moda 10,0
Varianza 76,110 Varianza 21,952
Tamaño de muestra 10 Tamaño de muestra 15
P20 7,6 P75 16,5
P80 12,0 P25 10,0

Publis 12 9 8 11 10 16 14 7 10 10 6 13

a. ¿Cuál es la distribución del número de notas publicadas por los periodistas del diario
Actualidad? Rpta. Asimetría positiva
b. ¿En cuál de los diarios locales el número de notas publicadas es más homogénea?
Rpta. La que tenga menor cv.
c. ¿Cuál es el mínimo número de notas publicadas por los periodistas del diario Siglo XXI para
pertenecer al 20% de periodistas que más artículos escribe? Rpta: Percentil 80
d. ¿Cuál el máximo número de notas que debe publicar un periodista del diario Publis para
pertenecer al 25% de periodistas con menos notas publicadas ? Rpta: Percentil 75

5. Un joven egresado de la carrera de Ciencias de la Comunicación tiene la invitación laboral de dos


prestigiosas agencias publicitarias internacionales. La agencia A de ellas ofrece sueldos en dólares y
y la agencia B en euros.

Para tomar la decisión de a cuál de ellas aceptar la invitación recopila datos correspondientes a los
sueldos mensuales pagados en cada una de ellas, los mismos que se presentan en la siguiente
tabla:

Media Mediana Moda Desviación estándar Tamaño de muestra


Agencia A 1295,75 1241 1230 436,57 20
Agencia B 1148,80 1180 1400 343,52 15
Estadística para Comunicadores 2020 01 71
Estadística para Comunicadores 2020 01 72
En base a la información anterior, responda las siguientes preguntas:

a. Defina la variable en estudio, determine su tipo y escala de medición.


Rpta: sueldo mensual, cuantitativa continua, razón
b. En la agencia A ¿qué sueldo es el más frecuente? Rpta: 1230
c. ¿Cuánto gana como mínimo el 50% de los empleados con los mejores sueldos de la agencia B?
Rpta: 1180
d. Si se recomienda aceptar la invitación de aquella agencia con sueldos más estables, esto es
con menos riesgos de variación, ¿qué agencia considera usted que conviene elegir?
Rpta: Agencia B

6. La siguiente información corresponde al tiempo de servicio, en meses, de una muestra de


publicistas que laboran en dos conocidas agencias de la capital.

Agencia Media Mediana Moda Desviación estándar Tamaño de muestra


Omega 18,93 14,0 6,0 15,78 16
Sigma 19,64 15,0 11,0 94,284 25

a. Interprete las medidas de tendencia central de la agencia Omega.


b. ¿Qué forma presenta la distribución del tiempo de servicio de los publicistas de la agencia Sigma?
Rpta: El que tenga mayor cv
c. ¿En cuál de las agencias publicitarias el tiempo de servicio es más homogéneo?
Rpta: El que tenga mayor cv
Estadística para Comunicadores 2020 01 73

Tabulaciones cruzadas
También llamadas tablas de contingencia o de doble entrada.
Se usan para resumir de manera simultánea los datos para dos variables.

Título de un gráfico de una tabla cruzada


Si el gráfico presenta las frecuencias absolutas o las frecuencias porcentuales con respecto al total, el
título será:
Distribución de <elementos> según <variable 1> y <variable 2>

Si el gráfico presenta las frecuencias porcentuales con respecto a la variable 2, el título será:
Distribución de <elementos> según <variable 1> por <variable 2>

Ejemplo
Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de residencia.
Los resultados se presentan a continuación:

Distribución de hogares según nivel socioeconómico y área de residencia


Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 15 2 17
Nivel socioeconómico B 48 3 51
Nivel socioeconómico C 105 145 250
Nivel socioeconómico D 94 175 269
Nivel socioeconómico E 38 180 218
Total 300 505 805
Fuente: Empresa A

De la tabla anterior, complete los espacios en blanco:

a. Número de hogares que pertenecen al NSE C o D: ................................


b. Son ............... hogares que pertenecen al NSE C y son del área urbana.
c. Del total de hogares del área rural, el ..........................% son del NSE E.
d. Del total de hogares del NSE D, el .......................% son del área urbana.

Solución
a. Número de hogares que pertenecen al NSE C o NSE D: 519.
b. Son 105 hogares que pertenecen al NSE C y son del área urbana.
c. Del total de hogares del área rural, el 35,64% son del NSE E.
d. Del total de hogares del NSE D, el 34,94% son del área urbana.
Estadística para Comunicadores 2020 01 74

Ejercicios
1. Los directivos de la agencia publicitaria Tres Picos quieren implementar un programa de motivación
para sus trabajadores. Para ello, se solicitó a cada trabajador realizar primero una autoevaluación
(calificación a sí mismo) de su nivel de desempeño profesional en lo que va del año. Los resultados
de una muestra de 120 trabajadores clasificados de acuerdo a su cargo se presentan a
continuación:

Distribución de trabajadores según ………….….……………….. y …………………………………………………………..


Nivel de desempeño profesional Total
Cargo
Excelente Bueno Regular Deficiente
Gerente 0 3 2 0 5
Director de medios 2 2 5 1 10
Planificador 3 6 8 2 19
Jefe de medios 4 15 12 0 31
Redactor 8 29 14 4 55
Total 17 55 41 7 120
Fuente: Agencia Tres Picos

Complete los espacios en blanco:

a. La cantidad de trabajadores que son de redactores o jefes de medios es ……………………………………


b. La cantidad de trabajadores que calificaron su desempeño como mínimo bueno es ……………………
c. Del total de trabajadores, el …………….. % son redactores.
d. Del total de jefe de medios, el …………… % calificaron su desempeño profesional como bueno.
e. Del total que calificaron su desempeño profesional como regular, el ………………% son gerentes.

2. En día 8 de agosto del 2018, el Senado argentino, luego de un largo debate, rechazó el proyecto
para legalizar el aborto hasta la semana 14 que habían aprobado los diputados argentinos en junio
de ese año. El resultado de la votación se muestra a continuación.
Distribución de senadores según sexo y voto respecto al proyecto de legalización del aborto
Sexo En contra A favor Abstención Ausente Total
Hombre 24 17 1 0 42
Mujer 14 14 1 1 30
Total 38 31 2 1 72
Fuente: Diario El País

Complete los espacios en blanco.


a. El número de senadores hombres que votaron en contra del proyecto fue ………………..…………
b. El número de senadoras que votaron a favor del proyecto fue ………………………………
c. El ………….…….% de las senadoras votaron a favor del proyecto.
d. El ………………..% de los senadores que votaron en contra fueron hombres.
Estadística para Comunicadores 2020 01 75

Gráfico de barras comparativas


Presente las tablas relativas con la información de la tabla de doble entrada de frecuencia absoluta.

 Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El
alto de cada barra es proporcional a la frecuencia de cada categoría.

 Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es proporcional a la frecuencia de cada categoría.

 La tabla de doble entrada y su gráfico deben tener el mismo título.

 Una manera ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada


corresponde al total general o si ella corresponde al total de fila o al total de columna.

Distribución de <elementos>según Distribución de <elementos>según


<variable 1>y <variable 2> <variable 1>por <variable 2>

no 100% no 100% 100% 100%100% 100%100%100%


Variable 2

Variable 2

Variable 2

Variable 2
Variable 1 Variable 1 Variable 1 Variable 1

Todas lasfrecuenciasjuntassuman Encadagrupoocolumna, lasfrecuencias


no 100% suman 100%
Barras Barras Barras agrupadas Barrasapiladas
agrupadas apiladas al 100% al 100%

Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El
alto de cada barra es proporcional a la frecuencia de cada categoría.

Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es proporcional a la frecuencia de cada categoría.

Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es el mismo para cada categoría.
Estadística para Comunicadores 2020 01 76

Ejemplo
Distribución de trabajadores según su función y relación con la gerencia
Relación con la gerencia
Total general
Función Buenas Regulares Malas
Apoyo/adm. 18 2 20
Obrero 10 29 20 59
Profesional 11 6 17
Técnico/ventas 19 7 26
Total general 58 44 20 122
Fuente: Empresa A

Las tablas de frecuencias relativas y sus respectivos gráficos se muestran a continuación:


Con respecto al gran total
Distribución de trabajadores según su función y relación con la gerencia
Relación con la gerencia
Total general
Función Buenas Regulares Malas
Apoyo/adm. 14.75% 1.64% 0.00% 16.39%
Obrero 8.20% 23.77% 16.39% 48.36%
Profesional 9.02% 4.92% 0.00% 13.93%
Técnico/ventas 15.57% 5.74% 0.00% 21.31%
Total general 47.54% 36.07% 16.39% 100.00%
Fuente: Empresa A

Distribución de trabajadores según su función y relación con la gerencia

25% 24%
Porcentaje de trabajadores

20%
16%
16%
15% Buenas
15%
Regulares
Malas
10% 9%
8%
6%
5%
5%
2%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas
Función

Interpretación
 Del total de trabajadores, el 16,4% son de Apoyo/adm.
 Del total de trabajadores, el 47,5% manifestaron tener una buena relación con la gerencia.
 Del total de trabajadores, el 23,8% son obreros y manifestaron tener una regular relación con la
gerencia.
Estadística para Comunicadores 2020 01 77

Con respecto al total de columnas


Distribución de trabajadores según su función por tipo de relación con la gerencia
Relación con la gerencia
Función
Buenas Regulares Malas
Apoyo/adm. 31,03% 4,55% 0,00%
Obrero 17,24% 65,91% 100,00%
Profesional 18,97% 13,64% 0,00%
Técnico/ventas 32,76% 15,91% 0,00%
Total general 100,00% 100,00% 100%
Distribución de trabajadores según su función por tipo de relación con la gerencia
100%
100%
Porcentaje de trabajadores

90%
80%
66% Apoyo/adm.
70%
60% Obrero
50% Profesional
40% 31% 33% Técnico/ventas
30%
20%
17% 19% 14% 16%
10% 5%
0%
Buenas Regulares Malas
Relación con la gerencia

 Del total de trabajadores que tienen una buena relación con la gerencia, el 31% son de Apoyo/adm.
 Del total de trabajadores que tienen una mala relación con la gerencia, el 100% son obreros.

Con respecto al total de filas


Distribución de trabajadores según relación con la gerencia por función
Relación con la gerencia
Función Total general
Buenas Regulares Malas
Apoyo/adm. 90,00% 10,00% 0,00% 100,00%
Obrero 16,95% 49,15% 33,90% 100,00%
Profesional 64,71% 35,29% 0,00% 100,00%
Técnico/ventas 73,08% 26,92% 0,00% 100,00%

Distribución de trabajadores según su relación con la gerencia por función


100% 90%
Porcentaje de trabajadores

90%
80% 73%
70% 65%
Buenas
60% 49%
50% Regulares
40% 34% 35% Malas
30% 27%
20% 17%
10%
10%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas
Función

 Del total de trabajadores de Apoyo/adm., el 90% tiene una buena relación con la gerencia.
 Del total de obreros, el 17% tiene una buena relación con la gerencia.
Estadística para Comunicadores 2020 01 78

Ejemplo
Un productor musical ha entrevistado a 425 personas haciéndolas oír una canción y pidiéndoles que la
identifiquen. Haga el gráfico de barras apiladas considerando el gran total 100%.
Distribución de personas según género musical y grado de identificación del candidato
Género musical preferido Plenamente Medianamente No identifica Total
Reggaetón 35% 3% 4% 42%
Vals 23% 7% 6% 36%
Cumbia 13% 8% 1% 22%
Total 71% 18% 11% 100%
Fuente: Productor musical

Distribución de personas según género musical y grado de identificación del candidato


45%
Porcentaje de encuestados

40% 4%
35% 3%
6%
30% No identifica
25% 7%
1% Medianamente
20%
35% 8% Plenamente
15%
10% 23%
5% 13%
0%
Reggaeton Vals Cumbia
Género musical

Ejemplo
Para realizar un gráfico apilado al 100% con respecto a género musical preferido (fila).

Distribución de personas según identificación del candidato por género musical


Género musical preferido Plenamente Medianamente No identifica Total
Reggaetón 84% 7% 9% 100%
Vals 63% 19% 18% 100%
Cumbia 59% 37% 4% 100%
Fuente: Productor musical

Distribución de personas según identificación del candidato por género musical


100%
Porcentaje de encuestados

9% 4%
90% 7% 18%
80% 37%
70% 19%
60% No identifica
50% Medianamente
40% 84% Plenamente
30% 63% 59%
20%
10%
0%
Reggaeton Vals Cumbia
Género musical
Estadística para Comunicadores 2020 01 79

Ejercicios

1. Desde el 20 de noviembre al 11 de diciembre del 2019, alrededor de 14 000 tuits de usuarios


españoles han insultado a a la activista sueca, Greta Thunberg. Ponga título al gráfico.

Título: ………………………………………..………………………….………………………………………………………….

Fuente: https://elpais.com/tecnologia/2019/12/12/actualidad/1576106658_165755.html

2. Se tiene información de una muestra de 805 hogares según nivel socioeconómico y área de
ubicación. Los resultados se presentan a continuación.

a. ¿Cuál es el título que debe llevar tabla anterior?


Título: ………………………………………………………………………………………………………………………..
Área de ubicación
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 15 2 17
Nivel socioeconómico B 48 3 51
Nivel socioeconómico C 105 145 250
Nivel socioeconómico D 94 175 269
Nivel socioeconómico E 38 180 218
Total 300 505 805
Fuente: Empresa de Medios A

a. Interprete, en porcentaje, el valor 145 de la celda sombreada.

con respecto al total


general

con respecto al total


de fila

con respecto al total


de columna
Estadística para Comunicadores 2020 01 80
b. Coloque título en el siguiente gráfico.
Distribución de hogares ……………. nivel socioeconómico ……………. área de ubicación

Fuente: Empresa de Medios A

c. Complete la tabla y el gráfico siguientes.


Distribución de hogares ……………. nivel socioeconómico ……………. área de ubicación
Área de ubicación
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 100%
Nivel socioeconómico B 94,1% 5,9% 100%
Nivel socioeconómico C 42,0% 58,0% 100%
Nivel socioeconómico D 34,9% 65,1% 100%
Nivel socioeconómico E 17,4% 82,6% 100%
Total 37,3% 62,7% 100%
Fuente: Empresa de Medios A

………………………………………………………………………………………………………………………..
100%

90%
80%

70%

60%

50%

40%

30%

20%

10%

0%
Nivel socioeconómico Nivel socioeconómico Nivel socioeconómico Nivel socioeconómico Nivel socioeconómico
A B C D E

d. A partir de la información anterior, complete los siguientes textos.

“Del total de hogares, ……….. de ellos están en zona rural y son de nivel socioeconómico B”
“De los hogares del nivel socioeconómico D, el …….…..% se encuentran en la zona urbana”
“De los hogares, el ………..% son, por lo menos, de nivel socioeconómico B”
Estadística para Comunicadores 2020 01 81

Ejercicios de aplicación

1. La siguiente tabla fue elaborada el Instituto Peruano de Marketing (IPM) y muestra al grupo de
profesionales de Ciencias de la Comunicación del semanario “Ultima Hora”. La clasificación se
realizó de acuerdo a la categoría laboral y nivel salarial. Coloque título a la tabla.
Título: ………………………………………………..……………………………………………………………………………..
  Nivel salarial
Categoría laboral Bajo Medio Alto Total
Jefe de sección 46 54 57 157
Redactor 61 60 23 144
Colaborador 73 47 29 149
Total 180 161 109 450
Fuente: Instituto Peruano de Marketing (IPM)

a. Interprete, en porcentaje, el valor 23 de la celda sombreada, c on respecto al total general, con


respecto al total de fila y con respecto al total de columna
b. Complete la siguiente tabla cruzada para elaborar el siguiente gráfico: Distribución porcentual
de profesionales según nivel salarial por categoría laboral.
Título: …………………….………………………………………………………………………………………………………..

  Nivel salarial
Categoría laboral Bajo Medio Alto Total
Jefe de sección 29,3%
Redactor 42,4%
Colaborador 49,0%
Fuente: Instituto Peruano de Marketing (IPM)

c. Elabore el gráfico para la tabla anterior.

2. Un ejecutivo de la empresa de medios A está interesado en conocer qué medio de comunicación es


más eficiente evaluando el éxito o fracaso de los reportes periodísticos difundidos. La siguiente
tabla resume la información:

Distribución de reportes periodísticos según medio de comunicación y condición de éxito


El reporte tuvo éxito
Total
Medio de comunicación Sí No
Prensa 67 15 82
Radio 12 19 31
Televisión 67 28 95
Total 146 62 208
Fuente: Empresa de Medios A

a. Presente la tabla que tenga el siguiente título: “Distribución de reportes periodísticos según
condición de éxito por medio de comunicación”

b. Elabore el gráfico para la tabla anterior.


Estadística para Comunicadores 2020 01 82
3. La actividad de la animación es la menos arraigada del sector de la producción de entretenimiento. Por ser
transferible culturalmente, es posible tomar contratos desde cualquier parte del mundo. Bajo este contexto,
un equipo de jóvenes profesionales está decidido en enrumbar en la producción de la animación en 2D y 3D.
Sabiendo que el negocio es de escala internacional, uno de los miembros de este equipo propuso realizar un
pequeño estudio sobre el comportamiento del mercado y la competencia al cual se enfrentarían.

La siguiente tabla resume la información presentada en el reporte final donde se muestra la


especialización de un total de 242 producciones y la región de origen:

Título ……………………………………………………………………………………………………………………………………….
Región Películas y TV Juegos en computadora Otros Total
Norteamérica 80 27 10 117
Europa 10 25 18 53
Asia 12 23 37 72
Total 102 75 65 242
Fuente: ……………………………………..………………………

Complete:

 De las producciones que proceden de Asia, las que son especializadas en juegos de computadoras
representan el …………………………%.
 Del total de producciones, ………………………….. proceden de Norteamérica y son especializadas en
juegos de computadoras.
 La moda para el caso de Europa es …………………………………………………………………………………………….
 Coloque el título del siguiente gráfico que fue presentado en el reporte final.

Título ……………………………………………………………………………………………………………………………………….

Fuente: ……………………………………..………………………
Estadística para Comunicadores 2020 01 83

Unidad 2
Probabilidad
y variable aleatoria
Logro
Al término de la unidad 2,
el estudiante aplica
la teoría de la probabilidad
para la toma de decisiones
en base a datos históricos.

Temario
 Probabilidad: Concepto de probabilidad, experimento aleatorio,
espacio muestral y evento. Operaciones con eventos en tablas de
doble entrada.
 Variable aleatoria: Función de densidad y uso de la tabla de la
distribución normal estándar para el cálculo de las probabilidades.
Estadística para Comunicadores 2020 01 84

Unidad 2. Probabilidad y variable aleatoria


Experimento Es un proceso que al ser realizado u observado repetidas veces, bajo las
aleatorio mismas condiciones, genera más de un posible resultado que no puede ser
determinado de antemano.

Experimento Es aquel en el que se puede predecir el resultado de su realización y existe ley


determinista o fórmula matemática que permite explicarlo. Los experimentos de la física son
deterministas. Por ejemplo, el movimiento de caída libre.

Espacio muestral Es el conjunto de todos los posibles resultados que genera un experimento
aleatorio. Se denota mediante el símbolo . Cada elemento del espacio
muestral se denomina punto muestral.

Evento Es todo subconjunto de un espacio muestral. Se denotan por letras


mayúsculas, por ejemplo, A y B.

Probabilidad Es una medida de la posibilidad de ocurrencia de un evento.

Los conceptos probabilísticos se aplican sobre experimentos aleatorios.

Ejemplo
Experimento aleatorio: Lanzar un dado
Espacio muestral: Ω = {1, 2, 3, 4, 5, 6}
Eventos y probabilidades: A = {1} P(A) = n(A) / n(Ω) = 1 / 6 = 0,167
B = {1, 2, 3} P(B) = n(B) / n(Ω) = 3 / 6 = 0,5
C = {2, 4, 6} P(C) = n(C) / n(Ω) = 3 / 6 = 0,5

Eventos mutuamente excluyentes


Diremos que dos eventos, A y B, son mutuamente excluyentes en el mismo espacio muestral si no
pueden ocurrir juntos. Por lo tanto, A y B son eventos excluyentes si y solo si A Ç B = f.

En la teoría de conjuntos los eventos mutuamente excluyentes serían equivalentes a los conjuntos
disjuntos, aquellos que no tienen elementos comunes.
Ejemplo
Sea el experimento : Contar el número de personas atendidas por un banco en un periodo de tiempo.
Sean los eventos:
A:= se atiendan a menos de 20 personas A = { 0, 1, 2,…, 19}
B:= se han atendido exactamente a veinticinco personas B = {25}
Como A Ç B = f, entonces los eventos son mutuamente excluyentes.
Estadística para Comunicadores 2020 01 85

Axiomas de la probabilidad

Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y A un


evento definido en Ω, entonces la probabilidad del evento A, denotada por P(A), es aquel número que
cumple los siguientes axiomas:

 Axioma 1: 0 £P(A) £ 1

 Axioma 2: P(Ω) = 1

 Axioma 3: Si A y B son dos eventos mutuamente excluyentes entonces:

P(A È B) = P(A) + P(B)

Definición clásica de probabilidad


Algunos autores definen la probabilidad como una medida de la posibilidad de ocurrencia de un
evento. La definición clásica propone que si el espacio muestral es numerable y cada punto muestral
tiene la misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento A
definido sobre W es:

n ( A ) Número de casos favorables al evento A


P( A )= =
n ( Ω ) Número de casos totales

Teoremas básicos de probabilidad


 P(f) = 0, donde  es el evento imposible.

 P(A) = 1 – P(AC)

 Si A y B son eventos cualesquiera, entonces

P(A È B) = P(A) + P(B) – P(A Ç B)


Estadística para Comunicadores 2020 01 86

Ejemplo

Una empresa investigadora de mercados, por encargo de un cliente, realizó un estudio acerca de las
preferencias del turismo interno que realizan los universitarios. La empresa realizó una encuesta a 220
alumnos de diversas universidades nacionales y privadas; registrándose la condición de la universidad
y la región de preferencia para un posible viaje.

Los resultados se muestran en la siguiente tabla:

Condición de Región de preferencia


universidad Costa (A) Sierra (B) Selva (C) Total
Nacional (D) 8 15 60 83
Privada (E) 12 25 100 137
Total 20 40 160 220

Se elige un alumno al azar, determine la probabilidad de que:


a. prefiera viajar a la sierra.
b. no estudie en una universidad privada.
c. no tenga preferencia por viajar a la selva y estudie en una universidad nacional.
d. prefiera viajar a la sierra o estudie en una universidad privada.

Para cada pregunta formalice las probabilidades con los eventos

Solución
a. prefiera viajar a la sierra.
40
P(B )= =0 , 1818
220

b. no estudie en una universidad privada.


83
P( Ec )=P( D )= =0 ,3772
220

c. no tenga preferencia por viajar a la selva y estudie en una universidad nacional.

8+15
P(C c∩D )= =0 ,1045
220

d. prefiera viajar a la sierra o estudie en una universidad privada


40 137 25 152
P(B∪E )= + − = =0 , 6909
220 220 220 220
Estadística para Comunicadores 2020 01 87

Ejercicios
1. El director de mercadotecnia de un diario metropolitano estudia la relación entre el tipo de
comunidad donde vive el lector y la sección del periódico que lee primero. Para una muestra de
lectores se obtuvo la siguiente información:

Historietas cómicas
Comunidad Noticias nacionales (N) Deportes (D) Total
(H)
Urbana (U) 170 124 90 384
Rural (R) 120 112 100 332
Total 290 236 190 716

Si se selecciona un lector al azar, calcule la probabilidad de que:


a. viva en una comunidad rural.
b. viva en una comunidad urbana y la sección del periódico que lee primero sea noticias
nacionales.
c. la primera sección del periódico que lee primero sean las noticias nacionales o las historietas
cómicas.
d. la primera sección del periódico que lea sea deportes o viva en una zona rural.
e. viva en la comunidad rural y la primera sección del periódico que lee no sea deportes .
Solución
a. viva en una comunidad rural.
P(………………….……….) = …………………………………………………………….……………………….

b. viva en una comunidad urbana y la sección del periódico que lee primero sea noticias nacionales.
Sea el evento ……… : ……………………………………………………………….……………………………….
Sea el evento ……… : ……………………………………………………………….……………………………….
P(………………….……….) = …………………………………………….…………………….……………………….

c. la primera sección del periódico que lee primero sean las noticias nacionales o las historietas
cómicas.
Sea el evento ……… : ……………………………………………………………….……………………………….
Sea el evento ……… : ……………………………………………………………….……………………………….
P(………………….……….) = …………………………………………….…………………….……………………….

d. la primera sección del periódico que lea sea deportes o viva en una zona rural.
Sea el evento ……… : ……………………………………………………………….……………………………….
Sea el evento ……… : ……………………………………………………………….……………………………….
P(………………….……….) = …………………………………………….…………………….……………………….

e. viva en la comunidad rural y la primera sección del periódico que lee no sea deportes.
Sea el evento ……… : ……………………………………………………………….……………………………….
Sea el evento ……… : ……………………………………………………………….……………………………….
Estadística para Comunicadores 2020 01 88
P(………………….……….) = …………………………………………….…………………….……………………….
Estadística para Comunicadores 2020 01 89
2. Se seleccionó una muestra aleatoria de trabajadores de la editorial Óptima para determinar sus
planes de jubilación después de cumplir los 65 años. Los trabajadores en la muestra se dividieron
en: ejecutivos, empleados y obreros. Los resultados obtenidos fueron:

Planes después de los 65 años


Trabajador
Se jubile (D) No se jubile (E) No ha decidido su jubilación (F) Total
Ejecutivo (A) 8 3 1 12
Empleado (B) 20 10 5 35
Obrero (C) 50 22 11 83
Total 78 35 17 130

Si se selecciona un trabajador al azar.


a. ¿Cuál es la probabilidad de que se jubile del trabajo?
b. ¿Cuál es la probabilidad de que se no se jubile y sea ejecutivo?
c. ¿Cuál es la probabilidad de que no haya decidido su jubilación o no sea obrero?
d. ¿Cuál es la probabilidad de que se jubile o no haya decidido su jubilación?

Solución
a. ¿Cuál es la probabilidad de que se jubile del trabajo?

Sea el evento ……… : ……………………………………………………………….……………………………….

P(………………….……….) = …………………………………………………………….……………………….

b. ¿Cuál es la probabilidad de que no se jubile y sea ejecutivo?

Sea el evento ……… : ……………………………………………………………….……………………………….

Sea el evento ……… : ……………………………………………………………….……………………………….

P(………………….……….) = …………………………………………………………….……………………….

c. ¿Cuál es la probabilidad de que no haya decidido su jubilación o no sea obrero?

Sea el evento ……… : ……………………………………………………………….……………………………….

Sea el evento ……… : ……………………………………………………………….……………………………….

P(………………….……….) = …………………………………………………………….……………………….

d. ¿Cuál es la probabilidad de que se jubile o no haya decidido su jubilación?

P(………………….……….) = …………………………………………………………….……………………….
Estadística para Comunicadores 2020 01 90
3. Trescientas personas se han presentado para una oferta laboral. La siguiente tabla muestra algunas
características de estas personas:

Experiencia Nivel de instrucción


Género previa Secundaria (S) Técnica (T) Universitaria (U)
Masculino Sin 35 38 13
(M) Con 10 30 18
Femenino Sin 40 37 8
(F) Con 12 42 17

Si se selecciona una persona al azar,


a. ¿Cuál es la probabilidad de que tenga instrucción técnica?
b. ¿Cuál es la probabilidad de que sea una persona con instrucción técnica y sin experiencia?
c. ¿Cuál es la probabilidad de que no sea universitario?
d. ¿Cuál es la probabilidad de que sea un hombre?
e. ¿Cuál es la probabilidad de que sea una mujer o no tenga experiencia previa?

Solución
a. ¿Cuál es la probabilidad de que tenga instrucción técnica?

Sea el evento ……… : ……………………………………………………………….……………………………….


P(………………….……….) = …………………………………………….…………………….……………………….

b. ¿Cuál es la probabilidad de que sea una persona con instrucción técnica y sin experiencia?

Sea el evento ……… : ……………………………………………………………….……………………………….


Sea el evento ……… : ……………………………………………………………….……………………………….
P(………………….……….) = …………………………………………….…………………….……………………….

c. ¿Cuál es la probabilidad de que no sea universitario?


Sea el evento ……… : ……………………………………………………………….……………………………….
P(………………….……….) = …………………………………………….…………………….……………………….

d. ¿Cuál es la probabilidad de que sea un hombre?


Sea el evento ……… : ……………………………………………………………….……………………………….
P(………………….……….) = …………………………………………….…………………….……………………….

e. ¿Cuál es probabilidad de que sea una mujer o no tenga experiencia previa?

Sea el evento ……… : ……………………………………………………………….……………………………….

Sea el evento ……… : ……………………………………………………………….……………………………….


P(………………….……….) = …………………………………………………………….……………………….
Estadística para Comunicadores 2020 01 91

Ejercicios de aplicación

1. Se llevó a cabo un estudio de satisfacción del servicio de cafetería entre los estudiantes de la
universidad, entre estudiantes de las facultades de Administración, Ingeniería, Derecho y
Arquitectura. La satisfacción del servicio se midió en una escala de 1-100. Los datos se resumen en
la siguiente tabla.
Calificación de la satisfacción Total
Ocupación Menos de 50 [50-59] [60-69] [70-79] [80-89]
Administración 10 21 22 11 11
Arquitectura 16 23 24 13 10
Derecho 10 24 20 10 13
Ingeniería 12 20 25 14 12
Total
Si se selecciona al azar a un estudiante que participó en el estudio, calcule la probabilidad de que:
a. haya dado un puntaje de 70 o más? Rpta: 0,2928
b. haya dado un puntaje de 50 a 59 y que estudie Derecho? Rpta: 0,0748
c. haya dado un puntaje menor a 60 o estudie Administración? Rpta: 0,5607
d. haya dado un puntaje que no sea menor a 60 y estudie Arquitectura? Rpta: 0,1464
2. En la siguiente tabla se muestra la distribución de una muestra de 200 empleados de una empresa
según su género, estado civil y opinión respecto al ambiente laboral.
Femenino (F) Masculino (N)
Total
Opinión Soltero Casado Divorciado Soltero Casado Divorciado
Buena (B) 25 9 6 35 6 10 91
Regular (R) 4 22 7 11 21 3 68
Mala (M) 2 5 15 3 7 9 41
Total 31 36 28 49 34 22 200
Si se selecciona un empleado al azar, calcule la probabilidad de que:
a. su opinión con respecto al ambiente laboral no sea mala. Rpta: 0,795
b. sea una mujer soltera. Rpta: 0,155
c. tenga una buena opinión del ambiente laboral y sea un hombre soltero. Rpta: 0,175
d. sea hombre divorciado y tenga una mala opinión del ambiente laboral. Rpta: 0,045
3. Cada año, en nuestro país se denuncian alrededor de siete mil violaciones y cerca de 100 mil casos
de violencia familiar. Al seleccionar una muestra de mujeres y preguntarles ¿qué tipo de violencia
sufrió?, ¿cuál es su estado civil? y ¿tiene hijos? La información se presenta en la siguiente tabla:
Soltera (E) Casada (F) Total
Tipo de violencia Sin hijos (G) Con hijos (H) Sin hijos (G) Con hijos (H)
Abuso sexual (A) 22 35 42 18 117
Maltrato físico (B) 26 52 44 50 172
Maltrato psicológico (C) 36 28 38 45 147
Otros (D) 15 10 12 27 64
Total 99 125 136 140 500
Si se selecciona al azar a una mujer, calcule la probabilidad de que:
a. no tenga hijos y no haya sufrido abuso sexual. Rpta: 0,342
b. sea casada con hijos o haya sufrido un maltrato psicológico. Rpta: 0,484
Estadística para Comunicadores 2020 01 92
4. El portal web Ponte en Carrera clasificó a una muestra aleatoria de jóvenes que trabajan de
acuerdo a su nivel educativo alcanzado y su condición de empleo. Los resultados se muestran a
continuación:

Nivel de educación alcanzado


Condición de empleo
Primaria (A) Secundaria (B) Superior (C) Total
Formal a tiempo completo (T) 12 35 32 79
Formal a tiempo parcial (P) 18 42 28 88
Informal (I) 35 28 10 73
Total 65 105 70 240

Si se selecciona al azar un joven que trabaja, calcule la probabilidad de que:

a. tenga educación superior. Rpta: 0,2917


b. empleo informal y tenga educación superior. Rpta: 0,0417
c. tenga empleo formal a tiempo parcial o empleo formal a tiempo completo. Rpta: 0,6958
d. Sean los eventos, P = empleo formal a tiempo parcial y T = empleo formal a tiempo completo
¿son estos eventos mutuamente excluyentes? Justifique. Rpta: Sí

5. Se realizó el resumen de la información presentada por la empresa Ipsos Perú, sobre el tipo de
asalto y el distrito de residencia con la finalidad de poder tomar decisiones acerca de qué distrito
necesita mayor presencia policial. La información se presenta en la siguiente tabla:

Tipo de asalto
Robo de cartera Robo de laptop Otro(G
Robo de celular (E)
Distrito (D) (F) ) Total
Los Olivos (A) 120 80 20 10 230
La Molina (B) 30 50 40 5 125
Surco (C) 70 40 55 20 185
Total 220 170 115 35 540

Si se selecciona al azar a un encuestado, calcule la probabilidad de que el encuestado:

a. no haya sido víctima de robo de cartera. Rpta: 0,5926


b. haya sido víctima de robo de cartera y que viva en La Molina. Rpta: 0,0556
c. haya sufrido el robo de su laptop y no viva en Surco. Rpta: 0,1111
d. no haya sufrido robo de su celular o no resida en La Molina. Rpta: 0,9074
e. haya sufrido el robo de su cartera o resida en Surco. Rpta: 0,6204
1.
Estadística para Comunicadores 2020 01 93

Variable aleatoria

Sea  un experimento aleatorio y W el espacio muestral asociado. Una variable aleatoria es una
descripción numérica del resultado de un experimento.
Una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales. El valor
numérico de la variable aleatoria depende del resultado del experimento.
Una variable aleatoria puede ser discreta o continua, depende del tipo de valores numéricos que
asuma.
Las variables aleatorias se designan por letras mayúsculas (X, Y, Z, etc.), y a sus valores por letras
latinas minúsculas.

Rango o recorrido
Se denomina así al conjunto de valores posibles que asume la variable aleatoria X. Se denota por RX.

Variable aleatoria continua: Distribución normal


Es la distribución de probabilidad más usada para describir variables aleatorias continuas.
Por ejemplo, se modela con variable normal, el peso, en kilogramos o estatura, en centímetros
Función de densidad de probabilidad normal

Se dice que la variable aleatoria X sigue una distribución normal con parámetros  y 2.
Se denota por X ~ N (, 2)
Características
 La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de
tendencia central coinciden. El punto más alto se encuentra sobre la media.
 El rango de la variable normal es toda la recta real, esto es, de – a + .
 Las colas nunca chocan con el eje horizontal, X.
 Si el valor de la desviación estándar es grande
implica mayor dispersión en los datos
 Toda el área bajo la curva normal es igual a uno.
Como la distribución es simétrica significa que el
área a la derecha de la media es igual a 0,50 y el
área a la izquierda de la media es también igual a
0,50.
Estandarización
Se toma como referencia una distribución normal estándar (  = 0 y 2 = 1). Se trabaja con la distancia
entre x y  en función de la desviación estándar, tal como se muestra.
X−μ
Z=
σ
Notación:
Z ~ N(0,1) y se lee: La variable aleatoria Z tiene distribución normal estándar con media igual a 0 y
varianza igual a 1.
Estadística para Comunicadores 2020 01 94

Función acumulada: F(z) = P(Z  z)

La distribución de la variable Z se encuentra tabulada en la tabla de la normal estándar. A


continuación, se presentan los diversos casos:

Caso 1 Caso 2 Caso 3


P(Z < a) P(Z ≥ a) = 1 - P(Z < a) P(a < Z < b) = P(Z < b) - P(Z < a)

Ejemplo

1. Dada una distribución normal estandarizada.

a. ¿Cuál es la probabilidad de que Z sea menor a 1,54?

b. ¿Cuál es la probabilidad de que Z mayor a -1,27?

c. ¿Cuál es la probabilidad de que Z entre -1,21 y 2,00?

d. ¿Cuál será el valor máximo de Z tal que el 63,307% de los valores son menores a Z?
Estadística para Comunicadores 2020 01 95
TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal: P (Z ≤ z) = 

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
-3,9 33 34 36 37 39 41 42 44 46 48
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
-3,8 50 52 54 57 59 62 64 67 69 72
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0001
-3,7 75 78 82 85 88 92 96 00 04 08
0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,6 12 17 21 26 31 36 42 47 53 59
0,0001 0,0001 0,0001 0,0001 0,0001 0,0002 0,0002 0,0002 0,0002 0,0002
-3,5 65 72 78 85 93 00 08 16 24 33
0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0003 0,0003 0,0003 0,0003
-3,4 42 51 60 70 80 91 02 13 25 37
0,0003 0,0003 0,0003 0,0003 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004
-3,3 49 62 76 90 04 19 34 50 66 83
0,0005 0,0005 0,0005 0,0005 0,0005 0,0005 0,0006 0,0006 0,0006 0,0006
-3,2 01 19 38 57 77 98 19 41 64 87
0,0007 0,0007 0,0007 0,0007 0,0008 0,0008 0,0008 0,0009 0,0009 0,0009
-3,1 11 36 62 89 16 45 74 04 35 68
0,0010 0,0010 0,0010 0,0011 0,0011 0,0011 0,0012 0,0012 0,0013 0,0013
-3,0 01 35 70 07 44 83 23 64 06 50
                     
0,0013 0,0014 0,0014 0,0015 0,0015 0,0016 0,0016 0,0017 0,0018 0,0018
-2,9 9 4 9 4 9 4 9 5 1 7
0,0019 0,0019 0,0020 0,0021 0,0021 0,0022 0,0023 0,0024 0,0024 0,0025
-2,8 3 9 5 2 9 6 3 0 8 6
0,0026 0,0027 0,0028 0,0028 0,0029 0,0030 0,0031 0,0032 0,0033 0,0034
-2,7 4 2 0 9 8 7 7 6 6 7
0,0035 0,0036 0,0037 0,0039 0,0040 0,0041 0,0042 0,0044 0,0045 0,0046
-2,6 7 8 9 1 2 5 7 0 3 6
0,0048 0,0049 0,0050 0,0052 0,0053 0,0055 0,0057 0,0058 0,0060 0,0062
-2,5 0 4 8 3 9 4 0 7 4 1
0,0063 0,0065 0,0067 0,0069 0,0071 0,0073 0,0075 0,0077 0,0079 0,0082
-2,4 9 7 6 5 4 4 5 6 8 0
0,0084 0,0086 0,0088 0,0091 0,0093 0,0096 0,0099 0,0101 0,0104 0,0107
-2,3 2 6 9 4 9 4 0 7 4 2
0,0110 0,0113 0,0116 0,0119 0,0122 0,0125 0,0128 0,0132 0,0135 0,0139
-2,2 1 0 0 1 2 5 7 1 5 0
0,0142 0,0146 0,0150 0,0153 0,0157 0,0161 0,0165 0,0170 0,0174 0,0178
-2,1 6 3 0 9 8 8 9 0 3 6
0,0183 0,0187 0,0192 0,0197 0,0201 0,0206 0,0211 0,0216 0,0222 0,0227
-2,0 1 6 3 0 8 8 8 9 2 5
                     
0,0233 0,0238 0,0244 0,0250 0,0255 0,0261 0,0268 0,0274 0,0280 0,0287
-1,9 0 5 2 0 9 9 0 3 7 2
0,0293 0,0300 0,0307 0,0314 0,0321 0,0328 0,0336 0,0343 0,0351 0,0359
-1,8 8 5 4 4 6 8 2 8 5 3
0,0367 0,0375 0,0383 0,0392 0,0400 0,0409 0,0418 0,0427 0,0436 0,0445
-1,7 3 4 6 0 6 3 2 2 3 7
Estadística para Comunicadores 2020 01 96
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
                     
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Estadística para Comunicadores 2020 01 97
TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal: P (Z ≤ z) = 

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
                     
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
                     
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
                     
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Estadística para Comunicadores 2020 01 98
2. La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una variable
aleatoria normal con una media igual a 500 soles y una desviación estándar igual a 60 soles.

Solución
La variable en estudio es …...……………………………………………..……………………………………….……..

Sus parámetros son:  = ……………………..……………..……. y 2 = ………………………..………………….


a. Si se escoge a un cliente al azar ¿cuál es la probabilidad que ahorre menos de 520 soles al
mes?

b. Si se escoge a un cliente al azar ¿cuál es la probabilidad que ahorre más de 560 soles al mes?

c. Si se escoge a un cliente al azar ¿cuál es la probabilidad que ahorre entre 420 y 540 soles?

d. Calcule el ahorro mínimo para estar en el 30% de los que más ahorran.
Estadística para Comunicadores 2020 01 99
3. El pago diario de los corresponsales de una cadena de televisión se modela con una variable normal
con una media de 12 dólares y una desviación estándar de 0,75 dólares.
Solución
La variable en estudio es …...……………………………………………..……………………………………….……..

Sus parámetros son:  = ……………………..……………..……. y 2 = ………………………..………………….


a. ¿Qué porcentaje de corresponsales reciben pagos diarios menores de 12,5?

b. ¿Qué porcentaje de corresponsales reciben pagos diarios mayores a 12,25?

c. ¿Qué porcentaje de corresponsales reciben pagos diarios entre 12,5 y 13,5?

d. ¿Cuál debe ser el pago mínimo para estar en el 20% de los corresponsales que más ganan?

e. ¿Cuál debe ser el pago máximo para estar en el 20% de los corresponsales que menos ganan?
Estadística para Comunicadores 2020 01 100
4. El consumo mensual de energía eléctrica de los hogares, en kilowatts, de una ciudad tiene
distribución normal con media de 160 kW y con una desviación estándar de 35 kW.
Solución
La variable en estudio es …...……………………………………………..……………………………………….……..

Sus parámetros son:  = ……………………..……………..……. y 2 = ………………………..………………….

a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 170 kW?

b. ¿Qué porcentaje de hogares registran un consumo entre 110 y 190 kW?

c. Calcule el consumo mínimo de energía eléctrica para estar en el 10% de los mayores consumidores.
Estadística para Comunicadores 2020 01 101
5. Suponga que el tiempo que emplean los suscriptores de la revista B&C en leer la publicación tiene
distribución normal con media de 49 minutos y desviación estándar de 16 minutos.
a. ¿Cuál es la probabilidad de que un suscriptor seleccionado al azar tarde por lo menos una hora
en leer la publicación?
Solución
Primero definamos la variable X:= tiempo empleado por los suscriptores de la revista B&C en leer
la publicación.

X  N( = 49 , 2 = 162)
Nos pide calcular:
P(X ≥ 60)
Para calcular dicha probabilidad debemos estandarizar la variable X, para ello, restamos la media y
dividimos entre la desviación estándar. Además, la tabla normal solo nos da el área izquierda, así
que debemos calcular la probabilidad usando el complemento.

P ( X≥60 )=1−P ( X <60 )=1−P (16X −49 <60−49


16 )=1−P ( Z <0 , 69)=1−0 , 7549=0 , 2451
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524

b. ¿Cuál es el tiempo máximo que debe emplear un suscriptor de esta revista para pertenecer al
34% de suscriptores que emplean menos tiempo en leer la publicación?

Solución
P(X ≤ Xmáx) = 0,34

Ahora, debemos estandarizar la variable X para poder usar la tabla normal.

X −49 X máx −49 X máx−49


P ( X≤ X máx ) =P ( 16
<
16 ) (
=P Z<
16
=0 ,34 )
Usando la tabla normal, buscamos el valor más cercano a 0,34 dentro de la tabla y salimos hacia los
bordes. En este caso, el valor más cercano es 0,34090 y en los bordes el valor es -0,41

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209

X máx−49
=−0 , 41
Luego, 16 , de donde Xmáx es 42,44 minutos.
Estadística para Comunicadores 2020 01 102

Ejercicios de aplicación

1. El ingreso mensual de los redactores de noticia tiene distribución normal con media $900 y una
desviación estándar de $100.
a. Si se elige al azar un redactor de noticia, ¿cuál es la probabilidad de que su ingreso sea menor
que $800? Rpta: 0,15866
b. Si el 5% de los redactores de noticia con mayores ingresos deben pagar impuestos, ¿a partir de
que ingreso se debe pagar impuestos? Rpta: 1064,49

2. Las puntuaciones de una prueba de aptitud académica tomada a 900 postulantes de una cadena
internacional de noticias están distribuidas normalmente con media de 60 puntos y desviación
estándar de 10 puntos.
a. ¿Qué porcentaje de postulantes obtuvo una puntuación mayor a 75 puntos? Rpta: 6,68%
b. ¿Cuántos postulantes recibieron una puntuación entre 40 y 50 puntos? Rpta: 122
c. Si el 12,3 % de los postulantes con mayor puntuación reciben el calificativo A y el 20% de los
postulantes con menor puntuación reciben el calificativo C. Calcular la mínima puntuación que
debe tener un postulante a esta cadena internacional de noticias para recibir un A y la máxima
puntuación que debe tener un postulante para recibir un calificativo C. Rpta: 71,6;
51,58

3. Una estación de noticias encuentra que el tiempo que los radioescuchas sintonizan la estación sigue
una distribución normal con media de 15 minutos y desviación estándar de 3,5 minutos. Si se elige
un radioescucha al azar:
a. ¿Cuál es la probabilidad sintonice la estación más de 20 minutos? Rpta: 0,07656
b. ¿Cuál es el tiempo máximo para que un radioescucha se encuentre en el 12,1% de
radioescuchas que menos tiempo escuchan esta estación?
Rpta: 10,9

4. Supóngase que los gastos durante un ciclo académico de los estudiantes de diseño publicitario
tienen distribución normal con media de 30 soles y desviación estándar de cinco soles.
a. ¿Cuál es la probabilidad de que un alumno seleccionado al azar haya tenido un gasto superior
a 35 soles? Rpta: 0,15866
b. ¿Cuál es la probabilidad de que un alumno seleccionado al azar haya tenido un gasto entre
27,5 y 32,50 soles? Rpta:
0,38292

5. Las compañías que miden las audiencias de programas de televisión y estaciones de radio para los
anunciantes y transmisoras se conocen como servicios de ratings. Si una de estas compañías
determinó que los puntos de ratings de las ediciones diarias del programa magazín ABC siguen una
distribución normal con media 23,1 puntos y una desviación estándar de 1,6 puntos.
a. Si se selecciona al azar una edición de este programa, ¿cuál es la probabilidad de que su rating
se encuentren entre 21,2 puntos y 25,3 puntos? Rpta: 0,79792
b. ¿Cuánto debe ser el rating mínimo para estar comprendido en el 12.1% de las ediciones de
este programa con mayores puntos de ratings? Rpta: 24,97

6. La duración de un spot publicitario sigue una distribución normal con una media de 48 segundos y
una desviación estándar de 12 segundos.
a. Calcule la probabilidad de que un spot publicitario dure más de 45 segundos. Rpta: 0,59871
Estadística para Comunicadores 2020 01 103
b. ¿Cuál es la duración mínima aproximada que debe tener un spot publicitario para estar dentro
del 18% de los spots que más duran? Rpta: 58,98

7. Se tiene información que los costos de los spots publicitarios realizado por la empresa PubliNegocios se
distribuye normalmente con moda igual a 42 000 dólares y desviación estándar de 3500 dólares.

a. Si se selecciona al azar un spot publicitario elaborado por dicha empresa ¿cuál es la


probabilidad que su costo haya sido menor de 30 000 dólares?
b. ¿Qué porcentaje de los spots publicitarios elaborados por la empresa PubliNegocios tienen
costos entre 41 000 y 43 000 dólares?
c. El 30% de los spots más costos se los va a clasificar como “muy rentables” ¿cuál es el valor
mínimo que debe tener un spot para estar considerado en este grupo?
Estadística para Comunicadores 2020 01 104

Unidad 3

Encuesta y muestreo

Logro
Al término de la unidad 3,
el estudiante aplica
los diferentes tipos de muestreo
para el cálculo de las estimaciones.

Temario
 El estudio estadístico: Pautas para desarrollar un trabajo de
investigación estadístico
 Tamaño de muestra para estimar el promedio y la proporción
 Tipos de muestreo: muestreo probabilístico: muestreo aleatorio
simple, muestreo estratificado y muestreo sistemático
 Muestreo no probabilístico
 Selección de una muestra irrestricta aleatoria
Estadística para Comunicadores 2020 01 105

Unidad 3. Muestreo

Unidad elemental Es el objeto sobre el cual se hace la medición. También llamada unidad de
observación, unidad de análiisis, unidad estadística o elemento. Por ejemplo,
en estudios de poblaciones humanas, con frecuencia ocurre que la unidad
elemental es cada individuo.

Población Es el conjunto de todas las unidades elementales posibles que podrían


muestreada extraerse en una muestra; es decir, es la población de donde se extrae la
muestra.

Unidad de Es la unidad donde realizamos la muestra. Por ejemplo, si queremos estudiar


muestreo a las personas pero no tenemos la lista de todos los individuos que
pertenecen a la población objetivo, la unidad de muestreo sería cada familia
y la unidad elemental sería cada individuo que vive en la familia

Marco Es una lista de las unidades de muestreo que estan disponibles para
muestral elección.

Para las encuestas telefónicas el marco de muestreo podría ser una lista de todos los números
telefónicos residenciales de la ciudad; para las entrevistas personales una lista de las direcciones de
todas las calles; para una encuesta de agricultura una lista de todas las granjas o un mapa con todas las
áreas que contienen granjas.

Población: Todos los niños de una localidad


Marco muestral Unidad de muestreo Unidad elemental Noestán disponibles
Vivienda 1 Una vivienda Un niño para ser elegidos
Vivienda 2
Vivienda 3
Vivienda 4
Vivienda 5

Se eligen Vivienda 1 Vivienda 2 Vivienda 3 Vivienda no está en


algunas el marco muestral
viviendas Se eligen
al azar algunos
niños al
Vivienda 4 Vivienda 5 azar
No tiene vivienda
Estadística para Comunicadores 2020 01 106

Censo
Es una investigación estadística que consiste en el recuento de la totalidad de los elementos que
componen la población por investigar. Es necesario que se especifique el espacio y el tiempo al que se
refiere el recuento.

Por ejemplo, el 22 de octubre del 2017 se realizaron los Censos Nacionales 2017: XII de Población, VII
de Vivienda y III de Comunidades Indígenas. Su finalidad es proveer información sobre la composición,
distribución geográfica y crecimiento de la población, los patrones de la concentración urbana y rural,
las características y servicios básicos de la vivienda para la ejecución de las políticas públicas.

Tomado: http://www.censos2017.pe/etapas-censo/

Muestreo
Cuando se opta por una investigación usando una muestra en vez de la población, el estudio
estadístico comprende por lo menos cuatro etapas:
 Definición de la población objetivo y búsqueda del marco muestral.
 Determinación del tamaño de la muestra.
 Selección de las unidades.
 Registro de las observaciones.

En el curso trabajaremos las dos últimas.


 La selección de las unidades y
 El registro de las observaciones.
Estadística para Comunicadores 2020 01 107
Por ejemplo, la Asociación Peruana de Empresas de Investigación realizaba una encuesta para
determinar el nivel socioeconómico de una persona. Hoy en día, ya no encuesta, si no más bien usa la
Encuesta Nacional de Hogares (ENAHO) realizada por el Instituto Nacional de Estadística e Informática
(INEI).

Niveles socioeconómicos en Lima Metropolitana y Callao

Ficha técnica

Universo de estudio
 Se consideró como universo de estudio a todos los hogares pertenecientes a
Lima Metropolitana entendida como los distritos de Lima ubicados en el
núcleo urbano (sin considerar balnearios) y la Provincia Constitucional del
Callao. Se definió como hogar, al conjunto de personas que, habitando en la
misma vivienda, preparan y consumen sus alimentos en común.

 La persona informante fue el jefe de familia, definido como aquella persona que más
aporta económicamente en el hogar.

Marco muestral
Para el desarrollo de la investigación se consideró como marco muestral:
 La base de datos de viviendas del Instituto Nacional de Estadística e Informática (INEI).
 Actualización mediante aplicación de rastreo de campo efectuada por APEIM en las zonas de
mayor crecimiento de la ciudad (conos)

Tamaño de la muestra
 Se entrevistó a un total de 3 598 hogares distribuidos en 41 distritos.
 El margen de error fue de 1,63% con un nivel de confianza del 95%.
 Dentro de esta muestra se realizaron 200 entrevistas en distritos con predominio de los N.S.E. Muy
Alto/Alto con el propósito de obtener una submuestra estadísticamente significativa para este
segmento.
 El total de entrevistas fue desagregado proporcionalmente a la distribución poblacional de cada
uno de los distritos de Lima Metropolitana.

Selección de la muestra

 Determinada la cantidad de entrevistas a aplicar por distrito, se procedió a


sortear tantas manzanas como entrevistas se requerían.
 Dentro de cada manzana se seleccionó por un sistema aleatorio simple
cinco viviendas: una vivienda titular y cuatro viviendas
suplentes.
 Los hogares titulares fueron visitados hasta en tres
oportunidades antes de proceder al reemplazo. Se controló
que la tasa de reemplazo no excediera el 10% del total de entrevistas
originalmente sorteadas.
Estadística para Comunicadores 2020 01 108

Tamaño de muestra para estimar el valor de la media o proporción poblacional

Al iniciar una investigación nos hacemos varias preguntas, por ejemplo:


 ¿A cuántas personas debemos entrevistar?
 ¿Qué tan precisos deben ser nuestros pronósticos?
 ¿Qué tanto debemos confiar en nuestras afirmaciones a partir de la muestra?
 ¿Cómo influye la variabilidad de los datos?

Ejercicio
Indique en cada situación si se quiere estimar la media poblacional  o la proporción poblacional p.

Situación Media poblacional 


o proporción poblacional p
Si deseamos pronosticar quién ganará las próximas
elecciones ¿a cuántas personas se debe
entrevistar?

Si deseamos estimar la media poblacional del


ingreso diario de un conductor de taxi por
aplicación ¿se debe entrevistar a 500 taxistas o
basta con 200?

Si deseamos estimar la media del número de


kilómetros que un futbolista profesional corre
durante un partido en el campeonato nacional ¿a
cuántos futbolistas hay que registrar?

Si queremos estimar el porcentaje


poblacional de dueños que llevan todos los
meses a su perro al veterinario ¿a cuántos
dueños se debe entrevistar?

Margen de error o error de estimación (e)


Es la diferencia entre un estadístico y su parámetro correspondiente.

Nos da una idea clara de cuánto se aleja el valor de un estadístico, basado en una muestra, del valor
del parámetro al que se está estimando. Un estadístico será más preciso cuando su error sea más
pequeño.
Estadística para Comunicadores 2020 01 109

Nivel de confianza (1 - )%


Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al verdadero valor
del parámetro.
Estadística para Comunicadores 2020 01 110

Tamaño de muestra para estimar la media poblacional 

La fórmula para determinar el tamaño de muestra n es:

2
z ×s
n= (( ) ) 1−
α
2

El valor de s puede ser estimado a partir de una muestra preliminar o piloto.

Tamaño de muestra para estimar una proporción poblacional cuando se dispone de


información muestral

Si ^p se utiliza como una estimación de la proporción poblacional p , podemos tener una confianza
del ( 1−α ) x 100% de que el error será menor o igual de una cantidad específica e cuando el
tamaño de la muestra es:
z2 × ^p × ( 1− ^p )
(1− α2 )
n=
e2

Tamaño de muestra para estimar una proporción poblacional cuando no se dispone de


información muestral
Si no se tiene una estimación previa de p, entonces, se puede usar p = 0,5; por lo tanto la fórmula para
calcular el tamaño de muestra es la siguiente:
z2 × 0,5× ( 1−0,5 )
(1− α2 )
n=
e2

Tamaño de muestra si se conoce el tamaño de la población N


Para para la media o para la proporción, si se conoce el tamaño de la población N, entonces el tamaño
de muestra se corrige con la siguiente fórmula:
n
nc =
n
1+
N
Estadística para Comunicadores 2020 01 111

Tamaño de muestra para estimar el valor de la media o proporción poblacional


Estadística para Comunicadores 2020 01 112

Ejemplo
El jefe de la oficina de seguridad del distrito de San Martin de Porres desea realizar una estimación de
cuánto tiempo, en promedio, estarían dispuestos a permanecer en las charlas sobre rondas vecinales
los vecinos del distrito. En estudios anteriores se estimó que el tiempo medio era de 45,25 minutos
con una varianza de 18,75 minutos2.

¿A cuántas personas se debería entrevistar si se estima un error máximo de 1,25 minutos y una
confianza del 95%?

Solución
El margen de error es e = 1,25

La desviación estándar muestral es s = √ 18,75 = 4,3301

El valor en la tabla normal estándar es Z(0,975) = 1,96

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
                     
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593

Reemplazando los valores en la fórmula, el tamaño de muestra (n) para un margen de error (e) de 1,25
minutos y un nivel de confianza del 95% es:

2
z ×s
n= ( ( ) 1−

e
α
2
) = ( 1,96 ×4,3301 2
1,25 )=46,1

Se redondea al entero mayor, por lo tanto, se necesitará seleccionar una muestra de 47 vecinos del
distrito de San Martin de Porres.
Estadística para Comunicadores 2020 01 113

Ejemplo
Universal es una nueva emisora de carácter político y a una semana de estar al aire cuenta ya con 3000
radioescuchas. El gerente de Universal desea realizar un estudio para estimar el tiempo de conexión
medio de los oyentes. ¿Cuál debe ser el tamaño de muestra de oyentes que se necesita si desea tener
un error de estimación de 0,15 horas con un nivel de confianza del 95%?

Al seleccionar una muestra piloto se obtuvieron los siguientes resultados, en horas:


3,2 4,8 5,3 9,1 6,3 8,2 6,5 9,6 10,3 8,6
6,3 7,9 8,2 7,9 6,9 9,3 8,6 6,8 10,1 9,0

Solución
El margen de error (e) es e = 0,15

La desviación estándar muestral (s) es s = 1,8597

El nivel de confianza es del 95%, por lo tanto, el valor en la tabla normal estándar es Z(0,975) = 1,96

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
                     
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593

El tamaño de la muestra se obtiene con la siguiente fórmula:

2
z ×s
n=( ( ) 1−
α
2

e ) =(1,96 ×1,8597 2
0,15 )
=590,49

Se redondea al entero mayor, por lo tanto, se necesitará seleccionar una muestra de 591
radioescuchas.

El tamaño de la población es N = 3000. Como el tamaño de la población es conocida se debe corregir la


muestra:
591
n= =493 ,7≈494
591
1+
3000
Estadística para Comunicadores 2020 01 114
Se necesitará entrevistar una muestra de 494 radioescuchas, pues se redondea al entero mayor.
Estadística para Comunicadores 2020 01 115

Ejemplo
En un estudio piloto, el 32% de los encuestados dijeron que el programa espacial debe enfatizar la
exploración científica. ¿Qué tan grande se necesita que sea la muestra definitiva si se desea una
confianza del 99% de que el porcentaje estimado esté dentro del 2% del porcentaje real?

Solución

El margen de error (e) es del 2%, por lo tanto es e = 0,02.

La estimación de la proporción poblacional de personas que manifiestan que se debe enfatizar en la


exploración científica es la proporción muestral ^p, es decir, ^p = 0,32.

El nivel de confianza es del 99%, por lo tanto, el valor en la tabla normal estándar es Z(0,995) = 2,58.

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643

Remplazando en la fórmula del tamaño de muestra:

z2 × ^p × ( 1− ^p )
(1− α2 ) 2,58 2 ×0,32 × ( 1−0,32 ) = 3621,08
n= =
e2 0,022

El tamaño de muestra con las condiciones solicitadas será 3622 personas, pues este valor se redondea
al entero mayor.
Estadística para Comunicadores 2020 01 116

Ejemplo
Una agencia publicitaria desea hacer una afirmación en su spot publicitario. Para ello lleva a cabo un
estudio para estimar el porcentaje de ciudadanos de una gran ciudad que están a favor de que el agua
se trate con flúor.

¿Qué tan grande debe ser la muestra que debe seleccionar si se desea tener una confianza de 95% de
que la estimación esté dentro del 1% del porcentaje real?

Solución

Se desea que la estimación esté dentro del 1% del porcentaje real, esto quiere decir que el margen de
error debe ser del 1%, esto es, e = 0,01.

El nivel de confianza es del 95%, por lo tanto, el valor en la tabla normal estándar es Z(0,975) = 1,96

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
                     
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593

Reemplazando los valores en la fórmula, el tamaño de muestra (n) para un margen de error (e) de 1% y
un nivel de confianza del 95% es:

z2 × ^p × ( 1− ^p )
(1− α2 ) 1,96 2 ×0,5 ×(1−0,5) = 9604
n= =
e2 0,012

Luego el tamaño de muestra solicitado será 9604 ciudadanos.


Estadística para Comunicadores 2020 01 117

Ejercicios

1. ¿Cuál debe ser el tamaño de muestra si se desea estimar el tiempo promedio, en horas, que
demoran los estudiantes en llegar a la universidad con un nivel de confianza del 97% y con un
margen de error de 5 minutos?

Una muestra piloto de 10 alumnos arrojó los siguientes resultados:

120 90 35 80 60 40 15 30 40 100

Solución

El margen de error (e) es = ………………..…………

La desviación estándar (s) es = ……………..……………

z
El valor de (1− α2 ) = z …………... = ……………………………

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361

Reemplazando los valores en la fórmula, el tamaño de muestra (n) para un margen de error (e) de
………………………………. y un nivel de confianza del ……………………………% es:

2
z s
n= ( ) 1−

e
α
2
= ( … … .. … …... × ….. … … . … .. 2
……………… ) =¿ ………………….
Estadística para Comunicadores 2020 01 118

Luego, se debe en= ( 1.961.5x 9.6 )ncuestar a ………………………………………………., pues se redondea al


entero …………………
Estadística para Comunicadores 2020 01 119
2. La gerencia de un diario desea estimar la media del gasto mensual que las familias destinan a la
compra de diarios. Se desea tener un nivel de confianza del 98% y un margen de error de dos soles.

Si la desviación estándar de los gastos en compra de diarios en una muestra piloto fue de 30 soles
¿Qué tamaño de muestra deberá seleccionar?

Solución

El margen de error (e) es = ………………..…………

La desviación estándar (s) es = ……………..……………

z
El valor de (1− α2 ) = z …………... = ……………………………

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158

Reemplazando los valores en la fórmula, el tamaño de muestra (n) para un margen de error (e) de
………………………………. y un nivel de confianza del ……………………………% es:

Luego, se debe en= ( 1.961.5x 9.6 )ncuestar a ………………………………………………., pues se redondea al


entero …………………
Estadística para Comunicadores 2020 01 120
3. En una muestra aleatoria de 300 personas mayores de edad de una gran ciudad se encontró que
105 leían un determinado periódico.

Calcule el tamaño de una nueva muestra que tenga un margen de error del 3% y un nivel de
confianza del 99% para estimar la proporción poblacional de lectores de ese periódico.

Solución

La estimación de la proporción poblacional p es la proporción muestral ^p=....................


El margen de error (e) = …………………….………

z
El valor de (1− α2 ) = z …………... = ……………………………

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643

Reemplazando los valores en la fórmula, el tamaño de muestra (n) para un margen de error (e) de
………………………………. y un nivel de confianza del ……………………………% es:

z2 × ^p × ( 1− ^p )
(1− α2 ) … ….. … … ...× … .. … … … … × ( 1−… … … … … ) ..
n= 2
= =¿ ………………….
e ………………

Luego, se debe en= ( 1.961.5x 9.6 )ncuestar a ………………………………………………., pues se redondea al


entero …………………
Estadística para Comunicadores 2020 01 121
4. El alcalde de un distrito desea estimar la proporción poblacional de residentes que conocen la
propuesta respecto al uso de fondos municipales para mejorar la limpieza del distrito.

Calcule el tamaño de muestra si se requiere una confianza del 94% y un margen de error del 2%.

Solución

La estimación de la proporción poblacional p es la proporción muestral ^p=.................... , pues


…………………………………………………………………………………………………………………………………………………………..

El margen de error (e) = …………………….………

El valor de z 1− α = z …………... = ……………………………


2

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670

Luego, se debe en= ( 1.961.5x 9.6 )ncuestar a ………………………………………………., pues se redondea al


entero …………………
Estadística para Comunicadores 2020 01 122
Estadística para Comunicadores 2020 01 123
5. En una muestra piloto de 500 familias en la ciudad de Lima, se encuentra que 340 están suscritas a
HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 93% de confianza y un
margen de error del 4%?
Solución

Entonces, el tamaño de muestra para las condiciones propuestas es de ………………..…………..……..


6. Para estimar el porcentaje de electores a favor de un candidato, una encuestadora debe
determinar el tamaño de la muestra de una población de 10 mil electores ¿Qué tan grande debe
ser la muestra si se quiere tener una confianza del 97% y un margen de error del 3%?
Solución

Finalmente, el tamaño de muestra para las condiciones solicitadas será igual a ………………..……………
Estadística para Comunicadores 2020 01 124

Ejercicios de aplicación

1. Se desea realizar una encuesta para estimar el número promedio de amigos que los jóvenes tienen
en su cuenta de Facebook. Con un error de estimación de cinco amigos y con un nivel de confianza
del 95%, determine el tamaño de muestra adecuado si en una muestra piloto se obtuvo que el
valor de la desviación estándar del número de amigos es igual a 42. Rpta: 272

2. La alcaldía de Lima desea concientizar a la población a través de la campaña “Si toma no maneje”
encargada a una importante agencia publicitaria. Con un 95% de confianza y con un error de
estimación no mayor a 3,5% ¿de qué tamaño necesita tomar la muestra la agencia para estimar el
porcentaje de todos los ciudadanos a favor de esta campaña? Rpta:
784

3. La máquina de refrescos de una universidad está ajustada de tal manera que la cantidad de líquido
despachada se distribuye aproximadamente en forma normal. ¿Qué tan grande se requiere que sea
la muestra si se desea tener una confianza de 98% de que su media muestral esté dentro de 0,05
centilitros del promedio real? Se cuenta con la siguiente información de una muestra preliminar o
piloto de tamaño 24. Rpta: 60

1,99 1,98 2,04 1,97 2,18 2,04 2,13 2,03 2,08 2,72 2,04 2,09
2,11 2,13 2,14 1,98 2,29 2,02 1,94 1,82 2,02 2,10 2,19 2.13

4. Se realiza un estudio para estimar la proporción de residentes en una ciudad que están a favor de la
construcción de una vía expresa. ¿Qué tan grande deber ser una muestra si se quiere un nivel de
confianza de 97% y un margen de error del 3%? Rpta: 1309

5. Una editorial desea evaluar la media muestral del tiempo de distribución de su último best seller en
cada uno de sus 400 puntos de venta. Para este estudio se desea tener un error de estimación de
tres minutos con un nivel de confianza del 90%. Además, se sabe que la desviación estándar de los
tiempos de distribución es de 17 minutos. ¿Qué tamaño de muestra debe emplearse para el
estudio? Rpta:
72
6. La gerencia de un diario local quiere determinar la cantidad mensual promedio que las familias
gastan en compra de diarios. En una muestra piloto se obtuvo que la desviación estándar de los
gastos fue de 20 soles. Si la gerencia desea tener una confianza del 93% en la información
recopilada y no quiere que el error de tolerancia sea mayor a tres soles. ¿Qué tamaño de muestra
deberá seleccionar para determinar el gasto familiar mensual promedio?
Rpta: 146

7. Se planea una encuesta para determinar los gastos mensuales en campañas publicitarias de las
4500 empresas de una ciudad. Para este estudio se desea tener un error de estimación de 50 soles
para los gastos mensuales con una confianza del 92%. Además, se sabe que la desviación estándar
de los gastos mensuales en campañas publicitarias en una muestra preliminar fue de 400 soles
¿Cuál será el tamaño de muestra a seleccionar? Rpta:
188

8. Una empresa desea estimar la proporción de trabajadores del área de diseño publicitario que están
a favor de que se corrija el programa de capacitación que se viene dando actualmente en el área. La
estimación debe quedar a menos de 0,08 de la proporción verdadera de los que favorecen el
Estadística para Comunicadores 2020 01 125
programa de capacitación. Con una confianza del 95% ¿cuántos trabajadores se deben seleccionar?
Rpta:
151
9. Un supermercado ha adquirido un lote de 2 000 revistas. En adquisiciones anteriores se ha
obtenido que la proporción de revistas defectuosas es alrededor de 0,18. ¿Qué tamaño de muestra
debe seleccionarse para estimar la proporción de revistas defectuosas en este lote si se desea tener
un error de estimación de 0,04 con una confianza del 90%? Rpta:
222

10.Una reportera de la revista Byte desea realizar una encuesta para estimar la verdadera proporción
de estudiantes universitarios que poseen tablet y quiere tener una confianza del 96% con un
margen de error de 0,035. Suponga que en un estudio previo obtuvo un estimado de la proporción
que reveló un porcentaje del 29% de estudiantes universitarios que poseen tablet. ¿A cuántos
estudiantes universitarios deberá encuestar?
Rpta: 707

11.El gerente comercial de la red profesional Conexión desea estimar la proporción de jóvenes que egresaron el
año pasado de una maestría en administración de negocios (MBA) y que han utilizado Conexión para obtener
un mejor empleo ¿Cuál debe ser el tamaño de muestra mínimo si se desea tener un nivel de confianza del
94% y un margen de error del 5%? Además, se sabe que el año pasado egresaron 2620 jóvenes de todos los
MBA de Lima. Rpta:
784

12.El jefe de la oficina de seguridad del distrito de San Borja desea realizar una estimación de cuánto
tiempo, en promedio, estarían dispuestos a permanecer los vecinos escuchando charlas sobre
seguridad vecinal. En estudios anteriores se estimó que el tiempo promedio era de 45,25 minutos
con una varianza de 18,75 minutos 2, ¿A cuántas personas se debería entrevistar si se estima un
error máximo de un minuto y una confianza del 95%? Suponga que esta variable se distribuye
normalmente. Rpta:
73

13.Usted trabaja en una compañía de investigación de mercado y le han encargado estimar el


porcentaje de hogares que tienen Internet en casa, ¿cuántos hogares debe encuestar si desea tener
una confianza del 95% de que el porcentaje muestral difiera del porcentaje poblacional en menos
de 2,5%?

14.El ingreso mensual de una muestra piloto de egresados de la carrera de periodismo de cierta
universidad tiene una desviación estándar de 2000 soles ¿De qué tamaño debe tomarse la muestra
si se desea tener un margen de error de 500 soles para la estimación del ingreso promedio mensual
de los egresados de la carrera de periodismo con una confianza del 94%?
Estadística para Comunicadores 2020 01 126

Muestreo probabilístico

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de


equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser seleccionadas.

Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra


extraída y son, por tanto, los más recomendables.

Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos:

aleatorio simple sistemático estratificado

Se selecciona una muestra Se selecciona un primer Se selecciona la muestra de


en forma aleatoria y sin elemento aleatoriamente y, los diversos estratos. Un
reemplazo a n unidades de luego, los demás elementos estrato es una parte de la
muestreo de una población que conformarán la muestra población, cuyos elementos
que contiene un total de N cada cierto intervalo. Este tienen características
unidades. Se garantiza que muestreo supone que se similares. El objetivo de
cada una de las muestras cuenta con una estratificar la población es
posibles tiene la misma enumeración completa de buscar homogeneidad entre
probabilidad de ser elegida. los elementos de la los estratos.
población.
Estadística para Comunicadores 2020 01 127

Ficha técnica
La ficha técnica es el documento donde consta la metodología y el proceso que se ha seguido para
realizar un estudio social o de mercado.
En el caso de los estudios cuantitativos, se suele incluir la información siguiente:
 Descripción del universo
 Metodología de selección de la muestra
 Tamaño muestral
 Nivel de confianza y margen de error con el que se presentan los resultados
 Técnica aplicada para realizar el trabajo de campo
 Período de recogida de la información
Ejemplo de ficha técnica
Estadística para Comunicadores 2020 01 128

Elección de la muestra
Se seleccionará los elementos del marco de muestreo que conformarán la muestra aplicando la
técnica de muestreo apropiada para el estudio que se desea llevar a cabo.

Muestreo aleatorio simple


Es el procedimiento por el cual se selecciona una muestra en forma aleatoria y sin reemplazo a n
unidades de muestreo de una población que contiene un total de N unidades.

Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser elegida.

Pasos por seguir para seleccionar una muestra simple aleatoria

1. Enumere las unidades del marco muestral con números sucesivos.


2. Seleccione tantos elementos del marco muestral como sea el tamaño requerido de la muestra,
usando una tabla de números aleatorios.
3. La selección de las unidades se realiza sin reemplazo.

El muestreo aleatorio simple presenta dos propiedades:

 Equiprobable: Cada unidad tiene las mismas posibilidades de ser elegida.

 Independencia: La selección de una unidad no influye en la selección de otras unidades.

Pero en el mundo real es difícil encontrar muestras completamente independientes y representativas.


Estadística para Comunicadores 2020 01 129
Por ejemplo, hacer una encuesta a los votantes marcando números de teléfono al azar es un método
no representativo pues no tiene en cuenta a los votantes que no disponen de teléfono y cuenta varias
veces a los que tienen varios números.
Estadística para Comunicadores 2020 01 130

Ejercicio
1. El director de una revista tiene información de todo su personal y desea obtener una muestra
aleatoria de trabajadores. El registro se muestra a continuación:

Trabajadores registrados
N° Tiempo de servicio Edad N° Tiempo de servicio Edad N° Tiempo de servicio Edad
1 73 23 41 106 45 81 99 49
2 96 46 42 99 49 82 131 32
3 110 67 43 94 35 83 131 32
4 105 60 44 98 30 84 93 42
5 91 43 45 98 30 85 104 53
6 90 36 46 99 49 86 81 29
7 129 46 47 98 30 87 124 56
8 129 46 48 98 30 88 98 56
9 91 43 49 73 23 89 98 56
10 96 46 50 73 23 90 106 45
11 110 67 51 95 33 91 129 46
12 129 46 52 95 33 92 106 45
13 100 35 53 96 46 93 129 46
14 99 49 54 96 46 94 124 56
15 113 55 55 110 67 95 98 56
16 101 39 56 124 56 96 98 56
17 86 45 57 90 36 97 104 53
18 104 42 58 90 36 98 106 45
19 126 57 59 101 35 99 129 46
20 98 30 60 101 35 100 124 56
21 126 58 61 124 56 101 98 56
22 98 30 62 95 33 102 117 30
23 101 39 63 95 33 103 99 49
24 86 40 64 96 42 104 104 33
25 104 42 65 96 46 105 94 35
26 99 49 66 110 67 106 101 39
27 113 55 67 124 56 107 123 44
28 98 30 68 99 49 108 98 30
29 126 57 69 131 32 109 88 60
30 98 31 70 131 333 110 123 40
31 104 53 71 113 55 111 98 30
32 104 53 72 94 35 112 88 59
33 81 29 73 93 42 113 101 39
34 124 56 74 91 47 114 117 30
35 91 43 75 91 47 115 90 36
36 106 45 76 86 41 116 98 30
37 106 45 77 93 42 117 88 59
38 91 43 78 91 47 118 123 40
39 104 63 79 91 47 119 98 30
40 104 53 80 86 45 120 88 59
Estadística para Comunicadores 2020 01 131
TABLA DE NÚMEROS ALEATORIOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para Comunicadores 2020 01 132
a. Para seleccionar una muestra de 12 trabajadores aplique el muestreo simple aleatorio. Elabore un
listado con el número seleccionado y el valor de su tiempo de servicio y edad. Utilice para la
selección las columnas: C14; C7; C10; C15 y C1 de la tabla de números aleatorios.
b. Con la muestra seleccionada, calcule el tiempo promedio de servicio y el porcentaje de
trabajadores mayores de 40 años.

Solución
Como el marco muestral tiene ………. elementos o unidades elementales, usaremos las columnas
……………………. para elegir números de …………….…. cifras.

a. Elabore un listado con el número seleccionado y el valor de su tiempo de servicio y lugar de


procedencia.

Trabajador Posición Tiempo de servicio Edad


1

10

11

12

b. Con la muestra seleccionada, calcule el tiempo promedio de servicio y el porcentaje de


trabajadores mayores de 40 años.

1. Una empresa de tiene un total de 150 empleados y ha registrado información acerca de las
variables: ingreso mensual, en soles (Ingreso) y años cumplidos en la empresa (Años).
Estadística para Comunicadores 2020 01 133

Trabajadores registrados
Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años Nº Ingreso Años
1 2300 5 39 2600 16 77 1800 3 115 1700 3
2 2800 11 40 2700 18 78 1700 5 116 2600 19
3 2400 4 41 2100 11 79 1700 4 117 1600 1
4 2500 2 42 2300 14 80 1700 0 118 1800 6
5 2300 3 43 1700 0 81 1700 1 119 2100 10
6 2100 2 44 2200 13 82 2100 6 120 1700 0
7 1700 2 45 2900 20 83 2600 17 121 2400 16
8 2000 0 46 1800 5 84 2400 9 122 2600 17
9 2200 7 47 2100 16 85 2600 19 123 2100 10
10 2100 4 48 2000 12 86 1900 7 124 2100 8
11 1700 0 49 2000 12 87 1600 0 125 2400 17
12 2500 2 50 2900 20 88 1900 3 126 1700 1
13 2800 13 51 2100 13 89 2100 14 127 2600 20
14 2400 9 52 2100 9 90 1700 0 128 2400 16
15 1700 1 53 1800 1 91 2100 15 129 2700 17
16 2400 9 54 2000 9 92 1700 1 130 2100 12
17 2200 10 55 2100 10 93 2300 14 131 1600 0
18 2200 4 56 1900 4 94 2500 16 132 2100 15
19 2300 10 57 2000 10 95 2600 18 133 1900 5
20 2800 11 58 2300 11 96 1900 3 134 2100 12
21 2100 7 59 2000 7 97 2500 19 135 2200 12
22 1700 1 60 1700 1 98 1800 6 136 2400 13
23 2500 6 61 1900 6 99 1700 2 137 1800 4
24 2400 9 62 2000 9 100 2000 10 138 2600 17
25 2700 17 63 2400 17 101 2400 16 139 2700 20
26 1700 0 64 1700 0 102 1700 0 140 2500 16
27 1600 2 65 1700 2 103 2500 12 141 2500 16
28 2600 17 66 2400 17 104 1700 3 142 1900 6
29 2500 13 67 2500 13 105 2400 17 143 2100 15
30 2500 16 68 2600 16 106 2400 16 144 1700 9
31 2700 17 69 2100 14 107 1900 7 145 1500 0
32 1700 1 70 1900 7 108 1700 1 146 1800 18
33 1600 1 71 2000 9 109 2100 6 147 2100 10
34 2400 11 72 1800 7 110 2000 5 148 2700 19
35 1900 3 73 2100 10 111 2000 3 149 1800 9
36 1800 5 74 2300 12 112 2500 13 150 2100 15
37 1800 3 75 2700 20 113 1700 0
38 2400 14 76 2800 20 114 2500 19
a. Seleccione una muestra de 16 trabajadores usando muestreo simple aleatorio. Elabore un listado
con el número seleccionado y el valor del ingreso mensual y años en la empresa. Use las columnas
C2, C10, C11 y C15 de la tabla de números aleatorios.
b. Con la muestra, estime e interprete las medidas de tendencia central para el ingreso mensual.
c. Con la muestra, estime e interprete los cuartiles para la variable años en la empresa.
Estadística para Comunicadores 2020 01 134

Solución
Seleccionemos tantos elementos del marco muestral como sea el tamaño requerido de la muestra.
Como el marco muestral tiene ………. elementos usaremos las columnas ………………………. para elegir
números de ………. cifras.

a. Elabore un listado con el número seleccionado y el valor del ingreso mensual y años en la empresa:

Posición

Ingreso mensual

Años en la empresa

Posición

Ingreso mensual

Años en la empresa

b. Con la muestra obtenida estime e interprete las medidas de tendencia central para la variable
ingreso mensual.

Valor Interpretación

Media

Mediana

Moda

c. Con la muestra obtenida estime e interprete los cuartiles para la variable años en la empresa.
Ordenamos los datos.

Años en la empresa

Años en la empresa

Valor Interpretación

Cuartil 1

Cuartil 2

Cuartil 3
Estadística para Comunicadores 2020 01 135
TABLA DE NÚMEROS ALEATORIOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para Comunicadores 2020 01 136

Muestreo estratificado
Estratificar significa dividir a la población en varias partes de acuerdo con ciertas características de sus
elementos. El objetivo del diseño estratificado es dar un tratamiento especial a cada estrato, ya sea
por razones administrativas, de costo, logísticas o minimizar variabilidad.

La característica del estrato es que dentro del él los datos son homogéneos pero heterogéneos entre
sí.
Pasos a seguir para seleccionar una muestra estratificada
1. Divida a la población en estratos que sean mutuamente excluyentes. Esto es, que incluyan a todos
los elementos de la población y que cada elemento pertenezca solamente a un estrato.
2. Una vez conocido el tamaño de muestra a seleccionar, calcule la cantidad de elementos a
seleccionar en cada estrato de manera proporcional al tamaño de cada estrato. El tamaño de
muestra para cada estrato se obtiene mediante la siguiente fórmula:
N
nh = h ×n
N
3. Seleccione muestras aleatorias simples para cada uno de los estratos.

Recomendaciones para el uso de muestras estratificadas


 Si se tiene que usar más de una variable para formar los estratos, cuidar que estas no estén
relacionadas entre sí.
 No se deben considerar la formación de muchos estratos, generalmente se usan entre tres y ocho
estratos.
Estadística para Comunicadores 2020 01 137
 Los estratos pequeños no contribuyen mucho a la reducción del error, por lo tanto pueden no ser
considerados.
 La variable de estratificación la suele sugerir el investigador o el estadístico.
Estadística para Comunicadores 2020 01 138

Ejemplo
La empresa de telecomunicaciones RVTV tiene 120 empleados de los cuales tiene información de las
variables: ingreso mensual, en soles; nivel de educación y años en la empresa (Años).
N Ingres Nivel de Año N Ingres Nivel de Año Ingres Nivel de Año

º o educación s º o educación s o educación s
1 2300 Secundaria 5 41 2100 Técnica 13 81 2000 Superior 3
2 2800 Secundaria 11 42 2100 Técnica 9 82 2500 Superior 13
3 2400 Secundaria 4 43 1800 Técnica 1 83 1700 Superior 0
4 2500 Secundaria 2 44 2000 Técnica 9 84 2500 Superior 19
5 2300 Secundaria 3 45 2100 Técnica 10 85 1700 Superior 3
6 2100 Secundaria 2 46 1900 Técnica 4 86 2600 Superior 19
7 1700 Secundaria 2 47 2000 Técnica 10 87 1600 Superior 1
8 2000 Secundaria 0 48 2300 Técnica 11 88 1800 Superior 6
9 2200 Secundaria 7 49 2000 Técnica 7 89 2100 Superior 10
10 2100 Secundaria 4 50 1700 Técnica 1 90 1700 Superior 0
11 1700 Secundaria 0 51 1700 Técnica 1 91 2400 Superior 16
12 2500 Secundaria 2 52 2100 Técnica 6 92 2600 Superior 17
13 2800 Secundaria 13 53 2600 Técnica 17 93 2100 Superior 10
14 2400 Secundaria 9 54 2400 Técnica 9 94 2100 Superior 8
15 1700 Secundaria 1 55 2600 Técnica 19 95 2400 Superior 17
16 2400 Secundaria 9 56 1900 Técnica 7 96 1700 Superior 1
17 2200 Secundaria 10 57 1600 Técnica 0 97 2600 Superior 20
18 2200 Secundaria 4 58 1900 Técnica 3 98 2400 Superior 16
19 2300 Secundaria 10 59 2100 Técnica 14 99 2700 Superior 17
10
20 2800 Secundaria 11 60 1700 Técnica 0 2100 Superior 12
0
10
21 2100 Secundaria 7 61 2100 Técnica 15 1600 Superior 0
1
10
22 1700 Secundaria 1 62 1700 Técnica 1 2100 Superior 15
2
10
23 2500 Secundaria 6 63 2300 Técnica 14 1900 Superior 5
3
10
24 2400 Secundaria 9 64 2500 Técnica 16 2100 Superior 12
4
10
25 2700 Secundaria 17 65 2600 Técnica 18 2200 Superior 12
5
10
26 1700 Secundaria 0 66 1900 Técnica 3 2400 Superior 13
6
10
27 1600 Secundaria 2 67 2500 Técnica 19 1800 Superior 4
7
10
28 2600 Secundaria 17 68 1800 Técnica 6 2600 Superior 17
8
10
29 2500 Secundaria 13 69 1700 Técnica 2 2700 Superior 20
9
11
30 2500 Secundaria 16 70 2000 Técnica 10 2500 Superior 16
0
11
31 2100 Técnica 11 71 2400 Técnica 16 2500 Superior 16
1
11
32 2300 Técnica 14 72 1700 Técnica 0 1900 Superior 6
2
11
33 1700 Técnica 0 73 2500 Técnica 12 2100 Superior 15
3
Estadística para Comunicadores 2020 01 139
11
34 2200 Técnica 13 74 1700 Técnica 3 1700 Superior 9
4
11
35 2900 Técnica 20 75 2400 Técnica 17 1500 Superior 0
5
11
36 1800 Técnica 5 76 2400 Técnica 16 1800 Superior 18
6
11
37 2100 Técnica 16 77 1900 Técnica 7 2100 Superior 10
7
11
38 2000 Técnica 12 78 1700 Técnica 1 2700 Superior 19
8
11
39 2000 Técnica 12 79 2100 Técnica 6 1800 Superior 9
9
12
40 2900 Técnica 20 80 2000 Técnica 5 2100 Superior 15
0
a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como
variable de estratificación el nivel de educación. Elabore un listado identificando el número
seleccionado y el valor respectivo de los años cumplidos en la empresa. Para el estrato 1 use las
columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11 y para el estrato 3 use C4, C3, C5 y
C7.
b. Con la muestra, calcule la proporción de empleados que tienen más de 12 años en la empresa .

Solución
a. Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use como
variable de estratificación el nivel de educación. Elabore un listado identificando el número
seleccionado y el valor respectivo de los años cumplidos en la empresa.
Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9, C10 y C11
y para el estrato 3 use C4, C3, C5 y C7.

Se divide a la población en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3
son: secundaria, técnica y superior, respectivamente. Para cada uno de los estratos, seleccionamos
muestras aleatorias simples.

Números de Cantidad seleccionada por estrato


Posiciones Nh
Estrato elementos en el
(desde – hasta) nh = ×n
estrato Nh N
N 30
Secundaria N1 = 30 1 – 30 n1 = 1 ×n= ×16=4
N 120
N2 50
Técnica N2 = 50 31 – 80 n2 = ×n= ×16=6 , 67≈7
N 120
N 40
Superior N3 = 40 81 – 120 n3 = 3 ×n= ×16=5 , 33≈5
N 120
Total N = 120 n = 16

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y
C5. Observemos que las posiciones de los primeros elementos a elegir están entre 1 y 30.

TABLA DE NÚMEROS ALEATORIOS


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
Estadística para Comunicadores 2020 01 140
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8

Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:

Estrato Secundaria
Posición 2 16 29 13
Años en la empresa 11 9 13 13

Para el estrato Técnica, realizamos un muestreo aleatorio simple usando las columnas C8, C9, C10 y
C11. Observemos que las posiciones de los elementos a elegir están entre 31 y 80.
Estadística para Comunicadores 2020 01 141
TABLA DE NÚMEROS ALEATORIOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7

Luego, el cuadro con los datos elementos seleccionados para el estrato Técnica es:

Estrato Técnica
Posición 54 62 66 77 48 67 44

Años en la empresa 9 1 3 7 11 19 9

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas C4, C3, C5 y
C7. Observemos que las posiciones de los elementos a elegir están entre 81 y 120.

TABLA DE NÚMEROS ALEATORIOS


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:

Estrato Superior
Posición 114 81 97 105 83
Años en la empresa 9 3 20 12 0

b. Con la muestra obtenida calcule la proporción de empleados que tienen más de 12 años en la
empresa.
Solución
Luego, con los elementos seleccionados se tiene que la proporción de empleados con más de 12
años en la empresa es igual a 4/16 = 0,25.
Estadística para Comunicadores 2020 01 142

Ejercicio

1. La siguiente tabla muestra a los 120 alumnos de la especialidad de Comunicaciones, de la


universidad A, a quienes se les preguntó por su aplicación preferida para escuchar música y por la
cantidad de horas a la semana que la usaba.

Hora
Posición App Posición App Horas Posición App Horas
s
1 Spotify 8 41 Spotify 16 81 YouTube Music 14
2 Spotify 9 42 Spotify 9 82 YouTube Music 8
3 Spotify 14 43 Spotify 8 83 YouTube Music 7
4 Spotify 12 44 Spotify 9 84 YouTube Music 15
5 Spotify 10 45 Spotify 4 85 YouTube Music 5
6 Spotify 9 46 Spotify 6 86 YouTube Music 8
7 Spotify 4 47 Spotify 7 87 YouTube Music 7
8 Spotify 10 48 Spotify 9 88 Amazon Music 6
9 Spotify 12 49 Spotify 8 89 Amazon Music 9
10 Spotify 10 50 Spotify 10 90 Amazon Music 9
11 Spotify 11 51 Spotify 12 91 Amazon Music 4
12 Spotify 13 52 Spotify 11 92 Amazon Music 2
13 Spotify 4 53 Spotify 9 93 Amazon Music 11
14 Spotify 2 54 Spotify 8 94 Amazon Music 2
15 Spotify 6 55 Spotify 4 95 Amazon Music 3
16 Spotify 4 56 Spotify 6 96 Amazon Music 8
17 Spotify 9 57 Spotify 7 97 Amazon Music 6
18 Spotify 5 58 Spotify 8 98 Amazon Music 7
19 Spotify 12 59 Spotify 7 99 Amazon Music 9
20 Spotify 7 60 Spotify 3 100 Amazon Music 4
21 Spotify 4 61 Spotify 6 101 Amazon Music 8
22 Spotify 6 62 Spotify 9 102 Amazon Music 7
23 Spotify 7 63 Spotify 2 103 Amazon Music 7
24 Spotify 8 64 Spotify 5 104 Amazon Music 9
25 Spotify 9 65 Spotify 1 105 Amazon Music 6
26 Spotify 10 66 Spotify 4 106 Amazon Music 7
YouTube
27 Spotify 5 67 7 107 Amazon Music 9
Music
YouTube
28 Spotify 4 68 6 108 Amazon Music 8
Music
YouTube
29 Spotify 7 69 7 109 Amazon Music 3
Music
YouTube
30 Spotify 4 70 8 110 Amazon Music 11
Music
YouTube
31 Spotify 4 71 4 111 Amazon Music 13
Music
YouTube
32 Spotify 6 72 5 112 Amazon Music 14
Music
YouTube
33 Spotify 7 73 3 113 Amazon Music 9
Music
YouTube
34 Spotify 5 74 6 114 Amazon Music 8
Music
YouTube
35 Spotify 8 75 5 115 Amazon Music 6
Music
Estadística para Comunicadores 2020 01 143
YouTube
36 Spotify 9 76 8 116 Amazon Music 5
Music
YouTube
37 Spotify 4 77 7 117 Amazon Music 7
Music
YouTube
38 Spotify 5 78 9 118 Amazon Music 3
Music
YouTube
39 Spotify 2 79 10 119 Amazon Music 6
Music
YouTube
40 Spotify 9 80 3 120 Amazon Music 5
Music
Estadística para Comunicadores 2020 01 144
a. Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Use la variable
<aplicación preferida> como variable de estratificación. Elabore un listado con el alumno
seleccionado y la cantidad de horas a la semana que escucha música con la aplicación de su
preferencia.
Para el estrato 1 use las columnas C1, C5 y C9, para el estrato 2 use las columnas C7, C3, C8 y C15 y
para el estrato 3 use C2, C5, C8, C14, C1, y C7.

Solución

Posición Nh
Estrato Nh nh = ×n
(desde – hasta) N
1. Spotify N1= n1=

2. Youtube Music N2= n2=

3. Amazon Music N3= n3=

Total

Estrato 1: Estrato 2: Estrato 3:


Spotify YouTube Music Amazon Music

Posición Horas Posición Horas Posición Horas

b. Con la muestra obtenida calcule el promedio de horas a la semana que los alumnos escuchan
música con la aplicación de su preferencia.

Solución

Entonces, con los doce elementos seleccionados en la muestra se tiene que la media muestral de
horas a la semana que los alumnos escuchan música a través de la aplicación de su preferencia es
……................. horas.
Estadística para Comunicadores 2020 01 145
TABLA DE NÚMEROS ALEATORIOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para Comunicadores 2020 01 146
2. Los siguientes datos han sido extraídos de una investigación realizada por La Defensoría del Pueblo,
Comisión de la Verdad y Reconciliación, Comité Internacional Cruz Roja y Coordinadora Nacional de
Derechos Humanos sobre un total de 150 personas extraviadas en el Perú entre los años 1980 y
1996 en los tres principales departamentos donde hubo el brote terrorista: Ayacucho, Huánuco y
San Martín. Las variables que se consideraron fueron: Lugar de procedencia, sexo y edad al
momento de la desaparición. Los datos se presentan a continuación:
Nº Procedencia Sexo Edad Nº Procedencia Sexo Edad Nº Procedencia Sexo Edad Nº Procedencia Sexo Edad
1 Ayacucho M 12 39 Ayacucho M 22 77 Ayacucho M 33 115 Huánuco M 28
2 Ayacucho M 40 40 Ayacucho F 23 78 Ayacucho M 22 116 Huánuco M 36
3 Ayacucho M 20 41 Ayacucho M 50 79 Ayacucho M 70 117 Huánuco M 27
4 Ayacucho M 43 42 Ayacucho M 26 80 Ayacucho M 34 118 Huánuco M 24
5 Ayacucho M 28 43 Ayacucho F 19 81 Ayacucho M 69 119 Huánuco M 45
6 Ayacucho M 12 44 Ayacucho M 54 82 Ayacucho F 31 120 Huánuco M 21
7 Ayacucho F 15 45 Ayacucho M 13 83 Huánuco M 21 121 Huánuco M 66
8 Ayacucho M 28 46 Ayacucho M 46 84 Huánuco M 27 122 Huánuco F 70
9 Ayacucho M 13 47 Ayacucho M 28 85 Huánuco F 19 123 Huánuco F 26
10 Ayacucho M 45 48 Ayacucho M 46 86 Huánuco M 27 124 Huánuco M 26
11 Ayacucho M 10 49 Ayacucho M 42 87 Huánuco M 20 125 Huánuco M 14
12 Ayacucho F 25 50 Ayacucho M 40 88 Huánuco M 25 126 Huánuco M 18
13 Ayacucho M 24 51 Ayacucho M 44 89 Huánuco M 18 127 Huánuco M 28
14 Ayacucho M 32 52 Ayacucho M 39 90 Huánuco M 47 128 San Martín M 25
15 Ayacucho M 48 53 Ayacucho M 17 91 Huánuco M 28 129 San Martín M 32
16 Ayacucho M 23 54 Ayacucho F 19 92 Huánuco M 32 130 San Martín M 22
17 Ayacucho F 7 55 Ayacucho M 24 93 Huánuco M 18 131 San Martín M 21
18 Ayacucho F 5 56 Ayacucho F 15 94 Huánuco M 22 132 San Martín M 28
19 Ayacucho M 4 57 Ayacucho M 17 95 Huánuco M 28 133 San Martín M 18
20 Ayacucho F 9 58 Ayacucho M 22 96 Huánuco M 31 134 San Martín M 29
21 Ayacucho M 6 59 Ayacucho M 50 97 Huánuco M 34 135 San Martín M 20
22 Ayacucho M 66 60 Ayacucho M 42 98 Huánuco M 25 136 San Martín M 18
23 Ayacucho M 18 61 Ayacucho M 19 99 Huánuco M 27 137 San Martín M 21
24 Ayacucho F 36 62 Ayacucho M 21 100 Huánuco M 19 138 San Martín M 26
25 Ayacucho M 26 63 Ayacucho M 15 101 Huánuco M 24 139 San Martín M 23
26 Ayacucho M 17 64 Ayacucho M 43 102 Huánuco M 28 140 San Martín M 35
27 Ayacucho M 28 65 Ayacucho M 16 103 Huánuco F 4 141 San Martín M 17
28 Ayacucho M 30 66 Ayacucho M 30 104 Huánuco F 2 142 San Martín M 32
29 Ayacucho F 19 67 Ayacucho M 48 105 Huánuco M 33 143 San Martín F 32
30 Ayacucho M 17 68 Ayacucho M 45 106 Huánuco M 25 144 San Martín M 41
31 Ayacucho F 20 69 Ayacucho M 41 107 Huánuco M 21 145 San Martín M 26
32 Ayacucho M 21 70 Ayacucho M 23 108 Huánuco M 21 146 San Martín M 20
33 Ayacucho M 37 71 Ayacucho M 22 109 Huánuco M 30 147 San Martín M 21
34 Ayacucho M 58 72 Ayacucho M 20 110 Huánuco M 21 148 San Martín M 15
35 Ayacucho M 18 73 Ayacucho M 22 111 Huánuco M 21 149 San Martín M 22
36 Ayacucho F 18 74 Ayacucho M 16 112 Huánuco M 54 150 San Martín M 45
37 Ayacucho M 19 75 Ayacucho M 45 113 Huánuco M 38        
38 Ayacucho M 18 76 Ayacucho F 56 114 Huánuco M 16        
Estadística para Comunicadores 2020 01 147
a. Aplique el muestreo estratificado para obtener una muestra de 10 personas desaparecidas. Elabore
un listado con el elemento seleccionado y el valor de la edad al momento de la desaparición. Utilice
como variable de estratificación: Lugar de procedencia.

Estrato 1: Ayacucho C3; C5; C7


Estrato 2: Huánuco C5; C9; C10; C12
Estrato 3: San Martín C4; C8; C11; C15

Solución

Posición Nh
Estrato Nh nh = ×n
(desde – hasta) N
1. Ayacucho N1= n1=

2. Huánuco N2= n2=

3. San Martín N3= n3=

Total

Estrato 1: Ayacucho Estrato 2: Huánuco Estrato 3: San Martín


Posición Edad Posición Edad Posición Edad

b. Con la muestra obtenida calcule el promedio de la edad al momento de la desaparición.

Solución

Entonces, con los elementos seleccionados se tiene que el promedio de la edad al momento de la
desaparición es ……................. años.
Estadística para Comunicadores 2020 01 148
TABLA DE NÚMEROS ALEATORIOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para Comunicadores 2020 01 149

Muestreo sistemático
En el muestreo sistemático se debe elegir un elemento del marco muestral cada cierto intervalo. Este
muestreo supone que se cuenta con una enumeración completa de los elementos de la población.
Una característica importante del muestreo sistemático es que presenta menos variabilidad que el
muestreo aleatorio simple, esto debido a la presencia de una estratificación innata en el diseño del
muestreo sistemático.
Procedimiento para seleccionar una muestra sistemática
N
k=
 Calcule el valor de k, donde n . El valor de k se redondea al valor del entero menor.
 Seleccione aleatoriamente un número entero entre 1 y k llamado arranque aleatorio (A)
 Para encontrar el valor de A, la cantidad de columnas a usar de la tabla de números aleatorios
dependerá de la cantidad de dígitos que tenga k. Por ejemplo, si el valor de k es un número de dos
cifras, entonces deberá agregar a la columna dada por enunciado una columna correlativa para
completar un número de 2 cifras.
 A partir de este número elegido, seleccione el siguiente que ocupa la posición (A + k) del listado
del marco muestral y así sucesivamente hasta completar la muestra.

Ejemplo
1. Se tiene a continuación una población de 15 personas a quienes se les consultó su edad. Se desea
elegir a cuatro de ellas mediante un muestreo sistemático. Use la columna C3, C6 y C12 de la tabla
de números aleatorios.
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 12 15 23 10 32 65 34 23 43 54 22 34 56 34 25
Estadística para Comunicadores 2020 01 150

Solución
N 15
k = = =3 , 75
Calculemos el valor de k, donde n 4 . El valor de k se redondea al valor del entero
menor, luego k = 3. Seleccionemos aleatoriamente un número entero entre 1 y k = 3, llamado
arranque aleatorio (A). Observando la columna C3 de la tabla de números aleatorios tenemos que
A = 2.

TABLA DE NÚMEROS ALEATORIOS


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0

Los elementos seleccionados serán:


Posición 2 5 8 11
Edad 15 32 23 22

2. Se tiene una población de 15 personas a quienes se les consultó su edad y se desea elegir a seis de
ellas mediante un muestreo sistemático. Use la columna C7 de la tabla de números aleatorios. Con
la muestra seleccionada, estime la edad media.

Posición 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 45 33 55 45 39 37 43 21 43 32 30 29 35 32 53

Solución
N
k= = =.. .. . .. .. . .. .. ..
Calculemos el valor de k, donde n El valor de k se redondea al valor
del entero menor, luego k =…… El arranque aleatorio (A) es …………….

TABLA DE NÚMEROS ALEATORIOS


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9

Los elementos seleccionados serán:

Posición            

Edad            

Con la muestra seleccionada, estime la edad media.


Estadística para Comunicadores 2020 01 151
Estadística para Comunicadores 2020 01 152

Ejercicio

1. Se tiene información de 40 personas de un distrito de Lima. Obtenga una muestra de siete personas
usando el muestreo sistemático y elabore una tabla con la posición seleccionada. Utilice las
columnas C9, C10 y C11. Además, con la muestra obtenida, calcule la edad promedio de las
personas y el porcentaje de individuos que son mujeres.
Individuos registrados
N Eda N Eda N Eda
Sexo Estatura Sexo Estatura Sexo Estatura
º d º d º d
1 Mujer 15 154 15 Mujer 19 178 29 Hombre 33 147
2 Hombre 16 154 16 Mujer 30 163 30 Hombre 17 167
3 Hombre 21 156 17 Hombre 29 180 31 Mujer 34 169
4 Mujer 31 184 18 Mujer 25 174 32 Mujer 20 156
5 Hombre 21 173 19 Hombre 29 137 33 Mujer 26 164
6 Mujer 24 170 20 Hombre 25 153 34 Hombre 25 190
7 Hombre 32 176 21 Mujer 16 168 35 Mujer 23 167
8 Hombre 26 188 22 Hombre 31 161 36 Hombre 20 169
9 Mujer 21 169 23 Hombre 18 270 37 Mujer 34 176
10 Mujer 22 173 24 Hombre 21 173 38 Hombre 35 188
11 Hombre 18 177 25 Hombre 31 187 39 Mujer 30 155
12 Hombre 25 181 26 Mujer 28 161 40 Mujer 29 141
13 Mujer 29 164 27 Mujer 19 172
14 Hombre 25 159 28 Hombre 31 162

Solución
N
k= = =.. .. . .. .. . .. .. ..
Calculemos el valor de k, donde n El valor de k se redondea al valor del
entero menor, luego k =……….……….…… y el arranque aleatorio (A) es ………………………..….
TABLA DE NÚMEROS ALEATORIOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
El cuadro con los datos es:
Posición              
Sexo              
Edad              
Estatura              
Con la muestra obtenida, calcule la edad promedio y el porcentaje de mujeres.
Estadística para Comunicadores 2020 01 153
Estadística para Comunicadores 2020 01 154
2. Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en la tabla
que se muestra a continuación información acerca de las variables: nivel educativo y años
cumplidos en la empresa (Años).
N N
Nivel educativo Años Nivel educativo Años Nº Nivel educativo Años Nº Nivel educativo Años
º º
1 Secundaria 5 39 Secundaria 16 77 Técnica 3 115 Superior 3
2 Secundaria 11 40 Secundaria 18 78 Técnica 5 116 Superior 19
3 Secundaria 4 41 Técnica 11 79 Técnica 4 117 Superior 1
4 Secundaria 2 42 Técnica 14 80 Técnica 0 118 Superior 6
5 Secundaria 3 43 Técnica 0 81 Técnica 1 119 Superior 10
6 Secundaria 2 44 Técnica 13 82 Técnica 6 120 Superior 0
7 Secundaria 2 45 Técnica 20 83 Técnica 17 121 Superior 16
8 Secundaria 0 46 Técnica 5 84 Técnica 9 122 Superior 17
9 Secundaria 7 47 Técnica 16 85 Técnica 19 123 Superior 10
10 Secundaria 4 48 Técnica 12 86 Técnica 7 124 Superior 8
11 Secundaria 1 49 Técnica 12 87 Técnica 0 125 Superior 17
12 Secundaria 2 50 Técnica 20 88 Técnica 3 126 Superior 1
13 Secundaria 13 51 Técnica 13 89 Técnica 14 127 Superior 20
14 Secundaria 9 52 Técnica 9 90 Técnica 0 128 Superior 16
15 Secundaria 1 53 Técnica 1 91 Técnica 15 129 Superior 17
16 Secundaria 9 54 Técnica 9 92 Técnica 1 130 Superior 12
17 Secundaria 10 55 Técnica 10 93 Técnica 14 131 Superior 0
18 Secundaria 4 56 Técnica 4 94 Técnica 16 132 Superior 15
19 Secundaria 10 57 Técnica 10 95 Técnica 18 133 Superior 5
20 Secundaria 11 58 Técnica 11 96 Técnica 3 134 Superior 12
21 Secundaria 7 59 Técnica 7 97 Técnica 19 135 Superior 12
22 Secundaria 1 60 Técnica 1 98 Técnica 6 136 Superior 13
23 Secundaria 6 61 Técnica 6 99 Técnica 2 137 Superior 4
24 Secundaria 9 62 Técnica 9 100 Técnica 10 138 Superior 17
25 Secundaria 17 63 Técnica 17 101 Técnica 16 139 Superior 20
26 Secundaria 0 64 Técnica 0 102 Técnica 0 140 Superior 16
27 Secundaria 2 65 Técnica 2 103 Técnica 12 141 Superior 16
28 Secundaria 17 66 Técnica 17 104 Técnica 3 142 Superior 6
29 Secundaria 13 67 Técnica 13 105 Técnica 17 143 Superior 15
30 Secundaria 16 68 Técnica 16 106 Técnica 16 144 Superior 9
31 Secundaria 17 69 Técnica 14 107 Técnica 7 145 Superior 0
32 Secundaria 1 70 Técnica 7 108 Técnica 1 146 Superior 18
33 Secundaria 1 71 Técnica 9 109 Técnica 6 147 Superior 10
34 Secundaria 11 72 Técnica 7 110 Técnica 5 148 Superior 19
35 Secundaria 3 73 Técnica 10 111 Superior 3 149 Superior 9
36 Secundaria 5 74 Técnica 12 112 Superior 13 150 Superior 15
37 Secundaria 3 75 Técnica 20 113 Superior 0      
38 Secundaria 14 76 Técnica 20 114 Superior 19      
Estadística para Comunicadores 2020 01 155
a. Aplique el muestreo sistemático para seleccionar una muestra de tamaño 13 empleados. Elabore
un listado con la posición seleccionada y el valor de los años cumplidos en la empresa y nivel
educativo. Utilice la columna C7, C10 y C15 de la tabla de números aleatorios.
b. Con la muestra obtenida, estime e interprete para la variable, años en la empresa el promedio y la
mediana. Obtenga además la proporción de empleados con nivel técnico.
Solución
a. Aplique el muestreo sistemático para seleccionar una muestra de tamaño 13 empleados. Elabore
un listado con la posición seleccionada y el valor de los años cumplidos en la empresa y nivel
educativo. Utilice la columna C6, C1 y C15 de la tabla de números aleatorios.

N
k= = =.. .. . .. .. . .. .. ..
Calculemos el valor de k, donde n El valor de k se redondea al valor del
entero menor, luego k =……………………. El arranque aleatorio (A) es ………………..………….

TABLA DE NÚMEROS ALEATORIOS


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
El cuadro con los datos es:

Posición                          
Años en la empresa                          
Nivel educativo                          

b. Con la muestra obtenida, estime e interprete para la variable, años en la empresa, el promedio y la
mediana. Obtenga, además, la proporción de empleados con nivel técnico.

Media =

Mediana =

Proporción =
Estadística para Comunicadores 2020 01 156
3. La siguiente tabla muestra el registro de todos los clientes de una empresa de señal por cable del
distrito de Los Olivos. Las variables consideradas fueron: ingreso semanal (en dólares), número de
televisores en el hogar y nivel educativo alcanzado por el jefe de familia.

Ingreso N° Nivel Ingreso N° Nivel Ingreso N° Nivel


N° N° N°
semanal de tv educativo semanal de tv educativo semanal de tv educativo
1 100 3 Primaria 36 250 2 Primaria 71 400 3 Secundaria
2 80 2 Primaria 37 205 2 Primaria 72 220 2 Secundaria
3 100 3 Primaria 38 220 3 Primaria 73 230 2 Secundaria
4 85 1 Primaria 39 285 4 Primaria 74 300 2 Secundaria
5 105 2 Primaria 40 220 2 Primaria 75 340 3 Superior
6 110 2 Primaria 41 400 3 Primaria 76 420 2 Superior
7 102 4 Primaria 42 350 2 Primaria 77 550 2 Superior
8 110 2 Primaria 43 400 2 Primaria 78 430 2 Superior
9 90 2 Primaria 44 540 2 Primaria 79 690 3 Superior
1
130 3 Primaria 45 250 3 Primaria 80 500 2 Superior
0
1
180 1 Primaria 46 295 4 Primaria 81 430 2 Superior
1
1
90 3 Primaria 47 230 1 Primaria 82 620 3 Superior
2
1
104 3 Primaria 48 240 2 Primaria 83 400 3 Superior
3
1
100 2 Primaria 49 400 3 Primaria 84 630 2 Superior
4
1
90 2 Primaria 50 270 5 Primaria 85 585 1 Superior
5
1
80 1 Primaria 51 320 2 Secundaria 86 350 2 Superior
6
1
120 1 Primaria 52 295 2 Secundaria 87 520 2 Superior
7
1
85 1 Primaria 53 200 1 Secundaria 88 402 2 Superior
8
1
100 2 Primaria 54 335 1 Secundaria 89 220 3 Superior
9
2
98 3 Primaria 55 250 2 Secundaria 90 690 1 Superior
0
2
120 2 Primaria 56 250 3 Secundaria 91 420 2 Superior
1
2
105 2 Primaria 57 120 2 Secundaria 92 450 2 Superior
2
2
120 1 Primaria 58 130 2 Secundaria 93 530 2 Superior
3
2
250 3 Primaria 59 235 2 Secundaria 94 300 3 Superior
4
2
300 4 Primaria 60 500 3 Secundaria 95 335 1 Superior
5
2
120 2 Primaria 61 200 1 Secundaria 96 330 1 Superior
6
2
195 3 Primaria 62 395 2 Secundaria 97 380 2 Superior
7
Estadística para Comunicadores 2020 01 157
2
120 3 Primaria 63 330 3 Secundaria 98 230 2 Superior
8
2
250 2 Primaria 64 310 3 Secundaria 99 385 1 Superior
9
3
300 3 Primaria 65 300 3 Secundaria 100 303 2 Superior
0
3
250 2 Primaria 66 530 3 Secundaria 101 540 2 Superior
1
3
230 2 Primaria 67 540 2 Secundaria 102 490 3 Superior
2
3
150 2 Primaria 68 200 2 Secundaria 103 495 2 Superior
3
3
200 3 Primaria 69 285 1 Secundaria 104 340 3 Superior
4
3
190 1 Primaria 70 430 3 Secundaria        
5

a. Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado con la
posición seleccionada y los valores del ingreso semanal (en dólares) y número de televisores en el
hogar. Utilice la columna C1 de la tabla de números aleatorios.
b. Con la muestra obtenida estime el promedio de cada variable y la proporción de clientes que tienen
a lo más dos televisores.
Solución
a. Seleccione una muestra de 12 clientes aplicando el muestreo sistemático. Elabore un listado con la
posición seleccionada y los valores del ingreso semanal (en dólares) y número de televisores en el
hogar. Utilice la columna C1, C9 y C15 de la tabla de números aleatorios.

N
k= = =.. .. . .. .. . .. .. ..
Calculemos el valor de k, donde n El valor de k se redondea al valor
del entero menor, luego k =……………………… El arranque aleatorio (A) es …………………….…….

TABLA DE NÚMEROS ALEATORIOS


C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6

El cuadro con los datos es:


Estadística para Comunicadores 2020 01 158

Posición                        
Ingreso
                       
semanal
Número de
                       
televisores

b. Con la muestra obtenida estime la proporción de clientes que tienen a lo más dos televisores y la
media del ingreso semanal.
Estadística para Comunicadores 2020 01 159

Ejercicios de aplicación
1. La tabla muestra a los 120 alumnos de la facultad de Comunicaciones de la universidad A, a
quienes se les preguntó por su emisora radial preferida y por la cantidad de horas a la semana que
la escucha.
Id Radio Horas Id Radio Horas Id Radio Horas Id Radio Horas
1 Studio 92 6 31 Studio 92 4 61 Oxígeno 6 91 Planeta 4
2 Studio 92 10 32 Oxigeno 6 62 Oxígeno 9 92 Planeta 2
3 Studio 92 4 33 Oxigeno 7 63 Oxígeno 2 93 Planeta 11
4 Studio 92 2 34 Oxigeno 5 64 Oxígeno 5 94 Planeta 2
5 Studio 92 3 35 Oxigeno 8 65 Oxígeno 1 95 Planeta 3
6 Studio 92 6 36 Oxigeno 9 66 Oxígeno 4 96 Planeta 8
7 Studio 92 7 37 Oxigeno 4 67 Oxígeno 7 97 Planeta 6
8 Studio 92 6 38 Oxigeno 5 68 Oxígeno 6 98 Planeta 7
9 Studio 92 8 39 Oxigeno 2 69 Oxígeno 7 99 Planeta 9
10 Studio 92 9 40 Oxigeno 9 70 Oxígeno 8 100 Planeta 4
11 Studio 92 11 41 Oxígeno 6 71 Oxígeno 4 101 Planeta 8
12 Studio 92 3 42 Oxígeno 6 72 Oxígeno 5 102 Planeta 7
13 Studio 92 4 43 Oxígeno 8 73 Oxígeno 3 103 Planeta 7
14 Studio 92 2 44 Oxígeno 9 74 Oxígeno 6 104 Planeta 9
15 Studio 92 6 45 Oxígeno 4 75 Oxígeno 5 105 Planeta 6
16 Studio 92 4 46 Oxígeno 6 76 Oxígeno 8 106 Planeta 7
17 Studio 92 9 47 Oxígeno 7 77 Oxígeno 7 107 Planeta 9
18 Studio 92 5 48 Oxígeno 9 78 Oxígeno 9 108 Planeta 8
19 Studio 92 2 49 Oxígeno 8 79 Oxígeno 10 109 Planeta 3
20 Studio 92 7 50 Oxígeno 10 80 Oxígeno 3 110 Planeta 11
21 Studio 92 4 51 Oxígeno 12 81 Oxígeno 4 111 Planeta 13
22 Studio 92 6 52 Oxígeno 9 82 Oxígeno 3 112 Planeta 14
23 Studio 92 7 53 Oxígeno 9 83 Oxígeno 3 113 Planeta 9
24 Studio 92 8 54 Oxígeno 8 84 Oxígeno 5 114 Planeta 8
25 Studio 92 9 55 Oxígeno 4 85 Oxígeno 5 115 Planeta 6
26 Studio 92 10 56 Oxígeno 6 86 Oxígeno 8 116 Planeta 5
27 Studio 92 5 57 Oxígeno 7 87 Planeta 7 117 Planeta 7
28 Studio 92 4 58 Oxígeno 8 88 Planeta 6 118 Planeta 3
29 Studio 92 7 59 Oxígeno 7 89 Planeta 9 119 Planeta 6
30 Studio 92 8 60 Oxígeno 3 90 Planeta 9 120 Planeta 5
a. Seleccione una muestra sistemática de tamaño 13. Elabore un listado con los alumnos
seleccionados y el valor de la radio de su preferencia. Utilice las columnas C4, C10 y C6. Con la
muestra, calcule el porcentaje muestral de alumnos que escuchan radio Planeta.
b. Seleccione una muestra aleatoria de tamaño 10 mediante muestreo aleatorio simple. Elabore un
listado con los alumnos seleccionados y el valor de la cantidad de horas a la semana que escuchan
la radio de su preferencia. Utilice las columnas C14, C17 y C4 de la tabla de números aleatorios. Con
la muestra obtenida Estime el promedio y el coeficiente de variación de la cantidad de horas a la
semana que escuchan la radio de su preferencia.
c. Seleccione una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Utilice como
variable de estratificación: Radio. Elabore un listado con el alumno seleccionado y la cantidad de
horas a la semana que escucha la radio de su preferencia. Las columnas para cada estrato son:
Estrato 1 Estrato 2 Estrato 3
C16; C4; C12 C5; C10; C12; C1 C6; C7; C12; C4; C11; C7
Studio 92 Oxígeno Planeta
Estadística para Comunicadores 2020 01 160
Estime la media de horas a la semana que escuchan la radio de su preferencia la muestra
seleccionada.

2. El 1 de octubre del año pasado, los integrantes de la Federación de Periodistas del Perú celebraron
el Congreso Nacional de Periodistas. En ese acto congresal, se elaboró un listado de los asistentes
que laboran en los distintos medios periodísticos de la prensa indicando género y edad.

Id Género Edad Id Género Edad Id Género Edad Id Género Edad


Masculin
1 Masculino 12 11 45 21 Masculino 49 31 Femenino 56
o
2 Masculino 48 12 Femenino 54 22 Femenino 27 32 Femenino 56
3 Femenino 64 13 Femenino 61 23 Femenino 20 33 Femenino 62
Masculin Masculin
4 Masculino 70 14 66 24 Masculino 23 34 17
o o
Masculin Masculin
5 Femenino 56 15 30 25 Masculino 31 35 21
o o
Masculin Masculin
6 Masculino 50 16 48 26 Masculino 67 36 26
o o
Masculin
7 Masculino 47 17 Femenino 56 27 Masculino 44 37 51
o
8 Femenino 20 18 Femenino 29 28 Masculino 46 38 Femenino 31
Masculin
9 Masculino 35 19 22 29 Masculino 41 39 Femenino 45
o
Masculin
10 Masculino 28 20 24 30 Masculino 17 40 Femenino 63
o

a. Seleccione una muestra simple aleatoria de tamaño 13. Elabore un listado con el número
seleccionado y su valor para la variable edad (en años). Utilice las columnas C12, C7 y C16. Con la
muestra obtenida, estime la proporción de asistentes al evento y la edad promedio de los
asistentes.
b. Seleccione una muestra sistemática de tamaño 11. Elabore un listado con el número del asistente
seleccionado y su valor para la variable edad (en años). Utilice las columnas C14, C9 y C6. Con la
muestra, estime la proporción de hombres asistentes al evento y la edad media de los asistentes.

3. En la siguiente tabla se muestran los datos de 120 mujeres de un asentamiento humano de San
Juan de Lurigancho que han sufrido algún tipo maltrato familiar.
a. Obtenga una muestra aleatoria de tamaño 12 mediante muestreo aleatorio simple. Elabore un
listado con la posición del elemento seleccionado y el valor respectivo para la variable edad actual.
Para realizar la selección considere las columnas de la tabla de números aleatorios: C8, C1, C14,
C19.
Con la muestra obtenida estime la edad máxima para pertenecer al 20% de las mujeres maltratadas
más jóvenes y la proporción de mujeres maltratadas mayores de 30 años.
b. Obtenga una muestra aleatoria de tamaño 11 mediante muestreo sistemático. Elabore un listado
con la posición del elemento seleccionado y el valor respectivo para las variables razón de violencia
y estado civil. Para realizar la selección considere las columnas de la tabla de números aleatorios:
C15, C7, C9, C10. Con la muestra obtenida estime el porcentaje de mujeres cuya razón de violencia hacia
ellas fue la infidelidad y el porcentaje de mujeres convivientes.
c. Obtenga una muestra aleatoria de tamaño 12 mediante muestreo estratificado. Considere como
variable de estratificación <razón de violencia >. Elabore un listado con el número del elemento
Estadística para Comunicadores 2020 01 161
seleccionado (posición) y el valor respectivo para la variable edad actual. Para realizar la selección
considere las siguientes columnas de la tabla de números aleatorios.
Estrato Columnas
Celos C1, C17, C51, C8
Infidelidad C7, C13, C7, C19, C7
Problemas económicos C8, C1, C14, C5, C10, C15
Con la muestra obtenida, estime el porcentaje de mujeres que tienen por lo menos 25 años y la
moda de estado civil.
Estadística para Comunicadores 2020 01 162
Id. Razón de violencia Estado civil Edad actual Id. Razón de violencia Estado civil Edad actual
1 Celos Conviviente 18 61 Infidelidad Conviviente 20
2 Celos Conviviente 25 62 Infidelidad Casada 28
3 Celos Conviviente 29 63 Infidelidad Conviviente 25
4 Celos Casada 20 64 Infidelidad Conviviente 29
5 Celos Conviviente 27 65 Infidelidad Casada 35
6 Celos Conviviente 19 66 Infidelidad Conviviente 27
7 Celos Casada 22 67 Infidelidad Conviviente 19
8 Celos Conviviente 26 68 Infidelidad Conviviente 22
9 Celos Casada 45 69 Infidelidad Casada 26
10 Celos Casada 39 70 Infidelidad Casada 35
11 Celos Casada 52 71 Infidelidad Conviviente 39
12 Celos Conviviente 35 72 Infidelidad Casada 22
13 Celos Conviviente 41 73 Infidelidad Conviviente 32
14 Celos Casada 32 74 Infidelidad Casada 35
15 Celos Conviviente 35 75 Infidelidad Conviviente 27
16 Celos Casada 27 76 Infidelidad Conviviente 43
17 Celos Conviviente 33 77 Infidelidad Casada 35
18 Celos Conviviente 28 78 Infidelidad Casada 36
19 Celos Casada 26 79 Infidelidad Casada 28
20 Celos Conviviente 28 80 Infidelidad Conviviente 27
21 Celos Conviviente 27 81 Infidelidad Casada 21
22 Celos Conviviente 21 82 Infidelidad Casada 33
23 Celos Casada 33 83 Infidelidad Conviviente 33
24 Celos Casada 23 84 Infidelidad Conviviente 28
25 Celos Conviviente 41 85 Infidelidad Conviviente 44
26 Celos Casada 25 86 Infidelidad Casada 32
27 Celos Conviviente 35 87 Problemas económicos Casada 22
28 Celos Casada 33 88 Problemas económicos Conviviente 50
29 Celos Conviviente 28 89 Problemas económicos Conviviente 30
30 Celos Conviviente 23 90 Problemas económicos Casada 20
31 Celos Casada 31 91 Problemas económicos Conviviente 35
32 Celos Casada 23 92 Problemas económicos Casada 38
33 Celos Conviviente 29 93 Problemas económicos Conviviente 35
34 Infidelidad Conviviente 24 94 Problemas económicos Casada 20
35 Infidelidad Casada 36 95 Problemas económicos Casada 43
36 Infidelidad Conviviente 33 96 Problemas económicos Casada 28
37 Infidelidad Casada 25 97 Problemas económicos Conviviente 23
38 Infidelidad Conviviente 33 98 Problemas económicos Conviviente 31
39 Infidelidad Casada 30 99 Problemas económicos Conviviente 33
40 Infidelidad Casada 32 100 Problemas económicos Casada 29
41 Infidelidad Conviviente 28 101 Problemas económicos Casada 24
42 Infidelidad Conviviente 23 102 Problemas económicos Conviviente 36
43 Infidelidad Conviviente 31 103 Problemas económicos Conviviente 33
44 Infidelidad Casada 43 104 Problemas económicos Casada 45
45 Infidelidad Conviviente 29 105 Problemas económicos Conviviente 43
46 Infidelidad Casada 24 106 Problemas económicos Casada 43
47 Infidelidad Conviviente 36 107 Problemas económicos Casada 36
48 Infidelidad Casada 33 108 Problemas económicos Conviviente 21
49 Infidelidad Casada 45 109 Problemas económicos Conviviente 19
50 Infidelidad Conviviente 43 110 Problemas económicos Conviviente 38
51 Infidelidad Conviviente 36 111 Problemas económicos Casada 48
52 Infidelidad Casada 21 112 Problemas económicos Casada 29
53 Infidelidad Casada 19 113 Problemas económicos Conviviente 31
54 Infidelidad Conviviente 38 114 Problemas económicos Casada 29
55 Infidelidad Conviviente 48 115 Problemas económicos Casada 35
56 Infidelidad Casada 29 116 Problemas económicos Conviviente 32
57 Infidelidad Conviviente 31 117 Problemas económicos Conviviente 42
58 Infidelidad Casada 29 118 Problemas económicos Casada 33
59 Infidelidad Casada 35 119 Problemas económicos Casada 25
60 Infidelidad Casada 40 120 Problemas económicos Conviviente 43
Estadística para Comunicadores 2020 01 163

Unidad 4

Inferencia estadística

Logro
Al término de la unidad 4,
el estudiante
aplica las pruebas de hipótesis
en la solución de problemas comerciales.

Temario
 Prueba de hipótesis:
 Prueba de hipótesis para el promedio.
 Prueba de hipótesis para la proporción.
Estadística para Comunicadores 2020 01 164

Unidad 4. Inferencia estadística


Distribución t-Student
 Se dice que la variable aleatoria t sigue una distribución t con k grados de libertad.
 Para un valor de la variable aleatoria ta,k es tal que el área a su derecha bajo la curva de la
distribución t con k grados de libertad es igual a a .

Características de la distribución t-Student


 Es simétrica y tiene forma de campana.
 Su rango se extiende de -¥ a +¥.
 La media de toda variable es cero.
 Cada valor de grado de libertad determina una distribución t distinta.
 Cuando los grados de libertad son altos, los valores de la distribución t se asemejan con los valores
de la distribución normal estándar (n > 29).

Ejemplo
Para un valor de la variable aleatoria ta,k = t0,02,42 = 2,11952; es tal que el área a su derecha bajo la curva
de la distribución t con k = 42 grados de libertad es igual a a = 0,02.

 
 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
41 1.04971 1.30254 1.68288 1.79517 1.93428 2.01954 2.12117 2.24825 2.4208 2.70118 41
42 1.04939 1.30204 1.68195 1.79409 1.93298 2.01808 2.11952 2.24633 2.41847 2.69807 42
43 1.04908 1.30155 1.68107 1.79305 1.93173 2.01669 2.11794 2.24449 2.41625 2.69510 43
44 1.04879 1.30109 1.68023 1.79207 1.93054 2.01537 2.11644 2.24275 2.41413 2.69228 44
Estadística para Comunicadores 2020 01 165

Prueba de hipótesis

La prueba de hipótesis involucra una suposición sobre el valor de un parámetro de la población. A


partir de la información proporcionada por la muestra se verificará la suposición sobre el parámetro
estudiado.

La hipótesis que se contrasta se llama hipótesis nula (H 0).

La hipótesis que debe ser aceptada si se rechaza la hipótesis nula se llama hipótesis alternativa (H 1).

Partiendo de los resultados obtenidos de la muestra, o bien rechazamos la hipótesis nula H 0 a favor de
la alternativa, o bien no rechazamos la hipótesis nula y suponemos que nuestra estimación inicial del
parámetro poblacional podría ser correcto.

El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta; significa que los datos de la
muestra son insuficientes para inducir un rechazo de la hipótesis nula.

Tipos de errores

Conclusión

Condición de la población No rechazar H0 Rechazar H0

H0 verdadera Conclusión correcta Error de tipo I

H0 falsa Error de tipo II Conclusión correcta

Error tipo I Ocurre cuando se rechaza una hipótesis H0 que es verdadera. La


probabilidad de error tipo I viene a ser la probabilidad de rechazar H0
cuando ésta es cierta.

Error tipo II Ocurre cuando se acepta una hipótesis H0 que es falsa, la probabilidad
de error tipo II es la probabilidad de aceptar H0 cuando ésta es falsa.

Debido a que el valor real del parámetro es desconocido este error no


puede ser fijado.
Estadística para Comunicadores 2020 01 166

Nivel de significación
El nivel de significancia o nivel de significación es la probabilidad de cometer el error tipo I, es decir, la
probabilidad de tomar la decisión de rechazar la hipótesis nula cuando ésta es verdadera.

 = P(Rechazar H0/ H0 es verdadero)

El valor es fijado por la persona que realiza la investigación. Por lo general varía entre 1% y 10%,
aunque el valor usual es de 5%.

Pasos a seguir en una prueba de hipótesis

Pasos Ejemplo

Paso 1 Plantear las hipótesis H0: μ ≤ 10

H1: μ > 10

Paso 2 Fijar el nivel de significación α = 0,05

Paso 3 Calcular el estadístico de la


prueba

Paso 4 Graficar las regiones críticas

Paso 5 Aplicar los criterios de decisión El valor del estadístico de prueba


pertenece a la región crítica

Paso 6 Concluir Rechazo H0


Estadística para Comunicadores 2020 01 167

Prueba de hipótesis para la media poblacional


Consideramos el caso donde la población sigue una distribución normal y la desviación estándar de la
población σ no es conocida, por lo tanto, se estimará mediante la desviación estándar muestral, s.
En este caso, se utiliza la distribución t para hacer inferencia acerca del valor de la media de la
población.

Procedimiento para realizar la prueba de hipótesis para la media poblacional 

1. Plantear las hipótesis nula y alterna

{ H 0 : μ= μ0 ¿ ¿ ¿ ¿
2. Fijar el nivel de significación 

3. Establecer el estadístico de la prueba


X̄ − μo
S
√n ~ tn-1
El estadístico tiene una distribución t con (n – 1) grados de libertad.

4. Graficar las regiones críticas

Unilateral Izquierda H1:  < 0 Unilateral derecha H1:  > 0

Bilateral H1:  ¿ 0

5. Decidir: Rechazar H0 o no rechazar H0.


Estadística para Comunicadores 2020 01 168
6. Concluir
Estadística para Comunicadores 2020 01 169

Ejemplos

1. El fabricante de una marca de cigarrillos le afirma a un publicista que sus cigarrillos contienen, en
promedio, como máximo 18 miligramos de nicotina por cigarrillo. El publicista para verificar esta
afirmación y colocarla en el cartel publicitario examinó una muestra de 20 cigarrillos.

Con un nivel de significancia del 2,5% ¿podrá concluir que la afirmación dada por su cliente es cierta
si la muestra arrojó un contenido promedio de 19,2 miligramos con desviación estándar de dos
miligramos? Suponga que el contenido de nicotina se distribuye normalmente.
Solución
Sea X:= contenido de nicotina en los cigarrillos (en miligramos)
:= media poblacional de la cantidad de nicotina por cigarrillo

1. Hipótesis

{H0:μ≤18 ¿ ¿¿¿
2. Nivel de significación
α=0 , 025
3. Estadístico de la prueba
19 , 2−18
t c= =2 , 6833
2
√20
4. Regiones críticas

 
 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1 1.0690 1.7396 1.8618
7 3 1.33338 1 7 2.01500 2.10982 2.22385 2.36805 2.56693 2.89823 17
1 1.0671 1.7340 1.8553 2.10092
8 7 1.33039 6 4 2.00707 2.21370 2.35618 2.55238 2.87844 18
1 1.0655 1.7291 1.8495
9 1 1.32773 3 3 2.00002 2.09302 2.20470 2.34565 2.53948 2.86093 19
2 1.0640 1.7247 1.8443 2.08596
0 2 1.32534 2 3 1.99371 2.19666 2.33624 2.52798 2.84534 20
   

5. Decisión
Como 2,6833 pertenece a la región crítica, entonces, se rechaza H 0

6. Conclusión
Estadística para Comunicadores 2020 01 170
Con 2,5% de nivel de significancia no es posible afirmar que el contenido medio de nicotina en
los cigarrillos es superior a 18 miligramos. Por lo tanto, no es cierta la afirmación del
fabricante.
Estadística para Comunicadores 2020 01 171

Ejercicios
1. A partir de los datos de una muestra aleatoria de 101 estudiantes de publicidad seleccionados de
varias universidades de la ciudad capital, se estimó que su gasto promedio semanal en materiales
de estudios (fotocopias e impresiones) es de 32,5 soles con una desviación estándar de 10 soles.
Usando un nivel de significación del 5% ¿proporcionan estos datos suficiente evidencia para decir
que el verdadero gasto promedio semanal en materiales de estudios de los estudiantes de
publicidad es mayor a 30 soles?

Solución

Sea X:= ………………………………………………………..…………………………………..…………………………………..


:= media poblacional …………….…………………………………..…………………………………..……………

1. Hipótesis
{H0:μ..... ..... ..... ... . . ¿ ¿¿¿
2. Nivel de significación  = ……………….
3. Estadístico de la prueba

x́−μ0 −¿
= =¿ ¿
s
√n √

4. Regiones críticas

 
 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1.2910 1.6619 1.9048 2.0839 2.2050 2.6315
90 1.04244 3 6 1.77068 0 1.98667 4 4 2.36850 7 90
1.2905 1.6610 1.9035 2.0823 2.2031 2.6285
95 1.04212 3 5 1.76961 2 1.98525 3 7 2.36624 8 95
1.2900 1.6602 1.9023 2.0808 2.2015 2.6258
100 1.04184 7 3 1.76866 7 1.98397 8 0 2.36422 9 100
1.2896 1.6595 1.9013 2.0795 2.1999 2.6234
105 1.04158 7 0 1.76779 3 1.98282 8 8 2.36239 7 105

5. Decisión

6. Conclusión
Estadística para Comunicadores 2020 01 172
Estadística para Comunicadores 2020 01 173
2. Una cadena de restaurantes de comida rápida afirma en su anuncio publicitario: “Te atendemos en
menos de tres minutos”. Para corroborar esta afirmación se selecciona al azar una muestra de 50
clientes de uno de estos restaurantes encontrando que el tiempo medio de espera era de 2,75
minutos con una desviación estándar de 1,5 minutos. Si la variable tiene distribución normal ¿será
cierta la afirmación dada por esta cadena de restaurantes? Use un nivel de significancia del 5%.
Solución

Sea X:= ………………………………………………………..…………………………………..…………………………………..


:= ………………………………………………………………………………..…………………………………..……………

1. Hipótesis
{H0:μ.... .... .... .... .¿ ¿¿¿
2. Nivel de significación  = ……………….

3. Estadístico de la prueba

x́−μ0 −¿
= =¿ ¿
s
√n √

4. Regiones críticas

 
 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
1.2998 1.6779 1.9272 2.1123 2.2379 2.6845
47 1.04800 2 3 1.78937 9 2.01174 3 7 2.40835 6 47
1.2994 1.6772 1.9263 2.1110 2.2365 2.6822
48 1.04775 4 2 1.78855 0 2.01063 7 2 2.40658 0 48
1.2990 1.6765 1.9253 2.1098 2.2351 2.6799
49 1.04752 7 5 1.78776 5 2.00958 7 2 2.40489 5 49
1.2987 1.6759 1.9244 2.1087 2.2337 2.6777
50 1.04729 1 1 1.78700 4 2.00856 2 9 2.40327 9 50
5. Decisión

6. Conclusión
Estadística para Comunicadores 2020 01 174
Estadística para Comunicadores 2020 01 175

Ejercicios de aplicación

1. Antes de poder ver una película debe esperar hasta el final de los comerciales, anuncios y cortos de
películas. Una cadena de salas de cines afirma que la duración promedio de cualquier anuncio es
menor a dos minutos. Para probar esta afirmación, se seleccionan al azar 30 anuncios y se encontró
que, en promedio, duraban 1,85 minutos con una desviación estándar de 0,3 minutos ¿Será cierto
lo afirmado por la cadena de salas de cines? Use  = 1%. Suponga que la duración de los anuncios
en las salas de cine se distribuye normalmente. Rpta: tc = -2,739; RC = ]-; -2,46202[; Rechazo
H0

2. Unos estudiantes de periodismo y comunicación desean conocer el tiempo promedio que dura una
entrevista a un representante político en los noticieros nocturnos. Para realizar esta prueba
tomaron una muestra al azar de 14 noticieros obteniendo un tiempo promedio de 7,4 minutos y
una desviación estándar de 0,8 minutos. ¿Se puede afirmar que el tiempo promedio que dura una
entrevista es mayor a 7 minutos? Use α = 0,05. Rpta: tc = 1,871; RC = ]1,77903; +[;
Rechazo H0

3. Un reportaje periodístico sobre consumo de cigarrillos en jóvenes universitarios de Lima


Metropolitana indicó que el gasto promedio mensual en cigarrillos de jóvenes universitarios
fumadores es de 50 soles. Para comprobarlo, la oficina de Apoyo al Alumno de una universidad
selecciona al azar una muestra de 9 estudiantes que fuman y registró el gasto mensual en
cigarrillos, en soles. Los resultados obtenidos se muestran a continuación:

39 48 55 62 35 74 45 52 32

Suponga que el gasto mensual en cigarrillos tiene distribución normal, con un nivel de significancia
del 2% ¿será cierta la afirmación del reportaje?
Rpta: tc = -0,199; RC = ]-; -2,306[  ]2,306; +[; No rechazo
H0

4. El consejo municipal de una ciudad está considerando aumentar el número de agentes de policía
municipal en un esfuerzo por reducir los delitos. Si el número promedio de robos diarios es mayor a
ocho se aumentará el número de agentes. Para poder tomar una decisión el consejo municipal
tomó una muestra de 36 días y encontró que el número promedio de robos era de 8,5 con una
desviación estándar igual a dos. ¿Qué decisión tomará el consejo municipal? Suponga que el
número de robos sigue una distribución normal. Utilice un nivel de significación del 5%.
Rpta: tc = 1,50; RC = ]1,68957; +[; No
rechazo H0

5. De una empresa que se dedica a la venta de cámaras fotográficas profesionales se tomó una
muestra aleatoria de estos artículos y se registró el precio, en dólares. Los datos se presentan a
continuación:

1199 948 799 658 859 859 689 859 895 699 1299

Asumiendo que las ventas siguen una distribución normal. Pruebe la hipótesis que señala que el
verdadero precio promedio de las cámaras fotográficas es superior a 800 dólares. Utilice un nivel de
significación del 2%. Rpta: tc = 1,438; RC = ]2,35931; +[; No rechazo H0
Estadística para Comunicadores 2020 01 176

Prueba de hipótesis para una proporción poblacional


Esta prueba se realiza para verificar una suposición que se hace sobre una proporción poblacional. En
este caso se utilizará la distribución Z para realizar la inferencia.

Procedimiento para realizar la prueba de hipótesis para la proporción poblacional

1. Plantear las hipótesis nula y alterna

{ H 0 : p= p 0 ¿ ¿ ¿¿
2. Fijar el nivel de significación 
^p − p o
Z=
po (1− po )
3. Establecer el estadístico de la prueba
4. Graficar las regiones críticas
√ n ~ N(0, 1)

Unilateral Izquierda H1: p < p0 Unilateral derecha H1: p > p0

Bilateral H1 : p ¿ p0

5. Decidir: Rechazar H0 o no rechazar H0

6. Concluir
Estadística para Comunicadores 2020 01 177

Ejemplos
1. El administrador de un diario local afirma que menos del 5% de los diarios presentan errores de
impresión. Si en una muestra aleatoria de 60 diarios se encontró que seis de ellos presentaban errores de
impresión. Con un nivel de significación del 2,5%, ¿se puede afirmar que el administrador tiene razón?

Solución

El parámetro es p: proporción poblacional de diarios que presentan errores de impresión

1. Hipótesis

{H0:p≥0,05 ¿ ¿¿¿ p0 = 0,05

2. Nivel de significación
 = 0,025

3. Estadístico de prueba
6
−0,05
^p − p0 60
z= = =1,7770
p0 ( 1− p0 ) 0,05 × ( 1−0,05 )

4.
n √ 60
Regiones críticas

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
                     
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593

5. Decisión

Como 1,7770 no pertenece a la región crítica, entonces, no se rechaza H0.

6. Conclusión

Con un nivel de significancia del 2,5% no se puede afirmar que menos el 5% de los diarios
presenta error de impresión. La afirmación del administrador no es cierta.
Estadística para Comunicadores 2020 01 178
2. Un programa televisivo de investigación encontró el año pasado que el 40% de las denuncias que
recibían sus investigadores por correo electrónico eran por estafa. Este año se realizó un estudio
similar, en una muestra de 420 correos se encontró que en 188 de ellos eran denuncias por estafas.
¿Se puede afirmar que aumentó la proporción de denuncias por estafa? Use  = 0,05.

Solución

Sea el parámetro p:= proporción poblacional de denuncias que reciben los investigadores por
correo electrónico que son por estafa

1. Hipótesis

{H0:p≤0,40 ¿ ¿¿¿ p0 = 0,40

2. Nivel de significación  = 0,05

3. Estadístico de la prueba
188
−0,40
^p − p0 420
z= = =1,9913
p0 ( 1− p0 ) 0,40 × ( 1−0,40 )
√ n √420

4. Regiones críticas

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327

5. Decisión

Como 1,9913 pertenece a la región crítica, se rechaza H 0.

6. Conclusión

Con 5% de nivel de significación se puede afirmar que más del 40% de las denuncias que los
investigadores reciben por correo electrónico son por estafa; por ello, la afirmación es
verdadera, la proporción ha aumentado.
Estadística para Comunicadores 2020 01 179

Ejercicios

1. El 70% de las campañas publicitarias manejadas por la compañía Cuarzo tienen éxito. Para verificar
esta afirmación se seleccionaron aleatoriamente 80 campañas publicitarias, encontrándose que 50
de ellas tienen éxito. Con un nivel de significancia del 2% ¿será cierta la afirmación?
Solución
Sea p: proporción poblacional de ………………………………………..…………………………..……………………………..

1. Hipótesis
{H0:p... . .... . ... . ... ¿¿¿¿
2. Nivel de significación  = ……………….

3. Estadístico de la prueba

^p − p0 −¿
z= = ¿
p0 ( 1− p0 ) √ × ¿ ¿ ¿ ¿
√ n

4. Regiones críticas

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520

5. Decisión

6. Conclusión
Estadística para Comunicadores 2020 01 180
Estadística para Comunicadores 2020 01 181
2. El diario local afirmó que más del 33% de los estudiantes de la cierta universidad prefieren como
plato preferido el ceviche. El jefe del comedor universitario necesita contrastar dicha hipótesis,
para ello seleccionó una muestra aleatoria de 600 estudiantes preguntándoles ¿Cuál de los platos
que ofrece el comedor universitario es su preferido? El resultado se resume en el siguiente gráfico.

Distribución de estudiantes de cierta universidad según su plato preferido


40% 34.62%
35%
Porcentaje de alumnos

30%
25%
23.08%
20% 15.38% 15.38%
15%
10% 7.69%
3.85%
5%
0%
Lomo Saltado Ceviche de Pato Ají de gallina Carapulcra Tallarines Otros
Plato preferido
Fuente: Hipotética

Con un nivel de significancia del 10%, es posible afirmar lo manifestado por el diario local.

Solución
Sea p: ………………………………………………………..…………………………………..…………………………………..

1. Hipótesis
{H0:p... . .... . ... . ... ¿¿¿¿
2. Nivel de significación  = ……………….
3. Estadístico de la prueba
^p − p0 −¿ ¿
z= =
p0 ( 1− p0 ) √× ¿ ¿ ¿ ¿
√ n
4. Regiones críticas

5. Decisión

6. Conclusión
Estadística para Comunicadores 2020 01 182
3. El gerente de una tienda de cámaras fotográficas realizó un estudio entre género y el tipo de marca
de cámaras fotográficas que utilizan los estudiantes de Ciencias de la Comunicación de una
universidad, para ello se tomó una muestra aleatoria de 200 estudiantes. Los resultados procesados
se muestran en la siguiente tabla adjunta.

Distribución de estudiantes de Ciencias de la Comunicación


según género y marca de cámaras fotográficas que utilizan
Marca de cámaras fotográficas Total
Género Hasselblad Mamiya Nikon Pentax
Masculino 30 20 30 40 120
Femenino 20 15 30 15 80
Total 50 35 60 55 200

El gerente afirmó que menos del 25% de los estudiantes utilizan cámaras de la marca Nikon y son
de género femenino. Con un nivel de significancia del 3% ¿podemos afirmar lo dicho por el
gerente?
Solución
Sea p: ………………………………………………………..…………………………………..…………………………………..

1. Hipótesis
{H0:p... . .... . ... . ... ¿¿¿¿
2. Nivel de significación  = ……………….

3. Estadístico de la prueba

^p − p0 −¿ ¿
z= =
p0 ( 1− p0 ) √× ¿ ¿ ¿ ¿
√ n
4. Regiones críticas

5. Decisión

6. Conclusión
Estadística para Comunicadores 2020 01 183
Estadística para Comunicadores 2020 01 184
4. Un restaurante de comida rápida planea una oferta especial que permita a los clientes comprar
vasos con diseño especial con conocidos personajes de caricaturas. Si más del 15% de los clientes
compran esos vasos, se lanzará la promoción. En una prueba preliminar en varios locales, 176 de 1000
clientes los compraron ¿Se debe lanzar la promoción especial? Use un nivel de significación del 8%.

Solución
Sea p: ………………………………………………………..…………………………………..…………………………………..

1. Hipótesis
{H0:p... . .... . ... . ... ¿¿¿¿
2. Nivel de significación  = ……………….

3. Estadístico de la prueba

4. Regiones críticas

5. Decisión

6. Conclusión
Estadística para Comunicadores 2020 01 185

Ejercicios de aplicación
1. De acuerdo a los datos provistos por el Observatorio de Movilidad Urbana, en el año 2015 la mitad
de los vehículos de transporte público tenían más de 20 años de antigüedad. Este año, en un local
de la empresa “Revisiones Técnicas Vehiculares S.A.”, se recogió información de una muestra de
120 vehículos, de los cuales 54 tenían más de 20 años de antigüedad. ¿Se puede afirmar con un
2,5% de significación, que la proporción de vehículos antiguos de transporte público se ha
reducido? Rpta: zc = -1,095; RC = ]-;
-1,96[; No rechazo H0

2. Una encuesta realizada por una emisora radial a 814 adultos de Lima Metropolitana arrojó que 582
adultos consideraban que el principal problema de los accidentes de tránsito se debía al estado de
ebriedad de los conductores ¿Será cierto que más del 70% de adultos considera que el principal
problema se debe al estado de ebriedad de los conductores? Concluya para  = 0,02.
Rpta: zc = 0,933; RC = ]2,05; +[; No
rechazo H0

3. En abril del 2018, un diario de la capital publicó un artículo con información gráfica. Los resultados,
provenientes de una encuesta realizada a una muestra de 2735 limeños por una prestigiosa
encuestadora de la capital se presenta a continuación:

Distribución porcentual de limeños según situación laboral actual

¿Es posible concluir, en base a la información muestral, que menos del 60% de los limeños son
trabajadores independientes? Use  = 0,05. Rpta: zc = -4,270; RC = ]-; -1,64[;
Rechazo H0

4. Diferentes estudios indican que más del 80% de los usuarios usan los buscadores en la web para
encontrar información sobre productos y servicios antes de comprarlos. Para verificar esta
información se seleccionan al azar 200 personas, de las cuales 170 indicaron que realizaron
consultas en la web antes de comprar el producto o servicio. Con un nivel de significación del 2,5%
¿Hay razón para dar credibilidad a dicha afirmación? Rpta: zc = 0,933; RC = ]
2,05; +[; No rechazo H0
Estadística para Comunicadores 2020 01 186
5. Se cree que por lo menos el 20% de los estudiantes de la carrera de Ciencias de la Comunicación
desea trabajar en el extranjero al finalizar sus estudios. Una encuesta realizada a una muestra
aleatoria de 560 estudiantes se encontró que 85 estaban dispuestos a trabajar en el extranjero al
finalizar su carrera. A un nivel de significación del 4% ¿cuál es su conclusión?
Rpta: zc = -2,852; RC = ]-;
-1,75[; Rechazo H0
Estadística para Comunicadores 2020 01 187
6. El director de la empresa de cable Cablemás afirma que más del 75% de los televidentes con cable
tiene instalado Cablemás en los hogares del distrito A. Otra compañía de cable que va a realizar un
estudio, duda de tal afirmación y lo quiere comprobar. Para ello toma una muestra aleatoria de 600
hogares con servicio de cable y obtiene que 463 hogares tienen instalado el servicio de cable
Cablemás ¿Es cierto lo que afirma el director? Use un nivel de significación del 5%.
Rpta: zc = 1,226; RC = ]1,64; +[; No rechazo H0

7. Se realizó una encuesta a una muestra de 300 alumnos universitarios de Lima Metropolitana. Los
resultados obtenidos a la pregunta ¿Cuál es tu red social favorita? se muestran en el siguiente
gráfico.
Distribución porcentual de alumnos universitarios de Lima según red social favorita

Usando un nivel de significación del 4% ¿se puede afirmar que más del 30% de los alumnos
prefieren Facebook como red social favorita? Rpta: zc = 1,512; RC = ]1,75;
+[; No rechazo H0

8. Un estudio señalaba que más del 42% del total de personas con grado de instrucción superior, prefieren la
TV como medio de comunicación. Para probar esta afirmación se realizó un nuevo estudio. Los resultados
obtenidos de una muestra de 200 encuestados, de los cuales 80 tienen grado de instrucción superior, se
presenta en el siguiente gráfico.
Distribución de entrevistados según medio de comunicación por grado de instrucción
70%
62%
60%
48%
% de encuestados

50%
39% 42% 44% Periódico
40% T.V.
30%
30% Radio
20% 13% 14%
8%
10%
0%
Primaria Secundaria Superior
Grado de instrucción

¿Será cierta la afirmación del estudio inicial? Utilice un nivel de significación del 1%.
Estadística para Comunicadores 2020 01 188

Unidad 5

Regresión lineal
y correlación

Logro

Al finalizar la unidad 5,
el estudiante aplica
el modelo de regresión lineal simple
para predecir nuevos valores.

Temario
 Regresión lineal simple: Diagrama de dispersión. Modelo de
regresión lineal e interpretación de los coeficientes. Validez del
modelo y coeficientes de determinación y correlación.
Estadística para Comunicadores 2020 01 189

Unidad 5. Regresión lineal y correlación


Un aspecto importante de la Estadística es el análisis de dependencia entre dos o más variables.
Usualmente, es interesante conocer el efecto que una o varias variables pueden causar sobre
otra, e incluso predecir en mayor o menor grado valores en una variable a partir de otra.

Por ejemplo, quisiéramos responder a las siguientes preguntas:


¿Cuál será el gasto que incurrirá una familia cuyo ingreso familiar mensual es 4000 soles?
¿Cuál será el monto de ventas de una empresa si invierte en publicidad 10 000 dólares?
¿Existirá relación lineal entre la edad del cliente y el monto de las compras realizadas?

Análisis de regresión lineal simple y de correlación

El análisis de regresión lineal y de correlación comprende el estudio de los datos muestrales para
saber si dos variables cuantitativas están relacionadas entre sí en una población.

Análisis de En el análisis de regresión lineal se obtiene una ecuación matemática que


regresión describe cierta relación lineal. La ecuación puede usarse para estimar o
predecir los valores de una variable (Y) cuando se conocen o se suponen
lineal conocidos los valores de otra variable (X).

Análisis de En el análisis de correlación se tiene como objetivo principal medir el grado


correlación de asociación o la relación lineal existente entre dos variables. Es útil en un
trabajo exploratorio cuando el investigador desea encontrar el grado o la
fuerza de esa relación.

El diagrama de dispersión
El primer paso en el análisis de regresión es construir una gráfica de los datos muestrales en un
plano bidimensional.
X es la variable independiente
Y es la variable dependiente, variable que se va a predecir o estimar.

Esta gráfica denominada diagrama de dispersión, nos permite visualizar el tipo de tendencia entre
las dos variables. Esta tendencia puede ser lineal o no lineal. También se puede observar si es una
relación directamente proporcional o inversamente proporcional.

Relación directa entre X e Y Relación inversa entre X e Y Relación no lineal entre X e Y


Estadística para Comunicadores 2020 01 190

La ecuación de la recta estimada


Para encontrar la ecuación lineal se trabajará con los cuadros de resultados (salidas) que se
obtiene al procesar los datos con el SPSS. La línea recta tiene dos coeficientes de regresión: bo y b1

La ecuación de regresión será


^y i=b0 +b1 x i

Donde:
b1 : es la pendiente de la recta.
b0 : es el intercepto o punto de corte de la recta con el eje Y.
^y i : es el i-ésimo valor estimado de la variable Y, reemplazando los valores en la ecuación.
Xi : es el valor de X en la i-ésima observación.

Interpretación de los coeficientes de regresión

Intercepto b0 Indica el valor de la variable respuesta (Y), cuando la variable


independiente (X) es igual a cero. Sin embargo, carece de interpretación
práctica si dicho valor está fuera del rango del conjunto de valores de X.

Pendiente b1 Indica el cambio promedio (incremento o disminución) en la variable


respuesta (Y), cuando la variable independiente (X) aumenta en una
unidad.

El método de mínimos cuadrados


Para hallar la ecuación de la recta que mejor se ajuste a un conjunto de datos o puntos, el método
más utilizado es conocido como el método de mínimos cuadrados, cuya ecuación resultante tiene
dos características importantes:
n n
∑ ( ^yi− y i )=∑ ei=0
 La suma de las desviaciones de los puntos con relación a la recta es 0, i=1 i=1
 La suma de los cuadrados de las desviaciones es mínima, es decir ninguna otra recta daría una
menor suma de dichos cuadrados.
n
∑ e i2
Min i=1
La ecuación de la recta estimada mediante el paquete estadístico SPSS, se basa en el método de
mínimos cuadrados.
Estadística para Comunicadores 2020 01 191
Estadística para Comunicadores 2020 01 192

Ejemplo
Considere las siguientes variables
X: variable independiente := Tiempo de experiencia (en años)
Y: variable dependiente := Ingreso (en soles).

Ecuación de la recta estimada:


^y =2500+450 x
 La relación es directa
 La pendiente es positiva
 A más años de experiencia, mayor será el ingreso

Interpretación
b0 = 2500, cuando el empleado no tiene experiencia, su ingreso será de 2500 soles.
b1 = 450, por cada año de experiencia adicional, el ingreso del empleado se incrementa en 450
soles.

Ejercicio
De acuerdo al siguiente gráfico presente un ejemplo indicando la variable X y la variable Y. Escriba
cómo sería la ecuación de la recta.

Ejercicio
X: variable independiente := Tiempo de uso del vehículo (en años)
Y: variable dependiente := Precio de venta del vehículo (en dólares).

Suponga una ecuación de la recta estimada teniendo en cuenta la interpretación de los


coeficientes de regresión.

Interprete los coeficientes de regresión sugeridos.


Estadística para Comunicadores 2020 01 193

Validación del modelo de regresión lineal


No siempre la ecuación estimada es válida. Puede ocurrir que no exista pendiente, es decir que la
pendiente poblacional sea igual a 0. Esto significaría que no existe relación lineal entre las
variables X e Y. Es necesario entonces verificar si el modelo es válido.

Se realiza la prueba:
H0: β 1=¿ 0 No es válido el modelo
H1: β 1 ≠ 0 Sí es válido el modelo

Se compara el Sig o p-valor con .


 Si Sig es menor que  (Sig < ) entonces, se rechaza H0.
 Si Sig es mayor o igual que  (Sig  ) entonces, no se rechaza H0.

Supuestos de la regresión lineal


 Los errores o residuos tienen distribución normal.
 Los errores o residuos tienen media igual a cero y varianza igual a σ 2.
 Los errores o residuos aleatorios asociados a cualquier par de valores asociados a la variable
dependiente Y, no se encuentran autocorrelacionados.

Ejemplo 1
Se desea estimar el ingreso por ventas (en miles de dólares) en función del gasto en publicidad
(en miles de dólares). A continuación, se muestran los datos de los últimos ocho meses.

Gasto en publicidad 2 1 3 4 3 2 4 5
Ingresos por ventas 7 5 7 9 8 6 11 13

Valide el modelo. Use un nivel de significación del 5%.

Solución

Para dar validez al modelo usaremos la tabla de coeficientes de la salida del SPSS.

Coeficientes

Coeficientes no Coeficientes
estandarizados estandarizados
Modelo B Error típ. Beta t Sig.
1 (Constante) 2.500 .889 2.813 .031 Sig o p-valor
Gasto en publicidad 1.917 .274 .944 6.988 .000

H0: β 1=¿ 0 No es válido el modelo


H1: β 1 ≠ 0 Si es válido el modelo

Comparando Sig o p-valor con  : Sig.= p-valor = 0,00 <  = 0,05. Se rechaza H0.

Conclusión: Con un nivel de significación del 5%, se puede afirmar que el modelo lineal estimado
es válido.
Estadística para Comunicadores 2020 01 194

Coeficiente de determinación

SSR
r2=
El coeficiente de determinación (r2) se calcula de la siguiente manera: SST
El coeficiente de no determinación (1 - r2) se calcula de la siguiente manera:
SSR
(1−r 2 )=1−
SST

r2 siempre es positivo varía entre 0 y 1; 0 ≤ r2 ≤ 1

El coeficiente de determinación (r2 x 100%) expresa el porcentaje de la variabilidad total de Y que


es explicada por X en el modelo lineal estimado.

Cuando r2 es más cercano a 1, mejor será el ajuste de la recta a los datos.

Coeficiente de correlación

El coeficiente de correlación expresa el grado de asociación lineal que existe entre dos variables X
e Y, donde el coeficiente de correlación muestral se denota por r.

-1 ≤ r ≤ 1 varía dentro de este intervalo de -1 a 1.

 Cuando r = 0, entonces indicará que no existe correlación o asociación entre las variables.

 Cuando r se acerca -1 ó a 1 indicará que existe una asociación fuerte.

 Cuando r = -1 o r = 1, la correlación o asociación entre estas variables es perfecta.

El coeficiente de correlación r siempre tiene el signo de la pendiente b1

Si
 b1 y r son positivos, entonces la relación entre las variables es directa.
 b1 y r son negativos, entonces la relación entre las variables es inversa.

En los resultados del SPSS, el valor de r siempre lo muestra positivo. En el caso de que la
pendiente b1 sea negativa, se colocará también al coeficiente de correlación r el signo negativo.

El coeficiente de correlación muestral r es el estimador del coeficiente de correlación poblacional


 (ro).
Estadística para Comunicadores 2020 01 195

Ejemplo
El número de vendedores y los ingresos por ventas, en miles de soles, en una tienda para los
primeros seis meses del año fueron los siguientes:

Mes Enero Febrero Marzo Abril Mayo Junio


Número de vendedores 14 22 19 35 30 44
Ingreso por ventas 17,5 18,5 18,0 26,0 25,0 29,5

Resumen del modelob

R cuadrado Error típ. de la Durbin-


Modelo R R cuadrado corregida estimación Watson
1 .976a .953 .942 1.22561 2.085
a. Variables predictoras: (Constante), nro_vendedores
b. Variable dependiente: ingreso_por_ventas
Coeficientesa

Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 10.251 1.436 7.138 .002
nro_vendedores .445 .049 .976 9.038 .001
a. Variable dependiente: ingreso_por_ventas

a. Interprete el coeficiente de determinación.

Solución
El coeficiente de determinación es r2 = 0,953 y en porcentaje es 95,3%.

Interpretación
Del total de la variación de la variable <ingreso por ventas>, el 95,3% es explicado por el
modelo de regresión lineal estimado.

El 10,9% restante de la variabilidad de la variable <ingreso por ventas>, se debe a otros


factores no contemplados en el modelo.

b. Interprete el coeficiente de correlación.

Solución
SPSS siempre muestra el valor del coeficiente de correlación positivo. Por tanto, es importante
verificar su signo, que es siempre el mismo de la pendiente de la recta b 1.

En este caso b1 = 0,445 es un número positivo, por lo tanto, el coeficiente de correlación es un


número positivo r = 0,976.
Interpretación
Entre el número de vendedores y el ingreso por ventas existe una asociación lineal positiva y
fuerte, por ser su valor cercano a 1.
Estadística para Comunicadores 2020 01 196

Ejercicios de aplicación

1. Se desea estimar el ingreso por ventas (en miles de dólares) en función del gasto en publicidad
(en miles de dólares). A continuación, se muestran los datos de los últimos ocho meses.
Gasto en publicidad 2 1 3 4 3 2 4 5
Ingresos por ventas 7 5 7 9 8 6 11 13
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

Resumen del modelo


Modelo R R cuadrado R cuadrado ajustado Error estándar de la estimación
a
1 ,944 ,891 ,872 ,95015

Coeficientes
Coeficientes no estandarizados Coeficientes estandarizados
Modelo B Desv. Error Beta t Sig.
(Constante) 2,500 ,889 2,813 ,031
Gasto en publicidad 1,917 ,274 ,944 6,988 ,000

Solución
a. Defina las variables X e Y.

Variable independiente X:
Variable dependiente Y:

b. Presente el diagrama de dispersión. ¿Qué relación observa? Comente.

c. Estime la ecuación de la recta. Interprete los coeficientes de regresión estimados.

Interpretación
b0 =

b1 =

d. Estime las ventas cuando se invierte 4 500 dólares en publicidad.


Estadística para Comunicadores 2020 01 197
2. Se desea determinar un modelo para estimar la audiencia, en miles de televidentes, de un
programa televisivo que se transmite al mediodía en términos del número de regalos que se
entregan en el programa. Para ello se seleccionó al azar 10 días y se midió la cantidad de
televidentes.
Número de regalos 11 7 13 17 17 19 3 11 16 8
Audiencia diaria 20 12 21 26 22 30 10 15 26 13
A continuación, se presenta los resultados obtenidos mediante el SPSS.
Resumen del modelo
Modelo R R cuadrado R cuadrado corregida Error típico de la estimación
1 ,951 ,905 ,893 2,219
Coeficientes
Coeficientes no estandarizados Coeficientes tipificados
Modelo B Error típico Beta t Sig.
1 (Constante) 4,275 1,884 2,269 ,053
Número de regalos 1,248 ,143 ,951 8,707 ,000

Solución

a. Defina las variables X e Y.


Variable independiente X:
Variable dependiente Y:
b. Presente el diagrama de dispersión. ¿Qué relación observa? Comente.

c. Estime la ecuación de la recta. Interprete los coeficientes de regresión estimados.

Interpretación
b0 =

b1 =

d. Estime la audiencia diaria del programa cuando se hicieron 15 regalos.


Estadística para Comunicadores 2020 01 198
3. Indique qué valor de r2 y r le corresponde a cada gráfico, considerando los siguientes valores: r2 = 0,98;
r2 = 0,89 y r2 = 0,62. Además, indique el tipo de relación entre las variables.

Situación 1 Situación 2 Situación 3

Solución
Situación 1
El coeficiente de determinación es ……………………….

El coeficiente de correlación es ……………………., por tanto la relación entre las variables es


……………………….. y …………………………

Situación 2
El coeficiente de determinación es ……………………….
El coeficiente de correlación es ……………………., por tanto la relación entre las variables es
……………………….. y …………………………

Situación 3
El coeficiente de determinación es ……………………….
El coeficiente de correlación es ……………………., por tanto la relación entre las variables es
……………………….. y …………………………

4. Se desea estimar el ingreso por ventas (en miles de dólares) en función del gasto en publicidad
(en miles de dólares). A continuación, se muestran los datos de los últimos ocho meses.
Gasto en publicidad 2 1 3 4 3 2 4 5
Ingresos por ventas 7 5 7 9 8 6 11 13
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

Resumen del modelo


Modelo R R cuadrado R cuadrado ajustado Error estándar de la estimación
a
1 ,944 ,891 ,872 ,95015

Solución
a. Indique e interprete el valor del coeficiente de correlación.

b. Indique e interprete el valor del coeficiente de determinación.


Estadística para Comunicadores 2020 01 199
5. El gerente de ventas de una compañía quiere mostrar al grupo de vendedores la forma como
se relaciona el número de llamadas a clientes mensuales con el valor de pedidos que se
reciben. A continuación, se presenta la información muestral para el último año.
Pedidos (miles de dólares) 9,0 8,0 12,3 13,7 15,7 5,4 7,3 7,0 6,0 6,7 6,9 7,5
Número de llamadas 5 4 6 7 8 1 3 4 1 3 2 4
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

Resumen del modelo


Modelo R R cuadrado R cuadrado ajustado Error estándar de la estimación
1 ,941a ,886 ,875 1,16572

Coeficientes
Coeficientes no estandarizados Coeficientes estandarizados
Modelo B Desv. Error Beta t Sig.
(Constante) 3,199 ,718 4,454 ,001
Número de llamadas 1,398 ,159 ,941 8,814 ,000

Solución
a. Defina las variables X e Y.
Variable independiente X:
Variable dependiente Y:
b. Realice el diagrama de dispersión. ¿Qué relación observa?

c. Estime el modelo lineal e interprete los coeficientes de regresión.

Interpretación
b0 =

b1 =

d. Valide el modelo de regresión lineal. Use un nivel de significación del 5%.

e. Interprete el coeficiente de correlación y determinación.


Estadística para Comunicadores 2020 01 200
6. El gerente de una agencia desea analizar la relación que existe entre los años de experiencia y
las ventas anuales (en miles de dólares) y estimar las ventas en base a los años de experiencia.
Los resultados de una muestra de 9 publicistas, obtenidos en SPSS se presentan a
continuación:
Años de experiencia 2 3 4 6 8 10 10 11 13
Ventas anuales (miles de dólares) 97 92 102 103 111 119 123 117 136
La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:
Resumen del modelo
Modelo R R cuadrado R cuadrado ajustado Error estándar de la estimación
a
1 ,954 ,910 ,897 4,49444

Coeficientesa
Coeficientes no estandarizados Coeficientes estandarizados
Modelo B Desv. Error Beta t Sig.
(Constante) 85,441 3,399 25,134 ,000
años 3,448 ,410 ,954 8,412 ,000
a. Variable dependiente: ventas
a. Defina las variables X e Y.
X:
Y:
b. Realice el diagrama de dispersión. ¿Qué relación observa? Comente.

c. Encuentre el modelo estimado e interprete los coeficientes de regresión.

Interpretación
b0 =

b1 =

d. Valide el modelo de regresión. Utilice un nivel de significación del 5%.

e. Interprete el coeficiente de correlación y determinación.


Estadística para Comunicadores 2020 01 201

Ejercicios de aplicación

1. Para estimar el costo de la producción (en miles de dólares) por cada 15 minutos de animación
en 2D en función del número de dibujos (en unidades) realizados por las empresas dedicadas a
la animación, se tomó una muestra de 15 producciones realizadas por empresas de animación
del continente asiático. Los resultados obtenidos fueron:

Costo 36 21 34 48 54 56 68 26 19 26 33 42 38 33 32
Número de dibujos 250 150 280 390 460 550 190 200 106 180 250 300 380 294 300

Resumen del modelo


Modelo R R cuadrado R cuadrado corregida Error típico de la estimación
1 .604 .365 .317 11.350

Coeficientes
Coeficientes
Coeficientes no estandarizados
estandarizados
Modelo B Error típ. Beta t Sig.
(Constante) 17.992 7.788 2.310 .038
Número de dibujos .069 .025 .604 2.736 .017

a. Presente el modelo estimado e interprete el valor de la pendiente.


Rpta: ^y = 17,992 + 0,069 x
b. Valide el modelo estimado. Use un nivel de significación de 5%. Rpta: Sí es valido.
c. Indique el valor del coeficiente de correlación e interprete. Rpta: 0,604
d. Estime el costo de animación 2D si la producción está compuesta por 280 dibujos.
Rpta: 37,312

2. Un economista del departamento de recursos humanos de una empresa está preparando un


estudio sobre el comportamiento del consumidor. Él recolectó los datos de doce
consumidores, en miles de dólares, para determinar si existe una relación entre el ingreso del
consumidor y los niveles de consumo.

Consumidor 1 2 3 45 6 7 8 9 10 11 12
35,
Ingreso 24,3 12,5 31,2 28,0 10,5 23,2 10,0 8,5 15,9 14,7 15,0
1
24,
Consumo 16,2 8,5 15,0 17,0 11,2 15,0 7,1 3,5 11,5 10,7 9,2
2

La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:
Estadística para Comunicadores 2020 01 202
Estadística para Comunicadores 2020 01 203
a. Presente el diagrama de dispersión. Rpta:

b. Presente el modelo estimado. Rpta: ^y = 1,778 + 0,558 x


c. Valide e interprete el modelo de regresión. Utilice un nivel de significación del 5%.
Rpta: Sí es valido.
d. ¿Qué proporción de cada dólar adicional del ingreso se destina al consumo?
Rpta: 0,558

3. El número de vendedores y los ingresos por ventas (en miles de soles) en una tienda para los
primeros seis meses del año fueron los siguientes:

Mes Enero Febrero Marzo Abril Mayo Junio


Número de vendedores 14 22 19 35 30 44
Ingreso por ventas 17,5 18,5 18,0 26,0 25,0 29,5

La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

a. Trace el diagrama de dispersión ¿qué tipo de relación se deduce a partir del diagrama?
Rpta: Directa

b. Valide e interprete el modelo de regresión estimado. Utilice un nivel de significación del


5%. Rpta: Sí es válido
c. Estime el ingreso por ventas si el número de vendedores es igual a 25.
Rpta: 21,376
d. ¿Qué porcentaje de la variación de los ingresos por ventas sería explicado por la influencia
lineal del número de vendedores? Rpta: 95,3%.
Estadística para Comunicadores 2020 01 204
4. El gerente de ventas de una compañía se está preparando para una reunión y le gustaría
mostrar al grupo de vendedores la forma como se relaciona el número de visitas que ellos
realizan a los clientes con el monto total de compra realizado por el cliente. De sus registros se
recolectó la siguiente información muestral para el último año. Los datos fueron los siguientes:

Número de visitas 5 4 6 7 8 1 3 4 1 3
Monto de compra (miles de 8,7 7,1 13,7 15,1 16,7 2,2 4,6 7,5 2,3 6,1
dólares)

La salida obtenida por el SPSS después de procesar los datos se presenta a continuación:

a. Realice un diagrama de dispersión entre estas dos variables. ¿Podría ajustarse un modelo
de regresión lineal simple? Rpta: Sí

b. Valide el modelo de regresión lineal simple. Use un nivel de significancia del 5%.
Rpta: Sí es válido
c. Presente la ecuación estimada. Interprete los coeficientes estimados.
Rpta: ^y = -0,677 + 2,161 x
d. Interprete el valor del coeficiente de determinación y del coeficiente de correlación.
Rpta: 0,966 y 0,983
Estadística para Comunicadores 2020 01 205

Introducción al SPSS

Segmentar un archivo

1. Seleccione Datos

2. Elija en el menú desplegable Segmentar archivo…

3. Seleccione Comparar los grupos. Seleccione una o más variables de agrupación.

4. Pulse Aceptar para generar la distribución de frecuencias.


Estadística para Comunicadores 2020 01 206

Seleccionar casos de un archivo


1. Seleccione Datos

2. Elija en el menú desplegable Seleccionar casos…

3. Seleccione Si satisface la condición/ Si…

4. Introduzca la expresión condicional. Luego, pulse Continuar.


Estadística para Comunicadores 2020 01 207

Recodificar una variable en una nueva variable

1. Seleccione Transformar.

2. Elija en el menú desplegable Recodificar en distintas variables…

3. Seleccione la variable que desee recodificar en Variable numérica -> Variable de salida:
4. Introduzca el nombre de la nueva variable de resultado y pulse en Cambiar.

5. Pulse en Valores antiguos y nuevos y especifique cómo deben recodificarse los valores. Pulse
Continuar.

6. Pulse Aceptar para generar una nueva variable con los valores codificados 0 y 1.
Estadística para Comunicadores 2020 01 208

Tabla de distribución de frecuencias y gráficos de una variable cualitativa

1. Seleccione Analizar

2. Elija en el menú desplegable Estadísticos descriptivos.

3. Seleccione Frecuencias...

4. Seleccione la variable de la cual quiere obtener la tabla de distribución de frecuencias.

5. Si desea un desea realizar un gráfico de barras o circular, seleccione Gráficos… Pulse Continuar.

6. Pulse Aceptar para generar la tabla de distribución de frecuencias y un gráfico.


Estadística para Comunicadores 2020 01 209

Gráficos de una variable cualitativa

1. Seleccione Gráficos

2. Elija en el menú desplegable Generador de gráficos…

3. Haga clic en Aceptar.

4. Arrastre la imagen del gráfico que desee al centro.

5. Para que sea un gráfico en porcentaje, seleccione el menú desplegable Estadísticos: y elija
Porcentaje(?).

6. Pulse en Aceptar para generar el gráfico.


Estadística para Comunicadores 2020 01 210

Tabla de distribución de frecuencias de dos variables cualitativas (tablas de


doble entrada)
1. Seleccione Analizar.

2. Elija en el menú desplegable Estadísticos descriptivos.

3. Seleccione Tablas cruzadas.

4. Seleccione una variable de fila y una variable de columna.

5. Elija Casillas para obtener porcentajes: por fila, por columna o del total. Haga clic en Continuar.

6. Pulse en Aceptar para la tabla cruzada.


Estadística para Comunicadores 2020 01 211

Tabla de distribución de frecuencias y gráficos de dos variables cualitativas


1. Seleccione Gráficos.

2. Elija en el menú desplegable Generador de gráficos…

3. Haga clic en Aceptar.

4. Arrastre la imagen del gráfico que desee al centro.

5. Para que sea un gráfico en porcentaje, seleccione el menú desplegable Estadísticos: y elija
Porcentaje(?).

6. Para que un gráfico de barras apiladas al 100% elija Establecer parámetros.

7. Para hacer un gráfico de barras apiladas al 100%, elija Total para cada categoría del eje X.
Estadística para Comunicadores 2020 01 212

Tabla de distribución de frecuencias y medidas de resumen de una variable


cuantitativa
1. Seleccione Analizar.

2. Elija en el menú desplegable Estadísticos descriptivos.

3. Seleccione Frecuencias...

4. Seleccione la variable de la cual quiere calcular los estadísticos.

5. Haga clic en Estadísticos… y elija las medidas de resumen que desee calcular. Haga clic en Continuar.

6. Pulse en Aceptar para generar a tabla cruzada.


Estadística para Comunicadores 2020 01 213

Tabla de distribución de frecuencias y gráficos de una variable discreta


(gráfico de bastones)

1. Seleccione Analizar.

2. Elija en el menú desplegable Generador de gráficos…

3. Haga clic en Aceptar.

4. Arrastre la imagen del gráfico que desee al centro.

5. Para que sea un gráfico en porcentaje, seleccione el menú desplegable Estadísticos: y elija
Porcentaje(?)

6. Para que sea un gráfico en porcentaje, seleccione el menú desplegable Estilo de la barra: y elija Bigote.

7. Pulse en Aceptar para generar el gráfico.


Estadística para Comunicadores 2020 01 214
Estadística para Comunicadores 2020 01 215

Tabla de distribución de frecuencias y gráficos de una variable cuantitativa


(histograma)
1. Seleccione Analizar.

2. Elija en el menú desplegable Generador de gráficos…

3. Haga clic en Aceptar.

4. Arrastre la imagen del gráfico que desee al centro.

5. Para que sea un gráfico en porcentaje, seleccione el menú desplegable Estadísticos: y elija Porcentaje
de histograma.

6. Haga clic en Establecer parámetros para cambiar la cantidad de intervalos. Pulse Continuar.

7. Pulse en Aceptar para generar el histograma.


Estadística para Comunicadores 2020 01 216

Prueba de hipótesis para la media

1. Seleccione Analizar.

2. Elija en el menú desplegable Comparar medias.

3. Seleccione Prueba T para una muestra…

4. Seleccione la variable para la cual desee hacer la prueba de hipótesis de la media poblacional.
El Valor de prueba debe ser igual valor hipotético.

5. Elija Opciones… Ingrese en Porcentaje del intervalo de confianza el valor (100 - nivel de
significación)%, es decir, si el nivel de significación es igual al 5%, escriba 95%. Haga clic en
Continuar.

6. Pulse en Aceptar para generar la tabla de la Prueba T.


Estadística para Comunicadores 2020 01 217

Proceso para realizar una prueba de hipótesis con el reporte de SPSS


Estadística para Comunicadores 2020 01 218

Proceso para realizar la prueba de hipótesis con el reporte de SPSS

PRUEBA BILATERAL : Se compara directamente SIG con α

Identificar el valor SIG y comparar con α


1) Si: SIG < α → Se Rechaza Ho
2) Si: SIG > α → NO se Rechaza Ho

PRUEBA UNILATERAL : Se grafica la región de rechazo

CASO 1: CASO 2:

Si tcc está al OTRO LADO de la región de Si tcc está en el MISMO LADO de la región de

rechazo, entonces: rechazo, hay duda, entonces se compara:


1) Si: SIG/2 < α → Se Rechaza Ho
NO se Rechaza Ho
2) Si: SIG/2 > α → No se Rechaza Ho
Estadística para Comunicadores 2020 01 219

Ejemplo
Suponga que el peso, en kilogramos, de ciertos paneles publicitarios sigue una distribución
normal. Para realizar un control de calidad de los paneles, se tomaron al azar una muestra de 7 de
ellos, encontrándose los siguientes resultados:

Paneles 1 2 3 4 5 6 7
Peso (en kilos) 55,50 56,20 61,00 64,50 67,80 62,10 56,70

Se desea probar si la evidencia muestral permite suponer que el verdadero peso medio real de
estos paneles es menos de 59 kilos. Use un α = 0,05.

Solución

1. Hipótesis

{H0:μ≥59 ¿ ¿¿¿
La prueba es de cola izquierda.

2. Nivel de significación
α = 0,05

3. Prueba estadística: Salida obtenida con SPSS


Prueba para una muestra

Valor de prueba = 59
95% Intervalo de
confianza para la
Diferencia diferencia
t gl Sig. (bilateral) de medias Inferior Superior
peso .877 6 .414 1.54286 -2.7623 5.8481

4. Decisión

La prueba es de cola izquierda, por lo tanto, el valor crítico es negativo y el valor de tc es 0,877
tiene signo positivo, luego tc está al otro lado de la región de rechazo, entonces no se rechaza
H0.

5. Conclusión
Con 5% de nivel de significación y a partir de la información muestral, no es posible afirmar
que el peso medio real de los paneles sea menos de 59 kilos.
Estadística para Comunicadores 2020 01 220

Ejemplo
Se desea probar que el gasto promedio de un viaje es menor a 1000 soles a un nivel de
significación del 5%.

H0: µ  1000
H1: µ < 1000

Solución

1. Dibujamos la distribución t de Student y la región de rechazo. La región de rechazo está a la


izquierda, pues H1: µ < 1000, por lo tanto, el valor crítico es negativo.

-4 -3 -2 -1 00 1 2 3 4

El valor crítico es negativo.

2. Al realizar la prueba de hipótesis en SPSS se obtiene el siguiente resultado.

Estadísticas para una muestra


N Media Desv. Desviación Desv. Error promedio
Cantidad de dinero que gasta 582 964,30 855,305 35,454
aproximadamente en un viaje

Prueba para una muestra


Valor de prueba = 1000
Diferencia de 95% de intervalo de
medias confianza de la
Sig. diferencia
t gl (bilateral) Inferior Superior
Cantidad de dinero que gasta -1,007 581 ,314 -35,701 -105,33 33,93
aproximadamente en un viaje

De la tabla observamos que el valor calculado del estadístico de prueba tcal es -1,007, es decir
es un valor negativo. Esto quiere decir que ambos valores, el valor crítico y el valor calculado
tcal son negativos, por lo tanto, están en el “mismo lado”. Luego, se compara SIG/2 con α.

Como SIG/2 = (0,314/2) = 0,157 < α = 0,05, entonces no se rechaza H0.


Estadística para Comunicadores 2020 01 221

Ejemplo
Se desea probar que el número promedio de días que suele emplear en un viaje de turismo es
mayor a 7 a un nivel de significación del 5%.

H0: µ  7
H1: µ > 7

Solución

1. Dibujamos la distribución t de Student y la región de rechazo. La región de rechazo está a la derecha,


pues H1: µ > 7, por lo tanto, el valor crítico es positivo.

-4 -3 -2 -1 00 1 2 3 4

El valor crítico es positivo.

2. Al realizar la prueba de hipótesis en SPSS se obtiene el siguiente resultado.

Estadísticas para una muestra


Desv. Error
N Media Desv. Desviación promedio
Número de días que suele
emplear en un viaje de turismo 582 6,68 4,775 ,198

Prueba para una muestra


Valor de prueba = 7
95% de intervalo de
confianza de la
Sig. Diferencia diferencia
t gl (bilateral) de medias Inferior Superior
Número de días que suele -1,606 581 ,109 -,318 -,71 ,07
emplear en un viaje de turismo

De la tabla observamos que el valor calculado del estadístico de prueba tcal es -1,606, es decir
es un valor negativo. Esto quiere decir que el valor crítico es positivo y el valor calculado tcal es
negativo, por lo tanto, el tcal está en el “otro lado”, entonces no se rechaza H0.
Estadística para Comunicadores 2020 01 222

Ejemplo
Se desea probar que el número promedio de días que suele emplear en un viaje de turismo es
diferente a 7 a un nivel de significación del 5%.

H0: µ = 4
H1: µ  4

Solución

1. Dibujamos la distribución t de Student y la región de rechazo, la prueba es bilateral, pues H1: µ  4.

-4 -3 -2 -1 00 1 2 3 4

2. Al realizar la prueba de hipótesis en SPSS se obtiene el siguiente resultado.

Estadísticas para una muestra


N Media Desv. Desviación Desv. Error promedio
Número de personas con 582 3,65 2,282 ,095
las que viaja usualmente

Prueba para una muestra


Valor de prueba = 4
Sig. 95% de intervalo de
(bilateral) confianza de la
Diferencia diferencia
t gl de medias Inferior Superior
Número de personas con las -3,742 581 ,000 -,354 -,54 -,17
que viaja usualmente

De la tabla observamos que el Sig (bilateral) es 0,000. Como la prueba es bilateral se


compara SIG (bilateral) con α. Como SIG = 0,000 < α = 0,05; entonces se rechaza H0.
Estadística para Comunicadores 2020 01 223

Prueba de hipótesis para la proporción (versión 1)

1. Primero, establezca las hipótesis nula y alterna.

2. Use Analizar / Estadísticos descriptivos / Frecuencias…

3. Seleccione la variable de interés pásela a Variables: y haga clic en Aceptar.

4. Obtendrá la tabla de distribución de frecuencias, de la cual calculará la proporción muestral ^p.

Actividad en la que gasta la mayor cantidad de dinero


Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válido Transporte 50 8,6 8,6 8,6
Comida 109 18,7 18,7 27,3
Alojamiento 100 17,2 17,2 44,5
Diversión a = 174 29,9 29,9 74,4
Tours 91 15,6 15,6 90,0
Compras productos del lugar 58 10,0 10,0 100,0
Total n = 582 100,0 100,0

5. Calcule el valor
Z α en la tabla normal estándar.
1−
2

^p − p0
El valor del estadístico de prueba es p0 ( 1− p0 )
√ n
Estadística para Comunicadores 2020 01 224

Prueba de hipótesis para la proporción (versión 2)

1. Transforme la variable en estudio, poniendo 1 al valor deseado y 0 a los demás valores. Vea
Transformar -> Recodificar en distintas variables...

2. Seleccione Analizar.

3. Elija en el menú desplegable Comparar medias.

4. Seleccione Prueba T para una muestra…

5. Seleccione la variable para la cual desee hacer la prueba de hipótesis de la proporción poblacional. El
Valor de prueba debe ser igual valor hipotético.

6. Elija Opciones… Ingrese en Porcentaje del intervalo de confianza el valor (100 - nivel de significación)
%, es decir, si el nivel de significación es igual al 5%, escriba 95%. Haga clic en Continuar.

7. Pulse en Aceptar para generar la tabla de la Prueba T.


Estadística para Comunicadores 2020 01 225

Regresión lineal simple

1. Seleccione Analizar.

2. Elija en el menú desplegable Regresión.

3. Seleccione Lineales…

4. Seleccione la variable dependiente y variable independiente.

5. Pulse en Aceptar para realizar la regresión.


Estadística para Comunicadores 2020 01 226
Tabla 1
TABLA DE NÚMEROS ALEATORIOS

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4 8 2 4 6 6 3 5 4 5 6 0 5 2 6 9 8 0 0 9
9 2 9 8 1 4 4 1 9 8 5 1 1 9 7 9 8 5 9 0
0 2 1 3 3 9 1 6 2 9 7 1 2 6 6 0 7 5 6 4
9 6 0 8 3 5 6 6 6 4 0 8 6 3 4 8 1 8 5 4
1 6 4 1 6 5 2 7 7 2 9 9 9 9 7 4 1 5 4 9
2 9 0 5 5 0 8 4 8 7 4 6 2 1 7 0 1 5 8 7
6 1 2 9 5 0 4 0 9 8 2 0 2 6 8 7 0 1 9 7
1 3 1 8 9 9 0 1 2 6 3 7 1 9 6 1 7 9 9 8
4 5 8 1 1 4 5 6 7 9 9 9 2 1 3 2 3 7 7 9
0 0 3 6 9 6 5 0 6 4 7 9 8 1 2 4 4 8 3 6
7 2 4 5 4 1 2 4 4 6 9 2 6 6 6 5 2 0 0 4
4 9 3 4 4 2 4 5 9 0 8 7 4 8 4 2 1 2 5 4
6 1 2 8 1 3 3 2 0 2 6 0 7 2 7 9 1 4 6 5
9 3 4 0 8 1 3 3 7 3 2 4 8 6 7 9 0 6 2 8
1 8 7 1 3 4 3 9 3 1 7 8 3 7 3 3 0 8 3 5
0 2 1 4 7 5 7 3 1 1 9 3 3 8 7 4 8 0 2 5
3 6 3 4 1 9 8 1 0 9 0 1 1 0 9 3 6 8 6 0
9 4 6 7 6 7 9 1 2 2 7 2 3 9 3 4 6 9 8 1
5 9 9 8 4 4 5 9 1 5 4 7 3 0 6 8 1 6 8 1
8 1 8 8 2 3 9 1 4 2 4 9 1 4 0 6 0 3 2 8
0 5 3 8 0 4 3 9 4 6 0 8 8 3 8 7 1 2 2 3
9 7 1 4 2 7 5 5 2 8 6 6 3 5 5 9 9 0 6 8
6 9 5 9 4 9 1 8 2 0 2 5 3 9 1 2 0 3 0 8
7 4 9 1 4 8 8 6 6 8 5 9 4 8 5 7 7 9 6 7
3 8 1 2 2 4 0 1 4 5 7 7 4 0 4 8 9 4 7 0
9 9 9 7 8 0 0 9 3 2 7 0 5 0 2 7 8 7 3 6
4 8 1 5 8 5 5 1 4 9 6 4 4 4 7 4 5 7 5 0
8 6 7 3 6 1 7 1 1 3 5 5 7 4 4 7 6 7 2 8
4 7 1 4 0 3 6 2 4 4 4 4 0 3 6 3 4 1 2 8
6 5 5 8 8 4 3 4 8 9 0 6 7 6 0 0 8 6 8 4
9 2 0 9 8 2 8 3 4 3 2 8 9 4 8 7 9 4 9 4
1 3 7 9 4 8 3 7 0 8 6 6 6 8 4 1 1 3 1 3
3 3 2 5 6 7 6 1 6 6 1 7 6 5 8 1 6 2 2 7
9 9 9 8 2 8 8 1 9 1 6 2 7 5 1 8 6 1 4 4
1 7 5 4 0 9 5 7 8 7 5 0 8 6 6 2 5 3 2 3
2 7 1 7 8 8 3 8 6 9 9 2 7 4 5 9 5 6 6 6
6 0 9 2 6 1 5 1 2 3 1 8 1 2 0 8 6 4 4 0
3 3 6 3 4 9 6 4 4 9 8 5 7 3 3 4 2 3 2 8
0 1 9 7 9 7 9 4 4 1 6 6 7 7 0 7 9 8 6 8
4 7 1 5 3 7 0 9 2 5 2 1 0 0 4 0 4 6 8 8
7 8 9 9 6 8 5 6 8 1 9 2 7 5 1 7 0 1 5 5
2 2 3 3 1 8 1 9 8 4 2 8 5 2 8 1 7 6 4 6
2 6 6 4 1 4 8 1 0 6 0 1 3 4 0 9 1 2 8 6
5 1 9 0 3 9 1 6 1 7 8 8 2 8 0 7 8 4 8 0
9 0 5 8 4 9 2 2 3 9 8 5 9 5 7 8 4 9 9 4
8 6 1 9 2 5 0 0 7 9 0 0 7 4 5 4 8 6 2 3
1 9 1 0 9 7 5 1 2 7 1 9 4 8 4 8 9 6 6 9
5 6 0 6 1 3 3 5 2 1 0 1 9 2 8 0 2 6 6 3
8 6 9 9 8 0 8 1 8 2 6 6 8 4 0 7 8 2 5 1
3 1 6 1 0 5 7 5 7 0 6 3 0 4 1 4 0 3 0 8
Estadística para Comunicadores 2020 01 227
Tabla 2.1
TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal P(Z < z) = 

Z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.9 0.000033 0.000034 0.000036 0.000037 0.000039 0.000041 0.000042 0.000044 0.000046 0.000048
-3.8 0.000050 0.000052 0.000054 0.000057 0.000059 0.000062 0.000064 0.000067 0.000069 0.000072
-3.7 0.000075 0.000078 0.000082 0.000085 0.000088 0.000092 0.000096 0.000100 0.000104 0.000108
-3.6 0.000112 0.000117 0.000121 0.000126 0.000131 0.000136 0.000142 0.000147 0.000153 0.000159
-3.5 0.000165 0.000172 0.000178 0.000185 0.000193 0.000200 0.000208 0.000216 0.000224 0.000233
-3.4 0.000242 0.000251 0.000260 0.000270 0.000280 0.000291 0.000302 0.000313 0.000325 0.000337
-3.3 0.000349 0.000362 0.000376 0.000390 0.000404 0.000419 0.000434 0.000450 0.000466 0.000483
-3.2 0.000501 0.000519 0.000538 0.000557 0.000577 0.000598 0.000619 0.000641 0.000664 0.000687
-3.1 0.000711 0.000736 0.000762 0.000789 0.000816 0.000845 0.000874 0.000904 0.000935 0.000968
-3.0 0.001001 0.001035 0.001070 0.001107 0.001144 0.001183 0.001223 0.001264 0.001306 0.001350
                     
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.00240 0.00248 0.00256
-2.7 0.00264 0.00272 0.00280 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.00440 0.00453 0.00466
-2.5 0.00480 0.00494 0.00508 0.00523 0.00539 0.00554 0.00570 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.00820
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.00990 0.01017 0.01044 0.01072
-2.2 0.01101 0.01130 0.01160 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.01390
-2.1 0.01426 0.01463 0.01500 0.01539 0.01578 0.01618 0.01659 0.01700 0.01743 0.01786
-2.0 0.01831 0.01876 0.01923 0.01970 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
                     
-1.9 0.02330 0.02385 0.02442 0.02500 0.02559 0.02619 0.02680 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.03920 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.05050 0.05155 0.05262 0.05370 0.05480
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.07780 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08691 0.08851 0.09012 0.09176 0.09342 0.09510 0.09680
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.11900 0.12100 0.12302 0.12507 0.12714 0.12924 0.13136 0.13350 0.13567
-1.0 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
                     
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.21770 0.22065 0.22363 0.22663 0.22965 0.23270 0.23576 0.23885 0.24196
-0.6 0.24510 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.27760 0.28096 0.28434 0.28774 0.29116 0.29460 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.33360 0.33724 0.34090 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.37070 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.45620 0.46017
-0.0 0.46414 0.46812 0.47210 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.50000
Estadística para Comunicadores 2020 01 228

Tabla 2.2
TABLA DE LA DISTRIBUCION NORMAL ESTANDAR

Área bajo la curva normal P(Z < z) = 

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
                     
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
                     
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
                     
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999065 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999534 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999651
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758
3.5 0.999767 0.999776 0.999784 0.999792 0.999800 0.999807 0.999815 0.999822 0.999828 0.999835
3.6 0.999841 0.999847 0.999853 0.999858 0.999864 0.999869 0.999874 0.999879 0.999883 0.999888
3.7 0.999892 0.999896 0.999900 0.999904 0.999908 0.999912 0.999915 0.999918 0.999922 0.999925
3.8 0.999928 0.999931 0.999933 0.999936 0.999938 0.999941 0.999943 0.999946 0.999948 0.999950
3.9 0.999952 0.999954 0.999956 0.999958 0.999959 0.999961 0.999963 0.999964 0.999966 0.999967
Estadística para Comunicadores 2020 01 229
Tabla 3.1
TABLA DE LA DISTRIBUCION T-STUDENT

Área bajo la curva P(T > c) = 

 
 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
0.3249 0.7265 1.3763 1.9626 3.0776 6.3137 7.9158 10.5788 12.706 15.8945 21.2049 31.8205 63.6567
1 2 4 8 1 8 5 2 9 2 4 5 2 4 1
0.2886 0.6172 1.0606 1.3862 1.8856 2.9199 3.3197 4.3026
2 8 1 6 1 2 9 6 3.89643 5 4.84873 5.64278 6.96456 9.92484 2
0.2766 0.5843 0.9784 1.2497 1.6377 2.3533 2.6054 3.1824
3 7 9 7 8 4 6 3 2.95051 5 3.48191 3.89605 4.5407 5.84091 3
0.2707 0.5686 0.9409 1.1895 1.5332 2.1318 2.3328 2.7764
4 2 5 6 7 1 5 7 2.60076 5 2.99853 3.29763 3.74695 4.60409 4
0.2671 0.5594 0.9195 1.1557 1.4758 2.0150 2.1909 2.5705
5 8 3 4 7 8 5 6 2.42158 8 2.75651 3.00287 3.36493 4.03214 5
0.2648 0.5533 1.1341 1.4397 1.9431 2.1043 2.4469
6 3 8 0.9057 6 6 8 1 2.31326 1 2.61224 2.82893 3.14267 3.70743 6
0.2631 0.5491 0.8960 1.1191 1.4149 1.8945 2.0460 2.3646
7 7 1 3 6 2 8 1 2.24088 2 2.51675 2.71457 2.99795 3.49948 7
0.2619 0.5459 0.8888 1.1081 1.3968 1.8595 2.0041
8 2 3 9 5 2 5 5 2.18915 2.306 2.44898 2.63381 2.89646 3.35539 8
0.2609 0.5434 1.0997 1.3830 1.8331 1.9726 2.2621
9 6 8 0.8834 2 3 1 5 2.15038 6 2.39844 2.5738 2.82144 3.24984 9
1 0.2601 0.5415 0.8790 1.0930 1.3721 1.8124 2.2281 1
0 8 3 6 6 8 6 1.9481 2.12023 4 2.35931 2.52748 2.76377 3.16927 0
   
1 0.2595 0.5399 0.8755 1.0876 1.3634 1.7958 1.9284 2.2009 1
1 6 4 3 7 3 8 3 2.09614 9 2.32814 2.49066 2.71808 3.10581 1
1 0.2590 0.5386 0.8726 1.0832 1.3562 1.7822 1.9123 2.1788 1
2 3 2 1 1 2 9 1 2.07644 1 2.30272 2.4607 2.681 3.05454 2
1 0.2585 0.8701 1.0794 1.3501 1.7709 1.8988 2.1603 1
3 9 0.5375 5 7 7 3 7 2.06004 7 2.2816 2.43585 2.65031 3.01228 3
1 0.2582 0.5365 0.8680 1.0762 1.3450 1.7613 2.1447 1
4 1 5 5 8 3 1 1.8875 2.04617 9 2.26378 2.4149 2.62449 2.97684 4
1 0.2578 0.5357 0.8662 1.0735 1.3406 1.7530 1.8777 2.1314 1
5 9 3 4 3 1 5 4 2.03429 5 2.24854 2.39701 2.60248 2.94671 5
1 0.5350 0.8646 1.0711 1.3367 1.7458 1.8692 2.1199 1
6 0.2576 1 7 4 6 8 8 2.02400 1 2.23536 2.38155 2.58349 2.92078 6
1 0.2573 0.5343 0.8632 1.0690 1.3333 1.7396 1.8618 2.1098 1
7 5 8 8 3 8 1 7 2.01500 2 2.22385 2.36805 2.56693 2.89823 7
1 0.2571 0.5338 0.8620 1.0671 1.3303 1.7340 1.8553 2.1009 1
8 2 2 5 7 9 6 4 2.00707 2 2.2137 2.35618 2.55238 2.87844 8
1 0.2569 0.5333 0.8609 1.0655 1.3277 1.7291 1.8495 2.0930 1
9 2 1 5 1 3 3 3 2.00002 2 2.2047 2.34565 2.53948 2.86093 9
2 0.2567 0.5328 0.8599 1.0640 1.3253 1.7247 1.8443 2.0859 2
0 4 6 6 2 4 2 3 1.99371 6 2.19666 2.33624 2.52798 2.84534 0
   
2 0.2565 0.5324 0.8590 1.0626 1.3231 1.7207 1.8396 2.0796 2
1 8 6 7 7 9 4 5 1.98804 1 2.18943 2.32779 2.51765 2.83136 1
2 0.2564 0.5320 0.8582 1.0614 1.3212 1.7171 1.8354 2.0738 2
2 3 8 7 5 4 4 2 1.98291 7 2.18289 2.32016 2.50832 2.81876 2
2 0.5317 0.8575 1.0603 1.3194 1.7138 1.8315 2.0686 2
3 0.2563 5 3 4 6 7 7 1.97825 6 2.17696 2.31323 2.49987 2.80734 3
2 0.2561 0.5314 0.8568 1.0593 1.3178 1.7108 1.8280 1.97399 2.0639 2.17154 2.30691 2.49216 2.79694 2
Estadística para Comunicadores 2020 01 230
4 7 4 6 2 4 8 5 4
2 0.2560 0.5311 0.8562 1.0583 1.3163 1.7081 1.8248 2.0595 2
5 6 5 4 8 5 4 3 1.97010 4 2.16659 2.30113 2.48511 2.78744 5
2 0.2559 0.5308 0.8556 1.0575 1.3149 1.7056 1.8218 2.0555 2
6 5 9 7 2 7 2 6 1.96651 3 2.16203 2.29581 2.47863 2.77871 6
2 0.2558 0.5306 0.8551 1.0567 1.3137 1.7032 1.8191 2.0518 2
7 6 5 4 3 0 9 3 1.96320 3 2.15782 2.29091 2.47266 2.77068 7
2 0.2557 0.5304 0.8546 1.0559 1.3125 1.7011 1.8165 2.0484 2
8 7 2 5 9 3 3 9 1.96014 1 2.15393 2.28638 2.46714 2.76326 8
2 0.2556 0.5302 0.8541 1.3114 1.6991 1.8142 2.0452 2
9 8 1 9 1.0553 3 3 4 1.95729 3 2.15033 2.28217 2.46202 2.75639 9
3 0.2556 0.5300 0.8537 1.0546 1.3104 1.6972 1.8120 2.0422 3
0 1 2 7 6 2 6 5 1.95465 7 2.14697 2.27826 2.45726 2.75000 0
   
3 0.2555 0.5298 0.8533 1.0540 1.3094 1.6955 1.8100 2.0395 3
1 3 4 7 6 6 2 0 1.95218 1 2.14383 2.27461 2.45282 2.74404 1
3 0.2554 0.5296 0.8530 1.3085 1.6938 1.8080 2.0369 3
2 6 7 0 1.0535 7 9 9 1.94987 3 2.1409 2.2712 2.44868 2.73848 2
3 0.5295 0.8526 1.0529 1.3077 1.6923 1.8062 2.0345 3
3 0.2554 0 5 8 4 6 9 1.9477 2 2.13816 2.26801 2.44479 2.73328 3
3 0.2553 0.5293 0.8523 1.0524 1.3069 1.6909 1.8046 2.0322 3
4 4 5 2 8 5 2 1 1.94567 4 2.13558 2.26501 2.44115 2.72839 4
3 0.2552 0.5292 0.8520 1.0520 1.3062 1.6895 1.8030 2.0301 3
5 8 1 1 2 1 7 2 1.94375 1 2.13316 2.26219 2.43772 2.72381 5
3 0.2552 0.5290 0.8517 1.0515 1.3055 1.8015 2.0280 3
6 3 8 2 8 1 1.6883 3 1.94195 9 2.13087 2.25953 2.43449 2.71948 6
3 0.2551 0.5289 0.8514 1.0511 1.3048 1.6870 1.8001 2.0261 3
7 8 5 4 7 5 9 2 1.94024 9 2.12871 2.25702 2.43145 2.71541 7
3 0.2551 0.5288 0.8511 1.0507 1.3042 1.6859 1.7987 2.0243 3
8 3 3 8 7 3 5 8 1.93863 9 2.12667 2.25465 2.42857 2.71156 8
3 0.2550 0.5287 0.8509 1.3036 1.6848 1.7975 2.0226 3
9 8 1 4 1.0504 4 8 1 1.93711 9 2.12474 2.2524 2.42584 2.70791 9
4 0.2550 0.5286 0.8507 1.0500 1.3030 1.6838 1.7963 2.0210 4
0 4 1 0 5 8 5 1 1.93566 8 2.12291 2.25027 2.42326 2.70446 0
Estadística para Comunicadores 2020 01 231
Tabla 3.2

TABLA DE LA DISTRIBUCION T-STUDENT

Área bajo la curva P(T > c) = 

 
 0.4 0.3 0.2 0.15 0.1 0.05 0.04 0.03 0.025 0.02 0.015 0.01 0.005
0.255 0.528 0.850 1.049 1.302 1.682 1.795 1.934 2.019 2.121 2.248 2.420 2.701
41 00 50 48 71 54 88 17 28 54 17 25 8 18 41
0.254 0.528 0.850 1.049 1.302 1.681 1.794 1.932 2.018 2.119 2.246 2.418 2.698
42 96 40 26 39 04 95 09 98 08 52 33 47 07 42
0.254 0.528 0.850 1.049 1.301 1.681 1.793 1.931 2.016 2.117 2.244 2.416 2.695
43 92 31 06 08 55 07 05 73 69 94 49 25 10 43
0.254 0.528 0.849 1.048 1.301 1.680 1.792 1.930 2.015 2.116 2.242 2.414 2.692
44 88 22 87 79 09 23 07 54 37 44 75 13 28 44
0.254 0.528 0.849 1.048 1.300 1.679 1.791 1.929 2.014 2.115 2.241 2.412 2.689
45 85 14 68 52 65 43 13 41 10 00 08 12 59 45
0.254 0.528 0.849 1.048 1.300 1.678 1.790 1.928 2.012 2.113 2.239 2.410 2.687
46 82 05 51 25 23 66 23 33 90 64 49 19 01 46
0.254 0.527 0.849 1.048 1.299 1.677 1.789 1.927 2.011 2.112 2.237 2.408 2.684
47 79 98 34 00 82 93 37 29 74 33 97 35 56 47
0.254 0.527 0.849 1.047 1.299 1.677 1.788 1.926 2.010 2.111 2.236 2.406 2.682
48 76 90 17 75 44 22 55 30 63 07 52 58 20 48
0.254 0.527 0.849 1.047 1.299 1.676 1.787 1.925 2.009 2.109 2.235 2.404 2.679
49 73 83 02 52 07 55 76 35 58 87 12 89 95 49
0.254 0.527 0.848 1.047 1.298 1.675 1.787 1.924 2.008 2.108 2.233 2.403 2.677
50 70 76 87 29 71 91 00 44 56 72 79 27 79 50
     
0.254 0.527 0.848 1.047 1.298 1.675 1.786 1.923 2.007 2.107 2.232 2.401 2.675
51 67 69 73 08 37 28 27 56 58 62 5 72 72 51
0.254 0.527 0.848 1.046 1.298 1.674 1.785 1.922 2.006 2.106 2.231 2.400 2.673
52 65 63 59 87 05 69 58 72 65 55 27 22 73 52
0.254 0.527 0.848 1.046 1.297 1.674 1.784 1.921 2.005 2.105 2.230 2.398 2.671
53 62 57 46 67 73 12 91 91 75 53 09 79 82 53
0.254 0.527 0.848 1.046 1.297 1.673 1.784 1.921 2.004 2.104 2.228 2.397 2.669
54 60 51 33 48 43 56 26 14 88 55 95 41 98 54
0.254 0.527 0.848 1.046 1.297 1.673 1.783 1.920 2.004 2.103 2.227 2.396 2.668
55 58 45 21 30 13 03 64 39 04 61 85 08 22 55
0.254 0.527 0.848 1.046 1.296 1.672 1.783 1.919 2.003 2.102 2.226 2.394 2.666
56 55 40 09 12 85 52 04 67 24 70 79 80 51 56
0.254 0.527 0.847 1.045 1.296 1.672 1.782 1.918 2.002 2.101 2.225 2.393 2.664
57 53 35 97 95 58 03 46 97 47 82 77 57 87 57
0.254 0.527 0.847 1.045 1.296 1.671 1.781 1.918 2.001 2.100 2.224 2.392 2.663
58 51 30 86 78 32 55 90 30 72 97 79 38 29 58
0.254 0.527 0.847 1.045 1.296 1.671 1.781 1.917 2.001 2.100 2.223 2.391 2.661
59 49 25 76 62 07 09 37 65 00 15 84 23 76 59
0.254 0.527 0.847 1.045 1.295 1.670 1.780 1.917 2.000 2.099 2.222 2.390 2.660
60 47 20 65 47 82 65 85 03 3 36 92 12 28 60
     
0.254 0.527 0.847 1.045 1.295 1.670 1.780 1.916 1.999 2.098 2.222 2.389 2.658
61 45 15 55 32 58 22 34 42 62 6 04 05 86 61
0.254 0.527 0.847 1.045 1.295 1.669 1.779 1.915 1.998 2.097 2.221 2.388 2.657
62 44 11 46 18 36 80 86 84 97 86 18 01 48 62
0.254 0.527 0.847 1.045 1.295 1.669 1.779 1.915 1.998 2.097 2.220 2.387 2.656
63 42 06 36 04 13 40 39 27 34 15 35 01 15 63
0.254 0.527 0.847 1.044 1.294 1.669 1.778 1.914 1.997 2.096 2.219 2.386 2.654
64 40 02 27 90 92 01 93 72 73 45 55 04 85 64
0.254 0.526 0.847 1.044 1.294 1.668 1.778 1.914 1.997 2.095 2.218 2.385 2.653
65 39 98 19 77 71 64 49 19 14 78 77 10 60 65
Estadística para Comunicadores 2020 01 232
0.254 0.526 0.847 1.044 1.294 1.668 1.778 1.913 1.996 2.095 2.218 2.384 2.652
66 37 94 10 64 51 27 06 68 56 14 02 19 39 66
0.254 0.526 0.847 1.044 1.294 1.667 1.777 1.913 1.996 2.094 2.217 2.383 2.651
67 36 90 02 52 32 92 65 18 01 51 29 30 22 67
0.254 0.526 0.846 1.044 1.294 1.667 1.777 1.912 1.995 2.093 2.216 2.382 2.650
68 34 87 94 40 13 57 24 69 47 90 58 45 08 68
0.254 0.526 0.846 1.044 1.293 1.667 1.776 1.912 1.994 2.093 2.215 2.381 2.648
69 33 83 86 28 94 24 85 22 95 30 89 61 98 69
0.254 0.526 0.846 1.044 1.293 1.666 1.776 1.911 1.994 2.092 2.215 2.380 2.647
70 31 80 79 17 76 91 47 77 44 73 23 81 90 70
     
0.254 0.526 0.846 1.043 1.292 1.665 1.774 1.909 1.992 2.090 2.212 2.377 2.642
75 25 64 44 65 94 43 73 67 10 08 16 1 98 75
0.254 0.526 0.846 1.043 1.292 1.664 1.773 1.907 1.990 2.087 2.209 2.373 2.638
80 19 50 14 20 22 12 21 84 06 78 49 87 69 80
0.254 0.526 0.845 1.042 1.291 1.662 1.771 1.906 1.988 2.085 2.207 2.371 2.634
85 14 37 87 80 59 98 87 23 27 74 13 02 91 85
0.254 0.526 0.845 1.042 1.291 1.661 1.770 1.904 1.986 2.083 2.205 2.368 2.631
90 10 26 63 44 03 96 68 80 67 94 04 50 57 90
0.254 0.526 0.845 1.042 1.290 1.661 1.769 1.903 1.985 2.082 2.203 2.366 2.628
95 06 16 42 12 53 05 61 52 25 33 17 24 58 95
10 0.254 0.526 0.845 1.041 1.290 1.660 1.768 1.902 1.983 2.080 2.201 2.364 2.625 10
0 02 08 23 84 07 23 66 37 97 88 50 22 89 0
10 0.253 0.526 0.845 1.041 1.289 1.659 1.767 1.901 1.982 2.079 2.199 2.362 2.623 10
5 99 00 06 58 67 50 79 33 82 58 98 39 47 5
11 0.253 0.525 0.844 1.041 1.289 1.658 1.767 1.900 1.981 2.078 2.198 2.360 2.621 11
0 96 92 90 34 30 82 01 39 77 39 61 73 26 0
12 0.253 0.525 0.844 1.040 1.288 1.657 1.765 1.898 1.979 2.076 2.196 2.357 2.617 12
0 91 80 63 93 65 65 64 74 93 31 20 82 42 0
0.253 0.524 0.841 1.036 1.281 1.644 1.750 1.880 1.959 2.053 2.170 2.326 2.575
∞ 35 40 62 43 56 84 69 79 97 75 09 35 83 ∞
Estadística para Comunicadores 2020 01 233

Índice

Axiomas de la probabilidad, 72 probabilístico, 107


Censo, 12, 91 sistemático, 126
Coeficiente de variación, 53 Nivel de significancia, 139
Correlación, 155 Observación, 9
Distribución de frecuencias Parámetro, 21
variable cualitativa, 27 Población, 9
Distribución normal, 79 Probabilidad
Distribución t-Student, 137 Definición clásica de, 72
Escalas de medición, 17 Teoremas básicos de, 72
Estadístico, 21 Prueba de hipótesis, 138
Eventos media poblacional, 140
mutuamente excluyentes, 71 proporción poblacional, 145
Ficha técnica, 108 Tipos de errores, 138
Gráfico Rango, 55
circular, 28 de una variable aleatoria, 79
de barras, 28 Registro administrativo, 13
de barras apiladas al 100%, 65 Regresión, 155
de bastones, 28 Coeficiente de correlación, 159
histograma, 28 Coeficiente de determinación, 159
Inferencia estadística, 137 coeficientes de regresión, 156
Media, 35 diagrama de dispersión, 155
Mediana, 38 ecuación de la recta estimada, 156
Medidas de asimetría, 44 Supuestos, 158
Medidas de posición: Cuantiles, 46 Validación, 158
Medidas de resumen, 34 Tabulaciones cruzadas, 60
Medidas de tendencia central, 35 Tamaño de muestra
Medidas de variabilidad o dispersión, 50 media de una población, 93, 94, 95
Moda, 41 proporción poblacional, 94
Muestra, 9 Variable, 14
Muestreo, 12, 91 Variable aleatoria
aleatorio simple, 109 definición, 79
estratificado, 116