Está en la página 1de 160

Licenciatura en Administración de Empresas

Estadística
Introducción a la Estadística
[1.1] ¿Por qué estudiar estadística?

[1.2] Tipos de investigación: científica y estadística

1
TEMA
Esquema

Introducción a la estadística

TEMA 1 – Esquema
Importancia de la estadística

Tipos de investigación

Pura Aplicada

Histórica Descriptiva Experimental

Transversal Longitudinal

© Universidad Internacional de La Rioja en México (UNIR)


Estadística
Estadística

Ideas clave

En los enlaces web que se muestran a continuación, encontrarás información suficiente


acerca del surgimiento de esta ciencia formidable, y de cómo ha contribuido al desarrollo
de otras disciplinas y sobre todo, al de la humanidad.
» Concetos básicos de investigación y estadísticas:
http://moodlelandivar.url.edu.gt/url/oa/fi/ProbabilidadEstadistica/Lectura%20conce
ptos%20b%C3%A1sicos.pdf
» Papel de la estadística en la investigación científica:
http://www.monografias.com/trabajos11/padelaest/padelaest.shtml

1.1. ¿Por qué estudiar estadística?

En el desarrollo de muchas actividades del ser humano, continuamente surgen grandes


flujos de información cuantitativa y cualitativa. Por medio de la metodología de la
estadística dicha información se puede corregir, ordenar, presentar y analizar,
con el objeto de interpretarla y de esta forma tomar mejores decisiones.

La estadística con sus dos ramas: descriptiva e inferencial, es una herramienta


muy valiosa que nos sirve para administrar la información que surge de un proceso,
extraer conclusiones y de esta forma hacer los ajustes necesarios para mejorarlo.

La metodología de la estadística es fundamental cuando se requiere recopilar la


información adecuada para un estudio o investigación.

Por medio de la estadística es posible efectuar estudios de tipo descriptivo y


explicativo en muchas áreas de la ciencia.

En la medida en que se conozcan más las técnicas de la Estadística, se podrá interpretar


mejor la información y, por lo tanto, extraer conclusiones con un mayor grado de
confianza.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

1.2. Tipos de investigación: científica y estadística

¿Qué es investigar?

Es una actividad humana orientada a la búsqueda de nuevos conocimientos. Es un


proceso sistematizado y organizado que incluye recopilación de datos,
información y toda aquella evidencia que sea útil para el avance científico.

Dentro de los objetivos de la investigación está el generar información medible y


comprobable que constituya una aportación sería a la generación del conocimiento.
Los diferentes tipos de la investigación científica aplicada: histórica, descriptiva y
experimental, permiten el desarrollo de análisis de hechos en distintos escenarios.

En este contexto el papel de la estadística es determinante. La estadística descriptiva


recopila, corrige, ordena, presenta y analiza la información que surge de los
procesos de una investigación que puede ser histórica o bien descriptiva. La aplicación
de esta metodología permite calcular resultados preliminares que el investigador
puede utilizar para revisar la efectividad de un proceso.

La estadística inferencial mediante la aplicación de la teoría de probabilidad formula


modelos en base al valor y frecuencia de los resultados con el objeto de conocer
el comportamiento de los valores que se van obteniendo y poder establecer un patrón.

La necesidad de desarrollar un proceso de investigación puede ser generada a partir


de la prueba de una hipótesis. En este sentido, la estadística inferencial con una
metodología específica provee a la investigación experimental de una herramienta que le
permite efectuar contrastes considerando todos los elementos posibles y sobre todo
tomar decisiones: se acepta o se rechaza la hipótesis, con una posibilidad de error muy
pequeña.
La información que fluye en el proceso de investigación de un fenómeno ocurre en
tiempo presente, sin embargo, es importante determinar cuál será el
comportamiento de este en el futuro y bajo otras condiciones. Aquí, la
estadística inferencial aplica procedimientos de pronóstico muy cercanos a la realidad.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer…

Mitos y realidades de la Estadística

La lectura de este documento te permitirá conocer cuáles son los principales mitos que
se han creado acerca de la Estadística y cómo, a partir de análisis formales, se ha
demostrado con hechos que dicha disciplina es un apoyo fundamental para los
desarrollos científicos.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.mundoestadisticacimat.mx/pdfs/mitos.pdf

No dejes de ver…

Historia de la Estadística

El vídeo muestra los inicios de la Estadística, así como los avances y las contribuciones
más notables.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=lTnJLGhmW8k

TEMA 1 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

+ Información

A fondo

La estadística

El siguiente documento contiene un análisis muy completo de la Estadística. Su lectura


seguramente reforzará tus conocimientos acerca de esta ciencia. Es un compendio de
estadística, historia, conceptos, métodos, aplicaciones e importancia.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.monografias.com/trabajos91/acerca-estadistica/acerca-estadistica.shtml

Clasificación de la investigación científica

También es recomendable la lectura del siguiente documento en el que encontrarás


conceptos clave acerca de la Investigación científica, diferentes tipos y aplicaciones.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
www.poldsaenz.sld.cu/scproyecto/metodologia%201.doc

Bibliografía

Tapia, F. J. (2010) Notas de Estadística aplicada a la Administración. Universidad de


Sonora.

Levine, D. M., Krehbiel, T. C. y Berenson, M. (2006) Estadística Descriptiva. México:


Pearson.

Levin, R. (2004). Estadística para Administración y Economía. México: Pearson.

TEMA 1 – Test © Universidad Internacional de La Rioja en México (UNIR)


Estadística descriptiva e inferencial
[2.1] El muestreo

[2.2] Tipos de muestreo

[2.3] Tipos de muestreo y probabilidad

[2.4] Muestreo aleatorio y probabilidad

[2.5] Delimitación del muestreo

2
TEMA
Esquema

TEMA 2 – Esquema
El muestreo

Tipos de muestreo

Tipos de muestreo y Muestreo aleatorio y


probabilidad probabilidad

Delimitación del
muestreo
Estadística

© Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ideas clave

Para estudiar este tema deberás leer el capítulo VI páginas 154 a 171, sobre muestreo y
algunos tópicos sobre aplicaciones a la economía. El enlace web para tener acceso a este
material es: http://herzog.economia.unam.mx/profesor/barajas/estadis/parte4.pdf
Así mismo, es recomendable complementar la lectura mediante el vídeo:
https://www.youtube.com/watch?v=zGtk_Ii9VBs

2.1. El muestreo

Accede al vídeo «Población, muestra y muestreo» a través del aula virtual

El muestreo es un procedimiento que se utiliza para recopilar información de interés


para un estudio estadístico, a través de la extracción de una porción denominada muestra
estadística, que se toma de una población específica.

De esta forma, se define la muestra como la parte de la población que se


selecciona para llevar a cabo un estudio. Es importante considerar que en lugar de llevar
a cabo un censo completo de toda la población, los métodos del muestreo estadístico se
concentran en seleccionar un pequeño conjunto de datos que sea representativo y que
permita mediante un análisis formal, estimar las características de toda la población.

¿Qué ventajas tiene extraer una muestra?

» Una muestra es más fácil de gestionar


» Requiere menos tiempo para su análisis
» Su manejo es menos costoso
» Una muestra da mayor validez al estudio
» Es muy útil cuando la población es muy grande o es infinita
» Ahorra recursos cuando los elementos observados se tienen que destruir en la
observación.

Es importante considerar que antes de aplicar el método de muestreo que sea adecuado,
se debe definir el marco. Este está compuesto por una serie de registros de los elementos
que forman la población, tales como: directorios, mapas, listas, es decir, los marcos

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

son fuentes de datos, y las muestras se extraen de los marcos


correspondientes.

Accede al ejercicio de autoevaluación a través del aula virtual

2.2. Tipos de muestreo

Accede al vídeo «Muestreo no probabilístico» a través del aula virtual

El primer paso antes de extraer la muestra es seleccionar el marco, la elección de un


marco inadecuado podría conducir a la extracción de una muestra errónea, y los
resultados de su análisis serían completamente inútiles.

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Muestreo aleatorio
simple

Muestreo sistemático

Muestreo estratificado

Métodos de Métodos
Muestreo por
muestreo probabilísticos conglomerados

Muestreo de áreas
Métodos no Muestreo con fines
probabilísticos especiales Muestreo polietápico

Muestreo de cuotas

Muestreo por
conveniencia Muestreo de juicio

En el esquema se pueden apreciar los diferentes métodos de muestreo, comenzando con


la clasificación más general: métodos probabilísticos y métodos no probabilísticos.

Cada uno de los métodos anteriores se deriva en diferentes aplicaciones cuyo empleo
depende de la naturaleza del estudio estadístico que se deba llevar a cabo.

Muestreo no probabilístico

Los métodos no probabilísticos no sirven para hacer generalizaciones ya que, al


utilizarlos para hacer un estudio, no se puede tener certeza de que la muestra extraída
sea representativa, debido a que no todos los elementos de la población tienen la misma
probabilidad de ser elegidos y por tanto formar parte de la muestra.

En el muestreo por cuotas, por ejemplo, el investigador debe conocer muy bien los
estratos de la población o a los individuos adecuados para un estudio, desde luego este
método no tiene aleatoriedad, y es muy utilizado en las encuestas de opinión. Para
aplicarlo, en primer lugar, se establecen cuotas formadas por un determinado número
de elementos que reúnen ciertas características. Una vez determinada la cuota, se eligen
los primeros individuos que cumplen con los requisitos que se requieren en el estudio.

En el muestreo por conveniencia, los sujetos de una investigación se seleccionan


debido a que se tiene fácil acceso a ellos, y para incluirlos no se considera ninguna
característica específica. Un ejemplo muy común es cuando se utilizan estudiantes
voluntarios para una investigación.

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Para utilizar el muestreo de juicio los componentes de la muestra se seleccionan de


acuerdo con la opinión de algún experto que piensa que los elementos que recomienda
contribuirán en forma importante para responder una pregunta de investigación. El
muestreo de juicio se puede utilizar en estudios de mercado, pero en forma muy
moderada.

El muestreo con fines especiales se utiliza cuando en un estudio se deben considerar


grupos muy específicos, por ejemplo, personas con alguna preferencia, o bien con gustos
especiales.

Muestreo Probabilístico

Los elementos que forman parte de una muestra probabilística se seleccionan en base a
valores de probabilidad conocidos. Estos son los métodos más recomendados, ya que
permiten la extracción de muestras cuyo análisis conduce a la elaboración de inferencias
sin sesgo acerca de la población de interés.

Accede al ejercicio de autoevaluación a través del aula virtual

2.3. Tipos de muestreo y probabilidad

Accede al vídeo «Muestreo probabilístico» a través del aula virtual

Los métodos de muestreo que se utilizan y que tienen como herramienta fundamental la
aplicación de la teoría de probabilidad son: muestreo aleatorio simple, muestreo
sistemático, muestreo estratificado, muestreo por conglomerados,
muestreo de áreas y muestreo polietápico.

El hecho de utilizar los diferentes métodos de muestreo junto con la teoría de


probabilidad permite que todos los individuos de la población tengan la
misma oportunidad de formar parte de la muestra, y de esta forma asegurar que el
grupo extraído para un estudio específico no tenga ninguna tendencia y por tanto sea
confiable.

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Muestreo aleatorio simple

El método se denomina así, porque su forma de aplicación permite que todos los
individuos de la población tengan la misma probabilidad de pertenecer a la muestra. Es
un muestreo probabilístico por medio del cual es posible hacer inferencias
estadísticas, así como calcular las probabilidades de error asociadas a las mismas.

El método permite extraer muestras representativas de la población, sin ningún


tipo de sesgo, lo que las hace más confiables para un estudio.

Dada una población de tamaño N, cuyos elementos están numerados, la extracción de


una muestra de tamaño n se puede llevar a cabo mediante el empleo de números
aleatorios. Los números aleatorios no siguen ninguna ley ni fórmula, y no tienen
relación entre sí. Aunque existen talas de números aleatorios, se pueden utilizar las
funciones de Excel para generarlos.

En la categoría Matemáticas y trigonométricas se encuentran las funciones ‘Aleatorio’ y


‘Aleatorio entre’. Un ejemplo: Suponga que de una población de tamaño N= 800,
debemos extraer una muestra aleatoria simple de tamaño n= 50.

La solución sería la siguiente. Utilizando la función de Excel


=ALEATORIO.ENTRE(1,800), generamos los cincuenta números aleatorios

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

dentro de los límites marcados por el tamaño de la población. Una parte de estos
números es: 145, 339, 284, 628, 384,…, una vez que se tienen los cincuenta números
aleatorios, se extraen de la población los elementos cuyo número coincide con el
correspondiente de la lista. El procedimiento de muestreo aleatorio simple se puede
utilizar como herramienta auxiliar en la aplicación de otros métodos de
muestreo probabilístico.

Para extraer una muestra sistemática de tamaño ‘n’, se escoge al azar un número
entero menor al tamaño N de la población, dicho número que es el de inicio, se
asigna al primer elemento que se va a extraer y que formará parte de la muestra. A
continuación, se establece el valor del intervalo de selección que es la diferencia
constante entre cada número asignado a los elementos que se van a extraer. El valor de
dicho intervalo se calcula dividiendo el tamaño de la población entre el tamaño de la
muestra. Así, por ejemplo, extraer una muestra sistemática de tamaño n= 25, de una
población de tamaño N= 100. La solución es: tamaño del intervalo = N/ n = 100/ 25 =

Escogemos en forma aleatoria un número entre 1 y 4, y a partir de él obtenemos los


elementos restantes de la muestra. El número de inicio es el 3, por tanto:
3, 7, 11, 15, 19, 23, 27, 31, 35, …, 99

De manera que, considerando que los elementos de la población están numerados, la


composición de la muestra se efectúa extrayendo de la población los elementos
correspondientes a los números calculados en la progresión anterior.

En el muestreo estratificado se divide la población en subgrupos, cada subgrupo


es un estrato. Es importante considerar que la muestra deberá estar formada por
elementos de cada uno de los estratos en la misma proporción en que componen la
población.

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Los estratos más comunes son: género, edad, religión, nivel socioeconómico, nivel de
escolaridad y nacionalidad. El muestreo aleatorio estratificado se emplea cuando el
estudio que se va a realizar requiere resaltar las características de un grupo en particular,
o bien para analizar las relaciones entre los diferentes estratos.

Veamos un ejemplo. Se desea extraer una muestra de tamaño n=50 del grupo de
funcionarios de una empresa cuya composición es la siguiente:

TIPO NÚMERO PORCENTAJE


Mujeres con maestría 20 20
Hombres con maestría 20 20
Mujeres con licenciatura 30 30
Hombres con licenciatura 30 30
Total 100 100

TIPO PORCENTAJE NÚMERO


Mujeres con maestría 20 10
Hombres con maestría 20 10

Mujeres con licenciatura 30 15


Hombres con licenciatura 30 15
Total 100 50

La aplicación del muestreo por conglomerados requiere que la población de interés


se divida en diferentes conglomerados. Aunque el conglomerado que más se utiliza en la
investigación es el geográfico, es posible utilizar otras opciones.

Para llevar a cabo un estudio específico, el investigador debe seleccionar, en primer lugar,
los conglomerados de interés, y extraer los componentes de la muestra por medio de
muestreo aleatorio simple o de muestreo aleatorio sistemático.

Veamos un ejemplo. Una empresa de telefonía quiere lanzar al mercado un nuevo


servicio que en paquete ofrece también señales para Internet y televisión. La zona de
interés se ha dividido en cien manzanas, y en forma aleatoria se han seleccionado cinco
manzanas para extraer una muestra piloto.

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

A continuación, se ha interrogado a cada familia acerca de si estarían interesados en


contratar el nuevo servicio. Se desea estimar la proporción de hogares interesados en
contratar el nuevo servicio. Los resultados se muestran en la siguiente tabla:

Manzana No de familias en la manzana No de familias interesadas


1 10 3
2 12 5
3 11 3
4 8 2

5 9 2

El total de familias entrevistadas es 50, y el número de familias interesadas es 15, por lo


15
tanto, la proporción de familias interesadas en el nuevo servicio es 𝑝𝑝̂ = 50 ∗ 100 = 30%

El muestreo probabilístico por áreas se denomina también muestreo probabilístico en


racimos. Por falta de listas ordenadas, se delimitan áreas geográficas por medio de planos
(pueden ser manzanas en una colonia o delegación), se eligen al azar las áreas a
muestrear y por medio de muestreo aleatorio simple se determinan los elementos a
entrevistar en las áreas de interés hasta completar la muestra que se requiere para el
estudio. Se puede apreciar que se aplica en la misma forma que el muestreo por
conglomerados.

El muestreo Polietápico, es un caso particular del muestreo por conglomerados. El


procedimiento se aplica en dos etapas, eligiendo en primer lugar los conglomerados, de
interés y en segundo lugar, por medio de muestreo aleatorio simple, los elementos que
van a conformar la muestra.

Hay que considerar que el procedimiento se puede aplicar en más etapas y que estas son
sucesivas. Por ejemplo, para llevar a cabo un estudio acerca de la efectividad de la
educación preescolar, se pueden establecer las siguientes etapas:

» Seleccionar al azar cinco delegaciones en el Distrito Federal


» En cada delegación seleccionar tres centros educativos
» En cada centro educativo seleccionar al azar un grupo de grado preescolar
» Finalmente, de cada grupo seleccionar por medio de muestreo aleatorio simple, el
número de individuos que se requiere para conformar la muestra.

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Accede al ejercicio de autoevaluación a través del aula virtual

2.4. Muestreo aleatorio y probabilidad

Para que las conclusiones obtenidas al analizar una muestra se puedan aplicar en forma
confiable y sea posible hacer inferencias válidas sobre el total de individuos de la
población de interés, es necesario que sea representativa.

El proceso denominado ‘muestreo aleatorio’, es una forma de obtener una muestra


representativa, mediante el empleo de números aleatorios, números generados por
computadora, que no tienen relación entre sí, no obedecen ni a secuencia ni a ley alguna,
es decir, son generados al azar. La aplicación de este método de muestreo permite que
cada individuo de una población tenga la misma probabilidad de ser incluido
en la muestra.

2.5. Delimitación del muestreo

Accede al vídeo «Muestra representativa» a través del aula virtual

A pesar de las ventajas que supone la aplicación de los diferentes métodos de muestreo
probabilístico, hay que tener en cuenta que realmente no existe una descripción
formal que permita afirmar si una muestra es o no representativa de una
población.

Un elemento importante en esta consideración es el error de muestreo denominado


también error aleatorio. Se incurre en él cuando se sacan conclusiones sobre una
población, a partir del estudio de una muestra extraída de ella, ya que es posible que por
ejemplo el valor de la media de la muestra esté muy alejado ya sea por exceso o por
defecto, del de la media poblacional.

El tamaño de la muestra que se debe extraer es también un gran limitante, sobre todo
porque, por ejemplo, las muestras pequeñas no representan en forma adecuada las

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

características de la población, y la extracción de una muestra muy grande resulta un


proceso costoso.

Accede al ejercicio de autoevaluación a través del aula virtual

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 2 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer…

Estadística aplicada a los negocios

Este documento contiene conceptos fundamentales del muestreo estadístico y sus


aplicaciones a los negocios.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
https://es.scribd.com/document/340997891/01-Muestreo-P1-pdf

No dejes de ver…

El muestreo estadístico

En este vídeo se abordan conceptos fundamentales acerca del muestreo estadístico,


clasificación y aplicaciones.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=HwICOFhF_eM

TEMA 2 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

A fondo

Estadística aplicada a la Administración, Contaduría e Informática


Administrativa

Compendio de aplicaciones de la Estadística y del muestreo estadístico en las áreas de la


Administración.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
https://studylib.es/doc/5342579/estad%C3%ADstica-aplicada-a-las-licenciaturas

TEMA 2 – + Información © Universidad Internacional de La Rioja en México (UNIR)


Ordenamiento y determinación de
variables
[3.1] Clasificación de variables

[3.2] Obtención de los datos, selección de los datos

[3.3] Descripción numérica de los datos

3TEMA
Ordenamiento y determinación de variables
Esquema

TEMA 3 – Esquema
Clasificación de variables

Variables Variables
cualitativas cuantitativas

Cardinales Ordinales Continuas Discretas

Obtención de datos
Selección de datos

Descripción numérica de los datos

© Universidad Internacional de La Rioja en México (UNIR)


Estadística
Estadística

Ideas clave

Para estudiar este tema deberás leer el documento cuyo enlace web se muestra a
continuación. El documento contiene conceptos fundamentales acerca de las variables
que se utilizan en los estudios de Estadística. Disponible en:
http://norestadistica.blogspot.mx/2011/03/variables-estadisticas.html

Igualmente, para hacer una revisión de conceptos y reafirmar tus conocimientos sobre el
tema, deberás leer el documento que se encuentra en el enlace web:
http://www.uclm.es/profesorado/jmezo/estadistica/t2.pdf

3.1. Clasificación de variables

Accede al vídeo «Tipos de variables» a través del aula virtual

Los datos que se manejan en estadística se denominan, en general,


variables. Cuando se trata de valores numéricos, la variable se denomina cuantitativa.
Si vamos a estudiar una muestra compuesta por números enteros (obtenidos mediante
un conteo), se dice que la variable es discreta, si la fuente de los datos es una medición,
se dice que la variable es continua.

Cuando la información que se tiene se refiere a una característica o atributo, se dice que
corresponde a una variable cualitativa. Nacionalidad, sexo o género, religión, estatus
socioeconómico, región, nivel de estudios, etc., son algunas cualidades que pueden
componer dicha variable.

Una variable cualitativa puede ser dicotómica, cuando solo puede tomar dos
valores posibles: si, no, hombre, mujer, y politómica, cuando se le pueden asignar tres o
más valores.

Si los valores de la variable se pueden ordenar, se denomina cualitativa ordinal (bajo,


medio, alto); pero si dichos valores no son susceptibles de un ordenamiento, la variable
se denomina cualitativa nominal (cristiano, musulmán, judío, etc.).

TEMA 3 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Accede al ejercicio de autoevaluación a través del aula virtual

3.2. Obtención de los datos, selección de datos

En general los métodos para recopilar datos estadísticos se aplican en función del
carácter del estudio que se va a realizar. Si la información existe, solo habrá que acudir a
la fuente correspondiente (fuente secundaria), y mediante algún método de muestreo,
extraer los datos hasta conformar la muestra que se requiere.

Cuando la información no existe y es numérica se hace necesaria la implementación de


un proceso para generarla; desde escoger un aparato de medición confiable,
hasta emplear personal capacitado en toma de mediciones para extraer la muestra.

Otro método para recopilar información es la aplicación de una encuesta. El empleo de


este instrumento requiere:

» Indicar los objetivos


» Definir la población sobre la que se va a aplicar
» Calcular el tamaño de la muestra y establecer el método de muestreo
» Determinar las preguntas que se van a hacer
» Establecer el grado de precisión que se desea

Es necesario considerar también que la encuesta se debe probar aplicándola a


pequeña escala (encuesta piloto). Además de tener una idea de su alcance, el
investigador puede tener una aproximación de su costo real.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 3 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

3.3. Descripción númerica de los datos

Accede al vídeo «Descripción numérica de datos» a través del aula virtual

Una vez extraída la muestra se revisan los datos, se corrigen y se vacían en una
tabla resumen o bien en una tabla de clasificación cruzada o tabla de contingencia.

Por ejemplo, se aplicó una encuesta a 2 000 personas para determinar el porcentaje de
ellas que llega al trabajo en su automóvil y tiene casa propia. Si una persona llega al
trabajo en automóvil propio, ¿se puede suponer que tiene casa propia?
P P'

Maneja al trabajo Propietario Inquilino Total


M Si 824 681 1505
M' No 176 319 495
Total 1000 1000 2000

Una vez que se corrigen los datos, se vacían en una tabla de clasificación cruzada, en el
lugar que les corresponde. Se simbolizan los eventos importantes: M, personas que
manejan hacia el trabajo; P, personas que son propietarias de una casa. Dado que se trata
de variables nominales dicotómicas, la descripción numérica de la muestra se limita a
determinar porcentajes que pueden ser de interés para un estudio en particular.

Así el porcentaje que se pide es: 824/2 000*100 = 41.2%. Note que dispuesta la tabla en
esta forma, es posible determinar otros porcentajes que pudieran interesar. ¿Qué
porcentaje de personas de la muestra pagan alquiler? 1 000/2 000*100 = 50%

El análisis numérico previo para una variable cuantitativa continua, se efectúa


formulando una tabla de distribución de frecuencias.

INTERVALOS DE
CLASE Fi Xi Fr Fa Fra
0 10 12 5 0,3077 12 0,3077
10 20 7 15 0,1795 19 0,4872
20 30 12 25 0,3077 31 0,7949
30 40 6 35 0,1538 37 0,9487
40 50 2 45 0,0513 39 1
39

TEMA 3 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

La tabla anterior se refiere a las utilidades en miles de euros de una muestra de 39


empresas.

En primer lugar, se formulan las categorías o intervalos de clase (entre cinco y quince),
y los datos de la muestra se asignan en la categoría que les corresponde según su valor.

La columna Fi (frecuencias) contiene el número de datos de la muestra que


ha quedado asignado a un intervalo. Xi (Marcas de clase), es el punto medio de cada
intervalo. Fr es la frecuencia relativa o porcentaje de los valores de la muestra incluido
en cada categoría.

Fa (Frecuencia acumulada) y Fra. (Frecuencia relativa acumulada)


representan el número total o el porcentaje total de unidades que cumplen con una
condición establecida.

Se puede apreciar que solo dos empresas ganaron entre 40 y 50 miles de euros, 31
empresas (79.49%) obtuvieron ganancias menores a 30 mil euros.

Los límites de los intervalos no se superponen. Por ejemplo en el intervalo 30 –


40, se incluyen los valores de la muestra cuyo valor es exactamente 30, pero que no llega
a 40.

El análisis de la tabla nos permite sacar las primeras conclusiones acerca del
comportamiento de los datos en la muestra.

Desde luego, el análisis va más allá. Se deben determinar los promedios estadísticos,
validarlos y determinar la forma de la distribución comparándola con un patrón ya
establecido.

Accede al ejercicio de autoevaluación a través del aula virtual

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 3 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer…

Funciones y aplicaciones de la Estadística

Documento que resume las principales funciones y aplicaciones de la Estadística.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.uaeh.edu.mx/docencia/VI_Lectura/licenciatura/documentos/LEC5.pdf

No dejes de ver…

Recopilación de datos

Vídeo en el que se exponen los diferentes procedimientos para recopilar información


para un estudio estadístico.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=JX_yBqCtnYk

TEMA 3 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Datos de una variable cuantitativa

Vídeo en el que se expone cómo seleccionar y presentar datos de una variable


cuantitativa, elaborando una tabla de distribución de frecuencias.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=-ZnUSLlUj9A

TEMA 3 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

+ Información

A fondo

Técnicas de obtención y representación de datos

El documento contiene un resumen acerca del surgimiento de la Estadística, la aplicación


de métodos estadísticos, muestreo, recopilación y presentación de datos estadísticos.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
https://archivos.csif.es/archivos/andalucia/ensenanza/revistas/csicsif/revista/pdf/Nu
mero_14/SILVIA_BORREGO_2.pdf

TEMA 3 – + Información © Universidad Internacional de La Rioja en México (UNIR)


Descripción gráfica de los datos
[4.1] Gráficos para describir variables categóricas

[4.2] Gráfico para describir datos de series temporales

[4.3] Gráficos para describir variables numéricas

[4.4] Tablas y gráficas para describir relaciones entre variables

[4.5] Errores comunes en la presentación de datos

4 TEMA
Descripción gráfica de los datos
Esquema

TEMA 4 – Esquema
Gráficos para Gráficos para
describir variables describir variables
categóricas numéricas

Tablas y gráficas para describir


relaciones de variables

Gráficos para describir datos de series


temporales

Errores comunes en la presentación de


datos

© Universidad Internacional de La Rioja en México (UNIR)


Estadística
Estadística

Ideas clave

Para estudiar este tema deberás leer el siguiente documento cuyo contenido se basa en
la descripción de los componentes fundamentales para la elaboración de tablas y
gráficas: https://www.fisterra.com/mbe/investiga/graficos/graficos.asp#Figura 2

Igualmente es importante que veas con mucha atención el siguiente vídeo que contiene
ejemplos acerca de la elaboración de tablas y gráficas:
https://www.youtube.com/watch?v=8xvjdMHKmYU

4.1. Gráficos para describir variables categóricas

Accede al vídeo «Gráficos de variables cualitativas» a través del aula virtual

Las variables categóricas se refieren a cualidades, características o atributos


que distinguen a los elementos de una muestra tales como: género, religión, estatus
socioeconómico, nivel de estudios, preferencia etc. La presentación de este tipo de
variable es por medio de gráficas circulares, gráficas de barras y gráficas de columnas.

Generalmente la construcción de una gráfica se lleva a cabo utilizando las funciones de


la hoja de cálculo de Excel y el tipo de gráfica está en función de los datos que deben
representarse. Por ejemplo, si es importante señalar los porcentajes que componen un
todo se utiliza la gráfica circular; por lo general los datos geográficos se presentan por
medio de barras y cuando se trata de una variable ordinal se prefiere la gráfica de
columnas.

En la sección No dejes de ver tendrás acceso a un vídeo que contiene suficientes ejemplos
de cómo trazar gráficas para datos que corresponden a variables categóricas.

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

A continuación, se muestran algunas tablas que contienen información (tablas resumen)


que corresponde a variables categóricas o cualitativas, así como las gráficas respectivas.

NÚMERO DE
NIVEL DE RIESGO ACCIONES
BAJO 45
MEDIO 35
ALTO 80
TOTAL 160

NIVEL DE RIESGO

80
NÚMERO DE ACCIONES

70
60
50
40 80
30 45
20 35
10
0
BAJO MEDIO ALTO
NIVEL DE RIESGO

Género Cantidad
Hombre 75
Mujer 45
total 120

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Superficie
Continente Millones Km2
América 42,7
África 30,2
Antártida 14

Asia 44,6
Europa 10,5
Oceanía 9

Accede al ejercicio de autoevaluación a través del aula virtual

4.2. Gráfico para describir datos de series temporales

Accede al vídeo «Gráfico de series temporales» a través del aula virtual

Una serie de tiempo denominada también cronológica, es un conjunto de observaciones


de una variable, que han sido registradas en períodos regulares de tiempo.

Los diagramas de dispersión o diagramas de puntos son gráficos que se utilizan para
representar series de tiempo. En el eje horizontal se marcan los períodos de tiempo y en
el vertical la variable en estudio. El desarrollo de los puntos del diagrama puede ser un
indicativo del comportamiento de la serie, lo cual es fundamental para establecer
un modelo que pueda utilizarse para hacer pronósticos.

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

La gráfica de una serie de cronológica se puede representar también como una línea
quebrada que muestra los cambios de la variable en el tiempo. Una vez trazada
la serie también es importante establecer la tendencia, por medio de una línea que pasa
a través de las variaciones.

VENTAS DE
REFRIGERADORES
2005-2012
2000
ERO DE UNIDADES

1500
1000
500
0
I III I III I III I III I III I III I III I III
1 2 3 4 5 6 7 8
PERIODOS DE TIEMPO (TRIMESTRES)

Cuando se trata de una serie estacional, puede ser, por ejemplo, de un producto o servicio
cuya demanda varía en función de las estaciones del año se hace necesario suavizar los
picos de la gráfica para poder apreciar la magnitud del efecto estacional.

Así, por ejemplo, la gráfica muestra la demanda trimestral de un producto en miles de


unidades, cuya estacionalidad se ha suavizado.

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

2000
1800
1600
1400
1200
1000 Series1

800 Series2

600
400
200
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31

Accede al ejercicio de autoevaluación a través del aula virtual

4.3. Gráficos para describir variables numéricas

Accede al vídeo «Gráficos de variables cuantitativas» a través del aula virtual

Las variables numéricas o cuantitativas contienen información generalmente recopilada


por medio de una medición. Los datos que se reúnen son valores numéricos que se
refieren a pesos, estaturas, ganancias, ventas, cocientes de inteligencia, promedios, etc.

Una vez corregida la información se presenta en una tabla de distribución de


frecuencias, cuyo formato es el siguiente:

INTERVALOS DE
CLASE Fi Xi Fr Fa Fra
0 10 12 5 0.3077 12 0.3077
10 20 7 15 0.1795 19 0.4872
20 30 12 25 0.3077 31 0.7949
30 40 6 35 0.1538 37 0.9487
40 50 2 45 0.0513 39 1.0000

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Para representar gráficamente una tabla de distribución de frecuencias, se utilizan 3


gráficas, debido a que cada una de ellas muestra un aspecto del comportamiento de la
variable en estudio:

Histograma

Muestra qué categoría o intervalo de clase contiene mayor número de valores.

BENEFICIOS MENSUALES
14
12 12
12

10
No de empresas

8 7
6
6

4
2
2

0
5 15 25 35 45
MILES DE EUROS

El histograma es una gráfica de columnas completamente unidas. En el eje


horizontal se representan las marcas de clase Xi que como se ve en la gráfica, se colocan
en el centro de cada columna, ya que son los puntos medios de los intervalos de clase. En
el eje vertical se marcan las frecuencias absolutas Fi que en la gráfica determinan la altura
de cada columna.

Polígono de frecuencias

Xi Fi
0 0
5 12
15 7
25 12
35 6
45 2
55 0

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

El polígono de frecuencias es una gráfica de línea que se traza considerando los puntos
medios de los intervalos y las frecuencias. Antes del trazo se agregan dos marcas
de clase, una al principio y otra al final, ambas con frecuencia cero. Se conoce también
como gráfica de puntos medios.

POLÍGONO DE FRECUENCIAS
14
NÚMERO DE EMPRESAS

12

10

0
0 5 15 25 35 45 55
GANANCIAS

Ojiva porcentual

FRE. REL. OJIVA PORCENTUAL


LÍMITES ACUMULADA 1
0,9
0 0 0,8
PORCENTAJE

0,7
10 0,3077 0,6
0,5
20 0,4872 0,4
30 0,7949 0,3
0,2
40 0,9487 0,1
0
50 1,0000 0 10 20 30 40 50
GANANCIAS

La ojiva porcentual es una gráfica de línea que muestra el porcentaje total de valores de
la muestra, que cumple con alguna condición. Así por ejemplo viendo la gráfica
podríamos decir que aproximadamente un 80% de las empresas de la muestra tuvo
ganancias de 30 mil euros o menos.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

4.4. Tablas y gráficas para describir relaciones entre variables

Accede al vídeo «Tablas y gráficas para describir relaciones entre variables»


a través del aula virtual

Para establecer la relación entre variables es necesario identificar cuál es dependiente y


cuál o cuáles son independientes, explicativas o predictoras. El objetivo de un análisis de
correlación y regresión es determinar si las variables predictoras influyen en los
cambios de la variable dependiente, calcular el grado de esta influencia y formular
un modelo que se pueda utilizar como patrón.

Cuando solo son dos variables cuya relación es objeto de estudio, esta se puede
representar en un plano de coordenadas rectangulares en donde el eje horizontal

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

corresponde a la variable independiente X y el vertical a la dependiente Y. La primera


gráfica para describir una relación entre variables es el diagrama de dispersión.

El desarrollo de los puntos en el diagrama puede mostrar evidencias de una


relación lineal directa o inversa, o bien una relación no lineal. Una vez
establecida la forma de la relación entre las variables, se procede a la formulación del
modelo que mejor se ajusta a los datos.

𝑌𝑌� = 𝑚𝑚𝑚𝑚 + 𝑏𝑏, es la forma de la ecuación de regresión lineal que mejor se ajusta a una
muestra con dos variables. Los parámetros de la regresión, ‘m’ y ‘b’, se calculan
aplicando:

La tabla que se utiliza para formular el modelo se presenta a continuación:

x Y XY x^2 y^2
ANUNCIOS VENTAS (miles)
3 125 375 9 15625
5 152 760 25 23104
4 131 524 16 17161
4 133 532 16 17689
5 142 710 25 20164
3 116 348 9 13456
3 127 381 9 16129
6 163 978 36 26569
33 1089 4608 145 149897

Desde luego la memoria de cálculo se trabaja en una hoja de Excel.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

4.5. Errores comunes en la presentación de datos

Accede al vídeo «Errores en la presentación de datos» a través del aula virtual

Exceder el número de tablas y gráficas adecuado

Cuando se recopila información para realizar un estudio, es importante tener muy claro
cuál es el objetivo del mismo. Esto permite que nos enfoquemos en la presentación de
los datos fundamentales.

Muchos cambios personalizados

Es importante tomar en cuenta que las tablas o gráficas que muestran el comportamiento
de una variable deben ser elaboradas con el fin de que puedan ser leídas, entendidas e
interpretadas, por lo tanto, hay que evitar agregar a la presentación elementos muy
personales que desvirtúen el sentido de la información.

Diseño antes que contenido

A este respecto no perder de vista que al hacer una presentación lo valioso es la


información que se está trasmitiendo. La forma de la presentación es solo un
complemento.

Información innecesaria

En ocasiones se puede suponer que añadir información adicional puede enriquecer una
presentación. Nada más alejado de la realidad. Debemos limitarnos a los datos
medulares, los que tienen verdadero interés.

Escoger la mejor presentación

Finalmente, el carácter de la información nos puede sugerir la forma de la presentación.


Por lo cual es conveniente escoger aquella que permita mostrar en forma clara los datos
importantes.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 4 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer…

4 formas de mentir con gráficos de datos en una presentación

En el siguiente enlace tendrás acceso a un documento muy interesante en el que se


muestran varios ejemplos acerca de cómo engañar por medio de una gráfica.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.elartedepresentar.com/2011/11/4-formas-de-mentir-con-graficos-de-
datos-en-una-presentacion/

No dejes de ver…

Gráficas para variables

Vídeo en el que se describen los procedimientos para trazar gráficas para variables
categóricas.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=khn8vrlcswk

TEMA 4 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Tabla de distribución de frecuencias

Vídeo en el que se aborda el tema de cómo hacer una tabla de distribución de frecuencias.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=bKK0kXzwpgs

Trazar tablas de distribución de frecuencias

Este vídeo está preparado para que puedas repasar como trazar las gráficas de una tabla
de distribución de frecuencias.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=bKK0kXzwpgs

TEMA 4 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

+ Información

A fondo

Proceso administrativo, proceso de planeación

Artículo de Devi Gómez relacionado con la planeación administrativa, pronósticos,


gráficas de la organización y diagramas.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://devigomez.blogspot.mx/2013/05/proceso-adminstrativo.html

TEMA 4 – + Información © Universidad Internacional de La Rioja en México (UNIR)


Medidas de tendencia central
[5.1] Medidas de variabilidad, media ponderada y medidas para
datos agrupados

[5.2] Medidas de relaciones entre variables

5 TEMA
Esquema

TEMA 5 – Esquema
Medidas de tendencia central

Medidas de relaciones
Promedios estadísticos Medidas de dispersión
entre variables

Datos no Datos Datos no Datos


agrupados agrupados agrupados agrupados

© Universidad Internacional de La Rioja en México (UNIR)


Estadística
Estadística

Ideas clave

Para estudiar este tema deberás leer el capítulo 3 del libro: Levine, D. M., Krehbiel, T. C.
y Berenson, M. L. (2014). Estadística para administración. México: Pearson educación.
Disponible a través de la Biblioteca Virtual de UNIR.

Además, deberás repasar el material que se presenta en el siguiente vídeo:


https://www.youtube.com/watch?v=SFyCbIOFNZ0

5.1. Medidas de variabilidad, media ponderada y medidas para


datos agrupados

Accede al vídeo «Medidas de tendencia central» a través del aula virtual

Accede al vídeo «Medidas de dispersión» a través del aula virtual

Accede al vídeo «Medidas para datos agrupados» a través del aula virtual

Las medidas de tendencia central


fundamentales y de mayor aplicación
son la media aritmética o promedio, la
mediana y la moda, y su función
principal es la de describir alguna
propiedad o tendencia de los datos de
una muestra. De los tres, el que más se
utiliza es la media aritmética, sobre
todo porque para calcularlo se
consideran todos los valores, sin embargo, cuando estos no siguen cierta regularidad, su
valor no es recomendable. Cuando la muestra contiene valores atípicos se utiliza la media
recortada.

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

La siguiente muestra contiene las utilidades obtenidas en miles de euros, por 39


pequeñas empresas. Calcular la utilidad promedio.

17.5 37.5 50 5
30 22.5 22.5 40
37.5 20 25 20
15 27.5 32.5 7.5
17.5 25 27.5 22.5
25 32.5 2 10
22.5 25 16 5
10 10 8 47.5
5 25 3 35
17.5 7.5 9

Solución:

La media aritmética para datos no agrupados se obtiene mediante la fórmula:

∑ 𝑋𝑋𝑖𝑖
𝑋𝑋� =
𝑛𝑛
17.5 + 30 + 37.5 + 15 + 17.5 + 25 + 22.5 + ⋯ + 5 + 47.5 + 35 818
𝑋𝑋� = = = 20.97
39 39

La mediana se denomina también promedio de posición, por lo que ocupa el lugar central
en una muestra de datos que no están agrupados en intervalos. Los valores se ordenan
en forma creciente y si el tamaño de la muestra es impar, hay un valor en el centro que
corresponde a la Mediana. Cuando el número de datos es par, hay dos valores en el
centro, el valor de la mediana se obtiene promediándolos.

Dada una muestra con datos X1, X2, X3, X4,…Xn, la posición que ocupa la mediana es:
𝑋𝑋𝑛𝑛+1 , si n=39, la mediana ocupa el lugar N° 20, por lo tanto Md= 22.5
2

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

El 50% de los valores de la muestra es mayor que la mediana, y el 50% es menor. Una
ventaja importante de este promedio es que su valor no se afecta cuando la muestra
contiene valores extremos.

2 10 22.5 30
3 10 22.5 32.5
5 15 22.5 32.5
5 16 25 35
5 17.5 25 37.5
7.5 17.5 25 37.5
7.5 17.5 25 40
8 20 25 47.5
9 20 27.5 50
10 22.5 27.5

La Moda o valor modal Mo, es el dato que es más frecuente, el que más veces se repite.
En este caso Mo=25. Cuando 2 o más valores tienen la misma frecuencia se toma como
Moda el menor.

Las medidas de variación o dispersión se utilizan para calcular el grado en que los datos
de la muestra difieren de un promedio. Si la diferencia es pequeña, se puede considerar
que la muestra contiene datos cuyos valores son regulares y que el promedio es
significativo.

El promedio que más se utiliza para el cálculo de la variabilidad de una muestra es la


media aritmética, ya las medidas de dispersión son: Rango, Desviación Media, Varianza,
Desviación típica o estándar y Coeficiente de variación.

Rango = Xmax. – Xmin. Se obtiene restando el valor menor de la muestra del valor
mayor. Para la muestra anterior R= 50 – 2 = 48

Al comparar varias muestras, la de mayor Rango es aquella cuyos componentes tienen


mayor dispersión.

Desviación Media
∑|𝑥𝑥 − 𝑥𝑥̅ |
𝐷𝐷𝐷𝐷 =
𝑛𝑛

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Es el promedio de las diferencias o desviaciones de los datos con respecto a su media,


por lo que:

|2 − 20.97| + |3 − 20.97| + |5 − 20.97| + ⋯ + |50 − 20.97| 386.03


𝐷𝐷𝐷𝐷 = = = 9.90
39 39

Para evaluar esta medida es necesario comparar varias muestras. Aquella con el menor
valor de DM será la que tenga menos dispersión.

Varianza

Una propiedad de la media aritmética establece que la suma de los cuadrados de las
desviaciones de los datos de una muestra con respecto a su media es mínimo, esta suma
dividida entre (n-1) se denomina varianza.

∑(𝑥𝑥 − 𝑥𝑥̅ )2
𝑆𝑆 2 =
𝑛𝑛 − 1
(2 − 20.97)2 + (3 − 20.97)2 + (5 − 20.97)2 + ⋯ + (50 − 20.97)2 5756.97
𝑆𝑆 2 = =
39 − 1 38
= 151.5

Sin embargo, el resultado de esta aplicación arroja unidades al cuadrado, que desde luego
no son compatibles con el estudio de la muestra. Este problema se resuelve extrayendo
la raíz cuadrada de la varianza, y el valor resultante se denomina Desviación típica o
estándar.

𝑆𝑆 = √151.5 = 12.30

La desviación típica es la medida de variación más importante en una muestra, pero


además junto con la media, se utiliza para hacer inferencias sobre la población.

∑ 𝐹𝐹𝐹𝐹∗𝑋𝑋𝑋𝑋
𝑋𝑋� = 𝑛𝑛 El coeficiente de variación V, es una medida de la dispersión relativa que hay
en una muestra, con respecto a la media aritmética.

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Medidas estadísticas para datos agrupados

La siguiente tabla es una distribución de frecuencias de las tarifas (en dólares), de una
muestra de 20 hoteles en una ciudad.

Se pide calcular las medidas de tendencia central y las medidas de dispersión.

INTERVALOS DE
CLASE Fi Xi Fr Fa Fra
110 140 4 125 20 4 20
140 170 4 155 20 8 40
170 200 5 185 25 13 65
200 230 5 215 25 18 90
230 260 0 245 0 18 90
260 290 2 275 10 20 100
20 100

Solución:

Cuando los datos de la muestra están categorizados, los valores de cada Xi corresponden
a las marcas de clase, y en los cálculos hay que tomar en cuenta el número de datos es
decir, las frecuencias absolutas Fi

Media aritmética

3670 ∑ 𝐹𝐹𝐹𝐹 ∗ 𝑋𝑋𝑋𝑋


Xi Fi 𝑋𝑋� = �=
= 183.5𝑋𝑋
20 𝑛𝑛
500
620
925
1075
0
550
3670

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Mediana

Para calcular el valor de la mediana hay que fijar su posición (n/2), esta permite
identificar el intervalo de valores en donde se encuentra dicho promedio, para
determinar los demás elementos de la fórmula:

𝑛𝑛
−𝑓𝑓𝑎𝑎
𝑋𝑋� = 𝐿𝐿𝑖𝑖 +� 2 � 𝐶𝐶
𝑓𝑓𝑚𝑚𝑚𝑚𝑚𝑚

» Li= Límite inferior del intervalo donde está la Mediana.


» Fa= Frecuencia acumulada anterior a dicho intervalo.
» Fmed. = Frecuencia del intervalo donde está la mediana.
» C= Ancho del intervalo de clase.

En base a lo anterior, tenemos la moda o valor modal:

n/2= 10
L1= 170
Facum= 8
Fmed.= 5
C= 30

Md=170 + [(10-8)/5]*30

Md. = 182

𝑑𝑑1
= 𝐿𝐿𝑖𝑖 + � � 𝐶𝐶
𝑑𝑑1 + 𝑑𝑑2
» Li=Límite inferior del intervalo de mayor frecuencia.
» ‘d1’= Mayor frecuencia – frecuencia del intervalo anterior
» ‘d2’= Mayor frecuencia – frecuencia del intervalo siguiente.
» C= ancho del intervalo de clase

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Por lo tanto, aplicando la fórmula con:

L1= 170
d1= 5-4= 1
d2= 5-5= 0
C= 30

Mo= 170 + [1/(1+0)]*30 = 200

Medidas de dispersión
∑ 𝐹𝐹𝐹𝐹|𝑋𝑋𝑋𝑋 − 𝑋𝑋�|
𝐷𝐷𝐷𝐷 =
𝑛𝑛
Desviación media

En la fórmula anterior, Xi representa a cada una de las marcas de clase. x es la media


aritmética de la muestra, n, es el tamaño de la misma y la diferencia entre cada una de
las marcas de clase y la media se da en valor absoluto, es decir, considerando todos los
resultados positivos.

De esta forma tenemos: Fi |𝑋𝑋𝑋𝑋 − 𝑋𝑋�|

234
114
7.5
157.5
0
183
3670
4366

Por lo tanto: Md= 4366/20= 218.3

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Varianza

Fi*(Xi-
Xmedia)^2
13689
3249
11.25
4961.25
0
16744.5
38655

∑ 𝐹𝐹𝐹𝐹(𝑋𝑋𝑋𝑋 − 𝑋𝑋�)2 38655


𝑆𝑆 2 = = = 2034.47
𝑛𝑛 − 1 19

Desviación típica o estándar

� )𝟐𝟐
∑ 𝑭𝑭𝑭𝑭(𝑿𝑿𝑿𝑿 − 𝑿𝑿
𝑺𝑺 = � = √𝟐𝟐𝟐𝟐𝟐𝟐𝟐𝟐. 𝟒𝟒𝟒𝟒 = 𝟒𝟒𝟒𝟒. 𝟏𝟏𝟏𝟏
𝒏𝒏 − 𝟏𝟏

Coeficiente de variación:
𝑆𝑆 45.11
𝑉𝑉 = ∗ 100 = ∗ 100 = 24.58%
𝑋𝑋� 183.5

Accede al ejercicio de autoevaluación a través del aula virtual

5.2. Medidas de relaciones entre variables

Accede al vídeo «Medidas de relaciones entre variables cuantitativas» a


través del aula virtual

Accede al vídeo «Medidas de relaciones entre variables cualitativas» a través


del aula virtual

El grado de la relación entre variables cuantitativas se mide por medio del coeficiente de
correlación ‘r’ de Pearson, cuyo valor oscila entre -1 y 1. Si r=1, entre las variables

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

hay una relación lineal directa perfecta, ya que cuando la variable independiente
aumenta, la variable dependiente también se incrementa.

Cuando r=-1, la relación entre las variables es lineal inversa perfecta, es decir,
cuando aumenta la variable independiente, la variable dependiente disminuye.

Ejemplo: Calcular el coeficiente de correlación y el coeficiente de determinación:

x Y XY x^2 y^2
ANUNCIOS VENTAS (miles)
3 125 375 9 15625
5 152 760 25 23104
4 131 524 16 17161
4 133 532 16 17689
5 142 710 25 20164
3 116 348 9 13456
3 127 381 9 16129
6 163 978 36 26569
33 1089 4608 145 149897

Solución:

Para N=8, tenemos:

8 ∗ 4608 − 33 ∗ 1089 927


𝑟𝑟 = = = 0.9556
�(8 ∗ 145 − 332 ) ∗ (8 ∗ 149897 − 10892 ) 970.11

𝑅𝑅 2 es el Coeficiente de Determinación, su máximo valor es 1 o 100%, y expresa el


porcentaje de dependencia entre las variables. Para la muestra anterior:

𝑅𝑅 2 = (0.9556)2 ∗ 100 = 91.31%

Los cambios de la variable Y dependen de los cambios de X en un 91,31%

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Covarianza

Es otra medida de la relación entre variables cuantitativas. Cuando su valor es positivo


existe variación conjunta y se da en el mismo sentido. Si el valor de la covarianza es
negativo, la variación se da en sentidos contrarios.

���� − 𝑋𝑋� 𝑌𝑌�


𝜎𝜎𝑥𝑥𝑥𝑥 = 𝑋𝑋𝑋𝑋

Aplicando la fórmula con las variables de la muestra anterior tenemos:


4608
����
𝑋𝑋𝑋𝑋 = = 576; 𝑋𝑋� ∗ 𝑌𝑌� = 4.125 ∗ 136.125 = 561.52
8

Por lo tanto: 𝜎𝜎𝑥𝑥𝑥𝑥 = 576 – 561.52 = 14.48

Dado que la covarianza es positiva, se deduce que existe variación conjunta entre las
variables y se da en el mismo sentido.

La relación entre variables categóricas se puede confirmar o no por medio de un


procedimiento denominado Prueba de chi cuadrada.

La información que se recaba se presenta en una tabla de contingencia o de clasificación


cruzada, y el procedimiento para establecer si existe o no relación entre las variables
requiere dos suposiciones iniciales denominadas Hipótesis, así como un valor de
significancia.

Ejemplo

Un despacho de mercadotecnia está efectuando un estudio para determinar si existe


relación entre el tipo de comunidad de residencia de la persona y su preferencia en temas
de lectura. Los resultados se muestran en la siguiente tabla.

Noticias Deportes Cómics Total


Ciudad 180 130 100 410
Suburbios 100 110 90 300
Rural 150 90 90 330
Total 430 330 280 1040

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Con un nivel de significancia 0.05, ¿existe relación entre el tipo de comunidad en el que
reside la persona y su preferencia en temas de lectura?

Solución:

Formulación de las hipótesis:

» H0: Existe relación entre la comunidad de residencia y el tipo de lectura


» H1: No existe relación entre la comunidad de residencia y el tipo de lectura

Calcular el estadístico de prueba 𝜒𝜒 2 :

(𝑓𝑓𝑜𝑜 −𝑓𝑓𝑒𝑒 )2
𝜒𝜒 2 = ∑ � �; con k-1 grados de libertad, en donde k es el número de categorías, fo es
𝑓𝑓𝑒𝑒

una frecuencia observada en una categoría particular y fe es una frecuencia esperada en


una categoría particular.

En una tabla de contingencia como la del caso, la frecuencia esperada fe para una
frecuencia observada fo, se calcula multiplicando el total de la hilera por el total de la
columna y dividiendo el producto entre el total de la muestra. Así por ejemplo la fe que
410∗430
corresponde a 180= , siguiendo con el procedimiento, fe para 100 =
1040

300*430/1040 = 124.04

La siguiente tabla muestra los elementos que se requieren para calcular el estadístico de
la prueba 𝜒𝜒 2

(𝑓𝑓𝑓𝑓 − 𝑓𝑓𝑓𝑓)2
fo fe (fo- fe)2
𝑓𝑓𝑓𝑓
180 169,52 109,85 0,65
100 124,04 577,85 4,66
150 136,44 183,81 1,35
130 130,10 0,01 0,00
110 95,19 219,27 2,30
90 104,71 216,43 2,07
100 110,38 107,84 0,98
90 80,77 85,21 1,05
90 88,85 1,33 0,01
Total 13,07

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

A continuación se busca el valor crítico de 𝜒𝜒 2 con (3-1)*(3-1)= 4 grados de libertad, es


decir, de la tabla de contingencia gl= (Nº de hileras – 1)*(Nº de columnas -1).

De esta forma para un nivel de significancia de 0,05 y 4 grados de libertad 𝜒𝜒 2 = 9,49


Dado que 13.07> 9,49, se rechaza la hipótesis nula por tanto no hay relación entre la
comunidad en la que habita la gente y sus preferencias de lectura, es decir, no existe
relación entre las variables.

Fuente:
cristina92sm.wordpress.com

Accede al ejercicio de autoevaluación a través del aula virtual

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 5 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer…

Estadística en la vida diaria

El siguiente documento de Virginia Carmona, es un resumen de las aplicaciones de la


Estadística en el mundo real.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
https://archivos.csif.es/archivos/andalucia/ensenanza/revistas/csicsif/revista/pdf/Nu
mero_23/VIRGINIA_CARMONA_GONZALEZ01.pdf

No dejes de ver…

Cálculo de media de tendencia central y de dispersión

Vídeo para aprender a calcular las medidas de tendencia central y las medidas de
dispersión utilizando las funciones de Excel.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=DUbOXH6qLY0

TEMA 5 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

+ Información

A fondo

Estadística aplicada a los negocios

El autor, Mauricio Lefcovich, hace un análisis de las necesidades de gestión en las


empresas y particularmente en los negocios, y de cómo la estadística es una herramienta
fundamental en ese proceso.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.gestiopolis.com/estadistica-aplicada-a-los-negocios

TEMA 5 – + Información © Universidad Internacional de La Rioja en México (UNIR)


Probabilidad
[6.1] Conceptos básicos de probabilidad

[6.2] Cálculo de probabilidades

[6.3] Variables aleatorias

[6.4] Modelos de probabilidad

6
TEMA
Estadística

Esquema

TEMA 6 – Esquema © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ideas clave

6.1. Conceptos básicos de probabilidad

Accede al vídeo «Conceptos básicos de probabilidad» a través del aula virtual

Conceptos previos

En este tema vamos a adentrarnos en los conceptos más básicos de la teoría de la


probabilidad, los cuales constituyen la base para un buen entendimiento de esta materia.

Para ello, comenzamos definiendo una serie de conceptos:

» Experimento aleatorio: es un proceso que puede dar lugar a varios resultados sin
que sea posible predecir cuál va a ocurrir. Hasta que el experimento aleatorio no se
haya llevado a cabo no es posible saber el resultado del mismo.
» Espacio muestral: es el conjunto de resultados básicos de un experimento. El
experimento, una vez realizado, dará lugar a un resultado que se encuentra dentro del
espacio muestral definido para el experimento.
» Suceso: dentro del espacio muestral hay diversos resultados posibles, cada uno de
estos posibles resultados recibe el nombre de suceso.

Para entender mejor estas definiciones, planteamos un experimento concreto:

Ejemplo: Lanzamiento de una moneda al aire.

Planteamos el sencillo experimento de lanzar una moneda al aire. ¿Cuáles son los
posibles resultados básicos que vamos a obtener?

C: sacar cara
X: sacar cruz

Entonces, el espacio muestral es: Ω={C,X}, siendo C y X cada uno de ellos un suceso.

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

¿Cuál sería el espacio muestral si en lugar de una moneda tuviésemos dos monedas?
Ω={CC,CX,XC,XX}.

Definición de probabilidad

Vamos a considerar como definición de probabilidad la dada por Laplace: El caso de que
todos los sucesos elementales del espacio muestral tengan la misma probabilidad del
suceso A es el cociente entre el número de resultados favorables a que ocurra el suceso A
en el experimento y el número de resultados posibles del experimento.

𝑛𝑛º 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓


𝑝𝑝 =
𝑛𝑛º 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝

Si recordamos el concepto de frecuencia relativa, esta regla corresponde a este mismo


concepto (recuento de casos dentro de una determinada categoría entre el número total
de casos).

Ejemplo: Ocupación e ingresos familiares.

Tenemos a continuación una tabla de datos sobre ocupación y nivel de ingresos del
cabeza de familia:
Bajo Medio Alto
Ama de casa 8 26 6
Obreros 16 40 14
Ejecutivos 6 62 12
Profesionales 0 2 8

Comenzaríamos pensando: ¿cuántas personas tenemos en total? Esto es, realizando el


cálculo de las frecuencias marginales:

Bajo Medio Alto Ocupación


Ama de casa 8 26 6 40
Obreros 16 40 14 70
Ejecutivos 6 62 12 80
Profesionales 0 2 8 10
Ingreso 30 130 40 200

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Así, por ejemplo, ¿cuál es la probabilidad de Ama de casa? Hemos dicho que este
concepto se corresponde con la frecuencia relativa, así que el resultado será 40/200. Este
valor, igual a 0,2, será la probabilidad de seleccionar una persona al azar de entre las 200
personas consultadas y que esta sea Ama de casa.

¿Y de Ama de casa con Ingreso Bajo? En este caso, recurrimos a las frecuencias absolutas
conjuntas y calculamos la relativa conjunta, 8/200. Así pues, 0,04 será la probabilidad
de que la persona seleccionada, además de ser Ama de casa, tenga Ingreso Bajo.

Accede al ejercicio de autoevaluación a través del aula virtual

6.2. Cálculo de probabilidades

Accede al vídeo «Cálculo de probabilidades» a través del aula virtual

Vamos a continuar aquí definiendo una serie de reglas útiles para el cálculo de
probabilidades que vienen a sumarse a la regla de Laplace, ya estudiada al comienzo de
este tema.

Las reglas que vamos a ver son tres, sirviendo cada una de ellas para el cálculo de un tipo
de probabilidad:

Probabilidad condicionada: dados dos sucesos de los que conocemos su espacio


muestral, el uso de esta regla es calcular la probabilidad de uno de estos sucesos cuando
se conoce cuál es el resultado del otro suceso.

Teorema de la probabilidad total: en este caso, tenemos un suceso y conocemos las


causas que pueden dar lugar a este; queremos, por tanto, calcular la probabilidad de que
el suceso ocurra por cada una de las causas que lo pueden provocar.

Teorema de Bayes: en las mismas condiciones que el caso anterior, queremos saber,
habiéndose producido el suceso, la probabilidad de que haya sido una causa concreta la
que lo ha originado.

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Probabilidad condicionada

Como segunda regla de cálculo de probabilidad, después de la regla de Laplace,


encontramos la regla de la probabilidad condicionada. Se correspondería con el concepto
de frecuencia relativa condicionada que fue estudiado en temas anteriores. Así, sabiendo
que se produce un determinado suceso, calculamos la probabilidad de otro. De este
modo, se define la probabilidad de A condicionado por B como:

𝑃𝑃(𝐴𝐴 ∩ 𝐵𝐵)
𝑃𝑃(𝐴𝐴 ∕ 𝐵𝐵) =
𝑃𝑃(𝐵𝐵)

Se entiende que 𝐵𝐵 es un suceso que ya ha sucedido, y que va a influir o no en lo que


sucederá con 𝐴𝐴.
Ejemplo: Ocupación e ingresos familiares (continuación).

Sabiendo que tenemos una familia de Ingreso Bajo, ¿cuál es la probabilidad de que la
persona seleccionada sea Ama de casa?

Bajo Medio Alto Ocupación


Ama de casa 8 26 6 40
Obreros 16 40 14 70
Ejecutivos 6 62 12 80
Profesionales 0 2 8 10
Ingreso 30 130 40 200

A: Ama de casa.
B: Ingreso Bajo.

𝑃𝑃(𝐵𝐵) = 𝑃𝑃(𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼 𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏) = 30/200

𝑃𝑃(𝐴𝐴⋂𝐵𝐵) = 𝑃𝑃(𝐴𝐴𝐴𝐴𝐴𝐴 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑦𝑦 𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼 𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏) = 8/200

8
200 8
𝑃𝑃(𝐵𝐵|𝐴𝐴) = = = 0,2667
30 30
200

Del mismo modo, podrían preguntarnos la probabilidad de Ingreso Bajo (B), sabiendo
que la persona es Ama de casa (A):

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

𝑃𝑃(𝐴𝐴) = 𝑃𝑃(𝐴𝐴𝐴𝐴𝐴𝐴 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐) = 40/200


𝑃𝑃(𝐴𝐴⋂𝐵𝐵) = 𝑃𝑃(𝐴𝐴𝐴𝐴𝐴𝐴 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑦𝑦 𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼 𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵) = 8/200

8
200 8
𝑃𝑃(𝐵𝐵|𝐴𝐴) = = = 0,2
40 40
200

Teorema de la probabilidad total

Tenemos un suceso A, el cual puede ocurrir debido a una serie de causas, las cuales
denotamos por Hi, de modo que la probabilidad de que ocurra el suceso coincide con la
suma de la probabilidad del suceso condicionada a que se haya dado cada una de las
causas en particular.

Veámoslo con el siguiente esquema sobre el teorema de la probabilidad total:

El suceso A puede ocurrir bajo los sucesos/causas H1 a H5. Por este motivo, el espacio
muestral está dividido en pequeñas parcelas de intersección vacía, esto es, que no se dan
a la vez.

Ω = 𝐻𝐻1 + 𝐻𝐻2 + ⋯ + 𝐻𝐻𝑘𝑘

𝐻𝐻𝑖𝑖 ∩ 𝐻𝐻𝑗𝑗 = ∅, ∀𝑖𝑖 , 𝑗𝑗

Queremos calcular la probabilidad de un suceso A que se encuentra ocupando un poco


de cada una de las parcelas.

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Así, estando A⊂Ω, calculamos la probabilidad de que ocurra A del siguiente modo, de
acuerdo con este teorema:

𝑃𝑃(𝐴𝐴) = 𝑃𝑃(𝐴𝐴 ∩ 𝐻𝐻1 + ⋯ + 𝑃𝑃(𝐴𝐴 ∩ 𝐻𝐻𝑘𝑘 ) =


= 𝑃𝑃(𝐴𝐴|𝐻𝐻1 ) · 𝑃𝑃(𝐻𝐻1 ) + ⋯ + 𝑃𝑃(𝐴𝐴|𝐻𝐻𝑘𝑘 ) · 𝑃𝑃(𝐻𝐻𝑘𝑘)

Ejemplo: Producción de piezas defectuosas

El Departamento de producción de una determinada empresa consta de cuatro tipos de


máquinas: A, B, C, D, las cuales producen piezas y las distribuyen de la siguiente manera,
respectivamente: 10 %, 20 %, 30 %, 40 %.

Han llegado al departamento quejas relacionadas con la venta de piezas defectuosas. Se


sabe, por registros anteriores, que el porcentaje de piezas defectuosas de cada tipo de
máquina es 0,1 %, 0,05 %, 0,5 % y 0,2 %, respectivamente.

Se ha producido una nueva venta en la empresa, ¿cuál es la probabilidad de que se le


haya vendido al cliente una pieza defectuosa?

Tenemos que el espacio muestral es la fábrica, y está dividido en cuatro máquinas


diferentes {A, B, C, D}. Cada una de ellas fabrica piezas, las cuales son de dos tipos, siendo
su espacio muestral {D, No D}.

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

De esta forma, la probabilidad que nos piden calcular es:

𝑃𝑃(𝐷𝐷) = 𝑃𝑃(𝐷𝐷|𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚) ∙ 𝑃𝑃(𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚) + 𝑃𝑃(𝐷𝐷|𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚) ∙ 𝑃𝑃(𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚) + 𝑃𝑃(𝐷𝐷|𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚) ∙ 𝑝𝑝(𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚)


0,1 10 0,05 20 0,5 30 0,2 40
+ 𝑃𝑃(𝐷𝐷|𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚) ∙ 𝑃𝑃(𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚) = ∙ + ∙ + ∙ + ∙
100 100 100 100 100 100 100 100
25
=
10000

Sabemos entonces que, teniendo en cuenta que la pieza puede haber sido producida por
una de las cuatro máquinas (A, B, C o D), la probabilidad de que tengamos una pieza
defectuosa es de 0,00025. Por tanto, es reducida la probabilidad de que nuestro cliente
se lleve una pieza defectuosa.

Basándonos en estos datos, tomaremos la decisión de no invertir más en sistemas de


control de calidad, pues la probabilidad de que nuestro sistema de producción cometa
errores es pequeña y, por lo tanto, no es muy probable que recibamos quejas relacionadas
con nuestro sistema de producción.

Teorema de Bayes

Se consideran las mismas condiciones que en el teorema anterior, pero, si ya ha sucedido


A, queremos saber la probabilidad de que la causa que lo produjo sea Hi.

Así, la probabilidad requerida es 𝑃𝑃(𝐻𝐻𝑖𝑖 /𝐴𝐴), la cual se puede deducir utilizando la


definición de probabilidad condicionada:

𝐻𝐻 𝑃𝑃(𝐻𝐻𝑖𝑖 ∩𝐴𝐴)
𝑃𝑃 � 𝐴𝐴𝑖𝑖 � = 𝑃𝑃(𝐴𝐴)
(*)

𝑃𝑃(𝐻𝐻𝑖𝑖 ∩𝐴𝐴)
Por otro lado, de la misma definición sabemos que 𝑃𝑃(𝐴𝐴/𝐻𝐻𝑖𝑖 ) = , por lo tanto
𝑃𝑃(𝐻𝐻𝑖𝑖 )

𝑃𝑃(𝐻𝐻𝑖𝑖 ∩ 𝐴𝐴) = 𝑃𝑃(𝐻𝐻𝑖𝑖 ) ∙ 𝑃𝑃(𝐴𝐴/𝐻𝐻𝑖𝑖 ).

Sustituyendo en (*) el numerador por esta última expresión, y el denominador por el


teorema de la probabilidad total, tenemos el cálculo de la probabilidad requerida como
sigue: ∑𝑘𝑘𝑗𝑗=1 𝑃𝑃( 𝐻𝐻𝑗𝑗 ) ∙ 𝑃𝑃(𝐴𝐴/𝐻𝐻𝑗𝑗 ).

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

𝑃𝑃(𝐻𝐻𝑖𝑖 ∩ 𝐴𝐴) 𝑃𝑃(𝐻𝐻𝑖𝑖 ) ∙ 𝑃𝑃(𝐴𝐴/𝐻𝐻𝑖𝑖 )


𝑃𝑃(𝐻𝐻𝑖𝑖 /𝐴𝐴) = = 𝑘𝑘
𝑃𝑃(𝐴𝐴) ∑𝑗𝑗=1 𝑃𝑃( 𝐻𝐻𝑗𝑗 ) ∙ 𝑃𝑃(𝐴𝐴/𝐻𝐻𝑗𝑗 )

Ejemplo: Producción de piezas defectuosas (continuación).

Supongamos en el ejemplo anterior que ha llegado una nueva queja a la empresa


relacionada con la venta de una pieza defectuosa. Sospechamos que la máquina que la ha
producido ha sido la máquina B, la cual estamos pensando en reemplazar.
Vamos, por tanto, a calcular la probabilidad de que, sabiendo que se ha producido una
pieza defectuosa, la haya fabricado la máquina B:

0,05 20
𝑃𝑃(𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 ∩ 𝐷𝐷) 𝑃𝑃(𝐷𝐷𝐵𝐵 |𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚) · 𝑃𝑃(𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚) 100 · 100
𝑃𝑃(𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚|𝐷𝐷) = = = = 0,04
𝑃𝑃(𝐷𝐷) 𝑃𝑃(𝐷𝐷) 25
10000

Vemos que la probabilidad de que la haya producido la máquina B es pequeña (0,04),


por lo que no parece muy apropiado gastar dinero en reemplazar esta máquina.

Accede al ejercicio de autoevaluación a través del aula virtual

6.3. Variables aleatorias

Accede al vídeo «Variables aleatorias» a través del aula virtual

Una variable aleatoria no es más que una variable de las estudiadas hasta ahora, con la
particularidad de que no somos capaces de asignarle un valor concreto hasta que
determinados hechos futuros hayan ocurrido. Por ejemplo, pensemos en un trabajador
cualquiera de tu empresa, cualquier trabajador elegido al azar: ¿cuál es el salario de este
trabajador? Lo más seguro es que no seas capaz de adivinar su salario, tan solo podrás, a
lo sumo, indicar el rango salarial en el que esperas que se encuentre su salario. Una vez
le hayas preguntado a este trabajador, ya podrás asignarle un valor. Pero, ¿y si ahora que
conocemos su salario cambiamos de trabajador? Vuelta a empezar… Estamos aquí
trabajando con la variable aleatoria salario de un trabajador.

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Por tanto, las variables aleatorias son aquellas variables matemáticas a las cuales no
podemos asignarles un valor concreto a priori, y de las cuales solo conocemos el rango
de valores que podrán tomar. Aunque no conocemos su valor, es posible calcular la
probabilidad de que tome determinados valores para, de este modo, poder controlar y
saber algo más acerca de cómo se va a comportar. También podremos calcular su media,
su varianza y, en definitiva, las medidas resumen aprendidas en temas anteriores, que
nos permiten controlar en parte su incertidumbre y conocer un poco más acerca de su
comportamiento.
Definición

Una variable aleatoria es una variable matemática asociada a un experimento aleatorio.


Por esta razón, el valor que tomará dicha variable nos es desconocido hasta que el
experimento haya dado resultados. Así pues, el concepto de variable aleatoria
proporciona un medio para relacionar cualquier resultado de un experimento aleatorio
con una medida cuantitativa, lo cual significa que a cada elemento de un espacio muestral
se le asigna un valor sobre la recta de los reales.

Tipos de variables aleatorias

En función de los valores que tome la variable, se puede clasificar en discreta o continua
del siguiente modo:

Variable aleatoria discreta: es aquella que solo puede tomar un número finito o
infinito numerable de valores. Por ejemplo: el número de caras en los diez lanzamientos
de una moneda, o el número de lanzamientos necesarios para obtener la primera cara,
etc.

Variable aleatoria continua: es aquella que puede tomar un número infinito no


numerable de valores. Por ejemplo, la renta de una familia, o el tiempo de vida de una
bombilla, etc.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

6.4. Modelos de probabilidad

Accede al vídeo «Modelos de probabilidad» a través del aula virtual

La idea de los modelos de probabilidad es la de asociar cada variable aleatoria con un


tipo de comportamiento particular el cual lleva asociado un determinado modelo
probabilístico. Este modelo nos va a permitir simplificar los cálculos de probabilidad
asociados a dicha variable aleatoria.

Modelos de probabilidad para variables aleatorias discretas

Bernoulli

Representa al tipo de variable aleatoria más sencilla, donde está representada la


realización de un suceso de interés al que llamaremos éxito (𝐸𝐸), siendo su suceso
contrario el fracaso (𝐸𝐸� ). La variable definida como una Bernoulli tomará el valor 1 en
caso de éxito y 0 en el caso de fracaso. Lo denotamos como 𝑋𝑋~𝑏𝑏(𝑝𝑝).

En cuanto a las probabilidades asociadas, tenemos:

𝑃𝑃(é𝑥𝑥𝑥𝑥𝑥𝑥𝑥𝑥) = 𝑃𝑃(𝐸𝐸) = 𝑝𝑝
𝑃𝑃(𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓) = 𝑃𝑃(𝐸𝐸� ) = 1 − 𝑝𝑝

La media es 𝐸𝐸(𝑋𝑋) = 𝑝𝑝, y la varianza 𝜎𝜎 2 = 𝑝𝑝(1 − 𝑝𝑝).

Un típico experimento de Bernoulli es el lanzamiento de una moneda al aire con


probabilidad p para cara y (1-p) para cruz. Si se trata de una moneda convencional, la
probabilidad será ½ en cada caso.

Ejemplo: Modelo de Bernoulli

En un lote hay N artículos fabricados, entre los cuales hay n defectuosos. Se toma al azar
un artículo del lote y se observa si es defectuoso o no. La variable aleatoria X, que
representa el artículo extraído es defectuoso, se distribuye como una b(p), donde p es la

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

probabilidad de éxito (ser defectuoso). ¿Cuál es la probabilidad de que el artículo


extraído sea defectuoso?

Aplicando Laplace se tiene que:


1
𝑃𝑃(𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑) =
𝑁𝑁

Binomial

La distribución binomial surge cuando estamos interesados en el número de veces que


ocurre un suceso A (éxito) en n intentos independientes de un experimento. Se deduce,
por tanto, de la Bernoulli para el caso en el que el experimento aleatorio se repite
sucesivas veces y la probabilidad de éxito se mantiene constante.

Si A tiene probabilidad 𝑝𝑝 (probabilidad de éxito) en un intento, entonces (1 − 𝑝𝑝) es la


probabilidad de que A no ocurra (probabilidad de fracaso).

Supongamos que el experimento consta de n intentos y definimos así la variable


aleatoria: X = número de veces que ocurre A. Entonces, X puede tomar los valores de 0,
1, 2, … n.

Si consideramos uno de estos valores, digamos el valor x, es decir, en x de los n intentos


ocurre A y en (𝑛𝑛 – 𝑥𝑥) no; entonces, la probabilidad de cada posible ordenación es 𝑝𝑝𝑝𝑝(1 −
𝑛𝑛
𝑝𝑝)(𝑛𝑛 − 𝑥𝑥) y existen � � idénticas ordenaciones.
𝑥𝑥

La función de probabilidad P(X = x) será la distribución binomial:

𝑛𝑛
𝑋𝑋~𝐵𝐵(𝑛𝑛; 𝑝𝑝) → 𝑃𝑃(𝑋𝑋 = 𝑥𝑥) = � � (𝑝𝑝) 𝑥𝑥 1 − 𝑝𝑝𝑛𝑛−𝑥𝑥 ,
𝑥𝑥
donde
𝑛𝑛 𝑛𝑛!
� �= .
𝑥𝑥 𝑥𝑥!·(𝑛𝑛−𝑥𝑥)!

Ejemplo: Modelo binomial

¿Cuál es la probabilidad de que en una familia de 4 hijos exactamente 2 sean niñas?

𝑋𝑋~𝐵𝐵(4; 0,5)

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Aplicamos ahora la fórmula de la binomial para el caso en el que se quiere calcular la


probabilidad de que la variable aleatoria X tome el valor igual a 2:

4
𝑃𝑃(𝑋𝑋 = 2) = � � (0,5)2 (1 − 0,5)4−2 = 6 · 0,25 · 0,25 = 0,375
2

4·3·2·1 24
Previamente se ha calculado que �42� = = = 6.
2·1 (2·1) 4

Poisson

Un proceso de Poisson es aquel compuesto de eventos discretos que son independientes


en el espacio y/o en el tiempo.

La variable aleatoria Poisson se utiliza para representar el número de acontecimientos


(sucesos de interés) que ocurren a velocidad media constante sobre el tiempo o el
espacio. Por ejemplo, el número de llegadas a una cola durante un intervalo de tiempo,
el número de llamadas a una central telefónica en un período de tiempo, el número de
defectos producido por piezas similares de un material.

Así, llamaremos Poisson de parámetro λ>0 a un proceso aleatorio para el cual cada
variable aleatoria X se define como número de acontecimientos que ocurren en un
intervalo de longitud t, y se dice que 𝑋𝑋~𝑃𝑃(𝜆𝜆 ∙ 𝑡𝑡). El número de acontecimientos ocurridos
en un intervalo es independiente del correspondiente a cualquier otro intervalo disjunto
con el anterior.

Los valores de la función de cuantía de una Poisson son:

𝑒𝑒 −𝜆𝜆 ·𝜆𝜆𝑥𝑥
𝑋𝑋~𝑃𝑃(𝜆𝜆) → 𝑃𝑃(𝑋𝑋 = 𝑥𝑥) = 𝑥𝑥!
,

con x=0,1,2,… y λ>0, donde 𝑛𝑛 · 𝑝𝑝 = 𝜆𝜆.

En esta distribución, la media y la desviación típica coinciden, siendo iguales a λ.

Ejemplo: Modelo de Poisson

Si de promedio entran 2 coches por minuto en un garaje, ¿cuál es la probabilidad de que


durante un minuto entren 4 o más coches?

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Así, λ = 2. Consideramos el suceso complementario entran 3 coches o menos, que tiene


probabilidad:

𝑃𝑃(𝑋𝑋 ≥ 4) = 𝑃𝑃(𝑋𝑋 ≤ 3)𝑃𝑃(𝑋𝑋 ≥ 4) = 𝑃𝑃(≤ 3)

20 21 22 23
𝑃𝑃(𝑋𝑋 ≤ 3) = 𝑝𝑝(0) + 𝑝𝑝(1) + 𝑝𝑝(2) + 𝑝𝑝(3) = 𝑒𝑒 −2 � + + + �
0! 1! 2! 3!
= 0,857
Entonces, la probabilidad pedida es:

𝑃𝑃(𝑋𝑋 ≥ 4) = 1 − 0,857 = 0,143𝑃𝑃(𝑋𝑋 ≥ 4) = 1 − 0,857 = 0,143

Modelos de probabilidad para variables aleatorias continuas

Las técnicas de inferencia estadística se basan en modelos de probabilidad continuos.


Uno de ellos, el modelo normal o de Gauss, es la base para la mayoría de fórmulas y
postulados que encontraremos en niveles más avanzados de estadística. Por ello,
consideramos de especial relevancia que comprendas e interiorices bien los contenidos
de esta sección.

Normal

Una variable aleatoria continua 𝑋𝑋 sigue una distribución normal de media µ y varianza
𝜎𝜎 2 , y lo denotamos como 𝑋𝑋~𝑁𝑁(𝜇𝜇, 𝜎𝜎 2 ).

La función de densidad de la normal tiene forma de campana. Centrada en la media


(μ), cumple la simetría que podemos observar en la siguiente figura. Deja a un lado de la
media una distancia proporcional a su desviación típica (σ), situando en el centro las
probabilidades que se indican en la siguiente figura.

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ejemplos de variables aleatorias que siguen una distribución normal

La talla de un individuo y su peso, las calificaciones de unos estudiantes en los exámenes,


y el valor que puede tomar cualquier indicador macroeconómico para un conjunto de
territorios.

Sin embargo, hay variables aleatorias que no siguen una distribución normal. Un ejemplo
de este caso lo encontramos en la variable renta anual de las familias, ejemplo que ya
fue presentado en el tema anterior como ejemplo de variable continua. Los valores que
puede tomar dicha variable continua no se encuentran simétricamente distribuidos
alrededor de un valor central, sino que el conjunto de valores que puede tomar esa
variable va desde el 0 hasta un valor máximo indeterminado. Esta variable presenta una
mayor frecuencia en los valores próximos a cero y una menor probabilidad conforme va
tomando valores elevados y acercándose al valor máximo. Se dice así que la distribución
presenta asimetría por la derecha.

Es posible transformar estas variables para que sigan una distribución normal. Una
transformación habitual consiste en tomar el logaritmo neperiano de la variable, lo cual
tiene sentido para variables positivas como el caso de la renta. En este caso, si 𝑋𝑋 es una
variable positiva con distribución simétrica por la derecha, entonces su transformación
logarítmica 𝑌𝑌 = 𝑙𝑙𝑙𝑙(𝑋𝑋) se distribuye como una distribución log-normal.

Para el cálculo de probabilidades existen tabulaciones de la distribución, que nos dan las
distintas probabilidades para la variable normal tipificada (estandarizada). La

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

distribución resultante de la tipificación de 𝑋𝑋 se denomina normal estándar, cuyo


procedimiento de tipificación podemos ver a continuación:

𝑋𝑋 − 𝜇𝜇 𝑋𝑋 − 𝜇𝜇
𝑍𝑍 = =
√𝜎𝜎 2 𝜎𝜎

Vamos a ver con el siguiente ejemplo cómo tipificar la variable 𝑋𝑋 para pasar de un cálculo
de probabilidades sobre 𝑋𝑋 al cálculo de probabilidades sobre 𝑍𝑍.

Ejemplo: Modelo Normal

Si el cociente intelectual (CI) de una población se ajusta a una N(96,2; 5,72 ), elegido un
individuo al azar, ¿cuál es la probabilidad de que su CI sea mayor que 100?
𝑋𝑋 = 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑𝑑𝑑 𝐶𝐶𝐶𝐶.

𝑋𝑋 − 96,2 100 − 96,2


𝑃𝑃(𝑋𝑋 > 100) = 𝑃𝑃 � > � = 𝑃𝑃(𝑍𝑍 > 0,667) = 0,252
5,7 5,7

El valor 0,252 del ejemplo anterior sale de las tablas de tabulación de la normal estándar.

Mostramos ahora una serie de modelos de distribución, los cuales se deducen de


variables aleatorias continuas con distribución normal estándar.

» Distribución chi-cuadrado: La forma de la distribución de la chi-cuadrado es


asimétrica por la derecha y los diferentes grados de libertad conforman toda una
familia de posibles distribuciones de probabilidad.
» Distribución t-student: la forma de la curva de la distribución t-student también
depende de los grados de libertad que se estén considerando. En cuanto a su forma
general, esta es muy parecida a la de la normal estándar, y se aproxima a ella a medida
que aumentan sus grados de libertad. Es simétrica respecto del valor central 0.
» Distribución F de Fisher-Snedecor: la distribución F es asimétrica por la
derecha, y la forma de su curva de densidad depende de los grados de libertad que se
consideren.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 6 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer…

Ejercicios resueltos sobre distribuciones de probabilidad

El siguiente manual de Santiago de la Fuente, profesor de Estadística Teórica en la


Universidad Autónoma de Madrid, está repleto de ejercicios resueltos. Con ellos podrás
practicar el cálculo de probabilidades a partir de los modelos de distribución. Sé
selectivo/a y presta atención a aquellos ejercicios que trabajan los modelos que hemos
estudiado en este tema.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.fuenterrebollo.com/Aeronautica2016/ejer-distribuciones.pdf

No dejes de ver…

Estadística y probabilidad. Tabla de distribución normal

Este vídeo muestra un tutorial para hallar el área bajo la curva en una distribución
normal.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
http://www.utel.edu.mx/blog/infografias-utel/estadistica-y-probabilidad-tabla-de-
distribucion-normal/

TEMA 6 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

+ Información

A fondo

Repaso de combinatoria: Variaciones, Permutaciones y Combinaciones

A continuación, se facilita el enlace a unos apuntes muy sencillos. Estos han sido
facilitados por la Universidad de La Rioja, procedentes de un seminario de creatividad
matemática. En ellos se recuerdan los principales elementos del análisis combinatorio.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.unirioja.es/talleres/creatividad_matematica/SeminarioBachillerato/COM
BINATORIA.pdf

Bibliografía

Arias, L., Portilla, L. M. y Bernal, M. E. (2008). Los costos y su manejo con el control
estadístico de procesos, con ayuda de la distribución normal. Scientia et Technica, 38,
259-264. Recuperado de
http://revistas.utp.edu.co/index.php/revistaciencia/article/view/3757/2001

Arriaza, M. (2010). Guía Práctica para el análisis de datos. Junta de Andalucía.


Consejería de Innovación, ciencia y empresa.

Hueso, A. y Cascant, M. J. (2012). Metodología y técnicas cuantitativas de


investigación. Editorial Universitat Politécnica de Valencia.

TEMA 6 – + Información © Universidad Internacional de La Rioja en México (UNIR)


Estimadores de máxima verosimilitud
[7.1] El Método de máxima verosimilitud

[7.2] Propiedades de los estimadores de máxima verosimilitud

[7.3] Ejemplos y estudio de casos

7 TEMA
Estadística

Esquema

TEMA 7 – Esquema © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ideas clave

Para estudiar este tema es necesario que leas las Ideas clave expuestas a continuación.
Es necesario también leer los siguientes documentos:

Teoría y problemas acerca de indicadores de máxima verosimilitud:

» Inferencia basada en la verosimilitud. Edilatex.com. Recuperado el 15 de junio de


2015 en: http://www.edilatex.com/index_archivos/estadistica.pdf
» Molinero, L. M. (2003). ¿Qué es el método de estimación de máxima verosimilitud
y cómo se interpreta? Alceingenieria.net. Recuperado el 16 de junio de 2015 en:
https://studylib.es/doc/4763556/%C2%BFqu%C3%A9-es-el-m%C3%A9todo-de-
estimaci%C3%B3n-de-m%C3%A1xima-verosimilitud-y…

Propiedades de logaritmos:

Números reales. Propiedades de los logaritmos. Vadenumeros.es. Recuperado el 17 de


junio de 2015 en: http://www.vadenumeros.es/primero/propiedades-de-los-
logaritmos.htm

7.1. El Método de máxima verosimilitud

Sabemos que la estimación puntual es una técnica que busca determinar el mejor
estadístico. Una vez calculado por única vez, su valor deberá ser el que tenga la mayor
aproximación al valor exacto del parámetro.

El método de estimación por máxima verosimilitud consiste en seleccionar el valor


del parámetro para el cual la probabilidad de que ocurra el resultado experimental ya
logrado sea máxima. Es decir, dados los resultados experimentales de un fenómeno, ¿qué
valor del parámetro tiene la máxima probabilidad de ser el verdadero?

Algunas partes del procedimiento requieren del cálculo diferencial e integral para
maximizar la función de verosimilitud, estas no serán tratadas ni en las
exposiciones ni en la evaluación.

TEMA 7 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

En las páginas web que te iremos recomendando a lo largo del tema 2, podrás
documentarte al respecto

Ahora resolveremos paso a paso un ejemplo que podrás tomar como modelo para la
solución de otros casos.

Vamos a suponer que se extrae una muestra de tamaño n de una población que sigue una
distribución de probabilidad exponencial con parámetro 𝜃𝜃. Dado que las variables
aleatorias de la muestra son: 𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , … 𝑥𝑥𝑛𝑛 , la función de probabilidad que sigue la
población se puede expresar como:

𝑥𝑥𝑖𝑖
1
𝑓𝑓(𝑥𝑥𝑖𝑖 ; 𝜃𝜃) = 𝑒𝑒 −− 𝜃𝜃 Para 𝑥𝑥𝑖𝑖 > 0; 𝜃𝜃 > 0
𝜃𝜃

Sustituyendo en la función anterior cada una de las variables de la muestra y


multiplicando los términos resultantes, se tiene la función conjunta denotada por la
letra L, es decir:

𝑛𝑛
∑𝑖𝑖=1 𝑥𝑥𝑖𝑖
𝑥𝑥1 𝑥𝑥2
1 1 1
𝐿𝐿(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , … 𝑥𝑥𝑛𝑛 ; 𝜃𝜃) = � 𝑒𝑒 − 𝜃𝜃 � ∗ � 𝑒𝑒 − 𝜃𝜃 � … ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 n 𝑡𝑡é𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 = 𝑒𝑒 𝜃𝜃 ,
𝜃𝜃 𝜃𝜃 𝜃𝜃𝑛𝑛

Sacando logaritmo natural en los dos lados de la igualdad anterior:

𝑛𝑛
1 ∑𝑖𝑖=1 𝑥𝑥𝑖𝑖
𝑙𝑙𝑙𝑙�𝐿𝐿(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , … ; 𝜃𝜃)� = 𝑙𝑙𝑙𝑙 � 𝑛𝑛 𝑒𝑒 𝜃𝜃 �
𝜃𝜃

Aplicando las leyes de logaritmos en el lado derecho tenemos:

𝑛𝑛
1 ∑𝑖𝑖=1 𝑥𝑥𝑖𝑖
𝑙𝑙𝑙𝑙 � � + 𝑙𝑙𝑙𝑙 �𝑒𝑒 𝜃𝜃 �
𝜃𝜃 𝑛𝑛
∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖
𝑙𝑙𝑙𝑙(1) − 𝑛𝑛 𝑙𝑙𝑙𝑙(𝜃𝜃) +
𝜃𝜃

Recuerda que ln (e)=1, ya que el número e es la base del sistema de logaritmos naturales.
Ahora considerando toda la igualdad podemos expresar:

∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖
𝑙𝑙𝑙𝑙(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , … 𝑥𝑥𝑛𝑛 ; 𝜃𝜃) = −𝑛𝑛𝑛𝑛𝑛𝑛(𝜃𝜃) +
𝜃𝜃

TEMA 7 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Se calcula la primera derivada de la función, y se iguala a cero:

1 ∑𝑛𝑛
𝑖𝑖=1 𝑥𝑥𝑖𝑖 ∑𝑛𝑛
𝑖𝑖=1 𝑥𝑥𝑖𝑖 𝑛𝑛 𝜃𝜃2 𝑛𝑛 ∑𝑛𝑛 𝑥𝑥𝑖𝑖
−𝑛𝑛 � � + 𝜃𝜃2
= 0; 𝜃𝜃2
= ; ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 = ; 𝑖𝑖=1 =𝜃𝜃� = 𝑋𝑋�
𝜃𝜃 𝜃𝜃 𝜃𝜃 𝑛𝑛

El símbolo 𝜃𝜃� corresponde al del estimador del parámetro. De acuerdo al procedimiento


anterior se tiene que el estimador de máxima verosimilitud para el parámetro 𝜃𝜃, es la
media de la muestra.

El desarrollo anterior muestra el procedimiento para obtener la fórmula del


estimador de máxima verosimilitud para un parámetro de la población.
Desde luego, es fundamental indicar la distribución de probabilidad que sigue
esta, para poder establecer la fórmula de la distribución conjunta que es la
expresión más importante del proceso, y por supuesto, la que se ha de manipular
aplicando las leyes de logaritmos.

Aunque la parte medular incluye procedimientos de cálculo, estos no serán exigidos en


ningún caso, pero si se te mostrará la expresión de la cual deberás despejar 𝜃𝜃�.

7.2. Propiedades de los estimadores de máxima verosimilitud

Accede al vídeo «Estimadores de máxima verosimilitud» a través del aula


virtual

TEMA 7 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Consistencia

Un requerimiento lógico para un estimador es que su precisión mejore al aumentar


el tamaño de la muestra. Es decir, que esperamos obtener mejores estimaciones
cuanto mayor sea el número de elementos.

Sesgo

Otra propiedad que debe cumplir el estimador de un parámetro θ es que, en promedio,


sus valores coincidan con θ. Cuando sucede esto decimos que el estimador es centrado
o insesgado.

Por ejemplo, una estimación puntual se puede comparar al ejercicio de tiro a una
diana. En este sentido, el centro de la diana es el verdadero valor del parámetro a estimar
(θ). De manera que los intentos de un tirador insesgado estarían distribuidos alrededor
del centro de la diana. Mientras que los intentos de un tirador sesgado estarían
sistemáticamente desviados de la diana.

Tirador insesgado Tirador sesgado

Eficiencia

Recordando que la dispersión de una variable aleatoria se mide por medio de la varianza,
por tanto, de dos estimadores centrados de un mismo parámetro, se prefiere el que tiene
menor varianza y se dice que es el más eficiente. Lo anterior se puede expresar como:

Si T1 y T2 son dos estimadores centrados de θ: E(T1)=E(T2)=θ; siendo E(T1)=valor


esperado del estimador T1, y E(T2) = valor esperado de T2

TEMA 7 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Por otro lado, T1 es más eficiente que T2, si V(T1) < V(T2)

Suficiencia

Un estadístico U es suficiente para un parámetro θ, si contiene toda la información de la


muestra para dicho parámetro. Dada una muestra aleatoria 𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , 𝑥𝑥4 , … 𝑥𝑥𝑛𝑛 y un
estadístico ∪ (𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , 𝑥𝑥4 , … 𝑥𝑥𝑛𝑛 ) = ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 , afirmaremos que el estadístico U es suficiente
para el parámetro θ, si cumple con:

𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , 𝑥𝑥4 , … 𝑥𝑥𝑛𝑛 ; 𝜃𝜃) = ℎ(∪; 𝜃𝜃)𝑔𝑔(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , 𝑥𝑥4 , … 𝑥𝑥𝑛𝑛 ), denominada factorización
de Neyman Fisher. Para demostrar la igualdad anterior, utilizaremos como función
𝑒𝑒 −𝜆𝜆
de densidad el modelo de Poisson 𝑃𝑃(𝑥𝑥; 𝜆𝜆) = 𝜆𝜆𝑥𝑥 𝑥𝑥!
; 𝑥𝑥 = 1,2,3,4, …

Considerando el modelo anterior para formar la función de densidad conjunta de la


muestra, tenemos:

𝑒𝑒 −𝜆𝜆 𝑒𝑒 −𝜆𝜆 𝑒𝑒 −𝜆𝜆 𝑒𝑒 −𝑛𝑛𝑛𝑛


𝑓𝑓(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , 𝑥𝑥4 , … 𝑥𝑥𝑛𝑛 ; 𝜆𝜆) = �𝜆𝜆𝑥𝑥1 � �𝜆𝜆𝑥𝑥2 � … �𝜆𝜆𝑥𝑥𝑛𝑛 � = 𝜆𝜆∑ 𝑥𝑥𝑖𝑖
𝑥𝑥1 ! 𝑥𝑥2 ! 𝑥𝑥𝑛𝑛 ! 𝑥𝑥1 ! 𝑥𝑥2 ! 𝑥𝑥𝑛𝑛 !
1
Haciendo ℎ(∑ 𝑥𝑥𝑖𝑖 ; 𝜆𝜆) = 𝜆𝜆∑ 𝑥𝑥𝑖𝑖 𝑒𝑒 −𝜆𝜆 , y 𝑔𝑔(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , 𝑥𝑥4 , … 𝑥𝑥𝑛𝑛 ) = , vemos que el
𝑥𝑥1 !𝑥𝑥2 !𝑥𝑥3 !…𝑥𝑥𝑛𝑛 !

estadístico U es suficiente para estimar el parámetro λ.

Accede al ejercicio de autoevaluación a través del aula virtual

7.3. Ejemplos y estudio de casos

Accede al vídeo «Ejemplos de estimadores de máxima verosimilitud» a través


del aula virtual

1. Determinar el estimador de máxima verosimilitud del parámetro p para una variable


aleatoria geométrica cuya función de densidad es 𝑓𝑓(𝑥𝑥𝑖𝑖 ; 𝑝𝑝) = 𝑝𝑝(1 − 𝑝𝑝)𝑥𝑥𝑖𝑖−1 , 𝑥𝑥𝑖𝑖 = 1,2,3,4, …

TEMA 7 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Solución:

Primer paso. Establecer la función de verosimilitud:


∑𝑛𝑛
𝑖𝑖=1 𝑥𝑥𝑖𝑖−∑𝑛𝑛 1 𝑛𝑛
𝐿𝐿(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , … 𝑥𝑥𝑛𝑛 ; 𝑝𝑝) = 𝑝𝑝𝑛𝑛 (1 − 𝑝𝑝) 𝑖𝑖=1 = 𝑝𝑝𝑛𝑛 (1 − 𝑝𝑝)∑𝑖𝑖=1 𝑥𝑥𝑖𝑖−𝑛𝑛

Segundo paso. Sacar logaritmos naturales y aplicar propiedades:


𝑛𝑛

ln�𝐿𝐿(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , … 𝑥𝑥𝑛𝑛 ; 𝑝𝑝)� = 𝑛𝑛 𝑙𝑙𝑙𝑙𝑙𝑙 + � 𝑥𝑥𝑖𝑖 ln(1 − 𝑝𝑝) − 𝑛𝑛 ln(1 − 𝑝𝑝)
𝑖𝑖=1

Tercer paso. Despejar p de la expresión:


𝑛𝑛 ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 𝑛𝑛
− + =0
𝑝𝑝 1 − 𝑝𝑝 1 − 𝑝𝑝

Multiplicando la expresión anterior por 𝑝𝑝(1 − 𝑝𝑝), tenemos:


𝑛𝑛

𝑛𝑛(1 − 𝑝𝑝) − 𝑝𝑝 � 𝑥𝑥𝑖𝑖 + 𝑛𝑛𝑛𝑛 = 0


𝑖𝑖=1

Efectuando las operaciones indicadas:


𝑛𝑛

𝑛𝑛 − 𝑛𝑛𝑛𝑛 − 𝑝𝑝 � 𝑥𝑥𝑖𝑖 + 𝑛𝑛𝑛𝑛 = 0


𝑖𝑖=1

Finalmente:
𝑛𝑛
𝑝𝑝 =
∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖

Ahora bien, si tenemos una muestra de tamaño n=6, compuesta por 3, 3, 2, 1,2,3, el
estimador de máxima verosimilitud de p, será:
6 6 3
𝑝𝑝̂ = = =
1 + 2 + 2 + 3 + 3 + 3 14 7

2. El tiempo de realización en minutos de una determinada tarea dentro de un proceso


industrial es una variable aleatoria con función de densidad:

𝑥𝑥 −𝑥𝑥
𝑓𝑓(𝑥𝑥) = 𝑒𝑒 𝜃𝜃
𝜃𝜃

Donde θ>0; calcular el estimador máximo verosímil de θ para una muestra aleatoria
simple de tamaño n.

TEMA 7 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Solución:

Primer paso. Establecer la función de verosimilitud:


1 𝑥𝑥
− 1 1 𝑥𝑥
− 2 1 𝑥𝑥
− 𝑛𝑛
𝐿𝐿(𝑥𝑥1 , 𝑥𝑥2 , 𝑥𝑥3 , … 𝑥𝑥𝑛𝑛 ; 𝜃𝜃) = � 𝑥𝑥1 𝑒𝑒 𝜃𝜃 � � 𝑥𝑥2 𝑒𝑒 𝜃𝜃 � … � 𝑥𝑥𝑛𝑛 𝑒𝑒 𝜃𝜃 �
𝜃𝜃 𝜃𝜃 𝜃𝜃

Considerando que se trata del producto de n términos, el lado derecho de la ecuación


anterior se puede anotar como:
𝑛𝑛
1 𝑛𝑛 −∑𝑖𝑖=1 𝑥𝑥𝑖𝑖
𝑛𝑛

� � 𝑒𝑒 𝜃𝜃 � 𝑥𝑥𝑖𝑖
𝜃𝜃
𝑖𝑖=1

En donde ∏𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 = 𝑥𝑥1 ∗ 𝑥𝑥2 ∗ 𝑥𝑥3 ∗ … 𝑥𝑥𝑛𝑛

Segundo paso. Escribir el logaritmo de la verosimilitud, y aplicar propiedades:


𝑛𝑛
∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖
−𝑛𝑛 ln 𝜃𝜃 − + ln � 𝑥𝑥𝑖𝑖
𝜃𝜃
𝑖𝑖=1

Tercer paso. Se calcula la derivada de la función anterior con respecto a θ, y se iguala


a cero:
𝑛𝑛 ∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖
− + =0
𝜃𝜃 𝜃𝜃 2

Cuarto paso. Se despeja el estimador de máxima verosimilitud y se expresa como 𝜃𝜃�:


∑𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖 𝑛𝑛
=
𝜃𝜃 2 𝜃𝜃
𝑛𝑛
∑𝑖𝑖=1 𝑥𝑥𝑖𝑖
𝜃𝜃� =
𝑛𝑛

3. La siguiente tabla contiene una muestra aleatoria simple de 15 registros de los tiempos
para realizar una tarea:

5.56 4.69 0.21 3.51 2.71


10.12 0.60 1.73 1.98 2.50
2.23 3.47 1.40 1.19 0.97

Calcula la estimación máximo verosímil del tiempo medio de realización del proceso.

TEMA 7 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Solución:
15
1 42.87
𝑥𝑥̅ = � 𝑥𝑥𝑖𝑖 = = 2.858
15 15
𝑖𝑖=1

Para esta muestra se tiene que el estimador máximo verosímil es:


𝐸𝐸[𝑥𝑥̅ ]𝑀𝑀𝑀𝑀 = 2.858

4. Calcular el estimador máximo verosímil de una población cuya función de densidad


tiene la forma:
𝑓𝑓(𝑥𝑥) = 𝜃𝜃𝑥𝑥 𝜃𝜃−1 , para θ >0 y 0 < x < 1

Solución:

Primer paso. Establecer la función de verosimilitud:


𝑛𝑛 𝜃𝜃−1
𝜃𝜃−1 𝜃𝜃−1 𝜃𝜃−1 𝑛𝑛
𝐿𝐿(𝑥𝑥1 , 𝑥𝑥2 , … 𝑥𝑥𝑛𝑛 ; 𝜃𝜃) = 𝜃𝜃𝑥𝑥1 ∗ 𝜃𝜃𝑥𝑥2 … ∗ 𝜃𝜃𝑥𝑥𝑛𝑛 = 𝜃𝜃 � 𝑥𝑥𝑖𝑖
𝑖𝑖=1

Segundo paso. Escribir el logaritmo de la verosimilitud y aplicar propiedades de


logaritmos:
𝑛𝑛

𝑛𝑛 ln 𝜃𝜃 + (𝜃𝜃 − 1)𝑙𝑙𝑙𝑙 � 𝑥𝑥𝑖𝑖


𝑖𝑖=1

Tercer paso. Despejar θ de la expresión:


𝑛𝑛
𝑛𝑛
+ 𝑙𝑙𝑙𝑙 � 𝑥𝑥𝑖𝑖 = 0
𝜃𝜃
𝑖𝑖=1
𝑛𝑛

𝑛𝑛 = −𝜃𝜃 𝑙𝑙𝑙𝑙 � 𝑥𝑥𝑖𝑖


𝑖𝑖=1
𝑛𝑛
𝜃𝜃 = −
𝑙𝑙𝑙𝑙 ∏𝑛𝑛𝑖𝑖=1 𝑥𝑥𝑖𝑖

5. Una urna contiene bolas blancas y negras. Sea p la probabilidad de extraer una bola
blanca, cuando se realiza una extracción al azar. La variable aleatoria asociada a esta
prueba es X, que puede tomar los siguientes valores: X=1, si la bola extraída es blanca,
X= 0, si la bola extraída es negra. ¿Qué valor de p es el estimador de máxima
verosimilitud?

TEMA 7 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Solución:

Considerando la distribución de probabilidad 𝑃𝑃(𝑋𝑋 = 𝑥𝑥) = 𝑝𝑝 𝑥𝑥 (1 − 𝑝𝑝)1−𝑥𝑥 , y suponiendo


que el resultado de una extracción es (B, N, B), debemos determinar entre p=0.60 y
p=0.70, qué valor de p hace más probable la ocurrencia de la extracción anterior.

Estableciendo 𝑃𝑃(𝐵𝐵) = 𝑝𝑝; 𝑃𝑃(𝑁𝑁) = 1 − 𝑝𝑝, de acuerdo al orden de la extracción tenemos:


𝑝𝑝. (1 − 𝑝𝑝). 𝑝𝑝 = 𝑝𝑝2 (1 − 𝑝𝑝)

Ahora sustituyendo los valores de probabilidad propuestos:


Si p=0.60; P(B,N,B)= 0.602 (1-0.60)=0.144
Si p=0.70; P(B,N,B)= 0.702 (1-0.70)= 0.147

Por tanto, resulta más probable p= 0.70 y es el estimador más verosímil.

Accede al ejercicio de autoevaluación a través del aula virtual

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 7 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer…

Pronósticos en los negocios

Hanke, J. E. y Dean, W. (2006). Pronósticos en los negocios. Pearson.

El libro contiene un análisis de los procedimientos fundamentales para elaborar


pronósticos en los negocios, así como diversas aplicaciones de la estadística a la
Administración.

Accede al libro a través de la Biblioteca Virtual de UNIR

¿Qué es un pronóstico? Características y métodos

Un artículo de gran interés en el plano empresarial, que describe las características,


clasificación y necesidad de los pronósticos para una mejor toma de decisiones.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.gestiopolis.com/que-es-un-pronostico-caracteristicas-y-metodos/

TEMA 7 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

+ Información

A fondo

Ejercicio de estimación de máxima verosimilitud

Arribas Gil, A. Ejercicio de estimación de máxima verosimilitud. Madrid: Universidad


Carlos III.

El siguiente documento nos describe la teoría, fórmulas y problemas sobre estimadores


de máxima verosimilitud.

Accede al documento a través del aula virtual o desde la siguiente dirección web:
http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/Sol_Ej_EMV.pdf

Ejercicios adicionales de Estimación por el método de Máxima


Verosimilitud

El siguiente documento elaborado como apuntes de la Universidad de las Palmas de Gran


Canaria (España), nos ofrece ejercicios resueltos sobre estimadores de máxima
verosimilitud

Accede al documento a través del aula virtual o desde la siguiente dirección web:
http://www2.ulpgc.es/hege/almacen/download/29/29399/emv.pdf

Bibliografía

Alvarado, J. A. (2008) Fundamentos de Inferencia Estadística. 1ª ed. Pontificia


Universidad Javeriana.

Rubin, L. (2004) Estadística para Administración y Economía. 7a ed. México: Pearson


Educación.

TEMA 7 – + Información © Universidad Internacional de La Rioja en México (UNIR)


Intervalos de confianza
[8.1] Tratamiento y definición del problema

[8.2] Intervalo de confianza para la media de una normal:


variación poblacional conocida

[8.3] Intervalo de confianza para la media de una normal:


variación poblacional desconocida

[8.4] Intervalo de confianza para la variación de una normal

[8.5] Intervalo de confianza para proporciones de una


población

[8.6] Intervalo de confianza para la diferencia de medias


de dos poblaciones normales

8
[8.7] Intervalo de confianza para el cociente de variaciones

[8.8] Intervalo de confianza para la diferencia de


proporciones TEMA
[8.9] Intervalos asintóticos
Estadística

Esquema

TEMA 8 – Esquema © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ideas clave

Para estudiar este tema es necesario que leas las Ideas clave expuestas a continuación.
Es muy importante que tengas en cuenta las páginas web señaladas en el desarrollo de
los temas anteriores, ya que te servirán de referencia cuando necesites revisar alguna
fórmula o concepto.

Además, es necesario consultar los siguientes documentos:

Fórmulas y problemas, analizando todos los casos:


Pérez Castejón, J.J. Intervalos de confianza. Estadística aplicada a la empresa II.
España: Universidad de Murcia. Recuperado el 3 de julio de 2015 en:
http://docplayer.es/26457199-Contraste-de-hipotesis-estadistica-aplicada-a-la-
empresa-ii-prof-d-juan-jose-perez-castejon.html

Intervalos de confianza para la diferencia de medias:


ITCH. Instituto Tecnológico de Chihuahua. Distribución Muestral de Diferencia de
Medias. México: Chihuahua. Recuperado el 4 de julio de 2015 en:
http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html

El objetivo fundamental de este tema es que aprendas a construir intervalos de


confianza para estimar los valores de los principales parámetros
poblacionales como son: la media, la proporción y la variación.

Te recomendamos que leas con mucha atención el desarrollo de cada apartado, así como
los ejemplos resueltos que han sido preparados para guiarte en tu estudio e incrementar
tu experiencia operacional.

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

8.1. Tratamiento y formulación del problema

Accede al vídeo «Introducción a los intervalos de confianza» a través del aula


virtual

Una de las funciones importantes de todo profesionista inmerso en el mundo


empresarial, es la de hacer estimaciones y pronósticos. Jefes de departamento,
directores y administradores, hacen estimaciones acerca de la demanda de un producto,
del número de créditos hipotecarios que deberán otorgar, o de las inscripciones en las
materias para el siguiente semestre. En la mayoría de los casos, las estimaciones se hacen
sin saber si son científicas o no, pero con la esperanza de que los resultados que se
obtengan sean muy semejantes a los reales, porque además una vez elaboradas, nos
permitirán tomar decisiones que seguramente estarán relacionadas no solo con el
funcionamiento de una empresa por ejemplo, sino también con su rentabilidad. Más aún,
en muchas ocasiones hemos elaborado estimaciones o tendremos que hacerlo sin contar
con la información pertinente completa, es decir, con una cuota importante de
incertidumbre.

La búsqueda de información segura, veraz, confiable, que nos dé mayor certeza y nos
permita tomar mejores decisiones, hace necesaria la formulación de intervalos para
estimar parámetros de la población.

El objetivo fundamental de este tema es que aprendas a construir e interpretar


estimaciones de los principales parámetros poblacionales por medio de la
formulación de intervalos de confianza.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

8.2. Intervalo de confianza para la media de una normal:


variación poblacional conocida

Accede al vídeo «Intervalo de confianza para la medida con varianza


poblacional conocida» a través del aula virtual

� que es la media aritmética de la muestra, de 𝜎𝜎, la desviación


A partir de los valores de 𝑿𝑿
típica de la población, y considerando que la población sigue una distribución normal, se
pueden formular tres intervalos en función del grado de confianza que se requiera
para la solución de un determinado caso. El grado de confianza es la probabilidad de
que el valor de la media poblacional 𝝁𝝁 se encuentre contenido en el intervalo
formulado.

Los grados de confianza que se manejan en la práctica son 90%, 95% y 99%. Cada
porcentaje representa el área central entre dos valores de Z simétricamente situados. Los
valores de Z correspondientes a los grados de confianza anteriores son: 1.64, 1.96 y 2.58
respectivamente.

La fórmula que se utiliza para la construcción de los intervalos de confianza es:


𝜎𝜎
𝑋𝑋� ± 𝑍𝑍
√𝑛𝑛

O bien:
𝜎𝜎 𝜎𝜎
𝑋𝑋� − 𝑍𝑍 ≤ 𝜇𝜇 ≤ 𝑋𝑋� +
√𝑛𝑛 √𝑛𝑛

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ejemplos:

1. Si 𝑋𝑋�= 80, σ=8 y n= 64, construya una estimación de intervalo de confianza del 95%
de la media poblacional 𝜇𝜇.

Solución:
Sustituyendo en la fórmula anterior:
8 8
80 − 1.96 ≤ 𝜇𝜇 ≤ 80 + 1.96
√64 √64

Efectuando las operaciones:


78 ≤ 𝜇𝜇 ≤ 82

Con un 95% de confianza la media poblacional se encuentra entre 78 y 82

2. Suponga que se desea estimar la vida media de un gran embarque de focos. Se sabe
que la desviación típica es de 80 horas, y una muestra aleatoria de 81 focos ha revelado
que la vida media de los focos de la muestra es de 375 horas.

Construye una estimación de intervalo de confianza del 90% para la media poblacional
de la duración de los focos de este embarque.

Solución:

Sustituyendo en la fórmula los datos del caso:


80 80
375 − 1.64 ≤ 375 + 1.64
√81 √81

Efectuando las operaciones indicadas:


360 ≤ 𝜇𝜇 ≤ 390

Con un 90% de confianza la media poblacional de la duración de los focos se encuentra


entre 360 y 390 horas.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

8.3. Intervalo de confianza para la media de una normal:


variación poblacional desconocida

Accede al vídeo «Intervalo de confianza para la media con varianza


poblacional desconocida» a través del aula virtual

Considerando que muy rara vez se conoce la desviación estándar real de la población,
para hacer una estimación de la media formulando un intervalo de confianza, deberán
� y 𝑺𝑺.
utilizarse solamente los estadísticos de la muestra 𝑿𝑿

Tomando en cuenta lo anterior, la fórmula que se utiliza para hacer una estimación por
intervalo de confianza es:
𝑆𝑆
𝑋𝑋� ± 𝑡𝑡𝑛𝑛−1
√𝑛𝑛

O bien:
𝑆𝑆 𝑆𝑆
𝑋𝑋� − 𝑡𝑡𝑛𝑛−1 ≤ 𝜇𝜇 ≤ 𝑋𝑋� + 𝑡𝑡𝑛𝑛−1
√𝑛𝑛 √𝑛𝑛

Para la cual el valor de t se obtiene de la tabla de la distribución t de Student,


implementada por William S. Gosset, para hacer inferencias acerca de la media cuando
no se conoce σ. Si en una muestra de tamaño n se calcula 𝑋𝑋�, solo n-1 de los valores de la
muestra son libres de variar; n-1 es el número de grados de libertad que se utiliza junto
con el grado de confianza, para buscar el valor de t en la tabla de la distribución.

La forma de la curva de la distribución t de Student se aproxima a la forma de la


curva normal, cuando el tamaño de la muestra aumenta.

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Por ejemplo, para una muestra de tamaño 11 y un grado de confianza del 90%, el número
de grados de libertad es 10, y dado que 1-α = 0.90, el 0.10 restante queda repartido
simétricamente en los dos extremos de la distribución, por tanto, el valor de t se debe
buscar en la columna encabezada por el valor 0.05, como se muestra en la figura.

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ejemplos:

1. En una dependencia se desea calcular el ingreso medio de una comunidad, para esto
se tomó una muestra de 25 familias y se determinó un ingreso medio de $ 12500 con una
desviación estándar de $800. Formule un intervalo de confianza del 90% para hacer una
estimación del ingreso medio de la zona.

Solución:

El valor de t correspondiente a (25-1) grados de libertad, con α/2 = 0.05 es 1.7109, por
lo que el intervalo de confianza se puede expresar como:
800 800
12500 − 1.7109 ∗ ≤ 𝜇𝜇 ≤ 12500 + 1.7109 ∗
√25 √25

Ahora efectuando las operaciones indicadas tenemos:


$𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏 ≤ 𝝁𝝁 ≤ $ 𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏𝟏

Hemos utilizado la distribución t porque no se conoce la desviación estándar de la


población y el tamaño de la muestra es menor que 30.

2. Ahora suponga que en el caso anterior el tamaño de la muestra se incrementa a 50,


formule un intervalo de confianza del 90% para estimar el ingreso medio de las familias
de la zona.

Solución:

Dado que el tamaño de la muestra es mayor que 30, el Teorema del límite central nos
permite utilizar la distribución normal como distribución de muestreo, lo cual
significa que para el grado de confianza del 90%, podemos utilizar Z= 1.64, por tanto:
800 800
12500 − 1.64 ∗ ≤ 𝜇𝜇 ≤ 12500 + 1.64 ∗
√50 √50

Efectuando las operaciones indicadas y simplificando tenemos:


$12314 ≤ µ ≤ $ 12686, redondeando las cantidades al entero más próximo.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

8.4. Intervalo de confianza para la variación de una normal

Accede al vídeo «Intervalo de confianza para la varianza» a través del aula


virtual

Para formular un intervalo de confianza para un nivel dado (90%, 95%, 99%) para la
varianza y la desviación típica de una población normal, debemos tener en cuenta la
(𝒏𝒏−𝟏𝟏)𝑺𝑺𝟐𝟐
variable aleatoria 𝝈𝝈𝟐𝟐
que tiene una distribución chi cuadrada.

La fórmula que se expone muestra el significado de la región 1-α que se señala en la


figura. Observa que es un valor de probabilidad, la probabilidad de que el valor de σ2 se
encuentre entre los límites señalados en la expresión.

Ejemplos:

En una muestra de 20 vendedores de una empresa que se dedica a la venta de cosméticos


se calculó que la media y la varianza son 6000 y 2000 dólares respectivamente.

Se pide construir un intervalo con un nivel de confianza del 90% para la varianza de la
población.

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Solución:

La fórmula para el intervalo de confianza que se pide es:


(𝑛𝑛 − 1) ∗ 𝑆𝑆 2 2
(𝑛𝑛 − 1) ∗ 𝑆𝑆 2
< 𝜎𝜎 <
𝜒𝜒1−𝛼𝛼 2 𝜒𝜒𝛼𝛼 2
2 2

Ahora considerando que α= 0.1, tenemos que α/2 = 0.05, y para 19 grados de libertad
los valores de chi cuadrada son 10.1117 y 30.144, por lo tanto sustituyendo en la
fórmula anterior:
19 ∗ 2000 19 ∗ 2000
< 𝜎𝜎 2 <
30.144 10.1117

Efectuando las operaciones indicadas:


1260.62 < σ2 < 3758.02

Sacando la raíz cuadrada de los límites anteriores obtenemos también el intervalo de


confianza para la desviación típica.
31.51 < σ < 61.30

Accede al ejercicio de autoevaluación a través del aula virtual

8.5. Intervalo de confianza para proporciones de una población

Accede al vídeo «Intervalo de confianza para la proporción» a través del aula


virtual

Hemos visto que en una muestra de tamaño n la proporción p de elementos que tienen
cierta característica es p=x/n, x es el número de elementos cuya proporción interesa.

La fórmula anterior es una estimación puntual de la proporción π de la población.

Ahora vamos a construir intervalos de confianza para la proporción de la población,


utilizando los niveles 90%, 95% y 99%, con los valores críticos de Z: 1.64, 1.96 y 2.58
respectivamente.

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Utilizaremos la fórmula:

𝑝𝑝 ∗ (1 − 𝑝𝑝) 𝑝𝑝 ∗ (1 − 𝑝𝑝)
𝑝𝑝 − 𝑍𝑍 ∗ � ≤ 𝜋𝜋 ≤ 𝑝𝑝 + 𝑍𝑍 ∗ �
𝑛𝑛 𝑛𝑛

Ejemplo:

Una empresa está interesada en calcular el porcentaje de familias que comprarían su


nuevo producto. Se seleccionó una muestra aleatoria de 300 familias de las cuales 130 lo
adquirirían siempre y cuando tuviera un precio accesible.

A. Construya un intervalo de confianza del 99% para la proporción poblacional de


familias que comprarían el nuevo producto.
B. ¿Cómo podría el gerente de ventas aprovechar la información del inciso a?

Solución:

A. Considerando que p= 130/300=0.43; n= 300; Z= 2.58; tenemos:


0.43∗(1−0.43) 0.43∗(1−0.43)
0.43 – 2.58* � ≤ π ≤ 0.43 + 2.58* �
300 300

Efectuando las operaciones indicadas y simplificando:


0.36 ≤ π ≤ 0.51

B. La información anterior puede representar un volumen de ventas importante,


siempre y cuando el producto se venda a un precio accesible.

2. La siguiente tabla muestra el número de días que se utilizó un cajero automático


instalado en un centro comercial, así como el número de operaciones efectuadas. La
información se recopiló durante 100 días.

Número de operaciones Número de días


0 25
1 30
2 20
3 10
4 10
5 5

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Construir un intervalo de confianza del 95% para la proporción de días en los que se
efectuaron 3 operaciones.

Solución:

Siendo X= 10; n= 100; p= 10/100= 0.1; y Z= 1.96, se tiene:


0.1∗(1−0.1) 0.1∗(1−0.1)
0.1 – 1.96* � ≤ π ≤ 0.1 + 1.96 * �
100 100

0.041 ≤ π ≤ 0.159

Accede al ejercicio de autoevaluación a través del aula virtual

8.6. Intervalo de confianza para la diferencia de medias de dos


poblaciones normales

Accede al vídeo «Intervalo de confianza para la diferencia de medias» a través


del aula virtual

En estudios en donde se requiere establecer la diferencia entre los promedios de dos


poblaciones independientes, por ejemplo la diferencia entre los pesos y las estaturas
promedio de niñas y niños; o bien calcular la diferencia en el contenido promedio de una
sustancia en dos componentes diferentes, o entre el número promedio de artículos
defectuosos después de haber aplicado dos procesos diferentes, se hace necesario aplicar
un procedimiento estadístico para estimar la diferencia entre las medias de dos
poblaciones.

Dadas dos muestras 𝑛𝑛1 ≥ 30, 𝑛𝑛2 ≥ 30, se puede considerar la distribución de la
diferencia de medias como aproximadamente normal, sin perder de vista, que si se sabe
que las poblaciones son normales, la distribución muestral de medias es normal sin
importar el tamaño de las muestras.

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

En base a lo anterior, la fórmula que vamos a utilizar para estimar la diferencia de


medias poblacionales es:

𝜎𝜎1 2 𝜎𝜎2 2 𝜎𝜎1 2 𝜎𝜎2 2


(𝑥𝑥̅1 − 𝑥𝑥̅2 ) − 𝑧𝑧 � + < 𝜇𝜇1 − 𝜇𝜇2 < (𝑥𝑥̅1 − 𝑥𝑥̅2 ) + 𝑧𝑧� +
𝑛𝑛1 𝑛𝑛2 𝑛𝑛1 𝑛𝑛2

En la expresión anterior, 𝑥𝑥̅1 , 𝑥𝑥̅2 , son los valores de las medias de cada muestra; 𝜇𝜇1 , 𝜇𝜇2 , son
las medias de las poblaciones; 𝜎𝜎1 2 , 𝜎𝜎2 2 son las varianzas poblacionales y 𝑛𝑛1 , 𝑛𝑛2
representan el tamaño de cada una de las muestras.

Ejemplos:

1. Se desea calcular la diferencia de la resistencia promedio en Kg. de un componente


industrial fabricado con dos máquinas diferentes. Los registros que se tienen son los
siguientes: n1 = n2 = 12; 𝑥𝑥̅1 = 70.5; 𝑥𝑥̅2 = 71.4; 𝜎𝜎1 2 = 5; 𝜎𝜎2 2 = 10; se pide construir un
intervalo con un nivel de confianza del 90%, para el cual utilizaremos z= 1.65, ya que se
conocen las varianzas de las dos poblaciones.

Solución:

5 10 5 10
(70.5 − 71.4) − 1.65 ∗ � + < 𝜇𝜇1 − 𝜇𝜇2 < (70.5 − 71.4) + 1.65 ∗ � +
12 12 12 12

Efectuando las operaciones indicadas y simplificando:

-2.74 < µ1-µ2 < 0.94

2. Construir un intervalo de confianza del 95% para la diferencia de medias


poblacionales, si se tiene la siguiente información:

𝑥𝑥̅1 = 72.5; 𝑥𝑥̅2 = 69.8; 𝑛𝑛1 = 𝑛𝑛2 = 40; 𝑠𝑠1 = 2.45; 𝑠𝑠2 = 1.75

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Solución:

Dado que el tamaño de las muestras n1, n2 >=30, de acuerdo con el teorema del límite
centra podemos utilizar para hacer la estimación el valor de Z= 1.96, por tanto:

2.452 1.752 2.452 1.752


(72.5-69.8) – 1.96* � 40
+ 40
< µ1 - µ2 < (72.5-69.8)+1.96* � 40
+ 40

Efectuando las operaciones indicadas y simplificando:


1.77 < µ1 - µ2 < 3.63

3. Construir un intervalo de confianza del 90% para la diferencia de medias de dos


poblaciones, considerando los siguientes datos:

𝑋𝑋�1 = 15; 𝑋𝑋�2 = 22; 𝑆𝑆1 2 = 7.5; 𝑆𝑆2 2 = 3; 𝑛𝑛1 = 10; 𝑛𝑛2 = 8

Solución:

Para resolver este caso tendremos en cuenta que el tamaño de las muestras es menor
de 30. No se conocen las varianzas de las poblaciones, pero se considera que son
iguales, es decir 𝜎𝜎1 2 = 𝜎𝜎2 2 , en este sentido para desarrollar el procedimiento de
solución es necesario calcular una varianza conjunta 𝑆𝑆𝑝𝑝 2, utilizando la expresión:

Sustituyendo en la expresión anterior tenemos:


9 ∗ 7.5 + 7 ∗ 3
𝑆𝑆𝑝𝑝 2 = = 5.53
10 + 8 − 2

Una vez calculada la varianza conjunta, sustituimos los valores indicados en la


expresión:

Considerando que para construir el intervalo de confianza del 90%, debemos buscar
el valor de t en la tabla de la distribución t de Student.

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Con 10 + 8 – 2= 16 grados de libertad. y (1- α)=0.90, t= 1.746, por tanto:

1 1 1 1
(15 – 22) -1.746* 2.35* � + < µ1 - µ2 < (15-22) + 1.746* 2.35*� +
10 8 10 8

Efectuando las operaciones indicadas y simplificando:


- 8.95 < µ1 - µ2 < -5.05

4. A continuación se muestran los registros obtenidos al aplicar un proceso de


capacitación en forma intermitente y en forma continua:

Capacitación continua Capacitación intermitente


nC=10 ni=8
𝑋𝑋�𝑐𝑐 = 44 𝑋𝑋�𝑖𝑖 = 40
𝑆𝑆𝑐𝑐 = 5 𝑆𝑆𝑖𝑖 = 10

Se pide construir un intervalo de confianza del 95% para la diferencia de medias,


Suponga que las varianzas poblacionales son diferentes y que su distribución es
aproximadamente normal.

Solución:

En primer lugar, debemos calcular el número de grados de libertad v, por medio de la


fórmula:

25 100 2
�10 + � 225
𝑣𝑣 = 8 = ≅ 10
2 2 23.01
25 100
� � � 8 �
� 10
9 � + � 7 �

De tal forma que para (1- α)= 0.90, y 10 grados de libertad, el valor de t es igual a 1.812.
A continuación, sustituyendo en la fórmula:

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

25 100 25 100
(44-40) – 1.812 * � + < 𝜇𝜇1 − 𝜇𝜇2 < (44 − 40) + 1.812 ∗ � +
10 8 10 8

Ahora, efectuando las operaciones indicadas y simplificando:


-3.02 < µ1 - µ2 < 11.02

Accede al ejercicio de autoevaluación a través del aula virtual

8.7. Intervalo de confianza para el cociente de variaciones

Accede al vídeo «Intervalo de confianza para el cociente de varianzas» a


través del aula virtual

La construcción de intervalos con un nivel de confianza dado se utiliza también


para estimar el cociente de las varianzas de dos poblaciones que se distribuyen
en forma normal.

El intervalo permite aceptar o rechazar las suposiciones acerca de si los valores de las
varianzas poblacionales son iguales o no.

La fórmula correspondiente es:

𝑆𝑆1 2 𝜎𝜎1 2 𝑆𝑆1 2


< <
𝐹𝐹(𝑉𝑉1 ,,𝑉𝑉2 )𝑆𝑆2 2 𝜎𝜎2 2 𝐹𝐹(𝑉𝑉2 ,𝑉𝑉1 ) 𝑆𝑆2 2

Para la cual, 𝑆𝑆1 2 , 𝑆𝑆2 2, son las varianzas de muestras aleatorias independientes. F es el
valor de la distribución F de Fisher, con v1= n1-1 grados de libertad en el numerador y
v2= n2-1 grados de libertad en el denominador. Para la aplicación de la fórmula anterior
es necesario considerar como n1 el tamaño de la muestra de la varianza más grande.

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ejemplo:

Considere los siguientes datos:

𝑆𝑆1 2 = 8; 𝑛𝑛1 = 10; 𝑆𝑆2 2 = 3; 𝑛𝑛2 = 8, construya un intervalo de confianza del 90% para el
cociente de las varianzas poblacionales.

Solución:

Para el nivel de confianza y los tamaños de las muestras dados, se tiene: F(9, 7)= 3.677,
y F(7,9)=3.293, por lo tanto:
8 𝜎𝜎1 2 8
< 2<
3.677 ∗ 3 𝜎𝜎2 3.293 ∗ 3
𝜎𝜎1 2
0.73 < < 0.81
𝜎𝜎2 2

Como el valor 1 no está contenido en el intervalo, se sigue que σ12 ≠ σ22

A continuación, se muestra la curva de la distribución F de Fisher, cuya forma está en


función de los grados de libertad del numerador y del denominador.

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Accede al ejercicio de autoevaluación a través del aula virtual

8.8. Intervalo de confianza para la diferencia de proporciones

Accede al vídeo «Intervalo de confianza para la diferencia de proporciones»


a través del aula virtual

Por medio de la formulación de intervalos de un nivel de confianza establecido,


es posible estimar la diferencia entre dos proporciones poblacionales. La
aplicación de este procedimiento está relacionada por ejemplo con los estudios de
mercado, cuando es necesario calcular la preferencia de los consumidores acerca de un
producto, en dos regiones diferentes; o cuando se requiere evaluar la diferencia en el
porcentaje de artículos defectuosos al utilizar en el proceso de fabricación dos máquinas
diferentes. Al igual que en los análisis anteriores, los resultados obtenidos nos servirán
para tomar mejores decisiones.

Sean p1 y p2 las proporciones de éxitos de dos muestras aleatorias de tamaños n1 y n2, con
n1, n2 ≥ 30. De acuerdo con la distribución Binomial, sabemos que q1 = 1-p1, y q2 = 1-p2.
En base a lo anterior, la estimación de la diferencia de proporciones poblacionales π1 –
π2 por medio de un intervalo de confianza de un nivel establecido, tiene la forma:

𝑝𝑝1 𝑞𝑞1 𝑝𝑝2 𝑞𝑞2 𝑝𝑝1 𝑞𝑞1 𝑝𝑝2 𝑞𝑞2


(𝑝𝑝1 − 𝑝𝑝2 ) − 𝑍𝑍𝛼𝛼 � + < 𝜋𝜋1 − 𝜋𝜋2 < (𝑝𝑝1 − 𝑝𝑝2 ) + 𝑍𝑍𝛼𝛼 � +
2 𝑛𝑛1 𝑛𝑛2 2 𝑛𝑛1 𝑛𝑛2

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

En la cual, el valor de Z depende del grado de confianza.

Ejemplo:

Una empresa manufacturera está distribuyendo actualmente dos marcas A y B de un


producto, y desea determinar si es válido suponer que los consumidores prefieren la
marca B sobre la marca A.

Un estudio de mercado ha revelado que 50 de 200 consumidores prefieren la marca A, y


que de 150 consumidores 30 prefieren la marca B. Se pide formular un intervalo de
confianza del 95% para efectuar el análisis.

Solución:

pA= 50/200=0.25; pB=30/150 = 0.2; q1= 1-0.25=0.75; q2=1-0.2 = 0.8; y para el grado
de confianza que se pide, Z= 1.96, por tanto sustituyendo en la fórmula anterior:
0.25∗0.75 0.20∗0.80
(0.25-0.20)–1.96*� + < 𝜋𝜋𝐴𝐴 − 𝜋𝜋𝐵𝐵 < (0.25-0.20)+1.96*
200 150

0.25∗0.75 0.20∗0.80
� +
200 150

Efectuando las operaciones indicadas y simplificando:


-0.038 < πA-πB < 0.138

El límite inferior del intervalo muestra que la proporción de consumidores que


prefieren la marca B es apenas superior a la proporción de consumidores que prefieren
la marca A. El límite superior muestra que la proporción de consumidores que
prefieren la marca A es superior.

Accede al ejercicio de autoevaluación a través del aula virtual

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

8.9. Intervalos asintóticos

Accede al vídeo «Intervalos asintóticos» a través del aula virtual

A diferencia de los intervalos «exactos» construidos en los casos anteriores, los


intervalos de confianza asintóticos se utilizan para estimar los valores
aproximados de los parámetros poblacionales, a partir de muestras
grandes. En base a lo anterior, se considera que los niveles de confianza son también
aproximados, de ahí el nombre de intervalos asintóticos.

Ejemplo:

En un estudio de mercado se aplicó una encuesta a 100 consumidores, de los cuales el


55% aseguró tener preferencia por un determinado producto. Se pide construir un
intervalo de confianza del 95% para la proporción de consumidores que comprarían
dicho producto.

Solución:

Note que en el planteamiento del caso no se declara la forma de la distribución de la


población de la cual se ha extraído la muestra, sin embargo, supondremos que se trata
de una distribución normal. Consideraremos, por tanto, que de acuerdo al nivel de
confianza pedido el valor de Z es 1.96.

De esta forma la expresión que vamos a utilizar para construir el intervalo es.
𝑝𝑝�(1−𝑝𝑝�)
𝑝𝑝̂ ± 𝑍𝑍 � , siendo 𝑝𝑝̂ el estimador del parámetro que se busca
𝑛𝑛

Sustituyendo los valores del caso, tenemos:


0.55∗0.45
0.55 ± 1.96 * � ; 0.55 ± 0.0975;
100

(0.45, 0.65)

La aproximación asintótica simplifica las expresiones y sobre todo los cálculos. Si la


variable aleatoria X, sigue una distribución Binomial B(n,p), es posible hacer una

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

aproximación por medio de la distribución normal 𝑁𝑁(𝑛𝑛𝑛𝑛, �𝑛𝑛𝑛𝑛𝑛𝑛), y si ahora


trasladamos los argumentos anteriores a la distribución de la proporción, tendremos
𝑋𝑋
que 𝑝𝑝̂ = , se puede aproximar por medio de una distribución normal de la forma
𝑛𝑛

𝑝𝑝𝑝𝑝
𝑁𝑁 �𝑝𝑝, � 𝑛𝑛 �.

Accede al ejercicio de autoevaluación a través del aula virtual

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 8 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer…

Fundamentos de Administración: conceptos esenciales y aplicaciones

P. Robbins, S. (2002). Fundamentos de Administración: conceptos esenciales y


aplicaciones. México: Pearson Educación.

Te recomendamos este libro en general y la lectura del capítulo 4 en particular, que hace
referencia a la toma de decisiones en la Administración.

Accede al libro a través de la Biblioteca Virtual de UNIR

No dejes de ver…

UDEM. Estadística para negocios Intervalos de confianza

El siguiente vídeo que te proponemos trata como tema principal, la construcción de


intervalos de confianza.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=qfhtjcgnoGg

TEMA 8 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

+ Información

A fondo

Problemas. Intervalos de Confianza y Contrastes de Hipótesis. Ejemplos


resueltos y propuestos

Huete Morales, M.D. Problemas. Intervalos de Confianza y Contrastes de Hipótesis.


Ejemplos resueltos y propuestos. España: Universidad de Granada.

En este documento elaborado por la Profesora Mª Dolores Huete para el Grado de


Relaciones Laborales (Universidad de Granada) puedes acceder a problemas resueltos
sobre intervalos de confianza para la varianza poblacional.

Accede al documento a través del aula virtual o desde la siguiente dirección web:
http://www.ugr.es/~mdhuete/rlaborales/PTema4.pdf

Bibliografía

Alvarado, J. A. (2008). Fundamentos de Inferencia Estadística. 1ª ed. Bogotá: Pontificia


Universidad Javeriana.

Rubin, L. (2004) Estadística para Administración y Economía. 7a ed. México: Pearson


Educación.

TEMA 8 – + Información © Universidad Internacional de La Rioja en México (UNIR)


Contraste de hipótesis
[9.1] Conceptos fundamentales del contraste de hipótesis

[9.2] Pasos que seguir en un contraste de hipótesis

[9.3] Contrastes paramétricos para una población

[9.4] Contrastes paramétricos para dos poblaciones

independientes

[9.5] Contrastes paramétricos para dos poblaciones

[9.6] Contrastes no paramétricos

9 TEMA
Estadística

Esquema

TEMA 9 – Esquema © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ideas clave

Para estudiar este tema es necesario que leas las Ideas clave expuestas a continuación.
Es muy importante que tengas en cuenta las páginas web señaladas en el desarrollo de
los temas anteriores, ya que te servirán de referencia cuando necesites revisar alguna
fórmula o concepto.

Además, es necesario consultar los siguientes documentos:

Formulario pruebas de hipótesis:


Galbiati, J. (2012). Formulario de Pruebas de Hipótesis. Recuperado el 10 de julio de
2015 en: http://www.jorgegalbiati.cl/ejercicios_6/pruebashipotesis.pdf

Pruebas de hipótesis para proporciones


Suárez Ibujes, M.O. Pruebas de hipótesis para proporciones. Recuperado el 10 de julio
de 2015 en: http://www.monografias.com/trabajos91/prueba-hipotesis-proporciones-
z-y-ji-cuadrado-empleando-excel-y-winstats/prueba-hipotesis-proporciones-z-y-ji-
cuadrado-empleando-excel-y-winstats.shtml

9.1. Conceptos fundamentales del contraste de hipótesis

Accede al vídeo «Introducción a los contrastes de hipótesis» a través del aula


virtual

Una de las herramientas de la Estadística Inferencial de mayor aplicación en el


ámbito empresarial, es sin duda el contraste de hipótesis. Se puede afirmar que las
pruebas de hipótesis forman el primer eslabón en la basta cadena que conduce a la toma
de decisiones.

La señal de inicio en el análisis serio de un proyecto, el cambio de materia prima en un


proceso de producción buscando mejor calidad, la revisión a fondo de las actividades en
un turno de trabajo buscando disminuir el número de defectuosos, etc.; son solo algunos
aspectos de las actividades profesionales en las que podemos tener un gran apoyo si
aplicamos correctamente una prueba de contraste.

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

La prueba de hipótesis es un procedimiento de la Estadística Inferencial que permite


confirmar la actualidad o vigencia de un parámetro poblacional, utilizando la
teoría de probabilidad y como evidencia los resultados obtenidos al estudiar una
muestra.

Una hipótesis es una declaración relativa a un parámetro de la población y esta


declaración está sujeta a una verificación. En las pruebas de contraste, se utilizan:

» Hipótesis Nula: es un enunciado que se refiere al valor de un parámetro de la


población. Se simboliza con H0, en donde el subíndice cero significa «no hay
diferencia».

» Hipótesis alternativa H1: Es la declaración que se acepta siempre y cuando los


datos de la muestra ofrezcan suficiente evidencia para rechazar H0.

En toda prueba de hipótesis debe haber un nivel de significancia que se simboliza con
la letra α y es la probabilidad de rechazar la hipótesis nula cuando es verdadera, es decir
de cometer un error tipo I. Así mismo, cuando se acepta una hipótesis nula que es falsa
se comete un error tipo II. La probabilidad de cometer un error tipo II se simboliza con
la letra β

Otro concepto importante es el que se refiere al Estadístico de Prueba. Su valor se


calcula partir de la información de la muestra y sirve para determinar si se
rechaza la Hipótesis nula.

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

9.2. Pasos que seguir en un contraste de hipótesis

El administrador formula una hipótesis acerca del valor de un parámetro poblacional,


selecciona una muestra de la población, la analiza y compara si los valores obtenidos
están estadísticamente de acuerdo o no con la hipótesis que se ha planteado. En una
prueba de contraste se compara la observación con la teoría. Si los resultados
obtenidos al estudiar la muestra no son compatibles con la hipótesis planteada, esta se
rechaza y por tanto se debe formular una nueva teoría y desde luego tomar otra decisión.

Accede al ejercicio de autoevaluación a través del aula virtual

9.3. Contrastes paramétricos para una población

Accede al vídeo «Prueba de hipótesis para una población» a través del aula
virtual

En los contrastes paramétricos se conoce la forma de la distribución y no se


conocen los parámetros.

La siguiente tabla muestra las condiciones para emplear la distribución normal y la


distribución t en las pruebas de hipótesis sobre la media de la población.

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Casos y soluciones:

Prueba para la media de una población, se conoce la desviación estándar


poblacional

1. Una cadena de tiendas está implementando un nuevo sistema para atender a los
clientes en menor tiempo. Actualmente el tiempo promedio de espera es de 10 minutos,
con una desviación estándar poblacional de 2.5 minutos. El departamento de control de
calidad calculó en una muestra de 50 clientes que el tiempo medio de espera con el nuevo
sistema es de 9 minutos. Con un nivel de significancia de 0.05, ¿se puede concluir que el
tiempo medio de espera es menor de 10 minutos?

Solución:

Formulación de las hipótesis


H0: µ ≥ 10
H1: µ < 10

Considerando el signo de la Hipótesis alternativa, se dice que la prueba es de extremo


izquierdo.

A continuación se calcula el estadístico de prueba, utilizando la fórmula:


� −𝝁𝝁
𝑿𝑿
𝒁𝒁 = 𝝈𝝈
√𝒏𝒏

9−10
para 𝑋𝑋�=9; n=50; σ = 2.5; µ = 10; tenemos: 𝑍𝑍 = 2.5 =-2.8284
√50

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Prueba para la media de la población, no se conoce la desviación estándar


de la población

2. El gerente de una casa de bolsa afirma que sus asesores financieros hacen en promedio
cada uno 50 llamadas telefónicas a clientes preferentes, en busca de ampliar los
portafolios de inversión. Algunos de sus agentes piensan que su estimación es muy
conservadora, y que en realidad se hacen más llamadas. Una muestra aleatoria de 30
asesores ha revelado que la cantidad media de llamadas es 52, con una desviación
estándar de 2.8. Con el nivel de significancia de 0.05, ¿se puede afirmar que el número
de llamadas por asesor es de más de 50?

Solución:

Estableciendo las hipótesis tenemos:


Ho: µ≤ 50
H1: µ> 50
El signo de la Hipótesis alternativa señala que se trata de una prueba de extremo
izquierdo, y como no se conoce la deviación estándar de la población y el tamaño de la
muestra es 30, utilizaremos la distribución T de Student con 29 grados de libertad y
un nivel de significancia α = 0.05

En base a lo anterior, el estadístico de prueba se obtendrá mediante la fórmula:


𝑋𝑋� − 𝜇𝜇
𝑡𝑡 = 𝑠𝑠
√𝑛𝑛

A continuación, sustituyendo los datos planteados en el argumento del caso:

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

52−50
𝑡𝑡 = 2.8 = 3.9123
√30

Conclusión: dado que 3.9123 > 1.699 que es el valor crítico de t, se rechaza Ho y
se acepta que el número de llamadas es mayor que 50.

Prueba de hipótesis para la proporción de la población

3. Un analista urbano afirma que en una región determinada el 25% de las familias que
rentan departamento se mudan en el lapso de un año. Una muestra de 250 familias
reveló que 56 se mudaron el año pasado. ¿Sugiere esta evidencia que la proporción de
familias que se mudan en el lapso de una año es diferente al porcentaje que se conoce?
Utilice un nivel de significancia de 0.01.

Solución:

Formulando las hipótesis:


H0: π = 0.25
H1: π≠ 0.25

Para calcular el estadístico de prueba utilizaremos la fórmula:


𝑝𝑝 − 𝜋𝜋
𝑍𝑍 =
�𝜋𝜋(1 − 𝜋𝜋)
𝑛𝑛

Para probar una hipótesis que se refiere a la proporción de la población, se debe


suponer que se satisfacen los supuestos binomiales: a) los datos de la muestra
provienen de un conteo, b) los resultados de un ensayo son éxito o fracaso, c) la
probabilidad de éxito es la misma en cada ensayo, c) el resultado de cada ensayo es
independiente. El tamaño de la muestra es n y p es la proporción de elementos que
cumplen con una condición establecida dentro de la muestra. La distribución binomial

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

se puede aproximar por medio de la distribución normal siempre y cuando nπ y n(1-


π) excedan de 5. A continuación se calcula la proporción de la muestra y se calcula el
estadístico de prueba.
p= 56/250 = 0.224, por tanto:
0.224−0.25
𝑍𝑍 = =-0.9493
0.25∗(1−0.25)

250

Observa que el estadístico de prueba queda situado en la región de no rechazo de la


hipótesis nula, por lo que se acepta que la proporción de familias que rentan
departamento y se mudan en el lapso de una año es 25%.

Accede al ejercicio de autoevaluación a través del aula virtual

9.4. Contrastes paramétricos para dos poblaciones


independientes

Accede al vídeo «Prueba de hipótesis para dos muestras independientes» a


través del aula virtual

Prueba para diferencia entre medias

Al estudiar dos poblaciones, la distribución muestral de interés es la distribución


muestral de la diferencia entre medias muestrales. Dadas dos poblaciones que
se identifican como Población 1 y Población 2, con medias µ1 y µ2 y desviaciones
estándar σ1 y σ2, si se extraen todas las posibles muestras de las poblaciones 1 y 2 y se

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

restan, se forma la distribución muestral de la diferencia de medias muestrales, cuyo


comportamiento se puede aproximar por medio de la distribución normal o de la
distribución t de Student, dependiendo del tamaño de las muestras.

Cuando se conocen las varianzas de las dos poblaciones, el error estándar de la diferencia
entre dos medias se puede calcular mediante:

El estadístico de prueba que nos permite aceptar o rechazar la Hipótesis nula, se


obtiene mediante la expresión:

El procedimiento para llevar a cabo las pruebas de hipótesis de la diferencia de


medias sigue la metodología que se planteó al principio del tema.

Casos:

Prueba de dos medias de muestras con σ conocida

4. Un despacho de analistas financieros desea determinar si existe una diferencia


relevante entre los rendimientos de dos tipos de acciones. Se seleccionaron 35 acciones
del tipo A y 50 acciones del tipo B. El rendimiento promedio de las acciones tipo A es
31.5% con una desviación estándar de 5%. Para las acciones tipo B el rendimiento

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

promedio se calculó en 35%, con una desviación estándar de 6.5%. Se pide utilizar un
nivel de significancia α=0.01

Solución:

Formulación de las hipótesis:


H0: µA=µB
H1: µA ≠µB

Por la forma de la hipótesis alternativa, efectuaremos una prueba de hipótesis de dos


extremos.

A continuación, se calcula el estadístico de prueba:

31.5−35
𝑍𝑍 = 2 2
=- 2.80
�5 +6.5
35 50

Y se formula la regla de decisión:

Los valores críticos de Z son ± 2.58, el valor del estadístico de prueba Z=-2.80, se
encuentra en la región de rechazo de la Hipótesis nula, por lo que no se puede afirmar
que los rendimientos de las acciones son iguales.

Prueba de Hipótesis de dos medias, desviaciones estándares desconocidas

Para llevar a cabo esta prueba se supone que las poblaciones muestreadas tienen
desviaciones estándares iguales pero desconocidos, las desviaciones de las muestras se
combinan formulándose una varianza conjunta:

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

2
(𝑛𝑛1 − 1)𝑆𝑆1 2 + (𝑛𝑛2 − 1)𝑆𝑆2 2
𝑆𝑆𝑝𝑝 =
𝑛𝑛1 + 𝑛𝑛2 − 2

En la fórmula anterior n1 y n2 corresponden a los tamaños de las muestras extraídas de


las poblaciones 1 y 2; S1 y S2 son las desviaciones estándares respectivas. Considerando
entonces la varianza conjunta, el estadístico de prueba se puede expresar como:

𝑋𝑋�1 − 𝑋𝑋�2
𝑡𝑡 =
1 1
�𝑆𝑆𝑝𝑝 2 � + �
𝑛𝑛1 𝑛𝑛2

Siendo 𝑋𝑋�1 y 𝑋𝑋�2 las medias de las muestras 1 y 2 respectivamente.

5. El gerente de producción de una fábrica de televisiones, desea comparar el número de


unidades defectuosas que se producen en el turno matutino, con el número de unidades
defectuosas en el turno vespertino. Para llevar a cabo el análisis extrajo 6 muestras en el
turno matutino y 8 en el vespertino. Los registros se muestran a continuación:

Matutino: 6 9 8 7 10 8
Vespertino 9 11 8 12 10 13 15 10

Con un nivel de significancia de 0.05, ¿hay diferencia en el promedio de televisiones


defectuosas en dichos turnos?

Solución:

Formulando las hipótesis nula y alternativa:


H0: µ1 = µ2

La forma de la hipótesis alternativa señala que debemos efectuar una prueba de dos
extremos.

Para la muestra que corresponde al turno matutino tenemos que:


n1 = 6; 𝑋𝑋�1 = 8; 𝑆𝑆1 =1.4

Para la muestra que corresponde al turno vespertino:


n2=8; 𝑋𝑋�2 = 11; 𝑆𝑆2 =2.3

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Por lo tanto, la varianza conjunta es:


(6−1)∗(1.4)2 +(8−1)+(2.3)2
𝑆𝑆𝑝𝑝 2 = 6+8−2
=3.9025

Ahora se calcula el valor del estadístico de prueba:


8−11
𝑡𝑡 = 1 1
=-2.8119
�3.9025∗� + �
6 8

A continuación, se buscan los valores críticos de t en la tabla de la distribución t de


Student para 6+8-2 grados de libertad, y se establece la regla de decisión.

Las pruebas para diferencias de proporciones entre dos poblaciones revisten gran
importancia en el ámbito empresarial porque se utilizan para tomar decisiones sobre
todo cuando es necesario comparar porcentajes de unidades defectuosas en dos procesos
de producción y determinar cuál es el mejor, lo cual implica un análisis a fondo de los
procedimientos de control de calidad. Su aplicación es fundamental también cuando es
necesario revisar los efectos de medicamentos suministrados en dos tratamientos
diferentes, esto con el fin de determinar la efectividad de los mismos.

Es necesario considerar que, para poder calcular el estadístico de prueba, en primer lugar
debemos obtener una proporción conjunta pc tomando en cuenta los tamaños de las
muestras y el número de elementos que en cada una de ellas cumple con alguna
característica establecida. Dado que en la Hipótesis nula se plantea que las proporciones
de las poblaciones π1 y π2 son iguales, resulta muy adecuado obtener una proporción
global combinando ambas muestras. La fórmula que se aplica es:

𝑋𝑋1 + 𝑋𝑋2
𝑝𝑝𝑐𝑐 =
𝑛𝑛1 + 𝑛𝑛2

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

En base al valor anterior, el estadístico de prueba se obtiene mediante:

𝑝𝑝1 − 𝑝𝑝2
𝑍𝑍 =
𝑝𝑝𝑐𝑐 (1 − 𝑝𝑝𝑐𝑐 ) 𝑝𝑝𝑐𝑐 (1 − 𝑝𝑝𝑐𝑐 )
� +
𝑛𝑛1 𝑛𝑛2

Una vez obtenido el estadístico de prueba establecemos la regla de decisión de acuerdo


al nivel de significancia de la prueba y a los valores críticos de Z

Ejemplo:

6. Como preparación para la revisión del contrato colectivo de trabajo el sindicato de una
gran empresa cuestionó a sus agremiados acerca de sus preferencias sobre uno de dos
aspectos: incrementar el salario o los beneficios para el retiro. De 1000 hombres que
fueron entrevistados, 750 estuvieron a favor de un incremento en los beneficios para el
retiro, y de 500 mujeres entrevistadas 400 estuvieron a favor de un incremento en los
beneficios para el retiro. Con un nivel de significancia de 0.05, pruebe la hipótesis de que
las proporciones de hombres y mujeres que están a favor de un incremento en los
beneficios para el retiro son iguales.

Solución:

Planteamiento de las hipótesis:


H0: π1 = π2
H1: π1 ± π2

Considerando los valores: n1=1000; X1=750; n2=500; X2=400 tenemos:

750+400
𝑝𝑝𝑐𝑐 = = 0.767; p1=750/1000= 0.75; p2= 400/500 = 0.8
1500

Por lo que calculando el estadístico de prueba:

0.75−0.80
𝑍𝑍 = =-2.16
0.767∗(1−0.767) 0.767∗(1−0.767)
� +
1000 500

Para un nivel de significancia de 0.05 y una prueba de dos extremos, los valores críticos
de Z son ± 1.96 por tanto el valor del estadístico de prueba queda situado en la zona

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

de rechazo de H0 por lo que se concluye que las proporciones de hombres y mujeres


que están a favor de que se incrementen los beneficios para el retiro, son diferentes.

Accede al ejercicio de autoevaluación a través del aula virtual

9.5. Contrastes paramétricos para dos poblaciones

Accede al vídeo «Pruebas de hipótesis para dos muestras dependientes» a


través del aula virtual

Uno de los análisis estadísticos que se utilizan en forma más común en la práctica es la
comparación de dos grupos diferentes de observaciones con respecto a una
variable numérica. Cuando existe Normalidad y las varianzas son iguales, la
comparación de los dos grupos se puede realizar con un parámetro como la media
poblacional. Las muestras independientes se extraen de poblaciones diferentes, es decir,
cuando la selección de los datos de una población no está relacionada con la de los datos
de la otra, son muestras independientes.

El análisis estadístico se extiende también para muestras dependientes o


relacionadas. En una muestra dependiente o relacionada, denominada también
pareada, el grupo de observaciones o valores de una variable en estudio se somete a dos
tratamientos diferentes o proviene de dos procesos diferentes, y el interés es determinar
si existe diferencia significativa entre los dos resultados.

Al resolver un caso señalaré el procedimiento que se sigue para efectuar una prueba de
hipótesis con este tipo de muestra.

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

7. Dos compañías A y B se dedican a hacer avalúos de instalaciones industriales. La


siguiente tabla muestra los resultados obtenidos al hacer el avalúo en 10 empresas del
mismo ramo:

2
Empresa Avalúos A Avalúos B Diferencias d 𝑑𝑑 − 𝑑𝑑̅
1 235000 230000 5000 360000
2 212000 205000 7000 6760000
3 230000 219000 11000 43560000
4 242000 238000 4000 160000
5 205000 200000 5000 360000
6 230000 225000 5000 360000
7 231000 228000 3000 1960000
8 212000 215000 -3000 54760000
9 225000 223000 2000 5760000
10 250000 245000 5000 360000
𝑑𝑑̅ = 4400 114400000

Las cantidades están expresadas en dólares. Se pide analizar si hay diferencia en los
avalúos medios de las dos compañías, con un nivel de significancia de 0.05.

Solución:

Formulación de las hipótesis:


H0: µd =0
H1: µd≠ 0

Siendo µd, el promedio de las diferencias entre los avalúos de las dos compañías.
Se calculan las diferencias entre los avalúos y estas se promedian:
∑ 𝑑𝑑 44000
𝑑𝑑̅ = = = 4400
𝑛𝑛 10

A continuación, se calcula el error estándar de las diferencias, mediante la fórmula:


∑(𝑑𝑑−𝑑𝑑� )2 114400000
𝑆𝑆𝑑𝑑 = � =� =3565.26
𝑛𝑛−1 10−1

Y ahora calculamos el estadístico de prueba:


𝑑𝑑� 4400
𝑡𝑡 = 𝑆𝑆𝑑𝑑 = 3565.26 =3.903
√𝑛𝑛 √10

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Dado que el tamaño de la muestra es menor que 30 utilizamos la distribución t de


Student, con un nivel de significancia de 0.05 y 9 grados de libertad, por lo que t crítica
=± 2.262

La prueba de hipótesis es de dos extremos y como el estadístico de prueba t=3.903 >


2.262 queda en la región de rechazo, se concluye que las medias de los avalúos de las
dos compañías no son iguales.

Accede al ejercicio de autoevaluación a través del aula virtual

9.6. Contrastes no paramétricos

Accede al vídeo «Contrastes no paramétricos» a través del aula virtual

En las pruebas de hipótesis efectuadas anteriormente, el supuesto fundamental se basa


en que las poblaciones siguen una distribución de probabilidad normal. Sin embargo,
cuando en una prueba no es necesaria una consideración respecto a la
forma de la distribución de la población, esta se denomina no paramétrica. En
las pruebas no paramétricas no es necesario suponer una distribución
normal.

Karl Pearson descubrió el estadístico chi cuadrada para comparar una


distribución de frecuencias observada con una supuesta distribución
normal, con este descubrimiento demostró que no todas las variables tienen una

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

distribución normal. Las pruebas de hipótesis no paramétricas siguen el mismo


procedimiento sistemático que en los casos anteriores, solo que ahora el estadístico de
prueba sigue la distribución chi cuadrada y se calcula mediante la fórmula:

(𝑓𝑓𝑜𝑜 −𝑓𝑓𝑒𝑒 )2
𝜒𝜒 2 = ∑ � 𝑓𝑓𝑒𝑒
�;

Con k-1 grados de libertad, en donde k es el número de categorías, fo es una frecuencia


observada en una categoría particular y fe es una frecuencia esperada en una categoría
particular. En la siguiente figura se muestra la forma de la distribución:

Ejemplos:

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Para los datos de la tabla siguiente:

CATEGORÍA 𝑓𝑓𝑜 a) Formule las hipótesis nula y alternativa


A 20 Formule la regla de decisión con el nivel de
B 30 significancia de 0.05
C 40 c) Calcule el valor de chi cuadrada
d)¿Cuál es su decisión respecto de Ho?

Solución:
a) Ho: Las frecuencias son iguales
𝐻𝐻1 : Las frecuencias no son iguales
b) Considerando k=3, para 2 grados de libertad y nivel de
significancia 0.05, rechace Ho si: 𝜒𝜒2 > 5.991
20 − 30 2 30 − 30 2 40 − 30 2
c) 𝜒𝜒2 = + + = 6,67
30 30 30
El valor deldenominador (30) se obtuvo sumando lasfrecuencias observadas
y dividiendo la suma entre 3
d) Dado 6.67>5.991 serechaza Ho, por tanto las frecuencias no son
iguales.

= 0.05

5,991 6,67

9. Un despacho de mercadotecnia está efectuando un estudio para determinar si existe


relación entre el tipo de comunidad de residencia de la persona y su preferencia en temas
de lectura. Los resultados se muestran en la siguiente tabla.

Noticias Deportes Comics Total


Ciudad 180 130 100 410
Suburbios 100 110 90 300
Rural 150 90 90 330
Total 430 330 280 1040

Con un nivel de significancia 0.05, ¿existe relación entre el tipo de comunidad en el que
reside la persona y su preferencia en temas de lectura?

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Solución:

Formulación de las hipótesis:

H0: Existe relación entre la comunidad y el tipo de lectura


H1: No existe relación entre la comunidad y el tipo de lectura

Calcular el estadístico de prueba 𝜒𝜒 2 .

En una tabla de contingencia como la del caso, la frecuencia esperada fe para una
frecuencia observada fo, se calcula multiplicando el total de la hilera por el total de la
columna y dividiendo el producto entre el total de la muestra. Así por ejemplo la fe que
410∗430
corresponde a 180= .
1040

𝑓𝑓𝑓𝑓 − 𝑓𝑓𝑓𝑓 2
𝑓𝑓𝑓𝑓 − 𝑓𝑓𝑓𝑓 2
fo fe 𝑓𝑓𝑓𝑓
180 169.52 109.85 0.65
100 124.04 577.85 4.66
150 136.44 183.81 1.35
130 130.10 0.01 0.00
110 95.19 219.27 2.30
90 104.71 216.43 2.07
100 110.38 107.84 0.98
90 80.77 85.21 1.05
90 88.85 1.33 0.01
total 13.07

A continuación se busca el valor crítico de 𝜒𝜒 2 con (3-1)*(3-1)= 4 grados de libertad, es


decir, de la tabla de contingencia gl= (No de hileras – 1)*(No de columnas -1).
De esta forma para un nivel de significancia de 0.05 y 4 grados de libertad 𝜒𝜒 2 = 9.488

Dado que 13.07> 9.488, se rechaza la hipótesis nula por tanto no hay relación entre la
comunidad en la que habita la gente y sus preferencias de lectura.

Accede al ejercicio de autoevaluación a través del aula virtual

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 9 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer…

Creatividad en la toma de decisiones

Te recomendamos especialmente el siguiente artículo publicado en la web


liderazgoymercado.com, sobre temas de liderazgo y toma de decisiones.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.liderazgoymercadeo.com/liderazgo_tema.asp?id=95

Ejercicios y problemas de contraste de hipótesis

De igual modo que en el artículo anterior, te recomendamos este documento que


contiene ejercicios resueltos, para reafirmar tu estudio.

Accede al documento a través del aula virtual o desde la siguiente dirección web:
http://www.vitutor.com/estadistica/inferencia/c_e.html

TEMA 9 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

No dejes de ver…

Pruebas de hipótesis

Te proponemos visualizar los siguientes vídeos, cuyo tema principal es la formulación de


pruebas de hipótesis.

Vídeo 1 Vídeo 2 Vídeo 3

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
Vídeo 1:
https://www.youtube.com/watch?v=AJcy4eZMwWM
Vídeo 2:
https://www.youtube.com/watch?v=TZlcEKlgo7Y
Vídeo 3:
http://es.slideshare.net/jab2801/t-de-student-para-dos-muestras-independientes-
9249928

TEMA 9 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Tutorial 5: Contrastes No Paramétricos (Bondad de Ajuste, Independencia,


Homogeneidad)

El siguiente vídeo explicativo trata sobre contrastes no paramétricos.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=_LLrNTJtMs0

TEMA 9 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

+ Información

A fondo

Ejercicios resueltos

El siguiente documento te ofrece la oportunidad de practicar a través de ejercicios


resueltos sobre pruebas de hipótesis.

Accede al documento a través del aula virtual o desde la siguiente dirección web:
http://www.monografias.com/trabajos89/ejercicios-resueltos-prueba-
hipotesis/ejercicios-resueltos-prueba-hipotesis.shtml

Bibliografía

Alvarado, J. A. (2008). Fundamentos de Inferencia Estadística (1ª ed). Bogotá:


Pontificia Universidad Javeriana.

Rubin, L. (2004). Estadística para Administración y Economía (7ª ed). México: Pearson
Educación.

TEMA 9 – + Información © Universidad Internacional de La Rioja en México (UNIR)


Regresión lineal simple
[10.1] Análisis de regresión: modelo de regresión lineal
simple

[10.2] Hipótesis básicas de regresión lineal

[10.3] Estimación de los parámetros

[10.4] Capacidad explicativa de la regresión lineal

[10.5] Intervalos de confianza y contraste de


hipótesis

[10.6] Pronósticos

10 TEMA
Estadística

Esquema

TEMA 10 – Esquema © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ideas clave

Para estudiar este tema es necesario que leas las Ideas clave expuestas a continuación.
Es muy importante que tengas en cuenta las páginas web señaladas en el desarrollo de
los temas anteriores, ya que te servirán de referencia cuando necesites revisar alguna
fórmula o concepto.

Además, es necesario consultar el siguiente documento:

Modelo de Regresión lineal simple. Universidad del País Vasco. Recuperado el 10


de julio de 2015 en:
http://cvb.ehu.es/open_course_ware/castellano/social_juri/gretl/contenidos/tema-
2.pdf

10.1. Análisis de regresión: modelo de regresión lineal simple

Accede al vídeo «Modelo de regresión lineal simple» a través del aula virtual

Uno de los métodos estadísticos de mayor aplicación en el ámbito empresarial, es el


método de Regresión Lineal. Dado que el Administrador continuamente debe tomar
decisiones profesionales y personales basándose en pronósticos de eventos futuros, el
análisis de regresión le permite determinar cuáles de las variables que intervienen en un
proceso están relacionadas, con qué fuerza se relacionan, y lo que es más importante: la
formulación de un Modelo de Regresión Lineal Simple. Dicho modelo además de
mostrar la regla de correspondencia entre las variables por medio de una ecuación, es
una herramienta fundamental para revisar el comportamiento futuro de las mismas y de
acuerdo con este, escoger la acción más conveniente.
Para comenzar a revisar si existe relación entre dos variables, estas se deben representar
gráficamente mediante un Diagrama de Dispersión o diagrama de puntos.

En este se muestra el patrón de comportamiento de las variables. La variable


Dependiente Y es el efecto que ocurre cuando la variable independiente X modifica
su valor. La variable Y siempre se representa en el eje vertical, la variable X en el eje

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

horizontal, de manera que la formulación de un modelo de regresión lineal principia con


la identificación de las variables. ¿Qué variable es la causa y cuál es el efecto?

El diagrama de la figura muestra que la relación entre las variables es directa, al


aumentar el valor de X, se incrementa el valor de Y; pero además los puntos se
distribuyen en una franja ascendente.

El diagrama de la figura muestra que la relación entre las variables X y Y es no directa.


A medida que X incrementa su valor, el de Y disminuye. Igualmente, los puntos se
distribuyen en una franja.

El diagrama de dispersión permite una apreciación visual del comportamiento de los


datos, sin embargo, es necesario comprobar si existe relación entre las variables, y sobre
todo si existe dependencia.

El coeficiente de correlación lineal de Pearson, es la expresión numérica que nos


indica el grado de la relación existente entre dos variables X y Y; se simboliza con la letra

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

«r» y su valor varía entre -1 y 1. Cuando r=1, se dice que las dos variables tienen una
relación directa perfecta; si r=-1 la relación entre las variables es no directa perfecta, si
r=0 no hay ninguna relación entre las variables.

La fórmula que se utiliza para calcular el coeficiente de correlación lineal de


Pearson es:

𝒏𝒏 ∑ 𝒙𝒙𝒙𝒙 − ∑ 𝒙𝒙 ∑ 𝒚𝒚
𝒓𝒓 =
�𝒏𝒏 ∑ 𝒙𝒙𝟐𝟐 − (∑ 𝒙𝒙)𝟐𝟐 ∗ �𝒏𝒏 ∑ 𝒚𝒚𝟐𝟐 − (∑ 𝒚𝒚)𝟐𝟐

Ejemplo:

Calcula el valor del coeficiente de correlación r, para la siguiente serie de datos, e indica
el significado del resultado obtenido

Solución:

Los elementos de la fórmula se han obtenido utilizando la hoja de cálculo de Excel, con
la cual podemos simplificar el procedimiento.

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Ahora sustituimos en la fórmula:

8∗246−23∗66
𝑟𝑟 = =0.7867
√8∗99−232 ∗√8∗700−66^2

El coeficiente de determinación r2 es un estadístico que se utiliza también para


establecer numéricamente el grado de relación entre las dos variables X y Y. El valor
máximo de r2 es uno e indica qué tan fuerte es la influencia de la variable independiente
en los cambios de la variable dependiente. Para el caso que nos ocupa r2= 0.6189. Se
podría decir que la variable independiente X influye en el cambio de la variable
dependiente Y en un 61.89%.

� = 𝒂𝒂 + 𝒃𝒃𝒃𝒃; 𝒀𝒀
La forma del modelo de Regresión Lineal Simple es 𝒀𝒀 � se conoce como valor

estimado de Y; 𝒂𝒂 es el término de intercepción, representa el valor de 𝒀𝒀� cuando x=0; 𝒃𝒃


se conoce como coeficiente de la regresión o pendiente de la recta de regresión,
y su valor representa el cambio en el valor estimado de Y cuando X cambia en una unidad.

La figura muestra la recta de regresión que se ajusta mejor a la trayectoria general de los
datos, y su ecuación se obtiene aplicando el procedimiento de mínimos cuadrados.

El procedimiento debe su nombre a que la suma de los cuadrados de las distancias entre
los puntos del diagrama de dispersión, y los correspondientes que están sobre la recta,
es mínima. Véase la siguiente figura:

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Accede al ejercicio de autoevaluación a través del aula virtual

10.2. Hipótesis básicas de regresión lineal

Accede al vídeo «Hipótesis básicas de la regresión lineal» a través del aula


virtual

Dado que un modelo de regresión lineal es una herramienta formidable capaz de mejorar
el proceso de toma de decisiones empresariales y profesionales, su formulación requiere
una serie de condiciones que al cumplirse garantizan su efectividad:

» Muestra suficiente. Es la que garantiza que los datos son fiables, que reducen la
incertidumbre y el sesgo, y que por lo tanto le dan confiabilidad a la investigación.
» Regresores deterministas. La diferencia entre los valores reales de la variable Y y
los valores estimados de Y, obtenidos con un modelo de regresión lineal se denomina
perturbación estocástica o error de estimación. En la ecuación de regresión el error de
estimación se representa como ui. La variable Y se conoce como regresora o regresada,
y la variable X se denomina también variable explicativa. Para que un regresor sea
determinista es necesario que no haya relación entre la perturbación y las variables
explicativas.
» No multicolinealidad. Cuando se utiliza el modelo de regresión lineal para
formular un modelo económico, por ejemplo, puede ocurrir que las variables
explicativas o regresoras tengan un alto grado de correlación, este hecho se conoce
como multicolinealidad, y puede ocurrir en series de tiempo o en series
macroeconómicas.

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

» Media nula de las perturbaciones aleatorias. El modelo general de regresión


lineal para una muestra aleatoria extraída de una población tiene la forma:
𝑌𝑌� = 𝑎𝑎 + 𝑏𝑏𝑏𝑏 + 𝑢𝑢𝑖𝑖

En este modelo se considera que los factores que no están incluidos explícitamente,
están incorporados en ui. Los valores de ui pueden ser positivos o negativos, pero como
se cancelan el efecto de la media sobre los valores estimados de Y es cero.

» Homocedasticidad. El término significa igual varianza. Para que el modelo de


regresión cumpla con este supuesto las poblaciones de los valores de Y
correspondientes a diversos valores de x, tienen la misma varianza.
» No autocorrelación. Las perturbaciones ui, uj … no deben estar correlacionadas.
Esto significa que las desviaciones de dos o más valores de Y con respecto a su media,
no deben mostrar ningún patrón.
» Distribución normal de las perturbaciones aleatorias. Las perturbaciones
aleatorias en un modelo de regresión lineal se distribuyen como una normal.

Accede al ejercicio de autoevaluación a través del aula virtual

10.3. Estimación de los parámetros

Accede al vídeo «Estimación de parámetros y capacidad explicativa del


modelo» a través del aula virtual

Dada una muestra aleatoria simple con una variable independiente o explicativa
X y una variable dependiente o regresada Y, la ecuación de regresión lineal tiene
la forma:

𝑌𝑌� = 𝑎𝑎 + 𝑏𝑏𝑏𝑏

𝑌𝑌� se denomina valor estimado de Y, X representa la variable independiente, 𝑎𝑎 es la


intersección de la muestra en Y, y b es la pendiente o tasa de variación. Los valores de los
parámetros 𝑎𝑎 𝑦𝑦 𝑏𝑏, se calculan mediante:

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

∑ 𝑋𝑋𝑋𝑋 − 𝑛𝑛𝑋𝑋�𝑌𝑌�
𝑏𝑏 = ; 𝑎𝑎 = 𝑌𝑌� − 𝑏𝑏𝑋𝑋�
∑ 𝑋𝑋 2 − 𝑛𝑛𝑋𝑋� 2

Siendo 𝑛𝑛 el tamaño de la muestra, 𝑋𝑋� 𝑦𝑦 𝑌𝑌�, los promedios de las variables X y Y


respectivamente.

Ejemplo:

La siguiente tabla muestra los registros de los precios y la demanda de un cierto


producto. Se pide formular la ecuación de la recta de regresión lineal que mejor se ajuste
a los datos, utilizando el método de mínimos cuadrados.

Precio X Demanda Y X*Y X^2 41.60


𝑋𝑋� = = 5.2
2,40 450 1080 5,76 8

3,2 440 1408 10,24


� = 3090 =386.25
𝑌𝑌
4 430 1720 16,00 8
4,8 400 1920 23,04
5,6 360 2016 31,36 � 𝑋𝑋𝑌𝑌 = 15400
6,4 350 2240 40,96
7,2 330 2376 51,84 � 𝑋𝑋 2 = 243.20
8 330 2640 64,00
41,60 3090 15400 243,20

Calculando los valores de los coeficientes tenemos:


15400−8∗5.2∗386.25
𝑏𝑏 = =- 24.85 𝑐𝑐 = 386.25 − −24.85 ∗ 5.2= 515.47
243.20−8∗ 5.2 2
Por lo tanto la ecuación de regresión es: � = 𝟒𝟒𝟏𝟏𝟒𝟒. 𝟐𝟐𝟒𝟒 − 𝟐𝟐𝟐𝟐. 𝟖𝟒𝟒 𝑿𝑿
𝒀𝒀

10.4. Capacidad explicativa de la regresión lineal

Al analizar el comportamiento de la Economía de un país, es necesario considerar que


hay una diversidad muy amplia de variables explicativas. La renta, el gasto, los precios y
los salarios son solo algunas ellas, pero además estas presentan relaciones entre sí, por
lo que no es posible separar comportamientos ya que todas las variables dependen en
mayor o menor grado de todas.

Por ejemplo, el consumo no solo depende de la renta, también depende de los precios de
un bien de interés y de otros bienes que pueden ser complementarios o sustitutos. En el

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

ámbito empresarial las ventas están relacionadas con la inversión, pero también son
importantes las políticas de precios y el gasto en publicidad.

En este contexto, un modelo de regresión lineal simple en el que intervienen una variable
independiente y una dependiente puede presentar serias limitaciones para ajustarse en
forma adecuada al comportamiento de los registros de una muestra. La poca efectividad
de un modelo de regresión lineal simple puede deberse a la omisión de otras variables
causales, cuya inclusión mejoraría en forma notable su capacidad explicativa.

Por lo anterior, al formular un modelo de regresión lineal debemos tener en cuenta todas
las variables que intervienen, con el objeto de obtener la ecuación que mejor se ajuste a
los datos, que explique las variaciones de Y y que nos permita calcular los pronósticos
más cercanos a la realidad.

Accede al ejercicio de autoevaluación a través del aula virtual

10.5. Intervalos de confianza y contraste de hipótesis

Accede al vídeo «Intervalos de confianza, contraste de hipótesis y


pronósticos» a través del aula virtual

Dado que el modelo de regresión lineal simple para una población es:

� = 𝑨𝑨 + 𝑩𝑩𝑩𝑩
𝒀𝒀

En donde A es la intercepción con el eje Y y B es la pendiente, también llamado


coeficiente de la regresión, el planteamiento de las hipótesis es el siguiente: Ho:
B=0; H1: B≠ 0; para una prueba de dos extremos, con un nivel de significancia α =
0.05.

La hipótesis nula Ho señala que no hay relación entre las variables estableciendo que el
coeficiente de la regresión poblacional vale cero. La hipótesis alternativa establece lo
contrario.

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Utilizaremos como estadístico muestral el coeficiente b= -24.85 de la ecuación de


regresión del modelo anterior de Demanda, y la distribución t de student para delimitar
las regiones de aceptación y rechazo de Ho.

En primer lugar, calcularemos el error estándar de la estimación:

2
∑�𝑌𝑌 − 𝑌𝑌��
𝑆𝑆𝑒𝑒 = �
𝑛𝑛 − 2

Su valor representa el error que se puede cometer al hacer un pronóstico. Los


valores estimados de Y se calculan sustituyendo cada valor de X en la ecuación de
regresión.

A continuación, calculamos su valor:

Precio X Demanda Y Y est. (Y-Yest.)^2


2,4 450 455,83 33,99
3,2 440 435,95 16,40
4 430 416,07 194,04
4,8 400 396,19 14,52
5,6 360 376,31 266,02
6,4 350 356,43 41,34
7,2 330 336,55 42,90
8 330 316,67 177,69
786,90
Para n = 8

Se = 786.90
= 11.45
6

Podría afirmarse que, para un valor dado del precio del producto, el pronóstico de la
demanda tendría una variación de ± 11 unidades.

Sb es el error estándar del coeficiente de regresión, su valor se calcula mediante


la fórmula:

𝑆𝑆𝑒𝑒
𝑆𝑆𝑏𝑏 =
�∑ 𝑋𝑋 2 − 𝑛𝑛𝑋𝑋� 2

Ahora efectuamos las sustituciones correspondientes con los valores ya calculados en el


modelo de regresión de la Demanda:

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

11.45
𝑆𝑆𝑏𝑏 = = 2.208
�243.20 − 8 ∗ (5.2)2

De esta forma, el valor del estadístico de prueba es:

𝑏𝑏 − 𝐵𝐵 −24.85 − 0
𝑡𝑡𝑐𝑐 = = = −11.25
𝑆𝑆𝑏𝑏 2.208

Recuerde que la hipótesis nula señala que B=0

Para 6 grados de libertad y α = 0.05, el valor crítico de t es 2.447

Como se puede ver en la figura anterior, -11.25 se encuentra en la zona de rechazo de H0,
por lo que se acepta que las variables están relacionadas.

El valor del coeficiente de la regresión muestral b=-24.85 significa que el efecto al


incrementar el precio del producto un peso, es la disminución de la demanda del
producto en casi 25 unidades. Ahora vamos a formular un intervalo de confianza del 95%

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

para establecer en qué nivel se encuentra el valor del coeficiente de la regresión de la


población B. El intervalo de confianza tiene la forma: b ±t (Sb) por lo que tenemos: -24.85
± 2.447(2.208), que corresponde a -30.25 < B < -19.45. Estos resultados indican que
el valor de B se encuentra entre - 30 y -19 unidades con un 95% de confianza.
(Las cantidades han sido redondeadas).

10.6. Pronósticos

Cuando se utiliza la ecuación de regresión lineal para pronosticar un valor de Y dado un


valor de X, es necesario tomar muy en cuenta que el valor de la variable explicativa debe
situarse en el rango de valores de la muestra. Al sustituir el valor de X en la ecuación, el
valor calculado de Y es una estimación puntual.

Ejemplo:

Dada la ecuación de regresión lineal 𝑌𝑌� = 515.47 − 24.85 𝑋𝑋, calcular el valor de Y si X= 7

Solución:

Sustituyendo el valor de X en la ecuación, tenemos: Y= 515.47-24.85 (7)= =341.52.


Ahora vamos a hacer la estimación formulando un intervalo de confianza del 95% de
la forma:

Y ±2.447 (Se); 341.52 ± 2.447 (11.45) por tanto: 313.5 < 𝑌𝑌� < 369.5, lo cual significa que
el valor estimado de Y para X=7 se encuentra en el intervalo 3113.5 a 369.5 con un 95%
de confianza.

Accede al ejercicio de autoevaluación a través del aula virtual

Accede al vídeo «Resumen del tema» a través del aula virtual

TEMA 10 – Ideas clave © Universidad Internacional de La Rioja en México (UNIR)


Estadística

Lo + recomendado

No dejes de leer

Análisis de Regresión Lineal Simple para Predicción

Badii, M.H.; A. Guillen; E. Cerna; J.; Valenzuela & J. Landeros. (2012). Análisis de
Regresión Lineal Simple para Predicción. Daena: International Journal of Good
Conscience, 7(3) 67-81. Noviembre 2012. México.

Igualmente te recomendamos el siguiente artículo que hace referencia al Análisis de


Regresión Lineal Simple para Predicción.

Accede al documento a través del aula virtual o desde la siguiente dirección web:
http://www.spentamexico.org/v7-n3/7%283%2967-81.pdf

Herramientas de planeación administrativa

El siguiente artículo recomendado se centra en las herramientas de planeación


administrativa.

Accede al documento a través del aula virtual o desde la siguiente dirección web:
http://www.gestiopolis.com/herramientas-de-planeacion-administrativa/

TEMA 10 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

No dejes de ver

Regresión lineal con Excel

En el siguiente vídeo se describe cómo realizar la regresión lineal en el software Excel.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=kYGPpxhDiks

TEMA 10 – Lo + recomendado © Universidad Internacional de La Rioja en México (UNIR)


Estadística

+ Información

A fondo

Ejercicios de regresión y correlación

A través de este documento puedes acceder a diversos ejercicios resueltos sobre regresión
lineal simple.

Accede al documento a través del aula virtual o desde la siguiente dirección web:
http://www.vitutor.com/estadistica/bi/ejercicios_regresion.html

Bibliografía

Alvarado, J. A. (2008). Fundamentos de Inferencia Estadística (1ª ed.). Bogotá:


Pontificia Universidad Javeriana.

Rubin, L. (2004). Estadística para Administración y Economía (7ª ed.). México:


Pearson Educación.

TEMA 10 – + Información © Universidad Internacional de La Rioja en México (UNIR)

También podría gustarte