Estadistica para Toma Decisiones PDF

Lectura
FUNDACIÓN UNIVERSITARIA IBEROAMERICANA
ESTADÍSTICA
PARA LA TOMA DE DECISIONES
©
© FUNDACIÓN UNIVERSITARIA IBEROAMERICANA
Índice
•• Introducción
Capítulo 1 •• Criterio estadístico para la toma de decisiones
1.1. Introducción .................................................................................................. 3

1.2. Población y muestra ....................................................................................... 5
1.2.1. Tamaño de la muestra ......................................................................... 6
1.2.2. Técnicas de muestreo .......................................................................... 6
1.3. Etapas de un proceso de toma de decisiones .................................................... 7

1.3.1. Definición del problema y objetivos ...................................................... 7
1.3.2. Planificación de la investigación ............................................................ 8
1.3.3. Recogida de datos ............................................................................... 9
1.3.4. Análisis de datos ................................................................................. 9
1.3.5. Resultados .......................................................................................... 9
1.3.6. Conclusiones ....................................................................................... 9
©
1.4. Variables y datos ............................................................................................ 10

1.4.1. Tipos de variables ............................................................................... 11
Capítulo 2 •• Variables cualitativas
2.1. Introducción .................................................................................................. 15

2.2. distribución de frecuencias .............................................................................. 15
2.3. Representación gráfica ................................................................................... 18
2.3.1. Diagrama de barras ............................................................................. 18
2.3.2. Diagrama circular o de sectores ............................................................ 19
2.3.3. Gráfico de barras múltiples .................................................................. 20
2.4. Tablas de contingencia o de doble entrada ....................................................... 20
ESTADÍSTICA PARA LA TOMA DE DECISIONES I

Capítulo 3 •• Variables cuantitativas
3.1. Introducción ................................................................................................... 27

3.2. Variables discretas .......................................................................................... 28
3.3. Variables continuas ......................................................................................... 29
3.3.1. El diagrama de puntos ......................................................................... 29
3.3.2. La tabla de frecuencias ........................................................................ 31
3.3.3. Histograma ......................................................................................... 33
3.3.4. Polígono de frecuencias ........................................................................ 34
3.4. Observaciones a lo largo del tiempo ................................................................. 36
Capítulo 4 •• Estadística descriptiva
4.1. introducción ................................................................................................... 41

4.2. Media, varianza y moda .................................................................................. 42
4.2.1. Media aritmética .................................................................................. 42
4.2.2. Varianza y desviación tipo .................................................................... 44
4.2.3. Fórmula alternativa para el cálculo de la desviación tipo ......................... 46
4.2.4. Moda .................................................................................................. 48
4.3. Medidas basadas en la ordenación de los datos ................................................. 49
4.3.1. La mediana ......................................................................................... 50
©
4.3.1.1. Comparación entre la media y la mediana ............................... 51
4.3.2. Los cuantiles y los extremos ................................................................. 52
Capítulo 5 •• Modelamiento estadístico de las variables
5.1. Introducción ................................................................................................... 57

5.2. La distribución normal ..................................................................................... 59
5.2.1. La función de densidad o ley normal ..................................................... 60
5.2.2. La función de distribución ..................................................................... 61
5.2.3. Distribución normal tipificada ................................................................ 62
5.2.4. Comprobación de la normalidad: prueba de Kolgomorov ......................... 65
5.3. La distribución t-student .................................................................................. 67
II ESTADÍSTICA PARA LA TOMA DE DECISIONES

5.4. La distribución chi-cuadrado ............................................................................ 70
5.4.1. Prueba de calidad o bondad del ajuste
para variables aleatorias discretas ........................................................ 72
5.4.2. Prueba de homogeneidad .................................................................... 73
5.4.3. Prueba de la independencia ................................................................. 76
5.5. Distribución muestral de medias ...................................................................... 77
5.6. distribución muestral de proporciones .............................................................. 78
5.7. Función de probabilidad binomial .................................................................... 79
5.7.1. Aproximación normal para binomial ...................................................... 81
Capítulo 6 •• Estadística inferencial
6.1. Introducción .................................................................................................. 85

6.2. La valoración o estimación .............................................................................. 86
6.2.1. Definición ........................................................................................... 86

6.2.2. Cualidades de un buen estimador ......................................................... 86
6.2.3. Aleatoriedad de la muestra .................................................................. 87
6.2.4. Estimación del tamaño de la muestra .................................................... 88
6.2.5. Tipos de estimación ............................................................................. 89
6.2.5.1. Estimaciones puntuales ......................................................... 89
6.2.5.2. Estimación por intervalo ........................................................ 89
©
6.3. contraste o prueba de hipótesis ....................................................................... 92

6.3.1. Introducción ....................................................................................... 92
6.3.2. Pasos a seguir para la prueba de hipótesis ............................................ 94
6.3.3. Errores en el contraste de hipótesis ...................................................... 94
6.3.4. Contraste de hipótesis para la media .................................................... 95
6.3.4.1. Contraste bilateral ................................................................ 95
6.3.4.2. Contraste unilateral .............................................................. 98
6.3.5. Contraste de hipótesis para proporciones .............................................. 101
6.3.5.1. Contraste bilateral ................................................................ 101
6.3.5.2. Contraste unilateral .............................................................. 103
ESTADÍSTICA PARA LA TOMA DE DECISIONES III

Capítulo 7 •• Igualdad estadística entre dos o más poblaciones
7.1. Introducción ................................................................................................... 107

7.2. Comparación de dos medias poblacionales ....................................................... 108
7.2.1. Diferencia entre medias empleando la distribución normal ...................... 108
7.2.2. Diferencia entre medias empleando la t-student ..................................... 111
7.3. Comparación de dos varianzas poblacionales .................................................... 112
7.4. Condiciones necesarias para la toma de decisiones estadísticas .......................... 115
7.5. Comparación de más de dos medias poblacionales (ANOVA) .............................. 115
7.6. Comparación de más de dos varianzas poblacionales ......................................... 119
7.6.1. Prueba F del cociente máximo .............................................................. 119
Capítulo 8 •• Correlación y regresión

8.1. Variables correlacionadas ................................................................................ 125
8.2. Diagramas de dispersión ................................................................................. 126
8.3. El coeficiente de correlación lineal de Pearson ................................................... 129
8.3.1. Cálculo de r ......................................................................................... 134
8.4. Regresión lineal simple .................................................................................... 134
8.4.1. Modelo de regresión ............................................................................ 136
8.4.1.1. Estimación de los parámetros α y β ........................................ 137
•• Bibliografía ©
IV ESTADÍSTICA PARA LA TOMA DE DECISIONES

INTRODUCCIÓN
IN T RO D U CC I ÓN
La interpretación de las decisiones gerenciales bajo incertidumbre y, en general, de las

distintas ciencias, dependen en gran parte de los métodos estadísticos. Por ello, es
fundamental que los gerentes se familiaricen con los razonamientos estadísticos como
una herramienta más de marketing, de diferenciación respecto de la competencia.
La calidad en los productos y servicios emplea la estadística para mejorar y optimizar los
procesos de producción y, de esta manera, ahorrar tiempo y dinero.
La estadística ayuda a corroborar hipótesis proporcionando un soporte matemático a las

observaciones realizadas. Es una ciencia probabilística, por lo que no hay lugar para las
afirmaciones categóricas o negaciones rotundas, que siempre deben estar enmarcadas
en un nivel de significación o dentro de un margen de error.
©
Este texto responde a la necesidad de justificar las decisiones gerenciales en base a la

información proporcionada por datos que, con demasiada frecuencia, resultan escasos.
Se trata pues de un compendio de técnicas para la recopilación y presentación de
información, intervalos de confianza y pruebas de hipótesis.
Los pasos a seguir para realizar un experimento son:
• Planteamiento de la hipótesis que se pretende demostrar.
• Definición de las variables a estudiar.
• Recogida y recopilación de datos (tipos de muestreo).
• Elección del método estadístico más apropiado para demostrar la hipótesis de

trabajo de la mejor forma posible.
ESTADÍSTICA PARA LA TOMA DE DECISIONES 1

INTRODUCCIÓN
A continuación se detallan los objetivos y el contenido de cada uno de los capítulos que
componen este manual:
RESUMEN
CAPÍTULO OBJETIVO PARTICULAR APORTACIÓN Y RESULTADO CONSEGUIDO
DEL CAPÍTULO
Conocimiento de la estadística como una
Introducción a la toma de
herramienta diferenciadora para aproximarse a la
decisiones.
solución de las necesidades de empresa.
Proporcionar al gerente una
serie de criterios Etapas en la toma de Establecimiento de las etapas a seguir para la toma
Capítulo 1 decisiones. de decisión ante un determinado problema.
estadísticos para la toma de
decisiones en la empresa. Población y muestra. Distinción entre población y muestra aleatoria.
Conocimiento de los tipos de variables existentes y
Datos y variables.
los datos y categorías a que dan lugar.
Distribuciones de Organización de los datos de acuerdo con las

Analizar las formas de frecuencias de datos pautas de comportamiento de los diferentes
Capítulo 2 representación de las categorizados. resultados observados.
variables cualitativas. Representaciones gráficas Análisis gráfico alternativo de las pautas de
de las variables cualitativas. comportamiento de los datos.
Organización de los datos de acuerdo con las

Variables discretas y
pautas de comportamiento de los diferentes

Analizar las formas de variables continuas.
resultados observados.
Capítulo 3 representación de las
variables cuantitativas. Representaciones gráficas
Análisis gráfico alternativo de las pautas de
de las variables
comportamiento de los datos.
cuantitativas.
Describir las características

Realización de descripciones concisas de un gran
de una serie de datos Estadísticos de tendencia
Capítulo 4 conjunto de datos que, debido a su volumen,
correspondientes a una central y de dispersión.
resulta complicado procesar en bruto.
población o muestra.
Adquirir los conocimientos Distribuciones de variable Conocimiento de las funciones de distribución

necesarios de cálculo de continua (normal, t-student, normal y t-student y su importantísimo papel que
probabilidades para su chi-cuadrado). desempeñan en el modelamiento estadístico.
©
Capítulo 5
posterior utilización en Conocimiento de la función de probabilidad
situaciones de Distribuciones de variable
binomial en las decisiones bajo incertidumbre que
incertidumbre. discreta (binomial).
implican únicamente dos resultados posibles.
Utilizar los conocimientos Determinación de estimaciones puntuales e

Estimación de parámetros.
fundamentales teóricos intervalos de confianza para medias y proporciones.
sobre la estimación y los
Capítulo 6 contrastes de hipótesis, Realización de inferencias sobre la población a
para la resolución de Contrastes de hipótesis. partir de una muestra aleatoria mediante el
situaciones prácticas en la planteamiento de la hipótesis nula.
empresa.
Análisis de la existencia o no de diferencias

Elaborar los razonamientos Comparación de dos o más
significativas entre varias poblaciones por medio del
lógicos para la elección del medias poblacionales.
planteamiento de la hipótesis nula.
Capítulo 7 modelo más adecuado a la
hora de comparar dos o Análisis de la homocedasticidad de diferentes
Comparación de dos o más
ma´s poblaciones. poblaciones como condición indispensable para la
varianzas poblacionales.
aplicación de los estadísticos.
Determinación del coeficiente de correlación lineal

Analizar la relación entre Correlación.
de Pearson de dos variables cuantitativas.
Capítulo 8 dos o más variables
cuantitativas. Establecimiento de un modelo de regresión y
Regresión lineal simple.
estimación de los parámetros correspondientes.
2 ESTADÍSTICA PARA LA TOMA DE DECISIONES

CRITERIO ESTADÍSTICO PARA LA TOMA DE DECISIONES
Capítulo 1
CRITERIO ESTADÍSTICO
P A RA L A T O M A
DE DECISIONES
1.1. INTRODUCCIÓN
En todo proceso de decisión se necesita recabar información que sea capaz de

©
responder a nuestras indagaciones. Para que los resultados sean fiables, tanto la
recogida de datos como su análisis deben ser realizados con criterio y de forma
objetiva.
Las herramientas estadísticas permiten recolectar, analizar e interpretar de forma

inteligente los datos relevantes en el proceso de toma de decisión. De esta manera,
para que la utilización de los resultados estadísticos se haga de una forma correcta,
resulta necesario que el gerente conozca los principios básicos de las técnicas usadas.
Los gerentes y profesionales, en general, necesitan justificar sus

decisiones basándose en la información proporcionada por los datos.
La estadística ayuda a tomar decisiones económicas bajo incertidumbre, a predecir con

eficacia pautas de comportamiento de las variables, en definitiva, a crear modelos sobre
los que basar dichas decisiones.

Los modelos estadísticos (p.e. el análisis de regresión) se emplean actualmente en

varios campos de negocio y de la ciencia, permiten predecir o identificar los factores
más influyentes, además de estudiar el impacto sobre las variables dependientes para
cualquier cambio en sus valores actuales.
A diferencia del modelo determinista, en los procesos de toma de decisiones bajo

incertidumbre, las variables son más numerosas y más difíciles de medir y controlar, por
lo que las nuevas tecnologías resultan hoy día imprescindibles para encontrar un modelo
que responda a nuestras necesidades como gerentes.
En este sentido, la utilidad de la estadística de negocio puede reflejarse en numerosos

campos y aplicaciones:
- Empleo de técnicas de muestreo aleatorio en el ámbito de la auditoría.

- Aseguramiento de la calidad de los productos, gracias al empleo de técnicas
estadísticas de control de la calidad.
- Empleo de métodos de regresión y correlación para entender las relaciones

entre variables y predecir comportamientos.
- Utilización de pruebas de significancia para aceptar o rechazar una hipótesis.
- Empleo de técnicas estadísticas para la predicción, por ejemplo, en el ámbito de
las ventas.
En definitiva, se trata de utilizar la estadística como una herramienta diferenciadora

respecto de la competencia para aproximarse a la solución que satisfaga las
necesidades de empresa, y así crear una oportunidad de negocio que nos permita
posicionarnos en el mercado de manera estratégica.
©
La Estadística para la toma de decisiones puede dividirse en:
- Estadística Descriptiva. Aquella que describe las características de una serie de

datos pertenecientes a una población o a una muestra (recogida, descripción,
análisis y sumatorio de datos).
- Estadística Inferencial. Dado el desconocimiento de la población, en la práctica,
el profesional buscará hacer inferencias para la toma de decisiones, es decir,
predicciones sobre ciertas características de la población, basándose en la
información contenida en una muestra al azar1 (o aleatoria) de la población
entera.
La estadística inferencial puede utilizarse para explicar un fenómeno o para
comprobar la validez de una proposición. En el primer caso, se denomina
análisis exploratorio de datos y, en el segundo, análisis confirmatorio de datos.
1. Esta condición es fundamental para asegurarse que una muestra es representativa con respecto a la población.

La Estadística Descriptiva es la base de la Estadística Inferencial.
1.2. POBLACIÓN Y MUESTRA
La población se podría definir como el conjunto de todos los individuos (personas,

animales, plantas, cosas) de los que nos interesa estudiar ciertos datos. Algunos
ejemplos de población son: la edad de los habitantes de un país o región, la vida media
de las bombillas, el número de alumnos que cursa primaria, entre otros.
Debido a la práctica imposibilidad de estudiar todos los individuos que componen una
población por su coste en tiempo y dinero, en la práctica, se recurre a utilizar una
muestra aleatoria, que no es más que un subconjunto de la población, y que nos servirá
para hacer inferencias sobre la misma.
A partir de una muestra escogida al azar de una población, pueden sacarse

conclusiones sobre sus características particulares. La muestra debería ser
representativa de la población.
Generalmente, se asocia la palabra “parámetro” a las medidas que provienen de la

población y “estadístico” a las originarias de la muestra. De esta manera, nos referimos
a la media poblacional como el parámetro (μ) y a la desviación tipo o estándard como el
©
parámetro (σ). Análogamente, se hablaría de la media muestral como el estadístico X y

de la desviación tipo de la muestra como el estadístico S.
Las letras griegas representan parámetros y las latinas simbolizan estadísticos.
En resumen, la media (desviación tipo) muestral es una estimación imparcial de la media

(desviación tipo) poblacional. Por extensión, la función de distribución empírica es una
estimación imparcial de la función de distribución de la población F(x).

1.2.1. TAMAÑO DE LA MUESTRA
El tamaño de la muestra (n) debe definirse en la etapa de planificación de la toma de

decisiones. Normalmente, como aproximación, puede utilizarse la expresión:
0 ,5
n = N + 1
donde:
n= tamaño de la muestra.
N= población finita de tamaño N.
El valor de n resultante se redondea al número entero más cercano. Naturalmente,

mientras más grande sea la muestra, mayor será la información que proporcione y, en
consecuencia, la estimación será más exacta.
La elección del tamaño de la muestra es un paso muy importante que se verá con

detalle más adelante.
1.2.2. TÉCNICAS DE MUESTREO
Un problema típico que se plantea a la hora de tomar decisiones sucede cuando se debe
hacer inferencias sobre una población determinada y se encuentra que el coste en
tiempo y dinero supera todas las previsiones.
©
Tal y como se ha mencionado con anterioridad, el procedimiento consisitiría en escoger
una muestra y adoptar una solución de compromiso, puesto que los resultados
obtenidos serían únicamente una estimación del valor real que deseamos encontrar. Eso
sí, nos habríamos ahorrado gran cantidad de recursos.
No obstante, nos quedaría la duda de si nuestra estimación es la mejor de todas las

posibles, y ello está relacionado con los métodos comunes de muestreo estadístico
empleados en los negocios:
- Muestreo de grupos: se requiere que la población sea homogénea, pero puede

estar agrupada en diferentes lugares. Por ejemplo, una empresa que tenga
sucursales en diferentes países no hace falta que recoja datos de todas y cada
una de ellas, sino que puede realizar un muestro aleatorio de un pequeño grupo
de dichas sucursales para sacar conclusiones sobre el total.
- Muestreo estratificado: se utiliza siempre que la población pueda ser

particionada en subpoblaciones más pequeñas.

- Muestreo aleatorio: sin lugar a dudas, es el más empleado en la toma de

decisiones de hoy día. Es importante que el muestro aleatorio se realice con la
ayuda de un ordenador.
- Muestreo de selección cruzada: estudia las observaciones de una población

definida en un momento o intervalo de tiempo determinado.
1.3. ETAPAS DE UN PROCESO DE TOMA DE

DECISIONES
La figura 1.1 ilustra las principales etapas de un proceso de toma de decisiones

estadísticas.
©
Figura 1.1: Etapas usuales de un proceso de toma de decisiones estadísticas.
1.3.1. DEFINICIÓN DEL PROBLEMA Y OBJETIVOS
Es muy importante definir claramente el problema y formular los objetivos que se

quieren conseguir, ya que éstos servirán para desarrollar las etapas posteriores de la
investigación.
Esta etapa debe responder a preguntas clave tales como: ¿cuál es el objetivo del estudio
o de las preguntas a responder? ¿A qué población va dirigida el proceso de toma de
decisiones?

Por ejemplo, como objetivo general, a un gerente le convendría conocer el perfil de

trabajo de los funcionarios de una determinada empresa, para orientar la política de
recursos humanos. En este caso, deberíamos especificar mejor lo que queremos
conocer dentro de la población de funcionarios, es decir, los objetivos específicos:
- conocer el tiempo medio de servicio de los funcionarios de la empresa;
- conocer el grado de instrucción de los funcionarios;
- verificar el interés de los funcionarios en participar en programas de

entrenamiento;
- evaluar el grado de satisfacción de los funcionarios en el trabajo que ejercen

dentro de la empresa; y,
- verificar si existe asociación entre el grado de satisfacción del funcionario y su

productividad.
La elaboración de los objetivos específicos debe realizarse de tal manera que indiquen

una primera aproximación de las características que se necesite observar o medir. De
esta manera, se precisarían observar las siguientes variables de cada funcionario de la
empresa:
- tiempo de servicio;
- grado de instrucción;
- interés en la participación de programas de entrenamiento; y,
- grado de satisfacción del trabajo y productividad.
©
1.3.2. PLANIFICACIÓN DE LA INVESTIGACIÓN
Los datos deben ser recogidos según un plan que garantice que la información es válida.
El plan debe identificar las variables importantes relacionadas con el problema, y
especificar cómo éstas van a ser medidas (modelo estadístico).
Previamente a la recogida de la muestra, es importante que la población sea definida de

forma cuidadosa y en su integridad.
En este contexto se responderá a preguntas tales como: ¿cómo es la muestra que se

seleccionará? ¿Existen posibles fuentes de selección que harían la muestra no
representativa? ¿Qué previsiones deben hacerse para trabajar en caso de anomalías?
entre otras.

1.3.3. RECOGIDA DE DATOS
En esta fase se procederá a la recogida de datos. Tal y como se verá a continuación, en

estadística, la información puede recogerse usando datos cualitativos o cuantitativos.
En este contexto, deberá reflexionarse acerca si el método de medida o clasificación

cubre los objetivos, si existen posibles irregularidades en las mediciones (y/o conteo) o
si las observaciones son confiables, entre otras.
1.3.4. ANÁLISIS DE DATOS
En el análisis exploratorio de los datos se emplean técnicas gráficas y numéricas, que

proporcionan las pautas de conducta y el origen de los mismos. Dichas técnicas serán
objeto de estudio a lo largo de los siguientes capítulos.
A resultas del análisis se conocerá la forma, ubicación, variablidad y anomalías

detectadas y se establecerán conjeturas acerca de las relaciones entre variables. En

este sentido, el hecho de cómo una variable se encuentra relacionada con otra se podrá
observar, por ejemplo, mediante comparaciones simples de proporciones a través de la
regresión lineal.
1.3.5. RESULTADOS
Los resultados se deben representar de una forma clara y objetiva, sin caer en
©
demasiados tecnicismos, para permitir a los responsables de la toma de decisiones

entenderlos y juzgarlos. De lo contrario, todo el esfuerzo no habrá servido para nada.
1.3.6. CONCLUSIONES
En este apartado se harán reflexiones sobre los resultados y se estudiará si son

relevantes en referencia a los objetivos propuestos.

1.4. VARIABLES Y DATOS
Se denomina variable a las características que pueden ser observadas (o medidas) en

cada elemento de la población y que puede tomar diferentes valores en diferentes
individuos, bajo las mismas condiciones.
Las variables surgen cuando preguntamos qué vamos a observar

o medir en los elementos de una población.
Por ejemplo, retomando el caso de los funcionarios mencionado con anterioridad,

algunos ejemplos de variables serían el tiempo de servicio, estado civil, productividad,
entre otras.
En este contexto, podríamos pensar en formular preguntas del tipo:

- ¿Desde cuándo el Sr. (o Sra.) trabaja en esta empresa?___________________
- ¿Cuál es su estado civil?________________________
Sin embargo, estas preguntas no están identificando de forma correcta las variables que
nos interesan, pues los funcionarios podrían interpretarlas de diferentes maneras; por
ejemplo, para la primera pregunta pueden surgir respuestas tales como: hace poco más
de 12 años, hace mucho tiempo, entre otras. Es decir, las variables no están siendo
observadas de una forma homogénea.
©
En consecuencia, para que las observaciones sobre el tiempo de servicio se realicen de
una manera homogénea, es preciso establecer una unidad de medida, por ejemplo, años
completos de trabajo en una empresa:
- ¿Desde cuándo el Sr. (o Sra.) trabaja en esta empresa?
______años completos.
En referencia a la variable “estado civil”, las posibles respuestas son atributos. Con el
fin de evitar alguna respuesta anómala, se pueden establecer previamente las posibles
alternativas de respuesta. De esta manera, la pregunta se reescribiría:
- ¿Cuál es su estado civil? ( ) soltero ( ) casado
( ) viudo ( ) separado ( ) divorciado

1.4.1. TIPOS DE VARIABLES
Existen dos tipos de variables: cualitativas y cuantitativas.
Las variables cualitativas o categóricas no se pueden medir por relaciones aritméticas, y

sus resultados son atributos o cualidades. Por ejemplo, variables de este estilo serían: el
estado civil de los funcionarios, el color, modelo y marca de los coches, entre otras.
Las variables cuantitativas se muestran como números pertenecientes a una cierta

escala, por ejemplo, el tiempo de servicio (en años completos), el peso, las
dimensiones, velocidad máxima de un vehículo, entre otras. En este grupo, indicadores
tales como la media y la desviación tipo tiene sentido. A su vez, las variables
cuantitativas se pueden dividir en discretas y continuas.
Las variables cualitativas reflejan una cualidad del individuo, mientras que las
cuantitativas corresponden a características que reflejan cantidades.
Las variables cualitativas también pueden utilizar números, aunque no por ello tienen
que reflejar cantidades. Por ejemplo, el número de teléfono, el número de la calle donde
se vive o el DNI, son variables cualitativas que, por comodidad, emplean números en
vez de nombres para definir los diferentes valores.
En la figura 1.2 se ilustra la clasificación de las variables y datos en términos de nivel de

medida.
©
Figura 1.2: Clasificación de las variables y datos.
Siempre que una variable pueda ser medida correctamente de forma cuantitativa, se
debe usar este tipo de medida, porque las cuantitativas son, en general, más
informativas que las cualitativas. Por ejemplo, decir que un funcionario hace 30 años
que trabaja en la empresa proporciona mucha más información que decir que hace
mucho tiempo que trabaja en la empresa.


©

Resumen
©


©

VA R I A B L E S CUALITATIVAS
Capítulo 2
VAR I A B L E S C U A L I T A T I VA S
2.1. INTRODUCCIÓN
Tal y como se ha mencionado en el capítulo anterior, los resultados de las variables

cualitativas (nivel de estudios, sexo, estado civil...) se estructuran en forma de
categorías. Por ejemplo, la variable color del pelo puede tener varias categorías como
rubio, moreno, canoso, entre otras, o al referirnos a la variable sexo (género) en un
conjunto de individuos, estaremos clasificando cada individuo en una categoría
©
masculina y en otra categoría femenina.
Si las variables cualitativas únicamente pueden tomar dos categorías, se denominan

dicotómicas: sexo, pertenencia a una organización (sí-no), tener hijos (sí-no), entre
otras.
Si las variables cualitativas pueden tomar más de dos categorías, se denominan

politómicas: color del pelo, marca de un vehículo, entre otras.
2.2. DISTRIBUCIÓN DE FRECUENCIAS
Uno de los primeros pasos para entender el comportamiento de una variable es la

construcción de una distribución de frecuencias.

La distribución de frecuencias comprende la organización de los datos de

acuerdo con las pautas de comportamiento de los diferentes resultados
observados. Puede ser representada de forma tabular o gráfica.
Para ilustrar la construcción de una distribución de frecuencias, se considerará una

muestra de 40 familias pertenecientes a un conjunto residencial en Monte Verde
(Florianópolis). En concreto, se estudiará como variable el nivel de estudios del padre de
familia, en función de los siguientes códigos o categorías:
1 = ninguno.
2 = nivel básico.
3 = nivel medio.
Los resultados son:
DATOS

33223133322122323333
33322313233231113333
Con el fin de construir una distribución de frecuencias con datos relativos a una variable
cualitativa, basta con contar la cantidad de resultados observados en cada categoría
(tabla 2.1).
©
NIVEL DE FRECUENCIA
PORCENTAJE
ESTUDIOS ABSOLUTA
Ninguno 6 15
Nivel Básico 11 27,5
Nivel Medio 23 57,5
Total 40 100
Tabla 2.1. Distribución de frecuencias del nivel de estudios de los patriarcas de una muestra de 40
familias del conjunto residencial Monte Verde, Florianópolis - SC, 1988.
La primera columna de la tabla 2.1 muestra todas las categorías previamente

establecidas de la variable “nivel de estudios”. La segunda columna proporciona el
cómputo del número de observaciones identificadas en cada una de las categorías
(frecuencia absoluta). Por último, la tercera columna presenta una medida relativa de la
frecuencia de cada categoría. Los porcentajes se obtienen de dividir la frecuencia

absoluta de cada categoría por el número total de observaciones (frecuencia relativa) y

multiplicar por 100.
Los porcentajes son particularmente importantes para

comparar distribuciones de frecuencia entre si.
La tabla 2.2 muestra tres distribuciones de frecuencias. La primera corresponde a la del

ejemplo anterior y, las restantes, a un estudio similar en dos localidades próximas.
LOCALIDAD
NIVEL DE ESTUDIOS ENCOSTO DO
MONTE VERDE PQ. DA FIGUEIRA
MORRO
Ninguno 6 (15,0)a 14 (32,6) 18 (48,7)
Nivel Básico 11 (27,5) 14 (32,6) 13 (35,1)

Nivel Medio 23 (57,5) 15 (34,8) 6 (16,2)
Total 40 (100) 43 (100) 37 (100)
a. Los números entre paréntesis corresponden a los porcentajes en relación al total de familias observadas en cada
localidad.
Tabla 2.2. Distribución de frecuencias referida al nivel de estudios de los patriarcas de una muestra de
120 familias de tres localidades diferentes del barrio de Saco Grande II, Florianópolis - SC,
Brasil, 1988.
©
En la tabla 2.2 se puede observar que los patriarcas de las familias investigadas en el
Conjunto Residencial Monte Verde presentan los mejores resultados; por otro lado, en
Encosta do Morro se dan los peores resultados con casi un 50% de patriarcas con
ningún nivel de estudios.
El lector debe observar que al organizar y resumir los datos de una distribución de
frecuencias, normalmente no se proporciona la información de cuántos elementos
pertenecen a cada categoría, ya que para entender el comportamiento general de una
variable esa información no suele ser relevante.

2.3. REPRESENTACIÓN GRÁFICA
Las representaciones gráficas ofrecen, en general, una mejor visualización de las pautas
de comportamiento de los datos que las tablas: por ello, constituyen una forma
alternativa de presentación de las distribuciones de frecuencias.
Existen diferentes maneras de representar las variables cualitativas politómicas

(diagrama de puntos, diagrama de columnas, diagrama de barras, diagrama circular o de
sectores, entre otras).
A continuación se presentarán los gráficos de barra y de sectores, que son los más
importantes a la hora de representar las distribuciones de frecuencias de los datos
categorizados.
2.3.1. DIAGRAMA DE BARRAS

La figura 2.1 representa la distribución de frecuencias de la tabla 2.1 expresada por un
gráfico de barras. Cada categoría se representa por una barra proporcional a su
frecuencia (número de familias) dispuesta a lo largo del eje de abcisas, en tanto que en
el eje vertical se recogen los valores de la variable o categorías.
Figura 2.1: Distribución de frecuencias del nivel de estudios de los padres de familia de una muestra de 40
Opcionalmente, se pueden presentar las categorías en el eje horizontal y la frecuencia

en el eje vertical. En este caso, el gráfico se denomina diagrama de columnas.

2.3.2. DIAGRAMA CIRCULAR O DE SECTORES
Consiste en un circulo dividido en sectores, cada uno asignado a un valor de la variable,

y cuya superficie es proporcional a la frecuencia con que aparece dicho valor.
Con el fin de calcular el ángulo que abarca cada sector, basta con plantear una regla de
tres entre el ángulo (en grados) desconocido, la frecuencia total y la frecuencia
observada para cada categoría, barriendo un ángulo de 360º, según:
α1 6
=
360 ° 40
donde:
6
α1 = (360 ) = 54 °
40
Realizando el mismo procedimiento, se tiene:
Categoría 1 (ninguno) sector de tamaño α1= 54º

Categoría 2 (nivel básico) sector de tamaño α2= 99º
Categoría 3 (nivel medio) sector de tamaño α3= 207º
Con lo que el gráfico de sectores quedará según se ilustra en la figura 2.2.

©
Figura 2.2: Distribución de frecuencias del nivel de estudios de los padres de familia de una muestra de 40

2.3.3. GRÁFICO DE BARRAS MÚLTIPLES
Con el fin de efectuar un análisis comparativo de varias distribuciones, podemos

construir varios gráficos de sectores o un gráfico de barras múltiples, como el que se
ilustra en la figura 2.3, que representa gráficamente las distribuciones de frecuencia de
la tabla 2.2.

©
Figura 2.3: Distribución de frecuencias referida al nivel de estudios de los patriarcas de una muestra de
120 familias de tres localidades diferentes del barrio de Saco Grande II, Florianópolis - SC,
1988.
2.4. TABLAS DE CONTINGENCIA O DE DOBLE

ENTRADA
Las ciencias sociales y humanas tienen un interés común en verificar la asociación de

dos variables ante un cierto conjunto de elementos. Por ejemplo, puede ser interesante
descubrir cómo varía el tanto por ciento de los usuarios acogidos a un programa de
alimentación popular con el nivel de renta de los mismos.

Este tipo de análisis generalmente se presenta en tablas de contingencia o de doble

entrada, tal y como se verá a continuación.
Con el fin de construir una distribución conjunta de frecuencias, se deben observar

simultáneamente las dos variables implicadas en el estudio.
La figura 2.4 muestra la construcción de una distribución conjunta, tomando como

variables el nivel de estudios del patriarca de la familia y el uso de programas de
alimentación popular.
CÓDIGOS DEL NIVEL DE ESTUDIOS
1. Ninguno
2. Nivel Básico
3. Nivel medio
CÓDIGOS DE USO DEL PROGRAMA

DE ALIMENTACIÓN POPULAR
0. Sí
1. No
©
Figura 2.4: Construcción de la tabla de distribución conjunta de frecuencias.
Para la construcción de la tabla de distribución conjunta de frecuencias, cada elemento

(familia) debe pertenecer a una y solamente una celda de la tabla.
Realizando la clasificación de todas las familias observadas y contando las frecuencias

de cada celda, se llega a la tabla 2.3.

USO DE NIVEL DE ESTUDIOS DEL PATRIARCA

TOTAL
PROGRAMAS NINGUNO BÁSICO MEDIO
SÍ 31 22 25 78
NO 7 16 19 42
Total 38 38 44 120
Tabla 2.3. Distribución conjunta de frecuencias de nivel de estudios del patriarca y uso de programas de
En la tabla 2.3 se puede observar que los totales por columnas proporcionan la
distribución de frecuencias de la variable nivel de estudios del patriarca, mientras que el
el total por filas constituye la distribución de frecuencias de la variable programas de
Para facilitar el análisis de una tabla de contingencia, se pueden incluir las frecuencias

relativas (porcentajes), que pueden ser calculadas en relación con los totales de las filas
y las columnas, dependiendo del objetivo.
En la tabla 2.4 se incluyen los porcentajes en relación con los totales de las columnas.
Esta tabla evidencia los perfiles de uso de los programas de alimentación popular,
considerando las familias separadas por nivel de estudios del patriarca (perfiles por
columnas).
©
TOTAL
SÍ 31 (81,6)a 22 (57,9) 25 (56,8) 78 (65,0)
NO 7 (18,4) 16 (42,1) 19 (43,2) 42 (35,0)
Total 38 (100) 38 (100) 44 (100) 120 (100)
a. Los números entre paréntesis son los porcentajes en relación con los totales de las columnas.
Tabla 2.4. Distribución del uso de programas de alimentación popular, según el nivel de estudios del
patriarca.
Se puede observar que a un nivel de estudios más bajo, la gran mayoría de las familias
investigadas usan los programas (81,6%), mientras que a un nivel de instrucción más
alto, poco más de la mitad emplean dichos programas (56,8%).

La tabla 2.5 muestra los porcentajes en relación con los totales de las filas. Esta tabla
evidencia los perfiles del nivel de estudio del patriarca (perfiles por fila), considerando la
muestra dividida en familias que usan y familias que no usan los programas. Se deja la
interpretación de la tabla para el lector.

TOTAL
SÍ 31 (39,7)a 22 (28,2) 25 (32,1) 78 (100)
NO 7 (16,7) 16 (38,1) 19 (45,2) 42 (100)
Total 38 (31,7) 38 (31,7) 44 (36,7) 120 (100)
a. Los números entre paréntesis son los porcentajes en relación con los totales de las columnas.
Tabla 2.5. Distribución del nivel de estudios del patriarca, según el uso de programas de alimentación
popular.
©


©

Resumen
©


©

VA R I A B L E S CUANTITATIVAS
Capítulo 3
VAR I AB L E S
C U A N T I T A T I VA S
3.1. INTRODUCCIÓN
Cuando se estudia una variable que es posible medir de forma numérica, se tiene mucho
ganado en referencia a las técnicas de análisis exploratorio de datos. Este capítulo trata
de la construcción de distribuciones de frecuencia de variables cuantitativas y sus
©
interpretaciones.
Una variable cuantitativa se denomina discreta cuando sus posibles valores pueden ser
listados. Por ejemplo, el número de hijos de una pareja o el número de habitaciones de
una casa, son ejemplos de variables discretas porque pueden asumir valores {0,1,2,...}
en referencia al primer caso o {1,2,3,...} por lo que respecta al segundo caso. Las
variables discretas generalmente resultan de un conteo.
Una variable cuantitativa se denomina continua cuando puede tomar cualquier valor en
un intervalo. Por ejemplo, el peso de un individuo es una variable continua, pues puede
asumir cualquier valor en un intervalo, digamos, de 0 a 300 kg. La variables continuas
acostumbran a ser generadas por un instrumento de medida.

VA R I A B L E S CUA NT IT AT IVAS
3.2. VARIABLES DISCRETAS
La construcción de distribuciones de frecuencias de datos de variable discreta puede ser

hecha de la misma forma que una frecuencia de datos categorizados, siempre que no
exista una gran cantidad de diferentes valores observados1.
Como ejemplo, se considerará el número de personas residentes en el domicilio,

considerando una muestra de 40 residencias del Conjunto Residencial Monte Verde.
DATOS
4 4 4 5 4 1 2 3 6 4 6 4 4 6 3 5 3 4 4 4
5 5 5 4 8 4 5 3 4 5 5 2 5 2 6 8 3 5 5 3
La tabla 3.1 representa la distribución de frecuencias de los datos, construida en base a

contabilizar el número de repeticiones de cada valor.

NÚMERO FRECUENCIA PORCENTAJE
DE PERSONAS DE RESIDENCIAS DE RESIDENCIAS
1 1 2,5
2 3 7,5
3 6 15,0
4 13 32,5
©
5 11 27,5
6 4 10,0
7 0 0,0
8 2 5,0
Tabla 3.1. Distribución de frecuencias del número de personas residentes para una muestra de 40
residencias del Conjunto Residencial Monte Verde, Florianópolis - SC, 1988.
Con el fin de representar gráficamente la distribución de frecuencias de una variable

cuantitativa, se deben construir un par de ejes cartesianos. En abcisas (eje horizontal),
se ubicará una escala para representar los valores de la variable de estudio y, en
ordenadas (eje vertical), se representará la frecuencia de cada valor.
1. Cuando una variable discreta presenta un gran número de diferentes valores observados, se pueden emplear artificios
propios para variables continuas, tal y como se verá más adelante.

En la figura 3.1 se ilustran dos formas alternativas de representación gráfica de la

distribución de frecuencias mostrada en la tabla 3.1. La primera consiste en realizar
trazos verticales sobre los valores efectivamente observados (figura 3.1A). En la
segunda representación se sustituyen los trazos por barras (figura 3.1B). Las barras
deben tener todas ellas la misma anchura.
El eje vertical (frecuencias) siempre debe partir de cero, mientras que el horizontal
(valores de la variable) puede iniciarse con el valor mínimo que ésta pueda tomar.
Figura 3.1: Representaciones gráficas de la distribución de frecuencias de la tabla 3.1.

©
3.3. VARIABLES CONTINUAS
En este caso carece de sentido contar las veces que se repite cada valor, ya que
considerando que difícilmente los valores se repiten, no se llegaría a unas conclusiones
apropiadas.
3.3.1. EL DIAGRAMA DE PUNTOS
Cuando se tiene un conjunto de pocos datos, se pueden analizar a través de un

diagrama de puntos, es decir, representando cada resultado (valor) por un punto en una
recta de números reales (figura 3.2).

Figura 3.2: Construcción de un diagrama de puntos.
Es posible colocar dos o más distribuciones en un mismo gráfico, basta con identificar
los puntos con símbolos diferentes y ubicarlos a otro nivel, tal y como se indica en la
figura 3.3.

Figura 3.3: Diagrama de puntos del Índice de Desarrollo Humano (IDH), pertenecientes a dos muestras
aleatorias de catorce municipios de la región del sur y de la región del norte2.
Los municipios de la muestra de la región del sur presentan, en general, unos valores de ©
IDH mayores que los municipios de la muestra de la región del norte. También se
observa que ambas muestras de municipios se diferencian en cuanto a la dispersión de
los datos. En este sentido, en la región del sur los municipios presentan valores de IDH
relativamente próximos (mayor homogeneidad), mientras que en la muestra de la región
del norte, los valores varían bastante de municipio a municipio (mayor heterogeneidad).
2. Datos extraídos del Atlas do Desenvolvimiento Humano (http://www.pnud.org.br/atlas). El IDH, calculado para cada
municipio, fue construido en base al censo demográfico de 2000. Observe que en este ejemplo los elementos de las
muestras son municipios.

3.3.2. LA TABLA DE FRECUENCIAS
Sin embargo, lo más usual es que trabajemos con un conjunto de un centenar o millares
de datos observados, haciendo impracticable la utilización del diagrama de puntos. En
este caso, podremos construir distribuciones de frecuencias, agrupando los resultados
en clases preestablecidas.
Las clases son pequeños intervalos mutuamente exclusivos que, agrupados todos
juntos, abarcan todo el conjunto de datos. En otras palabras, las clases deben ser
construidas de tal manera que todo valor observado pertenezca a una y solamente una
clase. Por simplicidad, y para facilitar la interpretación, se considerarán todas las clases
con una misma amplitud.
Como ejemplo, se emplearán las tasas de alfabetización de una muestra aleatoria de 40

municipios de Brasil3.
DATOS
57,25 76,85 92,90 89,07 75,49 84,33 65,28 94,59 71,20 82,30
72,81 66,01 90,52 87,94 58,88 86,34 45,37 81,15 94,83 81,42
54,70 67,95 69,91 95,03 77,62 57,14 91,22 64,65 85,70 81,34
59,07 68,04 73,22 95,34 88,40 83,52 64,19 64,17 95,34 84,66
Se puede observar que todos los valores se encuentran en un intervalo de 40 a 100 (el
menor valor es de 45,37 y el mayor es de 95,34). Se tienen que definir un conjunto de
clases mutuamente exclusivas, tales que, todas agrupadas, contengan todos los
©
valores. Una posible opción sería construir 6 (seis) clases con una amplitud aproximada
de 10, tal y como se muestra a continuación:
de 40,00 a 49,99; de 50 a 59,99;.....; de 90,00 a 99,99.
Para simplificar la notación, estas clases se representarán por:
40,00 |⎯ 50,00; 50,00 |⎯ 60,00;...; 90,00 |⎯ 100,00
donde el símbolo “|⎯” representa el intervalo entre dos variables, incluyendo el valor del
lado izquierdo y excluyendo el valor del lado derecho.
La tabla de frecuencias se construye a través de la contabilización de la frecuencia de

observaciones de cada clase, tal y como se muestra en el cuadro siguiente:
3. Datos del censo demográfico, 2000 (http://www.ibge.gov.br).

CLASES CONTABILIZADO FRECUENCIA
40 |⎯ 50 | 1
50 |⎯ 60 ||||| 5
60 |⎯ 70 ||||| ||| 8
70 |⎯ 80 ||||| | 6
80 |⎯ 90 ||||| ||||| || 12
90 |⎯ 100 ||||| ||| 8
En la representación de una tabla de frecuencias es común colocar también los puntos

medios de las clases, es decir, para cada clase, la media de sus límites. Por ejemplo,
para la clase 40 |⎯ 50 el punto medio es 45. El punto medio representa el valor típico
de la clase.
En la tabla 3.2 se representa la distribución de frecuencias de los datos en cuestión.

CLASES DE TASA DE PUNTO FRECUENCIA DE PORCENTAJE DE
ALFABETIZACIÓN MEDIO MUNICIPIOS MUNICIPIOS
40 |⎯ 50 45 1 2,5
50 |⎯ 60 55 5 12,5
60 |⎯ 70 65 8 20,0
©
70 |⎯ 80 75 6 15,0
80 |⎯ 90 85 12 30,0
90 |⎯ 100 95 8 20,0
TOTAL - 40 100,0
Tabla 3.2. Distribución de frecuencias de las tasas de alfabetización de una muestra aleatoria de 40
municipios brasileños.
El número de clases empleado en la tabla de frecuencias se escoge de manera arbitraria.

En este sentido, cuanto mayor es el conjunto de datos, pueden ser usadas un mayor
número de clases. Hay que tener presente que una tabla con pocas clases presenta una
distribución de forma bastante pobre, pudiendo no evidenciar algunas características
relevantes. Por otro lado, si se emplean muchas clases, la tabla puede adquirir grandes
dimensiones y enmascarar los aspectos relevantes de la distribución de frecuencias
dentro de la maraña de datos.

En general, un número adecuado de clases oscila entre cinco y veinte, dependiendo de

la cantidad de datos y de los objetivos. Una sugerencia es emplear n clases, donde n
es la cantidad de valores4.
Siguiendo con nuestro ejemplo, n=40, resultando así un valor de 6,32. Esto sugiere
emplear seis o siete clases. Nos quedamos con seis clases. Dado que los datos
extremos son 45,37 (menor) y 95,34 (mayor), se tiene una amplitud total de 95,34-
45 ,37 ≈ 50 . Asimismo, si las clases se inician por el valor menor, cada clase debe tener
una amplitud de: 50/6=8,33. Para facilitar la lectura de la tabla de frecuencias, se
optará por iniciar en 40 y usar intervalos de clase iguales a 10.
En la figura 3.4 se ilustra, de forma esquemática, el intervalo donde se encuentran los

datos.
Figura 3.4: Intervalo donde se encuentran las tasas de alfabetización de la muestra de 40 municipios
©
brasileños.
Una forma alternativa de presentar las distribuciones de frecuencia de variables

cuantitativas es a través de gráficos, tales como los histogramas o los polígonos de
frecuencia, los cuales se presentan a continuación.
3.3.3. HISTOGRAMA
La figura 3.5 muestra un histograma construido a partir de la tabla 3.2. Se puede

observar que la altura de cada rectángulo es proporcional a la frecuencia observada de
la correspondiente clase5.
4. Cuando se tienen valores discrepantes dentro de un conjunto de datos, se recomienda que el número de clases sea
mayor.

Figura 3.5: Distribución de frecuencia de las tasas de alfabetización de una muestra de municipios
brasileños, año 2000.
Los histogramas son representaciones similares a los diagramas de columnas, pero

utilizan rectángulos contiguos en vez de columnas separadas.
En la figura se observa un contingente razonable de municipios cuyas tasas de

alfabetización se encuentran por encima de 80, es decir, dentro de la población adulta,
existe un porcentaje superior al 80% de alfabetizados. Por otro lado, también se tienen
municipios con tasas de alfabetización muy bajas (entre 50 y 80). Un análisis similar por
región demográfica podría aportar nuevo tipo de información relevante.
Uno de los usos principales de los histogramas es determinar su unimodalidad, como

condición necesaria para la homogeneidad de la población, en vistas a realizar cualquier
©
análisis estadístico significativo.
3.3.4. POLÍGONO DE FRECUENCIAS
El polígono de frecuencias es una representación gráfica alternativa. Para construirlo, se

toma el punto medio (x) que corresponde a la frecuencia (f) de cada clase. Se colocan
los pares (x, f) como puntos en un par de ejes cartesianos.
La figura 3.6 muestra el polígono de frecuencias construido a partir de la tabla 3.2. El

lector observará que la información ofrecida por el polígono de frecuencias es
equivalente a la proporcionada por el histograma.
5. Cuando las clases no tienen la misma amplitud, resulta necesario realizar algunos ajustes. Véase, por ejemplo, Bussab
e Morettin (2002, p.27). El histograma también podría ser realizado en base a porcentajes en el eje vertical, aunque
su forma no cambiaría.

Figura 3.6: Distribución de frecuencia de las tasas de alfabetización de una muestra de municipios
brasileños, año 2000.
La figura 3.7 presenta dos polígonos de frecuencias en un mismo gráfico. El uso de

porcentajes en lugar de frecuencias absolutas es adecuado porque facilita las
comparaciones entre ambas distribuciones de renta.
©
Figura 3.7: Distribución de frecuencias de las rentas familiares de Monte Verde (muestra de 40 familias) y
Encosta do Morro (muestra de 37 familias), Barrio Saco Grande II, Florianópolis -SC, 1988.

El lector debe observar que un gráfico como el de la figura 3.7 permite explorar posibles
relaciones entre una variable cuantitativa (renta) y una variable cualitativa (localidad). Al
comparar histogramas o polígonos de frecuencias, se debe observar su posición
respecto el eje horizontal, su dispersión y su asimetría.
Se dice que una distribución es simétrica cuando un lado

de la distribución es el reflejo del otro lado.
En las medidas físicas resulta habitual tener distribuciones razonablemente simétricas.

Esto no ocurre, por ejemplo, en las distribuciones de renta, ya que existen por regla
general un mayor número de personas con baja renta que con alta (figura 3.8).

©
Figura 3.8: Diferentes formas de distribuciones de frecuencias.
3.4. OBSERVACIONES A LO LARGO DEL TIEMPO
En muchas ocasiones los datos se recogen en diferentes momentos o intervalos de

tiempo, siendo el objetivo evaluar la variación temporal de aquellos. El trazado, con la
variable de interés colocada en el eje vertical y el tiempo en el eje horizontal, puede
evidenciar una tendencia a la estacionalidad o bien descubrir algún valor relevante.

El gráfico de la figura 3.9 ilustra la variación media del caudal de un río a lo largo diez
años consecutivos.
Figura 3.9: Variación media del caudal de un río a lo largo del tiempo.
En el gráfico de la figura 3.9 se evidencia un valor relevante en el año 1996, mostrado

como atípico, ya que la variación es sensiblemente superior al de los otros años. Ya
veremos en los próximos capítulos qué hacer cuando se presenten datos de este estilo,
pues deben investigarse antes de descartarlos por algún tipo de error en la medida.
©


©

Resumen
©


©

ESTADÍSTICA DESCR IPT IVA
Capítulo 4
ESTADÍSTICA
D E S C R I P T I VA
4.1. INTRODUCCIÓN
En capítulos anteriores aprendimos a organizar los datos en distribuciones de

frecuencias donde era posible visualizar la forma en que una variable se distribuía en
términos de elementos observados.
©
En este capítulo se empleará otra estrategia que puede ser usada de forma alternativa
para complementar, describir y explorar datos cuantitativos.
En efecto, cuando la variable de estudio es cuantitativa, se pueden utilizar estadísticos

que proporcionan información específica sobre el conjunto de valores que puede tomar
una cierta variable.
De esta manera, se tienen las medidas de posición, que son parámetros que indican
dónde se sitúa o posiciona una serie, hacia dónde tiende y alrededor de qué valor se
sitúan los datos observados; y las medidas de dispersión, que indican cómo se sitúan
los valores, es decir, si se agrupan alrededor de las medidas centrales o, por el
contrario, se encuentran dispersos, alejados de su centro.

ESTADÍSTICA DESCRIPTIVA
Entre las medidas de posición, las más importantes son las de tendencia central, y entre
éstas, la media, la mediana y la moda. Entre las medidas de dispersión se encuentra la
varianza y la desviación tipo.
Por ejemplo, para conocer el peso de los recién nacidos de una comunidad, se puede
calcular la media o mediana de los pesos de dichas criaturas al nacer y, para tener una
idea de la magnitud de variación del peso de los neonatos, podemos calcular la
desviación tipo.
4.2. MEDIA, VARIANZA Y MODA
4.2.1. MEDIA ARITMÉTICA
El concepto de media aritmética - o simplemente media - es bastante familiar. Desde el

punto de vista matemático se define como la suma de un conjunto de valores dividida
por el número de valores observados.
Por ejemplo, dada la nota final de ocho alumnos (4,5,5,6,6,7,7 y 8), se puede calcular
la media por:
4 +5+5+6+6+7 +7 +8
=6
8
De modo general, dado un conjunto de n valores observados de una cierta variable X, se
©
puede definir la media por:
Σx
X =
n
donde:
∑X= suma de los valores observados de la variable X.
En la tabla 4.1 se muestran las notas finales de los alumnos pertenecientes a tres aulas
dentro del mismo curso escolar.

MEDIA POR
AULA NOTAS DE LOS ALUMNOS
AULA
A 4 5 5 6 6 7 7 8 6,00
B 1 2 4 6 6 9 10 10 6,00
C 0 6 7 7 7 7,5 7,5 6,00
Tabla 4.1. Notas finales de los alumnos por aula y su media.
La media aritmética es la medida de tendencia central

más común para las variables cuantitativas.
En la figura 4.1 se muestran estos tres conjuntos de valores representados por un

diagrama de puntos.
©
Figura 4.1: Representación de la distribución de las notas en las tres aulas y señalización de las medias
respectivas.
En la figura 4.1 se ilustra que en cada uno de los diagramas de puntos, la media
aritmética se presenta, de alguna forma, en la posición central de los valores
observados. Más propiamente, se puede decir que la media señala el centro de un
conjunto de valores. Haciendo una similitud con el concepto físico de punto de
equilibrio, la media sería la posición que equilibraría los pesos repartidos sobre una
tabla.
En esta figura también se observa que los tres conjuntos de valores, a pesar de estar
distribuidos de diferentes maneras, tienen la misma media aritmética. Este hecho indica
que este estadístico resume un conjunto de datos alrededor de una posición central,
pero no aporta ninguna otra información sobre otros aspectos de la distribución.

Si comparamos las notas del aula A con la notas del aula B, se verifica que en esta
última existe una mayor dispersión de los datos, lo que indica que el aula B es más
heterogénea en cuanto a las notas obtenidas. Por otro lado, en el conjunto de notas del
aula C se observa una nota extremadamente baja, un punto discrepante o anomalía, que
acarrea que la media de este grupo baje sensiblemente1.
Con el fin de explicar mejor el conjunto de datos, aparte de la media aritmética, se debe
acompañar una medida de la dispersión de los datos, y que se conoce como varianza, o
bien, desviación tipo.
4.2.2. VARIANZA Y DESVIACIÓN TIPO
Tanto la varianza como la desviación tipo son medidas que proporcionan información
complementaria a la aportada por la media aritmética. En concreto, explican la
dispersión de los datos, es decir, cuánto se dispersa un conjunto de valores con
respecto a la media μ. Estamos midiendo variabilidad.

Una variabilidad grande indica una baja calidad de los datos. Cuanto
más grande sea la varianza, menor será la calidad de los datos.
Con el fin de calcular la varianza, se puede considerar la suma de las desviaciones de

cada valor en relación con la media aritmética, elevar al cuadrado, y dividir la suma de
los cuadrados por (n-1).
©
En el siguiente cuadro se describen las etapas a seguir para el cálculo de la varianza.
DESCRIPCIÓN NOTACIÓN RESULTADOS NUMÉRICOS
Valores (notas de los alumnos) X 4 5 5 6 6 7 7 8
Media X 6
Desvíos en relación a la media X- X -2 -1 -1 0 0 1 1 2
Desvíos cuadráticos (X − X ) 2 4 1 1 0 0 1 1 4
1. En este caso, la media no es una estimación fiable del conjunto de datos. En un próximo apartado se verá el
tratamiento más adecuado para variables que contengan anomalías o valores discrepantes.

Para evitar el problema de los desvíos negativos2 , se elevarán éstos al cuadrado

( X − X ) 2 . La varianza será definida como la media aritmética de los desvíos
cuadráticos3. Por conveniencia, se calculará esta media, usando como denominador (n-
1) en lugar de n.
Finalmente, la varianza de un conjunto de valores se define por la expresión:
Σ(X - X)2
S2 =
n −1
donde:
s2= varianza de la muestra.
∑ (X − X ) 2 = suma de los desvíos cuadráticos.
n= nº de valores del conjunto de datos.
De esta manera, el conjunto de notas del aula A tiene como varianza:

4 +1+1+ 0 + 0 +1+1+ 4
S2 = = 1,71
8 −1
Debido a que la varianza de un conjunto de valores se calcula en función de sus desvíos

cuadráticos, las unidades de medida están al cuadrado. En este contexto, resulta más
cómodo trabajar con la raíz cuadrada positiva de la varianza. Esta medida se conoce
como desviación tipo, la cual se expresa en la misma unidad de medida de los datos del
análisis.
©
En consecuencia, la desviación tipo de un conjunto de valores se puede calcular:
Σ (X - X )2
S=
n −1
Siguiendo con el ejemplo, la desviación tipo del conjunto de notas del aula A sería:
S= 1,71 = 1,31
2. Las desviaciones se elevan al cuadrado porque, de lo contrario, siempre se obtendría un valor nulo a resultas de la
suma.
3. Muchos autores acostumbran a diferenciar en la fórmula de la varianza cuando los datos se refieren a una población
o a una muestra. Desde este enfoque, cuando los datos representan una población de N elementos, el denominador
es N. Si los datos se refieren a una muestra de n elementos, se recomienda usar como denominador n-1. Nosotros
utilizaremos por simplicidad este segundo caso.

Si comparamos las desviaciones tipo de varios conjuntos de datos, podremos evaluar si

se distribuyen de forma más o menos dispersa. La desviación tipo es siempre positiva y
tanto mayor cuanto más lo sea la dispersión de los valores observados.
X y S 2 son los mejores estimadores para μ y σ2.
La tabla 4.2 muestra la desviación tipo de las notas de cada una de las tres aulas.
NÚMERO DE DESVIACIÓN
AULA MEDIA
ALUMNOS TIPO
A 8 6,00 1,31
B 8 6,00 3,51
C 7 6,00 2,69
Tabla 4.2. Media y desviación tipo respectiva de las notas finales de los alumnos por aulas.

Al analizar la tabla 4.2 se verifica que los alumnos de las tres aulas tienen sus medias
alrededor de 6, pero si analizamos las desviaciones tipo correspondientes, se observa
que las notas de los alumnos del aula A tienen sus notas relativamente próximas las
unas de las otras, mientras que las de los alumnos del aula B se presentan de una forma
más heterogénea. A estas mismas conclusiones se puede llegar si se observa la gráfica
de la figura 4.1.
4.2.3. FÓRMULA ALTERNATIVA PARA EL CÁLCULO DE LA DESVIACIÓN TIPO
Al calcular las desviaciones X - X , en ocasiones en que la media pueda tener un valor ©

fraccionario, se pueden producir errores de redondeo que podrían comprometer el
resultado final. Para evitar este inconveniente, se puede utilizar la siguiente expresión de
cálculo de la desviación tipo y que es matemáticamente equivalente a la vista con
anterioridad:
2
ΣX2 − nX
S=
n -1
donde:
- ∑X2= suma cuadrática de los valores.

- X2 = valor de la media elevada al cuadrado.
- n= número de valores del conjunto de datos.

Ilustraremos el empleo de esta nueva fórmula con el ejemplo de las notas obtenidas por
los alumnos del aula A:.
Valores (notas) X 4 5 5 6 6 7 7 8 ( X =6)

Valores al cuadrado X2 16 25 25 36 36 49 49 64 (∑X2 =300)
donde:
300 - 8.(6)2 300 − 288 12

S= = = = 1,31
7 7 7
Tal y como era de esperar, se llega al mismo resultado obtenido con anterioridad.
Otro aspecto relativo al cálculo de la desviación tipo es el referente a los valores

repetidos. Por ejemplo, para calcular el sumatorio de las notas de los alumnos del aula
A, fijémonos en la siguiente expresión:
∑(X) = 4 + 5 + 5 + 6 + 6+ 7 + 7 + 8,
que es equivalente a
4(1) + 5(2) + 6(2) + 7(2) + 8(1) = ∑(Xƒ)
donde consideramos solamente los valores diferentes de X y ponderamos por sus

respectivas frecuencias f de ocurrencia de dichos valores. Análogamente, podemos
calcular la suma cuadrática de los valores de X por:
∑(X2ƒ)= 42 + 52(2) + 62(2) + 72(2) + 82

©
Con esta nueva notación, la fórmula de medida de la desviación tipo es:
X=
∑Xƒ e S=
∑(X ƒ) − nX
2
n n −1
En la tabla 4.3 se muestra la secuencia de cálculo para la obtención de la desviación

tipo, usando las notas finales de los alumnos del aula A.

NOTA FRECUENCIA
X·f X2·f
(X) (f)
4 1 4 16
5 2 10 50
6 2 12 72
7 2 14 98
8 1 8 64
Total 8 48 300
Tabla 4.3. Cálculos auxiliares para la obtención de X y S.
donde:
48 300 - 8(6)2
X= =6 e S= = 1,31
8 7
En las situaciones en que existan muchos valores repetidos, el procedimiento expuesto

facilita el cálculo de X y S, como también reduce la posibilidad de errores
computacionales.
4.2.4. MODA
La moda (Mo) es el valor que ocurre con mayor frecuencia dentro de un sistema de
observaciones. Es una medida de tendencia central adecuada a escalas nominales,
aunque también se calcula para escalas numéricas.
©
Una distribución puede tener más de una moda, en ese caso se dice que los datos son
bimodales, trimodales, etc.
Una población homogénea es una población estadística que tiene una única moda. Con
el fin de determinar si una población dada es o no homogénea, debe construirse el
histograma de una muestra escogida al azar de la población. En el caso de que haya
más de una moda, se tiene una mezcla de diferentes poblaciones.
Para cualquier prueba estadística que queramos realizar, siempre debemos

cercionarnos de que estamos tratando con poblaciones homogéneas.
En la práctica totalidad de los análisis estadísticos se asume que la población es

homogénea, es decir, su densidad (para variables aleatorias continuas) o la función total
de la probabilidad (para variables aleatorias discretas) es unimodal.

4.3. MEDIDAS BASADAS EN LA ORDENACIÓN DE LOS

DATOS
La media y la desviación tipo son los estadísticos más empleados para evaluar la
posición central y la dispersión de un conjunto de valores. No obstante, estas medidas
están fuertemente influenciadas por las anomalías. Por ejemplo, en las notas del aula C
el valor discrepante 0 (cero) “tira” de la media hacia abajo, tal y como se ilustra en la
figura 4.2.
Figura 4.2: La influencia de una anomalía en el cálculo de la media aritmética.
A pesar de que la media aritmética es 6 (seis), el diagrama de puntos sugiere que el

valor 7 (siete) sería una mejor estimación para representar las notas del aula C, pues
además de ser el valor más frecuente, deja la mitad de las notas por encima y la otra
mitad por debajo.
©
DETECCIÓN DE ANOMALÍAS
Una varianza potencialmente grande es indicativa de la posible presencia de

una anomalía, resultado de errores administrativos o de la propia recogida de
datos. Se debe ser muy cuidadoso y antes de clasificar una anomalía como tal,
debe descubrirse por qué y de qué manera ocurrió tal observación.
Si no existe ninguna duda, la anomalía debe ser quitada y el modelo

reformulado.
El procedimiento para descubrir una anomalía es el siguiente:
1. Calcular la media X y la desviación tipo S de la muestra entera.

2. Fijar los límites: X − k ⋅ S, X + k ⋅ S , donde un valor típico de k es 2,5.
3. Eliminar todos los valores que se encuentren fuera de límites.

4. Volver al paso 1.
5. En la mayor parte de los casos, se necesitará iterar con este mismo
algoritmo hasta que todas las anomalías queden eliminadas.
A continuación se presentarán una serie de estadísticos que se ven menos afectados

por la presencia de anomalías y que, en consecuencia, son más recomendables para
analizar variables que contengan este tipo de valores.
4.3.1. LA MEDIANA
Al igual que la media, la mediana es una medida de tendencia central que se caracteriza
por dividir la distribución por la mitad, dejando el 50% de los valores menores a un lado
y el 50% de los valores mayores al otro lado. Por ejemplo, el conjunto de valores
{2,3,4,5,8} tiene como mediana el valor de 4 (cuatro), pues la cantidad de valores cuya

magnitud es inferior a 4 es la misma que la cantidad de valores cuya magnitud es
superior a 4.
Sin embargo, no todos los conjuntos de datos tienen un valor central tan nítido como el
expuesto en el ejemplo4. En este sentido, se precisa una definición más detallada de la
mediana.
Se define la mediana de un conjunto de valores como aquel valor que ocupa la posición
n +1
2
, considerando los datos ordenados en orden decreciente. Si el valor n +1 es
2
©
fraccionario, se toma como mediana la media de los dos valores cuya posición sea más
próxima a n 2+1 . La mediana se representa por Md.
Algunos ejemplos son:
a) Conjunto de notas del aula C: {0; 6; 7; 7; 7; 7,5 7,5}

n+1
→ Posición = 4 → Md = 7
2
b) m5,3,2,8,4q ⎯⎯⎯⎯⎯→m2,3,4,5,8q, Posición n2+ 1 = 3 → M = 4

Ordenado
d
c) m3,5,6,7,10,11q → Posición → n2+ 1 = 3,5 → M d =

6+7
2
= 6,5
4. En el conjunto de datos {3,5,6,7,10,11}, cualquier valor entre 6 y 7 podría ser usado como mediana.

4.3.1.1. Comparación entre la media y la mediana
En la figura 4.3 se ilustran los valores de la media y de la mediana de un diagrama de

puntos. Nótese que la anomalía 62 “tira” más de la media que no de la mediana.
Figura 4.3: Ilustración de la posición de la media y la mediana en un diagrama de puntos.

La mediana proporciona una mejor medida de localización que la media cuando

existen algunas observaciones extremadamente grandes o extremadamente
pequeñas, es decir, cuando los datos se sesgan a derecha o a izquierda.
La figura 4.4 ilustra la posición de la media y la mediana en distribuciones con

diferentes formas: simétrica y asimétrica. En el primer caso, la media y la mediana
coinciden en la misma posición5. Tal y como se muestra en el segundo caso, si el valor
de la mediana es menor que la media, los datos están sesgados a la derecha (existe un
mayor número de individuos a la derecha de la curva), en caso contrario, los datos
©
estarían sesgados a la izquierda.
5. Se debe aclarar que para variables que supuestamente tengan distribuciones razonablemente simétricas, la media y
la mediana pueden no ser iguales ya que, en general, estamos considerando solamente algunos valores (muestras)
de estas variables. Para variables con distribuciones razonablemente simétricas, la media es la medida de posición
central más adecuada, por usar el máximo de información contenida en los datos. La media se calcula usando
propiamente la magnitud de los valores, mientras que la mediana utiliza solamente la ordenación de los valores.

Figura 4.4: Posiciones de la media y de la mediana en función de la forma (simétrica o asimétrica) de la

distribución.
En general, dado un conjunto de valores, la media es la medida de tendencia central más

adecuada cuando se supone que estos valores tienen una distribución razonablemente
simétrica, mientras que la mediana surge como alternativa para representar la posición

central en distribuciones muy asimétricas. Muchas veces se calculan ambas medidas
para evaluar la posición central bajo dos enfoques diferentes, como para también tener
una primera evaluación sobre la asimetría de la distribución.
4.3.2. LOS CUANTILES Y LOS EXTREMOS
En la práctica, el investigador está interesado en conocer los aspectos relativos al

conjunto de valores, aparte de los estadísticos de tendencia central. En este sentido, se
©
pueden obtener algunas informaciones relevantes a través de un conjunto de medidas
denominados cuantiles: mediana, cuartiles, deciles, centiles o percentiles.
Los cuantiles nos indican los valores de las variables que ocupan determinados lugares
en el conjunto ordenado.
- La mediana, Md, tal y como se ha visto con anterioridad, es aquel valor de la

variable que divide la distribución en dos partes iguales. En consecuencia, sería
un cuantil de orden 2.
- Los cuartiles son aquellos valores de la variable que dividen la distribución en
cuatro partes iguales.
- El primer cuartil o cuartil inferior, QI, es el valor que delimita el 25% de los
valores menores.
- El segundo cuartil o cuartil medio, Q2 o Md, es propiamente la mediana.
- El tercer cuartil o cuartil superior, QS, es el valor que separa el 25% de los
valores mayores.

Figura 4.5: Los cuartiles dividen la distribución en cuatro partes iguales.
- Los deciles son aquellos valores de la variable que dividen la distribución en

diez partes iguales. Los deciles son cuantiles de orden 10. Existen nueve
deciles: D1, D2,..., D9.
- Los centiles o percentiles son aquellos valores de la variable que dividen la
distribución en cien partes iguales. Los centiles son cuantiles de orden 100.
Existen 99 centiles: C1, C2,..., C99.
Se denomina extremo inferior, E1, al menor valor del conjunto de valores. El extremo
superior, ES, estaría constituido por el mayor valor. Por ejemplo, dado el conjunto de
valores {5,3,6,11,7}, tenemos E1=3 y ES=11.
Dado un conjunto de valores ordenados, se puede obtener de forma aproximada el

cuartil inferior, Q1, como la mediana de los valores cuya posición es menor o igual a la
©
posición de la mediana de la distribución. Análogamente, se puede obtener el cuartil

superior, QS, como la mediana de los valores cuya posición es igual o superior a la
posición de la mediana de la distribución6.
Algunos ejemplos sobre lo expuesto se ven a continuación:
a) Datos: 2, 0, 5, 7, 9, 1, 3, 4, 6, 8. Ordenando:
6. Dado un conjunto de valores, no siempre se consigue dividirlos exactamente en cuatro partes iguales. El
procedimiento expuesto ofrece una solución aproximada, muy satisfactoria cuando las cantidades de valores son
grandes y con pocas repeticiones.

b) Datos:
En el ejemplo (b), donde la mediana coincide con un valor del conjunto de datos, por
convención se toma este valor, tanto para la obtención de QI como para la de QS.

©

Resumen
©


©

MODELAMIENTO ESTADÍSTICO DE LAS VARIABLES
Capítulo 5
MODELAMIENTO
ESTADÍSTICO
D E L A S VAR I A B L E S
5.1. INTRODUCCIÓN
Al analizar los datos medidos por una variable cuantitativa continua, veremos que
©
existen dos clases de pruebas estadísticas: las paramétricas y las no paramétricas.
Las pruebas paramétricas exigen una serie de condiciones a los datos a los que se
aplican:
- Que los valores de la variable dependiente sigan una distribución de

probabilidad determinada, por lo menos en la población a la que pertenezca la
muestra en la que se hizo la investigación.
- Que las varianzas de los grupos que se comparan en una variable dependiente
sean aproximadamente iguales (homocedasticidad u homogeneidad de las
varianzas).
Las pruebas paramétricas más conocidas y usadas son: la prueba t-student, la F de

Snedecor y el coeficiente de correlación de Pearson. Éstas se basan en la distribución
de probabilidad normal, y al estimar los parámetros del modelo, se supone que los datos
constituyen una muestra aleatoria de dicha distribución, por lo que la elección del

MODELAMIENTO EST AD ÍST IC O D E L AS VAR IABL ES
estimador y el cálculo de la precisión de la estimación, elementos básicos para construir

intervalos de confianza y contrastar hipótesis, dependen del modelo probabilístico
supuesto.
En el momento en que las condiciones anteriormente expuestas no resulten válidas, o

bien no sea fácil su comprobación por tratarse de muestras pequeñas, se dispone de
dos posibles mecanismos: transformar los datos para que sigan una distribución normal,
o bien se puede recurrir a pruebas estadísticas de libre distribución, es decir, a aquellas
que no se basan en ninguna suposición en referencia a la distribución de probabilidad a
partir de la que fueron obtenidos los datos (pruebas no paramétricas).
Las pruebas no paramétricas más conocidas y usadas son la chi-cuadrado de Pearson, la

prueba de la probabilidad exacta de Fisher y el coeficiente de rangos de Spearman, entre
otras.
En este documento se hará especial énfasis en las familias de distribuciones

paramétricas, ampliamente utilizadas para resumir gran cantidad de datos, obtener
predicciones y determinar la calidad del ajuste, entre otras. De esta manera, la

estadística de negocios nos proveerá de las técnicas necesarias para hacer inferencia
inductiva sobre la población a partir de una muestra y medir el grado de incertidumbre
de tal inferencia (tabla 5.1).
Se trata de variables medibles (altura, peso,...).

Características
Pueden tomar valores enteros o con decimales.
VARIABLES
t- student.
©
CUANTITATIVAS
Tratamientos
Análisis de la varianza (ANOVA).
estadísticos
Correlación/Regresión.
Se trata de variables de cualidad agrupadas en categorías.
Características Los datos que toman son el número de individuos que presentan
VARIABLES dicha cualidad (frecuencia de aparición) y, por tanto, números
CUALITATIVAS enteros.
Tratamientos Contraste de homogeneidad.

estadísticos Contraste de independencia.
Tabla 5.1. Principales técnicas empleadas en la estadística de negocios para realizar inferencias sobre la
población a partir de una muestra.

5.2. LA DISTRIBUCIÓN NORMAL
En el siglo XIX, Adolphe Quételet observó que en muestras suficientemente grandes,

las representaciones gráficas de diferentes variables eran muy semejantes.
En sus estudios comprobó que muchas variables asociadas a fenómenos naturales y

aleatorias seguían el modelo de la normal, es decir, se encontraban distribuidas
uniformemente alrededor de una valor central, promedio o norma. Por ejemplo:
- Caracteres morfológicos aleatorios de individuos (personas, animales,

plantas,...) de una especie de ocurrencia natural: tallas, pesos, envergaduras,
diámetros, perímetros, entre otros;
- Caracteres fisiológicos: efecto de una misma dosis de un fármaco o de una

misma cantidad de abono;
- Caracteres sociológicos: consumo de cierto producto por un mismo grupo de

individuos, puntuaciones de examen;
- Caracteres psicológicos: cociente intelectual, grado de adaptación a un medio,

entre otros;
- Errores cometidos al medir ciertas magnitudes;

- Valores estadísticos muestrales como la media;
- Otras distribuciones como la binomial o la de Poisson son aproximaciones

normales; y,
- En general, cualquier característica que se obtenga como suma de muchos

©
factores.
En este sentido, el Teorema Central del Límite dice que si tenemos un grupo numeroso
de variables independientes (>30) y todas ellas siguen el mismo modelo de distribución
(cualquiera que éste sea), la suma de ellas se distribuye según una distribución normal1.
Este teorema se aplica tanto a suma de variables discretas como de variables continuas.
La distribución normal describe la forma en la que ciertos estimadores

de características de la población varían de una muestra a otra.
Resulta difícil explicar por qué se produce este fenómeno, pero lo cierto es que la curva
de Distribución Normal (denominada también Gaussiana) juega un papel fundamental en
1. Por ejemplo, si lanzamos una moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre
sí), se distribuye según una distribución normal.

el análisis estadístico, ya que además de explicar la distribución de las variables

apuntadas con anterioridad, también sirve para establecer una aproximación a otras
distribuciones mucho menos manejables.
5.2.1. LA FUNCIÓN DE DENSIDAD O LEY NORMAL
La ley normal es un modelo de distribución que responde a la fórmula:
(x- μ )2
1 −
f(x)= ⋅e 2 ⋅ σ2
σ . 2π
donde:
μ= media poblacional.
σ= desviación tipo poblacional.

σ2= varianza poblacional.
Su representación gráfica se ilustra en la figura 5.1.
Figura 5.1: Representación gráfica de la ley normal.
La función normal queda definida por dos parámetros, su media y su desviación tipo. Se
representa mediante la notación N (μ, σ), donde para cada valor de μ y σ se tendrá una
función de densidad distinta, y en consecuencia, una familia de distribuciones normales.
A resultas de la figura 5.1 de pueden observar las siguientes premisas:
- La curva tiene solamente un pico, por consiguiente es unimodal.

- La media de una población distribuida normalmente se encuentra en el centro

de su curva normal (simetría).
- A causa de la simetría de la distribución normal de probabilidad, la mediana y la

moda de la distribución también se hallan en el centro, por tanto, en una curva
normal, la media, la mediana y la moda poseen el mismo valor.
- Las dos colas (extremos) de una distribución normal de probabilidad se

extienden de manera indefinida y nunca tocan el eje horizontal.
- El área total bajo la curva normal será de 1 (normal tipificada), en
consecuencia, se puede considerar que las áreas bajo la curva son
probabilidades.
- El 68% de todos los valores bajo la curva se encuentran dentro de una
desviación estándar con respecto a la media (entre μ-σ y μ+σ), mientras que el
95% se localiza dentro de dos desviaciones estándar (entre μ-2σ y μ+2σ).
5.2.2. LA FUNCIÓN DE DISTRIBUCIÓN

La función de distribución F(x) representa el área contenida bajo la curva de la función

de densidad:
z
x (x- μ )2
1 −
F(x)= ⋅e 2⋅σ 2
dx
σ ⋅ 2π
-∞ < x < ∞
La representación gráfica puede verse en la figura 5.2.

©
Figura 5.2: Función de distribución F(x).

Cuando se conoce la media y la varianza de una ley normal, se está en condiciones de

encontrar probabilidades. En efecto, el área bajo la curva proporciona la probabilidad de
ocurrencia de un evento, tal y como se ilustra en la figura 5.3.
F(x) = P (X ≤ x)

Figura 5.3: El área bajo la curva proporciona la probabilidad de encontrar un valor de la distribución normal
comprendido entre a y b.
5.2.3. DISTRIBUCIÓN NORMAL TIPIFICADA
Cuando la media de la distribución es 0 y la varianza es igual a 1, la distribución se

denomina “normal tipificada”, y su ventaja reside en que existen tablas donde se recoge
la probabilidad (área) para cada punto de la curva de esta distribución.
©
Otra característica importante de la ley normal unitaria o tipificada es que toda el área
comprendida entre ella y el eje horizontal es igual a la unidad.
De esta manera, toda distribución normal se puede transformar en una tipificada

mediante el cambio de variable:
Xi − μ
Zi =
σ
donde:
zi= variable tipificada de x.

xi= variable aleatoria.
μ= media poblacional.
σ= desviación tipo poblacional.

Esto será muy útil a la hora de hacer comparaciones. En este caso, la función de
densidad unitaria quedaría:
Z 2i
1 −
f(z ) = ⋅e 2
2p
Siendo su representación gráfica la mostrada en la figura 5.4.
F (z) = P (Z ≤ z)
Figura 5.4: Representación de la ley normal unitaria.

©
Empleando la función de densidad unitaria, resultaría sencillo realizar el cálculo de áreas

comprendidas entre la curva y el eje horizontal. Sin embargo, tal y como se muestra, el
uso de la fórmula requeriría conocimientos de cálculo integral.
z z2
z
1 −
F(z) = ⋅e 2
dz
0 2π
Por este motivo, aún a costa de cometer un cierto error, se suelen utilizar tablas que
proporcionan directamente estos valores.
Atención a la consulta de las tablas. No todas se presentan en el mismo

formato, las hay que proporcionan el área entre z=0 y un valor de z i, mientras
que otras proporcionan directamente el área de la cola que deja ese valor z i.

En las tablas de la distribución normal que se pueden encontrar en el Apéndice, la

puntuación zeta se busca localizando la cifra de las unidades y el primer decimal en la
columna de la izquierda, y la cifra de las centésimas en la fila superior. La tabla
proporcionará el valor del área comprendida entre z=0 y el valor de zi (sea éste positivo
o negativo). Sin embargo, habitualmente nos interesa el área de una de las colas, que se
suele notar por α/2 (figura 5.5), por lo que:
α/2= 0,5 - (valor del área comprendida entre z=0 y zi). Este valor también
recibe el nombre de p-valor.

Figura 5.5: Representación de la ley normal unitaria con el área de las colas representadas por α/2.
VEAMOS UN EJEMPLO
©
El peso de unas piezas de plomo para automoción se distribuye normalmente.
Si sabemos que el peso medio es de 3,25 kg y la desviación típica es de 0,82
kg, ¿cuál es la probabilidad de que el peso de las piezas sea superior a 4 kg?
Lo que se debe hacer en primer lugar es tipificar la variable aleatoria X, peso de

las piezas de plomo:
xi − μ 4 − 3,25
Zi = = = 0,9146
σ 0,82
Buscando en la tabla para un valor de z=0,91 el valor resultante del área

comprendida entre 0 y dicho valor es de 0,3186. Sin embargo, a nosotros nos
interesa el p-valor, tal y como se indica en la figura 5.6.

Figura 5.6: Tipificación de la variable aleatoria X.
En consecuencia, la probabilidad de que el peso de la pieza sea superior a 4 kg

será:
α/2=p(X>4)=p(z>0,9146)=0,5-0,3186=0,18 (p-valor)
5.2.4. COMPROBACIÓN DE LA NORMALIDAD: PRUEBA DE KOLGOMOROV
En ocasiones resulta útil comprobar si una determinada distribución sigue el modelo de

la ley normal.
©
La prueba de Kolgomorov calcula las diferencias entre las frecuencias relativas

acumuladas (Hi) en cada uno de los intervalos y las que les correspondería en caso de
seguir fielmente la ley normal.
Una vez calculada, se escoge la diferencia mayor y se compara con la que proporciona
la tabla 5.2.

TAMAÑO DE LA TAMAÑO DE LA
MUESTRA VALOR MUESTRA VALOR
N N
1 0,975 14 0,349
2 0,842 13 0,361
3 0,708 14 0,349
4 0,624 15 0,338
5 0,565 16 0,328
6 0,521 17 0,318
7 0,486 18z 0,309
8 0,457 19 0,301
9 0,432 20 0,294
10 0,410 25 0,27
11 0,391 30 0,24

12 0,375 35 0,23
13 0,361 Más de 35 1,36/n0.5
Tabla 5.2. Tabla de referencia para la prueba de Kolgomorov2.
Si la diferencia es superior al valor que proporcione la tabla, se supone que la

distribución no sigue el modelo de la ley normal. En caso contrario, nada se opone a
rechazar esta suposición.
Es importante mencionar que, a resultas de esta prueba, nunca se puede afirmar que ©
una distribución sea normal , sino que la diferencia encontrada no ha sido lo
suficientemente grande para decir que no es normal.
PRUEBA DE KOLGOMOROV
1. Se calculan las columnas:
lsi: límite superior de cada intervalo.

zi: puntuación zeta correspondiente a lsi.
2. La tabla tiene un riesgo del 5% al afirmar que la distribución no es normal.

A ri : área entre l si y el extremo inferior de la curva (frecuencia relativa

acumulada según la tabla de la ley normal unitaria).
Ni: frecuencia acumulada real.
Hi: frecuencia relativa acumulada real.
/A ri- H i /: valor absoluto de las diferencias entre las frecuencias relativas
acumuladas según la tabla de la ley normal y las frecuencias relativas
acumuladas reales de la distribución.
2. Se busca la diferencia mayor en la última columna.
3. Se compara con las tablas:
Dif. máx. < tabla: nada se opone a aceptar la normalidad de la distribución.

Dif. máx. > tabla: la distribución no sigue una ley normal (riesgo del 5%).
Si esta prueba asegura la no normalidad de los datos, existen varias soluciones

posibles:
- Si la distribución es más apuntada que la normal (mayor parte de los valores

agrupados en torno de la media y colas más largas en los extremos), se debe
investigar la presencia de heterogeneidad en los datos y de posibles valores
atípicos o anomalías. La solución puede emplear pruebas no paramétricas.
- Si la distribución es unimodal y asimétrica, la solución más simple y efectiva

suele utilizar una transformación (logaritmo neperiano, raíz cuadrada, arcseno,
entre otras) para convertir los datos en normales3.
©
- Cuando la distribución no es unimodal, hay que investigar la presencia de

heterogeneidad, ya que en estos casos, la utilización de transformaciones no es
adecuada y los métodos no paramétricos pueden también no serlo.
5.3. LA DISTRIBUCIÓN T-STUDENT
Se ha estudiado hasta ahora que puede suponerse que la distribución de muestreo es

normal, ya sea porque lo es de por sí la población o bien porque la muestra es lo
suficientemente grande como para apelar al Teorema Central del Límite (n>30).
3. Para una mayor información, consultar: http://www.seh-lelha.org/noparame.htm.

Sin embargo, cuando la muestra es pequeña (n<30) o la varianza de la población se

desconoce, con el objeto de comparar la media de una muestra con la media hipotética
de una población, se requiere el empleo de la distribución t-student. Lógicamente, para
muestras más grandes puede emplearse la aproximación normal (tabla 5.3).
TAMAÑO DE
POBLACIÓN s CONOCIDA s DESCONOCIDA
MUESTRA
X − μ0
t=
X − μ0 SX
Grande (n ≥ 30) z=
σX o
Con distribución X − μ 0∗∗
normal z=
SX
Pequeña (n < 30) X − μ0 X − μ0

z= t=
σX SX

X − μ0
t=
∗ SX
X − μ0
Grande (n ≥ 30) z=
Sin distribución σX o
normal X − μ0
+
z=
SX
Se realizan por lo general pruebas no

Pequeña (n < 30) paramétricas dirigidas a la mediana.
* Se aplica el teorema central del límite. ©

** z se utiliza como aproximación de t.
+ se aplica el teorema central del límite y z se utiliza como aproximación de t.
Tabla 5.3. Tabla resumen de aplicación del valor z y de t en función del tamaño de muestra y del
conocimiento de la varianza poblacional4.
Imaginemos que se toman todas las muestras posibles de tamaño n inferior a 30 de una
determinada población distribuida según una normal. Con los valores calculados de la
media X y la desviación tipo s, el esquema de la prueba consiste en calcular un
estadístico:
X−μ
t=
S$ X
4. Fuente: http://www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_EstadistInferencial.htm

donde:
S
S$X =
n −1
quedando la distribución t de la forma:
X − μ
t = ⋅ n −1
S
Análogamente a la distribución normal, la t-student tiene forma acampanada y es

perfectamente simétrica respecto a t=0, pero con una dispersión mayor, la cual
aumenta a medida que disminuye el tamaño de la muestra (figura 5.7).
©
Figura 5.7: Comparación entre dos distribuciones t-student y la normal.5
Tal y como se ilustra en la figura, existen diferentes distribuciones t, cada una de ellas
asociada a lo que se ha dado en llamar grados de libertad (ν), que se definen como el
número de observaciones menos uno, es decir, ν= n-1.
La forma de la distribución t-student dependerá del tamaño de la muestra.
Se han señalado en la figura valores críticos de z y t para un coeficiente de confianza de

1-α=0,99, o lo que es lo mismo, con un área de cola o p-valor de α/2= 0,005. Si
5. Fuente: http://www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_EstadistInferencial.htm

acudimos a las tablas de la distribución normal, el valor crítico de z positivo es de 2,58,

es decir, el valor que deja un área de cola del 0,5% a la derecha de la distribución.
Análogamente ocurre en el lado izquierdo de la distribución con el valor de z negativo -
2,58.
En referencia al valor crítico de t con ν=3 grados de libertad, se tiene por las tablas6
(t 0,005 ) que es igual a 5,84 en el lado derecho y -5,84 en el lado izquierdo. En
consecuencia, existe una probabilidad de 0,99 de que la variable t se encuentre en el
intervalo [-5,84, 5,84].
Si escogemos el valor crítico de t con ν=29 grados de libertad, se tiene que un 0,5%
del área bajo la curva está a la derecha de 2,76 o a la izquierda de -2,76. Es decir,
existe una probabilidad de 0,99 de que la variable t se encuentre en el intervalo [-2,76,
2,76].
El valor crítico de t disminuye al crecer los grados de libertad. Si el tamaño de

la muestra aumenta de forma infinita, el valor de t tomaría el de 2,58, que es

igual al valor de z para la curva normal.
5.4. LA DISTRIBUCIÓN CHI-CUADRADO
Al igual que para comparar la media de la muestra con la poblacional, en muestreo

pequeño, se utilizaba una distribución t-student y un estadístico t, ahora se comparará
©
la varianza de una muestra con la varianza hipotética de una población gracias a la
distribución chi-cuadrado (χ2).
La distribución chi-cuadrado tiene una forma que depende del número de grados de
libertad como ocurre en el caso de la t-student. En la figura 5.8 se ilustran varias de
estas curvas.
6. Las tablas de la distribución normal y de las t-student se pueden encontrar en el apéndice.

Figura 5.8: Distribución chi-cuadrado para ν= 2, 5 y 10.
Con el fin de obtener un valor crítico a partir de una tabla7 de χa2 se deberá seleccionar
un nivel de significación y determinar los grados de libertad para el problema bajo
análisis.
Tal y como se verá en los ejemplos, la fórmula general para determinar los grados de
libertad8 en una tabla de contingencia9 es:
ν = (r −1)⋅ (c −1)
donde:
ν= grados de libertad.
©
ρ= filas de la tabla de contingencia.

c= columnas de la tabla de contingencia.
Aparte de la estimación de varianzas, otras aplicaciones de la distribución chi-cuadrado

son, entre otras:
• Para una variable:
- Prueba de calidad o bondad de ajuste para variables aleatorias discretas.
7. Las tablas de probabilidad de c2 pueden cosnsultarse en el Apéndice.

8. Cuando los grados de libertad sean iguales a 1, se debe aplicar la fórmula modificada por la corrección de Yates.
9. Una tabla de contingencia es una es una distribución (una matriz) en filas y columnas en la que los individuos de una
población se clasifican en función de algunas variables.

• Para dos variables:
- Prueba de homogeneidad.
- Prueba de la independencia.
5.4.1. PRUEBA DE CALIDAD O BONDAD DEL AJUSTE PARA VARIABLES ALEATORIAS

DISCRETAS
La distribución χ2 mide cuánto se diferencian las frecuencias observadas o reales de las

frecuencias esperadas o predichas, es decir, si la diferencia es o no significativa.
Las observaciones se obtienen mediante muestreo aleatorio a partir de una población

dividida en categorías.
El estadístico de prueba será:

k 2
χ =
2
Σ (Oi − E i )
con (k - 1) g.l.
i=1 Ei
donde:
O= frecuencia observada.
E= frecuencia esperada.
©
Para una variable, los grados de libertad son el resultado de restar el número de
categorías menos uno.
En este contraste se suele rechazar la hipótesis nula (los valores observados son
coherentes con los esperados) cuando el estadístico es mayor que un determinado valor
crítico.
En la prueba de bondad de ajuste se busca contrastar

la distribución teórica de una variable.
Es importante recalcar que el estadístico de prueba χ2 se podrá aproximar por una chi-
cuadrado cuando el tamaño muestral n sea grande (n>30), y todas las frecuencias
esperadas sean iguales o mayores a 5 (en ocasiones, se deberán agrupar varias
categorías con el fin de cumplir dicho requisito).

EJEMPLO
Se sabe que en un cruce de una misma especie vegetal, se obtienen tres

descendientes de características A, B, y C en una proporción 1:2:1. En una
muestra de 104 especies, se obtuvieron 28 de A, 49 de B y 27 de C. ¿Se
ajustan estos datos a la proporción esperada?
Lo primero es calcular la frecuencia esperada:
A: 104/4= 26
B: 104/2= 52
C: 104/4= 26
A continuación, se construye la siguiente tabla de contingencia:
FRECUENCIA FRECUENCIA
CATEGORÍA (O-e)2/e
ESPERADA (E) OBSERVADA (O)
A 26 28 0,1538
B 52 49 0,1731
C 26 27 0,0385
En consecuencia:
χ2 = 0,365 con 2 grados de libertad.

©
Si se hacen uso de las tablas de probabilidades de χ2 se determina el valor

crítico al nivel de significancia deseado. En este caso, para ν = 2 grados de
libertad y un nivel de significancia, se obtiene: χ2= 5,991.
Dado que 0,365 < 5,991 se acepta la hipótesis planteada y se concluye que
los datos corresponden a una proporción de 1:2:1.
5.4.2. PRUEBA DE HOMOGENEIDAD
En este caso se determinará si los datos correspondientes a dos o más muestras

aleatorias provienen de una misma población.

Las observaciones se obtienen mediante muestreo aleatorio a partir de una población

dividida en categorías.
Se empleará el estadístico:
k 2
χ =Σ
2 (Oi − Ei )
con (r - 1) ⋅ (c - 1) g.l.
i=1 Ei
donde:
O= frecuencia observada.
E= frecuencia esperada bajo homogeneidad.
r= nº de filas de la matriz de contingencia.

c= nº de columnas de la matriz de contingencia.

En este contraste se suele rechazar la hipótesis nula (los valores observados son
coherentes con los esperados) cuando el estadístico es mayor que un determinado valor
crítico.
Es importante recalcar que el estadístico de prueba χ2 se podrá aproximar por una chi-
cuadrado cuando el tamaño muestral n sea grande (n>30), y todas las frecuencias
esperadas sean iguales o mayores a 5 (en ocasiones, se deberán agrupar varias
categorías con el fin de cumplir dicho requisito).
©
EJEMPLO
Se quiere estudiar la fiabilidad de una válvula neumática en relación al

distribuidor que nos la suministra. En este sentido, se toma una muestra de
100 válvulas de cada uno de los tres distribuidores y se comprueba el número
de elementos defectuosos para cada uno.
Se pretende realizar un estudio de homogeneidad para concluir si entre los

distribuidores existen diferencias de fiabilidad referente a la misma válvula.
Los resultados se muestran en la siguiente tabla:

VÁLVULAS VÁLVULAS
TOTAL
DEFECTUOSAS CORRECTAS
Distribuidor 1 16 94 100
Total 49 251 300
En la tabla de contingencia siguiente se proporcionan (entre paréntesis) las

frecuencias esperadas bajo homogeneidad. En el análisis de una relación entre
2 variables, resulta más conveniente plantearse la hipótesis de que ambas son
independientes. Para hallar los valores esperados, se emplea la teoría de
probabilidades que establece: si dos acontecimientos son independientes, la
probabilidad de que ambos ocurran simultáneamente es el producto de sus
probabilidades individuales de ocurrir.
La probabilidad de que una válvula sea defectuosa y, a la vez, del distribuidor 1

será:
(49/300)*(100/300)= 0,0544
Multiplicando por el número total de válvulas, obtenemos la frecuencia

esperada para ese caso:
0,054·300= 16,33
Análogamente se haría para las demás.

©
VÁLVULAS VÁLVULAS
TOTAL
DEFECTUOSAS CORRECTAS
Distribuidor 1 16 (16,33) 94 (83,66) 100
Distribuidor 2 24 (16,33) 76 (83,66) 100
Distribuidor 3 9 (16,33) 81 (83,66) 100
Total 49 251 300
Sustituyendo, el estadístico del contraste será:
(16 − 16,33)2 (24 − 16,33)2 (9 − 16,33)2 (94 − 83,66)2 (76 − 83,66)2 (81− 83,66)2
χ2 = + + + + + = 8,96
16,33 16,33 16,33 83,66 83,66 83,66

Siendo el valor del estadístico por tablas: χ2 0,05 (2)= 5,99 ν = (3-1)·(2-1)=2
g.l.
Dado que 8,96 > 5,99 se concluye que no existe homogeneidad y, por tanto,
existen diferencias entre los tres distribuidores.
5.4.3. PRUEBA DE LA INDEPENDENCIA
En este caso se trata de probar si dos variables tienen algún grado de relación o son
completamente independientes. Es decir, estamos interesados en ver la relación
existente entre dos variables de una misma población.
EJEMPLO

Una muestra de 100 hortalizas se tratan con pesticida, mientras que a otra
muestra de 200 hortalizas del mismo invernadero no se les aplica ningún tipo
de tratamiento. Después de cierto tiempo, se examinan las muestras en
búsqueda de enfermedad.
Los resultados son los siguientes:
TRATAMIENTO SANOS ENFERMOS TOTAL
©
Tratado 88 12 100
No tratado 143 57 200
Total 231 69 300
Se quiere someter a hipótesis si existe relación entre el tratamiento con

pesticidad y la incidencia de la enfermedad.
Suponiendo que ambas variables sean independientes, al igual que ocurría en el

ejemplo de la prueba de homogeneidad, se tendrá una proporción esperada de
(entre paréntesis):
TRATAMIENTO SANOS ENFERMOS TOTAL
Tratado 88 (77) 12 (23) 100
No tratado 143 (154) 57 (46) 200
Total 231 69 300

En la tabla de contingencia 2x2 se observa como característica especial que la

diferencia entre lo observado y lo esperado es idéntica a excepción del signo.
Los grados de libertad son:
ν = (2-1)·(2-1)=1 g.
En consecuencia, debe aplicarse la corrección de Yates:

k 2
χ =Σ
2 (Oi − Ei − 0,5)
con (r - 1) ⋅ (c - 1) g.l.
i=1 Ei
10,52 11,52 11,52 10,52

c2 = + + + = 10,43
77 23 154 46
Siendo el valor del estadístico por tablas:

χ20,05 (1)= 3,841 ν = (2-1)·(2-1)=1 g.l
Dado que 10,43 > 3,841 al nivel de significación de 0,05, se rechaza la

hipótesis de independencia y asumir que existe relación entre el pesticida y la

incidencia de la enfermedad.
5.5. DISTRIBUCIÓN MUESTRAL DE MEDIAS

©
A partir de una población, podemos extraer diferentes muestras de tamaño n con sus
respectivas medias. Si cada una de estas medias se considera como una variable
aleatoria, se puede estudiar su distribución a la que se denominará distribución muestral
de medias.
- Si se tiene una población normal N(μ,σ) y se extraen de ella muestras de

tamaño n, la distribución de medias sigue también una distribución normal:
F σ I
N μ,GH n
JK
- Si la población no sigue una distribución normal, pero n>30, se aplica el
denominado Teorema central del límite, por el cual se asume que en estas
condiciones la distribución muestral de medias se aproxima igualmente a una
normal.

EJEMPLO
Las notas de cierto examen se distribuyen según una normal de media 5,8 y
desviación tipo 2,4. Hallar la probabilidad de que la media de una muestra
tomada al azar de 16 estudiantes se encuentre comprendida entre 5 y 7.
La población se distribuye según N(5,8;2,4). Si n=16, la distribución muestral

se distribuye según N(5,8;0,6). Nos interesa encontrar el área comprendida
entre 5 y 7 de esta distribución, pero como sólo conocemos las distribuciones
N(0,1) hay que hacer un cambio de variable:
x1 − μ 5 − 5,8
z1 = = = − 1,33
σ 0,6
x2 − μ 7 − 5,8
z2 = = =2
σ 0,6
En consecuencia, y acudiendo a las tablas de la distribución normal:

P(5 ≤ x ≤ 7)=P(-1,33 ≤ z ≤ 2)=0,8854
5.6. DISTRIBUCIÓN MUESTRAL DE PROPORCIONES
Lo más habitual es que se plantee estimar una proporción o porcentaje. En este caso, la ©
variable aleatoria toma únicamente dos valores diferentes (éxito o fracaso), es decir,
sigue una distribución binomial B (n,p), la cual se aproxima a la normal N(np,(npq)0,5)
cuando la extensión de la población es grande.
Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una

distribución normal:
F pq I
GH
N p,
n JK

donde:
p= proporción de uno de los valores que presenta la variable estadística en la

población.
q=1-p.
EJEMPLO
Una máquina fabrica piezas de precisión y en su producción habitual tiene un

3% de piezas defectuosas. Se empaquetan en cajas de 200, ¿cuál es la
probabilidad de encontrar entre 5 y 7 piezas defectuosas en una caja?
Al ser n> 30, la distribución muestral sigue una ley normal N(0,03; 0,01).
Sabiendo que p’=5/200= 0,025 y que p”=7/200= 0,035
Haciendo el cambio de variable:

p ′− μ 0,025 − 0,03
z1 = = = − 0,5
σ 0,01
p′ ′−μ 0,035 − 0,03

z2 = = = 0,5
σ 0,01
En consecuencia, y acudiendo a las tablas de la distribución normal:
P(5 ≤ x ≤ 7) = P(-0,5 ≤ x ≤ 0,5) = 0,383

©
5.7. FUNCIÓN DE PROBABILIDAD BINOMIAL
Una de las situaciones más importantes para el profesional es cuando la decisión bajo
incertidumbre implica solamente dos resultados aleatorios posibles. En efecto,
supongamos que un experimento aleatorio tiene las siguientes características:
- En cada prueba del experimento sólo son posibles dos resultados mutuamente
excluyentes: el suceso A (éxito) y su contrario⎯A (fracaso).

- El resultado obtenido en cada prueba es independiente de los resultados

obtenidos anteriormente.
- La probabilidad del suceso A es constante, y se representa por p, y no varía de

una prueba a otra. La probabilidad de⎯A es 1- p y se representa por q.
- El experimento consta de un número n de pruebas.
Todo experimento que tenga estas características diremos que sigue el modelo de la
Distribución Binomial. A la variable X que expresa el número de éxitos obtenidos en
cada prueba del experimento, la llamaremos variable aleatoria binomial.
La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1,
2, 3, 4,..., n suponiendo que se han realizado n pruebas10. Como hay que considerar
todas las maneras posibles de obtener k-éxitos y (n-k) fracasos, debemos calcular éstas
por combinaciones (número combinatorio n sobre k).
La distribución Binomial se suele representar por B(n,p) siendo n y p los parámetros de

dicha distribución.

La probabilidad de obtener k-éxitos vendrá dada por la función de probabilidad de la
variable aleatoria binomial:
p(X = k) =
FG nIJ ⋅ p k
⋅ qn-k =
n!
⋅ p k ⋅ qn-k
HkK k!(n - k)!
donde:
©
k= nº de éxitos 0 ≤ k ≤ n
n= nº de pruebas.
p= probabilidad de éxito 0 ≤ p ≤ 1
q= 1-p, y es la probabilidad de fracaso.
Existen tablas que proporcionan el cálculo de las probabilidades para algunos valores de
n y p.
10. Si n=1 la función de probabilidad de la distribución binomial se denomina función de distribución de Bernouilli.

EJEMPLO
Una empresa recibe un envío grande de piezas de las cuales se revisan 10 para
saber su calidad. El fabricante establece que un máximo del 5% de las piezas
podrán salir defectuosas. ¿Cuál es la probabilidad de que la muestra incluya
una pieza defectuosa?
Se tiene:
p(X =k)=
FG10IJ ⋅ 0,05 ⋅ 0,95
1 9
= 0,32
H 1K
Es decir, la probabilidad de que la muestra incluya una pieza defectuosa es del
32%.
5.7.1. APROXIMACIÓN NORMAL PARA BINOMIAL
Dado que las tablas binomiales son limitadas, puede ocurrir que “n” esté más allá de los
valores proporcionados por aquéllas. En esta situación, es necesario utilizar la
distribución normal estándar para el cálculo de las probabilidades binomiales.
Resulta necesario saber que los parámetros de la distribución binomial son:

©
μ= n·p
σ2= n·p·q
σ= (n.p.q)0.5
La aproximación normal para la distribución binomial se utiliza

habitualmente en procesos de control de calidad, censos,
confiabilidad, entre otras.
En el siguiente ejemplo se comparará el resultado de aplicar la ley de la distribución

binomial con el obtenido por la ley normal, para ver el grado de aproximación entre
ambos.

Una muestra de 20 artículos se toma aleatoriamente de un proceso de fabricación con

una probabilidad de artículos defectuosos p=0,40. ¿Cuál es la probabilidad de obtener
exactamente 5 artículos defectuosos?
• Si aplicamos la ley de la distribución binomial, se tiene:
p(X = k) =
FG 20IJ ⋅ 0,40 5
⋅ 0,615 = 0,075
H 5K
Es decir, la probabilidad de obtener exactamente 5 artículos defectuosos es del 7,5%.
• Si aplicamos la ley normal, se tiene:
μ= n·p= 20·0,4=8
σ2= n·p·q= 20·0,4·0,6=4,8; por lo que σ=2,19
Hemos de tener en cuenta que la binomial es discreta, mientras que la normal es

continua, por tanto, debe introducirse una corrección de continuidad en el cálculo de
0,5 agregado o restado de la variable x:
Tipificando:
(xi − 0,5) − μ 4,5 − 8

z1 = = = −1,60
σ 2,19
xi + 0,5) − μ 5,5 − 8
z2 = = = −1,14
©
σ 2,19
Consultando las tablas de la ley normal, se tiene que entre el 0 y z1 el área es de

0,4452 mientras que z2 deja un área de 0,3729 a su izquierda. La probabilidad que nos
interesa será la diferencia entre ambas áreas:
P(5 de 20)= 0,4452 - 0,3729= 7,2%.

Resumen
©


©

ESTADÍSTICA INFERENCIAL
Capítulo 6
ESTADÍSTICA
INFERENCIAL
6.1. INTRODUCCIÓN
La estadística inferencial o deductiva realiza inferencias o saca conclusiones sobre las

poblaciones a través de muestras que han sido extraídas de ellas, mientras que la
estadíst ica descript iva describe las características de una serie de dat os
©
correspondientes a una población o muestra.
Las pruebas de significancia estadística nos permitirán conocer, por ejemplo, si las
diferencias encontradas entre dos muestras son reales, es decir, están también
presentes en la población o bien podrían ser el resultado de un error de la muestra
aleatoria. Naturalmente, todo ello bajo una cierta incertidumbre probabilística.
La base de la inferencia estadística es el razonamiento inductivo, es decir, el

conocimiento del todo a partir de una parte y se basa principalmente en la prueba de
hipótesis en una población determinada.
Las inferencias en estadística son de dos clases:
- La valoración o estimación. Se determina un valor desconocido de alguna

característica de la población, bajo posibilidad de error debido al muestreo. En
este caso, el cálculo del error estándar dará idea de la exactitud de la
estimación.

- El contraste o prueba de hipótesis. Se define una hipótesis como un sistema de

valores posibles para la población y una alternativa, para valores diferentes.
6.2. LA VALORACIÓN O ESTIMACIÓN
6.2.1. DEFINICIÓN
Se define como estimador una estadística de muestra utilizada para obtener información
sobre un parámetro de la población. Por ejemplo, la media muestral X es un estimador
de la media poblacional μ.
El resultado de un estimador se puede expresar referido a un punto o a un rango de

valores (intervalo de confianza). En el primer caso, siempre deberá calcularse el margen
de error asociado a la estimación de ese punto.

6.2.2. CUALIDADES DE UN BUEN ESTIMADOR
Las cualidades que debe reunir un buen estimador son las siguientes:
- Imparcialidad. Se refiere al hecho de que el estadístico de muestra es un

estimador no sesgado del mismo parámetro relacionado de la población. Una
estimación es imparcial en referencia a un parámetro cuando el valor esperado
del estimador puede ser expresado como igual al parámetro que ha sido
©
estimado.
- Eficiencia. La estimación más eficiente es aquella que tiene el error o desviación
estándar más pequeño de entre todos los estimadores imparciales. Por ejemplo,
supongamos que ante una muestra tenemos que decidir si utilizamos o no la
media de la muestra para estimar la media de la población. Si calculamos el
error estándar de la media observamos que es igual a 1,05; si calculamos el
error estándar de la mediana, vemos que es igual a 1,6. En este caso, diríamos
que la media de la muestra es un estimador más eficiente de la media de la
población que la mediana, ya que su error estándar es menor (con menos
variación).
- Coherencia. Un estimador es coherente si al aumentar el tamaño de la muestra,
se produce una estimación con un error estándar más pequeño. Un estimador
coherente se vuelve más confiable si se tiene tamaños de muestra más
grandes.
- Suficiencia. Un estimador suficiente “extrae” una cantidad de información de la
muestra que no la aporta cualquier otro estadístico sobre el parámetro de la
población que se está estimando.

6.2.3. ALEATORIEDAD DE LA MUESTRA
La condición de aleatoriedad de la muestra es fundamental para asegurarse que es

verdaderamente representativa de la población. Con este fin, se realiza la denominada
“Prueba de Corridas”1 (Wald-Wolfowitz). Dicha prueba está diseñada para probar la
aleatoriedad de una muestra con una confianza de 100 (1-α)%.
Por ejemplo, imaginemos una cadena de producción de fichas blancas (B) y verdes (V).
Se considera la siguiente secuencia de producción: BBBVVBVBVBBB. El número de
corridas será R=7, n1= 8 (nº de fichas blancas) y n2= 4 (nº de fichas verdes).
El procedimiento es el siguiente:
1. Calcular la media de la muestra.
2. Pasando por la secuencia de la muestra, sustituir cualquier observación con +

ó - dependiendo si está por debajo o por arriba de la media. Debe eliminarse
cualquier comportamiento cíclico que se observe.
3. Calcular R, n1, y n2.

4. Calcular la media y la varianza esperada de R, según:
2 ⋅ n1 ⋅ n2
μR = +1
n1 + n2
2 ⋅ n1 ⋅ n2 ⋅ (2 ⋅ n1 ⋅ n2 − n1 − n2)
σR =
(n1 + n2)2 ⋅ (n1 + n2 −1)
©
5. Calcular:
R − μR
z =
σR
6. Conclusiones.
En los siguientes casos, la muestra no será aleatoria:
Si z> Zα, el comportamiento es cíclico y con estacionalidad.

Si z< -Zα, existe una pendiente o tendencia que indica que la muestra no es
aleatoria.
Si z<-Zα/2 ó z>Zα/2 se rechaza la aleatoriedad.
1. Una corrida es una sub-secuencia máxima de elementos semejantes.

6.2.4. ESTIMACIÓN DEL TAMAÑO DE LA MUESTRA
La determinación del tamaño de la muestra es una cuestión primordial, ya que una

buena elección permitirá ahorrar recursos en el caso de que tomásemos muestras más
grandes de lo necesario, o bien evitaremos sacar conclusiones poco fiables debido a su
precariedad.
Cuanto mayor sea la muestra, más alta será la confianza asociada. No obstante,
muestras más grandes también requieren un mayor esfuerzo en tiempo y recursos.
El objetivo es encontrar el tamaño de muestra más pequeño

que proporcione la confianza deseable.
Así pues, el tamaño de la muestra depende del nivel de confianza que se desee para los
resultados y de la amplitud del intervalo de confianza, es decir, del error máximo que se
esté dispuesto a admitir, tal y como se verá a continuación.

Una vez fijados el máximo error admisible E y el nivel de confianza (1-α), se puede
calcular el tamaño mínimo de la muestra que se empleará:
FG
n = zα /2 ⋅
σIJ 2
H EK
Si se estiman proporciones:
©
E = zα / 2 ⋅
p⋅q z
⇒ n = α /2
FG IJ 2
⋅p ⋅q
n E H K
EJEMPLO
La desviación típica de la altura de los habitantes de un país es de 8 cm.

Calcular el tamaño mínimo que debe tener una muestra de habitantes de dicho
país para que el error cometido al estimar la altura media sea inferior a 1 cm
con un nivel de confianza del 90%.
Para 1-α= 0,90, se tiene que α/2= 0,05

Consultando las tablas de distribución normal: zα /2 = 1,645 y si E=1,

sustituyendo:
F
n = Gz
σ I F
2
8I
⋅ J = G1,645 ⋅ J
2
= 173
H α /2
EK H 1K
6.2.5. TIPOS DE ESTIMACIÓN
Dentro de las estimaciones concernientes a una población, se pueden hacer

estimaciones puntuales y estimaciones por intervalo.
6.2.5.1. Estimaciones puntuales

Se trata de un número que se emplea para estimar un parámetro de la población

desconocido. Por ejemplo, un encuestador estaría haciendo una estimación puntual si
afirmara: “aquella mujer debe tener unos treinta años” o “en este bloque de pisos deben
vivir unos sesenta vecinos”.
El inconveniente de este tipo de estimaciones es que proporcionan poca información,

por ejemplo, si la mujer a la que se refería el encuestador tenía en realidad treinta dos
años, podríamos aceptar los treinta como una buena estimación, pero si la edad
verdadera era de cuarenta, podríamos rechazar la estimación por poco confiable. En
©
definitiva, una estimación puntual es mucho más útil si va acompañada por una
estimación del error implicado.
6.2.5.2. Estimación por intervalo
Si el encuestador se refiere a la mujer como “debe tener entre 30 y 35 años de edad”,

tiene una mejor confiabilidad de su estimación que la puntual y es muy probable que la
verdadera edad caiga dentro de este intervalo, pero también puede estar equivocado.
En la estimación por intervalo se calculan dos valores entre los que se encontrará el
parámetro, con un nivel de confianza fijado de antemano. De esta manera, se obtiene
un intervalo de confianza.

El nivel de confianza es la “probabilidad” de que el intervalo calculado contenga el

verdadero valor del parámetro. Se indica por (1-α) y normalmente se expresa en
porcentaje (1-α)·100%.
Si se repitiese el proceso con muchas muestras, se podría afirmar que el (1-

α) % de los intervalos construidos contendría el verdadero valor del
parámetro, y a lo máximo e l α% no.
6.2.5.2.1. Estimación por intervalos de confianza para la media
Por ejemplo, imaginemos que desconocemos la media poblacional de una cierta variable
que se desea estudiar. Se trata de sacar una muestra y obtener un intervalo (L1, L2) de
tal manera que se tenga una probabilidad (1-α)% de que la media poblacional esté en
ese intervalo.
El nivel de confianza del intervalo se fija de antemano. Se suele trabajar con 95%, 90%

e incluso 99%, o lo que es lo mismo, con probabilidades 0,05; 0,1 ó 0,01.
Si se cumple una de las siguientes hipótesis:
- El tamaño de la muestra es superior a 30 y la variable sigue un modelo normal.
- El tamaño de la muestra es mayor de 100.
El intervalo de confianza para la media poblacional viene dado por:
©
LM x − z ⋅ s
,x + z ⋅
s OP
N n n Q
donde:
z= valor que en la distribución N(0,1) deja a su derecha un área α/2.

X = media de la muestra.
s= desviación típica.

6.2.5.2.2. Estimación por intervalos de confianza para la proporción de la

población
Supongamos ahora el caso que queramos encontrar un intervalo (L1,L2), de forma que
tengamos una probabilidad alta (1-α)% de que una proporción de elementos p
desconocida en la población y pertenecientes a una categoría C se encuentren en dicho
intervalo.
En ese caso, si se cumple una de las siguientes hipótesis:
^
n⋅p > 5
FG IJ ^
H K
n ⋅ 1− p > 5
Se obtienen los siguientes intervalos según el tamaño de la muestra:
30<n ≤ 100
LM p −
^
z
1 ^
,p+ z
1 OP
N 4n 4n Q
n>100
LM
^
^
p(1 − p) ^
^ ^
p(1 − p)
^ OP
MMp − z n
, p+ z
n PP
N Q
donde:
©
^ n ° de element os de la muestra que pertenecen a C

p =
tamaño de la m uestra
z= valor que en la distribución N(0,1) deja a su derecha un área α/2.

EJEMPLO
La empresa de perfumes Colonias S.A. desea realizar un estudio de mercado

sobre uno de sus productos destinado a la mujer. Para ello, contrata a una
empresa de investigación que realiza un muestreo sobre 200 mujeres en una
extensa comunidad. Dicha empresa constata que una proporción muestral de
0,40 prefiere el perfume fabricado por Colonias S.A sobre todas las demás
marcas. ¿Qué conclusiones se pueden sacar para toda la comunidad si se
quiere un intervalo de confianza del 95%?

Lo primero que se debe hacer es ver si cumple alguna de las hipótesis:

^
n ⋅ p > 5 en nuestro caso 200 * 0,4 = 80 > 5
^
p = 0,4
n = 200
Para encontrar el valor de z, hemos de hallar el valor que en la distribución

N(0,1) deja a su derecha un área de α/2. Sabemos que el intervalo de confianza
es del 95%, por tanto, el valor del área de ambas colas será de α=0,05, lo que
implica α/2= 0,025.
Dado que las tablas con las que estamos trabajando nos proporcionan el valor
del área entre el 0 y zi, hacemos:
0,5-0,025=0,475
Este es el valor del área comprendida entre el 0 y zi. Para hallar zi buscamos en
las tablas dicho valor, y encontramos una zi= 1,96.

Como la muestra es superior a 100, se tiene:
LM0,40 − 1,96 0,4 ⋅ 0,6; 0,4 + 1,96 0,4 ⋅ 0,6 OP = 0,36; 0,46
N 200 200 Q
En consecuencia, con una confianza del 95%, se puede decir que la proporción
de todas las mujeres de la comunidad que usan el perfume de Colonias S.A es
de un 36% a un 46%.
6.3. CONTRASTE O PRUEBA DE HIPÓTESIS
6.3.1. INTRODUCCIÓN
En estadística, una afirmación respecto a alguna característica de la población se

denomina hipótesis.
Cuando contrastamos una hipótesis, estamos comparando las predicciones con la

realidad observada. Si dentro del margen de error que se puede admitir, existe
coincidencia, se aceptará la hipótesis y, en caso contrario, se rechazará.
92 ESTADÍSTICA P ARA LA TOMA DE DECISIONES

Por ejemplo, tal y como se ha mencionado con anterioridad, una media muestral diferirá
en valor de la media poblacional. Si el valor observado del estadístico se acerca al valor
del parámetro poblacional y solamente difiere en una cantidad que cabría esperar del
muestreo aleatorio, el valor hipotético no se rechaza. Si por el contrario, la estadística
muestral difiere en un monto que no es posible atribuir al azar, la hipótesis se rechaza
por no verosímil.
La hipótesis emitida se designa por Ho y se denomina Hipótesis nula, ya que parte del
supuesto que las diferencias entre el valor verdadero del parámetro y el estimado son
debidas al azar, por tanto, no existe diferencia. Este sería el caso, por ejemplo, de
decidir si un procedimiento es mejor que otro. En esta situación, se formularía la
hipótesis nula de que no hay diferencia entre ellos (es decir, cualquier diferencia
observada se debería simplemente a fluctuaciones en el muestreo de la misma
población).
La hipótesis nula es aquella que nos dice que no existen

diferencias significativas entre los grupos.
La hipótesis contraria se designa por H1 y se denomina Hipótesis alternativa.
El contraste de hipótesis puede realizarse de manera unilateral (en términos de mayor o

menor) o bien de forma bilateral (en términos de igual y distinto). En el primer caso,
consideraríamos una sola cola, mientras que el contraste bilateral abarcaría ambas:
• Si la hipótesis alternativa está en la forma “mayor que”, z es el valor que deja un p-

©
valor α en la cola derecha de la distribución.
• Si la hipótesis alternativa está en la forma “menor que”, z es el valor que deja un p-

valor α en la cola izquierda de la distribución.
• Si la hipótesis alternativa está en la forma “no igual a”, entonces existen dos
valores de z, uno positivo y otro negativo. El z positivo es el valor que deja un p-
valor de α/2 a la derecha de la distribución, mientras que el z negativo deja un p-
valor de α/2 a la izquierda de la distribución.
El objetivo es sacar conclusiones sobre el valor de un parámetro desconocido

de la población, a partir de una muestra aleatoria y significativa, que permita
aceptar o no una hipótesis previamente emitida.

6.3.2. PASOS A SEGUIR PARA LA PRUEBA DE HIPÓTESIS
Los pasos a seguir para la prueba de hipótesis son:
1. Enunciar la hipótesis. Aquí debe formularse la hipótesis nula y la hipótesis

alternativa.
2. Elegir un nivel de significación α y construir la zona de aceptación. El nivel de

significación es el estadístico que se especifica para rechazar la hipótesis nula.
Los niveles de significación de uso más frecuente son los de 5% y 1%. Por
ejemplo, un nivel de significación del 5% quiere decir que existe una
probabilidad de 0,05 de rechazar la hipótesis nula, aun siendo efectivamente
cierta.
La zona de aceptación es el intervalo fuera del cual solamente se encuentran el

α100% de los casos más raros.
3. Seleccionar el estadístico de prueba. Puede ser un estadístico muestral o una
versión estándar. Por ejemplo, el valor de la media muestral puede convertirse
en un valor z si la distribución de muestreo de la media es normal.

4. Establecer el valor o valores críticos del estadístico de prueba. Si la prueba es
unilateral, se tendrá un valor crítico, mientras que si es bilateral, el número de
valores críticos será de dos.
5. Determinar el valor del estadístico de prueba. Se recolecta una muestra
aleatoria y se determina el valor de la media muestral o un valor z estándar, por
ejemplo.
6. Toma de decisión. Si el valor calculado en la muestra cae dentro de la zona de
decisión, se acepta la hipótesis, en caso contrario, se rechaza.
©
6.3.3. ERRORES EN EL CONTRASTE DE HIPÓTESIS
El contraste de hipótesis no afirma categóricamente la verdad de la hipótesis, sino que

es un criterio para decidir si ésta se acepta o rechaza o si las diferencias entre las
muestras observadas y los resultados esperados son significativas.
De aquí que si rechazamos una hipótesis cuando debiera ser aceptada, se está
cometiendo un error de tipo I, mientras que si se acepta cuando en realidad debería ser
rechazada, se está cometiendo un error de tipo II (tabla 6.1).
La probabilidad de cometer un error de tipo I es el nivel de significación α, mientras que

la probabilidad de cometer un error de tipo II dependerá del verdadero valor de μ y del
tamaño de la muestra.

H0 VERDADERA H0 FALSA
Decisión incorrecta
Mantener H0 Decisión correcta
Error de tipo II
Decisión incorrecta
Rechazar H0 Decisión correcta
Error de tipo I
Tabla 6.1. Errores en el contraste de hipótesis.
6.3.4. CONTRASTE DE HIPÓTESIS PARA LA MEDIA
La distribución normal de probabilidad puede emplearse para probar un valor hipotético

de la media de la población si se cumple una de las siguientes hipótesis:
n >30 y la variable sigue un modelo normal.

n >100.
6.3.4.1. Contraste bilateral
H 0: μ = μ 0
H1: μ ≠ μ 0
donde μo es un valor conocido.

©
6.3.4.1.1. Caso 1: se conoce la desviación estándar σ de la población
Si se supone que la distribución en el muestreo de la media sigue la ley normal, el valor

de z se encontraría:
x − μ0
Z=
σ
n
En función del nivel de significación establecido, se podría encontrar el valor crítico de

z. En efecto, si se escoge un nivel de significación del 5%, se tiene que en cada cola se
tendrá un área o p-valor de 0,025, ya que se están considerando ambas colas al ser el
contrate bilateral. En consecuencia, el área entre la media hipotética y el valor crítico
sería de 0,5-0,025=0,475.

Acudiendo a las tablas, se observa que los valores críticos que dividen las regiones de
rechazo y no rechazo son +1,96 y -1,96.

Figura 6.1: Valores críticos y áreas de rechazo y no rechazo de la Hipótesis nula.
En consecuencia, la regla para la decisión sería:
si Z> 1,96: se rechaza la hipótesis nula; o bien,

si Z< 1,96: no se rechazaría la hipótesis nula.
©
EJEMPLO
En una empresa de fabricación de roscas se sabe que la desviación tipo en un

determinado modelo es de 2,4. Para una muestra de 36 roscas de este modelo
se obtiene un diámetro medio de 5,6 mm. ¿Se puede confirmar la hipótesis de
que el diámetro medio de las roscas es 6 con un nivel de significación 0,05?
Se cumple n>30, por lo que se puede emplear la distribución normal para

probar el valor hipotético.
Se trata de un contraste bilateral, ya que nos interesa una posible desviación en

cualquier dirección respecto del valor hipotético de la media.
H 0: μ = 6
H1: μ ≠ 6

Si Ho es cierta, las medias muestrales se distribuyen según N(6; 0,4).

Para α= 0,05 se tiene que α/2= 0,025 y por tablas Ζα/2= 1,96.
Sustituyendo, se tiene:
X − μ0
Z= = ±1
σ
n
Dado que:
/Z/<1,96 en cada una de las colas, no se rechaza la hipótesis nula y se

admite que el diámetro medio de las roscas es 6 mm con una probabilidad
de error del 5%.
Otra manera de hacerlo sería elaborando un intervalo de confianza (zona de

aceptación) para la media de la población en base a los resultados muestrales,
tras lo cual se observaría si el valor hipotético de la media poblacional está
incluido en el intervalo de confianza. Si dicho valor está incluido en el intervalo,
la hipótesis nula no puede ser rechazada (figura 6.2).

©
Figura 6.2: Representación de la zona de aceptación de la Ho para un contraste de hipótesis bilateral.
Dicho intervalo vendrá dado por la ecuación:
LMμ − Zα /2 ⋅
σ
, μ 0 + Zα /2 ⋅
σOP
N 0
n nQ
Sustituyendo, nos daría el intervalo de confianza:
6 − 1,96 ⋅ 0,4 ; 6 + 1,96 ⋅ 0,4 = 5,22 ; 6,78

Dado que 5,6 se encuentra dentro del intervalo, se puede aceptar igualmente la
hipótesis nula de que el diámetro de las roscas sea 6 con una probabilidad de
error del 5%.
6.3.4.1.2. Caso 2: no se conoce la desviación estándar σ de la población
A partir de la muestra se calcula un valor experimental Vexp:
X − μ0
Vexp =
s
n
Y el valor teórico (Vα ó z), que es el valor que en la distribución N(0,1) deja a su derecha
un área α/2 para un nivel de significación α.

La regla de decisión, una vez fijado el nivel de significación α es la siguiente:
- Si Vexp > Vα se acepta la hipótesis alternativa.
- Si Vexp ≤ Vα se acepta la hipótesis nula.
6.3.4.2. Contraste unilateral
H0: μ ≤ μ 0
©
H1: μ > μ 0
donde μo es un valor conocido.
6.3.4.2.1. Caso 1: se conoce la desviación estándar σ de la población
En este caso, aplicando el método de intervalos de confianza para pruebas de hipótesis

referentes a la media, se aceptaría la H0 cuando:
X ∈LM−∞, μ + zα ⋅
σOP
N 0
nQ

Y se rechazaría cuando:
X ∉ LM −∞ , μ + zα ⋅
σOP
N 0
nQ
En la figura 6.3 se ilustra la representación de la zona de aceptación H0 para un

contraste de hipótesis unilateral.
Figura 6.3: Representación de la zona de aceptación de la H0 para un contraste de hipótesis unilateral.
EJEMPLO
Una empresa fabrica perfiles de aluminio de 170 cm como máximo, con una
desviación tipo de 8 cm. En una muestra de 100 perfiles se observa una
longitud de 172 cm. Se puede aceptar la hipótesis con un nivel de significación
©
del 5%?
H0: μ ≤ 170
H1: μ > 170
Las medias muestrales se distribuyen según N(170;0,8).

Para α= 0,05 las tablas proporcionan un valor de zα= 1,645
La zona de aceptación será:
LM−∞, μ + zα ⋅
σOP = −∞; 170+1,645 ⋅ 0,8 = −∞; 171,32
N 0
nQ

Como quiera que:
172 ∉ -∞; 171,32
Se rechaza la hipótesis nula de que los perfiles de aluminio midan como mucho
170 cm.
6.3.4.2.2. Caso 2: no se conoce la desviación estándar σ de la población
No obstante, en la mayoría de los casos se desconoce la desviación estándar σ de la

población. En este caso, la distribución t-student es la referencia adecuada para la
determinación de la estadística de prueba estandarizada cuando la distribución de
muestreo de la media tiene una distribución normal pero σ es desconocida.

El procedimiento a seguir es idéntico al seguido para la distribución normal,
sustituyendo la z por la t como estadístico de prueba.
X − μ0
t=
SX
donde:
s
SX =
©
n
EJEMPLO
Una empresa productora de lámparas quiere demostrar que la vida útil de los
focos de la marca que fabrica es de 4200 horas, frente a la alternativa que
plantea la competencia de que su duración es menor. Para ello, se sacó una
muestra aleatoria de 10 lámparas cuyo ciclo medio de vida útil era de 4000
horas con una desviación estándar de s= 200 horas. Se supone que, en
general, el ciclo de vida útil de los focos sigue una distribución normal. El nivel
de significancia es del 5%.

Dado que la muestra es pequeña n<30 y desconocemos la varianza

poblacional, se requiere aplicar la distribución t-student.
H 0 : μ = 4200
H1: μ < 4200
Consultando las tablas para la t-student, se tiene que para α=0,05 y n-1
grados de libertad, un valor de t crítico de -1,833.
s 200
SX = = = 63,3h
n 10
X − μ0 4000 − 4200
t= = = −3,16
SX 63,3
Dado que -3,16 se halla en la región de rechazo de la cola izquierda (a la

izquierda del valor crítico), se rechaza la hipótesis nula y se acepta que el ciclo
medio de vida útil real de las lámparas es menor de 4200 h.
6.3.5. CONTRASTE DE HIPÓTESIS PARA PROPORCIONES
La prueba de hipótesis puede utilizarse para probar hipótesis en relación a datos

cualitativos, es decir, para llegar a conclusiones en referencia a la proporción de los
©
valores que tienen una característica particular.
6.3.5.1. Contraste bilateral
H 0: p = p 0
H1 : p ≠ p 0
Se busca un zα/2 tal que:
b
P -zα/2 ≤ z ≤ zα/2 = 1− α g
La zona de aceptación se ilustra en la figura 6.4 y será el intervalo:
LM p - Z ⋅
p ⋅q
, p + Z α /2 ⋅
p ⋅q OP
N α /2
n n Q

Figura 6.4: Representación de la zona de aceptación de la Ho para un contraste de hipótesis bilateral.
La hipótesis nula H0 se aceptará cuando:
LM
p ′ ∉ p - Z α /2 ⋅
p ⋅q
, p + Z α /2 ⋅
p ⋅q OP
N n n Q
Y se rechazará cuando:

LM
p ′ ∉ p - Z α /2 ⋅
p ⋅q
, p + Z α /2 ⋅
p ⋅q OP
N n n Q
EJEMPLO
Se quiere determinar si la proporción de personas que toman un medicamento

para el dolor de cabeza y que obtienen alivio es del 90%, tal y como afirma la
©
publicidad. Se tiene una muestra aleatoria de 100 individuos, de los cuales, 88
obtuvieron alivio al tomar el medicamento. Sería aconsejable en este caso
tomar niveles de significancia bajos, por ejemplo del 5%.
H 0 : p = 0 ,9
H 1 : p ≠ 0 ,9
con un nivel de significancia dado α=0,05.

Para α=0,05 se tiene que α/2= 0,025 y, por tanto, zα/2= 1,96
Dado que q=1-p= 0,1
Sustituyendo:
LMp - Z ⋅
p ⋅q
, p + Z α /2 ⋅
p ⋅q OP = 0 , 84 ; 0,95
N α /2
n n Q

Dado que 0,88 está contemplado en el intervalo, no se rechazaría la hipótesis

nula.
6.3.5.2. Contraste unilateral

H0 : p ≥ p 0
H1: p < p0
Se busca un zα tal que:
b
P z ≤ zα = 1 − α g
La zona de aceptación se ilustra en la figura 6.5 y será el intervalo:
LMp - Z p⋅q
, +∞
OP
⋅
N α
n Q
©
Figura 6.5: Representación de la zona de aceptación de la Ho para un contraste de hipótesis unilateral.
La hipótesis nula H0 se aceptará cuando:
LM
p ′ ∈ p - Zα ⋅
p⋅q
, +∞
OP
N n Q
Y se rechazará cuando:
LM
p ′ ∉ p - Zα ⋅
p⋅q
, +∞
OP
MN n PQ

EJEMPLO
Una máquina fabrica piezas de precisión garantizando que la proporción de

piezas correctas es de al menos del 97%. Un cliente recibe un lote de 200
piezas y aparecen 8 piezas defectuosas; a un nivel de confianza del 95%
¿rechazará el lote por no cumplir las condiciones de garantía?
H 0 : p ≥ 0,97
H 1 : p < 0,97
La distribución muestral si H0 es cierta es N(0,97; 0,01).

Para α= 0,05 se tiene que zα= 1,645
Sustituyendo:
LMp - Z ⋅
p⋅q OP
, + ∞ = 0,95; + ∞
N α
n Q

La proporción de piezas correctas en la muestra es p’=192/200= 0,96. Como
quiera que se cumple:
0,96 ∈ 0,95; + ∞
Se acepta la hipótesis nula y, en consecuencia, el lote.

Resumen
©


©

IGUALDAD ESTADÍSTICA ENTRE DOS O MÁS POBLACIONES
Capítulo 7
IG U A L D A D E S T A D Í S T I C A
E N T RE D O S O M Á S
POBLACIONES
7.1. INTRODUCCIÓN
Es sabido que dos variables aleatorias X e Y son equivalentes si y sólo si se cumple que
©
tienen la misma función de distribución:
Fx ( z ) = Fy (z )
En función de los usos, existen diferentes pruebas a realizar para probar la igualdad
estadística de poblaciones. Las principales y que trataremos aquí son:
- Igualdad de dos poblaciones normales. Aplicando la prueba z (t-student) y la

prueba F-Snedecor para probar la igualdad de medias y de varianzas,
respectivamente.
- Análisis de la varianza. Aunque puede emplearse con dos poblaciones, la
ANOVA está diseñada para la prueba de igualdad de medias de tres o más
poblaciones.
- Igualdad de proporciones en varias poblaciones. Aquí tienen usos interesantes

las aplicaciones de chi-cuadrado.

7.2. COMPARACIÓN DE DOS MEDIAS

POBLACIONALES
Se trata de comparar la media de dos poblaciones diferentes, planteando la hipótesis

nula de que no existen diferencias significativas entre ambas.
Las pruebas referentes a la diferencia entre medias pueden ser bilaterales o unilaterales.
7.2.1. DIFERENCIA ENTRE MEDIAS EMPLEANDO LA DISTRIBUCIÓN NORMAL
El procedimiento que se sigue es parecido al observado en la prueba de una hipótesis

referente al valor de una media poblacional. La única diferencia radica en que la
desviación tipo estándar de la diferencia de las medias es el estadístico que se emplea
para determinar el valor z (o t) asociado con el resultado muestral.

Si se conoce la varianza σ 1 y σ 2 de ambas poblaciones, la fórmula general para
determinar el valor de z y probar así la hipótesis nula es:
(X1 − X2) − (μ1 − μ2)0

Z=
Ox1 −x2
Si no se conoce la varianza σ1 y σ2 de las poblaciones, se utiliza:
(X1 − X2) − (μ1 − μ2)0
©
Z=
Sx1 −x2
No obstante, si queremos probar la hipótesis nula, lo más usual es suponer que las dos
muestras se han obtenido de poblaciones con igual media, por lo que se tiene:
(μ1 − μ2 )0 = 0
Simplificando:
(X1 − X2 )
Z=
Ox1 − x2
(X1 − X2 )
Z =
Sx1 − x2

donde:
2 2
2 2 S1 S
S x1 − S x2 = S x1 + S x2 = + 2
n1 n2
Supongamos ahora que no sólo se supone que las medias muestrales se obtuvieron de
poblaciones con medias iguales, sino que, en realidad, también se obtuvieron de la
misma población, entonces σ1= σ2= σ.
De esta manera, el valor estimado combinado de la varianza de la población σ2 es:
2 2
(n1 − 1 ) ⋅ S 1 + (n 2 − 1 ) ⋅ S 2
s$2 =
n1 + n 2 − 2
Y la desviación tipo estimada de la diferencia de medias basada en el supuesto que las

varianzas de las poblaciones son iguales es:
σ$2 σ$2
s$x1 − x2 = +
n1 n2
EJEMPLO
Una muestra de 30 empleados de una empresa perciben por termino medio un

salario de 280 euros semanales con una desviación estándar de la muestra de
14 euros. En la empresa de la competencia, una muestra al azar de 40
©
empleados dio como resultado un salario medio de 270 euros con una
desviación estándar de 10 euros. No se supone que las desviaciones estándar
de las dos poblaciones de montos sean iguales.
Se quiere observar si con un nivel de significación del 5% existe o no diferencia

entre los salarios medios semanales de ambas empresas.
Planteamos la hipótesis nula de que no existen diferencias salariales:
H 0 :(μ 1 − μ 2 ) = 0
H 1: ( μ 1 − μ 2 ) ≠ 0

Aplicando la fórmula:
2 2
2 2 S1 S 142 102
Sx1 − Sx2 = Sx1 + Sx2 = + 2 = + = 3,0
n1 n2 30 40
X1 − X2 280 − 270
Z= = = 3,33
Sx1 − Sx2 3
Por tablas, sabemos que:
/ Zα =0,05 / = 1,96
La z calculada de 3,33 se encuentra en la región de rechazo del modelo de

prueba de hipótesis. En consecuencia, la hipótesis nula se rechaza, y la
hipótesis alternativa de que el salario semanal promedio de las dos empresas es
diferente, se acepta.

©
Figura 7.1: Región de aceptación y rechazo de la hipótesis nula.

7.2.2. DIFERENCIA ENTRE MEDIAS EMPLEANDO LA T-STUDENT
Las hipótesis que deben satisfacerse para poder aplicar la t-student con el fin de
comparar las medias de dos grupos son:
- La variable estudiada debe seguir una distribución normal.

- La dispersión en los dos grupos a comparar debe ser homogénea (hipótesis de
homocedasticidad o de igualdad de varianzas).
No es obligatorio que los tamaños de los grupos sean iguales, ni tampoco resulta
necesario conocer la dispersión de los dos grupos.
EJEMPLO
En una muestra aleatoria de 10 focos el ciclo medio de vida es de 4000 horas

con una desviación tipo de 200 horas. Para otra marca de focos, cuya vida útil
también se presume que sigue una distribución normal, una muestra aleatoria
de 8 focos tiene una duración media de 4300 horas y una desviación estándar
de 250. Se prueba la hipótesis de que no existe ninguna diferencia entre el
ciclo medio de vida útil de las dos marcas de focos con un nivel de significancia
del 1%. Se supone que se cumple la hipótesis de homocedasticidad.
Planteamos la hipótesis nula de que no existen diferencias en el ciclo medio de

vida útil:
H 0 :(μ 1 − μ 2 ) = 0
©
H1:(μ 1 − μ 2 ) ≠ 0
Aplicando las fórmulas:
2 2
(n1 − 1) ⋅ S1 + (n2 − 1) ⋅ S2 (9) ⋅ 2002 + (7) ⋅ 2502
s$2 = = = 49843,75
n1 + n2 − 2 10 + 8 − 2
) )
s2 s2 4 9 8 4 3 ,7 5 4 9 8 4 3 ,7 5
s$x1 − x2 = + = + = 1 0 5 ,9
n1 n2 10 8
X − X2 4000 − 4300
t = )1 = = −2,833
σ x1 − x2 105,9
Dado que en las tablas se tiene que la t crítica con ν= n1+n2-2= 16 g.l y
α=0.01 es de 2,921 en valor absoluto, y que el valor -2,833, por tanto, se

halla en la zona de aceptación de la hipótesis nula, se concluye que la hipótesis

nula no puede rechazarse al nivel de significancia del 1%.
A menudo la aplicación de la t-student se realiza sin excesivo cuidado, es decir,

sin comprobar las condiciones de aplicación. En este contexto, antes de realizar
la prueba, siempre deben ratificarse previamente la normalidad (prueba de
Kolgomorov) y homogeneidad de las varianzas (prueba F-Snedecor, Levene...).
En el caso de que no se cumpla la condición de normalidad, se suele intentar

alguna transformación que “normalice” los datos, siendo la de logaritmo
neperiano la más común. En la práctica, ocurre que la transformación que
“normaliza” los datos también consigue la igualdad de varianzas. No obstante,
si ni siquiera después de transformar los datos se consigue la igualdad de
varianzas, debe emplearse una modificación de la prueba de t-student debida a
Satterthwaite, válida para el caso de no homogeneidad de varianzas.

7.3. COMPARACIÓN DE DOS VARIANZAS
POBLACIONALES
Con frecuencia existe interés en conocer si la varianza de dos poblaciones difieren. En

estos casos, debe hacerse una prueba estadística de igualdad de varianzas. La hipótesis
a plantear es:
©
H o : σ 21 = σ 2 2
En estos casos se empleará la prueba F de Snedecor. Para ello, se construye el

estadístico de contraste experimental F dado por:
m áx{S 21;S 2 2 }
F =
obs
m in{S 21;S 2 2 }
donde:
Fobs= F de Snedecor.
s21= varianza muestral del grupo 1.

s22= varianza muestral del grupo 2.
En el caso que Fobs< Fteórica, se aceptaría la H0: σ21=σ22

donde:
Fteórica= es la F de Snedecor obtenida mediante tablas (ver apéndice) para un

valor dado de α con:
- grados de libertad del numerador, m: tamaño muestral del grupo con mayor
varianza muestral menos uno.
- grados de libertad del denominador, n: tamaño muestral del grupo con

menor varianza muestral menos uno.
Existen infinidad de variables F, todas ellas positivas e identificadas por dos parámetros
m y n denominados grados de libertad. Estos parámetros son siempre enteros positivos.
Tal y como se puede observar en la figura 7.2, la curva de densidad es asimétrica

positiva.
©
Figura 7.2: Criterio para el rechazo de la hipótesis nula sobre la homocedasticidad.
EJEMPLO
El gerente de una empresa dedicada a la comercialización de carne de vacuno

desea conocer si, tal y como dice la prensa, un cierto aditivo produce el
engorde prematuro de las reses. Para ello, compara los pesos de dos grupos de
reses al cabo de un determinado período de tiempo. En el primer grupo se ha
incluido el aditivo como parte de su alimentación, mientras que en el segundo
se ha obviado por completo.

Los resultados son los siguientes:
Con aditivo
39 36 35 37 40 39 40 38 35 39
(kg)
Sin aditivo
43 45 42 35 37 38 33 38 41 43
(kg)
Se trata de un problema de comparación de dos medias mediante el test de la t

student. Sin embargo, aquí nos interesa comprobar el cumplimiento de la
igualdad de varianzas para poder así aplicar la prueba, suponiendo la
normalidad de los grupos.
Haciendo los cálculos pertinentes, resulta:
X1 = 37,8 X2 = 39,5
S 21 = 3,36 S 22 = 13,65

Aplicando el estadístico, resulta:
máx{S 21;S 2 2 } 13,65

F = = = 4,06
obs
min{S 21;S22 } 3,36
Dado que Fobs= 4,06 > F9; 9; 0,05= 3,178 se rechazaría la hipótesis nula de
que las varianzas poblacionales son significativamente iguales.
Algunas transformaciones usadas para lograr normalidad (logaritmo, arcseno,

raíz cuadrada, etc.) consiguen a su vez también la homogeneidad en las
©
varianzas. Por ese motivo, se recomienda que si los datos primarios no cumplen
ninguno de los dos supuestos, se utilice la transformación y se trate de
asegurar, en primer lugar, la homocedasticidad. De hecho, la principal razón
para transformar los datos es para mejorar la homogeneidad de las varianzas y
no para resolver el problema de normalidad, ya que este último es un problema
menor en ANOVA.

7.4. CONDICIONES NECESARIAS PARA LA TOMA DE

DECISIONES ESTADÍSTICAS
Aquí se recuerda que en casi todas las pruebas estadísticas para la toma de decisiones,
deben tenerse en cuenta las siguientes premisas:
1. Cualquier anomalía puede tener un impacto significativo e influenciar en los

resultados de la valoración y métodos de las pruebas estadísticas.
2. La población debe ser homogénea, es decir, unimodal.
3. La muestra debe ser aleatoria
4. Además de ser homogénea, cada población debe distribuirse según una normal.
5. Homogeneidad de las varianzas (Homocedasticidad).
Veremos a continuación que estas premisas incluyen los supuestos que deberán cumplir
las poblaciones para realizar e interpretar un análisis de la varianza ANOVA.
7.5. COMPARACIÓN DE MÁS DE DOS MEDIAS

POBLACIONALES (ANOVA)
Aunque el análisis de la varianza (ANOVA) también se puede emplear para analizar las
diferencias entre las medias de dos poblaciones, es un método más general que permite
©
las comparaciones entre las medias de más de dos grupos.
El análisis de la varianza o ANOVA nos permitirá probar la diferencia entre dos o más
medias 1 , examinando el cociente de la variabilidad entre dos condiciones y de la
variabilidad dentro de cada condición.
Es importante señalar que el ANOVA será válido solamente si:
- La variable respuesta sigue una distribución normal.
- Se cumple la hipótesis de homocedasticidad o igualdad de las varianzas.
- Se cumple el supuesto de independencia de los grupos a comparar respecto a la

variable respuesta que se analiza.
1. En el ANOVA se comparan medias, no varianzas.

Las hipótesis a contrastar considera k situaciones experimentales analizadas sobre una

variable de respuesta Y.
H0: μ1 = μ 2 = μ 3 = L = μ k
H1: al menos dos difieren
donde:
μi= representan los valores (i=1, 2,...k) medios de la variable de respuesta Y,

en las k situaciones experimentales.
A la hora de formular el criterio de rechazo de la hipótesis nula, recurre a dos

estimadores independientes de la varianza -de ahí su nombre- conocidos como
cuadrados medios de los tratamientos (MSA o MSB) y cuadrados medios del error
(MSE), y que son comparados probabilísticamente con ayuda de la distribución F de
Snedecor.

MSA da idea de la varianza entre grupos, mientras que MSE
es un indicativo de la varianza dentro de los grupos.
MSA y MSE estiman la varianza poblacional en la hipótesis de que las k muestras

provengan de la misma población.
La distribución muestral del cociente de dos estimaciones independientes de la varianza

de una población normal es una F de Snedecor con los grados de libertad
correspondientes al numerador y denominador, respectivamente, por lo que se puede
©
contrastar dicha hipótesis empleando esa distribución.
Si en base a este contraste se rechaza la hipótesis de que MSE y MSA estimen la misma
varianza, se puede rechazar la hipótesis de que las k medias provengan de una misma
población.
Los resultados de un ANOVA se suelen representar en la tabla 7.1.

SUMA DE MEDIA
FUENTES DE
g.l CUADRADOS CUADRÁTICA F
VARIACIÓN
SS MS
Entre grupos
k-1 SSA SSA/(k-1) MSA/MSE
Tratamiento
Dentro de grupos
k·(n-1) SSE SSE/k(n-1)
Error
Total kn-1 SST
Tabla 7.1. Tabla ANOVA.
Es muy importante mencionar que para que el contraste de hipótesis basado en la F de

Snedecor lo sea de la igualdad de medias, es necesario que todas las muestras
provengan de una población con la misma varianza σ 2 , de la que MSE y MSA son
estimadores. En consecuencia, resulta necesario comprobarlo antes de realizar el
contraste.
En principio, el análisis de la varianza no puede realizarse si las muestras no son

homocedásticas. No obstante, existen soluciones alternativas en estos casos.
EJEMPLO
En un determinado experimento se llegó a las conclusiones que se muestran en

©
la siguiente tabla:
MUESTRA SUMA MEDIA
Población 1 2 3 1 3 1 10 2
Población 2 3 4 3 5 0 15 3
Población 3 5 5 5 3 2 20 4
Media principal 3
Se trataría de ver si existen diferencias significativas entre las poblaciones. Por

tanto, definiríamos la hipótesis nula como siempre, es decir, planteando que no
existen diferencias entre ellas:
H0 : μ1 = μ 2 = μ 3
H1: al menos dos de las medidas difieren

Para rellenar la tabla ANOVA hemos de calcular la suma de los cuadrados entre
grupos SSA y dentro de los grupos SSE.
Calculo de SSA
Se calcula procurando que todos los valores adquieran el valor que tendrían si a
sus respectivas medias les restasen (en valor absoluto) la magnitud de la media
principal.
MUESTRA SUMA
Población 1 1 1 1 1 1 5
Población 2 0 0 0 0 0 0
Población 3 1 1 1 1 1 5
Total SSA 10
Cálculo de SSE

Se calcula restando a cada uno de los valores su media respectiva del grupo y
elevando al cuadrado.
MUESTRA SUMA
Población 1 0 1 1 1 1 4
Población 2 0 1 0 4 9 14
Población 3 1 1 1 1 4 8
Total SSE 26
©
Tabla ANOVA
SUMA DE MEDIA
FUENTES DE
g.l CUADRADOS CUADRÁTICA F
VARIACIÓN
SS MS
Entre grupos
2 10 5 2,30
Tratamiento
Dentro de grupos
12 26 2,17
Error
Total 14 36
Dado que por tablas, a un valor de significancia de α=0,05, con 2 g.l. en el

numerador y 12 g.l. en el denominador, el valor crítico obtenido2 de F0,05 ; 2,
12= 3,89.

Como quiera que 2,30 < 3,89, no existen evidencias suficientes para rechazar
la hipótesis nula, aceptando que no hay diferencias entre las medias de las
poblaciones.
7.6. COMPARACIÓN DE MÁS DE DOS VARIANZAS

POBLACIONALES
Tal y como se ha visto, para comprobar la homocedasticidad (igualdad de varianzas) de

dos poblaciones puede emplearse la F de Snedecor; sin embargo, si hablamos de más
de dos poblaciones, la F de Snedecor no sirve y se debe recurrir a otros métodos como
la prueba de Bartlett, Cochran y la de la F del cociente máximo.
7.6.1. PRUEBA F DEL COCIENTE MÁXIMO
Esta prueba estadística, que no tiene nada que ver con la F de Snedecor, se emplea
para someter a prueba la hipótesis:
H0:σ 21 = σ 22 = σ 23
El procedimiento es el siguiente:
©
a) Encontrar la varianza más grande y más pequeña de todos los grupos a

comparar.
b) Calcular la razón de estas varianzas (Fmax. observado).
c) Elegir un error (α) aceptable de cometer, normalmente 0,05.
d) El test supone que todos los grupos a comparar son del mismo tamaño. Si los
grupos son diferentes, debe usarse el grupo con menor tamaño muestral (n)
para calcular los grados de libertad.
e) Mirar en la tabla de distribución acumulada de Fmax. teórico los valores de
probabilidad con a grupos y n-1 grados de libertad. Estos valores han sido
calculados bajo el supuesto de que las varianzas son homogéneas.
f) Si Fmax. observado > Fmax. teórico a un α=0,05, entonces se rechaza la hipótesis
nula de la homogeneidad de varianzas, es decir, existe heterogeneidad de
varianzas.
2. Las tablas de la F-Snedecor pueden consultarse en el Apéndice.

EJEMPLO
Se sospecha que una granja porcina ha vertido una cantidad de purines

indeterminada a un lago. El gerente de la granja asegura que no hubo ninguna
filtración. Para tratar de verificar esta sospecha, la administración realiza
medidas de los niveles de nitratos en diferentes puntos del lago, obteniendo los
siguientes valores:
Lago 1 7,1 8,5 6,2 7,3 7,9
Posteriormente, se toman muestras de nitratos en varios puntos de otros tres

lagos no contaminados, obteniendo:
Lago 2 7,2 6,5 5,9 7,8 ---
Lago 3 5,6 7,1 6,3 6,7 6,5

Lago 4 7,2 6,6 6,3 7,4 ---
Los valores obtenidos en el lago del posible vertido parecen ser más altos que
en los obtenidos en los otros tres. ¿Se considera esta diferencia lo
suficientemente importante como para concluir que el nivel de nitratos del lago
1 es diferente al de los demás y que, por tanto, está contaminado?
Este sería un problema de ANOVA, sin embargo, aquí lo que nos interesa es
comprobar la homogeneidad de varianzas por la prueba de la Fmax.
GRUPOS SXi SX2i Xi ni S2i ©
Lago 1 37 276,8 7,4 5 0,6
Lago 2 27,4 189,74 6,85 4 0,5125
Lago 3 32,2 208,6 6,44 5 0,2464
Lago 4 27,5 189,85 6,875 4 0,1969
Totales 124,1 864,99 X t =6,894 18 S2t=0,522

De la tabla se deduce que la varianza mayor es 0,6 mientras que la menor es

0,1969. En consecuencia:
S2 mayor 0,6
F máx = = = 3,047
2
S menor 0,1969
Dado que para 3 grados de libertad a un α=0,05, la Fmax. crítica = 6,6 > 3,047
se aceptaría la hipótesis nula de homogeneidad de varianzas.
©


©

Resumen
©


©

CORRELACIÓN Y REGRESIÓN
Capítulo 8
CORRELACIÓN
Y RE G RE S I Ó N
8.1. VARIABLES CORRELACIONADAS
Decimos que dos variables, X e Y, están positivamente correlacionadas cuando siguen

una misma tendencia, es decir, a elementos pequeños de X le corresponden elementos
pequeños de Y, mientras que a elementos grandes de X tienden a corresponderle
©
elementos grandes de Y.
En cambio, se dice que están correlacionadas de forma negativa cuando la tendencia es

inversa, es decir, a elementos pequeños de X tienden a corresponderles valores grandes
de Y, mientras que a elementos grandes de X les corresponden valores pequeños de Y.
Por ejemplo, las variables peso-altura, en general, están correlacionadas de manera

positiva, pues la mayoría de los individuos altos también son pesados, mientras que la
mayoría de los bajos tienen un menor peso. Por otro lado, en algunos países, las
variables renta familiar y número de elementos de la familia, acostumbran a presentarse
negativamente correlacionadas, pues las familias de baja renta, en general, tienden a
tener un mayor número de hijos que las de renta alta.
A lo largo de este capítulo se ilustrará el estudio de correlación entre dos variables,

utilizando los datos de la tabla 8.1, relativos a algunos indicadores sociales de una
muestra de municipios de Brasil1.

ESPERANZA DE MORTALIDAD TASA

MUNICIPIO DISTa. VIDA AL
RENTA PER-
CAPITAL NACER INFANTILb ALFABETIZACIÓNc CÁPITA ($)
Araruna (PR) 365 67,99 23,19 86,23 188,29

Nova Redenção (BA) 278 61,19 56,56 63,00 74,79
Monção (MA) 150 59,58 63,32 63,64 66,96
Porto Rico do Maranhão (MA) 78 58,96 66,05 79,33 65,34
Campo Erê (SC) 468 68,10 31,71 83,38 173,38
Lagoa do Piauí (PI) 40 63,65 47,08 65,81 60,00
São José das Palmeiras (PR) 486 71,01 16,62 77,54 150,67
Paraíba do Sul (RJ) 83 71,36 15,69 89,28 264,55
Malhada dos Bois (SE) 65 64,46 44,18 69,95 80,69
Jandaíra (BA) 175 62,45 51,57 59,72 58,68
Vespasiano (MG) 14 68,68 32,81 90,43 196,51
Ipaba (MG) 167 67,42 37,04 81,82 125,75
a. Distancia a la capital de la respectiva Unidad de Federación.

b. Número medio de muertes por cada mil nacimientos hasta el año de vida.
c. Tasa de alfabetización (porcentaje de población adulta alfabetizada).
Tabla 8.1. Algunos datos basados en el Censo Demográfico de 2000, de una muestra aleatoria de

municipios brasileños2.
8.2. DIAGRAMAS DE DISPERSIÓN
Una manera de visualizar el tipo de correlación entre dos variables es mediante el

diagrama de dispersión, en el cual los valores de las variables se representan por puntos
en un sistema cartesiano.
La representación se realiza bajo la forma de pares ordenados (x,y) donde “x” es un ©

valor de una variable e “y” corresponde al valor de la otra variable.
La figura 8.1 ilustra la construcción de un diagrama de dispersión.
1. Se está utilizando una muestra bastante pequeña para ilustrar las técnicas. Se podría hacer un estudio más detallado
tomando toda la población de todos y cada uno de los municipios, ya que estos datos están disponibles en el Censo
Demográfico de 2000 incluido en el Atlas de Desarrollo Humano (http://www.pnud.org.br/atlas).
2. Fuente: Atlas de Desarrollo Humano (http://www.pnud.org.br/atlas).

Figura 8.1: Construcción de un diagrama de dispersión. Representación de las tres primeras observaciones
de X (distancia a la capital) y de Y (esperanza de vida al nacer) referente a los datos de la
tabla 8.1.
La figura 8.2 muestra cuatro diagramas de dispersión, relacionando algunas variables de

la tabla 8.1 con otras. El lector debe notar que cada uno de los pares observados se
refiere a un mismo elemento (municipio).
©
Figura 8.2: Algunos diagramas de dispersión construidos a partir de los datos de la tabla 8.1.

El diagrama (b) de la figura 8.2 muestra una situación de correlación positiva, ya que los
puntos están en torno a una línea imaginaria ascendente. En general, valores pequeños
de una variable también lo son en la otra, y lo mismo acontece para grandes valores.
Los diagramas (a) y (c) muestran correlaciones negativas porque, en ambos casos, los
puntos están entorno a una línea imaginaria descendente. En general, valores pequeños
de una variable se corresponden con grandes en la otra. En (c) los puntos se presentan
más próximos a una línea descendente que en (a), lo que caracteriza una correlación
más fuerte.
En el diagrama (d) no se presenta correlación alguna, pues valores pequeños (o grandes)

de una variable están asociados tanto a valores pequeños como a valores grandes de
otra. En este caso, los puntos no se posicionan alrededor de ninguna línea ascendente o
descendente.
La figura 8.3 muestra un conjunto de puntos que se aproxima más a una parábola que a
una recta, ilustrando un caso de correlación no lineal. La interpretación de las
correlaciones no lineales es más difícil y no será objeto de este documento.

©
Figura 8.3: Diagrama de dispersión de un ejemplo hipotético de correlación no lineal.
Es importante resaltar que el concepto de correlación se refiere a una asociación

numérica entre dos variables, sin implicar, necesariamente, una relación causa-efecto.
Si se toman, por ejemplo, las variables población de Argentina y venta de cerveza en
Brasil a lo largo de los dos últimos años, se observa que están correlacionadas de
manera positiva, pues ambas aumentan con el tiempo. Con todo, en términos prácticos,
esta correlación es espúrea, ya que no aporta ninguna información relevante.
El análisis de datos para verificar las correlaciones se realiza usualmente en términos

exploratorios como elemento auxiliar dentro de un problema de estudio; es decir, el
estudio de la correlación numérica entre las observaciones de dos variables es
generalmente un paso intermedio del análisis de un problema.

8.3. EL COEFICIENTE DE CORRELACIÓN LINEAL DE

PEARSON
El coeficiente de correlación lineal de Pearson es apropiado para describir la correlación

lineal de dos variables cuantitativas.
El valor del coeficiente de correlación debe ser independiente de la unidad de medida de

los datos. Por ejemplo, el coeficiente de correlación entre las variables peso y altura
debe tener el mismo valor independientemente de si el peso está medido en gramos o
kilogramos y la altura en metros o centímetros.
Con el fin de evitar la influencia de las unidades de medida, debe procederse a realizar
un cambio de variable (tipificar) tal que:
x− X y−Y
x′ = y′ =
Sx Sy
donde:
x´=valor tipificado que toma un valor de la variable X.
y’ =valor tipificado que toma valor de la variable Y.

X = media de los datos de la variable X.
Y = media de los datos de la variable Y.

©
Sx= desviación tipo de los datos de la variable X.

Sy= desviación tipo de los datos de la variable Y.
El coeficiente de correlación lineal de Pearson, r, se define por la siguiente expresión, en

términos de valores tipificados:
∑ (x ′ ⋅ y ′)
r =
n − 1
donde:
r= coeficiente de correlación lineal de Pearson.
n= tamaño de la muestra, es decir, el número de pares (x,y).

Σ(x’·y’) es la suma de los productos x’·y’ de los pares de valores tipificados.

EJEMPLO DE CORRELACIÓN POSITIVA
La tabla 8.2 proporciona un conjunto de datos hipotéticos y tipificados.
VALORES ORIGINALES VALORES TIPIFICADOS PRODUCTOS
x y x’ y’ x’y’
2 4 -1,50 -,175 2,63

3 7 -1,00 -0,88 0,88
4 9 -0,50 -0,29 0,15
5 10 0,00 0,00 0,00
5 11 0,00 0,29 0,00
6 11 0,50 0,29 0,15
7 13 1,00 0,88 0,88
8 15 1,50 1,46 2,19
40 80 0,00 0,00 6,87 Suma
5,00 10,00 0,00 0,00 Media

2,00 3,42 1,00 1,00 Desviación tipo
Tabla 8.2. Conjunto de valores hipotéticos y tipificados.
En la figura 8.4 se ilustra la disposición de los valores originales y tipificados en

unos ejes cartesianos.
Figura 8.4: Diagramas de dispersión de los valores originales y tipificados.

Cuando se trabaja con datos correlacionados positivamente, como es el caso

del ejemplo, los pares (x’, y’) tienden a tener el mismo signo (+ ó -),
especialmente para aquellos puntos lejos del origen. En este sentido, tal y
como muestra la tabla 8.2, los productos x’·y’ son de signo positivo.
En consecuencia, el coeficiente de correlación r será positivo, tal y como se

muestra:
∑(x′ ⋅ y ′) 6,87
r= = = 0,981
n −1 7
EJEMPLO DE CORRELACIÓN NEGATIVA
La tabla 8.3 proporciona un conjunto de datos hipotéticos y tipificados.

VALORES ORIGINALES VALORES TIPIFICADOS PRODUCTOS
x y x’ y’ x’y’
2 16 -1,50 1,75 -2,63

3 13 -1,00 0,88 -0,88
4 11 -0,50 0,29 -0,15
5 10 0,00 0,00 0,00
5 9 0,00 -0,29 0,00
6 9 0,50 -0,29 -0,15
7 7 1,00 -0,88 -0,88
©
8 5 1,50 -1,46 -2,19
40 80 0,00 0,00 -6,87 Suma
5,00 10,00 0,00 0,00 Media
2,00 3,42 1,00 1,00 Desviación tipo
Tabla 8.3. Conjunto de valores hipotéticos y tipificados.
En la figura 8.5 se ilustra la disposición de los valores originales y tipificados en

unos ejes cartesianos.

Figura 8.5: Diagramas de dispersión de los valores originales y tipificados.

En este ejemplo, el coeficiente r es negativo porque los pares de valores (x’, y’)
tienen, en general, signos diferentes, especialmente en aquellos puntos
alejados del origen. Este hecho hace que los productos x’·y’ sean de signo
negativo y, en consecuencia, también lo sea r.
En la figura 8.5 se observa una mayor concentración de puntos en los

cuadrantes II y IV (donde x e y tienen signos opuestos), acarreando un valor
negativo para r.
∑(x′ ⋅ y′) −6,87

r= = = −0,981
©
n −1 7
En definitiva, de ambos ejemplos se deduce que si los puntos se concentran en los

cuadrantes I y III (figura 8.6), la correlación es positiva, mientras que si lo hacen en los
cuadrantes II y IV, es negativa. En caso de que los puntos se distribuyesen de forma
aproximadamente igual en todos los cuadrantes, los datos no estarían correlacionados
haciendo que la suma de productos positivos y negativos fuesen cercana a cero.

Figura 8.6: Cuadrantes en los que se dividen los ejes cartesianos.
Para cualquier conjunto de datos, el valor del coeficiente de correlación de Pearson, r,

estará en el intervalo de -1 a 1. Será tanto más próximo de 1 (ó -1) cuanto más fuerte
sea la correlación de datos observados.
El valor de r=1 se alcanzaría cuando los puntos estuviesen colocados perfectamente

sobre una recta ascendente (correlación positiva perfecta), mientras que el valor de r=-
1 se alcanzaría en el caso de que estuviesen colocados exactamente sobre una recta
descendente (correlación negativa perfecta). En caso de no existir correlación, el valor r
tendería a un valor próximo a cero.
©
Figura 8.7: Nivel de correlación en función del valor de r.

8.3.1. CÁLCULO DE R
El cálculo del coeficiente de correlación r presentado anteriormente, tiene como

inconveniente el incorporar ciertos errores de redondeo, pues normalmente los valores
de la media y de la desviación tipo no son enteros. En este contexto, se sugiere utilizar
la siguiente fórmula basada en las observaciones originales:
n . ∑ ( X . Y ) − ( ∑ X ). ( ∑ Y )
r =
n. ∑ X 2 − ( ∑ X ) 2 . n. ∑ Y 2 − ( ∑ y ) 2
Para ilustrar esta expresión, vamos a rehacer el ejemplo de correlación lineal positiva
visto con anterioridad:
8(447) − (40).(80)
r= =
8(228) − (40)2. 8(882) − (80)2

3.576 − 3200
= =
1824 − 1600. 7.056 − 6400
376 376
= = = 0,981
224. 656 383,33
Como era de esperar, el valor es el mismo, ya que las fórmulas son matemáticamente
equivalentes.
8.4. REGRESIÓN LINEAL SIMPLE ©
El término regresión surge a finales del siglo XIX de los trabajos de Galton. Dichos
trabajos procuraban explicar ciertas características de un individuo a partir de las
características de sus familiares. Por ejemplo, Galton afirmaba que los hijos de padres
que tenían alguna característica determinada, también poseían esta característica,
aunque con menor intensidad que éstos últimos en promedio.
Los estudios de Galton se basaban en observaciones empíricas. En uno de estos

trabajos relacionó centenares de alturas de individuos con las respectivas alturas medias
de sus padres (tabla 8.4).

X Y X Y X Y X Y
164 166 164 168 166 166 166 168

166 171 166 173 169 166 169 168
169 171 169 173 171 166 171 168
171 171 171 173 171 176 173 168
173 171 173 176 173 178 176 171
176 173 176 176 178 176 176 178
Tabla 8.4. Relación de alturas de diversos individuos (Y) y alturas medias de sus padres (X), medidas en
centímetros.
Fuente: Stigler (1986, p. 286)3.
En la figura 8.8 se representa un diagrama de dispersión con las observaciones de la

tabla 8.4, indicando una correlación positiva tal y como era de esperar.
©
Figura 8.8: Diagrama de dispersión de datos.
Si trazamos una recta ascendente por la nube de puntos, se observa una tendencia a
que los hijos de padres altos tengan alturas inferiores a la media de sus padres, mientras
que los hijos de padres bajos tienen alturas superiores a la media de sus padres.
Este ejemplo se distingue de los anteriores por suponer una relación de causalidad entre
X e Y, descrita en términos de una relación matemática. Es esta la diferencia básica
entre un estudio de correlación y un análisis de regresión. La aplicación de un análisis de
regresión se realiza sobre un referencial teórico que justifique una relación matemática
de causalidad.
3. Stigler, S. M. The history of statistics: the mensurement of uncertainty before 1900. USA, Harward, 1986.

8.4.1. MODELO DE REGRESIÓN
El modelo estadístico-matemático de regresión, en su formulación más simple, relaciona

una variable Y, denominada dependiente, con otra variable X, llamada independiente
(tabla 8.5).
VARIABLE INDEPENDIENTE, X ? VARIABLE DEPENDIENTE, Y
Renta → Consumo ($)
Gasto o control de calidad ($) → Número de productos defectuosos
Memoria RAM del computador (gb) → Tiempo de respuesta del sistema (segundos)
Área construida (m2) → Precio ($)
Tabla 8.5. Diversas aplicaciones del modelo de regresión lineal simple.

Análogamente al estudio de las correlaciones, el análisis de regresión también parte de
un conjunto de observaciones apareadas (x,y), relativas a las variables X e Y. Diremos
que un valor y depende, en parte, de su correspondiente valor x. Por ejemplo, la altura
de un individuo (y) depende, en parte, de la altura media de sus padres (x).
Simplificaremos esta dependencia por una relación lineal entre X e Y tal que:
y = α + β. x
©
Si fijamos valores para a y b, la ecuación y=a+bx es la ecuación de una recta. Por
ejemplo, si a=1 y b=2, la ecuación y= 1+2x representa una recta en unos ejes
cartesianos (figura 8.9).
Figura 8.9: Representación gráfica de la ecuación y= 1+2x.

Sin embargo, si observamos un conjunto de valores (x,y), se verifica que, en general,

los puntos no están exactamente sobre una recta, sino que fluctúan en torno a alguna
recta imaginaria. En estas condiciones, un modelo más adecuado sería:
y = α + βx + ε
donde:
- α+βx= representa la parte estructural.
- ε = representa el efecto aleatorio, es decir, el efecto de infinidad de factores que

afectan una observación de forma aleatoria. Por ejemplo, la altura de un
individuo (y) no solamente depende de la altura media de sus padres (x), sino
también, de su alimentación, del genotipo de sus ancestros y de una infinidad
de otros factores, representados en el modelo por esta letra.
8.4.1.1. Estimación de los parámetros α y β

La idea básica de la construcción de la parte estructural del modelo, supuestamente

lineal, es encontrar una recta que pase lo más próxima posible a los puntos observados.
Esta recta se representará por:
y$ = a + bx
y se llamará recta de regresión o ecuación de regresión (figura 8.10).

©
Figura 8.10: Representación de la ecuación de regresión del ejemplo.

Los valores de a y b se determinan a través del llamado método de los mínimos

cuadrados4:
n. ∑ ( X . Y ) − ( ∑ X ) . ( ∑ Y ) ∑ Y − b. ∑ X
b = a =
n. ∑ X 2 − ( ∑ X )2 n
donde:
- n= número de pares (x,y) observados (tamaño de la muestra).
- ∑ (X.Y)= sumatorio de los productos x·y.
- ∑X= suma de los valores observados de la variable X.

- ∑Y= suma de los valores observados de la variable Y.
- ∑X2= suma de los cuadrados de los valores de X.
Siguiendo con el ejemplo, a continuación se ilustrará la ecuación de regresión, con parte

de las observaciones de altura media de los padres (X) y altura del hijo (Y), extraídas de

la tabla 8.4.
La tabla 8.6 muestra los cálculos de los sumatorios.
DATOS CÁLCULOS INTERMEDIOS

X Y X2 X.Y
164 166 26.896 27.224
166 166 27.556 27.556
©
169 171 28.561 28.899
169 166 28.561 28.054
171 171 29.241 29.241
173 171 29.929 29.583
173 178 29.929 30.794
176 173 30.976 30.448
178 178 31.684 31.684
∑X = 1.539 ∑Y = 1.540 ∑X2 = 263.333 ∑ (X.Y) = 263.483
Tabla 8.6. Parte de las observaciones de la tabla 8.4 y cálculos intermedios para la obtención de la recta
de regresión.
4. La obtención de la ecuación de regresión por el método de los mínimos cuadrados consiste en hacer que la suma
cuadrática de los efectos aleatorios, ∑E2, sea lo menor posible. La solución de este problema matemático genera las
expresiones de a y b citadas.

9.(263483) − (1539).(1540) 1287

b= = = 0,872
9.(263333) − (1539)2 1476
1540 − (0,872).(1539)
a= = 22,00
9
De esta manera, se obtiene la recta de regresión:
y$ = 22 + 0,872 ⋅ x
Con el fin de trazar la recta de regresión en el plano formado por los ejes X e Y, basta
con dar un par de valores que cumplan (figura 8.11).
©
Figura 8.11: Diagrama de dispersión de los datos y recta de regresión ajustada.
En referencia a los nueve individuos observados, se puede predecir la altura de un hijo

( y$), a partir de una altura media dada de sus padres, x, a través de la ecuación: y$ = 22
+ (0,872) x. Por ejemplo, para una altura media de los padres de x=175 cm, se tiene
una altura estimada del hijo de: y$ = 22 + (0,872).(175) = 174 cm.
El coeficiente b, que en nuestro caso es de 0,872, estima la variación esperada de Y, a

partir de la variación de una unidad de X. Este coeficiente indica una correlación
positiva entre las variables X e Y, para los nueve individuos en estudio.


©

Resumen
©


©

Bibliografía
[1] Barbetta, P. A. (2005). Estadística Aplicada a las Ciencias Sociales. 5ª ed.

UFSC. Florianópolis, Brasil.
[2] Bartolomé, A. (1989). Estadística, 2ª Curso de Formación Profesional, 4.
Edebé. Barcelona.
[3] Bussab, W. O. y Morettin, P. A. (2002). Estadística básica. 5ª ed. Colección
Métodos Cuantitativos. Saraiva. São Paulo, Brasil.
[4] Levine, D. M., Berenson, M. L. y Stephan, D. (2000). Estadística: teoría y
aplicaciones usando Excel. LTC. Rio de Janeiro, Brasil.
[5] Mendenhall, N. (1985). Probabilidades y estadística, 1 y 2. Campos. Rio de
Janeiro, Brasil.
[6] Selltiz, Wrightsman, Cook. (1987). Métodos de investigación en las
relaciones sociales. 4 ed. EPU. São Paulo, Brasil.
[7] Stevenson, W. J. (1981). Estadística aplicada a la administración. Harbra.
São Paulo, Brasil.
[8] Stigler, S. M. (1986). The history of statistics: the measurement of
uncertainty before 1900. Harvard University Press. Cambridge, MA.
[9] Triola, M. F. (1999). Introducción a la estadística. LTC. Rio de Janeiro,
©
Brasil.
Páginas web consultadas
[1] Arsham, Hossein. Razonamiento estadístico para la toma de decisiones

gerenciales [en línea]. 2004. Enlace web:
http://www.staff.vu.edu.au/sarath/Business-stats/opre504S.htm
[2] Descartes 2D. Estadística [en línea]. Idea de María José García Cebrian,
adaptada por María Vicenta Cabalgante Perera. [Madrid]: Ministerio de
Educación y Ciencia, 2003. Enlace web:
http://www.cnice.mecd.es/Descartes/indice_aplicaciones.htm#recuento
[3] López, Jesús. Aula virtual de Bioestadística [en línea]. [Madrid]: Universidad
Complutense de Madrid, Facultad de Biología, Dpto. de Matemática
Aplicada. Biomatemática, noviembre 2004. Enlace web:
http://e-stadistica.bio.ucm.es/

[4] Martínez, Omar. Análisis de la varianza [en línea]. Ilustrados.com. Enlace
web: http://www.ilustrados.com/publicaciones/EpyAlEyluZqETutecT.php
[5] Material docente de la unidad de bioestadística clínica [en línea]. [Madrid]:
Hospital Ramón y Cajal, 1996. Enlace web:
http://www.hrc.es/bioest/M_docente.html
[6] Miranda, Ileana. La estadística del agropecuario. 10 preguntas 10 respuestas.
[en línea]. Monografías.com. Enlace web: http://www.monografias.com/
trabajos19/estadistica-agropecuario/estadistica-agropecuario.shtml
[7] Monge, Juan Francisco. Estadística no paramétrica: prueba Chi-cuadrado [en
línea]. En: Proyecto e-math. Estadística Básica. UOC, 15 julio 2003.
Enlace web: http://www.uoc.edu/in3/e-math/
[8] Velasco, Roberto J. Estadística inferencial [en línea]. Ensayo para la
licenciatura en psicología. México. Enlace web: http://www.universidad
abierta.edu.mx/SerEst/Apuntes/VelascoRoberto_EstadistInferencial.htm

©

Estadistica para Toma Decisiones PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica para Toma Decisiones PDF

Cargado por

Copyright:

Formatos disponibles

Lectura

FUNDACIÓN UNIVERSITARIA IBEROAMERICANA

Capítulo 1 •• Criterio estadístico para la toma de decisiones

1.1. Introducción .................................................................................................. 3

1.3. Etapas de un proceso de toma de decisiones .................................................... 7

1.4. Variables y datos ............................................................................................ 10

Capítulo 2 •• Variables cualitativas

2.1. Introducción .................................................................................................. 15

ESTADÍSTICA PARA LA TOMA DE DECISIONES I

3.1. Introducción ................................................................................................... 27

Capítulo 4 •• Estadística descriptiva

4.1. introducción ................................................................................................... 41

FUNDACIÓN UNIVERSITARIA IBEROAMERICANA

Capítulo 5 •• Modelamiento estadístico de las variables

5.1. Introducción ................................................................................................... 57

II ESTADÍSTICA PARA LA TOMA DE DECISIONES

Capítulo 6 •• Estadística inferencial

6.1. Introducción .................................................................................................. 85

6.2.1. Definición ........................................................................................... 86

6.3. contraste o prueba de hipótesis ....................................................................... 92

ESTADÍSTICA PARA LA TOMA DE DECISIONES III

7.1. Introducción ................................................................................................... 107

Capítulo 8 •• Correlación y regresión

FUNDACIÓN UNIVERSITARIA IBEROAMERICANA

IV ESTADÍSTICA PARA LA TOMA DE DECISIONES

La interpretación de las decisiones gerenciales bajo incertidumbre y, en general, de las

La estadística ayuda a corroborar hipótesis proporcionando un soporte matemático a las

Este texto responde a la necesidad de justificar las decisiones gerenciales en base a la

Los pasos a seguir para realizar un experimento son:

• Planteamiento de la hipótesis que se pretende demostrar.

• Definición de las variables a estudiar.

• Recogida y recopilación de datos (tipos de muestreo).

• Elección del método estadístico más apropiado para demostrar la hipótesis de

ESTADÍSTICA PARA LA TOMA DE DECISIONES 1

Distribuciones de Organización de los datos de acuerdo con las

Organización de los datos de acuerdo con las

FUNDACIÓN UNIVERSITARIA IBEROAMERICANA

Describir las características

Adquirir los conocimientos Distribuciones de variable Conocimiento de las funciones de distribución

Utilizar los conocimientos Determinación de estimaciones puntuales e

Análisis de la existencia o no de diferencias

Determinación del coeficiente de correlación lineal

2 ESTADÍSTICA PARA LA TOMA DE DECISIONES

En todo proceso de decisión se necesita recabar información que sea capaz de

Las herramientas estadísticas permiten recolectar, analizar e interpretar de forma

Los gerentes y profesionales, en general, necesitan justificar sus

La estadística ayuda a tomar decisiones económicas bajo incertidumbre, a predecir con

ESTADÍSTICA PARA LA TOMA DE DECISIONES 3

Los modelos estadísticos (p.e. el análisis de regresión) se emplean actualmente en

A diferencia del modelo determinista, en los procesos de toma de decisiones bajo

En este sentido, la utilidad de la estadística de negocio puede reflejarse en numerosos

- Empleo de técnicas de muestreo aleatorio en el ámbito de la auditoría.

FUNDACIÓN UNIVERSITARIA IBEROAMERICANA

En definitiva, se trata de utilizar la estadística como una herramienta diferenciadora

- Estadística Descriptiva. Aquella que describe las características de una serie de

4 ESTADÍSTICA PARA LA TOMA DE DECISIONES

La Estadística Descriptiva es la base de la Estadística Inferencial.

1.2. POBLACIÓN Y MUESTRA

La población se podría definir como el conjunto de todos los individuos (personas,

A partir de una muestra escogida al azar de una población, pueden sacarse

Generalmente, se asocia la palabra “parámetro” a las medidas que provienen de la

parámetro (σ). Análogamente, se hablaría de la media muestral como el estadístico X y

Las letras griegas representan parámetros y las latinas simbolizan estadísticos.