Ada Ca U1

También podría gustarte

Está en la página 1de 30

Unidad 1

Estadística en la
toma de decisiones

Análisis de Datos
Página 1 de 29

Introducción
En esta unidad revisarás las medidas numéricas que te permitirán resumir datos de
aquellas variables, con el propósito de conocer y resumir los datos que presentan cada
una de las variables.

En el contexto estadístico esta unidad es muy importante para el análisis de datos porque
da conocer la información que contienen las variables previas a realizar un método
estadístico avanzado. Por lo general, estos métodos estadísticos se aplican en conjunto
con las medidas de tabulación para dar a conocer al usuario la distribución de las
variables.

Las medidas más utilizadas son las medidas de tendencia central, medidas de localización
y las medidas de variabilidad, pero también revisaremos el concepto de distribuciones de
probabilidad; para saber cómo se comportan estas variables representado sus
características en función de sus respectivos momentos de la distribución.

Lo anterior puede sonar muy teórico, pero cuando lo llevamos a la práctica tiene una
proporción aplicada a los negocios que revisaremos en cada unidad. Además, cada una de
estas medidas entrega información por sí sola, pero cuando se interpretan con otras
medidas el análisis estadístico se hace mucho más robustos e interpretativo para concluir
y conocer los datos.

En esta unidad trabajaremos con una base ejemplos de las recaudaciones por películas de
las empresas Disney y Pixar. Para entregar algo de contexto, en su momento Disney quiso
adquirir a Pixar, por lo cual se necesitaba un análisis exaustivo de las recaudaciones de
Pixar. Durante las unidades iremos analizando las recaudaciones de Pixar, y por qué
Disney lo compró. En la tabla 1, se encontrarán las recaudaciones de cada empresa.
Página 2 de 29

Tabla 1: Recaudaciones por empresa de taquillas


Películas Disney Disney Películas Pixar Pixar
Pocahontas $346 Toy Story $362
Jorobado de Notre Dame $325 Bichos $363
Hércules $253 Toy Story 2 $485
Mulán $304 Monsters Inc. $525
Tarzán $448 Buscando a Nemo $865
Dinosaurio $354 Los Increíbles $631
Las Locuras del Emperador $169
Lilo y Stich $273
El Planeta del Tesoro $110
El Libro de la Selva 2 $136
Tierra de Osos $250
Vacas Vaqueras $104
Chicken Little $ 246
Fuente: Anderson, D., Sweeney, D. y Williams, T. (2008). Estadística en la Administración y
Economía. México DF: Cengage Learning.

1. Conceptos generales de la estadística


1.1 ¿Qué se entiende por estadística?
En la literatura existe una gran variedad de definiciones de la estadística siendo su factor
común referirse a información numérica. De esta manera, la estadística permite entregar
un valor o porcentaje que podría ser interpretable o representado mediante un gráfico.
Estos ejemplos pueden ser:

• Las ventas de autos en Chile representan, en promedio, un 7% con respecto al PIB


de Chile.
• El tiempo promedio de espera, en la sala de urgencias, en los hospitales, en Chile,
es de 3.5 horas.
• Con nivel del 95% de confianza, la desviación estándar de los tornillos, de la fábrica
XYZ, es de 0.9mm.
• Las ventas de la empresa XYZ están correlacionadas en 67% con respecto a lo
caluroso que se encuentre el día.
Todos los ejemplos que se mencionaron anteriormente tienen en parte un análisis
estadístico detrás que viene asociado a los diferentes tipos de estadística: Estadística
Descriptiva y la Estadística Inferencial.
Página 3 de 29

Durante la asignatura revisaremos los conceptos y la interoperabilidad de estos dos tipos


de estadística aplicadas al análisis de variables de negocios, y en cómo sacar el máximo
provecho de estas herramientas para encontrar posibles oportunidades de negocios.

De todas formas, es importante considerar una definición general de estos tipos de


estadística:

Definición 1: Tipos de Estadísticas

Estadística Método para organizar, resumir y presentar datos de manera


descriptiva informativa.

Estadística Métodos que se emplean para determinar una propiedad de una


inferencial población con base en la información de una muestra de ellas.

1.2 Datos
Cuando se aplica los conceptos visto en la definición 1, sí o sí, se tiene que aplicar a un
conjunto de datos que están de cierta manera estructurados en alguna estructura de
información. La descripción de información es diferente a la descripción de datos. Cuando
las empresas tienen datos que no son equivalentes a información, sino que cuando tienen
datos tienen una posible información, en donde esa posible información dependerá de los
expertos del analista de datos, y del conocimiento del negocio.

La estadística tiene ese beneficio de entregar información mediante los datos, pero ¿qué
tipos de datos?, ¿cuál es la cantidad de datos ideal?

Para responder las preguntas anteriores, necesitamos entender la definición de población


y muestra. Cuando se requieren hacer análisis, por ejemplo, al nivel nacional (en un país)
las instituciones que se encuentran a cargo de estos análisis no pueden adquirir datos
mediante encuestas de las todas las personas de esa nación, y esto se debe a varias
razones: 1. Costos elevados; 2. Tiempo para hacerlo, y la más importante, 3. Es imposible
encuestar todas las personas.

Por lo tanto, lo que hacen estas instituciones es extraer muestras representativas, en


donde esa muestra representativa representa a la población.
Página 4 de 29

Figura 1: Concepto de Población y Muestra

Fuente: Anderson, D., Sweeney, D. y Williams, T. (2008). Estadística en la Administración y


Economía. México DF: Cengage Learning

Como se muestra en la figura 1, la población viene siendo algo teórico, en la cual, para
realizar el análisis, se tiene que extraer de esa población teórica un conjunto de muestras
pero que son representativas a la población (autos de distintos colores).

1.3 Tipos de variables


En el tema anterior se introdujo el concepto de población y muestra, y en que los datos no
son equivalentes a información. Pero también hay que entender que al aplicar los
métodos estadísticos a variables, existen diferentes tipos de variables, en las cuales las
más comunes son las variables de naturaleza cuantitativa y cualitativa, en la que cada una
de estas naturalezas se pueden subdividir tipos de características de variables (Figura 2).
Página 5 de 29

Figura 2: Naturaleza de las variables

Fuente: Anderson, D., Sweeney, D. y Williams, T. (2008). Estadística en la Administración y


Economía. México DF: Cengage Learning.

Las observaciones de una variable de naturaleza cuantitativa pueden diferenciarse de dos


formas: Continua y Discreta. Las observaciones de una variable continua toman cualquier
valor dentro de un intervalo específico, por ejemplo, el monto del impuesto sobre la
renta, la estatura de una persona, las mediciones de una casa, etc. En cambio, las
observaciones de una variable discreta adoptan solo ciertos valores.

Por otro lado, las observaciones de una variable de naturaleza cualitativa pueden
diferenciarse de dos formas: Nominal y Ordinal. Estas observaciones vienen dadas por la
cualidad de lo que se quiere medir. Las observaciones de una variable nominal pueden ser
los estados civiles (soltero, casado, viudo, etc.). Las observaciones de una variable ordinal
vienen dadas por una cualidad ordenada, por ejemplo, jerarquías en una empresa (dueño,
gerente general, gerente de división, etc.). Tanto la nominal y la ordinal viene dadas por
cualidades, pero se diferencias en que una sigue un orden jerárquico y la otra no
(nominal).

1.4 Estructuras de información


Dado que conocemos ciertos conceptos y definiciones claves para introducirnos en
métodos estadísticos, faltaría solamente conocer los tipos de estructuras de información,
con la que comúnmente se trabaja.

Cuando se trabajan con métodos estadístico no solamente basta conocer de forma


conceptual los métodos propiamente tal, si no también saber qué tipo de estructuras de
información se tiene para aplicar estos métodos estadísticos conocidos, de estos se
desprenden dos muy importante: Corta Transversal y Serie de Tiempo.
Página 6 de 29

Cuando tenemos base de datos de corte transversal se hace referencia a un set de datos
capturadas en un instante de tiempo. Por ejemplo, la información de los trabajadores de
una(s) empresa(s) (Tabla 2).

Tabla 2: Base de datos de corta transversal, información de empleados


Salario N° hijos Estado civil Cargo empresa Religión
Obs. 1 $ 374.976 1 Casado Analista Ateo(a)
Obs. 2 $ 176.124 2 Soltero Gerente general Católico
Obs. 3 $ 135.656 3 Viudo Gerente Católico
Obs. 4 $ 106.817 2 Casado Gerente Ateo(a)
Obs. 5 $ 278.960 3 Soltero Analista Católico
Obs. 6 $ 568.045 5 Soltero Analista Judaísmo
Obs. 7 $ 580.341 1 Casado Jefe Ateo(a)
Obs. 8 $ 478.178 2 Soltero Gerente Católico
Obs. 9 $ 689.251 3 Viudo Jefe Judaísmo
Obs. 10 $ 197.330 4 Casado Jefe Ateo(a)
Fuente: Elaboración propia

En relación con la Tabla 2, esta se puede considerar una base de datos de 10


observaciones capturadas en un instante de tiempo. Ahora bien, como toda variable de
datos tiene ciertos componentes, como: observaciones (registro), campo, variables, datos
(observar glosario para su definición).

Por otro lado, tenemos otra estructura de información denominada Serie de tiempo en
que hace referencia a una variable seguida en el tiempo (Tabla 3).

Tabla 3: Serie de tiempo, indicadores económicos


Tiempo IMACEC % desempleo IPC
ene-15 8% 3% 114
feb-15 8% 3% 105
mar-15 9% 4% 116
abr-15 9% 4% 103
may-15 9% 4% 120
jun-15 9% 4% 116
jul-15 9% 4% 114
ago-15 9% 4% 114
sept-15 9% 4% 110
oct-15 9% 4% 104
Fuente: elaboración propia
Página 7 de 29

En relación con la tabla 3, se tienen variables en que sus datos se encuentran capturados
en diferentes instantes en el tiempo (periodicidad mensual). Estos tipos de métodos
sirven para la realización de pronósticos como ventas, costos, demandas, etc.

Cabe mencionar que en la estadística avanzada hay métodos que sirven para ciertas
estructuras de información es por eso la importancia de identificar a priori qué tipo de
estructura de información se utiliza para así lograr aplicar el método correspondiente.

Por ultimo, en el curso revisaremos métodos que son indiferentes a la estructura de


información, sin embargo, se podrán realizar ciertos gráficos que son más adecuados para
ciertas estructuras de información que otras.

2. Tabulación de datos cualitativos

2.1 Distribución de frecuencias


Los datos cualitativos emplean etiquetas o nombres para determinadas categorías de
elementos iguales. En este capítulo se presentan métodos tabulares y gráficos para
resumir la información de las variables a analizar.

En todo el mundo se encuentran con ese tipo de presentaciones tabulares, como reportes
anuales, artículos, estudios e investigación, etc. Por eso es útil saber cómo se calculan e
interpretan.

La distribución de frecuencias es unas de las medidas más usuales en los métodos de


tabulación, en la que permite un resumen tabular de datos que muestra el número
(frecuencias) de elementos en cada una de las diferentes clases disyuntas (que no se
sobreponen).

Supongamos que se tiene en una base datos, una variable en que la detalla una lista de
refresco (Coca-Cola, Sprite, Inca-Cola y Pepsi) vendidos en un período de un año. Si se
logra aplicar un método tabular, pasaría esa variable en forma de lista a un cuadro de
resumen (Tabla 4).
Página 8 de 29

Tabla 4: Frecuencia absoluta, refrescos


Refrescos Frecuencia absoluta
Coca-Cola 100
Pepsi 110
Inca Cola 30
Sprite 80
Fuente: Elaboración propia

En base a la Tabla 4, se puede señalar en que los refrescos más vendidos en un año son
Coca-Cola y Pepsi. Esta tabla resumen aporta mucho más que si se detalla la lista de los
refrescos en la variable. Ahora bien, hay que tener presente que al vender más refrescos
de Coca-Cola y Pepsi no significa que les fue mejor con respecto a los demás refrescos, es
por eso la importancia de los métodos de frecuencia relativa.

2.2 Distribución de frecuencias relativa


Cuando una empresa establece la demanda anual, mediante pronósticos, la empresa
adecúa todo un sistema para tener un stock en bodega para poder satisfacer la demanda.

Tabla 5: Frecuencia relativa, refrescos


Refrescos Frecuencia absoluta Stock Frecuencia relativa
Coca-Cola 100 500 20.0%
Pepsi 110 500 22.0%
Inca Cola 30 40 75.0%
Sprite 80 100 80.0%
Fuente: Elaboración propia

Mediante la tabla 5, se desprende que la información realmente está completa para


realizar un correcto análisis de las ventas de refrescos, señalando las mejores ventas
vienen de los refrescos de Inca-Cola y Sprite, siendo un 75% y 80% respectivamente.

Como se señaló anteriormente, los refrescos que más se vendieron en el año fue Coca-
Cola y Pepsi, pero eso no significa que les fue mejor en las ventas ajustado al stock con
respecto a los otros refrescos. Es importante relativizar las frecuencias absolutas con
respecto a tu clase subyacente; en términos matemáticos esto se representaría en base a
la ecuación 1.
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑎 (𝐹𝐴𝑐 ) (1)
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑅𝑒𝑙𝑎𝑡𝑖𝑣𝑎 (𝐹𝑅𝑐 ) =
𝑛
Página 9 de 29

En donde c representa la clase subyacente.

2.3 Gráfico: barra y pastel


Cuando un analista está trabajando con métodos estadísticos, puede representar los
resultados de dos formas: 1. Métodos numéricos o tablas, y 2. Métodos gráficos. Es
importante recalcar que los métodos númericos en ocasiones esconden ciertos detalles en
que los métodos gráficos fácilmente son detectables. Además, los métodos gráficos son
formas en que se puede representar los resultados de manera más clara y entendible a la
audiencia a la que estamos presentado los resultados obtenidos mediante los análisis
estadísticos.

Los gráficos de barra o diagrama de barra son una gráfica para representar los datos
cualitativos de una distribución de frecuencias (absoluta) o frecuencias relativas, donde se
señala en el eje horizontal las etiquetas o clases subyacentes a la variable bajo análisis. En
el eje vertical se muestran las magnitudes segundo método estadístico aplicado a graficar.

Figura 3: Gráfico de Barra, refrescos

Fuente: Elaboracon Propia.


Página 10 de 29

Observando las gráficas de la figura 3, se puede ver claramente que las ventas en términos
relativos al stock son mayores a los refrescos que se vendieron de forma absoluta.

Por otro lado, existen los gráficos de pastel o anillo que tienen la misma finalidad que los
gráficos de barra pero representado de otra forma. En vez de representar barras verticales
según la magnitud de la frecuencia, los gráficos de pastel o torta señalan regiones o áreas
según la magnitud de la frecuencia. Ambos son válidos para dar a conocer la frecuencia
absoluta o relativa.

3. Tabulación de datos cuantitativos

3.1 Distribución de frecuencias

Anteriormente hemos señalado los métodos de cálculo de las frecuencia absolutas y


relativas para datos en la que son cualitativos, este último es relativamente sencillo dado
que las clases correspondiente a la tabulación corresponden en igual medida a las clases
subyacentes que corresponden a la variable, es decir, si tenemos diez categorías
tendremos diez clases para tabular.

En el caso de datos que son cuantitativos se hace un poco más complejo dado que no se
tiene clases subyacentes que a su vez no son semejantes a las observaciones de la
variable. Es por eso por lo que hay que cumplir tres pasos para calcular las respectivas
frecuencias absolutas y relativas, estos pasos serían:

1. Determinar el número de clases disyuntas


2. Determinar el ancho de clase
3. Determinar los límites de clases

3.2 Número, ancho y límite de clases


El número de clases hace referencia en cuantos intervalos se tabulará la variable que
contiene datos cuantitativos. En la literatura, establecen que entre 5 a 20 intervalos es lo
óptimo para establecer las clases para estos tipos de datos. Pero existen ciertos métodos
que permiten suavizar la cantidad de intervalos cuando la cantidad de observaciones
tienden al infinito. Este criterio es denominado criterio de Sturges.
Página 11 de 29

Criterio de Sturges
El criterio de Sturges permite suavizar el número de intervalos cuando la
cantidad de observaciones tiende hacer muy alta. Si se establece un rango
entre 5 y 20 clases para una cantidad de observaciones muy grande, no será
posible observar de forma adecuada la distribución de las frecuencias.
𝑆𝑡𝑢𝑟𝑔𝑒𝑠 = 1 + 3.3 ∗ 𝐿𝑜𝑔(𝑛) (2)
El cálculo del número de clases según Sturges viene dado por la ecuación 2, en
donde la n es el número de observaciones de la variable.

Luego que se determina el número de intervalos o clases se debe definir el ancho de cada
una de clases, es decir, se debe medir el rango entre el límite inferior y superior por cada
una de las clases. Para encontrar el ancho de clases se utiliza ecuación 3.

𝑀𝑎𝑥𝑖𝑚𝑜 𝑉𝑎𝑙𝑜𝑟 − 𝑀𝑖𝑛𝑖𝑚𝑜 (3)


𝐴𝑛𝑐ℎ𝑜 𝑑𝑒 𝐶𝑙𝑎𝑠𝑒 =
𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝐶𝑙𝑎𝑠𝑒𝑠

Cabe destacar que hacer las clases de un mismo ancho de clase reduce la posibilidad de
que los usuarios hagan interpretaciones inapropiadas. En ocasiones, la ecuación 3
entregará un valor decimal, el cual el usuario deberá aproximarlo a un número entero,
siempre y cuando los datos de la variable no sean decimales.

Por último, los límites de clases determinan los límites inferior y superior por clase
asociadas. Cada una de clases (calculadas por la ecuación 2) deberá tener un valor mínimo
y máximo en la unidad de medida en que se está midiendo la variable bajo análisis.
Volviendo al ejemplo de los refrescos, supongamos que adicionalmente a la variable que
lista cada uno de ellos, se tiene otra variable que muestra las ventas anuales con
periodicidad diaria de cada uno de los refrescos. Es decir, tenemos una estructura de
información de serie de tiempo en la que se tienen 365 ventas por cada uno de los
refrescos. Si llevamos a cabo los pasos (1), (2) y (3) podemos observar lo siguiente:

3.3 Cálculo de los pasos


Paso 1: Número de clases
Considerando la ecuación 2 para el cálculo del número de clases o el número de intervalos
a tabular, se considera lo siguiente:
Página 12 de 29

𝑆𝑡𝑢𝑟𝑔𝑒𝑠 = 1 + 3.3 ∗ log(365) = 9.45 ≈ 10

En donde el número de clases para las ventas del refresco sería de diez.

Paso 2: Ancho de clases


Luego de calcular el número de clases, se debería calcular el valor que separar´ los límites
inferior y superior, mediante la ecuación 3.
$99.612 − $5.091
𝐴𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = = $9.452
10
Es decir, que el rango entre los límites por cada clase será de $9.452.

Paso 3: Límites de clases


Cada clase tendrá un respectivo límite inferior y superior, en donde el límite inferior de la
clase 1 será el valor mínimo (desde ahí comenzará) y terminará con el máximo valor de los
datos de esa variable que corresponde al límite superior de la clase 10.
Tabla 6: Límites de clases
Tabulación Coca-Cola
Clase Límite Inf. Límite Sup.
1 $ 5,091 $ 14,543
2 $ 14,543 $ 23,995
3 $ 23,995 $ 33,447
4 $ 33,447 $ 42,899
5 $ 42,899 $ 52,351
6 $ 52,351 $ 61,803
7 $ 61,803 $ 71,255
8 $ 71,255 $ 80,707
9 $ 80,707 $ 90,159
10 $ 90,159 $ 99,612
Fuente: Elaboración propia

En la tabla 3 se pueden observar los límites inferior y superior de cada una de las clases.
Estos son los tres pasos para definir las clases de una variable con datos cuantitativos,
luego de esto pueden comenzar a calcular las respectivas frecuencias absolutas, relativa y
relativa acumulada como se muestra en la tabla 7.
Página 13 de 29

Tabla 7: Frecuencias de las ventas de Coca-Cola

Tabulación Coca-Cola
Clase Límite Inf. Límite Sup. Rangos Frec. Abs. Frec. Rel. Frec. Rel Ac
1 $ 5,091 $ 14,543 5091 - 14543 45 12% 12%
2 $ 14,543 $ 23,995 14543 - 23995 38 10 23%
3 $ 23,995 $ 33,447 23995 - 33447 45 12% 35%
4 $ 33,447 $ 42,899 33447 - 42899 40 11% 46%
5 $ 42,899 $ 52,351 42899 - 52351 23 6% 52%
6 $ 52,351 $ 61,803 52351 - 61803 38 10% 63%
7 $ 61,803 $ 71,255 61803 - 71255 33 9% 72%
8 $ 71,255 $ 80,707 71255 - 80707 42 12% 83%
9 $ 80,707 $ 90,159 80707 - 90159 29 8% 91%
10 $ 90,159 $ 99,612 90159 - 99612 32 9% 100%
Total 365 100%
Fuente: Elaboración propia
En la tabla 4, se observa que la tabulación de las ventas de Coca-Cola tienen frecuencias
absolutas y relativa medianamente parejas, es decir, que en cada una clase tienen una
igual proporción de cantidad de ventas, siendo el menor valor un 6% hasta un máximo del
12%. En ocasiones hay que observar la frecuencia relativa acumulada dado que existe la
posibilidad en que las frecuencias relativas se acumulan en ciertas clases.

Tip en Excel - Cálculo de frecuencia absoluta


En Excel existe la función para calcular las frecuencias absolutas sin la necesidad de
usar una función =Contar.Si(). La función que permite contar las observaciones
dando a conocer de forma inmediata el rango (datos de la variable) y rango de
clase (límite superior) es la función =Frecuencia()

3.4 Frecuencia relativa acumulada


La frecuencia relativa acumulada señala la velocidad en que crece las frecuencias de
ventas a medida que aumenta el número de clases o análogo que aumente las ventas. Es
por eso la importancia del cálculo de la frecuencia relativa acumulada para señalar la
concentración en alguna clase.

En base al ejemplo de las ventas de refresco, como existe una distribución homogénea en
las clases, se esperaría que la frecuencia relativa acumulada se distribuya de la misma
Página 14 de 29

forma. Una buena forma de señalar la distribución de la frecuencia relativa acumulada en


mediante un gráfico de Ojiva, Figura 4.

Figura 4: Gráfico de Ojiva, ventas de Coca-Cola

Fuente: Elaboración propia

En relación con la figura 5, se observa que es relativamente homogéneo por clases siendo
las clases de en medio de la que hay una curva en la que representa menor cantidad de
ventas en las clases de al medio (6% y 10% observar tabla 6).

3.5 Gráfico: Histograma y Ojiva


Una presentación usual para datos cuantitativos es el histograma. Esta gráfica se hace con
los datos previamente tabulados mediante las distribuciones de frecuencias. Un
histograma se construye colocando las clases en el eje horizontal, y la frecuencia en el eje
vertical.

Figura 5: Histograma, ventas de Coca-Cola

Fuente: Elaboración propia


Página 15 de 29

Uno de los usos más importantes de un histograma es proveer información acerca de la


forma de la distribución. Se dice que un histograma es sesgado a la izquierda si su cola se
extiende más hacia la izquierda. Dichos histogramas son típicos para calificaciones: no hay
calificaciones mayores a 100%, la mayor parte están arriba de 70% y solo hay unas cuantas
bajas. Ejemplos de este tipo de histogramas son los datos de los precios de las casas; unas
cuantas casas caras crean el sesgo a la derecha.

Como el histograma y la ojiva trabajan bajo una variable tabular, estos gráficos se podrían
combinar en uno solo, mostrando los detalles de la compensación. Por ejemplo, si se
combina el gráfico 2 y 3 logramos obtener un detalle en el que las clases de en medio son
las que menor frecuencia tienen por lo que en el gráfico de ojiva se observaría el efecto.

Figura 6: Histograma y Ojiva, ventas de Coca-Cola

Fuente: Elaboración propia

Tip en Excel - Histograma


La tabulación y el histograma para una variable de datos cuantitativos se pueden
realizar mediante herramientas de Excel. Para este caso, se utilizará la
herramienta análisis de datos que se encuentra en la pestaña Datos.
Para activar esta herramienta tiene que ir archivos – opciones – complementos –
ir – ticket en herramientas para análisis.
Estando en la herramienta Análisis de Datos abrir Histogramas.
Página 16 de 29

4. Medidas estadísticas
4.1 Medida de Tendencia Central

4.1.1 Promedio y Media


Las medidas de tendencia central son unas de las primeras medidas estadísticas que se
calculan para hacer cualquier análisis de los datos, desde ventas de empresas y costos
hasta promedios de notas en las universidades y colegios.

Principalmente esta es una de las medidas más utilizadas, por la interpretación sencilla
que conlleva, en la que calcula principalmente el valor central de los datos de una
variable, de la cual viene dado por la ecuación 1.
∑ 𝑥𝑖 (1)
𝑥̅ =
𝑛
La ecuación 1 calcula la suma de los valores de la variable dividida por la cantidad de
observaciones de esta. Es decir, es una suma ponderada de igual peso para cada
observación de la variable.

En la literatura se hace referencia a un promedio y una media como distintas formas de


representan un promedio, pero eso viene dado por el concepto de población y muestra.
Cuando se calculan los promedios a nivel población (𝜇) y media (𝑥̅ ) a nivel de muestra, sin
embargo, la interpretación es exactamente la misma entre ambas.

4.1.2 Mediana
La mediana es un método análogo al del promedio (pertenecientes a la misma familia)
pero su interpretación y cálculo se diferencian. La mediana es una medida que a su vez es
equivalente a un percentil, principalmente, al percentil 50 (medida de localización). Lo que
busca la mediana es encontrar el valor de en-medio de las observaciones de la variable.

El cálculo de esta medida viene por dos métodos que se alinean para encontrar el valor de
en-medio de la variable (observar ecuación 2).

Ordenar de menor a mayor las observaciones. Si:


1. El número de observaciones es impar, la mediana es el valor de en-medio.
2. El número de observaciones es par, la mediana será el promedio de los (2)
valores de en-medio.

Calcular el valor de en-medio de la variable realmente no suma mucho valor, pero en


cambio si interpretamos de forma conjunta la media y la mediana genera una
Página 17 de 29

interpretación mucho más robusta, y una interpretación adicional que si lo hacemos por si
solas.

En otras palabras, y rescatando el ejemplo aludido al principio de la unidad, la mediana de


las recaudaciones de Disney y Pixar es de $253 y $505 respectivamente. Realmente, estos
valores no nos entregan mucho valor más que Pixar en mediana recauda más que Disney;
pero si se hace la interpretación en conjunto al promedio ($255 y $539), se observa que
existe una diferencia entre los promedios y la mediana para cada una de las empresas, es
decir, la diferencia entre sus media y mediana de Disney y Pixar es de $2 y $34,
respectivamente. La diferencia de media y mediana de Pixar es mucho mayor que la de
Disney y eso significa, adicionalmente a la interpretación, que Pixar tiene recaudaciones
más a la derecha (películas con mayores recaudaciones) que las de Disney, en donde
prácticamente la media y la mediana son iguales.

Ahora bien, a qué explicación se viene lo anterior. La mediana a diferencia de la media es


una medida no sensible a los datos, dado que calcula un valor de en-medio (nunca
considera la magnitud para hacer los cálculos). En cambio, la media sí considera la
magnitud de las observaciones, que a su vez la hace ser sensible a la magnitud de los
datos. Por lo tanto, si la diferencia entre la media y la mediana es grande significa que
existen observaciones atípicas que hacen que la media se dispare, al alza o a la baja, pero
la mediana queda en una misma ubicación.

Tip en Excel – Promedio y Mediana


En Excel se puede calcular de dos formas las medidas de estadísticas: mediante
funciones y mediante la herramienta para análisis. Si se utiliza las funciones solo
bastaría señalar en una celda =promedio() y =mediana().
En cambio, si se desea utilizar las herramientas para análisis, basta con ir a Datos –
Análisis de Datos (junto a solver) – Estadística Descriptiva.

4.2 Medidas de Variabilidad

4.2.1 Desviación Estándar


Las medidas de variabilidad son medidas que acompañan la interpretación de las medidas
de tendencia central, sobre todo la medida de desviación estándar.
Página 18 de 29

En ciertos rubros industriales, por ejemplo, en el rubro financiero, la desviación estándar


hace referencia a riesgos porque da a conocer la volatilidad que tiene un activo financiero
con respectivo a su medio, en donde mientras más volatilidad tiene el activo financiero es
más riesgoso.

Ese mismo ejemplo anterior se desprende que la desviación estándar es una medida de
variabilidad interpretable por el usuario y viene calcula por la ecuación 3.
2 (3)
∑(𝑥𝑖 − 𝑥̅ )
𝑠 = √( )
𝑛−1

La desviación estándar al igual que la media tiene una simbolización cuando se requiere
calcular la desviación estándar poblacional (𝜎) y una desviación estándar muestral (𝑠).

Este método permitiré ser interpretado fácilmente, porque se interpreta con las mismas
unidades de medida que tiene los datos. En otras palabras, la desviación estándar de las
recaudaciones de Disney y Pixar es de $103.4 y 189.8, respectivamente. La desviación
estándar de Pixar es mucho más dispersa que la desviación estándar que Disney con
respecto a su media. Es decir, Pixar es mucho más volátil en sus recaudaciones que
Disney. ¿Pero si la ajustamos con su media, realmente será más homogéneas las
recaudaciones de Pixar con respecto a la de Disney? Para responder esa pregunta se
tendrá que definir qué es un Coeficiente de Variación, lo que se indicará más adelante.

4.2.2 Varianza

La varianza es como el hermano mayor de la desviación estándar. Mediante el cálculo de


la varianza se podrá obtener el valor de la desviación estándar. A diferencia de la
desviación estándar, la varianza es una medida no interpretable, es decir, una medida
denominada adimensional dado que se pierden las unidades de medidas al momento en
que se eleva al cuadrado.

Por lo cual, uno denomina la varianza y todas las medidas adimensionales como medidas
de cálculo dado que son medidas que se utilizan para calcular otras medidas, y en
ocasiones esas otras medidas son medidas que se pueden interpretar para el uso del
negocio.
Página 19 de 29

Por ejemplo, cuando se calculan portafolio de inversión, se calcula la varianza y no la


desviación estándar para construir portafolio, pero si se desea saber el riesgo del
portafolio se calcula desviación estándar.

Tip en Excel – Desviación estándar y Varianza


Para hacer el cálculo de la desviación estándar y varianza se podrá utilizar las
funciones de Excel: =desvest.m( ) y =var.m( ). La “m” o la “p” hacen referencia si se
requiere calcular una medida muestral o una medida poblacional. Normalmente se
calcula con “m”.

4.2.3 Coeficiente de variación

El coeficiente de variación es una medida poca conocida en el área de los negocios, pero
de gran utilidad. Lo que calcula esta medida es una dispersión ajustada por su media, es
decir, calcula un grado de homogeneidad de los datos que está acotado entre 0 y 1 o 0 y
100, si es que se multiplica por cien, como viene dada en la ecuación 4.
𝑠 (4)
𝐶. 𝑉 = ⋅ 100
𝑥̅

Si volvemos al ejemplo de las recaudaciones de Disney y Pixar encontramos que el


coeficiente de variación es de 40.4% y 35.2%, respectivamente. Eso quiere decir la
desviación estándar de Pixar es mayor que la Disney, pero al ajustarla por su promedio las
recaudaciones Pixar son más homogéneas que las de Disney. Esto se debe principalmente,
a que las medias de Disney y las de Pixar se encuentran en una misma unidad de medida,
pero en diferentes escalas.

El coeficiente de variación también sirve para comparar dos variables en la que sus datos
están con diferentes unidades de medidas, por ejemplo, ventas en pesos ($) y en millones
de pesos (MM$). Teniendo esa figura no podrá utilizar la desviación estándar y
compararlas; pero si podrá utilizar el coeficiente de variación sin la necesidad de
transformar una variable y dejarla en la misma unidad de medida que la otra.
Página 20 de 29

4.3 Medidas de Localización

4.3.1 Percentiles

Los percentiles son de la familia de las medidas de localización. Al igual que la mediana,
son medidas que permiten saber la ubicación de un cierto valor dentro de las
observaciones de la variable. Es decir, si se requiere saber la ubicación de un valor dentro
de las observaciones se tendrá que localizar la ubicación que corresponde a ese valor
dentro de las observaciones de la variable.

Existe un ejemplo muy bueno para lograr identificar la utilidad que tienen los percentiles
dentro de las medidas descriptivas, y ese ejemplo es:

“No dice nada que un estudiante tuvo 62 punto de 120 en el examen de estadística en
comparación de otros estudiantes, pero sí dice que ese puntaje se ubicó en el percentil
82%, es decir, el 82% de los estudiantes tuvieron un puntaje menor a 62 puntos y 18% de
los estudiantes tuvieron un puntaje mayor a 62 puntos”.

Por otro lado, volviendo al ejercicio de las recaudaciones de Disney y Pixar, se podrá
obtener una mejor información si cruzamos los valores de las recaudaciones de una
empresa para saber en qué ubicación se encuentran dentro de las recaudaciones del otro.
Es decir, la máxima recaudación de Disney es $448 y esa recaudación se localiza en la
ubicación de las recaudaciones de Pixar en el lugar 33.9%. Lo anterior hace referencia que
la máxima recaudación que obtuvo Disney con sus películas se ubicó en la posición 33.9%
de las recaudaciones de Pixar (relativamente bajo), a su vez, el 66.1% (100-33.9) de las
recaudaciones de Pixar se encuentran sobre la máxima recaudaciones de las películas de
Disney.

Otro análisis interesante es observar en qué lugar se ubica la mínima recaudación de Pixar
dentro de las recaudaciones de Disney.

Tip en Excel – Percentiles


Para calcular los percentiles en Excel se puede hacer de dos formas: una de forma
incluyente y la otra de forma excluyente. Es decir, si desea saber la ubicación de
un valor dentro de las observaciones de la variable puede señalar si el valor se
quiere incluir (incluyente), pero si se desea no incluir el valor, y solo considerar
menor a ese valor se tiene que señalar excluir. La forma con que se calcula en
función es con =rango.percentil.exc( ) o =rango.percentil.inc( ).
Página 21 de 29

4.4 Medidas de asociación

4.4.1 Coeficiente de correlación

A medida que se avanza en la unidad se encontrarán que los análisis de los datos ya no
son solo univariados, no solo se analiza por sí sola la variable, sino también se incluye
análisis de dos o más variables. Las medidas de asociación son medidas en las que sí o sí se
necesitan dos variables para que el método funcione.

El coeficiente de correlación es una medida que permite observar la asociación lineal que
existe entre dos variables, en la que viene dada por la ecuación 5.
𝑛∑𝑥𝑖 𝑦𝑖 − ∑𝑥𝑖 ∑𝑦𝑖 𝜎𝑥𝑦 (5)
𝑟𝑥,𝑦 = → 𝜌𝑥𝑦 =
𝜎𝑥 𝜎𝑦
√𝑛∑𝑥𝑖2 − (∑𝑥𝑖 )2 ⋅ √𝑛∑𝑦𝑖2 − (∑𝑦𝑖 )2

La ecuación 5 representa el coeficiente de asociación lineal que existe entre dos variables
y y x. En la que se encuentra acotada en -1 y 1. Por lo tanto, si el coeficiente de correlación
entrega un valor positivo y cercano a uno significa que las dos variables tienen un alto
nivel de correlación y son directamente proporcionales. Lo mismo sucede si el coeficiente
de correlación entrega un valor cercano a menos uno (≈ −1); pero en este caso sería
inversamente proporcional.

El coeficiente de correlación de las recaudaciones de las empresas es de un +70.4%, eso


quiere decir que a medida que aumenta las recaudaciones en ambos casos, estos están
correlacionados positiva y directamente proporcionales. Pero ojo, no quiere decir que a
medida que aumente las recaudaciones de una empresa causa el aumento de recaudación
en la otra empresa, eso se denomina causalidad y se calcula con otros métodos.

4.4.2 Covarianza

La covarianza es una medida que mide variación conjunta entre dos variables. Esta medida
es otra medida de las denominadas medidas de cálculo (al igual que la varianza) porque es
una medida sensible a las magnitudes de las observaciones y no interpretable para el
negocio.

Esta es una de las medidas que viene de la mano con el coeficiente de correlación (Freund,
Miller y Miller, 2000), dado que esta medida es un input dentro del cálculo de este,
mediante el factor (𝜎𝑥𝑦 ), viene dada por la ecuación 6.
Página 22 de 29

∑(𝑥𝑖 − 𝑥̅𝑖 )(𝑦𝑖 − 𝑦̅𝑖 ) (6)


𝑆𝑥𝑦 = ⟶ 𝐶𝑂𝑉(𝑥, 𝑦) = 𝜌𝑥𝑦 𝜎𝑥 𝜎𝑦
𝑛−1

La ecuación 6 representa la forma con la cual se debería calcular la varianza conjunta


entre dos variables, pero como su limitación es la interpretación se utiliza el coeficiente de
correlación para cumplir con ese propósito.

Tip en Excel – Coeficiente de Correlación y Covarianza


Para ambos casos se puede utilizar la herramienta analítica (“Análisis de Datos”)
pero también se puede utilizar las funciones de Excel, como: =coef.de.correl( ) y
=covariance.m( )

5. Distribuciones de probabilidad y momentos


5.1 Distribuciones de probabilidad
Cuando una persona habla de variable aleatoria, en la que puede ser ventas de la
empresa, los costos de la empresa, la serie de precios de acciones de una empresa que
transa en bolsa, etc. Estas siguen un comportamiento, se compartan de cierta forma, y ese
comportamiento tiene un nombre que viene asociado al nombre de una distribución de
probabilidad.

Actualmente existen muchas distribuciones de probabilidad: Normal, Triangular,


Uniforme, La Place, Gumbell, Pert, entre muchas otras (casi 54 distribuciones). Cada una
de esas distribuciones tienen un comportamiento que, en cierto método estadístico, se
podría asociar a un comportamiento de alguna variable que estaremos analizando.

En este curso, no nos interesa mucho saber que comportamiento se asocia las
recaudaciones de Disney y Pixar; pero sí nos interesa saber las características que tienen
esas variables para poder interpretarlas.

Cada distribución de probabilidad viene asociadas a las características de las


distribuciones de probabilidad denominadas momentos de una distribución.

Los momentos de una distribución son conocidos como cuatro y enumerados: Esperanza,
Varianza, Asimetría y Curtosis (Behar y Grima, 2018). Los dos primeros momentos ya se
Página 23 de 29

analizaron, pero faltaría analizar e interpretar el tercer (asimetría) y el cuarto (curtosis)


momentos de las distribuciones de probabilidad.

Como mencionamos anteriormente, todas las distribuciones de probabilidad tienen estos


cuatro momentos, pero el cálculo de cada una de ellas es diferente según distribución. Eso
sí la interpretación sigue siendo la misma indiferente al cálculo que se realice.

5.2 Tercer y Cuarto Momento


Los momentos de una distribución se calculan por variables: si tengo cinco variables, cada
una de esas cinco variables tendrá su respectivo valor de asimetría y curtosis.

La asimetría corresponde el tercer momento de la distribución de probabilidad, y esa


señala el lugar en donde se encuentran concentrados las observaciones de la variable
(Figura 7).

Figura 7: Formas de Asimetría

Fuente: elaboración propia

Si el valor de la asimetría es menor a cero significa que la concentración de los datos se


encuentra hacia la derecha, caso contrario si la asimetría es positiva; pero si la asimetría
es igual a cero significa que la concentración de los datos se encuentra al centro (Behar y
Grima, 2018).
Página 24 de 29

En el caso de la curtosis, esta hace referencia a nivel de apuntalamiento que tiene los
datos, esto quiere decir que si los datos tienen un nivel de apuntalamiento alto significa
que existe una mayor probabilidad de ocurrencia que ocurran los datos atípicos o
extremos. Lo anterior se denomina leptocurtosis, como se muestra en la Figura 8.

Figura 8: Formas de Curtosis

Fuente: elaboración propia

Si la variable tiene una curtosis negativa significa que es platicurtica (más achatada), en
cambio sí es igual a cero es mesocurtica.

Ahora bien, lo interesante de esto es la interpretabilidad que se puede dar al combinar la


asimetría y la curtosis de forma conjunta. Si estamos analizando ventas de una empresa
esperaremos que las ventas de estas tengan una asimetría negativa, concentración de los
datos al lado derecho; y una curtosis positiva (leptocurtica) mayor probabilidad de
ocurrencia de los datos extrenos. Por lo tanto, al tener concentración al lado positivo y
con mayor probabilidad de ocurrencia, se puede dar la posibilidad que las ventas tengan
altas probabilidades de encontrarse en el lado derecho de la campana (ventas anormales).

Para caso de las recaudaciones de Disney y Pixar tenemos que Pixar tiene asimetría
positiva, pero con altas probabilidad que ocurran datos extremos, en cambio, Disney
ocurre lo contrario es platicurtico, pero con niveles de asimetría negativa, que a su vez se
puede ver representado en la diferencia de la media y la mediana.
Página 25 de 29

Tip en Excel – Asimetría y Curtosis


Los cálculos de estos dos momentos se pueden realizar por la función de Análisis
de Datos, y también por las funciones de Excel, como: =Coeficiente.Asimetria( ) y
=Curtosis( )

6. Elaboración de una hipótesis nula y una alternativa


6.1 Conceptos de muestra y población
Recordando un poco los inicios del curso, señalamos que unas de las principales fuentes
de información que debería tener la estadística eran los datos capturados por una
empresa, institución, empresas u otra organización que requería hacer un estudio
estadístico.

Al momento de hacer un análisis estadístico y por la cual entra en juego la estadística es


que el 99.999% de las veces no se pueden capturar todos los datos para realizar el estudio
por varias razones. Una de la más importante, es que es imposible de capturar entrevistar
o capturar todas las observaciones de estudio que se requiera estudiar.

Es en este momento en que entra en juego la estadística. Como solamente obtendrá una
muestra de toda la población es donde la estadística inferencial entra en juego; infiriendo
una hipótesis sobre la población, pero utilizando una muestra. Realmente lo anterior tiene
mucha lógica. Por ejemplo, si necesito medir el tráfico vehicular en un año de una avenida
concurrida, no es necesario estar midiendo los datos durante todo el año, sino más bien
estar solo 3 meses, en donde esos tres meses son significativos para inferir el tráfico
vehicular promedio durante todo el año.

Ahora bien, aunque tenga mucha lógica, debería causar cierta duda, dado que no todo
preciso y perfecto. Porque si utilizamos una muestra para inferir sobre la población se
necesitará tener un nivel de confianza para cuantificar lo que yo estoy tratando de inferir
hacia la población. En otras palabras, se puede hacer referencia que en la Av. Walker
Martínez transitan en promedio 1.250.000 de vehículos anuales, pero es muy diferente
decir, con un nivel de confianza del 95% en la Av. Walker Martínez transitan 1.250.000.
Agregar ese nivel de confianza no solo genera confianza en lo que se está infiriendo, sino
también se están aplicando los métodos estadísticos de forma correcta.
Página 26 de 29

6.2 Prueba de una hipótesis de investigación


Como ya se entiende en donde y en cómo se aplica la estadística inferencial, hay que
aprender a definir una hipótesis correcta.

Cuando alguien habla de hipótesis de investigación no solo está haciendo referencia a un


artículo de investigación, sino en cómo se debería definir una hipótesis correcta y deseada
para lograr inferir de forma correcta sobre la población objetivo.

Por ejemplo, las empresas, sobre todo las empresas manufactureras en que transforman
una materia prima en un producto como un clavo, tienen que llevar un control de calidad
óptimo para cumplir los estándares de fabricación, por lo tanto, la empresa no se puede
dar el lujo de controlar la producción de forma manual, es decir, que esté una persona
midiendo y anotando cada uno de los clavos que está fabricando la máquina, en que
fácilmente en una hora puede producir cientos y miles de clavos.

Por lo tanto, para cumplir los estándares de calidad sin incurrir en costos elevados y en
riesgos operacionales se puede utilizar estadística inferencial para saber si las máquinas
están elaborando clavos con los estándares óptimos de calidad.

Entonces, lo que primero que uno se debería preguntar es ¿qué es lo que quiero medir? y
si tengo lo adecuado para comprobar la hipótesis de lo que deseo medir. En caso de los
clavos, deseo medir que todos los clavos tengan un diámetro de 5mm. Para responder la
primera pregunta, hay que tener claro que las hipótesis en estadística se conocen en dos
tipos: Hipótesis Nulas (ℎ0 ) y Alternativa (ℎ1 ), en donde la hipótesis nula hace referencia a
la hipótesis que deseo medir, y la alternativa a todo lo contrario que la nula.

Por lo tanto, la hipótesis nula será que en promedio los clavos tienen de diámetro 5mm, y
la hipótesis alternativa será que los clavos no tienen (distinto, mayor o menor a 5mm), en
promedio, un diámetro de 5mm. Para lograr saber si la hipótesis nula definida se rechaza
o no se rechaza se tendrá que tener una muestra de clavos en que se traduce en una
variable que haga referencia los diámetros de los distintos clavos de esa muestra.

Por último, falta responder ¿Cuánta es la cantidad óptima de observaciones para tener en
la muestra?
Página 27 de 29

7. Errores tipo l y ll
7.1 Error tipo l y ll
Cuando se hacen pruebas de hipótesis para inferir sobre la población, estas pruebas de
hipótesis entre ellas son de características opuestas, es decir, una confirma un valor pero
la otra hipótesis es la contrapuesta, por lo tanto unas de las dos tienen que ser verdadera
pero no así ambas.

Lo ideal es que la prueba de hipótesis se lleva a la aceptación de H0 cuando H0 realmente


es verdadera, y al rechazo de H0 cuando H1 es sea verdadera. Por desgracia, las
conclusiones correctas no siempre son posibles, dado que como estamos utilizando
observaciones muéstrales, y no poblacionales, siempre cabe la posibilidad del error.

Tabla 8: Tipos de errores


H0 Verdadera H1 Verdadera
Se acepta H0 Conclusión Correcta Error Tipo ll
Se rechaza H0 Error Tipo l Conclusión Correcta

En base a la tabla 8, se pueden dar todas las casuísticas en las que dos son
verdaderamente correctas. Por ejemplo, se comete un error del tipo 1 cuando rechazo la
hipótesis nula (h0) siendo la hipótesis nula verdadera. Por otro lado, tenemos un error del
tipo ll cuando se acepta H0 siendo la hipótesis alternativa la correcta.

Ahora bien, cuando se establecen las hipótesis nula y alternativa cabe la posibilidad que
preferimos cometer menos errores de un tipo que de otro. Por ejemplo, si estamos
evaluando el rendimiento de una máquina, y se establece en la hipótesis nula que el
rendimiento de la máquina es igual a 50 sombreros por minuto ¿Qué tipo de error
queremos disminuir? ¿el error tipo 1 o el error tipo 2?

7.2 Nivel de significancia


Cuando queremos evitar cometer un error del tipo l, es decir, rechazar la hipótesis nula
siendo esta verdadera se le conoce como nivel de significancia. El nivel de significancia es
la probabilidad de cometer un error de tipo l cuando la hipótesis nula es verdadera. Para
denotar este nivel de significancia se utiliza la letra griega alpha (𝛼), y los usuales valores
Página 28 de 29

que se usan son 0.05 (5%) y 0.01 (1%). En otras palabras, seleccionar el alpha significa
controlar el error tipo l, y si el costo de cometer un error del tipo 1 es elevado, los valores
pequeños de alpha son preferibles.

En efecto, al no aceptar directamente H0, se evita el riesgo de cometer un error tipo II.
Siempre que no se determine y controle la probabilidad de cometer un error tipo II, no se
dirá “se acepta H0”. En esos casos solo son posibles dos conclusiones: no se rechaza H0 o
se rechaza H0.

Conclusiones
En esta unidad abordamos los contenidos de los métodos de estadística descriptiva
aplicados a la toma de decisiones, en la que para este caso se tomaron las recaudaciones
de Disney y Pixar, y por qué Disney tenía argumento para poder adquirir Pixar.

Comenzamos analizando los diferentes métodos de los más sencillos y de análisis


univariados hasta los más avanzados de métodos multivariados, principalmente
detallando la intuición, la forma de cálculo, las limitaciones y la interpretabilidad de cada
uno de los métodos.

Por último, encontramos que la empresa Disney tiene fundamentos estadísticos sólidos
para comprar la empresa Pixar. A pesar de que todo análisis lleva un fundamento
estadístico, este debería ir acompañado de un robusto análisis de la industria, análisis de
los fundamentales de la empresa, y un alto nivel del conocimiento del negocio. Los análisis
estadísticos son en ocasiones para fundamentar ciertas decisiones y/o apoyo a la toma de
decisiones en los negocios, por lo tanto, no hay que dejar de lado estos métodos
estadísticos, sobre todo cuando tenemos datos para poder analizar.
Página 29 de 29

Referencias bibliográficas
• Anderson, D., Sweeney, D. y Williams, T. (2008). Estadística en la Administración y
Economía. México DF: Cengage Learning.
• Behar, R. y Grima, P. (2018). 55 respuestas a dudas típicas de Estadística. Díaz de
Santos Biblioteca Digital de Aranjuez.
• DeGroot, M. & Schervish, M. (2002). Probability and Statistics. Boston: Addison-
Wesley.
• Freund, J., Miller, I. y Miller, M. (2000). Estadística matemática con aplicaciones.
México: Pearson.

Ingrese aquí el nombre de la


asignatura

También podría gustarte