Guía Unidad 1 - Datos y Descriptiva

Facultad: CIENCIAS SOCIALES Y EMPRESARIALES
Programa: ESPECIALIZACIÓN EN GERENCIA DE PROYECTOS

Módulo: ESTADÍSTICA
TEMA: DATOS
A manera de introducción se presentarán una serie de definiciones que serán de mucha utilidad para
el desarrollo del módulo.
Los procesos estadísticos: pros y contras

El uso de la estadística y, en general, del análisis de datos en los proyectos de mejora
tienen tres grandes ventajas:
1. Evita dar por válidas afirmaciones e ideas infundadas.
2. Permite argumentar decisiones encaminadas a conseguir mejoras basadas en
evidencias y datos objetivos.
3. Favorece un método de trabajo sistemático.
Por el contrario, una mala utilización de la estadística también entraña ciertos peligros,
debido a que algunos profesionales se basan en los números sin contrastarlos ni
analizarlos adecuadamente. Y esta actitud puede llevar a decisiones erróneas en el
ámbito de la mejora continua de procesos.
Lo que de verdad es importante no son los datos en sí mismos, sino el proceso de
transformación de estos datos en decisiones adecuadas. Es preciso actuar con rigor y
cautela, contrastando fuentes y analizando las cifras concienzudamente. Lo contrario
sería utilizar la estadística de una forma ingenua e, incluso, irresponsable
DISPONIBLE EN: https://www.captio.net/blog/el-papel-de-la-estad%C3%ADstica-y-el-

an%C3%A1lisis-de-datos-en-la-gestion-por-procesos
Estadística:
Es una ciencia formal que se encarga del estudio de una determinada característica a través del uso
y los análisis provenientes de una población de datos, busca explicar las relaciones en los fenómenos.
Es posible hablar de dos tipos o ramas de la estadística:
 Descriptiva: realiza estudios sobre poblaciones completas, a través del cálculo de parámetros
que den información completa.
 Inferencial: realiza estudios sobre un subconjunto llamado muestra y proyecta los resultados
a toda la población.
Población
Es la colección completa de todos los elementos a estudiar, cuando se realiza una medición numérica
de una población esta se denomina parámetro.
Muestra
Es un subconjunto de miembros seleccionados de la población, cuando se realiza una medición
numérica de una población esta se denomina estadístico.
Datos: son las observaciones recolectadas, pueden clasificarse de diversas maneras:
De acuerdo con la naturaleza de los mismos así:

 Datos cualitativos: categorías que se distinguen por características no numéricas, ejm:
género.
 Datos cuantitativos: consisten en números que representan conteos o mediciones, ejm: pesos,
edades.
 Datos discretos: corresponde a aquellos que tienen un número finito o bien son posibles de
contar. Ejm: el número de prendas en una producción.
 Datos continuos: resultan de un número infinito de posibles valores que pueden asociarse a
puntos de una escala continua, sin interrupciones. Ejm: la cantidad de leche que produce una
vaca.
También es posible clasificar los datos en el uso de cuatro niveles de medición:

 Nominal: datos consistentes en categorías que no pueden acomodarse según un esquema
de orden. Ejm: si/no/indeciso; Colores.
 Ordinal: cuando los datos pueden acomodarse en algún orden, aunque no es posible
determinar diferencias entre los valores de los datos. Ejm: calificaciones de aceptable, bueno
y sobresaliente.
 De intervalo: Los datos pueden acomodarse en algún orden, pero la diferencia entre dos
valores tiene un significado. Sin embargo, los datos no tienen punto de partida inherente. Ejm:
temperatura, ya que esta ordenada y tiene intervalos iguales entre ellos, pero no existe un
punto de partida ya que el 0° es arbitrario y no representa la ausencia de calor. El tiempo es
otro ejemplo de datos ordenados en escala de intervalo.
 De razón: es similar a la escala de intervalo, pero tiene un punto de partida o cero que indica
la ausencia de la propiedad o característica estudiada. Ejm: Precios de los elementos.
TEMA: ESTADÍSTICA DESCRIPTIVA (población)
Distribución de frecuencias: lista de valores de datos (ya sea de manera individual o por grupos de
intervalos) junto con sus frecuencias (o conteos) correspondientes,
 Datos no agrupados; es decir tomamos cada dato de manera individual y revisamos su

frecuencia en el conjunto de datos.
Ejemplo:
Se toman los datos obtenidos en una encuesta de satisfacción:
Nada importante Muy importante

1 2 3 4 5
a La cantidad de información recibida
b La claridad de la información
c La utilidad de la información
d La claridad de acceso a la información de la web
Para construir la tabla de frecuencias realizamos:
xi fi Fi hi Hi
xi : Dato
fi : Frecuencia absoluta
Fi: Frecuencia absoluta acumulada
hi : Frecuencia relativa
Hi: Frecuencia relativa acumulada
 Datos agrupados; realizamos grupos o clases de datos para analizar su comportamiento.
Procedimiento:
1. Decida el número de clases que desea tener, se sugiere entre 5 y 20. Puede utilizarse la regla
de Sturges
𝑐 = 1 + 3,322 ∗ 𝐿𝑜𝑔 𝑁
2. Calcular la anchura de la clase como: valor más alto menos valor más bajo, dividido en el
número de clases,
3. Determine el valor más bajo y luego proceda los límites de cada clase
4. Construya una tabla de frecuencias donde se incluya: Clases, marca de clase, frecuencia
absoluta, frecuencia relativa, frecuencia acumulada, frecuencia acumulada relativa.
5. Con base en los datos construya un histograma
xi Xi fi Fi hi Hi
Xi : Marca de clase
Medidas de tendencia central: valor que se encuentra en el centro o la mitad de un conjunto de

datos.
 Media: medida de tendencia central que se obtiene sumando los puntajes y dividiendo el total
entre el número de puntajes.
∑𝑛𝑖=1 𝑥𝑖
𝑥=
𝑁
∑𝑛𝑖=1 𝑥𝑖 ∗ 𝑓𝑖
𝑥=
𝑁
 Mediana: medida de tendencia central que implica el valor que está en medio. Para datos no
agrupados, simplemente se ordenan y se determina directamente, para datos agrupados se
determina en que clase se encuentra realizando (N/2) y luego se aplica la ecuación:
𝑁
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 𝐴 ( 2 )
𝑓𝑖
 Moda: valor que ocurre con mayor frecuencia, un conjunto de datos puede ser bimodal o
multimodal. En el caso de datos no agrupados se revisa la mayor frecuencia absoluta. En
caso de datos agrupados se aplica la siguiente ecuación:
∆1
𝑀𝑜 = 𝐿𝑖 + 𝐴 ( )
∆1 + ∆2
Donde:
∆1 = 𝑓𝑖 − 𝑓𝑖−1
∆2 = 𝑓𝑖 − 𝑓𝑖+1
 Mitad de rango: Se constituye en el valor que está a medio camino, entre el puntaje más alto
y más bajo.
𝑣𝑀 + 𝑣𝑚
𝑀𝑟 =
2
Medidas de variación: aquellas que determinan como varían los datos al interior de una población o
muestra.
 Rango: es la diferencia entre el valor máximo y el valor mínimo 𝒗𝑴 − 𝒗𝒎
 Desviación estándar: medida de variación de los valores con respecto a la media
∑(𝑥𝑖 − 𝑥)2
𝑠=√
𝑁−1
∑(𝑥𝑖 − 𝑥)2 ∗ 𝑓𝑖
𝑠=√
𝑁−1
Cuando hay varios resultados posibles y éstos están muy dispersos se ve

claramente que hay inseguridad en el resultado final de un proyecto, mientras
más concentrados estén los resultados habrá más confianza en el resultado
final y mientras más dispersos estén los resultados más desconfianza habrá
en el resultado final. La desviación estándar es la medida más adecuada para
esta clase de dispersiones.
 Varianza: medida de variación igual al cuadrado de la desviación estándar s2
2
∑(𝑥𝑖 − 𝑥)2
𝑠 =
𝑁−1
2
∑(𝑥𝑖 − 𝑥)2 ∗ 𝑓𝑖
𝑠 =
𝑁−1
 Coeficiente de correlación: medida que indica la situación relativa de los mismos sucesos
respecto a las variables, es decir, el grado de relación entre las 2 variables, su valor siempre
está entre -1(correlación negativa, grande y perfecta) y 1(correlación positiva, grande y
perfecta), el cero corresponde a correlación nula.
Donde:
𝑥 = 𝑥𝑖 − 𝑥 ; 𝑦 = 𝑦𝑖 − 𝑦
El riesgo en una inversión se reduce diversificando un portafolio, lo que

implica comprar capitales con una correlación negativa en términos de
retornos. La correlación negativa significa que, si una acción del portafolio
se está comportando mal, la otra acción sube y viceversa. Un buen portafolio
usualmente incluye acciones de pequeñas y grandes capitalizaciones, bonos,
commodities y divisas
 Coeficiente de variación: describe la desviación estándar relativa a la media, se expresa como

porcentaje
𝑠
𝐶𝑣 = (100%)
𝑥
Cuando se trata de comparar dos a más proyectos en los cuales sus valores son
diferentes, se utiliza el coeficiente de variación para realizar el análisis de
proyectos financieros. Para escoger el mejor proyecto se toma el que tiene
menor coeficiente de variación, ya que este es el que tiene un menor riesgo.
Medidas de posición relativa: aquellas que pueden utilizarse para comparar valores de diferentes
conjuntos de datos o para comparar valores dentro del mismo conjunto de datos.
 Puntuaciones Z: número de desviaciones estándar que un valor x se encuentra por arriba o

por debajo de la media
𝑥𝑖 − 𝑥
𝑧=
𝑠
 Cuantiles: son medidas que dividen un grupo de datos en m partes iguales, los más conocidos
son los cuartiles, deciles y percentiles.
o Cuartiles: los cuartiles dividen los valores ordenados en cuatro partes iguales Q 1
corresponde al 25%, Q2 al 50%, Q3 al 75%.
Para calcular Q1 se debe aplicar:

𝑄1
𝑁∗
100
Donde Q1 es el 25%, el valor que se obtiene es el número del dato que nos representa el primer 25%
del total de los datos, por ejemplo, para un conjunto de 30 datos tendríamos que
25%
40 ∗
100
Lo que corresponde a 10 es decir, el dato en la posición 10 del conjunto de datos divide el primer 25%
del total de los mismos.
Por ejemplo, si se analiza un conjunto de datos donde se presenta el salario de 40 empleados en una
empresa y el dato 10 corresponde a $1.200.000, esto quiere decir que el 25% de los empleados ganan
menos o igual a $1.200.000 mensualmente y por correspondencia también puedo decir que el 75%
ganan $1.200.000 o más.
El segundo cuartil o 𝑄2 , se corresponde con la mediana
o Deciles y percentiles: los deciles dividen en 10 partes iguales y los percentiles en 100.
Rectas de regresión
En la administración, las decisiones suelen basarse en la relación entre dos o más variables. Por
ejemplo, observar la relación entre el gasto en publicidad y las ventas puede permitir a un gerente de
mercadotecnia tratar de predecir las ventas correspondientes a un determinado gasto en publicidad.
O, una empresa de servicios públicos puede emplear la relación entre la temperatura diaria y la
demanda de electricidad para predecir la demanda de electricidad considerando las temperaturas
diarias que se esperan el mes siguiente. Algunas veces los directivos se apoyan en la intuición para
juzgar la relación entre dos variables. Sin embargo, cuando es posible tener datos, puede emplearse
un procedimiento estadístico llamado análisis de regresión para obtener una ecuación que indique
cuál es la relación entre las variables.
En la terminología que se emplea en regresión, a la variable que se va a predecir se le llama variable

dependiente. A la variable o variables que se usan para predecir el valor de la variable dependiente
se les llama variables independientes. Por ejemplo, al analizar el efecto de los gastos en publicidad
sobre las ventas, como lo que busca el gerente de mercadotecnia es predecir las ventas, esto indica
que las ventas serán la variable dependiente.
La recta de regresión se presenta como:
𝑦 = 𝛽0 + 𝛽1 𝑋 + 𝐸
Donde 𝛽0 + 𝛽1 son los parámetros del modelo y E es el error, aquí nos representa la variabilidad
que no puede ser explicada por la relación lineal entre X y Y.
Cuando la relación entre las variables es simple, la ecuación se denomina “ecuación de regresión
lineal simple” y se presenta como:
𝑦 = 𝛽0 + 𝛽1 𝑋
Esta ecuación representa una línea recta; β0 es la intersección de la recta de regresión con el eje Y,
β1 es la pendiente y Y es la media o valor esperado de Y para un valor dado de X.
Se observan aquí tres casos:

En la gráfica A: indica que el valor medio de y está relacionado positivamente con x.
En la gráfica B: indica que el valor medio de y está relacionado negativamente con x, valores menores
de y corresponden a valores mayores de x.
La recta de regresión de la gráfica C muestra el caso en el que el valor medio de y no está relacionado
con x; es decir, el valor medio de y es el mismo para todos los valores de x.
Ejemplo:
El dueño de una cadena de restaurantes ubica sus sedes cerca de universidades, decide recoger
datos respecto de ventas trimestrales, respecto del número de estudiantes en la universidad cercana
Restaurante # estudiantes (miles) Ventas trimestrales (miles $)

1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202
Estos datos se pueden representar mediante una gráfica en los ejes X y Y, en la cual se coloque la
variable independiente en el eje X y la dependiente en el eje Y; en este caso las ventas dependen del
número de estudiantes, por lo tanto se obtiene:
Para determinar la recta se utiliza la ecuación de regresión lineal simple:

𝑦 = 𝛽0 + 𝛽1 𝑋
Donde:
Y: Valor estimado de las ventas trimestrales
𝛽0: intersección de la recta de regresión con el eje Y
𝛽1: pendiente de la recta de regresión
X: tamaño de la población de estudiantes
Para calcular cada valor tenemos que:
∑(𝑥𝑖 − 𝑥) (𝑦𝑖 − 𝑦)
𝛽1 = 𝑦
∑(𝑥𝑖 − 𝑥)2
𝛽0 = 𝑦 − 𝛽1 𝑥
Para este ejemplo, se calculan las medias y por tanto:
140
𝑥= = 14
10
1300
𝑦= = 130
10
Se utiliza la tabla presentada y con estos valores es posible determinar por tanto que:
𝛽1 = 5 𝑦
𝛽0 = 60
Por lo tanto, la ecuación de regresión estimada es:
Y = 60 + 5X
Que se puede entonces representar en la gráfica de dispersión como:

Si por ejemplo se quisiera predecir las ventas trimestrales para un restaurante ubicado cerca de una
universidad con 16.000 estudiantes, solo se reemplaza dicho valor en la ecuación como:
Y = 60 + 5(16)
Y = 140
Por lo tanto, las ventas corresponderían a $140.000

BIBLIOGRAFÍA RECOMENDADA
1. TRIOLA, MARIO F. Estadística. Décima edición PEARSON EDUCACIÓN,

México, 2009. Disponible en:
https://www.uv.mx/rmipe/files/2015/09/Estadistica.pdf
2. ANDERSON, DAVID. SWEENEY, DENNIS. & WILLIAMS, THOMAS.
Estadística para administración y economía. México. 2008. Disponible en:
https://www.upg.mx/wp-content/uploads/2015/10/LIBRO-13-Estadistica-para-
administracion-y-economia.pdf
3. LEVIN RICHARD, L. & RUVIN, DAVID. Estadística para administración y
economía. México. 2004. Disponible en:
https://www.academia.edu/16570654/Estadistica_para_Administracion_y_Economi
a_Levin-Rubin_7ma_Ed_Pearson

Guía Unidad 1 - Datos y Descriptiva

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Guía Unidad 1 - Datos y Descriptiva

Cargado por

Copyright:

Formatos disponibles

Facultad: CIENCIAS SOCIALES Y EMPRESARIALES

Programa: ESPECIALIZACIÓN EN GERENCIA DE PROYECTOS

Los procesos estadísticos: pros y contras

DISPONIBLE EN: https://www.captio.net/blog/el-papel-de-la-estad%C3%ADstica-y-el-

Datos: son las observaciones recolectadas, pueden clasificarse de diversas maneras:

De acuerdo con la naturaleza de los mismos así:

También es posible clasificar los datos en el uso de cuatro niveles de medición:

 Datos no agrupados; es decir tomamos cada dato de manera individual y revisamos su

Nada importante Muy importante

Para construir la tabla de frecuencias realizamos:

Medidas de tendencia central: valor que se encuentra en el centro o la mitad de un conjunto de

Cuando hay varios resultados posibles y éstos están muy dispersos se ve

 Varianza: medida de variación igual al cuadrado de la desviación estándar s2

El riesgo en una inversión se reduce diversificando un portafolio, lo que

 Coeficiente de variación: describe la desviación estándar relativa a la media, se expresa como

 Puntuaciones Z: número de desviaciones estándar que un valor x se encuentra por arriba o

Para calcular Q1 se debe aplicar:

El segundo cuartil o 𝑄2 , se corresponde con la mediana

En la terminología que se emplea en regresión, a la variable que se va a predecir se le llama variable

La recta de regresión se presenta como:

Se observan aquí tres casos:

Restaurante # estudiantes (miles) Ventas trimestrales (miles $)

Para determinar la recta se utiliza la ecuación de regresión lineal simple:

Para este ejemplo, se calculan las medias y por tanto:

Por lo tanto, la ecuación de regresión estimada es:

Que se puede entonces representar en la gráfica de dispersión como:

Por lo tanto, las ventas corresponderían a $140.000

1. TRIOLA, MARIO F. Estadística. Décima edición PEARSON EDUCACIÓN,

También podría gustarte