Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tomo I
APÉNDICE TÉCNICO
Métodos Estadísticos Básicos, Tomo I, Apéndice Técnico Diciembre de 2019 S. Alatorre y E. Mendiola
ÍNDICE
APÉNDICE TÉCNICO .................................................................................................................1
General ...................................................................................................................6
Frecuencias y sus tablas .......................................................................... 7
Gráficas ...................................................................................................................9
Gráficas de frecuencias ............................................................................ 9
Otras gráficas ........................................................................................... 11
Regresión .............................................................................................................. 19
Regresión y correlación lineales ......................................................... 19
Probabilidad .......................................................................................................... 20
Distribuciones de probabilidad ............................................................ 22
APÉNDICE TÉCNICO
MODO DE USO
Este apéndice tiene por objetivo que usted lo pueda utilizar como material de consulta después
de haber comprendido la exposición conceptual que se hace en los capítulos del libro, es decir,
para qué se usa cada una de las herramientas estadísticas y/o probabilísticas que se presentan,
en qué consiste, en su caso qué condiciones requiere, qué precauciones de cálculo y de grafica-
ción hay que tener y lo más importante: cómo se interpretan los resultados. Por ello, este apén-
dice de ningún modo sustituye al libro; sólo lo complementa para facilitar la consulta para una
correcta aplicación de los métodos estadísticos básicos.
Aquí daremos algunas indicaciones que le pueden resultar útiles al registrar la información con
fines de análisis estadístico. Estas recomendaciones se pueden aplicar tanto para el registro en
papel como para el registro en algún formato electrónico que permita su posterior análisis, del
tipo Excel.
Cuando se tiene una sola muestra en la que se estudian una o más variables, se recomienda
registrar la información en una tabla con diversas columnas y renglones. Cada renglón co-
rresponde a un elemento de la muestra demográfica, y cada columna, salvo la primera, a los
datos correspondientes a una variable. La primera columna es un identificador del elemento
de la muestra (por ejemplo, si es una persona, su nombre o un número que la identifica). En
las demás columnas se tienen los datos correspondientes a las distintas variables.
Cuando se tienen dos o más muestras en las que se estudia una misma variable se pueden
registrar los datos en dos (o más) pares de columnas: en el primer par el identificador de
elemento de la primera muestra y el dato correspondiente, en el segundo par el identificador
de elemento de la segunda muestra y el dato correspondiente, y así sucesivamente. Alterna-
A-2 Apéndice Técnico A-2
tivamente, se puede registrar toda la información en dos columnas, usando los primeros ren-
glones para la primera muestra, los siguientes para la segunda y así sucesivamente, marcando
claramente cuándo se pasa de una muestra a la siguiente.
Puede ocurrir, cuando se tiene la información capturada, que una de las variables registra-
das se utilice como un criterio para definir muestras con un menor nivel de generalidad
que el de la muestra original. Por ejemplo, supongamos que se registra, para 120 de los
5000 estudiantes de una universidad, el sexo, la edad y la carrera que estudian. Entonces
se puede considerar el conjunto de datos como una muestra trivariada de tamaño n=120;
o bien como tres muestras univariadas de tamaño n=120; o bien, si interesa comparar la
edad y la carrera de los 57 hombres y las 63 mujeres, como dos muestras bivariadas de
tamaños n=57 y n=63. Y algo similar si interesa comparar el sexo de los estudiantes de una
u otra carrera.
Debe tenerse cuidado con las preguntas de cuestionarios que admiten respuestas múltiples.
En ese caso cada posible respuesta se convierte en una nueva variable dicotómica, y por lo
tanto una nueva columna, con valores del estilo no/sí o bien 0/1. (Al respecto ver la última
parte del apartado 1.2.2 del Capítulo 1).
Aunque una variable le debe poder asignar exactamente un valor a cada elemento de la
muestra demográfica y no puede haber elementos a los que no se les asigne un valor, en la
práctica suelen ocurrir las no-respuestas. No se debe registrar el valor 0 cuando hay una no-
respuesta, sino dejar la celda en blanco o bien asignar una categoría específica, como NC (No
Contestó), NS (No Sabe), etc. (Al respecto ver la pregunta 4 de la sección 1.3 del Capítulo 1).
Si se usan numerales para registrar los datos, debe quedar claro cuándo se trata simplemente
de etiquetas, cuándo son etiquetas ordenadas, y cuándo son números “verdaderos”. Esto es
importante porque las herramientas estadísticas que se utilicen en cada caso pueden ser dis-
tintas.
Cuando se trata de variables categóricas, es útil representar los valores o categorías con ini-
ciales, teniendo cuidado de no repetir. Por ejemplo, si se pregunta a estudiantes universita-
rios dónde estudian con mayor frecuencia, en su casa, su universidad, su trabajo o en el trans-
porte, la casa puede ser “c” y la universidad “u”, pero la “t” sólo se debe usar para el trabajo
o bien para el transporte (porque si “t” es ambos, no sabremos cuándo es cada uno).
Cuando se trata de variables categóricas, es conveniente tener categorías como “otros” o
“varios”, con el fin de que a cada elemento de la muestra demográfica le corresponda uno y
solamente uno de los valores posibles de la variable.
Cuando se trata de variables numéricas, debe prestarse particular atención al caso del 0: en
ocasiones 0 es un valor posible (por ejemplo, una temperatura de 0°C al amanecer), en oca-
siones no lo es (nadie mide 0.00 m de estatura).
Cuando la variable se refiere a tiempo, es necesario tener en cuenta que, aunque es una
variable continua, como la estatura o el peso, las fracciones de tiempo que utilizamos en la
vida cotidiana no son decimales, como en la estatura y el peso, sino que van cambiando: un
año se descompone en 12 meses, cada mes en 30 días (aprox.), cada día en 24 horas, cada
hora en 60 minutos, cada minuto en 60 segundos, cada segundo en centésimas. Por lo tanto,
si se quieren calcular promedios y otras herramientas estadísticas, debe “traducirse” cada
una de estas fracciones a fracciones decimales, para operar aritméticamente con ellas. Al
final, el resultado puede volverse a “traducir” a la forma usual. El siguiente cuadro le puede
ayudar a hacer ambas “traducciones”:
Para pasar Procedimiento Ejemplo
De años A años Se dividen los meses entre 12 4 años 9 meses =
y meses y fracs dec. y se suman a los años 4.75 años
De meses A meses Se dividen los días entre 30 5 meses 10 días =
y días y fracs dec y se suman a los meses 5.33 meses
De días A días Se dividen las horas entre 24 3 días 6 horas =
y horas y fracs dec y se suman a los días 3.25 días
De horas A horas Se dividen los minutos entre 60 4 horas 20 min =
y minutos y fracs dec y se suman a las horas 4.33 hr
De minutos A minutos Se dividen los segundos entre 60 26 min 30 seg =
y segundos y fracs dec y se suman a los minutos 26.5 min
De años A años Se multiplica la fracción por 0.12: 5.25 años =
y fracs dec. y meses ésos son los meses 5 años 3 meses
De meses A meses Se multiplica la fracción por 0.30: 2.25 meses =
y fracs dec. y días ésos son los días 2 meses 7.5 días
De días A días Se multiplica la fracción por 0.24: 3.48 días =
y fracs dec y horas ésas son las horas 3 días 11.5 hrs
De horas A horas Se multiplica la fracción por 0.60: 6.17 horas =
y fracs dec. y minutos ésos son los minutos 6 horas 10.2 min
De minutos A minutos Se multiplica la fracción por 0.60: 21.59 min =
y fracs dec. y segundos ésos son los segundos 21 min 35.4 seg
En este resumen se clasifican los distintos elementos en siete grupos, distinguidos por colores:
Estas sinopsis presentan con qué tipos de variable se pueden utilizar los diversos estadígrafos y
gráficas.
Acerca de la calculadora:
Acerca de Excel:
Este software, parte del paquete Office de Microsoft, es de uso cada vez más amplio. Muchos de
los estadígrafos y gráficas aquí presentados pueden ser calculados o realizados con Excel, a pesar
de que el paquete no está dirigido específicamente a la estadística. No es el objetivo de este libro
enseñar a usar Excel; para ello existen muchos manuales y apoyo en línea. Tampoco es necesario
que usted sea un experto en el uso de este paquete antes de poder seguir las instrucciones de la
columna correspondiente de este apéndice; es suficiente tener un poco de información básica y
no tener miedo de experimentar (tenga en cuenta que si usted se equivoca no le va a pasar nada
ni a su computadora ni al paquete en ella instalado). Lo que se ha buscado aquí es poner los
nombres de las funciones (en mayúsculas) o de las gráficas o tablas (en letras cursivas), con el fin
de facilitar la búsqueda. Como en el caso de la calculadora, una excelente manera de aprender a
usar Excel es seguir en él los ejemplos que se presentan en el texto y verificar que se obtienen los
mismos resultados.
CLASIFICA-
VARIABLES
REFEREN-
CIÓN
Definiciones generales: se agrupan aquí los conceptos de carácter general, como variable y sus tipos, valor, dato, frecuencia, frecuen-
cia relativa, distribuciones, tablas, etc. Para más referencia, ver el Capítulo 1.
Tamaño de la No aplica
Todas Cantidad total de datos en la población No aplica 1.2.2
población: N
Tamaño de la No aplica
Todas Cantidad total de datos en la muestra No aplica 1.2.2
muestra: n
Variable: X, Y, Medición de un atributo en categorías No aplica No aplica
Todas 1.2.2
etc o números
GENERAL
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
Todas
ción. Se puede lativas sólo se pueden conocer las fre- 2.2.2, 2.3.1
expresar como cuencias si además se conoce n; en ese
porcentaje caso 𝑓 = 𝑓̃ × 𝑛
Distribución de
Relación de las frecuencias correspon-
frecuencias (o
dientes a cada valor de una variable, en 2.1.1, 2.1.4,
frecuencias rela- Todas No aplica
un conjunto de datos. Se puede pre- 2.3.2
tivas o porcen-
sentar en forma de tabla y/o de gráfica
tajes)
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
Toda gráfica es para ser vista. El título debe indicar claramente de qué se trata; si hay ejes debe quedar claro qué representa cada
uno. Si un eje es numérico, la escala debe ser clara; si es categórico, los valores deben ser explícitos (de preferencia sin abreviaturas).
GRÁFICAS
Si se usan colores la leyenda debe aclarar el significado de cada uno. Se debe indicar la fuente de los datos cuando eso no es explícito
en el texto que la acompaña. Si se desea comparar gráficas distintas, lo más conveniente es que estén a la misma escala.
Las gráficas de frecuencias (o frecuencias relativas o porcentajes) relacionan cada valor de una variable con la frecuencia (o frecuen-
cias relativas o porcentajes) en la que ocurre en un conjunto de datos. Pueden ser circulares, de barras, de barras apiladas, histogra-
mas o polígonos de frecuencias
En un eje, valores de la variable según
su orden salvo con variables nomina-
les. En el otro, frecuencias, frecuencias
relativas o porcentajes; ese eje debe
empezar en 0.
Las barras deben ser del mismo ancho,
ir separadas por un espacio menor
Gráficas de frecuencias
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
Gráficas de frecuencias PUEDE USAR CIAS
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
Medidas de Tendencia Central, Ubicación o Localización: son estadígrafos que describen, de diversas maneras, cómo se concentran
los datos de un conjunto y/o cuál es el centro de su distribución. Las Medidas de Tendencia Central pueden representar al conjunto
de datos de acuerdo con diversos criterios. Las más comunes son la moda, la mediana y el promedio aritmético o media. Todas se
MEDIDAS DE TENDENCIA CENTRAL (LOCALIZACIÓN)
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
En modo estadís-
Serie simple:
tico (SD), ingresar
Σ𝑥 para cada dato PROMEDIO 3.1.1, 3.1.2,
Promedio, 𝑥̅ =
𝑛 (del conjunto de da- 3.4.1, 3.4.2,
media o media x M+
MEDIDAS DE TENDENCIA CENTRAL
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
Medidas de dispersión: son estadígrafos que, de diversas maneras, qué tanto se dispersan o alejan los datos de un conjunto de su
centro. Las más comunes son el rango, la desviación estándar, la varianza y el coeficiente de variación.
Diferencia entre el dato mayor y el dato
menor MÁXIMO menos MÍ- 3.1.1, 3.1.3,
Rango Numéricas No aplica NIMO (del conjunto de 3.2.1, 3.3.1,
Se expresa en las mismas unidades de datos) 3.4.2
medida que la variable que describe
MEDIDAS DE DISPERSIÓN
Serie simple:
∑(𝑥𝑖 − 𝑥̅ )2
𝑠=√ Como para el
𝑛−1
cálculo del prome-
Serie agrupada: dio. Al final, s está
∑ 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2 en S-VAR→3 =
Desviación es- 𝑠=√ Se pueden calcular DESVEST
(∑ 𝑓𝑖 ) − 1
tándar mues- el promedio y la DESVEST.M 3.2.1, 3.4.1,
tral: Numéricas Serie agrupada desde un histograma: desviación están-
(del conjunto de da- 3.4.2
s como arriba, utilizando como x la dar al mismo
tos)
marca (centro) de cada clase tiempo
Se expresa en la unidad de medida de la Algunas calculado-
variable que describe; no tiene una in- ras simbolizan s
terpretación directa para una sola como “xn-1”
muestra, pero sí permite comparar la
dispersión de dos o más muestras de
datos de la misma variable.
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
Serie simple:
∑(𝑥𝑖 − 𝜇)2
𝜎=√ Como para el
𝑁
cálculo del prome-
Serie agrupada: dio. Al final, s está
∑ 𝑓𝑖 (𝑥𝑖 − 𝜇)2 en S-VAR→2 =
𝜎=√ Se pueden calcular DESVESTP
Desviación es- (∑ 𝑓𝑖 )
el promedio y la DESVEST.P
tándar poblacio- Numéricas 3.2.1
MEDIDAS DE DISPERSIÓN
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
Serie simple:
∑(𝑥𝑖 − μ)2
𝜎2 =
𝑛 VARP
Calcular la desvia-
Varianza pobla- Serie agrupada: VAR.P
Numéricas ción y elevar al 3.2.1
cional: 2 ∑ 𝑓𝑖 (𝑥𝑖 − μ) 2
(del conjunto de da-
𝜎2 = cuadrado con x2
(∑ 𝑓𝑖 ) tos)
Se expresa en el cuadrado de la unidad
de medida de la variable que describe
MEDIDAS DE DISPERSIÓN
𝑠
𝐶𝑉 = ( × 100) %
𝑥̅
Se expresa como porcentaje, es decir
sin unidades de medida.
La interpretación directa para una sola
muestra está dada por la valoración
empírica (ver tabla abajo), además sí
permite comparar la dispersión de dos
o más muestras de datos de variables
Dividir s entre 𝑥̅ , ex-
Coeficiente de que tienen distintas unidades de me- 3.2.2, 3.3.1,
Numéricas s ÷ 𝑥̅ × 100 = presar el resultado
variación: CV dida, o bien que tienen la misma uni- 3.4.2
como porcentaje
dad, pero con tendencias centrales muy
distintas.
Valoración empírica:
Coeficiente de
Dispersión
Variación
Menos de 10% Baja
Entre 10% y 50% Moderada
Entre 50% y 100% Alta
Más de 100% Muy alta
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
Descripción de la distribución y/o de su forma. Se agrupan aquí estadígrafos que permiten describir los valores que marcan cortes de
determinados porcentajes de valores o los que describen la forma de la distribución según su asimetría o según la cantidad relativa
de datos cercanos al centro
Q1 es el valor que delimita al 25% más
pequeño de los datos. Se puede calcu- CUARTIL.EXC, CUAR-
lar como la mediana de la primera mi- TIL.INC ó bien CUARTIL
DESCRIPCIÓN DE LA DISTRIBUCIÓN
Diferencia entre Q3 y Q1
Rango inter- Calcular la diferencia
Numéricas Se puede tomar como una medida de la Q3 – Q1 = 3.3.1, 3.4.2
cuartílico: RIC entre Q3 y Q1
dispersión del 50% central de los datos
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
REGRESIÓN PUEDE USAR CIAS
Regresión: Ajuste de un modelo matemático para describir la relación entre dos o más variables
Coeficiente de Medida de la intensidad de la rela- COEFICIENTE.R2
(Depende del tipo
determinación: Numéricas ción entre dos variables, de acuerdo (del conjunto de las Y, 4.3.2
de calculadora)
R2 con un modelo de regresión elegido y el conjunto de las X)
Medida de la intensidad de la rela- En modo de regre-
ción lineal entre dos variables. sión lineal (Reg lin),
r < 0: a mayores valores de X, menores ingresar cada dato
valores de Y; r > 0: a mayores valores bivariado
Coeficiente de de X, mayores valores de Y. COEF.DE.CORREL
x , y M+ 4.3.2, 4.3.3,
correlación li- Numéricas (del conjunto de las Y,
|r| < 0.3: correlación mala; Al final: 4.3.4
Regresión y correlación lineales
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
Definición clásica: La probabilidad de un evento se calcula como el cociente de la cantidad de elementos del evento
entre la cantidad de elementos del espacio muestral. Requiere que los eventos elementales tengan la misma probabilidad
Definición frecuencial: La probabilidad de un evento se estima con el cociente de la frecuencia en que ocurrió el evento 5.1.2
entre la cantidad de observaciones realizadas, es decir con la frecuencia relativa. Requiere de una cantidad grande de
experimentaciones u observaciones
No podemos saber cómo van a ocurrir
Fenómenos
Todas la siguiente vez que se observen. Lle- No aplica No aplica 5.1.1
aleatorios
van implícita una variable aleatoria.
A medida que aumenta la cantidad de
PROBABILIDAD
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
P(AB)=P(A)×P(B)
A y B no son independientes (es de-
cir, están relacionados) si alguna de
esas igualdades no ocurre.
CLASIFICA-
VARIABLES
REFEREN-
CIÓN ELEMENTO CON QUE SE DEFINICIÓN Y/O CÁLCULO CALCULADORA EXCEL
PUEDE USAR CIAS
SINOPSIS de uso de estadígrafos y de gráficas. Se marca con cuando la herramienta se puede utilizar, con cuando no se puede
utilizar, y con () cuando se puede utilizar pero no es muy útil o adecuada.
Medidas de Medidas de Estadígrafos de Medidas de Correlación
Tendencia Central Dispersión Distribución y Modelos de Regresión
SINOPSIS DE
determinación
contingencia y
Coeficiente de
Coeficiente de
otros modelos
Coeficiente de
de correlación
Cuartiles y RIC
distribuciones
condicionales
marginales y
(rango inter-
de variación
Coeficiente
Coeficiente
regresión u
Desviación
ESTADÍGRAFOS
cuartílico)
promedio
Tablas de
Mediana
estándar
Recta de
Media o
curtosis
Moda
sesgo
lineal
Una variable dicotómica
Una variable nominal
Una variable ordinal
Una variable discreta
: clase
Una variable continua
modal
Dos variables categóricas Cada variable, según Cada una, según Cada variable, según
Dos variables numéricas lo indicado arriba lo indicado arriba lo indicado arriba ()