Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 / 10
INFORMACIÓN PREVIA
CORREO:
jesus_naranjo@my.unitec.edu.mx
1 / 10
SESIÓN 1
ESTADÍSTICA DESCRIPTIVA
Orden del día:
1.1. Población y muestra
1.2. Variables estadísticas
1.3. Parámetros y estadísticas
1.4. Distribución de frecuencias
1.5. Construcción de frecuencias (regla de Sturges)
1.6. Frecuencias relativas
1.7. Frecuencias relativas acumuladas
1.8. Medidas de tendencia central (media, mediana y moda)
1.9. Medidas de dispersión (rango, varianza y desviación estándar)
1.10. Gráficas (Diagrama de barras, diagrama de dispersión, diagrama circular e
histograma)
1.11. Solución de casos aplicando hojas de cálculo
3
1. Población y muestra
Población
Lepkowski (2008) define a la población como un conjunto de todos los casos que concuerdan
con determinadas especificaciones.
Muestra
Muñoz (2015) define la muestra como el segmento de la población que se considera
representativa de un universo y se selecciona para obtener información acerca de las
variables del objeto de estudio, es decir, la muestra es un subgrupo de la población.
4
2. Variables estadísticas
Una variable es una propiedad que tiene una variación que puede medirse u observarse,
ejemplo el género, la presión arterial, la inteligencia, el tiempo que tarda en manifestarse una
enfermedad (Hernández-Sampieri et al. 2016). Existen diferentes tipos de variables:
Variables cuantitativas: Admiten una escala numérica de medición, pueden ser de dos tipos:
continuas y discretas. Se le llama variables continuas cuando entre los valores pueden darse
infinidad de posibilidades. Ejemplos, pesos de objetos, dimensiones, calificaciones de
estudiantes, entre otros.
5
2. Variables estadísticas
Las variables cualitativas producen datos que se pueden clasificar de acuerdo a similitudes o
diferencias en clase; por lo tanto, con frecuencia se denominan datos categóricos, por
ejemplo; género, año y especialidad.
Una variable continua puede tomar infinitamente muchos valores correspondientes a los
puntos en un intervalo de recta. Variables como la estatura, peso, tiempo, distancia y
volumen son continuas porque pueden tomar valores en cualquier punto a lo largo de un
intervalo de recta.
6
3. Parámetros y estadísticas
7
3. Parámetros y estadísticas
Parámetros de dispersión: informan cuánto se alejan del centro los valores de la distribución.
Las medidas de dispersión varianza, desviación estándar y rango.
Parámetros de forma: indican cómo se distribuyen los datos, respecto al valor central. Este
puede ser asimétricamente o simétrica.
8
4. Distribución de frecuencias
9
4. Distribución de frecuencias
Nivel de confianza
El nivel de confianza determina qué tan seguro se está de la representatividad de la muestra.
Se expresa como un porcentaje y representa con qué frecuencia se encuentra dentro del
intervalo de confianza el porcentaje de la población que elegiría una respuesta.
Intervalo de confianza
El intervalo de confianza es un número positivo y negativo que expresa el grado de dispersión
de los resultados y es la probabilidad de cometer un error, o de equivocarse en la prueba de
hipótesis o la estimación de parámetros; los niveles más comunes son 0.05 y 0.01.
10
5. Construcción de frecuencias (Regla de Sturges)
11
5. Construcción de frecuencias (Regla de Sturges)
Para determinar los intervalos se debe saber cuál es el tamaño de la muestra o el número de
observaciones; en este caso, se tienen 30.
Luego se aplica la regla de Sturges:
A partir del número de intervalos, se puede calcular la amplitud que estos van a tener; es
decir, la anchura de cada barra representada en el histograma de frecuencias:
El límite inferior es considerado como el valor menor de los datos, y el superior es el valor
mayor. La diferencia entre el límite superior e inferior es denominada rango o recorrido de la
variable (R).
12
5. Construcción de frecuencias (Regla de Sturges)
De la tabla que se dio desde un inicio, se tiene que el límite superior es 46 y el inferior 13; de
esa manera, la amplitud de cada clase será:
De tal manera que ahora se construye una tabla donde se refleje el numero de clases (x) y la
amplitud que estos van a tener.
13
6. Frecuencias relativas
14
7. Frecuencias relativas acumuladas
15
7. Frecuencias relativas acumuladas
16
7. Frecuencias relativas acumuladas
TABLA DE FRECUENCIAS super fácil - Para principiantes. (febrero 2021) [Vídeo]. YouTube: https://youtu.be/JtB2w0QLRZ4
17
8. Medidas de tendencia central (media, mediana y moda)
Moda. Es elemento que se repite más veces en el conjunto de datos. Pueda haber 2 modas,
entonces el grupo de observaciones dice que es bimodal.
Mediana. Se ordenan los datos comenzando por el menor hasta el mayor, a continuación se
ubica la posición con la siguiente ecuación: Mediana = (N +1) / 2
Cuando N es impar, la ecuación señala un dato puntualmente. • En el caso de N par, el
resultado de la ecuación ubica la mediana entre dos números del conjunto, por lo cual se
hace el promedio de ambos.
18
8. Medidas de tendencia central (media, mediana y moda)
Ejercicio:
Las alturas (en centímetros) de los 10 alumnos de una clase son 178, 163, 155, 159, 171, 155,
172, 170, 159 y 163.
Ordenamos los datos: 155, 155, 159, 159, 163, 163, 170, 171, 172 y 178.
Como hay un número par de datos, la mediana es la media de los datos de la posición 5 y 6:
(163 +163) / 2 = 163
Observa que hay el mismo número de datos a uno y otro lado de la mediana (4 datos en cada
lado).
La media o promedio es (155+155+159+159+163+163+170+171+172+178)/10 = 164.5cm y
hay tres modas: 155, 159 y 163 (que son los valores que mas veces se repiten).
19
9. Medidas de dispersión (rango, varianza y desviación estándar)
Son aquellos parámetros que miden la desviación de la media (μ); Varianza, Desviación
estándar y Rango.
Varianza: Es la desviación ponderada de la media que tiene el i‐ésimo dato.
• Aquí hay diferencia entre la varianza estimada para una población y para una muestra.
Varianza poblacional: Si x1, x2, . . . xN representan la totalidad de las N observaciones de una
población, entonces la varianza poblacional es:
Ejemplo:
De los datos usados en la varianza ahora obtengamos la desviación estándar de acuerdo con
la fórmula anterior, de tal manera que sólo hay que extraer la raíz cuadrada de la varianza si
la varianza fue de 9.2 y da igual a 3.03.
21
9. Medidas de dispersión (rango, varianza y desviación estándar)
Ejemplo.
Calculemos el rango del conjunto de datos 2, 3, 3, 5, 7 y 10
R (rango)= máximo – mínimo
R= 10-2 lo que nos da 8
22
10. Gráficas
Gráficas de líneas
Cuando una variable cuantitativa se registra en el tiempo a intervalos igualmente espaciados
(por ejemplo diario, semanal, mensual, trimestral o anual), el conjunto de datos forma una
serie de tiempo.
Los datos de una serie de tiempo se presentan con más efectividad en una gráfica de líneas
con el tiempo como eje horizontal. La idea es tratar de distinguir un patrón o tendencia que
sea probable de continuar en el futuro y luego usar ese patrón para hacer predicciones
precisas para el futuro inmediato.
23
10. Gráficas
Gráficas de puntos
Muchos conjuntos de datos cuantitativos están formados de números que no se pueden
separar fácilmente en categorías o intervalos. Entonces se hace necesaria una forma
diferente de graficar este tipo de datos.
La gráfica más sencilla para datos cuantitativos es la gráfica de puntos. Para un conjunto
pequeño de mediciones, por ejemplo el conjunto 2, 6, 9, 3, 7, 6, se puede simplemente
graficar las mediciones como puntos en un eje horizontal.
24
10. Gráficas
Gráficas de tallo y hoja
Otra forma sencilla de exhibir la distribución de un conjunto de datos cuantitativos es la gráfica de
tallo y hoja. Esta gráfica presenta una exhibición gráfica de los datos usando los valores numéricos
reales de cada punto de datos.
25
10. Gráficas
26
10. Gráficas
27
11. Solución de casos aplicando hojas de cálculo
28
11. Solución de casos aplicando hojas de cálculo
29
Referencias
30