Está en la página 1de 50

Fundamentos de Estadística:

conceptos básicos
Elí M. Bobadilla, M. Sc.
ebobadilla@isa.edu.do
CONTENIDO UNIDAD I: Fundamentos de Estadística

a. Conceptos básicos de estadística;


b. Etapas de la estadística: en la historia y la investigación;
c. Métodos estadísticos: estudios experimentales y estudios
observacionales;
d. Estadística descriptiva y estadística inferencial;
e. Variables: tipos, descripciones y aplicaciones;
f. Medidas de tendencia central: Media y Mediana;
g. Medidas de dispersión, varianza, desviación estándar, error estándar,
coeficiente de variación, cuartiles y percentiles;
h. Representación gráfica de datos.
OBJETIVOS UNIDAD I: Fundamentos de Estadística
a. Conocer conceptos básicos de la estadística;
b. Diferenciar la estadística descriptiva de la estadística inferencial;
c. Valorar la importancia de la estadística descriptiva e inferencial;
d. Dominar el concepto de variable;
e. Clasificar los tipos de variables de acuerdo a su naturaleza e identificar su
aplicabilidad en el estudio de un fenómeno;
f. Conocer las medidas de tendencia central: media, mediana y moda;
g. Aplicar análisis de tendencia central a series de datos: media, mediana y moda;
h. Conocer las medidas de dispersión: desviación estándar, error estándar,
coeficiente de variación, cuartiles y percentiles;
i. Aplicar análisis de dispersión a series de datos: desviación estándar, error
estándar, coeficiente de variación, cuartiles y percentiles;
j. Representar de manera gráfica diferentes series de datos a partir de la naturaleza
de las variables.
ETAPAS DE LA INVESTIGACIÓN ESTADÍSTICA

Cálculo e interpretación
de los indicadores
estadísticos: variables.
Tabulación de los datos.
Procesamiento de los datos.
Presentación de los datos.
ANÁLISIS E
INTERPRETACIÓN DE
PLANIFICACIÓN
RESULTADOS
Planteamiento del problema.
Formulación de objetivos e ORGANIZACIÓN DE
hipótesis. Antecedentes.
Operacionalización variables. LOS DATOS
Identificación de fuentes de
información.

Presentación y comunicación
final de los hallazgos.
Levantamiento de la RECOLECCIÓN Divulgación científica.
información en las unidades de
estudio: población-muestra. DE LOS DATOS
CONCLUSIONES
ESTADÍSTICA DESCRIPTIVA-ESTADÍSTICA INFERENCIAL:
La estadística es útil para una amplia variedad de ciencias fácticas, desde la física hasta las ciencias sociales,
desde las ciencias de salud [ y la biología] hasta el control de la calidad. Además, se usa en áreas de negocios y
gubernamentales con el objetivo de describir el conjunto de datos obtenidos para la toma de decisiones, o bien
para realizar generalizaciones sobre las características observadas. (Estadística, s.f.)

Actualmente en las ciencias fácticas, la estadística es una herramienta fundamental, casi obligatoria, que permite
estudiar determinadas poblaciones y fenómenos a partir de recolección de información, análisis de datos e
interpretación de los hallazgos. De manera particular, la estadística es fundamental en el estudio cuantitativo de
los fenómenos de masa o colectivos.

La estadística para su mejor estudio se ha dividido en dos grandes ramas: la estadística descriptiva y la
estadística inferencial.
ESTADÍSTICA DESCRIPTIVA
Desde el punto de vista de la estadística descriptiva, se estudia, analiza y describe la totalidad de los individuos
de una población. Su finalidad es obtener información, analizarla, elaborarla y simplificarla cuanto sea
necesario, o posible, para que pueda ser interpretada cómoda y rápidamente. De manera que, pueda ser
implementada en la toma de decisiones y mejora de procesos.
ESTADÍSTICA INFERENCIAL
La estadística inferencial es una parte de la estadística que comprende los métodos y procedimientos que por
medio de la inducción determina propiedades de una población estadística, a partir de una parte de esta
(muestra). (Estadística inferencial, s.f.)
En ese sentido, la tarea básica de la estadística inferencia es obtener conclusiones útiles que permitan hacer
deducciones generales: inferir los resultados hallados en la muestra a la población.
ESTADÍSTICA DESCRIPTIVA E INFERENCIAL

MUESTRA MUESTRA DATOS

POBLACIÓN ESTADÍSTICA DESCRIPTIVA

ESTADÍSTICA INFERENCIAL
MÉTODOS ESTADÍSTICOS:
Los métodos estadísticos son procedimientos para manejar datos cuantitativos y cualitativos mediante
técnicas de recolección, recuento, presentación, descripción y análisis. Los métodos estadísticos permiten
comprobar hipótesis o establecer relaciones de causalidad en un determinado fenómeno. (CONACyT, 2020)

En común, todos los métodos estadísticos tiene como intención investigar la causalidad. Es decir, las causas que
permiten que un fenómeno o conducta ocurra.

Hay dos grandes métodos estadísticos para estudiar la causalidad: Método Observacional y Método
Experimental.

Básicamente, la diferencia entre ambos tipos de métodos es la manera en que los estudios son conducidos.
Ambos son efectivos en el cumplimiento de sus objetivos, y tanto en los estudios observacionales como
experimentales la estadística juega un rol esencial.
MÉTODOS ESTADÍSTICOS:

ESTUDIOS EXPERIMENTALES

ESTUDIOS OBSERVACIONALES
MÉTODOS ESTADÍSTICOS: Niveles de medición

La medición de las variables puede realizarse por medio de cuatro escalas de medición. Dos de las escalas miden
variables categóricas y las otras dos miden variables numéricas (Therese L. Baker, 1997).

NOMINAL ORDINAL INTERVALO RAZÓN

Categorías distintivas sin Categorías con dos o más niveles. Características nominales y Características nominales,
orden específico. Ejemplo: Implican orden inherente entre sí. ordinales. Establece distancias entre ordinales y de intervalos.
grupo de personas Ejemplo: clasificación de una una medida y otras. Ejemplo: escala Ejemplo: número de crías
organizadas por sexo población de aves según su estado de pH que establece intervalos para por pareja, kilogramos de
(Hombre-Mujer) de desarrollo (Adultos-Juveniles- sustancias ácidas (menor de 7), comida por día,
Neonatos) neutras (igual a 7) o básicas apareamientos por año,
(mayores de 7) etc.
VARIABLES: tipos, definiciones y ejemplos
MEDIDAS DE TENDENCIA CENTRAL:

Las medidas de tendencia central son medidas


estadísticas que pretenden resumir en un solo
valor a un conjunto de valores. Representan
un centro en torno al cual se encuentra
ubicado el conjunto de los datos.

Las medidas de tendencia central más


utilizadas son: media, mediana y moda.

La media (promedio) de un conjunto de datos


se encuentra al sumar todos los números en el
conjunto de datos y luego al dividir entre el
número de valores en el conjunto. La mediana
es el valor medio cuando un conjunto de datos
se ordena de menor a mayor. La moda es el
número que se presenta con más frecuencia en
un conjunto de datos. (Khan, 2020)
MEDIDAS DE TENDENCIA CENTRAL: Media

La media aritmética es el valor que se obtiene


al sumar todos los datos que tenemos y dividir
el resultado entre el número total de esos
datos.
En otras palabras, es la suma de n valores de
la variable y luego dividido por n, donde n es
el número de sumandos, o en el caso de
estadística el número de datos se da el
resultado.
MEDIDAS DE TENDENCIA CENTRAL: Mediana
En el ámbito de la estadística, la mediana representa el valor de
la variable de posición central en un conjunto de datos
ordenados. Se le denota Me.

Dada una serie de datos,


14 13 8 4 9 20 17 6 11
Lo organizamos de menor a mayor
4 6 8 9 11 13 14 17 20

Al tratarse de una serie de datos impar, se


toma el valor justo en el medio de la serie.
Dicho valor representa la mediana, en este
caso:
Me= 11
MEDIDAS DE TENDENCIA CENTRAL: Mediana
En el ámbito de la estadística, la mediana representa el valor de
la variable de posición central en un conjunto de datos
ordenados. Se le denota Me.

Dada una serie de datos,


14 13 8 4 9 20 17 6 11 19
Lo organizamos de menor a mayor
4 6 8 9 11 13 14 17 19 20
Al tratarse de una serie de datos par, se toman
los dos valores y se promedia. En este caso:

11 + 13 / 2= 12

Me= 12
MEDIDAS DE TENDENCIA CENTRAL: Moda

La moda es el dato más repetido de la encuesta, el


valor de la variable con mayor frecuencia absoluta.
En cierto sentido la definición matemática
corresponde con la locución "estar de moda", esto
es, ser lo que más se lleva. (Medidas de tendencia
central, s.f.)

Dada las edades de 20 estudiantes de maestría,


podemos identificar cuál es la moda en edades.
Veamos:

21 25 23 27 34 31 20 27 20 24
23 23 25 26 27 29 28 31 23 21
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL: Simetría
MEDIDAS DE DISPERSIÓN:
Las medidas de dispersión miden el grado de dispersión de los valores de la variable. Dicho en otros términos las
medidas de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de
medidas usadas en conjunto permiten describir un conjunto de datos entregando información acerca de su posición y su
dispersión.
La mayoría de las medidas de dispersión tienen las mismas unidades que la cantidad que se mide. En otras palabras, si
las medidas están en metros o segundos, también lo es la medida de dispersión. Los ejemplos de medidas de dispersión
incluyen:

• Rango

• Desviación estándar

• Varianza

• Error estándar

• Coeficiente de variación

• Cuartiles y percentiles
MEDIDAS DE DISPERSIÓN: Rango
Indica la dispersión entre los valores extremos de una variable, es decir, el mayor y el menor
valor. Se calcula como la diferencia entre el mayor y el menor valor de la variable. Se
denota como R.

Para datos ordenados se calcula como:

R = x(n) - x(1)

Donde:
x(n): es el mayor valor de la variable.
x(n): es el menor valor de la variable
MEDIDAS DE DISPERSIÓN: Rango
MEDIDAS DE DISPERSIÓN: Desviación estándar
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos
alrededor de la media. El símbolo σ (sigma) se utiliza frecuentemente para representar la desviación estándar de
una población, mientras que s se utiliza para representar la desviación estándar de una muestra. La variación que
es aleatoria o natural de un proceso se conoce comúnmente como ruido. La desviación estándar utiliza las
mismas unidades que los datos.

La desviación estándar de los datos de la muestra es una estimación de la desviación estándar de la población.

Puesto que la desviación estándar se basa en los datos de una muestra y no en toda la población, es improbable
que la desviación estándar de la muestra sea igual a la desviación estándar de la población. Para estimar mejor la
desviación estándar de la población, utilice el intervalo de confianza.

La desviación estándar también se puede utilizar para establecer un valor de referencia para estimar la variación
general de un proceso.
MEDIDAS DE DISPERSIÓN: Desviación estándar
MEDIDAS DE DISPERSIÓN: Varianza

La varianza de una muestra o de un conjunto de valores, es la sumatoria de las desviaciones al cuadrado con
respecto al promedio o a la media, todo esto dividido entre el número total de observaciones menos 1. De
manera muy general se puede decir que la varianza es la desviación estándar elevada al cuadrado.

La varianza, junto con la desviación estándar, son medidas de dispersión de datos u observaciones. La
dispersión de estos datos indica la variedad que estos presentan, es decir, si todos los valores en un conjunto
de datos son iguales, entonces no hay dispersión, pero en cambio, si no todos son iguales entonces hay
dispersión.

Esta dispersión puede ser grande o pequeña, dependiendo de qué tan cercanos sean los valores a la media.

La varianza de una muestra es utilizada para estimar la varianza de una población, la cual en muchas
ocasiones se desconoce. Es por esto que S2 también es considerada comúnmente como un estadístico y σ2
como un parámetro.

La varianza mide qué tan dispersos están los datos alrededor


de la media. La varianza es igual a la desviación estándar
elevada al cuadrado.
MEDIDAS DE DISPERSIÓN: Varianza

La suma de las X menos la


media elevada al cuadrado
entre N

La suma de las X menos la


media elevada al cuadrado
entre N menos 1
MEDIDAS DE DISPERSIÓN: Varianza
MEDIDAS DE DISPERSIÓN: Coeficiente de variación

En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la
variable, se utiliza el coeficiente de variación (suele representarse por las siglas "C.V.")
Se calcula:
MEDIDAS DE DISPERSIÓN: Coeficiente de variación

• El coeficiente de variación no posee unidades.


• El coeficiente de variación es frecuentemente menor que uno. Sin embargo, en ciertas distribuciones de
probabilidad puede ser 1 o mayor que 1.
• Es insensible ante cambios de escala.
• Para su interpretación se puede expresar como porcentaje, teniendo en cuenta que puede superar el valor
100%.
• Depende de la desviación típica, también llamada "desviación estándar", y en mayor medida de la media
aritmética, dado que cuando ésta es 0 o muy próxima a este valor el C.V. pierde significado, ya que puede dar
valores muy grandes, que no necesariamente implican una gran dispersión de datos.
• El coeficiente de variación es común en varios campos de la probabilidad aplicada, como teoría de renovación
y teoría de colas. En estos campos la distribución exponencial es a menudo más importante que la distribución
normal. La desviación típica de una distribución exponencial es igual a su media, por lo que su coeficiente de
variación es 1. La distribuciones con un C.V. menor que uno, como la distribución de Erlang se consideran de
"baja varianza", mientras que aquellas con un C.V. mayor que uno, como la distribución hiperexponencial se
consideran de "alta varianza". Algunas fórmulas en estos campos se expresan usando el cuadrado del
coeficiente de variación, abreviado como S.C.V. (por su siglas en inglés). (Coeficiente de variación, s.f.)
REPRESENTACIÓN GRÁFICA DE DATOS: Esquema de un grafico
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico de barras
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico comparativo de barras
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico de barras horizontales
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico comparativo de barras
horizontales
REPRESENTACIÓN GRÁFICA DE DATOS: Barras horizontales superpuestas
REPRESENTACIÓN GRÁFICA DE DATOS: Barras comparativas horizontales
superpuestas
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico rectángular
REPRESENTACIÓN GRÁFICA DE DATOS: Pirámide poblacional
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico de línea simple
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico de línea múltiple
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico de áreas
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico circular o de torta
REPRESENTACIÓN GRÁFICA DE DATOS: Mapa temático
REPRESENTACIÓN GRÁFICA DE DATOS: Mapa temático
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico de dispersión
REPRESENTACIÓN GRÁFICA DE DATOS: Gráfico triangular
Fundamentos de Estadística: conceptos
básicos, variables, medidas de tendencia
central y medidas de dispersión.
Elí M. Bobadilla, M. Sc.
ebobadilla@isa.edu.do

También podría gustarte