Está en la página 1de 19

2.

Estadística descriptiva

2. Estadística descriptiva
Dr. Martin Taboada Neira

Trujillo, junio del 2022


2. Estadística descriptiva

Estadístico
Estadístico (Estadígrafo), se definen como
un tipo de función matemática, que a partir
de datos se llega a una conclusión.

Tipo Estadístico
Distribución de frecuencia Absoluta y relativa
Representación gráfica: barras, círculos
La estadística descriptiva se encarga Estadísticos de posición (Me), (Mo), (Md).
de la: central:
• Recogida Estadísticos de dispersión: Rango. , S2. CV,
• Ordenación
• Tabulación Máx y Min.
• Análisis Estadísticos de forma: Simetría (S),
de los datos de una muestra (y de una Curtosis (K).
variable).
2. Estadística descriptiva

1. Distribución de frecuencia

Una distribución de frecuencia es un Clase fa Fa f% F%


conjunto de puntuaciones ordenadas en sus
respectivas categorías.
Las frecuencias se pueden expresar en
tablas de:
fa, frecuencia absoluta.
-Frecuencias absolutas (f)
Fa, frecuencia absoluta acumulada.
-Frecuencias relativas (%).
f%, frecuencia relativa.
-Frecuencias acumuladas: absolutas y
F%, frecuencia relativa acumulada.
relativas
Se presentan en tablas.
2. Estadística descriptiva

2. Representaciones gráficas
Se utilizan para hacer más clara y evidente la información que nos dan las tablas de datos.
2.1. Graficas de barras 2.2. Grafico circular (pastel)
Representan distribuciones de frecuencia Representan distribuciones de frecuencias
relativa (%) de una variable cualitativa o relativas (%) de una variable cualitativa o
cuantitativa discreta. cuantitativa discreta.
Uno de los ejes sirve para inscribir las Cada sector representa el valor porcentual
frecuencias, ya sean absolutas o relativas de las categorías de la variable
(%), y el otro para la escala. cuantitativa, o discreta.
2. Estadística descriptiva

2. Representaciones gráficas
2.3. Histograma
Se asemeja al diagrama de barras, ya que también
representa las frecuencias. Sin embargo, difieren.
En el diagrama de barras cada su “barra” correspondiente,
mientras que el “histograma se agrupan en intervalos para
ser representados con una única barra.

Las áreas son iguales o proporcionales a sus frecuencias.


Este gráfico se usa para representar una distribución de
frecuencias de una variable cuantitativa continua.
Habitualmente se representa la frecuencia observada en
el eje Y, y en el eje X la variable.
2. Estadística descriptiva
3. Estadísticos de tendencia central
3.1. Media (M = x ) 3.2. Mediana (Md) 3.3. Moda (Mo)
Centro de gravedad de una Se utilizar para variables que El único estadístico que se
n
distribución de frecuencias. puede utilizar en presencia de

x
adoptan al menos una escala
ordinal. variables nominales.
i
Con los datos ordenados del La moda es la puntuación a la
x = i =1 valor inferior al superior, la que corresponde la frecuencia
máxima en una distribución de
n
donde: n, tamaño de
mediana se interpreta como el
valor del caso que ocupa la frecuencias; es el valor o
muestra; x, valor de la
variable, i = 1; 2; …; n posición central de la categoría “que más se lleva”,
distribución (punto medio), que más se repite en una
No recomienda a la media aquel valor que deja igual distribución de frecuencias.
como índice de tendencia número de casos por encima
No es preciso realizar ningún
central, si la distribución de (50%) que por debajo (otro
cálculo, ya que se descubre
frecuencias muy asimétrica 50%), creando dos grupos,
con la simple inspección ocular.
perdería representatividad. uno superior y otro superior..
2. Estadística descriptiva
4. Estadísticos de variabilidad
4.1. Desviación típica (S ) 4. 2. Varianza (S2) 4.3. Coeficiente de variación
Permite conocer la variabilidad Es el cuadrado de la (CV)
de los datos: homogeneidad o desviación típica. El CV es una cantidad relativa,
heterogeneidad). n mide la dispersión de los datos
n  i
( x − x ) 2
con respecto a la media.
 (x − x)
i
2
S2 = i =1
S
S= i =1 n −1 CV = 100
n −1 x
ത 2 , se
El numerador σ(𝑋𝑖 = 𝑋)
Una S pequeña: la distribución
se sitúan muy cerca de la denomina suma de cuadrados. 4.4. Rango
media (homogénea). La varianza es un concepto Son los extremos entre los que
Una S elevada: el conjunto de básico en la investigación y en están comprendidos los valores
valores que están diseminados estadística inferencial. de los datos obtenidos.
en un amplio rango.
R = Rmax − Rmin
2. Estadística descriptiva
5. Medidas de forma
5.1. La curva normal
1. Es un tipo de curva de probabilidad que asumen o exigen la normalidad de los datos
observados.
2. Tiene un solo pico, por consiguiente es unimodal y presenta una forma de campana.
3. La media de una población distribuida normalmente se encuentra en el centro de su
curva normal.
4. La mediana y la moda de la distribución también se hallan en el centro, por tanto en
una curva normal, la M, la Md y la Mo poseen el mismo valor.
5. Las dos colas o extremos de una distribución normal de probabilidad se extienden de
manera indefinida y nunca tocan el eje horizontal (asintótica al eje X).
2. Estadística descriptiva

6. Medidas de forma
6.2. Simetría
• Una distribución es simétrica si al plegarla sobre sí misma (a partir del valor de
la mediana), las dos mitades que se obtienen se superponen completamente,
es decir, una de las áreas es imagen de la otra formando una mutua imagen
especular.
• Si la distribución de frecuencias es unimodal, coincidirán en un mismo valores
M = Md = Mo.
2. Estadística descriptiva

6. Medidas de forma
6.3. Asimetría
Una distribución asimétrica suele definirse como sesgada y se caracteriza por
disponer del pico más elevado de la distribución desplazado.

Asimetría positiva: los valores Asimetría negativa: los valores


más extremos (la cola larga de la más extremos son menores que la
distribución) son mayores que la media, la cola más larga apunta
media. hacia el lado izquierdo.
2. Estadística descriptiva
6. Medidas de forma
6.4. Índice de asimetría (S)

(a) S > 0 Asimetría positiva


Mo ˂ Me ˂ X
Sesgo a la derecha

(b) S = 0 Simétrica
Mo = Me = X
no existe sesgo

(c) S < 0 Asimetría negativa


X ˂ Me ˂ Mo
Sesgo a la izquierda
2. Estadística descriptiva

6. Medidas de forma
6.5. Curtosis (K)
El coeficiente de curtosis (K) mide la densidad de las colas de una distribución, en
comparación con la curva normal.
• Si K=0, la curva construida a partir de la distribución de frecuencias de la
variable es normal (mesocúrtica).
• Si K > 0(valor positivo). La curva es “apuntada”, alta y estrecha (leptocúrtica).
• Si K < 0(valor negativo). La curva es poco “apuntada”, baja y ancha (platicúrtica).

leptocurtica k>0 Mesocurtica k=0 Platicúrtica k<0


2. Estadística descriptiva

6. Medidas de forma
6.5. Curtosis (K)

(a) Leptocúrtica K > 0

(b) Mesocúrtica K = 0

(c) Planicúrtica K < 0


2. Estadística descriptiva

Tamaño demuestra para población cuando no se conoce σ

Población infinita (desconocida) Población finita (conocida) Ajuste de no


Aplicando no / N :
Z 2 pq Z 2 . p.q.N
n0 = n0 = 2 Si no / N ≤ 0,1:
E2 E ( N − 1) + Z 2 . p.q
se acepta el no encontrado.
donde: n = tamaño de muestra.
p = proporción de la población que posee la característica que Si no / N > 0,1:
se desea saber (cuando se desconoce se asume p = 50) se debe recalcular el
q = 1-p
Z = desviación normal, los valores más usados para (1 -  ) tamaño.
son: 0,95 y 0,99; y los valores correspondientes de Z/2
son: Se muestra mediante
Z0,025 =1.96 (algunos toman como 2.0) y Z0,05 = 2,575.
E = error porcentual que varía de 1% a 5% , algunos hasta 10 n=
n0
% (error de la muestra por no ser la población) n
N = población 1+ 0
N
no = muetra provisional cuando se tiene N finita..
Para poblaciones infinitas N =∞, entonces no = n-
2. Estadística descriptiva
Tamaño demuestra para una población cuando se conoce σ

Población infinita (desconocida) Población finita (conocida) Ajuste de no


Z 2 2 Z 2 .N . 2
Aplicando no / N :
n0 = n0 = 2
E2 E ( N − 1) + Z 2 . 2 Si no / N ≤ 0,1:
donde: n = tamaño de muestra. se acepta el no encontrado.
σ = desciación estándar de la población. q = 1-p
Z = desviación normal, los valores más usados para (1 -  ) Si no / N > 0,1:
son: 0,95 y 0,99; y los valores orrespondientes de Z/2 se debe recalcular el
son: tamaño.
Z0,025 =1.96 (algunos toman como 2.0) y Z0,005 = 2,575.
E = error que se espera cometer alrededor de la media Se muestra mediante
poblacional.
N = población n0
n=
no = muetra provisional cuando se tiene N finita.. n
Para poblaciones infinitas N =∞, entonces no = n 1+ 0
N
2. Estadística descriptiva

Ejercicio de aplicación
Matriz de datos

1. Plantear el problema: Caso de estudio. N V1 V2 … Vi


.
2. Definir variables. 1 y1 y1 … y1
3. Determinar el tamaño de muestra. 2 y2 y2 … y2
4. Toma de datos (aleatoria, matriz de datos) 3 y3 y3 … y3
5. Análisis estadístico (tratamiento datos).
. . . … .
6. Presentación de resultados.
. . . … .
. . . … .
n yn yn … yn
2. Estadística descriptiva

Tratamiento con software (Software)


Interpretación

E S
Sistema de computo
(software)
Pie Chart (BOSTON2.STA 4v*24c)

<= 29,6
> 52,4

(44,8;52,4] (29,6;37,2]

(37,2;44,8]

Valores de variables Principio de caja negra


DUREZA

univariantes Resultados
2. Estadística descriptiva

Tarea 2
Desarrolle un caso de estudio de estadística descriptiva

1. Plantear el problema: Caso de estudio.


2. Formulación del problema, objetivos e hipótesis (si es necesario).
3. Definición de variables.
4. Diseño de muestra Tamaño de muestra.
5. Toma de datos (aleatoria, matriz de datos).
6. Análisis estadístico (tratamiento datos).
7. Presentación de resultados.
8. Conclusiones.
9. Bibliografía.
2. Estadística descriptiva

2. Estadística descriptiva
Dr. Martin Taboada Neira

Trujillo, junio del 2022

También podría gustarte