Está en la página 1de 52

Facultad Ciencias de

la Salud y Servicios BIOESTADISTICA


Sociales

UNIDAD 2
RECOLECCIÓN Y PRESENTACIÓN GRÁFICA DE DATOS

TEMA 3:
SÍNTESIS DE DATOS ESTADÍSTICOS

Ing. Juan T. Calderon Cisneros, PhD.


SUBTEMA: 1.- Tablas de Distribución de frecuencias
relativas porcentuales.
SUBTEMA: 2.- Tablas de Distribución de frecuencias
acumuladas
SUBTEMA: 3.- Representaciones Graficas.
SUBTEMA: 4.- Parámetros de tendencia central
OBJETIVO
DESARROLLA CONOCIMIENTOS
BÁSICOS SOBRE LOS
CONCEPTOS DE MEDIDAS DE
TENDENCIA CENTRAL Y DE
DISPERSIÓN APLICADA
CORRECTAMENTE EN EL
ÁMBITO DE LAS CIENCIAS DE LA
SALUD Y LAS CIENCIAS
BIOLÓGICAS
Ejemplo 1:

Las notas de 35 alumnos en el examen final de estadística, calificado del 0 al 10, son las
siguientes:

0; 0; 0; 0; 1; 1; 1; 1; 2; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 5; 5; 6; 6; 6; 7; 7; 7; 8; 8; 8; 9; 10; 10.

Con los datos obtenidos, elaborar una tabla de frecuencias


Solución:

•El número de intervalos (k), donde N=35, me lo da el


enunciado del problema: k = 5

•Hallamos el rango: R = Xmax– Xmin = 10 – 0 = 10.

•Calculamos la amplitud de clase: A = R/k = 10/5 = 2.

•Ahora hallamos los límites inferiores y superiores de


cada clase, y elaboramos la tabla de frecuencias.
Existen diferentes
Si se eligen muchos
reglas para
intervalos, la longitud
determinar el
de cada uno de ellos
número de intervalos
resulta pequeña
de clase

Si se eligen pocos
intervalos, la longitud Una de ellas es la
de cada intervalo de regla de Sturges.
clase resulta grande.
NÚMERO DE
INTERVALOS DE
CLASE A USAR

7
2.- Calcular la longitud de la
clase con= 3.- Diseñar la tabla
𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 con las clases y
𝑁𝑢𝑚𝑒𝑟𝑜 𝑐𝑙𝑎𝑠𝑒𝑠 frecuencias absolutas
y relativas

1.- Calcular el
numero de clases
con= 4.- Adicional se calcula:
* marca de clases se usa
𝟐𝑲 ≥ 𝒏 grafico de polígonos
Donde N=numero de ELABORACION DE * Frecuencia acumulada
datos. se usa para grafico de
INTERVALOS DE ojiva.
Aunque a muchas CLASES CON LA
asumen el numero. REGLA DE
STURGES
* Gráfico de barras,
* Gráfico de sectores circulares
Variables * Líneas
cualitativas.

* Diagrama de Pareto para el control de


calidad (el 80% de los problemas se
deben al 20% de las causas)
.

GRÁFICAS
Discretas * Gráfico de bastones

* Histogramas
Variables
Cuantitativas Continuas * Polígonos
* Ojivas

* Diagrama de
dispersión
Discretas o Continuas
*Series de tiempo
Variable: Cualitativa
Variable: Cualitativa
Variable: Cuantitativa - Discreta
Variable: Cuantitativa - Continua
Variable: Cuantitativa

15
Variable: Cuantitativa
Para dos variables
categóricas X ,Y, indica el
número de veces que Además se generan
las variables, toma de gráficos de barras.
manera simultanea los
valores de X e Y.

También llamadas
Pueden frecuencias
tablas cruzadas o
absolutas o
tablas de
frecuencias relativas.
contingencia.
DISTRIBUCIÓN
CONJUNTA DE
FRECUENCIAS
Estas medidas son:
1.-Media aritmética
3.-Mediana Es un valor promedio
4.-Moda para representar o
resumir las
características de un
Permite determinar la conjunto de valores.
posición de un valor
respecto a un
conjunto de datos, el Se calcula tanto para
cual lo consideramos datos agrupados en
como representativo. tablas de frecuencia o
para datos originales
MEDIDAS DE es decir no agrupados
TENDENCIA
CENTRAL

20
Su fórmula para datos
no agrupados: Una desventaja es
σ𝑿 que es muy sensible

𝑿=
𝒏 a valores muy
pequeños o grandes
σ𝑿
𝝁=
𝑵
Su fórmula para datos
agrupados:
Es la mas conocida, σ 𝑿. 𝒇
utilizada y entendida 𝝁=𝑿 ഥ=
por todos, es 𝒏
adaptable cuando se Donde:
trata de hacer
cálculos MEDIA X= marca de clase o el
matemáticos. ARITMETICA valor de la variable
Se la conoce como
media ponderada

22
Su fórmula para datos
agrupados: Su formula para datos no
𝒏 agrupados:
− 𝑭𝒋−𝟏
𝑴𝒆 = 𝑳𝒊𝒏𝒇 + 𝒊 ∗ 𝟐 (cuando n es impar)
𝒇𝒋
Su importancia es 𝑴𝒆 = 𝑿 𝒋
menor debido a su (cuando n es par)
fórmula que es rígidas 𝑿𝒋−𝟏 + 𝑿𝒋
ya que no admiten 𝑴𝒆 =
tratamiento algebraico. 𝟐
Es el valor central de un Para encontrar la
conjunto de datos posición de la mediana
ordenados. es:
Su ventaja es que los 𝒏+𝟏
valores extremos no 𝟐
tienen incidencia en el
calculo. MEDIANA

24
Su ventaja es que es la
única medida de Su formula para datos no
posición que puede ser agrupados:
utilizada en atributos es
decir cuando la (valor que mas se
característica es repite)
cualitativa 𝑴𝒐 = 𝑿 𝒋
Es el valor de la variable
que mas se repite o
aquel que representa la Su formula para datos
máxima frecuencia. agrupados:
Puede suceder que una (valor que mas se repite
distribución tenga dos o en las frecuencias)
mas modas. 𝑴𝒐 = 𝒎𝒂𝒓𝒄𝒂 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆

MODA

26
PERCENTILES

Un percentil aporta información acerca de la


dispersión de los datos en el intervalo que va del
menor al mayor valor de los datos.

28
PERCENTIL

El percentil p es un valor tal que por lo menos p


por ciento de las observaciones son
menores o iguales que este valor y por lo menos
(100 p) por ciento de las observaciones son
mayores o iguales que este valor.

29
CALCULO DEL PERCENTIL

30
CALCULO DEL PERCENTIL

Ejemplo
Determine el percentil 85 y 50 en los sueldos mensuales
iniciales.

31
CUARTILES
A los puntos de división se les conoce como
cuartiles y están definidos
como sigue:

32
CUARTILES

Los cuartiles han sido definidos como el percentil


25, el percentil 50 y el percentil 75.

Por lo que los cuartiles se calculan de la misma


manera que los percentiles.

33
CUARTILES

CALCULAR LOS CUARTILES DEL EJERCICIO


ANTERIOR

34
RESUMEN DE CINCO NÚMEROS
En el resumen de cinco números se usan los cinco números siguientes para
resumir los datos.

35
DIAGRAMA DE CAJA
Es un resumen gráfico de los datos con base en el
resumen de cinco números.

La clave para la elaboración de un diagrama de caja es


el cálculo de la mediana y de los cuartiles Q1 y Q3.

También se necesita el rango intercuartílico, RIC= Q3-


Q1

36
PASOS PARA ELABORAR UN
DIAGRAMA DE CAJA

37
38
Sin embargo es posible
determinar si hay
concentración de datos
alrededor del promedio, el
cual nos indicaría una
buena representatividad Por el contrario una
Al calcular un gran dispersión
promedio, por estaría indicando
ejemplo la media no poca
sabemos hasta donde representatividad,
se dá la por lo tanto no sería
representatividad confiable o adecuada
para ese conjunto de par el conjunto de
datos. datos.
MEDIDAS DE
DISPERSION

39
La desviación Rango= Valor mayor –
estándar S ò σ Valor menor
Se define como la raíz
cuadrada positiva de la
La varianza: S2 ò varianza
Es la medida de dispersión
σ2 mas sencilla.

Se define como la media de


los cuadrados de las
Coeficiente de
diferencias entre los valores variación=
que toma la variable y su 𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝒆𝒔𝒕á𝒏𝒅𝒂𝒓
media. Sus símbolos son: 𝑴𝒆𝒅𝒊𝒂
MEDIDAS DE indica cuán grande es
S2 = varianza muestral DISPERSION la desviación
σ2= varianza poblacional
estándar en relación
con la media

40
DATOS NO AGRUPADOS Y AGRUPADOS

41
DATOS NO AGRUPADOS

42
DATOS NO AGRUPADOS Y AGRUPADOS

43
DATOS NO AGRUPADOS Y AGRUPADOS

44
DATOS AGRUPADOS

σ(𝑋 − ത 2𝑓
𝑋)
𝑆2 =
𝑛−1

σ 𝑋 2
𝑓 − 𝑛 ത2
𝑋
𝑆2 =
𝑛−1

σ 2
𝑋 𝑓
2
𝑆 = − 𝑋ത 2
𝑛−1
45
EJERCICIOS EN CLASES

Realizar los ejercicios


proporcionados por el
docente

46
ANÁLISIS DE LOS DATOS
Estadística

Descriptivo Inferencial

Toma de Decisiones
ACTIVIDAD DE CIERRE

Parámetros de tendencia central


Los parámetros estadísticas sirven para sintetizar la
información dada por una tabla o gráfica.
Concretamente, los parámetros de centralización nos
indican cuál es el valor centro en torno al cual se
distribuyen los datos.
Revisar el siguiente link:
https://www.youtube.com/watch?v=CrItHF8aJ
3M
Tomado de La CLASES ONLINE CON SUSI --- Si tienes
alguna duda concreta o quieres que sea tu profesora
particular puedes solicitarme Clases Online en este
enlace: http://susiprofe.com/ver/clases
Bibliografía

Montgomery, D. C., Runger, G. C., &


Medal, E. G. U. (1996). Probabilidad y
estadística aplicadas a la
ingeniería (No. 968-18-5914-6. 01-A1
LU. AL-PyE. 1.). Mexico DF, Mexico:
McGraw-Hill.

Walpole, R. E., Myers, R. H., & Myers,


S. L. (1999). Probabilidad y estadística
para ingenieros. Pearson Educación.
BIOESTADISTICA

ING. JUAN T. CALDERON CISNEROS, PhD


DOCENTE-INVESTIGADOR – ACREDITADO
SENESCYT-REG-INV-18-02756

COORDINADOR DE LA RED ACADÉMICA "HERRAMIENTAS DE ESTADÍSTICA


MULTIVARIANTE PARA EL ANÁLISIS DE BIG DATA".
Nro. SENESCYT-2018-040_ REG-RED –18-0011.

RESEARCHERID IS: K-6083-2014


Scopus Author ID: 57204238028
http://orcid.org/0000-0002-8167-8694
http://www.redhemabigdat.com/
https://ec.linkedin.com/in/juan-t-calderon-cisneros-19a14b31

También podría gustarte