Está en la página 1de 33

Bachillerato

Internacional - IB

TEMA: ESTADISTICA
DESCRIPTIVA
Docente:
CASIMIRO CRUZ
SONCCO
ESTADISTICA DESCRIPTIVA
1.1. INTRODUCCIÓN : CONCEPTOS BÁSICOS
ESTADÍSTICA: “Estudio de los métodos de recogida y descripción de
datos, así como del análisis de esta información”
Etapas de un estudio estadístico
1 Recogida de datos
2 Ordenación, tabulación y
gráficos*
3 Descripción de características*
4 Análisis formal
¿Quienes usan la estadística?

•Investigadores: científicos, ingenieros, ….


•Médicos
•Administradores.
•Organismos oficiales.
•Diarios y revistas.
•Marketing.
•Políticos.
•Deportes.
•etc.
VARIABLE ESTADÍSTICA (v.e.): ”Característica propia del individuo
objeto del estudio estadístico”

EJEMPLOS:
- Estatura
- Salario
- Color del pelo
- Nivel de colesterol
- Nº de hijos de una familia
ORGANIZACIÓN Y CLASIFICACION DE DATOS
Cuando se cuenta con un conjunto de datos, el primer paso es expresarlo y
clasificarlo de acuerdo a ciertos criterios diferentes y simples que permita
ver en forma rápida todas las características posibles para obtener
conclusiones útiles. Para el cual se consideran los siguientes pasos.
1. Revisión y corrección de datos
2. Construcción de tablas de frecuencias
3. Representación tabular o cuadros estadísticos y grafica.
DISTRIBUCION DE FRECUENCIAS
Consideremos una muestra de tamaño “n” y la variable estadística “x” que
toma “k” valores diferentes: x1; x2; x3;…; xk: Definimos los siguientes:
FRECUENCIA ABSOLUTA SIMPLE (fi o ni): Es el número de veces que se repite cada xi. la suma de todas las
frecuencias absolutas siempre da el tamaño de la muestra es decir:
𝑛

෍ 𝑓𝑖 = 𝑛
𝑖=1
FRECUENCIA RELATIVA SIMPLE (hi): Es la razón que existe entre la frecuencia absoluta simple y el tamaño de la
muestra. Es decir:
𝑓𝑖
ℎ𝑖 =
𝑛
Además se cumple que:
𝑘

෍ ℎ𝑖 = 1
𝑖=1
FRECUENCIA ABSOLUTA ACUMULADA (Fi o Ni): Es la acumulación de las frecuencias absolutas simples; es decir
𝐹𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + … + 𝑓𝑖
FRECUENCIA RELATIVA ACUMULADA (Hi): Es la acumulación sucesiva de las frecuencias relativas simples, es
decir:
𝐻𝑖 = ℎ1 + ℎ2 + ℎ3 + … + ℎ𝑖
FRECUENCIA PORCENTUAL SIMPLE (pi): Resulta al multiplicar la frecuencia relativa simple por 100%, es decir:
𝑝𝑖 = 100%ℎ𝑖
FRECUENCIA PORCENTUAL ACUMULADA (Pi) Resulta al multiplicar a la frecuencia relativa acumulada Hi por
100%, es decir:
𝑃𝑖 = 100%𝐻𝑖
DISTRIBUCION DE FRECUENCIAS DE UNA VARIABLE DISCRETA
Una distribución de frecuencias es una un arreglo de los valores observados x1; x2; …; xk
de la variable X con sus respectivas frecuencias, en una tabla de la forma:
Valor de X fi Fi hi Hi pi Pi
P1
x1 f1 F1 h1 H1 p1
P2
x2 f2 F2 h2 H2 p2
P3
x3 f3 F3 h3 H3 p3
.
. . . . . .
.
. . . . . .
.
. . . . . .
Pk=100
xk fk Fk=n hk Hk pk
%
Total n 1 100%

EJEMPLOS
01. Construir la distribución de frecuencias del números de hijos por familia (variable X) en una
muestra de 20 hogares, si se han observado los siguientes datos.
2; 1; 2; 4; 1; 3; 2; 3; 2; 0; 3, 2; 1; 3; 2; 3; 3; 1; 2; 4
02. Se realiza una encuesta a un conjunto de 16 familias sobre el numero de hijos. Los satos
obtenidos fueron:
2; 1; 3; 1; 2; 1; 3; 0; 2; 1; 2; 3; 4; 1; 1; 2
a) Construya una tabla de distribución de frecuencias y grafique
b) Interprete cada una de las frecuencias.
DISTRIBUCION DE FRECUENCIAS POR INTERVALOS
Esta distribución se usa cuando la variable estadística es continua o cuando el número de valores distintos de una variable es
discreto es muy grande. Esta distribución se obtiene dividiendo el rango de la variación de los datos en k intervalos o clases y
determinando el número de datos que contiene cada intervalo.
Cada intervalo o clase lo tomaremos cerrado por la izquierda y abierto por la derecha. Solo el último intervalo se tomara con
extremos cerrados.
Para construir con mayor facilidad la tabla de distribución de frecuencias por intervalos tomaremos en cuenta las siguientes
recomendaciones.
R1: Elegir no más de 20 intervalos ni menos de 5, puesto que muchos intervalos pueden complicar los cálculos de las medidas
descriptivas, y pocos intervalos podrían omitir ciertas características importantes de los datos.
R2: El número de intervalos debe dar una distribución de frecuencias mono modal, es decir sus frecuencias absolutas van
aumentando progresivamente hasta una frecuencia máxima y luego disminuye también en forma progresiva.
Intervalo fi Fi hi Hi pi Pi
I1 f1 F1 h1 H1 p1
P1
I2 f2 F2 h2 H2 p2
P2
I3 f3 F3 h3 H3 p3
P3
. . . . . .
.
. . . . . .
.
. . . . . .
.
Ik fk Fk=n hk Hk pk
Pk=100%
Total N 1 100%
CONSTRUCCION DE LA TABLA DE FRECUENCIAS
Para la construcción de la tabla de frecuencias de alguna variable discreta o continua, seguiremos el
siguiente proceso.
1. Determinar el rango (R) de la variación de los datos definido como:
R = Xmax – Xmin
2. Determinar el número de intervalos “k” teniendo en cuenta la recomendación R1, para el cual
recurrimos a la regla de Sturges:
𝑘 = 1 + 3,3 log 𝑛 ; 𝑛 ≥ 10
Redondeando al entero inmediato mayor.
Alternativamente se puede utilizar: 𝑘 = 𝑛; 25 ≤ 𝑛 ≤ 400
3. Determinar la amplitud por:
𝑅
𝐴 = 𝑘 ; si la división no es un numero exacto en el numero decimales, el numero A se aproxima
por exceso de manera que se cubra todo el rango. Además debemos tener en cuenta que la
amplitud debe tener la misma cantidad de decimales que los datos.
4. Determinamos los extremos de los intervalos de la manera siguiente:
𝐼1 = 𝑋𝑚𝑖𝑛 ; 𝑋𝑚𝑖𝑛 + 𝐴
𝐼2 = 𝑋𝑚𝑖𝑛 + 𝐴; 𝑋𝑚𝑖𝑛 + 2𝐴
.
.
.
𝐼𝑘 = 𝑋𝑚𝑖𝑛 + 𝑘 − 1 ; 𝑋𝑚𝑖𝑛 + 𝑘𝐴
MARCA DE CLASE (xi): Se define como el punto medio o semisuma de los limites
superior e inferior de cada intervalo de clase.
𝐿𝑖 + 𝐿𝑠
𝑚𝑖 =
2
GRAFICA DE LA DISTRIBUCION DE FRECUENCIAS POR INTERVALOS
Estas distribuciones se grafican mediante un histograma o polígono de frecuencias y a partir de
ella se la curva de frecuencias.

HISTOGRAMA: Representa la gráfica de la distribución de frecuencias por intervalos y consiste en


graficar barras rectangulares verticales cuya base es proporcional a la amplitud del intervalo de
clase y su altura es proporcional a su frecuencia (absoluta, absoluta acumulada, relativa, relativa
acumulada, porcentual o porcentual acumulada), cuyo punto central es la marca de clase.
POLIGONO DE FRECUENCIAS: Es la representación gráfica por una figura poligonal cerrada, el
cual se obtiene uniendo con segmentos de recta los puntos que tiene proporcionalmente la
marca de clase y como ordenada la frecuencia respectiva.

CURVA DE FRECUENCIAS: Se obtiene del polígono de frecuencias suavizando sus puntos


angulares. En el proceso de suavización es recomendable tener en cuenta que la porción de área
que se descarta debe ser proporcional a la porción de área que se incluye en el interior de la
gráfica.
EJEMPLO:
La inversión anual, en miles de dólares, de una muestra de 40 pequeñas empresas fueron:
31 17 27 20 28 10 34 25 4 24
15 39 18 30 41 26 12 46 18 23
36 19 29 37 33 27 27 24 26 31
25 28 33 28 22 23 31 29 35 21
a) Construir una distribución de frecuencias de 7 intervalos de clase
b) determinar el numero de empresas con una inversión de menos de 25 mil dólares
c) determinar el porcentaje de empresas con una inversión entre 14 mil y 20 mil dólares
THE END

También podría gustarte