Está en la página 1de 55

GEOESTADÍSTICA

Unidad N° I
Definición de estadísticas y
conceptos básicos.
TEMA DE LA SEMANA
Distribución de frecuencias simples, distribución por intervalos.
S04.s4

Judith Sánchez R.
LOGRO ESPECIFICO
Al finalizar la sesión, el alumno:

 Conoce los cuadros de distribución de frecuencias


simples, distribución por intervalos, por medio del
análisis de casos.
Temario:
1. CARACTERÍSTICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS
2. OPERACIONES BÁSICAS CON LOS DATOS
3. CONCEPTOS EN LAS VARIABLES DE INTERVALOS O
AGRUPADAS
4. LAS REPRESENTACIONES DE LAS DISTRIBUCIONES DE
FRECUENCIAS
REVISIÓN DE LA CLASE
ANTERIOR
¿Qué se vio la clase
pasada?
¿Quedó alguna duda?

4
SABERES PREVIOS

¿Saben algo Distribución de


frecuencias simples, distribución por
intervalos?

5
UTILIDAD

¿Por qué creen que es importante este tema?


¿En qué situaciones lo aplicarías?

6
DISTRIBUCIÓN DE FRECUENCIAS SIMPLES, DISTRIBUCIÓN POR INTERVALOS.
DISTRIBUCION DE FRECUENCIAS
Características de las distribuciones de frecuencias

• LA OPERACIÓN BÁSICA EN ESTADÍSTICA DESCRIPTIVA


CONSISTE EN PRESENTAR LA INFORMACIÓN PARA SU
ESTUDIO.
• EL OBJETO DE LA ESTADÍSTICA DESCRIPTIVA ES LA
REALIZACIÓN DE COMPARACIONES SIGNIFICATIVAS
ENTRE AGRUPACIONES DE DATOS
• ¿CÓMO PUEDO DESCRIBIR A UNA POBLACIÓN O
MUESTRA??????
• OPERACIONES BÁSICAS CON LOS DATOS:
• AGRUPACIÓN (ORGANIZACIÓN,
ORDENACIÓN)
• TRATAMIENTO ARITMÉTICO DE LOS
DATOS
• LAS DISTRIBUCIONES SON LA FORMA EN QUE SE ORGANIZAN Y
SE COMPARAN LOS DATOS OBTENIDOS.
• HAY DISTRIBUCIONES DE FRECUENCIAS, PORCENTUALES Y
ACUMULADAS
Características de las distribuciones de frecuencias

• Hay distribuciones llamadas unitarias,


(tipo I), agrupadas en frecuencias (tipo
II) y agrupadas en intervalos de clase y
frecuencias (tipo III)
• Unitarias, (tipo I). CADA UNIDAD UN VALOR
• Recorrido de la variable pequeño y población o muestra pequeña
• EDADES EN UNA FAMILIA

• Agrupadas en frecuencias (tipo II) VALORES REPETIDOS PARA POCAS


CATEGORIAS de la variable
• Recorrido de la variable pequeño pero muestra o universo grande (es
decir, hay valores que se repiten
• SEXOS EN ESTA CLASE

• Agrupadas en intervalos de clase y frecuencias (tipo III) MUCHOS


VALORES POSIBLES Y MUCHAS CATEGORIAS de la variable
• Recorrido de la variable grande y muestra o población grande
• INGRESOS, PESO, EDADES, ETC
• Las distribuciones de frecuencias son la expresión analítica de
las variables y son fundamentales en el análisis UNIVARIABLE (y
bivariable). Y son la base de las distribuciones porcentuales y
agrupadas
• Son distribuciones donde cada una de las CATEGORIAS en las
que se descompone una variable son presentadas en relación al
número de CASOS que tienen.
• Las DISTRIBUCIONES O TABLAS DE FRECUENCIAS sirven para la
expresión de cualquier tipo de variable (CUALITATIVAS,
CUANTITATIVAS, CONTINUAS Y DISCRETAS, ORDINAL, NOMINAL,
INTERVALO, ETC)
• Una vez asignadas las categorías a una variable, llamaremos
FRECUENCIA al número de casos en cada una de esas categorías y
los resultados los expresaremos en las llamadas TABLAS DE
FRECUENCIAS:
• VARIABLE: CUALITATIVA, NOMINAL

Nacionalidad
CATEGORIAS
Frequency
Española 929
Latinoamericana 192
Magrebí 24
Subsahariana 3
Otras 52
Total 1200
• Si la variable está expresada en escala de intervalo, llamaremos
también INTERVALO (O CLASE) a las categorías definidas:

EDAD_RECODE_ENDOS
CATEGORIAS
Frequency
intervalos/clase entre 15 y 16 años 223
entre 17 y 18 años 194
entre 19 y 20 años 244
entre 21 y 22 años 222
entre 23 y 24 años 317
Total 1200

LA MAYORÍA DE LAS VARIABLES CONTINUAS HAN DE ADQUIRIR


LA FORMA DE INTERVALO (AGRUPADA) Y TAMBIEN MUCHAS
DISCRETAS, A EFECTOS DE FACILITAR SU ANÁLISIS
• Llamaremos FRECUENCIA ABSOLUTA al número total de casos en
cada categoría

Tabla de frecuencias ABSOLUTAS


CATEGORIAS Frecuencia de
Fi clase/Frecuencia
intervalos/clase entre 15 y 16 años 223 absoluta SIMPLE
entre 17 y 18 años 194
entre 19 y 20 años 244
entre 21 y 22 años 222
entre 23 y 24 años 317
Total 1200

Frecuencia absoluta simple (también llamada frecuencia de clase):


número de veces que se repite un suceso. Expresión= fi

N o n= Número total de casos (suma de todas las fi)..N=∑fi


ESTADÍSTICA APLICADA A LAS
CC SOCIALES
• Llamaremos FRECUENCIA ABSOLUTA acumulada a la suma de cada
categoría con la anterior

Tabla de frecuencias ABSOLUTAS ACUMULADAS

f¡ fa Frecuencia
ABSOLUTA
izquierda 100 100 ACUMULADA

derecha 250 350


Centro 300 650
Total (N o n) 650
N o n= Número total de casos (suma de todas las fi)..N=∑fi
• Para establecer comparaciones más allá de la pura observación, se
emplean las llamadas FRECUENCIAS RELATIVAS que son el
cociente entre cada frecuencia absoluta (f¡) con el total de casos (N)

Frecuencia
f¡ fr RELATIVA

Hombres 100 0.29


Mujeres 250 0.71
Total (N o n) 350 1.00
Frecuencia relativa: Es una PROPORCIÓN .Expresión= ∑fi/N
• Al igual que en las frecuencias absolutas
acumuladas, existe la frecuencia relativa acumulada
(EXPRESIÓN: fra)

Frecuencia RELATIVA
ACUMULADA
f¡ fr fra
Hombres 100 0.29 0.29
Mujeres 250 0.71 1.00
Total (N o 350 1.00 1.00
n)
• CADA FRECUENCIA RELATIVA (fr) multiplicada por
100 da como resultado el porcentaje

Frecuencia RELATIVA
ACUMULADA

f¡ fr % fra
Hombres 100 0.29 X100 29%
Mujeres 250 0.71 71%
Total (N) 350 1.00 100%
Frecuencia relativa X 100: Es un porcentaje .Expresión= %FRA
• EJEMPLO DE UNA DISTRIBUCIÓN DE FRECUENCIAS SALIDA SPSS

EDAD

Cumulative
Frequency Percent Percent
Valid etre 15 y 16 años 223 18,6 18,6
entre 17 y 18 años 194 16,2 34,8
entre 19 y 20 años 244 20,3 55,1
entre 21 y 22 años 222 18,5 73,6
entre 23 y 24 años 317 26,4 100,0
Total 1200 100,0
• EN LAS DISTRIBUCIONES DE FRECUENCIAS CON DATOS
AGRUPADOS O DE INTERVALO, LOS DATOS SE PRESENTAN DE
MANERA FÁCIL Y COMPRENSIBLE...PERO SE PIERDE
INFORMACIÓN
EDAD

Cumulative
Frequency Percent Percent
Valid etre 15 y 16 años 223 18,6 18,6
entre 17 y 18 años 194 16,2 34,8
entre 19 y 20 años 244 20,3 55,1
entre 21 y 22 años 222 18,5 73,6
entre 23 y 24 años 317 26,4 100,0
Total 1200 100,0

¿cuánta GENTE HAY


DE 16 AÑOS??
Conceptos en las variables de intervalos o
agrupadas

• Número de intervalos de clase= K


Marca de clase: valor intermedio. Tomamos como marca de clase el punto medio
de cada intervalo y lo calculamos sumando los extremos del intervalo y
dividiéndolo entre 2. La marca de clase es el valor que representa a todo el
intervalo para el cálculo de algunos parámetros como la media aritmética o la
desviación típica.

edad f¡ Marca de clase


Entre 15 y 18 100 16.5
Entre 19 y 22 250 20.5
Entre 23 y 26 300 24.5
Total (N o n) 650
• Límites del intervalo; los valores superiores e inferiores (límite
superior= Li Límite inferior Li-1
• Cuando trabajamos con variables discretas, no hay problema con
los límites reales; ejemplo NUM DE HIJOS EN UN FAMILIA
• EL LIMITE INFERIOR DE LA CLASE “ENTRE 3 Y 4” NO SE
SUPERPONE AL SUPERIOR DE LA CLASE “ENTRE 1 Y 2”

HIJOS f¡ Marca de clase


Entre 1 y 2 100 1.5
Entre 3 y 4 250 3.5
Entre 5 y 6 300 5.5
Total (N o n) 650
• Cuando trabajamos con variables CONTÍNUAS, SI HAY
PROBLEMAS UNA VEZ QUE LAS AGRUPAMOS O
CREAMOS INTERVALOS

• EJEMPLO; VARIABLE EDAD: EL LIMITE INFERIOR DE LA


CLASE “ENTRE 3 Y 4” SE SUPERPONE AL SUPERIOR DE
LA CLASE “ENTRE 1 Y 2”

EDAD f¡ Marca de clase


Entre 15 y 18 100 16.5
Entre 19 y 22 250 20.5
Entre 23 y 26 300 24.5
Total (N o n) 650
• Para resolver el problema, se emplean teóricamente los llamados
“limites reales”

• EJEMPLO; VARIABLE EDAD: EL LIMITE SUPERIOR DE


LA CLASE “ENTRE 15 Y 18” SE SUMA AL INFERIOS DE LA
CLASE “ENTRE 19 Y 22 AÑOS” Y SE DIVIDE POR DOS

EDAD f¡ Marca de clase Límites reales


Entre 15 y 18 100 16.5 De 14.50 a 18,50
Entre 19 y 22 250 20.5 De 18,50 a 22.50
Entre 23 y 26 300 24.5 De 22,50 a 26,50
Total (N o n) 650
Las representaciones de las distribuciones de
frecuencias

• Normalmente, las distribuciones de frecuencias se representan de forma


gráfica.

• Es una manera de mostrar de forma visual las relaciones entre los datos.

• Tres agrupaciones en cuanto al tipo de representación:


• Gráficos para comparar categorías dentro de una variable
• Gráficos para análisis y comparación de distribuciones
• Gráficos para la distribución conjunta de dos variables
Las representaciones de las distribuciones de
frecuencias

• La elección de cada tipo de gráfico dependerá de

• Los objetivos del análisis que vayamos a efectuar.


• Del tipo de variable que vayamos a
tratar.(cualitativas/cuantitativas y continuas o discretas)
• GRAFICOS PARA LA DESCRIPCION Y COMPARACION DE
CATEGORIAS EN UNA VARIABLE

• Diagrama de barras (simples y apilables)


• Grafico de áreas
• Diagrama de sectores
• DIAGRAMA DE BARRAS

• Interesa comparar las categorías de una variable


• Tipo de variables; cualitativas o cuantitativas discretas.
• Compara datos en % o en frecuencias para cada una de las categorías.

ESTADÍSTICA APLICADA A LAS


CC SOCIALES
Diagrama de barras. Variable cualitativa

60 60

50
40
40

30
sexo
20

10

0
Hombres Mujeres
Diagrama de barras. Variable cuantitativa
discreta

40 40

35
30
25 25

20 20

15
10 10

5 3
2
0 Num de hijos en hogar

Uno dos tres cuatro cinco seis


Diagrama de barras. Barras apiladas. Variable
cuantitativa discreta en dos poblaciones
100% 3 0
5
2
90% 10 10
80%
70% s e is

40 45 cinco
60% cuatro
Tre s
50% Dos

40% Uno

30% 25 15
20%
10% 20 25
0%
Andalucia Galicia
• GRAFICO DE AREAS

• Interesa comparar dos categorías o dos


poblaciones (o más) sobre una variable
cuantitativa continua.
• Muy empleado en análisis de series temporales.
• Gráfico de Áreas. Variable cuantitativa continua.
Comparación de tres categorías de la variable “situación
laboral” en cuanto a los ingresos
100% desconocido
5
ocupados
18 15
90% parados
25
80%

70%

60% 30
52
50% 65 85

40%

30%

20% 45
30
10% 20
10
0%
2000 3000 4000 5000
• DIAGRAMA DE SECTORES

• Para comparar pocas categorías de una variable cualitativa o


cuantitativa discreta.
• El cálculo de los grados: el arco de cada sector equivale a la frecuencia
de esa categoría, con lo cual se DIVIDE LA FRECUENCIA
ABSOLUTA DE CADA CATEGORÍA POR EL NUMERO TOTAL
DE CASOS Y SE MULTIPLICA POR 360
• Hombres: 700/1200*360=210 grados
• Mujeres: 500/1200*360=150 grados
• Un circulo tiene 360 grados

• NOTACION DE LOS GRADOS DEL ANGULO: άi


• DIAGRAMA DE SECTORES. Variable CUALITATIVA. Comparación de sexo
en una muestra

30

70

Hombres mujeres
• GRAFICOS PARA EL ANALISIS Y LA COMPARACION DE
DISTRIBUCIONES

• Histogramas
• Polígonos de frecuencias
• Diagrama de CAJAS
• HISTOGRAMA

• Adecuadas para variables de intervalo, cuantitativas de tipo


contínuo.
• Los distintos intervalos se ordenan de menor a mayor y de
izquierda a derecha.(convención que no siempre se aplica)
• A diferencia del diagrama de barras, el histograma
representa superficies. La dimensión de cada categoría se
calcula mediante
• S=b (base =amplitud del intervalo)*h (altura=porcentaje o
frecuencias)
• CALCULO DE DENSIDAD DE FRECUENCIA (EN
INTERVALOS DE AMPLITUD DESIGUAL: Di= fi Ci
HISTOGRAMA. Variable cuantitativa contínua y de intervalo
Datos sin agrupar
HISTOGRAMA. Variable cuantitativa contínua y de intervalo
Datos agrupados/intervalos iguales
Las representaciones de las distribuciones de frecuencias

• POLIGONO DE FRECUENCIA

• Adecuadas para variables de intervalo, cuantitativas de tipo contínuo


• Son una alternativa a los histogramas
• La línea que cruza en cada categoría representa la marca de clase
Polígono de frecuencias. Variable cuantitativa continua y de intervalo
Polígono de frecuencias simple construido encima de histograma
Polígono de frecuencias. Variable cuantitativa continua y de intervalo
Polígono de frecuencias dos distribuciones
140
120
100
80 Hombres
60 Mujeres

40
20
0
21-30 31-40 41-50 51-60
Poligono de frecuencias. Variable cuantitativa continua y de intervalo
Polígono de frecuencias acumuladas
Las representaciones de las distribuciones de frecuencias

• DIAGRAMA DE CAJA (BOX PLOT)

• Tiene como finalidad evaluar la FORMA de una distribución.


• Se trata de un gráfico basado en los CUARTILES, (dividen a la
distribución en 4 partes) que ofrece información sobre la simetría y
concentración de la distribución.
• Util para detectar casos atípicos en la distribución
Las representaciones de las distribuciones de frecuencias
https://www.youtube.com/watch?v=JtB2w0QLRZ4
https://www.youtube.com/watch?v=VNMck8wco98
PRACTICA

CASO A RESOLVER
• Desarrolla un ejemplo de cada variable
CIERRE

¿Qué aprendimos hoy?

¿Cuáles son los puntos


principales?
Consulta bibliográfica

OPCIONAL
BIBLIOGRAFIA CONSULTADA

Puente Viedma, Carlos de la - Autor. Estadística


Descriptiva e Inferencia. Ediciones IDT.
https://tubiblioteca.utp.edu.pe/cgi-bin/koha/opac-detail.pl?
biblionumber=38096
Prepárate

OPCIONAL
TEMA O ACTIVIDAD DE LA
SIGUIENTE SESIÓN
•Controles en el manejo de
concentrados
•Control de Calidad en la
Comercialización

También podría gustarte