Está en la página 1de 61

ESTADÍSTICA

DESCRIPTIVA
Estadística:

“La ciencia de la recolección


y análisis de datos para la
toma de decisiones.”
Estadística Descriptiva: Es la parte de la estadística que
trata solamente de describir y analizar un grupo dado
sin sacar conclusiones o inferencias de un grupo mayor,
a partir de ella.

Estadística Inferencial: La inferencia estadística


comprende aquellas técnicas por medio de las cuales se
toma decisiones sobre una población estadística
basadas solo en la muestra observada. Debido a que
dichas decisiones se toman en condiciones de
incertidumbre, entonces estas serán confiables con
cierto grado de probabilidad
• Para poder comprender mejor este tipo de
estudio es importante conocer los siguientes
términos básicos:
Población: Es un conjunto de
personas, eventos o cosas de
las cuales se desea hacer un
estudio, y tienen una
característica en común.
Muestra: Es un subconjunto cualquiera
de la población; es importante escoger la
muestra en forma aleatoria (al azar),
pues así se logra que sea representativa
y se puedan obtener conclusiones más a
fines acerca de las características de la
población.
Todo estudio estadístico debe considerar
diferentes tipos de variables:

Variables

Variables cualitativas
Variables Cuantitativas
Variables cualitativas:
Relacionadas con
características no numéricas
de un individuo (por ejemplo:
atributos de una persona,
nacionalidad, color de la piel,
sexo).
Variables Cuantitativas: Relacionadas
con características numéricas del
individuo por ejemplo: edad, precio
de un producto, ingresos anuales.
Las variables cuantitativas se dividen
en discretas (aquellas que pueden
tomar solo algunos valores en un
intervalo y no valores intermedio,
ejemplo: edad, número de hermanos
que puede ser 1, 2, 3....,etc, pero,
por ejemplo, nunca podrá ser 3,45) o
continuas (aquellas que pueden
tomar cualquier valor en un intervalo
real, ejemplo: alturas, la velocidad
de un vehículo puede ser 80,3 km/h,
94,57 km/h...etc.).
Cualitativas Nacionalidad, profesión

Cuantitativas Temperatura, edad

Discretas sexo

Continuas Estatura, peso

Constantes El valor de ∏
Razones
Estadística Porcentajes
elemental Tasas

Distribución de Absolutas
frecuencias Relativas

Medidas de Moda
Tendencia Mediana Aritmética
Media Geométrica
central
Armónica

Medidas de Desviación estándar


dispersión Varianza
Coeficiente de variación
Índice de Gini
ESTADISTICA ELEMENTAL
RAZONES
Las razones son cocientes que resultan de comparar el
número de personas que quedan ubicadas en una de las
categorías de una variable cualitativa dicotómica, con el
número de personas que queda en la otra categoría de esa
variable
En una encuesta 120 personas están de acuerdo con el divorcio y 80 están en
desacuerdo, la razón entre esos números es:

120/80

Ese valor se expresa diciendo que la razón de las personas que están de
acuerdo con el divorcio respecto de las que están en desacuerdo es de 120 a
80, o simplificando, de 3 a 2.
PROPORCIONES
Es la relación entre el número de unidades o personas en
la categoría y el total de las personas del grupo.
Las personan que están de acuerdo con el divorcio son 120 y el total
del grupo es de 200 (120 + 80), entonces la proporción de personas
que tienen esa actitud, en el nivel del grupo, es de:

120/200 = 0.6

La proporción de las personas en desacuerdo es:

80/200 = 0.4

En general, si “p” es el número de personas de una de las categorías


de una variable dicotómica, y “q” es el número de personas de la otra
categoría, entonces:

p+q=1
Proporción de personas de 30 años y
más en tres tipos de educación, en las
localidades de Amira y Belicia, 1995

Tipo de Amira p Belicia q


educación
Básica 480 0,57 284 0,54

Media 320 0,38 190 0,36

Superior 45 0,05 51 0,10

Total 845 1,00 525 1,00


PORCENTAJES
Un porcentaje es una proporción multiplicada por 100. Los
porcentajes cumplen la misma función comparativa que
esa medida

Tipo de Amira (%) Belicia (%)


educación
Básica 57,0 54,0
Media 38,0 36,0
Superior 5,0 10,0
Total 100,0 100,0
(845) (525)
TASAS
La tasa es un tipo especial de razón en la cual el
numerador indica el numero de un cierto suceso que
ocurre durante un determinado periodo, y el denominador
es el número de sucesos con los cuales el primero esa
relacionado
Tasa de atención en salud en el municipio A:

Total hrs de atención en salud


Total de la población del municipio

Tasa de retención escolar.


Es la proporción o porcentaje de alumnos que terminan
un ciclo escolar respecto del número de esa cohorte al
iniciar el ciclo.
112/200 = 0.56 (o 56 %)
DISTRIBUCION DE FRECUENCIAS
Ordenando la Información
Al ordenar datos muy numerosos, es
usual agruparlos en clases o categorías.
Al determinar cuántos pertenecen a
cada clase, establecemos la frecuencia.
Construimos así una tabla de datos
llamada tabla de frecuencias.
¿Para qué se construyen las tablas
de frecuencias ?

1. ORDENAR
2. AGRUPAR
3. RESUMIR INFORMACIÓN
El formato general de una tabla estadística , llamada también
TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS es la siguiente:

Nombre de la Frecuencia
variable
Categorías o Frecuencias
Recorrido de la Observadas
variable
TOTAL n
Definiciones:
•Rango: Diferencia entre el máximo y el mínimo
valor de una variable.

•Marca de clase: Representante de un intervalo, y


corresponde al promedio entre los extremos de éste.

•Tamaño de un intervalo: Es el cuociente entre el


valor del rango y la cantidad de intervalos que se
desea obtener. Se recomienda tomar como longitud
de los intervalos un valor entero que sea mayor o
igual al cuociente obtenido.
Para estas tablas debemos considerar cada intervalo con límites
cerrado y abierto, o sea [ - [

La tabla siguiente la vamos a elaborar con:

frecuencias absolutas: estas frecuencias son las que se


obtienen directamente del conteo
frecuencias relativas: corresponden a los porcentajes de cada
frecuencia absoluta.
frecuencia absoluta acumulada: corresponde a la frecuencia
absoluta del intervalo más la suma de las frecuencias absolutas
de todos los valores anteriores.
frecuencia relativa acumulada: corresponde al porcentaje de la
frecuencia relativa del intervalo más la suma de las frecuencias
relativas de todos los valores anteriores.
Motivo de la consulta médica, durante una
semana en un consultorio rural

Motivo consulta Numero de pacientes

Bronquitis 19

Otitis 13

Heridas 7

Fracturas 18

Vacunas 20
Los siguientes datos corresponden a las notas obtenidas por
un curso de 24 alumnos en un trabajo de matemáticas:

3,2 4,2 5,6 6,0 2,8 3,9 4,2 4,2 5,0


5,0 3,9 3,9 3,2 3,2 4,2 5,6 6,0 6,0
3,2 6,0 4,2 5,0 5,6 5,0

Ordenemos estos datos en una tabla


tabla::
• Nombre de variable
• Frecuencia Absoluta
• Frecuencia relativa (ambas)
(ambas)
Nota Frecuencia Frecuencia Frecuencia Relativa
Absoluta Relativa Porcentual (%)

2,8 1 0,041 4,166


3,2 4 0,166 16,666
3,9 3 0,125 12,500
4,2 5 0,208 20,833
5,0 4 0,166 16,666
5,6 3 0,125 12,500
6,0 4 0,166 16,666

¿Qué conclusiones puedes obtener de la tabla anterior?


Hasta el momento sólo hemos trabajado con una pequeña
cantidad de datos. ¿Qué crees que deberíamos hacer si tenemos
muchos datos?

Tabla de Frecuencias de datos agrupados


(tambien llamadas tabla de frecuencias con clase)
En ocasiones, el agrupar los datos en
intervalos, nos puede ayudar para realizar un
intervalos
mejor análisis de ellos.
Sueldo ($) Marca de frecuencia Frecuencia Frecuencia Frecuencia
Clase Absoluta Relativa % Absoluta Relativa
Acumulada Acumulada %

[200.000 – 300.000[ 250.000 5 25 5 25

`[300.000 – 400.000[ 350.000 4 20 9 45

[400.000 – 500.000[ 450.000 4 20 13 65

[500.000 – 600.000[ 550.000 3 15 16 80

[600.000 – 700.000[ 650.000 2 10 18 90

[700.000 – 800.000[ 750.000 2 10 20 100


MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central son números


calculados con fórmulas especiales que representan, en
forma sumaria, una serie de valores de una variable
cuantitativa.

Así, por ejemplo, si un grupo tiene un promedio de


edad de 15.5 años y otro tiene un promedio de 18.6, el
primero se caracteriza por su "menor" edad respecto
del segundo
MODA
La moda se identifica al observar el valor que se presenta
con más frecuencia en la distribución.

Unimodal

Bimodal

Multimodal
Si consideramos el ejemplo del peso de una muestra de
personas:
65 76 48 48 68 78 90 87 67 72 92
Mo = 48 kilos
Esto significa que la mayoría de estas personas pesa 48
kilos. Esta distribución es unimodal.

Si consideramos el ejemplo del peso de una muestra de


personas:
65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayoría de estas personas pesa 48
kilos y 78 kilos.
Esta distribución es bimodal.
Debilidades:

a) La medida varía considerablemente de una muestra a


otra tomada mismo universo.

b) Puede no dar una buena representación del colectivo del


cual proviene. Por ejemplo, las dos distribuciones
siguientes, muy distintas entre sí por sus valores
componentes, tienen la misma moda (el número 4), con lo
cual podría creerse que las dos series de valores son
semejantes, cuando, en realidad, hay bastantes diferencias
entre ellas:

•2,0 – 3,0 – 4,0 – 4,0 – 6,0 – 6,5 – 6,6 – 6,8 – 7,0


•3,0 – 3,5 – 4,0 – 4,0 – 4,5 – 4,8 – 5,0 – 5,3 – 5,5
MEDIANA

Sea X una variable por lo menos ordinal y sea x1, x2,…xn


una muestra de tamaño n de observaciones de la
variable, se define como Mediana "Me" un valor tal que
supera a no más del 50% de las observaciones y es
superado por no más del 50% de las observaciones,
cuando estas han sido ordenadas según magnitud.

“El valor de la escala debajo


del cual se encuentra 50% de
los datos”
Ejemplo: Consideremos la edad en años de ocho
personas
10 18 25 32 12 5 7 7

Para calcular la mediana, previamente se deben


ordenar las observaciones. En este caso lo haremos
en forma creciente:

5 7 7 10 12 18 25 32

Como la cantidad de datos es par, entonces la


mediana corresponde al promedio de los datos
centrales, por lo tanto la mediana es 11.
• La mediana es menos sensible que la media a
la presencia de datos extremos.

• La mediana no se ve afectada si todas las


frecuencias se multiplican o dividen por una
misma constante.

• Para el cálculo no hace uso de toda la


información que suministra la variable.
MEDIA ARITMETICA

La media aritmética es una de las medidas de tendencia


central más utilizada para caracterizar a un colectivo
mediante un solo valor. Ese valor es la suma de los
valores de una variable cuantitativa continua, de carácter
interval o proporcional, dividida entre el número de
valores sumados
PROMEDIO PARA DATOS NO TABULADOS

Sea X una variable cuantitativa y x1, x2,…, xn una


muestra de tamaño "n" de valores de la variable, se
define la media aritmética de X como:

x1 +x2 +x3 +.....+xn ∑ x i


X= X = i=1

n n
PROMEDIO PARA DATOS TABULADOS

Para calcular la media aritmética de un conjunto de


datos, se suma cada uno de los valores y se divide entre
el total de casos.
Sea X una variable estadística que toma los valores ,
con frecuencias absolutas , respectivamente, la media
viene dada por:

x1 f1 + x2 f 2 + ... + xn f n ∑x ⋅ f i i
x= = i =1
f1 + f 2 + ... + f n n

∑f i =1
i
Consideremos la edad en años de ocho personas

10 18 25 32 12 5 7 7

En este ejemplo el promedio , media o media aritmética


de la edad de estas personas está dada por:

10 + 18 + 25 + 32 + 12 + 5 + 7 + 7
x=
8
Es decir la edad promedio de estas personas es de 15,5
años.
MEDIA GEOMETRICA

x g = a1 × a 2..............an
n

Menos sensible a los valores extremos


Consideremos el mismo ejemplo (la edad en años de
ocho personas)
10 18 25 32 12 5 7 7

En este ejemplo el promedio , media o media aritmética


de la edad de estas personas está dada por:

xg = 8 10×18× 25×32×12×5× 7 × 7

Es decir la edad promedio de estas personas es de 12,8


años.
Notas en un curso X
3,0 3,0 3,0 4,0 5,0 5,0 5,0

Notas en un curso Y
1,0 1,0 1,0 4,0 7,0 7,0 7,0

Promedios X Y

Aritmético 4,00 4,00

Geométrico 3,89 2,80


MEDIDAS DE TENDENCIA CENTRAL
• La variabilidad se refiere a cuan alejados de la media
están los datos.

• Desviación Estándar
• Varianza
• Coeficiente de variación
DESVIACION ESTÁNDAR

”Raíz cuadrada de la media de los cuadrados de las


desviaciones con respecto a la media de la distribución”

∑ (x − x ) ∑ (x − x )
n n
2 2
i i
s= i
S= i =i
n n −1
Distribución Poblacional Distribución Muestral
Cursos Alumnos Notas

1 4 1,0 – 1,0 – 7,0 – 7,0

2 4 1,0 – 3,0 – 5,0 – 7,0

3 4 3,5 – 3,5 – 4,5 – 4,5

Cursos Prom. Arit. Desv. estándar

1 4,0 3,46

2 4.0 2,58

3 4,0 0,58
DESVIACION ESTÁNDAR

Las desviaciones estándar de dos distribuciones de


frecuencia no se pueden comparar directamente, pues
dependen del tamaño de la media aritmética respectiva

s
Cv =
x
Ejemplo:

En 2 cursos de posgrado de la Usach, las edades de


los alumnos fluctúan de la siguiente manera: en un
curso el promedio de edad es de 26 años con una
desviación estándar de 3; en el segundo curso el
promedio de edades es de 38 con una desviación
estándar de 5.

¿Puede afirmarse que hay una mayor dispersión


en el curso 2, solo comparando las desviaciones?
Parámetros X Y

Media 26 38
aritmética
Desviación 3 5
estándar
Coeficiente de 11,5 13,2
variación
VARIANZA

”Es la diferencia entre el valor de cada


observación y la media”

σ 2
=
∑ (X − µ ) 2
S 2
=
∑ ( X −X)
2

N n −1
Varianza Poblacional Varianza Muestral

Es el promedio de las desviaciones respecto de la media


aritmética
INDICE DE GINI

Para determinar la concentración que puede tener una


variable cuantitativa en un cierto colectivo, se utilizan
dos medidas principales: una de ellas es el índice de
Gini y la otra es la diferencia de la variable entre quintiles
extremos de la distribución.

Gini = 1 – Ʃ(pi + pi–1) x (qi + qi+1)


Tipo de Porcentaje Porcentaje de
ocupación respecto del total personas con
educación
universitaria
Obreros rurales 17,0 2,5
Obreros urbanos 38,5 4,8
Agricultores 22,8 5,1
Empleados 11,8 20,9
Empresarios 7,2 26,9
Profesionales y 2,7 30,8
técnicos
100.0 100.0
pi qi pi–1 qi + qi+1 (pi + pi–1) x (qi + qi+1)

0,170 0,025 – – –

0,555 0,073 0,385 0,098 0,04

0,783 0,124 0,228 0,197 0,04

0,901 0,333 0,118 0,457 0,05

0,973 0,602 0,072 0,935 0,06

1,000 1,000 0,027 1,602 0,04

0,23

1 - 0.23 = 0.77
CUANTILES
La mediana divide a la distribución en dos partes iguales, los
cuantiles son parámetros que dividen los datos de la
distribución en partes iguales.

Cuartiles: Se llaman cuartiles a tres valores que dividen a la


serie de datos en cuatro partes iguales.

Quintiles: Se llaman quintiles a cuatro valores que dividen a


la serie en cinco partes iguales.

Deciles:
Nueve valores iguales que dividen la distribución en 10 partes
iguales.

Percentiles: Noventa y nueve valores que dividen la serie en


100 partes iguales
REPRESENTACIONES
ESTADISTICAS
Representaciones Gráficas

Para hacer más clara y evidente la información que nos dan


las tablas se utilizan los gráficos. Existen múltiples tipos de
gráficos, pero aquí trataremos solamente de los usados
más frecuentemente, que son: gráfico de barras, gráfico de
sectores o circular (pastel), histograma, polígono de
frecuencias, la ojiva y el pictograma.
Gráficos estadísticos
GRÁFICOS
La información contenida en las tablas de
frecuencias resulta más accesible y fácil de
interpretar si se representan por medio de gráficos
estadísticos..
estadísticos

Diagrama de barras

Se usa fundamentalmente para representar distribuciones de frecuencias de una variable


cualitativa o cuantitativa discreta y, ocasionalmente, en la representación de series
cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean
absolutas o relativas (%), y el otro para la escala de clasificación utilizada.
Histograma

Está formado por rectángulos, cuyas bases


corresponden con los intervalos de clase y sus áreas son
iguales o proporcionales a sus frecuencias.
Este gráfico se usa para representar una distribución de
frecuencias de una variable cuantitativa continua.
Habitualmente se representa la frecuencia observada en
el eje Y, y en el eje X la variable
Polígono de
frecuencias
Es una línea poligonal que une los vértices superiores
de las barras de un diagrama de barras, o los puntos
medios de las bases superiores de los rectángulos de
un histograma. Se utiliza, al igual que el histograma,
para representar distribuciones de frecuencias de
variables cuantitativas continuas, pero como no se
utilizan barras en su confección sino segmentos de
recta, de ahí el nombre de polígono. Habitualmente se
usa cuando se quiere mostrar en el mismo gráfico más
de una distribución.
Ojivas

La ojiva es la representación gráfica de las frecuencias


absolutas acumuladas o de los respectivos porcentajes
acumulados.
Diagrama de sectores o gráfico circular
Gráfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias
relativas (%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace
corresponder la medida del ángulo de cada sector con la frecuencia correspondiente a la clase
en cuestión. Si los 360º del círculo representan el 100 % de los datos clasificados, a cada 1% le
corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para un sector dado bastaría
con multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres).
GRÁFICOS
Pictogramas Gráfico de líneas u ojiva

Los pictogramas son gráficos similares a los


En este tipo de gráfico, al igual que el
gráficos de barras, pero empleando un
histograma y el polígono de frecuencias el
dibujo en una determinada escala para
objetivo es representar distribuciones de
expresar la unidad de medida de los datos.
frecuencias de variables cuantitativas
Se utiliza un dibujo relacionado con el tema,
continuas, pero sólo para frecuencias
para representar cierta cantidad de
acumuladas.
frecuencias. Este tipo de gráfica atrae la
se representan los valores de los datos en dos
atención por los dibujos, pero la desventaja
ejes cartesianos ortogonales entre sí.
es que se lee en forma aproximada.
Se pueden usar para representar: una serie o
más series
TABLAS
COSTO ECONÓMICO DE LA DEGRADACIÓN
DE SUELOS EN EUROPA

Tipo de alteración Costo económico (Billones de €)

Erosión 0,7 – 14
Pérdida de materia orgánica 3,6 – 5,6
Compactación No es posible su estimación
Salinización 158 – 321
Corrimiento de tierras 1,2
Contaminación 2,4 – 17,3
Pérdida de biodiversidad No es posible su estimación

Fuente: Cortés, 2007

También podría gustarte