Está en la página 1de 73

ELEMENTOS DE

ESTADSTICA DESCRIPTIVA
Profr. Eliud Quintero Rodrguez
Introduccin

La Estadstica es una ciencia que


facilita la solucin de problemas en
los cuales necesitamos conocer
caractersticas sobre el
comportamiento de algn suceso o
evento.
Nos permite inferir el
comportamiento de sucesos iguales o
similares sin necesidad de que estos
ocurran.
Esto nos da la posibilidad de tomar
decisiones acertadas y a tiempo,
as como realizar proyecciones del
comportamiento del suceso.

Slo se realizan los clculos y el


anlisis con los datos obtenidos de
una muestra de la poblacin y no
con toda la poblacin.
Actualmente el INEGI es el encargado de
concentrar y publicar la informacin estadstica del
estado y del pas.
Conceptos bsicos
Estadstica:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para
despus obtener conclusiones. Se divide en
Estadstica Descriptiva y Estadstica Inferencial.

Estadstica descriptiva:
Se encarga de la recoleccin,
organizacin, presentacin y
anlisis de los datos de una
poblacin.
Estadstica inferencial:
Se encarga de analizar la informacin
presentada por la estadstica descriptiva
mediante tcnicas que nos ayuden a conocer,
con determinado grado de confianza, a la
poblacin. Lo que nos permite tomar
decisiones.
Poblacin:
Conjunto definido de TODOS los INDIVIDUOS, de
donde se observa cierta caracterstica.
Al nmero de integrantes de la poblacin se llama
tamao de la poblacin y se representa con la
letra N.

Las poblaciones pueden ser finitas o infinitas.


Poblacin Estadstica:
Conjunto de TODOS los DATOS que se obtienen al
realizar la medicin de una variable en los
elementos de una poblacin.
Muestra:
Subconjunto de una poblacin, que intenta reflejar
las caractersticas de la poblacin lo mejor posible.
El nmero de individuos que integran la muestra,
llamado tamao de la muestra se representa con
la letra n.
Individuo:
Es el elemento de la poblacin o de la muestra que
aporta informacin sobre lo que se estudia.
Variable:
Caracterstica o propiedad de los individuos que se
desea estudiar y se puede medir o calificar;
cambia o vara con el tiempo en un individuo dado,
o cambia o vara de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, nmero de hijos, etc.
Dato:
Valor que se obtiene al realizar la medicin de la
caracterstica de la variable en estudio.
Pueden ser univariados, bivariados o multivariados.

La naturaleza de los datos pueden ser datos


cuantitativos o datos cualitativos.
Datos Cuantitativos (nmeros):
Valores obtenidos al medir peso,
estatura, temperatura, nmero
de hijos.

Datos Cualitativos (categoras):


Se obtienen al calificar la
caracterstica en cuestin como
el sexo, estado civil, grado
mximo de estudios.
Variable Dicotmica:
Slo puede tomar dos valores (s no, 0 1, hombre
mujer, bueno malo, encendido apagado).

En la variable CUANTITATIVA se pueden distinguir


dos tipos: continua y discreta.
Variable Continua:
Si la variable puede tomar cualquier
nmero real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.
Variable Discreta:
Si la variable slo puede tomar
nmeros enteros.
Ej. El nmero de hijos de un individuo.
Escalas de Medicin
Escala Nominal

Escala Ordinal

Escala de Intervalo

Escala de Razn
Escala Nominal:
Est asociada a variables cualitativitas y es
denominada de este modo si no se pueden hacer
operaciones aritmticas entre sus valores, pues stos
son nicamente ETIQUETAS.

Ejemplo: sexo, cdigo postal, estado civil, nmero


telefnico, nmero al correr en un maratn, deporte
favorito, carrera a estudiar, etc.
Escala Ordinal:
Los valores de la variable que tienen un ORDEN con
un nivel especfico, pero no se pueden hacer
operaciones aritmticas entre ellas.

Ejemplo:
Psimo Malo Regular Bueno Excelente
Primaria Secundaria Preparatoria - Licenciatura
Escala de Intervalo:
En ella existe un orden entre los valores de la
variable y adems una NOCIN DE DISTANCIA
aunque no se puedan realizar operaciones.
El cero o punto de inicio no es nico, es ms bien un
punto de referencia.

Ejemplo: Escalas de temperatura, la edad de la


Tierra, la lnea del tiempo de la humanidad.
Escala de Razn:
La magnitud tiene SENTIDO FSICO, existe el cero
absoluto, existe orden, se puede determinar
cuntas veces es mayor uno que otro.

Ejemplo: peso, estatura, edad, distancia, dinero, etc.


Fuentes de informacin

Encuesta:
Recopilar los datos mediante el uso
de cuestionarios o entrevistas.

Experimento:
Procedimiento utilizado en la
investigacin cientfica para obtener
informacin que permita conocer el
comportamiento de algn proceso.
Fuentes de Informacin

Investigacin Documental:
Procedimiento para obtener
datos mediante la consulta de
informacin ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
Redondeo de datos, notacin
cientfica y cifras significativas.
Redondeo:
El redondeo de datos es un
procedimiento que consiste en escribir un
nmero que representa a una cantidad
con menos cifras de las que tiene
realmente para tener una idea rpida de
la cantidad.
Notacin Cientfica
Es una manera de escribir en forma breve cifras
muy grandes o pequeas. La forma general es
n
a x 10 , en donde a es un nmero entre 1 y 9,
n es un nmero entero.

Ejemplo:
4
El nmero 25 000 se escribe 2.5 x 10 , o el
-
nmero 0.00025 se escribe como 2.5 x 10 . 4
Cifras Significativas
A los dgitos exactos que se utilizan para escribir
una cifra, a parte de los ceros para localizar el
punto decimal, se les llama cifras significativas.

Ejemplos:
3.22 tiene 3 cifras significativas.

-3
0.0032 = 3.2 x 10 tiene 2 cifras significativas.

-3
0.00320 = 3.20 x 10 tiene 3 cifras significativas.
La cifra 3.22 se encuentra realmente entre
3.215 y 3.225.

La cifra 0.0032 es un valor que se encuentra entre


0.00315 y 0.00325.

La cifra 0.00320 se encuentra entre las cifras


0.003195 y 0.003205
Orden de datos
La ordenacin es el proceso mediante el cual los
datos estn acomodados de tal manera que se
establece un orden (ascendente o descendente)
entre ellos.

Hay dos mtodos comunes:


Listado en orden ascendente
Mtodo de tallo y hojas
Ejemplo
Considera que la variable de estudio es el peso de
25 estudiantes. Los pesos se encuentran en la
siguiente tabla:

Peso de 25 estudiantes (en kg)

40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Listado en orden ascendente
El proceso consiste en ordenarlos de menor a mayor

Peso de 25 estudiantes (en kg) Peso de 25 estudiantes (en kg)

42 40 48 51 49 40 42 43 44 44
56 44 43 55 52
45 48 49 50 50
52 62 44 50 59
51 51 52 52 55
63 50 56 55 45 55 56 56 57 58
57 66 63 51 58
59 62 63 63 66
Mtodo de tallo y hojas

Si los nmeros de los datos estn formados por


dos dgitos, se hace una columna con el primer
dgito (decenas) y a la derecha de cada uno
de ellos se escribe, en fila, slo el segundo
dgito (unidades) de cada uno de los datos
que tengan el mismo primer dgito.
Datos sin ordenar: Peso de 25 estudiantes (en kg)

4 2,0,8,9,4,3,4,5 42 40 48 51 49
5 1,6,5,2,2,0,9,0,6,5,7,1,8 56 44 43 55 52
52 62 44 50 59
6 2,3,6,3
63 50 56 55 45
57 66 63 51 58
Datos ordenados:
4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8,9
6 2,3,3,6
Doble tallo
Una variante de este mtodo es en lugar de dividir
en un grupo las decenas, se divide en dos grupos. El
primero abarcando los dgitos del 0 al 4 y el
segundo del 5 al 9.

4 0,2,3,4,4
El ejemplo anterior 4 5,8,9
queda: 5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
Caso de variables cualitatitivas
El procedimiento es:

Se identifican todos los valores diferentes y se


acomodan en columna.

Se agrega una segunda columna en donde se van


registrando, mediante una lnea vertical, la veces
que aparece el valor dado.
Ejemplo
Considera que la variable de estudio es el color de
playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla:

rosa azul blanco azul rosa


gris blanco caf negro blanco
rosa azul caf blanco blanco
gris azul blanco rosa gris
gris blanco caf negro verde
Color Frecuencia
rosa azul blanco azul rosa Azul IIII
gris blanco caf negro blanco Blanco IIII II
rosa azul caf blanco blanco Caf III
gris azul blanco rosa gris Gris IIII
gris blanco caf negro verde Negro II
Rosa IIII
Verde I
Tabla de Frecuencia de Datos

Una vez que se tenga ordenados los datos, se


acomodan en la Tabla de distribucin de
frecuencias o tabla de frecuencias.

La tabla es bsicamente una tabla de valores


x-y, dnde x representa el dato y y
representa la frecuencia.
La frecuencia es el nmero de veces que aparece
cada dato.

Hay dos clases de tablas de frecuencias:


Para datos NO agrupados.
Para datos agrupados.
Tabla de frecuencias para
datos NO agrupados

Est formada por dos columnas: una para la


variable xi y la otra para su frecuencia f, a
esta frecuencia se le llama frecuencia absoluta o
frecuencia observada.
Ejemplo
Tabla de frecuencias de los pesos en kg de 25
alumnos.
xi f xi f
Peso de 25 estudiantes (en kg)
40 1 52 2
42 1 55 2
40 42 43 44 44 43 56
1 2
45 48 49 50 50 44 2 57 1
51 51 52 52 55 45 1 58 1
55 56 56 57 58 48 1 59 1
59 62 63 63 66 49 62
1 1
50 2 63 2
51 2 66 1
Total 25
Frecuencia relativa y acumulada
Por lo regular, se agregan dos columnas: la de la
frecuencia relativa fr y la de la frecuencia
acumulada fa.
La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el nmero total de
datos, esto es fr = f/n.
La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato
dado.
Ejemplo
1/25
xi f fr fa xi f fr fa
40 1 0.04 1 52 2 0.08 14
42 1 0.04 2 55 2 0.08 16
43 1 3 2/25 56 2 0.08 18
0.04
44 2 0.08 5 57 1 0.04 19
45 1 0.04 6 58 1 0.04 20
48 1 0.04 7 59 1 0.04 21 Siempre
49 1 0.04 8 62 1 0.04 22 es el
50 2 10 63 2 nmero
0.08 0.08 24
total
51 2 0.08 12 66 1 0.04 25
Total 25 1

Siempre es 1
Intervalo de clase

En ocasiones es conveniente acomodar los


datos en pequeos grupos de igual tamao,
llamados intervalos de clase.
El punto medio o marca de clase xi, se
obtiene con:
Marca de clase = Lmite inferior + lmite superior
2
El tamao del intervalo se obtiene mediante
la diferencia de los lmites superior e inferior.
Ejemplo

Lmite inferior Lmite superior Lm inf + Lim sup


2
Intervalo de clase Punto medio xi
38 42 40
43 47 45
48 52 50
53 57 55
58 62 60
63 67 65
Lmite verdadero del intervalo
Frontera de clase o lmite verdadero del intervalo:
Intervalo de clase Punto medio xi
37.5 42.5 40
40 2.5 42.5 47.5 40 + 2.5 45
47.5 52.5 50
52.5 57.5 55
57.5 62.5 60
62.5 67.5 65
Tabla de intervalos con
lmites verdaderos
Usando smbolos de Usando parntesis
Est incluido
y
No est incluido
Est incluido No est incluido
desigualdad corchetes
Intervalo de Punto Intervalo de Punto
clase medio xi clase medio xi
37.5 x < 42.5 40 [37.5 , 42.5) 40
42.5 x < 47.5 45 [42.5 , 47.5) 45
47.5 x < 52.5 50 [47.5 , 52.5) 50
52.5 x < 57.5 55 [52.5 , 57.5) 55
57.5 x < 62.5 60 [57.5 , 62.5) 60
62.5 x < 67.5 65 [62.5 , 67.5) 65
El tamao del intervalo es de 5
Si por alguna razn no es fcil decidir el ancho del
intervalo y el nmero de ellos, se pueden utilizar las
siguientes frmulas:
K = 1 + 3.3 log (n)
Donde K = nmero aproximado de clases

n = nmero de datos.
Amplitud de los intervalos = Rango / K
Donde Rango = diferencia entre el dato mayor
y el dato menor.
Ejemplo
Para el ejemplo de los datos de los pesos de 25
alumnos, el valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.
Por lo tanto se requieren aproximadamente 6
intervalos.
Y la amplitud de los intervalos sera:
Amplitud = Rango / K = (66 40) / 5.6 = 4.64.
Aproximadamente 5 unidades es la amplitud de los
intervalos.
Tabla de distribucin de
frecuencias para datos agrupados
Se elabora con los intervalos de clase, sus puntos
medios y las frecuencias correspondientes para
cada uno de los intervalos.
xi f 52 2 Datos agrupados
Datos sin agrupar

40 1 55 2 Intervalo de Punto medio f


42 1 56 2 clase xi
43 1 57 1 38 42 40 2
44 2 58 1 43 47 45 4
45 1 59 1 48 52 50 8
48 1 62 1 53 57 55 5
49 1 63 2 58 62 60 3
50 2 66 1 63 - 67 65 3
51 2 Total 25 Total 25
Se agregan las columnas de frecuencia relativa fr
y frecuencia acumulada fa:
Intervalo Punto f fr Fa 2/25
de clase medio xi
4/25
38 42 40 2 0.08 2
8/25
43 47 45 4 0.16 6
48 52 50 8 0.32 14
53 57 55 5 0.20 19
58 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
Por ltimo se agregan las columnas:
Frecuencia porcentual, f% %f, se obtiene
multiplicando la frecuencia relativa fr x 100.
Frecuencia relativa acumulada fra, se obtiene
sumando las frecuencias relativas anteriores a un
dato dado.
Frecuencia porcentual acumulada, f%a, se
obtiene sumando las frecuencias porcentuales
acumuladas a un dato dado.
Tablas de frecuencias absoluta, 0.08 x
relativa y acumulada 100

0.08 x 2/25
100
Intervalo Punto medio f fr f% fa fra f%a
de clase xi
38 42 40 2 0.08 8 2 0.08 8
43 47 45 4 0.16 16 6 0.24 24
48 52 50 8 0.32 32 14 0.56 56
53 57 55 5 0.20 20 19 0.76 76
58 62 60 3 0.12 12 22 0.88 88
63- 68 65 3 0.12 12 25 1 100
Total 25 1 100
Grfica de Datos
Existen dos tipos de grficas mas usuales:
Polgono de Frecuencias
Histograma

Otros grficos:
Grfica de barras
Pictograma
Grfico Circular o de pastel.
Polgono de Frecuencias
Es la representacin mediante un grfico de
lnea. En l se muestra la distribucin de
frecuencias y est formado por segmentos de
lnea que unen los puntos correspondientes a la
frecuencia de cada una de las clases.

El eje x representa el dato xi


y el eje y las frecuencias.
Ejemplo

9 Polgono de Frecuencias
8
7
6
5
f 4
Intervalo de Punto medio f 3
clase xi 2
38 42 40 2 1
0
43 47 45 4
35 40 45 50 55 60 65 70
48 52 50 8 xi
53 57 55 5

58 62 60 3

63 - 68 65 3

Total 25
El eje y puede ser sustituido por las frecuencias
relativas o porcentuales.
Polgono de Frecuencia Relativa
0.35

0.3

0.25
fr 0.2

0.15

0.1

0.05

0
35 40 45 50 55 60 65 70
xi
Polgono de Frecuencia Porcentual

35

30

25

% f 20

15

10

0
35 40 45 50 55 60 65
xi
Histograma
14

Es la representacin grfica de 12

10

los datos mediante una sucesin 6

de rectngulos. 0
0.95 2.95 4.95

Est formado por rectngulos cuya anchura


representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
En el eje x estarn los lmites verdaderos, los
puntos medios y en el eje y las frecuencias.
Intervalo de Punto medio f

Ejemplo clase
38 42
xi
40 2

43 47 45 4

48 52 50 8

53 57 55 5

58 62 60 3
Histograma
63 - 68 65 3
9
Total 25
8
7
6
5
f
4
3
2
1
0
35 40 45 50 55 60 65
xi
Tambin podemos usar la frecuencia relativa y la
frecuencia porcentual.
Histograma con frecuencias relativas
0.35
0.3
0.25
fr
0.2
0.15
0.1
0.05
0
35 40 45 50 55 60 65
xi
Histograma con frecuencias porcentuales
35

30

25

20
%f
15

10

0
35 40 45 50 55 60 65
xi
Pirmide Poblacional
Una variante en el histograma es colocar en el
eje x de tal manera que las columnas
quedarn en forma horizontal, es muy comn
en datos poblacionales.
Ojiva
Es la representacin grfica de las frecuencias
acumuladas mediante un grfico de lnea. Se
muestra la distribucin de frecuencias
acumuladas de los datos.

En el eje x estarn los puntos medios y en el


eje y las frecuencias acumuladas.
Ejemplo

Intervalo Punto f fr fa
de clase medio xi
38 42 40 2 0.08 2
43 47 45 4 0.16 6
48 52 50 8 0.32 14
53 57 55 5 0.20 19
58 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
Ojiva
30

25 25

22
20 19

fa 15 14

10
6
5
2
0 0
35 40 45 50 55 60 65
xi
Usando la frecuencia acumulada y la frecuencia
porcentual.
Intervalo Punto medio f fr f% fa fra f%a
de clase xi
38 42 40 2 0.08 8 2 0.08 8
43 47 45 4 0.16 16 6 0.24 24
48 52 50 8 0.32 32 14 0.56 56
53 57 55 5 0.20 20 19 0.76 76
58 62 60 3 0.12 12 22 0.88 88
63- 68 65 3 0.12 12 25 1 100
Total 25 1 100
Ojiva con frecuencia relativa acumulada
1
0.9 0.88

0.8 0.76
0.7
0.6 0.56
fra 0.5
0.4
0.3
0.24
0.2
0.1 0.08

0 0

35 40 45 50 55 60
xi
Ojiva con frecuencia porcentual acumulada
100
90 88

80 76
70
60 56
f%a 50
40
30
24
20
10 8

0 0

35 40 45 50 55 60
xi
Grfico Circular
Tambin es llamado grfico de pastel.

Slo se representan datos de frecuencias relativas


o frecuencias porcentuales.

Se debe dividir el rea del crculo de manera


proporcional a las frecuencias. 13% 13%
PERRO
17%
PAJARO
HAMSTER
GATO
57%
Agregaremos una columna a nuestra tabla de
frecuencias Frecuencia relativa al crculo,
multiplicando (fr)(360), para mostrar la parte
proporcional de crculo medida en grados que
corresponde a cada intervalo.
Ejemplo 1
0.08 x
360
Intervalo Punto medio f fr (fr ) (360)
de clase xi 0.16 x
38 42 40 2 0.08 28.8 360

43 47 45 4 0.16 57.6
48 52 50 8 0.32 115.2
53 57 55 5 0.20 72
58 62 60 3 0.12 43.2
63- 68 65 3 0.12 43.2
Total 25 1 360
Grfico Circular 40
8%
60
12% 65
12% 45
16%

55
20% 50
32%
Ejemplo 2

Color Frecuencia Conteo Color de Playera


Azul IIII 4 Azul Blanco Caf Gris
Negro Rosa Verde
Blanco IIII II 7 4%
Caf III 3 16% 16%
Gris IIII 4 8%
28%
Negro II 2 16%
Rosa IIII 4 12%
Verde I 1
Otros Grficos
La grfica de barras se traza similar al
Histograma, slo que las barras se dibujan
separadas unas de otras.
La escala en el eje x es para mostrar
categoras o intervalos de nmeros NO
consecutivos. Frecuencia absoluta
60

50

40

30

20

10

0
PERRO PAJARO HAMSTER GATO
Carrera Alumnos
Eleccin de Carrera
Medicina 8
Mecnica 11 11 11
Civil 8 8 8
6
Agronoma 3 3 3
Fsico - Matemticas 3
Leyes 6
Contadura 11
Pictograma
Similar al de barras, slo que se sustituyen por
figuras, generalmente relacionadas con la variable
estudiada.

También podría gustarte