Está en la página 1de 39

Estadstica I

Modulo 1 del primer seguimiento


Estadstica descriptiva

Ing. Javier De la Hoz Maestre

1. Conceptos bsicos y definiciones


Aprenderconsiste en adquirir instrumentos para interpretar y gozar el
entorno (Piaget). Por ello, no se obsesione por convertirse en
"profesional" tras un curso de pocas horas.Disfrutede lo que aprenda
e intente usarlo en la primera oportunidad.

Estadstica I

Definicin

La Estadstica es la Ciencia de la :
Sistematizacin, recogida, ordenacin y presentacin
a
v
de
los datos referentes a un fenmeno que presenta
i
t
p
ri
variabilidad o incertidumbre para su estudio metdico, con
c
s
objeto de
De
adeducir
las leyes que rigen esos fenmenos,
d

ob
r
P

lid
i
ab

er
f
In

y poder de esa forma hacer previsiones sobre los mismos,


ia
c
tomar decisiones u obtener conclusiones.
en
3

Mtodo cientfico y estadstica

La Estadstica se utiliza
como
tecnologa
al
servicio de las ciencias
donde la variabilidad y la
incertidumbre forman parte
de su naturaleza

Plantear
hiptesis

Disear
experimento

Obtener
conclusiones

Recoger datos
y analizarlos

Prez Tejada, H. E. M. S. (2000). Estadstica para las ciencias sociales y del comportamiento (No. 300.15 P4).

Conceptos bsicosy definiciones

Todos los anlisis estadsticos deberan empezar por la identificacin de..

Individuo (Individual) Elementos que vamos a observar


Poblacion(Population) Todos los individuos de interes
Censo (palabra derivada del latn censere que significa valuar o tasar) es una
enumeracin completa de la poblacin.
Variable (variable)-- carcter objeto de estudio, que puede tomar distintos valores
Parametro (Parameter) - resumen (nmerico o grafico) de la variable para la
poblacion
Muestra (sample)-- porcion de la poblacion que realmente se examina
Estadstico (statistic) resumen de la variable para los individuos de la muestra.

Conceptos bsicosy definiciones

A Parameter is to a Population
as a Statistic is to a Sample
A Statistic is to a Parameter as
a Sample is to a Population
Parameter
Statistic

Population
Sample

Tipos de variables y escalas de medida


Lo que estudiamos u observamos en cada objeto o
individuo de la muestra o poblacin son las variables.
Los datos son los valores que toma la variable en cada
caso.
Lo que vamos a realizar es medir, es decir, asignar valores
a las variables incluidas en el estudio o clasificar que
consiste en agrupar los objetos estudiados en categoras.
Deberemos adems concretar la escala de medida que
aplicaremos a cada variable.

Tipos de variables y escalas de medida


Variables

Ejemplos
Escala de medicin
nominal
Sexo: masculino, femenino

Categricas
ordinal

Numricas

Nivel socioeconmico:
Bajo, Medio y Alto

de
intervalo

Temperatura, calificacin de
examen, etc.

de razn
o relacin

Estatura, peso, distancia, etc.

absoluta

Nmero de hijos por familia, etc.

Tipos de variables y escalas de medida


La escala nominal clasifica las unidades de acuerdo con
ciertas caractersticas, de forma que dos unidades de la
misma categora son igualesentre s y diferentes de las
restantes categoras.
La escala ordinal cumple las propiedades de la escala
nominal y, adems, permite ordenar las categoras.
La escala de intervalo cumple las propiedades de la escala
ordinal y,adems, dispone de unidad de medida.

Tipos de variables y escalas de medida


La variable tiene cefalea? admite las categoras nunca , a veces,
muchas veces y siempre. En qu escala de medida se encuentra?
R/ escala ordinal.

11

2. Presentacin ordenada de
informacin : Tablas de frecuencia y
grficos

Estadstica I

Ing. Javier
la Hoz

Presentacin ordenada de
Informacin

De

Gnero

Frec.

Hombre

6
5
4
3

Mujer

2
1
0
Hombre

Mujer

Las tablas de frecuencias y las representaciones grficas son dos maneras


equivalentes de presentar la informacin. Las dos exponen
ordenadamente la informacin recogida en una muestra.

El propsito de la construccin de una tabla es presentar un conjunto de


datos en forma tal que su lectura e interpretacin sea posibilitada por la
disposicin de los mismos.

Representacin tabular:
Las reglas generales que se deben observar para facilitar se
lectura y posibilitar su correcta interpretacin son las siguientes:
a) Es preferible que la tabla contenga pocas variables a que
contenga muchas.
b)Todas las abreviaturas o smbolos que se utilicen deben
explicarse al pie.
c) El ttulo de cada fila y columna debe ser preciso.
d) Toda variable cuantitativa debe incluir la unidad de medida
que corresponde a los datos.
e) El ttulo de la tabla debe ser preciso, respondiendo a las
preguntas: qu?, cuando?, dnde?, y si se relacionan dos o
ms variables tambin
se responder a la pregunta cmo?.
Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representacin tabular:
Las reglas generales que se deben observar para facilitar se
lectura y posibilitar su correcta interpretacin son las siguientes:
g) Los totales deben indicarse cuando tengan sentido.
h) Si los datos no son originales, debe mencionarse la fuente de
los mismos al pie de la tabla.
i) Si se relacionan dos variables (bivariada), donde se puede
suponer que una de ellas es causa de la otra, se debe tener la
precaucin de escribir la supuesta causa en el margen
izquierdo y el supuesto efecto en el margen superior.
j) En una tabla bivariada, los porcentajes deben obtenerse
sobre los respectivos totales de fila.
Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representacin tabular:

Fuente: Bendassolli, P. F., Coelho-Lima, F., Carlotto, M. S., Nssle, F. S., & Ferreira, I. M. (2015). Estratgias Utilizadas pelos
Trabalhadorespara Enfrentar o Desemprego. Revista Colombiana de Psicologa, 24(2), 347-362..

Representacin tabular:
Consideremos una poblacin estadstica de n individuos, descrita segn un
carcter o variable C cuyas modalidades han sido agrupadas en un nmero k de
clases, que denotamos mediante c1, c2, . . . , ck. Para cada una de las clases
ci, i = 1, . . . , k, se pueden considerar las siguientes magnitudes:
Frecuencia absoluta (ni) de la clase ci es el nmero de observaciones que
presentan una modalidad perteneciente a esa clase.
Frecuencia relativa (f) de la clase ci es el cociente entre las frecuencias
absolutas de dicha clase y el nmero total de observaciones, es decir,

ni
fi
n

Obsrvese que (f) es el tanto por uno de observaciones que estn en clase ci.
Multiplicado por 100 representa el porcentaje % de la poblacin que comprende
esa clase.

Representacin tabular:
Frecuencia absoluta acumulada Ni, se calcula sobre variables
cuantitativas o cualitivas ordinales, y es el nmero de elementos
de la poblacin cuya modalidad es inferior o equivalente a la
i
modalidad ci:
N i n1 n2 ... ni n j
j 1

Frecuencia relativa acumulada, (Fi) se calcula sobre variables


cuantitativas o cuantitativas ordinales, siendo el tanto por uno de
los elementos de la poblacin que estn en alguna de las clases y
que presentan una modalidad inferior o iguali a la c i, es decir,
Fi

N i n1 n2 ..... ni

f1 f 2 ... f i f j
n
n
j 1

Representacin tabular:
Llamaremos distribucin de frecuencias al conjunto de clases junto a las
frecuencias correspondientes a cada una de ellas. Una tabla
estadstica sirve para presentar de forma ordenada las distribuciones
de frecuencias. Su forma general es la siguiente:

Ejemplo
Cuntos individuos
tienen menos de 2 hijos?
frec. indiv. sin hijos
+
frec. indiv. con 1 hijo
= 419 + 255
= 674 individuos

Qu porcentaje de
individuos tiene 6 hijos o
menos?
97,3%

Qu cantidad de hijos es
tal que al menos el 50%
de la poblacin tiene una
cantidad inferior o igual?
2 hijos

50%

Representacin tabular:

Si la variable es continua las clases vendrn


definidas mediante lo que se denomina
intervalos. En este caso, las modalidades que
contiene una clase son todos los valores
numricos posibles contenidos en el intervalo,
el cual viene normalmente definido de alguna
li 1 , li x : li 1 p x li
li 1 , li x : li 1 x p li

de estas formas

Presentacin ordenada de datos

En el caso de variables continuas, la forma


de la tabla estadstica es la siguiente:

Representacin tabular:
Como construimos una tabla de frecuencias cuando
nuestros datos son continuos?
Para construir cualquier tabla de frecuencias agrupadas debe tenerse en cuenta los siguientes
comentarios
Para mayor comodidad en el proceso de construccin de las clases, acordaremos que la primera
clase debe contener por lo menos el dato menor (en la realidad, esto no siempre es as).
Las clases deben ser mutuamente excluyentes, es decir, cada dato debe quedar exactamente en
una sola clase, no en dos al mismo tiempo.
Para mayor comodidad en el proceso de construccin de las clases, acordaremos que todas las
clases deben tener la misma amplitud (en la realidad, esto no siempre es as).

Representacin tabular:

Se recomienda seguir los siguientes pasos:


1. Determinar el nmero de clases (k). Mientras menos clases escojamos ser ms fcil el
trabajo, pero se perder ms informacin. . Una sugerencia til para el nmero de clases es la
n
siguiente:
si n no es muy grande
N 0 de clases=k
(Regla de Sturges) en otro caso
1 3.22 log n
2. Determinar el rango (R), que es la diferencia entre las medidas mayor y menor en el conjunto
R X mx X mn
de observaciones.

3.

Posteriormente se estima la amplitud deRclase (w ) calculando el cociente entre el rango R y el


w
nmero de clases k.

Representacin tabular:
4.

A continuacin se construye la primera clase ,para ello, primero, tenemos que encontrar
las fronteras inferior y superior de esta clase, por lo que hay que tener en cuenta el
punto medio de la unidad de medida.
Puntomedio

Unidad de medida
2

La unidad de medida es 1 si todos los datos son enteros; 0,1 si hay por lo menos un dato
con un solo lugar decimal; 0,01 si tiene dos lugares decimales ;0,001 si tiene tres
lugares decimales.
El primer limite inferior o frontera inferior de la primera clase ser igual a:

Linf xmin puntomedio

El primer limite superior sera igual a:

Lsup Linf w

Representacin tabular:
Ejemplo :
En un programa de autocontrol del peso, aplicado a 90 personas se
obtuvieron los siguientes valores de perdida de peso.
Representar esta informacin en una tabla de frecuencia.

26

Representacin tabular:
Solucin :

Primero organizamos la informacin de menor a mayor


Determinamos el nmero de clases (k)
Determinamos el rango (R)
Determinamos la amplitud (w)
Construimos la primera clase

27

Tabla bivariada:
El propsito de la tabla bivariada es representar como los valores
obtenidos de dos variables que supuestamente se relacionan.
Existen condiciones que se deben respetar:
Si se relacionan dos variables (bivariada), donde se puede suponer que
una de ellas es causa de la otra, se debe tener la precaucin de escribir la
supuesta causa en el margen izquierdo y el supuesto efecto en el margen
superior.
En una tabla bivariada, los porcentajes deben
sobre los
Dificultadesobtenerse
de comunicacin
Problemas
Muy pocas
Algunas
Muchas
Total
familiares
respectivos totales de fila.
Pocos

12

13

30

Algunos

14

10

30

Muchos

11

20

Total

30

26

24

80

Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representaciones grficas:
El propsito de la representacin grfica es visualizar
el comportamiento de un conjunto de datos.
Existen condiciones que se deben respetar:
a) todo grfico debe incluir un ttulo, comnmente
escrito en la parte inferior, que responda a las
preguntas: qu?, cuando?, dnde?, y si se
relacionan dos o ms variables tambin se
responder a la pregunta cmo?.
b) todas las abreviaturas o smbolos que se utilicen
deben explicarse al pie.
c) si los datos no son originales, debe mencionarse la
fuente de los mismos al pie.
d) se debe titular los ejes de forma precisa.
e) en general, un grfico progresa de abajo hacia
arriba y de izquierda a derecha.
f) se debe indicar la escala, incluyendo el origen de
la misma y teniendo en cuenta que si es uniforme, a
igual distancia entre dos puntos de un grfico, debe
corresponder el mismo incremento en la escala.
Los grficos de uso ms frecuentes son los
siguientes, se encuentran agrupados segn el tipo
de variable al que corresponde el conjunto de datos:

Barras simples
V. Cualitativa o
categrica

Barras compuestas
Sectorial

V. Cuantitativa
discreta

Barras o Bastones

Histograma
V. Cuantitativa
continua

Polgono de frecuencias

Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representacin grfica: Variables


cualitativas
Barras
simples:

Permite representar:
Una variable cualitativa
Frecuencias absolutas o
porcentajes
Todos los espacios entre
las barras deben ser
iguales
El ancho de las barras
debe ser el mismo y
mayor que el espacio que
las separa

Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representacin grfica: Variables


cualitativas
Barras
componentes:
Permite representar:

La relacin entre dos variables


Porcentajes
Se dibujan grupos de barras
adosadas
Todos los espacios entre los grupos
de barras deben ser iguales
El ancho de las barras debe ser el
mismo y mayor que el espacio que
las separa

Dificultades
de
comunicacin

Representacin grfica: Variables


cualitativas
Sectorial:
Permite representar:
Una variable cualitativa
Se divide un crculo en sectores
circulares de superficie proporcional al
porcentaje que representa cada tem

Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representacin grfica: Variables


cuantitativas
Bastones:
Permite representar:
Una variable cuantitativa
discreta
Frecuencias o porcentajes
Para cada valor de
variable se dibuja una
lnea vertical (bastn),
con una altura igual a la
frecuencia o porcentaje
correspondiente a ese
valor

Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representacin grfica: Variables


cuantitativas
Histograma:
Permite representar:
Una variable cuantitativa
continua
Frecuencias o porcentajes
Se dibujan rectngulos cuyas
bases tienen una longitud
igual a la amplitud del
intervalo y altura igual a la
frecuencia de la clase
respectiva

Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representacin grfica: Variables


cuantitativas
Polgon
o:

Permite representar:
Una variable
cuantitativa continua
Frecuencias absolutas
Sirve para compara
diferentes
distribuciones

Ver ej. 4
Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representacin grfica: Variables


cuantitativas
Ojiva:

Permite representar:
Una variable
cuantitativa continua
Porcentajes
acumulados
Sirve para compara
diferentes
distribuciones

Fuente: Ungaro, J. F. (1994) Presentacin Tabular, Documento de trabajo para el curso de perfeccionamiento docente. U.N.MdP., 1994.

Representacin grfica: Variables


cuantitativas
Grfico 9: Relacin entre libros ledos en un ao y horas dedicadas a mirar TV

Grfco de dispersin:
Permite representar:
Dos variable cuantitativa
Cada punto representa una
unidad de anlisis
Sirve para compara
visualizar la correlacin

30
Horas dedicadas a leer libros
25
20
15
10
5
0
0

10

15

20

25

Horas de dicadas a mirar TV

30

35

40

Representacin grfica:
Ejercicio
A partir del siguiente grfico, que relaciona Cargo que ocupa
en la empresa y Nivel de satisfaccin, responda los tems
que se presentan a continuacin:

Nivel de
satisfaccin

1.Identifique el grfico empleado Por qu los


investigadores habrn empleado este tipo de grfico?
2.Determine el total de casos
3.Cul el porcentaje de empleados no ejecutivos sobre el
total de la muestra?
4.Cul es la proporcin de empleados ejecutivos con un
nivel de satisfaccin media?

Ejecutivo

No ejecutivo

39

También podría gustarte