Está en la página 1de 58

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERU

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERU


ESCUELA DE POST GRADO
ESCUELA DE POST GRADO
UNIDAD DE POST GRADO DE LA FACULTAD DE
UNIDAD DE POST GRADO DE LA FACULTAD DE
EDUCACION
EDUCACION
MENCION: GESTION EDUCATIVA
 
MENCION: GESTION EDUCATIVA
 

AMADOR GODOFREDO VILCATOMA SANCHEZ 


Vilcatoma58 @hotmail,com
¿Qué es la estadística?
Objetivos
Que deberían saber al terminar esta clase:
Que queremos significar por estadística

Que entendemos por estadística descriptiva e inferencial.

Que es una población y que una muestra.

Que es una variable, el dato y los datos

Cuando la información se refiere a un parámetro y cuando a una estadística

Distinguir cuando una variable es cualitativa y cuando cuantitativa.

Distinguir entre una variable discreta y continua.

Distinguir las distintas escalas de medición nominal, ordinal, de intervalo y de razón


¿Qué es la estadística?
Estadística es la ciencia de:
Recolectar
Describir
Organizar Datos
Interpretar

para transformarlos en información, para la toma


mas eficiente de decisiones.
¿Quienes usan la estadística?
Organismos oficiales.
Diarios y revistas.
Políticos.
Deportes.
Marketing.
Control de calidad.
Administradores.
Investigadores científicos.
Médicos
Educadores
etc.
Tipos de Estadística
Estadística Descriptiva: Método de recolectar,
organizar, resumir y presentar los datos en forma
informativa.

Ejemplo 1: Los datos del Censo de población de


2010.
Ejemplo 2: La cantidad de robos ocurridos el
último mes en Huancayo.
Ejemplo 3: La cantidad de pacientes atendidos
en el Hospital Regional el último año.
Tipos de Estadística
Estadística inferencial: Métodos usados para
determinar algo acerca de la población,
basado en una muestra.
Población(1) es la colección, o conjunto, de
individuos, objetos o eventos cuyas
propiedades serán analizadas.
Muestra es un subconjunto de la población de
interés.
 (1) Algunos autores utilizan Universo como sinónimo
Población y Muestra

Población

Muestra
Parámetro y estadígrafo
Parámetro: Valor numérico que resume todos los
datos de una población completa. Se utilizan letras
griegas para simbolizar un parámetro como ser  y  .
 Ejemplos: La calificación “promedio” del nivel secundario en el
momento de admisión de todos los estudiantes que han asistido alguna
vez a la Universidad del Centro.
Estadística: Valor numérico que resume los datos de una
muestra. Se utilizan letras del alfabeto español para
simbolizarlas como ser x y s .
 Ejemplo: La edad “promedio” registrada en una encuesta de 150
estudiantes.
Tipos de Estadística
(ejemplos de estadística inferencial)
Ejemplo 1: Una encuesta desarrollada por IBOPE, en
marzo 2009, dice que el ratings de radio en Huancayo
esta encabezado por FM 98.3 MEGA con un 1.5%
seguido por FM 95.9 ROCK & POP con 1.18%
Ejemplo 2: De acuerdo con una encuesta desarrollada
por Prince & Cook sobre telefonía residencial en el
2008, el gasto mensual promedio por cliente es de
$30.30. A nivel nacional.
Ejemplo 3: El INDEC informó que la Encuesta
Permanente de Hogares (EPH) del mes de mayo de
2002 reporto la tasa mas alta de desempleo que
ascendió al 24.3% a nivel nacional
Variable
Variable: Característica de interés sobre
cada elemento individual de una población o
muestra.
Dato: Valor de la variable asociada a un
elemento de la población o muestra. Este
valor puede ser un número, una palabra o
un símbolo.
Ejemplo: La familia González tiene “4” miembros, sus
ingresos mensuales son de “$685”, “2” son de sexo
femenino y “2” masculino.
Datos: Conjunto de valores recolectados
para la variable de cada uno de los
elementos que pertenecen a la
población o muestra.
Ejemplo1: El conjunto de 54 “cantidad de
miembros” recolectados de 54 familias
residentes en Huancayo.
Ejemplo2: El conjunto de las “calificaciones”
de los 43 estudiantes de estadística de la
carrera de Educacion
1-7

Tipos de Variables

Cualitativa o de Atributos Clasifica o describe un


elemento de la población. Los valores que
puede asumir no constituyen un espacio
métrico, por lo tanto las operaciones
aritméticas, como sumar y obtener
promedios, no son significativas.
Ejemplos: Sexo, Nacionalidad, Marcas de auto,
Grado de Satisfacción con la Universidad, etc..
Tipos de Variables(cont.)

Cuantitativa o Numérica: Cuantifica un


elemento de la población. Los valores que
puede asumir constituyen un espacio
métrico, por lo tanto las operaciones
aritméticas, como sumar y obtener
promedios, son significativas.
Ejemplos: Cantidad de Habitaciones, Número de hijos,
Kilómetros recorridos, Tiempo de vuelo, Ingreso, etc..
1-9

Tipos de Variables (cont.)

Las variables cuantitativas se pueden


clasificar a su vez en discretas o continuas.
Cuantitativas Discretas: solo pueden
asumir ciertos valores y normalmente hay
huecos entre ellos. Son conteos
normalmente.
Ejemplo1: cantidad de materias aprobadas.(1, 2,3 ......)
Ejemplo2: cantidad de hijos (1, 2, 3,4...)
1-9

Tipos de Variables(cont.)
Las variables cuantitativas se pueden clasificar a su vez en
discretas o continuas.
Cuantitativas Continuas: puede asumir cualquier valor
dentro del rango de medición. Normalmente se miden
magnitudes como ser longitud, superficie, volumen, peso,
tiempo, dinero
Ejemplo 1: Peso al nacer.
Ejemplo 2: Salario de un empleado
Ejemplo 3: Tiempo de viaje en ómnibus entre Huancayo y
Tarma
Escalas de Medición
Las variables cualitativas se miden en escala
nominal o ordinal.
Nominal: los elementos solo pueden ser
clasificados en categorías pero no se da un
orden o jerarquía
Ejemplo 1: Barrio de residencia de los alumnos .
Ejemplo 2: Color de ojos
Ejemplo 3: Simpatizante de un club de futbol
Escalas de Medición
Las variables cualitativas se miden en
escala nominal o ordinal.
Ordinal: los elementos son clasificados en
categorías que tienen un orden o jerarquía,
la diferencia entre valores no se pueden
realizar o no son significativas.
Ejemplo 1: Grado de satisfacción en el uso de un servicio
público .
Ejemplo 2: Ocupación
Escalas de Medición

Las variables cuantitativas se miden en


escala de intervalo o razón.
Intervalo: los elementos son clasificados en
categorías que tienen un orden o jerarquía, la
diferencia entre valores se pueden realizar y
son significativas. La diferencia entre dos
valores consecutivos es de tamaño
constante y no existe el 0 absoluto.
Ejemplo: Temperatura en grados Celsius
Escalas de Medición
Las variables cuantitativas se miden en
escala de intervalo o razón.
Razón: los elementos son clasificados en
categorías que tienen un orden o jerarquía, la
diferencia entre valores se pueden realizar y
son significativas. Existe el 0 absoluto, es
decir la ausencia de la variable medida.
Ejemplo 1: Tiempo de vuelo.
Ejemplo 2: Ingresos familiares
Una distribución de frecuencia (o tabla de frecuencia) es una lista
de valores de los datos (ya sea de manera individual o por grupos
de intervalos), junto con sus frecuencias (o conteos)
correspondientes.
Edad de los Frecuencia
Numero
de Frecuencia estudiantes
hermanos 17 – 19 1
0 4
20 – 22 3
1 6
23 – 25 2
2 3
3 2 26 - 28 3
4 3 29 - 30 5
Total 18 Total 14

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Frecuencia Frecuencia
Numero de Frecuencia Frecuencia
% absoluta relativa %
hijos absoluta relativa
acumulada acumulada

Xi ni hi Ni Hi
0.10
6 0.25
11 0.55
14 0.80
1.00
TOTAL

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Marca de clase: (Xi) Son los puntos medios de las clases
Frecuencia absoluta (Simple)( ni; fi; fs): Es el numero de
veces que se repite un dato:
n1 =
n2 =
…..
Frecuencia relativa (hi): Es la división de las frecuencia absoluta
entre el total de observaciones.
ni Frecuencia de clase
hi  Frecuencia relativa 
N Numero total de datos
n
h1  1 
N
n
n
h2  2 
N
h
i 1
i 1

n
h3  3 
N
A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I
Porcentaje: (%) = hi x 100
Frecuencia absoluta acumulada (Ni; Fi; Fs): Se define
como:
N1 = n1
N2 = N1 + n 2
N3 = N2 + n 3

Nr = Nr-1 + nr
Frecuencia relativa acumulada (Hi): Es la división de las
frecuencia absoluta entre el total de observaciones.
H1 = h1
H2 = H1 + h 2
H3 = H2 + h 3

Hr = Hr-1 + hr
A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I
Los datos se organizan en intervalos de la siguiente manera:
a b c d e f ... r-3 r-2 r-1 rn

Limites de clase inferiores: son las cifras mas pequeñas que


pueden pertenecer a las diferentes clases. Son a; c; e; ….

Limites de clase superiores: son las cifras mas grandes que


pueden pertenecer a las diferentes clases. Son b; d; f; ….

Fronteras de clases: Son las cifras que se utilizan para separar las
clases, pero sin los espacios creados por los limites de clase

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Los datos se organizan en intervalos por las siguientes razones:
a b c d e f ... r-3 r-2 r-1 rn

Anchura
de la clase

1. Es posible resumir conjunto grandes de datos.


2. Se logra cierta comprensión sobre la naturaleza de los datos
3. Se tiene una base para construir graficas importantes

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


1. Decida el numero de clase, el cual debe estar entre 5 y 20.
2. Calcule:
(valor mas alto) - (valor mas bajo)
Anchura de la clase 
numero de clase
Redondee este resultado para obtener un numero mas
adecuado. (Generalmente se redondea hacia arriba)

3. Punto de partida. Comience por elegir un numero para el limite


inferior de la primera clase. Elija el valor del dato mas bajo.
4. Usando el limite inferior de la primera clase y la anchura de la
clases, proceda a listar los demás limites de clase inferior.
5. Anote los limites inferiores de clase en una columna vertical y
luego proceda a anotar los limites superiores de clase.
6. Ponga una marca en la clase adecuada para cada dato.

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Grafica de puntos.
Es aquella donde se marca cada valor de un dato como un punto a
lo largo de una escala de valores. Los puntos con valores
iguales se apilan:
Ejemplo:
Sea el numero de hermanos de la familia Rodríguez:
1 2 3 2 1 1 2 3 4 1 2 2 2 2 2 3 2 1 1 1 4 3 4 4 3 2 2

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Grafica de tallos y hojas.
Representa datos que separan cada valor en dos partes: el tallo (el
dato que se ubica en el extremo izquierdo) y la hoja (el digito
del lado derecho).
Las hojas se ordenan de forma creciente y no en el orden en que
aparezca en la lista original).
La ventaja radica en que nos permite ver la distribución de los
datos y al mismo tiempo retener toda la información de la lista
original.
Tallo
(decenas) Hojas (unidades)

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Grafica de Pareto.
Es una grafica de barras para datos cualitativos , donde las barras
se ordenan de acuerdo con las frecuencias. Las escalas
verticales representa tanto a las frecuencias o las frecuencias
relativas. La barra mas alta se coloca al lado izquierdo y las
mas pequeñas a la derecha. Al ordenar las barras por
frecuencia esta grafica enfoca la atención en las categorías
mas importantes
Educación 7
Ingenieria 9
Contabilidad 4
Economia 5
Otros 3

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Gráficos circulares.
Las graficas circulares se utilizan para datos cualitativos. Para
construir se divide el circulo en las proporciones adecuadas.
La grafica de Pareto y la circular presentan los mismos datos en
diferentes formas.

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Diagrama de series de tiempo.
Incluye datos de serie de tiempo, los cuales se reúnen en
diferentes momentos.

2001 14
2002 10
2003 9
2004 8
2005 8
2006 7
2007 6
2008 5
2009 5
2010 2

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


•VARIABLES CUANTITATIVAS:
Diagrama de barras
Histograma
Polígono de frecuencias
Diagrama de caja o box-plot
Diagrama de sectores
•VARIABLES CUALITATIVAS:
Diagrama de rectángulos
Diagrama de sectores
•OTRAS REPRESENTACIONES.
DIAGRAMA DE BARRAS
Sobre cada valor de la variable se levanta una barra
cuya altura es proporcional a su frecuencia (absoluta o
relativa)
NÚMERO DE LLAMADAS 40
Número de llamadas
xi Frecuencia

frecuencias
30
0 40
1 26 20
2 14
3 6 10

4 3 0
6 1 0 1 2 3 4 5 6
Total 90

La suma de las alturas de las barras es 90 porque


hemos representado frecuencias absolutas
HISTOGRAMA
Cada clase se representa mediante un
rectángulo cuyo área es proporcional a su
frecuencia (absoluta o relativa)
La altura de cada rectángulo es el cociente
entre el área (frecuencia) y la base (amplitud
del intervalo) o proporcional a dicho cociente
En el ejemplo anterior, si agrupamos en intervalos
de la misma amplitud:

22
[xi xi+1) ni
20

18
[9,25) 21
16
[25,41) 5
14
[41,57) 3
12 [57,73) 7
10 [73,89) 3
8 [89,105] 1
6

10 20 30 40 50 60 70 80 90 100 110
Y si los intervalos son de amplitud variable, el
histograma queda:
2.2
[xi xi+1) ni Amplitud
2.0
[9,15) 7 6
1.8
[15,21) 10 6
1.6

1.4
[21,40) 8 19
1.2
[40,59) 6 19
1.0 [59,70) 4 11
0.8 [70,105] 5 35
0.6

0.4

0.2

10 20 30 40 50 60 70 80 90 100 110
Si la variable es sin agrupar, el polígono de
frecuencias se obtiene uniendo los extremos
superiores de las barras en el diagrama de barras

Número de llamadas
40
frecuencias

30

20

10

0
0 1 2 3 4 5 6
Si la variable está agrupada en intervalos, el polígono
de frecuencias se obtiene uniendo los puntos medios
de las bases superiores de cada rectángulo
2.2

2.0

1.8

1.6

1.4

1.2

1.0

0.8

0.6

0.4

0.2

10 20 30 40 50 60 70 80 90 100 110
Se obtiene levantando sobre el extremo superior de
cada intervalo de clase una perpendicular al eje de
abscisas cuya altura sea proporcional a la
4.4 frecuencia acumulada (absoluta o relativa) del
4.0 intervalo.
3.6 Sobre el diagrama de
3.2 barras que se forma se
2.8
construye el polígono de
frecuencias acumuladas
2.4
partiendo del extremo
2.0 inferior del primer
1.6 intervalo y uniendo los
extremos de las barras del
1.2
diagrama de barras
0.8

0.4

10 20 30 40 50 60 70 80 90 100 110
El total de una característica se representa en un
círculo.
El área de cada sector circular representa el porcentaje
sobre el total de cada categoría.

Número de llamadas
3,33% 1,11%
6,67% valores
0
1
15,56% 2
44,44% 3
4
6

28,89%
Polígonos de frecuencias porcentuales correspondientes a las
distribuciones de ingresos en familias de población : blanca y
negra en los EE.UU. (1970)

14.0

12.0
Población Población
10.0 negra blanca
8.0

6.0

4.0
Indice de
integración = 0.71
2.0

1000 2000 5000 10000 15000 25000 50


Ingresos
Diagrama de estrella llave o perfil
radial

alfabet

mort_inf PIB_cap
Una medida de tendencia central es el valor que se encuentra en el
centro mismo o a la mitad de un conjunto de datos.
Y son la media, la mediana, la moda y la mitad del rango.
La media.
La media aritmética de un conjunto de datos es la medida de tendencia
central que se calcula al sumar los valores y dividir el total entre el numero
de valores.

x
Suma de todos los valores de la muestra
Media   i 1
n Numero de valores muestrales

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Simbólicamente se representa:
n

x
x i 1
, es la media de un conjunto de valores muestrales.
n
n

x
 i 1
, es la media de un conjunto de valores de una poblacion
N

Determinar la edad promedio de los estudiantes. 18 – 20 – 22 - 26

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Mediana:
La mediana de un conjunto de datos es la medida de tendencia central que
implica el valor intermedio, cuando los valores de los datos originales se
presentan en orden de magnitud creciente o decreciente
Criterio para determinar la mediana:
1.Se ordena los valores en forma creciente o decreciente.
2.Si el numero de valores es impar, la mediana es el numero que se localiza
exactamente en la mitad de la lista.

3.Si el numero de valores es par, la mediana se obtiene calculando la media de


los dos números que están a la mitad.

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Moda:
La moda de un conjunto de datos es el valor que se presenta con mayor
frecuencia

Observaciones
1.Cuando dos valores se presentan con la misma frecuencia y esta es la mas
alta, ambos valores son las modas, por lo que se denomina BIMODAL.
2.Cuando mas de dos valores se presentan con la misma frecuencia y esta es la
mas alta, todos los valores son modas por lo que se denomina MULTIMODAL.
3.Cuando ningún valor se repite, no hay moda.
Ejemplo:
5.40 1.10 0.42 5.40 1.42 0.48 0.42
12 12 13 14 15 13 11 15 17
1 2 4 6 7

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Mitad de rango:
Es la medida que constituye el valor que esta a la mitad, entre la puntuación
mas alta y la mas baja , en el conjunto de datos.
Se obtiene sumando el valor máximo con el valor mínimo y luego dividiendo la
suma entre 2

Ejemplo:
5.40 1.10 0.42 5.40 1.42 0.48 0.42
12 12 13 14 15 13 11 15 17
1 2 4 6 7

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Valor maximo  Valor minimo
2

• La media es Es adecuada para Se utiliza muy


sensible a valores datos de nivel pocas veces
extremos. nominal
• Las medias La mediana Sumar los
es el valor dos
muestrales que se números y
tienden a variar encuentra luego
menos que otras exactamente dividirlos
a la mitad entre 2
medidas de
tendencia central Suele ser una buena
opción si existen
algunos valores
extremos

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Media de una distribución de frecuencias
Se define como:
Donde:
n

xn i i
x i 1
n
n

x i fi
x i 1
n
n

x i fs
x i 1
n

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Ejemplo

Numero Frecuencia
de hijos absoluta

xi ni xini
1 1
2 4
3 3
4 5
5 4
6 5
Total

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Ejemplo

Frecuencia
Frontera
absoluta

ni xini
14 – 16 2
17 – 19 4
20 – 22 3
23 – 25 3
26 – 28 6
29 - 31 2
Total

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Ejemplo

Frecuencia
Frontera
absoluta

hi xihi
14 – 16 0,10
17 – 19 0,20
20 – 22 0,15
23 – 25 0,15
26 – 28 0,30
29 - 31 0,10
Total

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


n

Media Ponderada.  xiwi


Se define como: Media ponderada : x  i 1
n

 wi
i 1

Crédito Crédito x  xiwi


Asignaturas Nota x  i 1
o peso Nota n

 wi
i 1
wi xi wixi

Total

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Mediana.
Se define como:   n 1 
    ( m  1) 
 2 
Me  ( Limite inferior de la clase mediana)x(anchura de la clase)  
 frecuencia de la clase mediana 
Donde:  
n:Suma de todas las frecuencias de la clase.
m:es la suma de las frecuencias de clase que preceden la clase de la mediana.

O también  n  

 2   ( N )
j 1 
Me  ( Li )  (c)    
 nj 

 

Procedimiento: n
1. Se determina 2 y se ubica este valor en la frecuencia acumulada, la
cual determinara el intervalo mediano. Si el valor no existe se elige el valor
inmediato superior.

A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I


Ejemplo: Sean las edades de los estudiantes de la Univ. Continental, determinar la
Me e interprete su resultado

Frecuencia
Frecuencia
Frontera absoluta
absoluta
acumulada

ni Ni

14 – 16 2
2
16 – 18 6
4
18 – 20 9
3
20 – 22 12
3
22 – 24 18
6
24 - 26 20
2
Total 20
A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I
Moda es el dato de mayor frecuencia
Ejemplo Sean las edades de los estudiantes de la Univ. Continental, determinar la
Mo e interprete su resultado

Marca de Frecuencia
clase absoluta

ni

15 2
17 6
19 3
21 3
23 6
25 2
Total 20
A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I
Ejemplo: Sean las edades de los estudiantes de la Univ. Continental, determinar la
Mo e interprete su resultado
 1 
Frecuencia Mo  ( Li )  c  
Frontera
absoluta

 1   2 

ni

14 – 16
2
16 – 18
6
18 – 20
3
20 – 22
3
22 – 24
6
24 - 26
2
Total 22
A. VILCATOMA SÁNCHEZ - ESTADÍSTICA I

También podría gustarte