Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lectura Unidad 1
Lectura Unidad 1
PRIMERA UNIDAD
CONCEPTOS BASICOS
Estadística
Es una ciencia formal, que nos proporciona instrumentos para recopilar, organizar, resumir, presentar,
analizar, hacer predicciones e interpretar datos para tomar decisiones sobre determinados hechos o
fenómenos de estudio.
Partes de la Estadística
Estadística Descriptiva
Se encarga de la recolección, Clasificación, organización, presentación, descripción de una población sin
sacar conclusiones de tipo general.
Estadística Inferencial
Su propósito es inferir conclusiones y/o predicciones respecto de una población en estudio. Aplica las
Probabilidades.
Población
Es el conjunto de personas u objetos susceptibles de ser estudiadas y que tienen una característica común.
Ejemplo: Una I.E. donde se puede estudiar las tallas de los estudiantes, nivel de desnutrición, la procedencia
de sus padres. En una ferretería un stock de focos, etc.
A un elemento de la población se le llama Unidad Estadística. Ejemplo: Un alumno, un padre, un foco.
Muestra
Es un subconjunto de la población. Es una parte proporcional y representativa de una población que se
desea estudiar. Ejemplo: Un grupo seleccionado de estudiantes de una I. E.
Dato
Es el resultado de la observación, entrevista o recolección en general. Ejemplo: Cuando observamos el color
de cabello, cuando medimos tu talla.
Frecuencia
Número de veces que se repite un valor.
Carácter estadístico
Es una propiedad que permite clasificar a los individuos de una población. Pueden ser cualitativas o
cuantitativas.
Variable estadística
Es el conjunto de valores que toma un carácter estadístico. Si las características permanecen inalterables se
llaman constantes. Ejemplo: códigos de teléfonos de Lima.
TIPOS DE VARIABLES
A. SEGÚN SU NATURALEZA
Cualitativa. Es una cualidad o atributo. No se puede medir. Ejemplos: color de ojos, curso preferido,
nacionalidad, signo zodiacal, hobby, etc.
Cuantitativa. Es aquella que podemos expresar numéricamente. Dan lugares a variables estadísticas.
Variable Discreta. Es aquella que se puede contar, se representa por un número natural. Ejemplo: Número
de vecinos, número de CD vendidos, número de hijos, etc.
Variable Continua. Es aquella que se puede medir, puede tomar los infinitos valores de un intervalo
Ejemplos: Tallas y pesos de alumnos, temperatura, etc.
B. SEGÚN SU FUNCIÓN
Variable independiente: Es aquella característica o propiedad que supone es la causa del fenómeno
estudiado. En investigación experimental se llama así, a la variable que el investigador manipula.
Variable dependiente: Hayman (1974: 69) la define como propiedad o característica que se trata de
cambiar mediante la manipulación de la variable independiente. La variable dependiente es el factor que es
observado y medido para determinar el efecto de la variable independiente.
Ejemplo:
En sociología, medir el efecto de la educación en ingreso promedio familiar, la variable dependiente es el
nivel de ingreso en soles, y la variable independiente es el nivel de educación de las personas que
componen la casa (es decir, grados académicos).
C. PRESENTACIÓN DE DATOS
VARIABLE CUALITATIVA
a) Problema: ¿Cuál es el estado civil de los estudiantes de Postgrado UNE?
b) Instrumento: encuesta
Ejemplo:
1. Marque usted con un aspa el cuadro correspondiente a su estado civil.
SOLTERO VUIDO
CASADO DIVORCIADO
Población Muestra
N= 1500
estudiantes n=100
EPG-
UNE
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD
CUADRO Nº 001
ESTADO CIVIL DE ESTUDIANTES DE POSTGRADO DE LA UNE 2018
ESTADO CIVIL CONTEO fi hi hi%
IIII IIII IIII IIII IIII
SOLTERO IIII IIII IIII IIII IIII 75 0.75 75
IIII IIII IIII IIII IIII
INTERPRETACIÓN:
h1% El 75% de estudiantes de la Escuela de Postgrado de UNE tienen como estado civil soltero.
GRÁFICO Nº 001
ESTADO CIVIL ESTUDIANTES DE POSTGRADO DE LA UNE 2018
80
70
60
Estudiantes
50
SOLTERO
40
CASADO
30
DIVORCIADO
20
VIUDO
10
0
SOLTERO CASADO DIVORCIADO VIUDO
ESTADO CIVIL
LEYENDA: S C V D
FUENTE: PROVIENE DEL CUADRO Nº 001
ELABORADO:LJCC-PRC
INTERPRETACIÓN:
75 % estudiantes de postgrado de la UNE tienen como estado civil soltero.
GRÁFICO DE SECTOR CIRCULAR
GRÁFICO Nº 002
“ESTADO CIVIL DE ESTUDIANTES DE POSTGRADO DE LA UNE 2018
5%
5%
15% SOLTERO
CASADO
75% DIVORCIADO
VIUDO
LEYENDA: S C V D
FUENTE: PROVIENE DEL CUADRO Nº 001
ELABORADO: LJCC-PRC
GRÁFICO LINEAL
GRAFICO Nº 003
“ESTADO CIVIL DE ESTUDIANTES DE POSTGRADO DE LA UNE 2018”
80
70
60
FRECUENCIAS
50
40
fi
30
20
10
0
SOLTERO CASADO DIVORCIADO VIUDO
Leyenda:
Fuente: Proviene del Cuadro Nº 001
Elaborado: LJCC-PRC
Nº Estudiantes 1 2 3 4 5 6 7 8 9 10
Estatura (cm.) 114 147 120 135 140 150 160 170 153 150
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD
Se pide:
a) Construir una tabla de distribución de frecuencias
b) Interpretar los resultados f 1, F2, h3%, H3%
c) Construir el histograma y polígono de frecuencias
A. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
1. RANGO (R)
R= VALOR MAXIMO- VALOR MINIMO
R= 170-114
R= 56
4. ERROR ( e)
e=K*I-R
e=4*14-56
e=0
CUADRO Nº 002
“ESTATURA DE ESTUDIANTES DE LA I.E RICARDO BENTIN SANCHEZ”
CUADRO Nº 003
“ESTATURA DE ESTUDIANTES DE LA I.E RICARDO BENTIN SANCHEZ”
k I X'i f
0 (100-114] 107 0
1 (114-128] 121 2
2 (128-142] 135 2
3 (142-156] 149 4
4 (156-170] 163 2
5 (170-184] 177 0
Gráfico N° 001
Estatura de Estudiantes de I.E.E "R. Bentin"
4.5
4
3.5
ESTUDIANTES
3
2.5
2 H
1.5
P
1
0.5
0
(100-114] (114-128] (128-142] (142-156] (156-170] (170-184]
ESTATURA
INTERPRETACIÓN:
f1. 2 Estudiantes de la Institución Educativa Ricardo Bentin tienen como estatura promedio de 121 cm.
H3% El 80% de estudiantes de la Institución Educativa Ricardo Bentin tienen como estatura mayor e igual a
114 cm. y menor a 156 cm.
Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden a reunir los
datos (“Punto central”).
Aplicadas a una muestra se les denomina estimadores o estadígrafos.
Aplicadas a poblaciones se les denomina parámetros o valores estadísticos de la población.
Los principales métodos utilizados para ubicar el punto central son la media, la mediana y la moda.
A. PARA DATOS SIN AGRUPADOS
LA MEDIA
LA MEDIANA
LA MODA
LA MEDIA ( x )
Es la medida de tendencia central más utilizada, también se le conoce con el nombre de Promedio. Para
calcular la media aritmética, se suman todos los datos de la muestra y el resultado se divide entre el total
de datos.
Ejemplo: n
X
1, 2, 2, 8, 1,4 i
X i 1
1 2 2 8 1 4 18 n
x 3
6 6
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD
LA MEDIANA (Me)
Es el valor medio de un arreglo ordenado de datos numérico, si no hay empates, la primera mitad de las
observaciones será menor que la mediana y la segunda mitad será mayor.
Si un valor extremo se presenta en una secuencia de datos, es mejor utilizar la mediana.
La mediana es el valor tal que el 50% de los datos son menores y el otro 50% son mayores
Ejemplo:
1, 2, 2, 8, 1,4
a) Ordenamos en forma ascendente : 1,1, 2,2, 4,8
2 2
b) Por ser par tomamos los dos valores centrales y lo dividimos entre dos 2
2
Nota: Si es impar el valor central será la mediana.
LA MODA (Mo)
Es el valor que aparece con mayor frecuencia en un conjunto de datos.
Puede darse lo siguiente:
Distribución bimodal cuando los datos adquiridos en una columna encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es
en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no
hay moda.
Ejemplo:
1, 2, 2, 8, 1,4
c) Ordenamos en forma ascendente 1,1, 2,2, 4,8
d) Las frecuencias 1 y 2 tienen la misma frecuencia
Mo = [1, 2] es bimodal.
LA MEDIA
LA MEDIANA
LA MODA
n
LA MEDIA fi * x' i
Ejemplo: Hallar la Media de datos agrupados del siguiente cuadro. i 1
x
n
INTEVALO
2 a 4
4 a 6
6 a 8
8 a 10
INTEVALO MARCA DE CLASE (x’i) fi fi * x’i
2 a 4 3 10 30
4 a 6 5 20 100
6 a 8 7 10 70
8 a 10 9 10 90
TOTAL 50 295
n
fi * x' i
i 1
x
295 n
x 5,8
50
LA MEDIANA (Me)
n T
Me li 2 *i
fn
Me= Mediana
li= Límite inferior del intervalo de la clase mediana
n= Tamaño de la muestra
T= Suma de todas las frecuencias absolutas simples anteriores a la clase mediana
INTEVALO
2 a 4
4 a 6
6 a 8
8 a 10
n T 25 10
Me li 2 *i Me 4 *2 Me 5,5
fn 20
LA MODA (Mo)
d1
Mo li *i
d1 d 2
Mo= moda
li= límite inferior del intervalo de la clase modal
n= Tamaño de la muestra
d1=diferencia que existe entre la frecuencia de clase modal y la frecuencia anterior (tomados en valor
absoluto)
d2=diferencia que existe entre la frecuencia de clase modal y la frecuencia posterior (tomados en valor
absoluto)
i= amplitud
Mayor frecuencia 20 clase modal
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD
d1= 20 10 10 d1
Mo li *i
d2= 20 10 10 d1 d 2
10
Mo 4 *2 Mo 5
10 10
MEDIDAS DE DISPERSION
¿QUÉ ES DISPERSIÓN?
La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la
confiabilidad de la medida de tendencia central.
MEDIDAS DE DISPERSIÓN
Llamadas medidas de variabilidad son los valores numéricos
que indican o describen la forma en que las observaciones
están dispersas o diseminadas, con respecto al valor central.
Son importantes debido a que dos muestras de observaciones
con en el mismo valor central pueden tener una variabilidad
muy distinta.
1. VARIANZA (s2)
Es una medida de dispersión que cuantifica la variabilidad de los datos con respecto a la media aritmética. Se
le puede definir como un promedio de las distancias elevadas al cuadrado, entre cada variable y la media.
Lo que hace la varianza es establecer la variabilidad de la variable aleatoria. Es importante tener en cuenta
que, en ciertos casos, es preferible emplear otras medidas de dispersión ante las características de las
distribuciones.
Varianza Muestral
Es cuando se calcula la varianza de una comunidad, grupo o población en base a una muestra.
La Covarianza
Es la medida de dispersión conjunta de un par de variables.
k 2
fi x'i x
S2= i 1
n 1
2. DESVIACIÓN ESTÁNDAR O TÍPICA (S)
Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto
central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio
de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz
cuadrada de la varianza, por lo tanto su ecuación sería:
2
s
s s *100
x
3. COEFICIENTE DE VARIACIÓN (CV)
Es una medida relativa de variabilidad de los datos entre la media y la desviación estándar de una
población o muestra. Se expresa como porcentaje y se distingue por permitir comparar la variabilidad de
dos o más conjuntos de datos expresados en unidades diferentes.
Existe una clasificación de dispersión de un conjunto de datos, según el porcentaje de coeficiente de
variación:
Distribución homogénea
CV < 10% Poca dispersión
10% <CV < 33% Dispersión aceptable
Distribución heterogénea
33%<CV < 50% Dispersión alta
CV > 50% Dispersión muy alta
Se tiene datos de dos poblaciones:
variable Grupo1 Grupo2
Edad (años) x =25 x =11
Peso(kg) x =72.5 x =40
s=5 s=5
N=15 N=15
b) Deciles (Dj) Son los valores de la variable que dividen a la distribución en las partes iguales, cada una
de las cuales engloba el 10 % de los datos. En total habrá 9 deciles. (Q2 = D5 = Me)
Valores ordenados
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
V.min. D1 D2 D3 D4 D5 D6 D7 D8 D9 V.máx
c) Centiles o Percentiles (Pj) Son los valores que dividen a la distribución en 100 partes iguales, cada una
de las cuales engloba el 1 % de las observaciones. En total habrá 99
percentiles. (Q2 = D5 = Me = P50)
A. CUARTIL (Qj)
jn T
Qj li 4 *i
fn
Donde:
B. DECIL (Dj) jn T
Dj li 10 *i
Donde: fn
li =límite inferior de la clase decilica
jn/10= clase decilica
T= sumatoria de todas las frecuencias absolutas simples anteriores a la clase decílica.
fn = frecuencia de la clase decilica
i = amplitud
Dj= número que representa al decil
C. PERCENTIL (Pj) jn T
Pj li 100 *i
fn
Donde:
li =límite inferior de la clase percentilica
jn/4= clase percentilica
T= sumatoria de todas las frecuencias absolutas simples anteriores a la clase percentílica
fn = frecuencia de la clase percentilica
i = amplitud
Pj= número que representa al percentil.
EJEMPLO:
Se desea conocer los sueldos promedio semanal de los trabajadores de la empresa SAC S.A de la
ciudad de trujillo para tal objetivo realizo una encuesta a 80 trabajadores en el mes de setiembre del
2013. Obteniéndose los siguientes resultados:
Se pide hallar.
2 80 T
Q2 li 4 *i
fn
40 24
Q2 150 * 30
20
Q2 174
5 80 T
D5 li 10 *i
fn
40 24
D5 150 * 30
20
D5=174
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD
20 80 T
li 100 *i
P20 fn
5
P20 120 * 30
13
P20 = 131,5
INTERPRETACIÓN:
Q2: El 50% del total de trabajadores es decir 40 de ellos tienen sueldos semanales inferiores o iguales a 174
nuevos soles y los restantes o sea el 60% de trabajadores tienen sueldos superiores a 174 nuevos soles.
MEDIDAS DE DISTRIBUCIÓN
Son medidas que permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su
representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las
características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y
la Curtosis.
ASIMETRÍA
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central
(Media aritmética).
TIPOS DE ASIMETRÍA
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está
en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la
izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la
derecha.
x Me Mo
x Me Mo
Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en
la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo
hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga que a la
izquierda.
x Me Mo
x Me Mo x Me Mo Mo Me x
AS
Donde
AS coeficiente de asimetría de Fisher
(Xi) cada uno de los valores
( ) la media de la muestra
(ni) la frecuencia de cada valor.
INTERPRETACIÓN
(AS= 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma
cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se
tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).
(AS > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la
parte izquierda que en la derecha de la media.
(AS< 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la
parte derecha de la media.
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD
3( x Me)
As
s
Donde:
= media aritmética.
Me = Mediana.
s = desviación típica o estándar
Observación
Donde:
= Cuartil uno
= Cuartil dos = Mediana
= Cuartil tres.
c. Medida de Fisher
Donde:
xi = cada uno de los valores
n = número de datos
x = media aritmética
f = frecuencia absoluta
3
= cubo de la desviación estándar poblacional
xm = marca de clase