Está en la página 1de 15

CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.

PRIMERA UNIDAD

CONCEPTOS BASICOS

Estadística
Es una ciencia formal, que nos proporciona instrumentos para recopilar, organizar, resumir, presentar,
analizar, hacer predicciones e interpretar datos para tomar decisiones sobre determinados hechos o
fenómenos de estudio.
Partes de la Estadística
Estadística Descriptiva
Se encarga de la recolección, Clasificación, organización, presentación, descripción de una población sin
sacar conclusiones de tipo general.
Estadística Inferencial
Su propósito es inferir conclusiones y/o predicciones respecto de una población en estudio. Aplica las
Probabilidades.
Población
Es el conjunto de personas u objetos susceptibles de ser estudiadas y que tienen una característica común.
Ejemplo: Una I.E. donde se puede estudiar las tallas de los estudiantes, nivel de desnutrición, la procedencia
de sus padres. En una ferretería un stock de focos, etc.
A un elemento de la población se le llama Unidad Estadística. Ejemplo: Un alumno, un padre, un foco.
Muestra
Es un subconjunto de la población. Es una parte proporcional y representativa de una población que se
desea estudiar. Ejemplo: Un grupo seleccionado de estudiantes de una I. E.
Dato
Es el resultado de la observación, entrevista o recolección en general. Ejemplo: Cuando observamos el color
de cabello, cuando medimos tu talla.
Frecuencia
Número de veces que se repite un valor.
Carácter estadístico
Es una propiedad que permite clasificar a los individuos de una población. Pueden ser cualitativas o
cuantitativas.
Variable estadística
Es el conjunto de valores que toma un carácter estadístico. Si las características permanecen inalterables se
llaman constantes. Ejemplo: códigos de teléfonos de Lima.

TIPOS DE VARIABLES
A. SEGÚN SU NATURALEZA
Cualitativa. Es una cualidad o atributo. No se puede medir. Ejemplos: color de ojos, curso preferido,
nacionalidad, signo zodiacal, hobby, etc.

Variable Cualitativa Nominal


Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden.
Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable Cualitativa Ordinal o Variable Cuasicuantitativa
Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden. Por
ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una
prueba deportiva: 1º, 2º, 3º, Medallas de una prueba deportiva: oro, plata, bronce.

Cuantitativa. Es aquella que podemos expresar numéricamente. Dan lugares a variables estadísticas.
Variable Discreta. Es aquella que se puede contar, se representa por un número natural. Ejemplo: Número
de vecinos, número de CD vendidos, número de hijos, etc.
Variable Continua. Es aquella que se puede medir, puede tomar los infinitos valores de un intervalo
Ejemplos: Tallas y pesos de alumnos, temperatura, etc.
B. SEGÚN SU FUNCIÓN
Variable independiente: Es aquella característica o propiedad que supone es la causa del fenómeno
estudiado. En investigación experimental se llama así, a la variable que el investigador manipula.
Variable dependiente: Hayman (1974: 69) la define como propiedad o característica que se trata de
cambiar mediante la manipulación de la variable independiente. La variable dependiente es el factor que es
observado y medido para determinar el efecto de la variable independiente.
Ejemplo:
En sociología, medir el efecto de la educación en ingreso promedio familiar, la variable dependiente es el
nivel de ingreso en soles, y la variable independiente es el nivel de educación de las personas que
componen la casa (es decir, grados académicos).
C. PRESENTACIÓN DE DATOS
VARIABLE CUALITATIVA
a) Problema: ¿Cuál es el estado civil de los estudiantes de Postgrado UNE?
b) Instrumento: encuesta
Ejemplo:
1. Marque usted con un aspa el cuadro correspondiente a su estado civil.
SOLTERO VUIDO
CASADO DIVORCIADO

c) Clasificar los datos de la encuesta


d) Ordenar los datos
e) Analizar los datos
f) Tabular
g) Graficar
h) Interpretar

Población Muestra

N= 1500
estudiantes n=100
EPG-
UNE
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD

CUADRO Nº 001
ESTADO CIVIL DE ESTUDIANTES DE POSTGRADO DE LA UNE 2018
ESTADO CIVIL CONTEO fi hi hi%
IIII IIII IIII IIII IIII
SOLTERO IIII IIII IIII IIII IIII 75 0.75 75
IIII IIII IIII IIII IIII

CASADO IIII IIII IIII 15 0.15 15


DIVORCIADO IIII 5 0.05 5
VIUDO IIII 5 0.05 5
100 100 1 100
Nota al pie: La molina 2018
Fuente: Proviene de encuesta
Elaborado: L.C.B-P.R.C.

INTERPRETACIÓN:
h1% El 75% de estudiantes de la Escuela de Postgrado de UNE tienen como estado civil soltero.

TIPOS DE GRÁFICOS ESTADÍSTICOS


GRÁFICO DE BARRAS

GRÁFICO Nº 001
ESTADO CIVIL ESTUDIANTES DE POSTGRADO DE LA UNE 2018
80
70
60
Estudiantes

50
SOLTERO
40
CASADO
30
DIVORCIADO
20
VIUDO
10
0
SOLTERO CASADO DIVORCIADO VIUDO
ESTADO CIVIL

LEYENDA: S C V D
FUENTE: PROVIENE DEL CUADRO Nº 001
ELABORADO:LJCC-PRC

INTERPRETACIÓN:
75 % estudiantes de postgrado de la UNE tienen como estado civil soltero.
GRÁFICO DE SECTOR CIRCULAR
GRÁFICO Nº 002
“ESTADO CIVIL DE ESTUDIANTES DE POSTGRADO DE LA UNE 2018

5%
5%
15% SOLTERO
CASADO
75% DIVORCIADO
VIUDO

LEYENDA: S C V D
FUENTE: PROVIENE DEL CUADRO Nº 001
ELABORADO: LJCC-PRC

GRÁFICO LINEAL
GRAFICO Nº 003
“ESTADO CIVIL DE ESTUDIANTES DE POSTGRADO DE LA UNE 2018”
80
70
60
FRECUENCIAS

50
40
fi
30
20
10
0
SOLTERO CASADO DIVORCIADO VIUDO

Leyenda:
Fuente: Proviene del Cuadro Nº 001
Elaborado: LJCC-PRC

VARIABLE CUANTITATIVA CONTINUA


1. PROBLEMA:
Se ha tallado una muestra de 10 estudiantes de la Institución Educativa Emblemática Ricardo Bentin
Sánchez en el distrito del Rímac- Lima, el 01 de setiembre de 2018 y se obtiene los siguientes
resultados en cm.

Nº Estudiantes 1 2 3 4 5 6 7 8 9 10
Estatura (cm.) 114 147 120 135 140 150 160 170 153 150
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD

Se pide:
a) Construir una tabla de distribución de frecuencias
b) Interpretar los resultados f 1, F2, h3%, H3%
c) Construir el histograma y polígono de frecuencias
A. TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
1. RANGO (R)
R= VALOR MAXIMO- VALOR MINIMO
R= 170-114
R= 56

2. NÚMERO DE INTERVALOS (K)


K= 1+3,32*logn
K=1+3,32*log10
K=1+3,32*1
K=4,32
K=4
3. AMPLITUD ( i)
R 56
14
K 4

4. ERROR ( e)
e=K*I-R
e=4*14-56
e=0

CUADRO Nº 002
“ESTATURA DE ESTUDIANTES DE LA I.E RICARDO BENTIN SANCHEZ”

Ii X’i CONTEO fi hi hi% Fi Hi%


114-128 121 II 2 0.2 20 2 20
128-142 135 II 2 0.2 20 4 40
142-156 149 IIII 4 0.4 40 8 80
156-170 163 II 2 0.2 20 10 100
[ [ 10 10 1 100

Nota al pie: Distrito La Molina 2018


Fuente: Encuesta local institucional
Elaborado: LJCC

B. GRÁFICO DEL HISTOGRAMA Y POLÍGONO DE FRECUENCIAS

CUADRO Nº 003
“ESTATURA DE ESTUDIANTES DE LA I.E RICARDO BENTIN SANCHEZ”

k I X'i f
0 (100-114] 107 0
1 (114-128] 121 2
2 (128-142] 135 2
3 (142-156] 149 4
4 (156-170] 163 2
5 (170-184] 177 0
Gráfico N° 001
Estatura de Estudiantes de I.E.E "R. Bentin"
4.5
4
3.5
ESTUDIANTES

3
2.5
2 H
1.5
P
1
0.5
0
(100-114] (114-128] (128-142] (142-156] (156-170] (170-184]
ESTATURA

Fuente: proviene de la tabla Nº 003


Elaborado: LJCC-PRC

INTERPRETACIÓN:

f1. 2 Estudiantes de la Institución Educativa Ricardo Bentin tienen como estatura promedio de 121 cm.
H3% El 80% de estudiantes de la Institución Educativa Ricardo Bentin tienen como estatura mayor e igual a
114 cm. y menor a 156 cm.

MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN

Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden a reunir los
datos (“Punto central”).
Aplicadas a una muestra se les denomina estimadores o estadígrafos.
Aplicadas a poblaciones se les denomina parámetros o valores estadísticos de la población.
Los principales métodos utilizados para ubicar el punto central son la media, la mediana y la moda.
A. PARA DATOS SIN AGRUPADOS
LA MEDIA
LA MEDIANA
LA MODA
LA MEDIA ( x )
Es la medida de tendencia central más utilizada, también se le conoce con el nombre de Promedio. Para
calcular la media aritmética, se suman todos los datos de la muestra y el resultado se divide entre el total
de datos.

Ejemplo: n
X
1, 2, 2, 8, 1,4 i
X i 1
1 2 2 8 1 4 18 n
x 3
6 6
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD

LA MEDIANA (Me)
Es el valor medio de un arreglo ordenado de datos numérico, si no hay empates, la primera mitad de las
observaciones será menor que la mediana y la segunda mitad será mayor.
Si un valor extremo se presenta en una secuencia de datos, es mejor utilizar la mediana.

La mediana es el valor tal que el 50% de los datos son menores y el otro 50% son mayores

Ejemplo:
1, 2, 2, 8, 1,4
a) Ordenamos en forma ascendente : 1,1, 2,2, 4,8
2 2
b) Por ser par tomamos los dos valores centrales y lo dividimos entre dos 2
2
Nota: Si es impar el valor central será la mediana.

LA MODA (Mo)
Es el valor que aparece con mayor frecuencia en un conjunto de datos.
Puede darse lo siguiente:
Distribución bimodal cuando los datos adquiridos en una columna encontremos dos modas, es decir,
dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es
en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no
hay moda.
Ejemplo:
1, 2, 2, 8, 1,4
c) Ordenamos en forma ascendente 1,1, 2,2, 4,8
d) Las frecuencias 1 y 2 tienen la misma frecuencia
Mo = [1, 2] es bimodal.

B. PARA DATOS AGRUPADOS

LA MEDIA
LA MEDIANA
LA MODA

n
LA MEDIA fi * x' i
Ejemplo: Hallar la Media de datos agrupados del siguiente cuadro. i 1
x
n
INTEVALO
2 a 4
4 a 6
6 a 8
8 a 10
INTEVALO MARCA DE CLASE (x’i) fi fi * x’i
2 a 4 3 10 30
4 a 6 5 20 100
6 a 8 7 10 70
8 a 10 9 10 90
TOTAL 50 295
n
fi * x' i
i 1
x
295 n
x 5,8
50
LA MEDIANA (Me)

n T
Me li 2 *i
fn

Me= Mediana
li= Límite inferior del intervalo de la clase mediana
n= Tamaño de la muestra
T= Suma de todas las frecuencias absolutas simples anteriores a la clase mediana

fn= Frecuencia absoluta simple de la clase medina


i= Amplitud
n/2= Clase Mediana
EJEMPLO: Hallar la Mediana de datos agrupados del siguiente cuadro.

INTEVALO
2 a 4
4 a 6
6 a 8
8 a 10

INTEVALO MARCA DE CLASE (x’i) fi


2 a 4 3 10
4 a 6 5 20 Clase
6 a 8 7 10 Mediana
8 a 10 9 10 50/2=25
TOTAL 50

n T 25 10
Me li 2 *i Me 4 *2 Me 5,5
fn 20

LA MODA (Mo)
d1
Mo li *i
d1 d 2
Mo= moda
li= límite inferior del intervalo de la clase modal
n= Tamaño de la muestra
d1=diferencia que existe entre la frecuencia de clase modal y la frecuencia anterior (tomados en valor
absoluto)
d2=diferencia que existe entre la frecuencia de clase modal y la frecuencia posterior (tomados en valor
absoluto)
i= amplitud
Mayor frecuencia 20 clase modal
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD

EJEMPLO: Hallar La Moda de datos agrupados del siguiente cuadro.


INTEVALO
2 a 4
4 a 6
6 a 8
8 a 10

INTEVALO MARCA DE CLASE (x’i) fi


2 a 4 3 10
4 a 6 5 20 Clase Modal
6 a 8 7 10 Frecuencia 20
8 a 10 9 10
TOTAL 50

d1= 20 10 10 d1
Mo li *i
d2= 20 10 10 d1 d 2
10
Mo 4 *2 Mo 5
10 10
MEDIDAS DE DISPERSION

¿QUÉ ES DISPERSIÓN?
La dispersión es la variación en un conjunto de datos que proporciona información adicional y permite juzgar la
confiabilidad de la medida de tendencia central.

MEDIDAS DE DISPERSIÓN
Llamadas medidas de variabilidad son los valores numéricos
que indican o describen la forma en que las observaciones
están dispersas o diseminadas, con respecto al valor central.
Son importantes debido a que dos muestras de observaciones
con en el mismo valor central pueden tener una variabilidad
muy distinta.

1. VARIANZA (s2)
Es una medida de dispersión que cuantifica la variabilidad de los datos con respecto a la media aritmética. Se
le puede definir como un promedio de las distancias elevadas al cuadrado, entre cada variable y la media.
Lo que hace la varianza es establecer la variabilidad de la variable aleatoria. Es importante tener en cuenta
que, en ciertos casos, es preferible emplear otras medidas de dispersión ante las características de las
distribuciones.
Varianza Muestral
Es cuando se calcula la varianza de una comunidad, grupo o población en base a una muestra.
La Covarianza
Es la medida de dispersión conjunta de un par de variables.

A. PARA DATOS SIN AGRUPADOS


2 2
2 xi x s 2 xi x
s n n 1
B. PARA DATOS AGRUPADOS

k 2
fi x'i x
S2= i 1
n 1
2. DESVIACIÓN ESTÁNDAR O TÍPICA (S)

Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto
central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio
de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz
cuadrada de la varianza, por lo tanto su ecuación sería:

2
s
s s *100
x
3. COEFICIENTE DE VARIACIÓN (CV)

Es una medida relativa de variabilidad de los datos entre la media y la desviación estándar de una
población o muestra. Se expresa como porcentaje y se distingue por permitir comparar la variabilidad de
dos o más conjuntos de datos expresados en unidades diferentes.
Existe una clasificación de dispersión de un conjunto de datos, según el porcentaje de coeficiente de
variación:

Distribución homogénea
CV < 10% Poca dispersión
10% <CV < 33% Dispersión aceptable

Distribución heterogénea
33%<CV < 50% Dispersión alta
CV > 50% Dispersión muy alta
Se tiene datos de dos poblaciones:
variable Grupo1 Grupo2
Edad (años) x =25 x =11
Peso(kg) x =72.5 x =40
s=5 s=5
N=15 N=15

¿Qué grupo es más homogéneo o menos variable en relación al peso?


Grupo1 5/72,5**100 CV= 6,9%
Grupo2 5/40*100 CV=12,5%
Según el coeficiente de variación, se puede afirmar que el grupo1 tiene menos dispersión de los pesos con
respecto a la media que el grupo2.
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD

MEDIDAS DE POSICIÓN NO CENTRAL


a) Cuartiles (Qj) Son valores de la variable que dividen a la distribución en 4 partes, cada una de las
cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1 es el primer
cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo cuartil que deja a
su izquierda el 50% de los datos, y Q3 es el tercer cuartil que deja a su izquierda el 75%
de los datos. (Q2 = Me)
Valores ordenados
25% 25% 25% 25%

V.min. Q1 Q2=Me Q3 V. máx.

b) Deciles (Dj) Son los valores de la variable que dividen a la distribución en las partes iguales, cada una
de las cuales engloba el 10 % de los datos. En total habrá 9 deciles. (Q2 = D5 = Me)

Valores ordenados
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

V.min. D1 D2 D3 D4 D5 D6 D7 D8 D9 V.máx

c) Centiles o Percentiles (Pj) Son los valores que dividen a la distribución en 100 partes iguales, cada una
de las cuales engloba el 1 % de las observaciones. En total habrá 99
percentiles. (Q2 = D5 = Me = P50)

FÓRMULA PARA DATOS AGRUPADOS:

A. CUARTIL (Qj)
jn T
Qj li 4 *i
fn
Donde:

li =límite inferior de la clase cuartilica


jn/4= clase cuartilica
T= sumatoria de todas las frecuencias absolutas simples anteriores a la clase cuartílica.
fn = frecuencia de la clase cuartilica
i = amplitud
Qj= número que representa al cuartil

B. DECIL (Dj) jn T
Dj li 10 *i
Donde: fn
li =límite inferior de la clase decilica
jn/10= clase decilica
T= sumatoria de todas las frecuencias absolutas simples anteriores a la clase decílica.
fn = frecuencia de la clase decilica
i = amplitud
Dj= número que representa al decil

C. PERCENTIL (Pj) jn T
Pj li 100 *i
fn
Donde:
li =límite inferior de la clase percentilica
jn/4= clase percentilica
T= sumatoria de todas las frecuencias absolutas simples anteriores a la clase percentílica
fn = frecuencia de la clase percentilica
i = amplitud
Pj= número que representa al percentil.

EJEMPLO:
Se desea conocer los sueldos promedio semanal de los trabajadores de la empresa SAC S.A de la
ciudad de trujillo para tal objetivo realizo una encuesta a 80 trabajadores en el mes de setiembre del
2013. Obteniéndose los siguientes resultados:

SUELDOS X’i Fi hi hi% Fi Hi%


90-120 105 11 0,14 14 11 14
120-150 135 13 0,16 16 24 30
150-180 165 20 0,25 25 44 55
180-210 195 17 0,21 21 61 76
210-240 225 15 0,19 19 76 95
240-270 255 3 0,04 4 79 99
270-300 285 1 0,01 1 80 100

Se pide hallar.

Q2, D5 y P20 e interpretar.

2 80 T
Q2 li 4 *i
fn

40 24
Q2 150 * 30
20
Q2 174

5 80 T
D5 li 10 *i
fn

40 24
D5 150 * 30
20
D5=174
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD

20 80 T
li 100 *i
P20 fn
5
P20 120 * 30
13
P20 = 131,5

INTERPRETACIÓN:
Q2: El 50% del total de trabajadores es decir 40 de ellos tienen sueldos semanales inferiores o iguales a 174
nuevos soles y los restantes o sea el 60% de trabajadores tienen sueldos superiores a 174 nuevos soles.
MEDIDAS DE DISTRIBUCIÓN
Son medidas que permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su
representación gráfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la información. Su utilidad radica en la posibilidad de identificar las
características de la distribución sin necesidad de generar el gráfico. Sus principales medidas son la Asimetría y
la Curtosis.

ASIMETRÍA
Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central
(Media aritmética).

TIPOS DE ASIMETRÍA

Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos está
en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la
izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga que a la
derecha.

x Me Mo

Simétrica.- Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de


los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una
curva normal en forma de campana llamada campana de Gauss.

x Me Mo

Asimetría Positiva o a la Derecha.- Se da cuando en una distribución la minoría de los datos está en
la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo
hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga que a la
izquierda.

x Me Mo
x Me Mo x Me Mo Mo Me x

El Coeficiente de asimetría, se representa mediante la ecuación matemática

AS

Donde
AS coeficiente de asimetría de Fisher
(Xi) cada uno de los valores
( ) la media de la muestra
(ni) la frecuencia de cada valor.

INTERPRETACIÓN

(AS= 0): Se acepta que la distribución es Simétrica, es decir, existe aproximadamente la misma
cantidad de valores a los dos lados de la media. Este valor es difícil de conseguir por lo que se
tiende a tomar los valores que son cercanos ya sean positivos o negativos (± 0.5).
(AS > 0): La curva es asimétricamente positiva por lo que los valores se tienden a reunir más en la
parte izquierda que en la derecha de la media.
(AS< 0): La curva es asimétricamente negativa por lo que los valores se tienden a reunir más en la
parte derecha de la media.
CURSO: ESTADÍSTICA APLICADA A LA INVESTIGACIÓN CIENTÍFICA DOCENTE: PEDRO RAMON C.
PRIMERA UNIDAD

MÉTODOS PARA CALCULAR LA ASIMETRÍA (AS)

a. Coeficiente de Karl Pearson (varía entre -3 y 3)

3( x Me)
As
s
Donde:
= media aritmética.
Me = Mediana.
s = desviación típica o estándar

Observación

Si As < 0 la distribución será asimétrica negativa.


Si As = 0 la distribución será simétrica.
Si As > 0 la distribución será asimétrica positiva.

b. Medida de Yule Bowley o Medida Cuartílica (varía entre -1 y 1)

Donde:
= Cuartil uno
= Cuartil dos = Mediana
= Cuartil tres.
c. Medida de Fisher

Para datos sin agrupar

Para datos agrupados en tablas de frecuencias

Para datos agrupados en intervalos

Donde:
xi = cada uno de los valores
n = número de datos
x = media aritmética
f = frecuencia absoluta
3
= cubo de la desviación estándar poblacional
xm = marca de clase

También podría gustarte