Está en la página 1de 41

1

4. DATO : Es el valor o respuesta que adquiere la variable en cada unidad de análisis. Dato es
ESTADÍSTICA el resultado de la observación, entrevista o recopilación en general. Los datos son la
materia prima de la estadística.
INTRODUCCION: El curso programático de Estadística aplicada a la investigación educativa 5. INFORMACIÓN : Es el resultado de los datos procesados de acuerdo a ciertos objetivos.
comprende Estadística y Probabilidad, Inferencia y Diseños Experimentales, orientados para que No hay información sin datos.
sirva de soporte en la formación científica en el profesional, con el objetivo, que utilice las técnicas de 6. INDICADORES : Son elementos característicos que describen una situación o fenómeno
la Estadística y Probabilidad, Inferencia y Diseños Experimentales para solucionar problemas en su permitiendo su análisis. Estos son: Índices, proporciones, estadígrafos, o medidas de
campo de formación profesional. Estas aristas del curso permiten realizar: Una descripción de resumen en general.
grandes colecciones de datos empíricos o realizar un análisis estadístico de datos experimentales y Los indicadores no determinan la realidad, la realidad determina el valor del indicador.
de los datos de un fenómeno observado. Así como, la toma de decisiones frente a una situación La validez y confiabilidad del indicador depende de la validez de los datos utilizados y de la
dotada de incertidumbre. lógica de su relación o construcción.
7. MUESTRA : Es una parte o subconjunto de una población de estudio. La muestra esta
Por cuestiones didácticas estudiaremos el curso en cuatro capítulos: constituida de elementos seleccionados de forma aleatoria, con la finalidad de investigar
CAPÍTULO 01: Estadística las propiedades de la población.
CAPÍTULO 02: Probabilidad 8. PARÁMETRO : Es un valor obtenido para describir en forma resumida las características
CAPÍTULO 03: Inferencia más importantes acerca de la población, en tanto las medidas de resumen de una muestra
CAPÍTULO 03: Diseños Experimentales se llaman estadígrafos.
9. POBLACIÓN O UNIVERSO : Es un conjunto completo de individuos u objetos de estudio
que poseen alguna característica común observable. Población es el universo de estudio
CAPÍTULO 01: ESTADÍSTICA
que está integrado por la totalidad de todas las unidades de análisis.
10. UNIDAD DE ANÁLISIS : Es el objeto o elemento indivisible que será estudiado en una
I. DEFINICIÓN:
población, sobre los cuales se va a obtener datos. La unidad de análisis no es el fenómeno
La Estadística es una ciencia que proporciona un conjunto de métodos y técnicas para
investigado si no el que genera el fenómeno y proporciona datos concretos.
recolectar, clasificar información y luego analizarla a fin de inferir “algo” respecto de la fuente de
11. VARIABLE : Es una característica que puede tomar diferentes valores. Las variables son
información.
características observables susceptibles de adoptar distintos valores o ser expresados en
La estadística como ciencia cumple los aspectos principales del método científico.
varias categorías. La variable adquiere un valor determinado en cada unidad de análisis.
1. Realización de experimentos y observaciones.
Las variables se denotan por X, Y, Z, etc.
2. Obtención de conclusiones o proposiciones objetivas a partir de los resultados de dichos
Las variables se clasifican en:
experimentos y observaciones.
a. VARIABLE CUALITATIVA: Indican una cualidad de la unidad de análisis. Por ejemplo:
3. Formulación de leyes que simplifiquen la descripción de un gran número de experiencias u Profesión, La clasificación de estudiantes según actitudes, etc.
observaciones. Las variables cualitativas se clasifican a su vez en nominales y ordinales.
Variable Cualitativa Nominal: Son aquellas donde las categorías o modalidades de la
II. NOMENCLATURA ESTADISTICA: variable no siguen un orden específico. Ejemplo:
Considerando que existe un conjunto de términos que se usaran frecuentemente en la Variable: Profesión
Estadística, es necesario precisar el significado de algunos de ellos: Categoría : Ingeniero, Médico, Arquitecto, Profesor.
1. ESTADÍSTICAS: Se toma como sinónimo de DATOS ESTADÍSTICOS, servirá para Variable Cualitativa Ordinal: Son aquellas donde las categorías o modalidades de la
designar a toda colección sistemática de datos referentes a un determinado fenómeno. variable siguen un orden o son susceptibles a una ordenación. Ejemplo:
2. ESTADÍSTICO : Es la persona que se dedica al estudio de la ESTADÍSTICA, es el Variable : Rendimiento académico
profesional que analiza estadísticas, desarrolla métodos y modelos estadísticos y Categoría : Malo, Regular, Bueno.
contribuye a la ciencia estadística.
3. ESTADÍGRAFO : Es cualquier función de datos empíricos que se usan con fines b. VARIABLE CUANTITATIVA: Indica en que cantidad se posee una determinada
descriptivos o analíticos; son medidas de resumen estadístico de un conjunto de datos. característica.
Por ejemplo: La media aritmética, la mediana, la varianza, el coeficiente de correlación, La variable cuantitativa a su vez se clasifica en discretas y continúas.
etc.
2
Variable Cuantitativa Discreta : Surge por el procedimiento de conteo, generalmente PROBLEMA 04:
la variable toma valores enteros. Ejemplo: ¿Cómo influye la motivación interna, la autoestima en el rendimiento académico de los estudiantes
Variable: Números de carros de una empresa minera. Número de lingotes de oro, etc. del nivel secundario de la I.E. “Andrés Avelino Cáceres” de Ayacucho, año 2008?
Variable Cuantitativa Continúa : La variable puede tomar cualquier valor de un (1)
intervalo. Ejemplo: (2)
Variable: El peso de los lingotes de oro, Las ventas del día, etc. (3)

PROBLEMA 05:
PRÁCTICA 01: FORMULACIÓN DE PROBLEMAS ¿Cuál es la correlación que existe entre el rendimiento académico histórico de los estudiantes en los
grados de primaria con el rendimiento académico en los dos primeros grados de la educación
INSTRUCCIONES: secundaria de estudiantes que cursan el tercer año de la I.E. “Andrés Avelino Cáceres” de
(1) Identifique las variables en los siguientes problemas de investigación. Así mismo, aplicando Ayacucho, año 2008?
el principio causa – efecto determine si hay dependencia entre las variables o no. (1)
(2) Formular para cada problema de investigación un Hipótesis u Objetivos (2)
(3) Formular cinco problemas e identificar sus variables de estudio, así mismo proponga la (3)
hipótesis u objetivos para el estudio.
PROBLEMA 06:
PROBLEMA 01: ¿Qué aspectos del entorno del estudiante están relacionados con su formación integral, teniendo
¿Cómo influye el tiempo de estudio que dedican a una asignatura en el rendimiento académico de como referencia los alumnos cuarto año del nivel secundario de la I.E. “Andrés Avelino Cáceres” de
los alumnos del nivel secundario de la I.E. “Andrés Avelino Cáceres” de Ayacucho, año 2008? Ayacucho, junio del 2008?
(1) VARIABLE INDEPENDIENTE : Tiempo de estudio (1)
(2) VARIABLE DEPENDIENTE : Rendimiento académico (2)
(3) HIPÓTESIS : El tiempo de estudio que dedican en una materia influye (3)
significativamente en el rendimiento académico de los alumnos del nivel secundario de la I.E.
“Andrés Avelino Cáceres” de Ayacucho, del año 2008.

PROBLEMA 02:
¿Cuál es el perfil en función a los factores psico-sociodemográficos asociados al desarrollo integral
de los estudiantes del nivel secundaria de la I.E. “Andrés Avelino Cáceres” de Ayacucho, en el año
2008?
(1) VARIABLE : Factores psico-sociodemográficos
(2) VARIABLE : Desarrollo integral
(3) OBJETIVO : Describir el perfil en función a los factores psico-
sociodemográficos asociados al desarrollo integral de los estudiantes del nivel secundario de la I.E.
“Andrés Avelino Cáceres” de Ayacucho, año 2008

PROBLEMA 03:
¿Cuál es la relación entre los factores psico - sociodemográficos y el desarrollo integral de los
educandos del nivel secundario de la I.E. “Andrés Avelino Cáceres” de Ayacucho, junio del 2008?
(1)
(2)
(3)

3
años, en efecto para el 2008 se propone mejorar este indicador, formulando un plan
estratégico para los tres años posteriores, el que será evaluado monitoreando el desarrollo
de los programas curriculares en las aulas seleccionadas.
Población :
Muestra :
Variable de estudio :
Unidad de análisis :

4. La Dirección Regional desea invertir una partida de dos millones de soles en la


implementación de 5 colegios, los peritos comisionados evaluaran a los centros educativos
de la región priorizando si la calificación de la infraestructura es deficiente. Escogerán tres
en la zona rural, dos en zona urbana.
Población :
Muestra :
Variable de estudio :
PRÁCTICA 02: ELEMENTOS ESENCIALES DE UNA INVESTIGACIÓN Unidad de análisis :
INSTRUCCIONES:
Analizar los enunciados propuestos e identifique: La población de estudio, muestra, variable de
estudio y la unidad de análisis. Aplicando el razonamiento y capacidad de inducción - deducción. 5. En un concurso de matemáticas a nivel regional se seleccionan los tres primeros puestos
1. Seleccionar del curso de educación física, los 10 primeros estudiantes que corran los 100 de cada una de las dos categorías. La primera categoría esta formada por estudiantes de
metros planos en menos de 9.78 segundos, tomando como referencia a los estudiantes cuarto y quinto año; la segunda categoría por estudiantes de primero a tercer año de
con mejor aptitud física de La Gran Unidad Educativa “Ramón Castilla”. educación secundaria. Los ganadores serán premiados con S/. 500.00, S/. 400.00 y S/.
Población : Total de estudiantes matriculados en la asignatura de educación 300.00 respectivamente.
física de La Gran Unidad Educativa “Ramón Castilla” Población :
Muestra : Estudiantes con mejor aptitud física. Muestra :
Variable de estudio: El tiempo que demoran en recorrer los 100 metros planos. Variable de estudio :
Unidad de análisis : Un estudiante Unidad de análisis :

2. La Dirección de la Institución Educativa “San Martín”, en su Proyecto Educativo 6. El profesor Juan Arrollo, investiga el nivel de motivación que tienen sus alumnos para el
Institucional tiene como competencia potenciar las capacidades de sus 572 estudiantes de estudio de la asignatura de matemáticas
nivel secundaria. Para ejecutar tal fin, los docentes aplicando las técnicas clasificación Población :
recomiendan a los estudiantes que taller es adecuado teniendo como referencia sus Muestra :
habilidades, para que integren en forma libre uno y solamente uno de los siete talleres de Variable de estudio :
formación que promociona. Los talleres tienen una capacidad para 30 estudiantes y Unidad de análisis :
presentará a sus mejores alumnos para que exhiban sus habilidades en sus fiestas
aniversarias. 7. La Dirección de una Institución educativa desea renovar el 50% de su plana docente
Población : contratada, para cumplir con su finalidad evalúa los índices de desaprobados reportados
Muestra : en los informes de las asignaturas que dictaron de los dos últimos años y el número de
Variable de estudio : faltas registradas a las jornadas de trabajo extracurriculares del presente año.
Unidad de análisis : Población :
Muestra :
3. En el Centro Educativo “Santa Teresita” se observa que el calificativo promedio a nivel de la Variable de estudio :
Institución con respecto al redimiendo académico es de 14 puntos en los cinco últimos Unidad de análisis :

4
8. Se desea seleccionar al brigadier del aula, para lo cual se proponen cuatro candidatos. El DEFINICIÓN 01 : Se llama FRECUENCIA ABSOLUTA del valor yi al número de veces
candidato que obtiene la mayor votación es declarado brigadier.
Población : que aparece este valor en el conjunto de observaciones y se representa por " ni " donde
Muestra : i = 1, 2,..., m
Variable de estudio :
Unidad de análisis : Entonces la TABLA DE FRECUENCIAS ABSOLUTAS tiene la siguiente forma:

9. Elegir el estudiante del año de la comunidad educativa provincial, observando su actividad Valores diferentes Frecuencias
académica y aptitudinal.
Población : observados yi absolutas ni
Muestra : y1 n1
Variable de estudio :
Unidad de análisis : y2 n2
. .
10. Seleccionar al mejor estudiante en todas las áreas, del nivel secundario del Perú.
Población : . .
Muestra : . .
Variable de estudio :
Unidad de análisis : ym nm
Total n
III. ORGANIZACIÓN Y CLASIFICACIÓN DE DATOS.
Frente a un conjunto de datos, lo primero que se debe realizar es expresar y clasificar de
acuerdo a criterios convenientes, en alguna forma simple de tal manera que se observe
rápidamente todas las características posibles para obtener conclusiones útiles ya sea EJEMPLO:
directamente o por medio de cálculos posteriores. Se consideran los siguientes pasos: Se realiza un estudio en una Institución Educativa para saber el número más frecuente de hijos que
1. Revisión y corrección de los datos. tienen los Padres de Familia, con la finalidad de estimar posteriormente en cuando bajaran sus
2. Construcción de tablas de frecuencias. ingresos de matricula del próximo año 2008 de su población estudiantil, si solo cobran matricula por
3. Representación tabular o cuadros estadísticos y graficas. un hijo. Para tal objetivo se selecciona una muestra aleatoria de 16 Padres de los que se obtuvo la
x1 = 2 x2 = 1 x3 = 3 x4 = 1
3.1 REVISIÓN Y CORRECCIÓN DE LOS DATOS y1 = 1
Ningún análisis estadístico, por acabado y seguro que sea, es capaz de suministrar respuestas x5 = 2 x6 = 1 x7 = 3 x8 = 3 y2 = 2
adecuadas a un problema en estudio, si aquel se basa en una información incorrecta. De aquí siguiente información:
la regla debe ser revisar y corregir los datos recolectados previamente. x9 = 2 x10 = 1 x11 = 2 x12 = 3 y3 = 3
y4 = 4
x = 4 x =1 x =1 x = 2
13 14 15 16
3.2. TABLAS DE FRECUENCIAS
Si los datos son números es necesario clasificarlos en un cuadro resumen de las observaciones
originales a las que se les conoce como TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS o
SIMPLEMENTE TABLA DE FRECUENCIAS. Con la información construya una tabla de frecuencias absolutas e interprete la frecuencia máxima y
mínima.
3.2.1. DATOS DE VARIABLES DISCRETAS Nº de Nº de
Sean x1 , x2 ,..., xn un conjunto de “n” observaciones discretas y sean y1 , y2 ,..., ym el Hijos Padres ni INTERPRETACIÓN:
conjunto de valores diferentes que toman los datos originales (m <= n). 1 6
5 2 5
3 4
4 1
Total 16
Hay en la Institución Educativa seis Padres de familia que tienen un hijo, así como, un Padre que m
tiene cuatro hijos. Si denotamos por “ H i ” esta frecuencia entonces: H i
* *
=  h j = hi  hi 1  ...  hm
j =1

DEFINICIÓN 08: Se llama FRECUENCIA RELATIVA ACUMULADA PORCENTUAL a la


* *
frecuencia acumulada H i ó ( H i ) multiplicado por 100%. Es decir, 100 H i % ó (100 H i %) ,
DEFINICIÓN 02 : Se llama FRECUENCIA ABSOLUTA ACUMULADA “MENOR QUE”
correspondiente al valor yi , al número de observaciones menores o iguales a yi ( xi  yi ) . Si y representa el porcentaje de observaciones menores o iguales a yi (mayores o iguales a yi ).
denotamos esta frecuencia por “ N i ”, entonces: N i = n1  n2  ...  ni 3.2.1.1 PROPIEDADES DE LAS FRECUENCIAS
i Las propiedades que a continuación se presentan son consecuencias de las definiciones
Usando la notación de sumatoria, la frecuencia absoluta acumulada se escribe: N i =  nj anteriores de frecuencia absoluta, frecuencia absoluta acumulada, frecuencia relativa y
j =1 frecuencia relativa acumulada.
EJERCICIO: Calcular las frecuencias absolutas acumuladas del ejemplo anterior.
PROPIEDAD 01: Las frecuencias absolutas y frecuencias absolutas acumuladas son siempre
DEFINICIÓN 03: Se llama FRECUENCIA ABSOLUTA ACUMULADA “MAYOR QUE” enteros no negativos. Es decir:
correspondiente al valor yi , al número de observaciones mayores o iguales a yi ( xi  yi ) , Si ni �0 , N i �0 ,
*
N i �0 "i = 1, 2, ..., n
denotamos a esta frecuencia por “ N
*
i ”, entonces: N
*
i = ni  ni 1  ...  nm PROPIEDAD 02: La suma de todas las frecuencias absolutas es igual al número total del
m
conjunto de observaciones. Es decir:
=  nj
* m
En notación de sumatoria, se escribe: N i
j =i n
i =1
i = n1  n2  ...  nm = n
DEFINICIÓN 04: Se llama FRECUENCIA RELATIVA del valor yi , al cociente de la frecuencia
PROPIEDAD 03: Las frecuencias relativas y las frecuencias relativas acumuladas son siempre
absoluta de yi y el número total de observaciones. números fraccionarios no negativos, no mayores que uno. Es decir:
*
ni 0 �hi �1, 0 �H i �1, 0 �H i �1 "i = 1, 2,..., m
Esta frecuencia se denota por “ hi ” entonces: hi =
n PROPIEDAD 04: La frecuencia absoluta acumulada MENOR QUE correspondiente al valor
DEFINICIÓN 05: Se llama FRECUENCIA RELATIVA PORCENTUAL, a la frecuencia relativa hi ym coincide con el número total del conjunto de observaciones. Es decir:
multiplicada por 100% (100 hi %), y representa el porcentaje de observaciones que corresponde al m
valor yi N m =  ni = n
i =1

DEFINICIÔN 06: Se llama FRECUENCIA RELATIVA ACUMULADA “MENOR QUE” del valor PROPIEDAD 05: La frecuencia absoluta acumulada MAYOR QUE correspondiente al valor
yi a la frecuencia relativa total de las observaciones menores o iguales a yi . y1 coincide con el número total del conjunto de observaciones. Es decir:
Si denotamos a esta frecuencia por “ H i ”, entonces: H i = h1  h2  ...  hi m
i
N1* =  ni = n
En notación de sumatoria se tiene: Hi =  hj i =1
j =1
DEFINICIÓN 07: Se llama FRECUENCIA RELATIVA ACUMULADA “MAYOR QUE” del valor PROPIEDAD 06: La frecuencia relativa acumulada MENOR QUE correspondiente al valor
yi a la frecuencia relativa total de las observaciones mayores o iguales a yi . ym coincide con la unidad. Es decir:
6
m PROPIEDAD 12: Las frecuencias absolutas acumuladas cumplen las desigualdades
H m =  hi = 1 siguientes:
i =1

PROPIEDAD 07: La frecuencia relativa acumulada MAYOR QUE correspondiente al valor y1 n1 = N1  N 2  ...  N m = n
coincide con la unidad. Es decir: y Ni = N i 1  ni , "i = 1, 2,..., m

m
y N0 = 0. como ni = N i  Ni 1
H =  hi = 1
*
1
i =1
n = N1* �N 2* �... �N m* = nm

PROPIEDAD 08: La frecuencia absoluta acumulada MENOR QUE correspondiente al valor y Ni* = Ni*1  ni1 , "i = 2,3,..., m
y1 es n1 . Es decir: y ni 1 = Ni*1  Ni*
1
N1 =  ni = n1 PROPIEDAD 13: Las frecuencias relativas acumuladas cumplen las desigualdades siguientes:
i =1
h1 = H1 �H 2 �... �H m
PROPIEDAD 09: La frecuencia absoluta acumulada MAYOR QUE correspondiente al valor
ym es nm . Es decir: y H i = H i 1  hi , "i = 1, 2,..., m
m donde H 0 = 0, hi = H i  H i 1
N m* =  ni = nm
i =m 1 = H1* �H 2* �... �H m* = hm
y Hi* = H i*1  hi1 , "i = 2,3,..., m
Nº de Nº de
Ni N i* hi hi % Hi Hi % H i*
Hijos Padres ni donde hi1 = H i*1  H i*
1 6 6 16 0.38 38 0.38 38 1.00 EJEMPLO:
2 5 11 10 0.31 31 0.69 69 0.62 Construya todas las frecuencias estudiadas para la distribución de Padres de familia según
3 4 15 5 0.25 25 0.94 94 0.31 número de hijos (Tabla anterior). Interprete una frecuencia de cada columna.
4 1 16 1 0.06 6 1.00 100 0.06 SOLUCIÓN:
Total 16 1.00 100
PROPIEDAD 10: La frecuencia relativa acumulada MENOR QUE correspondiente al valor y1
es h1 . Es decir:
1
H1 =  hi = h1
i =1
PROPIEDAD 11: La frecuencia relativa acumulada MAYOR QUE correspondiente al valor
ym es hm . Es decir:
m
H m* =  hi = hm INTERPRETACIÓN:
i =m n3 : En la Institución Educativa hay cuatro padres de familia que tienen tres hijos

7
N3 : En la Institución Educativa se registran 15 padres de familia que tienen de uno a tres DEFINICIÓN 11: AMPLITUD DE CLASE ( C ), es la longitud del intervalo que define la clase
y se define como:
hijos o tienen como máximo tres hijos.
N 2* : Hay diez padres de familia que tienen por lo menos dos hijos. R
C=
h2 : La proporción de padres de familia que tienen dos hijos, es de 0.31. m
h2 % : El 31% de los padres de familia tienen dos hijos. CONSTRUCCIÓN DE LOS INTERVALOS DE CLASE

H 2 % : El 69% de los padres de familia tienen como máximo dos hijos. Los intervalos de clase se construyen partiendo de un xmin , al que se le va asignado
H 2* : La proporción de padres de familia que tienen por lo menos dos hijos, es de 0.62 consecutivamente a las clases, los limites inferior y superior de clase, de la siguiente manera:

lim inf : y0 = xm í n limsup : y1 = xm í n  c


3.2.2. DATOS DE VARIABLE CONTINUA
lim inf : y1 = xm í n  c limsup : y2 = xm í n  2c
Sean x1 , x2 ,..., xn un conjunto de observaciones, siendo “n” el tamaño de la muestra y donde
.
los datos son del tipo continuo. En este caso debido a que la magnitud de la característica .
puede tomar al menos una teóricamente, una infinidad de valores, el proceso de reducción,
agrupación o condensación de los datos originales, que conducen a la construcción de tablas de lim inf:y m-1 =x mín +(m-1)c lim sup: y m =x mín +mc=x máx
frecuencia, no es tan simple como en el caso discreto, puesto implica realizar algunos cálculos
previos a la elaboración de la tabla de frecuencias. DEFINICIÓN 12: LA MARCA DE CLASE es el punto medio del intervalo que representa a dicha
clase. Se denota por " yi " i = 1, 2,..., m . Es decir:

DEFINICIÓN 09: AMPLITUD DEL RECORRIDO ó RANGO ( R ), es la longitud del recorrido yi 1  yi


del conjunto de datos. Es decir: yi =
2
R = xm á x  xm í n
DEFINICIÓN 13: La frecuencia absoluta ( ni ) de la clase i-ésima, es el número de observaciones
Donde :
del conjunto original que pertenecen a dicha clase. Entonces, la tabla de distribución de frecuencias
xm á x : Observación de valor máximo tiene la siguiente forma:
xm í n : Observación de valor mínimo
TABLA DE DISTRIBUCION DE FRECUENCIAS
DEFINICIÓN 10: Se llama CLASES ó INTERVALOS DE CLASE a cada uno de los grupos
en que se divide el conjunto de datos. Intervalo Marca de frecuencia
Si la variabilidad de los datos es grande, entonces se fijara un número de intervalos pequeños yi 1  yi clase yi ni
de tal forma que no se pierda la representatividad de la información. Por otro lado si no se
conoce nada algo con respecto al comportamiento de los datos se utiliza la REGLA DE
STURGES:
m = 1  3.332 log(n)
Donde:
m: Número de Intervalos
n: Número total de observaciones

8
y0  y1 y1 n1 2º. Determinar el recorrido de la variable o rango “R”:

y1  y2 y2 n2 R = xmáx  xmín = 118  60 = 58


. . .
. 3º. Determinar el número de intervalos a confeccionar “m”, aplicando la regla de Sturges:
. . .
. . .
.
m = 1  3.3log(n) = 1  3.3log(60) = 6.87 �7
ym 1  ym ym nm
4º. Calcular la amplitud del intervalo “C”:
Total n
R 58
C= = = 8.29 �8
EJEMPLO: m 7
En una Escuela de Educación Secundaria se fórmula una tarea de matemáticas, la que tiene por
objeto medir el tiempo en minutos que emplean los alumnos en terminarla; los datos
5º. Elaborar los intervalos:
se registran a continuación:
Alumno Tiempo Alumno Tiempo Alumno Tiempo Alumno Tiempo Alumno Tiempo
1 [Intervalo>
74 13 64 25 94 37 63 49 69
2 60 7068 14 60 26 90 38 61 50 70
3 68 7876 15 68 27 98 39 65 51 74
4 76 7284 16 62 28 92 40 60 52 68
5 84 7692 17 66 29 96 41 66 53 70
6 92 110 100 18 84 30 79 42 75 54 104
7 100 108 108 19 80 31 75 43 80 55 100
8 108 118 116 20 88 32 81 44 76 56 107
9 108 21 82 33 80 45 80 57 102
10 112 22 86 34 80 46 75 58 106
11 80 23 65 35 63 47 75 59 79
12 85 24 60 36 80 48 101 60 100
Con los datos, realizar lo siguiente:
(a) Organizar los datos en una tabla de distribución de frecuencias.
(b) Interprete las frecuencias.

SOLUCIÓN:
(a) Pasos para organizar los datos en una tabla de distribución de frecuencias:

1º. Identificar el valor máximo y mínimo del conjunto de datos:

xmín = 60, xmáx = 118

9
3.2.3. DATOS DE VARIABLE CUALITATIVA
En el caso de datos cualitativos, la tabla de distribución de frecuencias
adoptara la siguiente forma:
Variable Frec. abs. Frec. relativas hi %
ni hi

Característica n A h A 100 h A
A
n B h B 100 h B
Característica
B . . .
Con las observaciones hechas: Empezamos a elaborar los intervalos; donde el primer . . .
.
intervalo esta dado por:
. n Z h Z 100 h Z
Extremo inferior + amplitud = 58 + 9 = 67
En consecuencia el primer intervalo es [ 58 - 67 > ; los demás intervalos se confeccionan Característica
de forma similar. Z
6º. Construir la tabla de distribución de frecuencias:
Totales n 1.00 100 %
[Tiempo> ni Ni hi hi % Hi Hi %
EJEMPLO:
58 67 12 12 0,20 20 0,20 20
67 76 13 25 0,22 22 0,42 42 La revista signos de la Congregación de Colegios Católicos del Perú, efectuó una encuesta
76 85 15 40 0,25 25 0,67 67 respecto a lo adecuado de la protección policial en la Ciudad. Se selecciono un total de
85 94 5 45 0,08 8 0,75 75 419 personas en una muestra aleatoria simple. Los siguientes datos
94 103 7 52 0,12 12 0,87 87 reflejan las respuestas de las personas encuestadas a la pregunta. ¿Es
103 112 6 58 0,10 10 0,97 97 adecuada la protección policial en su vecindario?
112 121 2 60 0,03 3 1,00 100
60 1,00 100 Respuesta Frec. abs. ni hi hi %
(b) Interpretar las frecuencias
n3 : En la Institución Educativa hay 15 estudiantes que emplearon entre 76 y 85 Si 293
minutos para terminar su tarea. No 80
N 3 : En la Institución Educativa hay 40 estudiantes que emplearon entre 58 y 85 No sabe resp 46
minutos para terminar su tarea.
h2 : La proporción de estudiantes que emplearon entre 67 y 76 minutos para culminar Total 419 1.00 100
%
su tarea, es de 0.22.
h2 % : El 22% de los estudiantes emplearon entre 67 y 76 minutos para culminar su Responda lo siguiente:
tarea. i. Qué proporción de personas no saben responder?.
H 5 % : El 87% de los estudiantes emplearon entre 58 y 103 minutos para culminar su ii. Qué porcentaje de personas contestaron Si?
tarea
10
EJERCICIO: (3) CUADRO PROPIAMENTE DICHO:
Se solicito a 20 estudiantes de la UNSCH, llenar una ficha académica donde debían registrar su
Es la parte del cuadro que contiene la información y consta de un conjunto de casillas o celdas,
auto evaluación en su formación profesional, según la siguiente escala: Muy Buena (MB), Buena
dispuestas en columnas y filas. Sus elementos esenciales son: Encabezamiento de las
(B), Regular (R). Los datos son los siguientes:
columnas, columna principal o matriz y cuerpo.
R; MB; B; MB; MB; B; B; MB; R; MB; R; B; MB; B; R; B; MB; B; B; R.
Determinar: ENCABEZAMIENTO: Es la primera fila del cuadro en el se explica las categorías y el objeto de
(a) La variable de estudio. cada una de las columnas, es decir indica la naturaleza de los datos inscritos en cada celda que
(b) Elaborar una tabla de frecuencias. se halla debajo. Deben ser breves y explícitos. Ejemplo: Frecuencia Absoluta, Frecuencia
Relativa.
3.3. REPRESENTACION TABULAR Y GRÁFICA.
COLUMNA PRINCIPAL O MATRIZ: Es aquella en la que se anotan las categorías o las
La ejecución de una investigación implica que se ha recolectado una serie de datos y clasificado
diferentes clases de la escala de clasificación utilizada. Ejemplo: Los intervalos confeccionados,
la información; resultando imprescindible presentarla de manera adecuada par que permita
las categorías de la variable Estado Civil.
hacer un análisis útil.
Existen dos tipos de presentación: mediante cuadros estadísticos y gráficos:
CUERPO: Es el conjunto de celdas o casillas, que son la intersección de filas y columnas,
donde están anotados los datos numéricos.
3.3.1. CUADROS ESTADÍSTICOS.
En general un cuadro estadístico es un arreglo ordenado de filas y columnas de los datos o
(4) NOTAS AL PIE Ó NOTAS EXPLICATIVAS: Contiene habitualmente la fuente de los
series estadísticas o también características relacionadas con el objeto de ofrecer información
datos representados y cualquier nota aclaratoria sobre el contenido del cuadro.
de fácil lectura, comparación e interpretación. Las características pueden ser cualitativas,
cuantitativas o una combinación de ellas.
FUENTE: Es la indicación al pie del cuadro que sirve para nombrar la entidad responsable de
El objetivo de las líneas (horizontales) y columnas (verticales) de un cuadro se deben
donde se obtuvieron los datos. Ejemplo: Departamento de Estadística del Poder Judicial.
organizar de modo que se evidencie los aspectos que interesa mostrar y resalten las
comparaciones que se desean hacer notar. La tabla de distribución de frecuencias es un caso
AUTOR: Es una indicación que se coloca debajo de la fuente y sirve para mencionar al
especial de un cuadro estadístico.
responsable que ha utilizado los datos originales o de la fuente.
PARTES DE UN CUADRO ESTADÍSTICO.
Las partes de un cuadro estadístico son:
(1) NÚMERO: Es el código de identificación del cuadro que permite ubicar en el interior de un
documento. Ejemplo: CUADRO Nº 01.
(2) TÍTULO: Es la descripción resumida del contenido del cuadro. La redacción del título debe
ser breve, claro y completo, de modo que se pueden deducir sin ambigüedad que tipo de CUADRO 01: DISTRIBUCIÓN DE LA INVERSIÓN DE LA INSTITUCIÓN EDUCATIVA PARTICUAR
información contiene el cuadro. La redacción del un titulo completo debe indicar: “SAN REMO” POR TRIMESTRES DEL 2007, SEGÚN NIVELES Y GRADOS DE
DE EDUCACIÓN.
QUÉ: Qué hay en el cuadro, se refiere al hecho observado o la característica principal. Ejemplo: INVERSIÓN EN SOLES DE
Número de hijos por padre de familia. LA I.E.P. “SAN REMO”
NIVEL DE EDUCACIÓN
AÑO 2007 / TRIMESTRE
DONDE: Se refiere al lugar geográfico o institución a la que corresponde la información.
Ejemplo: I.E. “San Martín” II III IV
PRIMARIA 46228 53961 51295
COMO: Como están ordenados o clasificados los datos en el cuadro. La variable ubicada en la
PRIMER GRADO 20563 27369 26025
fila se identifica con la preposición “por” y las de la columna con la preposición “según”. Ejemplo:
SEGUNDO GRADO 14376 14508 13783
Distribución de frecuencias de padres de familia según número de hijos.
TERCER GRADO 3381 3489 3319
CUANDO: A que momento o periodo de tiempo está referida la información. Ejemplo: Abril del CUARTO GRADO 1155 1095 1043
2008
QUINTO GRADO 6753 7500 7125

11
(4) El titulo se coloca generalmente en la parte superior del grafico, precisando lo más claro
SECUNDARIA 113600 116033 110138 posible el contenido que expone.
(5) Debe indicar la unidad de medida utilizada.
PRIMER AÑO 27702 25773 24484
(6) Cada escala debe ser rotulada de tal manera que se comprenda fácilmente que
SEGUNDO AÑO 35847 37815 35826
representa: kg, libras, etc.
TERCER AÑO 6668 6348 6148 (7) Las escalas no deben tener muchas subdivisiones.
CUARTO AÑO 19177 18809 17869 (8) El grafico generalmente progresa de izquierda a derecha y de abajo hacia arriba.
QUINTO AÑO 24206 27288 25811 (9) Las líneas del propio grafico deben dibujarse más gruesas que las escalas.
(10) No deben trazarse más líneas coordenadas que las necesarias para la fácil lectura,
EDUCACIÓN ESPECIAL 101118 91227 96681 procurando que el cero aparezca en el diagrama.
(11) El grafico generalmente debe ir acompañado de la tabla que le dio origen.
TOTAL 260946 261221 258114
FUENTE: INSTITUCIÓN EDUCATIVA PARTICUAR “SAN REMO” (12) Para alcanzar su objetivo con sencillez no debe contener más líneas o símbolos que los
AUTOR: ADMINISTRACIÓN CONTABLE DE LA I.E.P que el ojo pueda cómodamente seguir.
3.3.2. REPRESENTACIÓN GRÁFICA 3.3.5. PRINCIPALES TIPOS DE GRÁFICO.
Un gráfico es la representación de un fenómeno estadístico por medio de figuras geométricas, Hay varias formas de hacer la representación gráfica de un conjunto de datos estadísticos; cada
(puntos, líneas, rectángulos, paralelipedos, etc.) cuyas dimensiones son proporcionales a la una de ellas posee ventajas por las que se adaptan mejor para presentar un tipo de series
magnitud de los datos representados. estadísticas que otro. El investigador elegirá el más conveniente.
Su objeto principal es la representación de los datos de forma gráfica, que permita de un Los más usuales son los siguientes:
solo golpe de vista darse cuenta del conjunto de elementos presentados y de evidenciar sus 1. Diagrama de barras
variaciones características. El gráfico es un auxiliar del cuadro estadístico, no lo sustituye si no 2. Pictogramas
que lo complementa. 3. Gráfico de sectores
4. Diagrama de frecuencias
VENTAJAS Y DESVENTAJAS DEL GRÁFICO: 5. Histogramas de frecuencias
EL gráfico tiene la ventaja sobre el cuadro, de permitir apreciar más rápidamente los datos y 6. Polígono de frecuencias absolutas y relativas.
abarcar todo su conjunto. 7. Polígono de frecuencias acumuladas u ojivas.
La construcción del grafico se basa en el cuadro estadístico, pero tiene sus limitaciones
como las siguientes: (1) GRÁFICO DE BARRAS
(1) El gráfico no puede presentar tantos grupos de datos como una tabla. Un cuadro puede Es aquel en cual la información queda representada por una serie de rectángulos, barras o
tener 4 o más columnas de datos, sin embargo representado esto en un grafico dificulta paralelipedos, los cuales pueden dibujarse horizontalmente o verticalmente.
su comprensión. Este gráfico se utiliza para representar variables de tipo cualitativo o cuantitativo
(2) En los cuadros pueden darse valores exactos, en los gráficos muchas veces solo valores discreto.
aproximados.
3.3.3. PARTES DE UN GRÁFICO
Un grafico debe contener las siguientes partes: Titulo, Grafico propiamente dicho y notas
explicativas.
3.3.4. REGLAS PRINCIPALES PARA EL TRAZADO DE GRAFICOS LINEALES
(1) Las frecuencias se ubican por lo general en el eje vertical y el método de clasificación en el
eje horizontal.
(2) Las dos escalas de los ejes deben guardar proporción de tal forma que el grafico no de la
impresión de fluctuaciones muy lentas o muy exageradas.
(3) La escala que representa la frecuencia debe empezar en cero. Cuando no puede empezar
de forma normal, se parte la escala con una línea en zigzag.
12
Este sistema de representación se utiliza para representar datos cualitativos o cuantitativos
discretos. Su uso más frecuentes es con fines comparativos; cuando se quiere mostrar las
diversas componentes de una serie de valores de la variable comparada con el total.
Para construir el grafico de sector, se utiliza una circunferencia, cuyo círculo se divide en
sectores tales que sus medidas angulares centrales y por tanto la superficie del sector circular
sean proporcionales a las magnitudes de los valores de la variable que representan. Al total del
círculo le corresponde 360º y mediante una regla de tres simple se encontrará el número en
grados que le corresponde a cada sector.
Total (n) : 360º
Parte(ni) : xº
º n *360º
x = i
n

FUENTE: INSTITUCIÓN EDUCATIVA PARTICUAR “SAN REMO”


AUTOR: ADMINISTRACIÓN CONTABLE DE LA I.E.P

(2) PICTOGRAMA O PICTOGRAFOS


Un pictograma es la representación de series estadísticas por medio de símbolos que por su
forma sugieren la naturaleza de los datos. Consiste en tomar como unidad un símbolo arbitrario
para el que debemos fijar previamente el valor que le asignamos como unidad.
EJEMPLO: De la tabla de Distribución de frecuencias presenta el número de hijos por familia.
Elabore un pictograma.
Nº DE HIJOS (yi) Nº DE FAMILIAS (ni)
1 6
2 5
3 4 FUENTE: INSTITUCIÓN EDUCATIVA PARTICUAR “SAN REMO”
AUTOR: ADMINISTRACIÓN CONTABLE DE LA I.E.P
4 1
TOTAL 16 (4) DIAGRAMA DE FRECUENCIAS
El diagrama de frecuencias se usa para representar los diferentes tipos de distribuciones de
GRAFICO 02: DISTRIBUCION DE FRECUENCIAS DEL NÚMERO DE HIJOS SEGÚN FAMILIAS
frecuencias de datos discretos. Por tanto se pueden confeccionar seis gráficos.
FAMILIA CON 1 HIJOS: ******

FAMILIA CON 2 HIJOS: *****

FAMILIA CON 3 HIJOS: ****

FAMILIA CON 4 HIJOS: *

FUENTE: FICHA DE MATRICULA DE LA INSTITUCIÓN EDUCATIVA “SANTA TERESA”


AUTOR: SECRETARIA DE LA I.E.
NOTA: TOMANDO COMO UNIDAD UNA FAMILIA (*)

(3) GRAFICO DE SECTORES

13
FUENTE: INSTITUCIÓN EDUCATIVA PARTICUAR “SAN REMO” FUENTE: INSTITUCIÓN EDUCATIVA PARTICUAR “SAN REMO”
AUTOR: ADMINISTRACIÓN CONTABLE DE LA I.E.P AUTOR: ADMINISTRACIÓN CONTABLE DE LA I.E.P

(5) HISTOGRAMA DE FRECUENCIAS


Se usa para representar gráficamente las distribuciones de frecuencias absolutas o relativas de
datos cuantitativos continuos agrupados en clases.
El histograma queda representado por una serie de rectángulos semejantes a los del
histograma de barras, con la diferencia que las barras se colocan verticalmente y deben ir uno al
lado de las otras sin que haya un espacio que las separe. La base de cada rectángulo es la
amplitud de la clase (intervalo) de la variable correspondiente y la altura esta definida por la
frecuencia absoluta “ni” ó frecuencia relativa “hi”.
EJEMPLO: En la I.E. “LAS CARMELITAS” tienen como objetivo recolectar papel en todo el año
2007; para venderlos deben hacer fardos de 95 kilogramos para la industria del reciclaje. El
comprador pesa 50 fardos cuyos pesos se presentan a continuación:
yi-1 yi ym ni hi Ni Hi
91.5 92.5 92 4 0.08 4 0.08
92.5 93.5 93 11 0.22 15 0.30
FUENTE: INSTITUCIÓN EDUCATIVA PARTICUAR “SAN REMO” 93.5 94.5 94 20 0.40 35 0.70
AUTOR: ADMINISTRACIÓN CONTABLE DE LA I.E.P 94.5 95.5 95 9 0.18 44 0.88
95.5 96.5 96 6 0.12 50 1.00
Total 50 1.00
Graficar las frecuencias absolutas y las frecuencias relativas simples

14
FUENTE: I.E “LAS CARMELITAS”
AUTOR: SECRETARIA DE LA I.E “LAS CARMELITAS”

FUENTE: I.E “LAS CARMELITAS”


AUTOR: SECRETARIA DE LA I.E “LAS CARMELITAS”

(7) POLÍGONO DE FRECUENCIAS ACUMULADAS U OJIVAS.


Una ojiva es una representación gráfica de una distribución de frecuencias absolutas acumuladas
o las frecuencias relativas acumuladas. Su construcción es de la siguiente forma:

(a) Se ubica en el eje horizontal los límites de los intervalos de clase.


(b) Se levantan sobre el extremo superior de cada clase un segmento cuya longitud
coincidan con la frecuencia absoluta acumulada o con la frecuencia relativa acumulada de
dicha clase.
FUENTE: I.E “LAS CARMELITAS” (c) Luego se unen con segmentos de rectas los extremos superiores de dichos
AUTOR: SECRETARIA DE LA I.E “LAS CARMELITAS”
segmentos verticales.
(6) POLÍGONO DE FRECUENCIAS
Los polígonos de frecuencias absolutas o relativas, se obtienen uniendo los puntos medios de las
bases superiores de los rectángulos en el histograma de frecuencias absolutas o relativas
respectivamente.
EJERCICIO:
Elaboré el polígono de frecuencias para las absolutas y las relativas.

15
PRÁCTICA 03: TABLA DE DISTRIBUCIÓN DE FRECUENCIAS Y GRÁFICOS
ESTADÍSTICOS
INSTRUCCIONES: Leer cada uno de los enunciados que se presentan a continuación y responda
puntualmente a cada uno de los ítems formulados para cada pregunta.

PREGUNTA 01:
Clasifique las siguientes variables de estudio, en cualitativas y cuantitativas, así como sub
clasificación:

A. Elige una frase que describa a tu ciudad:


Fc1 Ordenada y tranquila
Fc2 Ordenada y bulliciosa
Fc3 Desordenada y tranquila
Fc4 Desordenada y Bulliciosa
B. Cuando evalúas tu esencia como persona, solo reconoces tus características:
Ep1 Positivas
FUENTE: I.E “LAS CARMELITAS” Ep2 Negativas
AUTOR: SECRETARIA DE LA I.E “LAS CARMELITAS”
Ep3 Positivas y negativas
C. Con quién tienes mas confianza:
Mc1 Padre
Mc2 Madre
Mc3 Hermano(a)
Mc4 Amiga
D. Si haces un balance de tus acciones durante toda tu trayectoria de vida, con cuánto te
calificarías en una escala de 0 a 20:
BA01 – Baja [0 – 10]
BA02 - Regular [11 – 13]
BA03 - Buena [14 – 16]
BA04 – Muy Buena [17 – 20]
E. Si tuvieras que vender algo a una persona humilde, que te costó S/. 10.00 le venderías a S/.
15.00 o S/. 12.00
F. Qué nota promedio lograste en la asignatura de matemáticas .

PREGUNTA 02:
Una profesora califica a sus estudiantes en el aspecto de intervenciones
orales con calificativos que varían de 10 a 14 puntos por participación. Los
FUENTE: I.E “LAS CARMELITAS”
datos extraídos del registro de evaluaciones son las siguientes:
AUTOR: SECRETARIA DE LA I.E “LAS CARMELITAS” 10 12 10 14 12
14 11 12 11 13
10 10 12 12 10
16
11 11 11 12 11 (b) Elaboré una tabla de distribución de frecuencias con sus elementos.
12 11 12 12 10 (c) Interprete los resultados y recomiende que puede hacer para mejorar la situación familiar.
13 10 13 11 13 (d) Elaborar un grafico adecuado para cada frecuencia.
Organizar los datos en una tabla de distribución y luego responda lo siguiente:
PREGUNTA 05:
(a) ¿Cuántos alumnos tienen notas aprobatorias?
(b) ¿Cuántos alumnos obtuvieron notas de once a trece? Los siguientes puntajes son los resultados de un examen para medir el
(c) ¿Cuál es la proporción de estudiantes desaprobados? coeficiente intelectual de un grupo de estudiantes:
(d) ¿Cuál es la proporción de alumnos que tienen notas de por lo menos once? 93 99 105 103 107 110 115 92 108 110 115 120 93 124 130 102 112 102 108 110 109
(e) ¿Cuál es 31 41 53 61 65 69 74 78 el porcentaje de alumnos aprobados 110 95 98 90 124 104 108 125 130 136 140 108 96 104 107 106 97 122 103
con 34 41 54 62 68 69 75 78 notas mayores de once? Determinar los siguientes ítems:
(f) ¿Cuál es el porcentaje de alumnos que (a) Construya una tabla de distribución de frecuencias.
34 48 55 63 68 70 76 79
obtuvieron notas de por lo menos doce? (b) Determine cuantos estudiantes tienen coeficiente intelectual menores de 104 puntos
(g) 38 48 56 64 68 73 77 83 Supongamos que hay un estudiante (c) El número de estudiantes que tienen coeficiente intelectual de 112 puntos a más.
que tiene 39 49 59 64 69 74 78 84 promedio de 17 en los exámenes (d) El número de estudiantes que tienen coeficiente intelectual de por lo menos 104 puntos ó más
escritos, analice si la nota de promedio 14 obtenido en intervenciones orales influye en el pero menos de 136 puntos.
promedio general. Explique su razonamiento y que haría Ud. al respecto (e) La proporción de estudiantes con coeficiente intelectual menores de 112 puntos.
(f) La proporción de estudiantes con coeficiente intelectual de por los menos 104 puntos pero a los
PREGUNTA 03: más 128 puntos.
Se pregunto a un grupo de estudiantes su estatura en cms, los datos (g) El porcentaje de estudiantes con coeficiente intelectual entre 128 y 144 puntos.
obtenidos son los siguientes: (h) Elaborar un gráfico apropiado para cada frecuencia
152 163 154 170 164 154 166
PREGUNTA 06:
163 162 168 168 172 170 160 Los datos que se presentan a continuación son los gastos de mantenimiento diarios de la I.E. “Santa
161 158 165 165 151 161 157 Teresita” en el 2007
160 155 158 158 170 169 168
155 156 162 162 166 168 160
Organice los datos en una tabla de distribución de frecuencias con sus elementos y responda
puntualmente los siguientes ítems:
(a) ¿Cuál es el rango de talla más frecuente?
(b) ¿Cuál es el rango de talla más baja?
(c) ¿Cuál es porcentaje de alumnos que tienen el rango de talla más alta? Con la información realizar lo siguiente:
(d) Interprete las frecuencias absolutas acumuladas en función de la marca de clase (a) una tabla de frecuencias y sus elementos
(b) Elaborar un grafico para la frecuencias relativas porcentuales
PREGUNTA 04: (c) Interprete la frecuencia n2, n4, N2, N4; h2, h4, H2 y H4 , h2%, h4%, H2% y H4 %
En una encuesta a 50 estudiantes seleccionados del nivel secundaria de la I.E. Ramón Castilla en
año 2007, se les consultó al respecto de ¿Cómo califican sus relaciones PREGUNTA 07:
familiares?, obteniendo como respuestas “Buenas ( B )”, “Regulares ( R )” y Los 40 estudiantes de la serie 200 de la Escuela Profesional de Educación Primaria matriculados en
Estadística Aplicada, rindieron su primer examen parcial obteniendo los siguientes resultados:
“Malas ( M )”. Los datos registrados son los siguientes:
B R R M R M R B R R R R MR M R R R B M B BM R R M R R B
08 13 08 14 05 11 12 16 11 17 09 16 08 07 13 12 15 19 12 11 11 12 13
B B R R R M R R M R R R B B R R R B R R B
04 09 14 12 11 12 11 10 11 13 13 10 15 11 16 08 14
Determine los siguientes ítems:
(a) La variable de estudio.
Con la información determine lo siguiente:
17
(a) Elaboré una tabla de frecuencias relativas acumuladas. [06 - 10] 30
(b) Construya un polígono de frecuencias relativas acumuladas. [11 - 15] 20
(c) Interprete los resultados de la tabla de frecuencias determine si se lograron los objetivos de [16 - 20] 5
la cátedra.
Total 70
PREGUNTA 08:
Con la información determinar:
A continuación se presenta la tabla de distribución de frecuencias del (a) Si hay diferencia significativa entre el nuevo método y el método tradicional, en términos
coeficiente intelectual de estudiantes. porcentuales ¿Cuánto es?
Li Ls Yi ni Ni hi Hi (b) ¿Cuál es el porcentaje de estudiantes recuperables en ambos métodos?
88 92 5 (c) ¿Cuál es el porcentaje de estudiantes que tienen serios problemas de aprendizaje en el área de
104 13 0.200 comunicación en ambos métodos?
28 0.375 (d) Si el nuevo método proporciona mejores resultados que el método tradicional. ¿Explique el
porque?
3 0.075 0.775
(e) Evidencie la diferencia entre métodos de forma gráfica
5 36
2 38 PREGUNTA 10:
144 140 0.050 Se evalúa a 50 estudiantes de quinto grado de primaria en la asignatura de matemática, empleando
Total 40 la escala vigesimal [0, 20; pero el reporte de la calificación debe informarse según los códigos
Completar en la tabla los datos que faltan e interprete en función de la marca del intervalo y en D, C, B, A, AD y para efectos de la interpretación utilizar la equivalencia
función de la marca clase las frecuencias n2, n4, N2, N4; h2, h4, H2 y H4
cualitativa de la escala presentada en la tabla adjunta.
PREGUNTA 09: ESCALA DE MEDICIÓN
Se desea analizar que efectos tiene la aplicación de un nuevo método a un grupo de estudiantes del D Muy Bajo [00 - 05]
tercer grado de educación secundaria en la asignatura de Comunicación, que anteriormente se C Bajo [06 - 10]
aplicaba el método tradicional. Para establecer si hay alguna diferencia significativa se compara el B Regular [11 - 13]
nuevo método con el método habitual aplicado a otro grupo de estudiantes de similares A Bueno [14 - 16]
características en el área de Comunicación. Para realizar las mediciones de los efectos de los AD Muy Bueno [17 - 20]
métodos se aplica una evaluación a ambos grupos en forma simultánea, cuyos resultados se
presentan en las siguientes tablas de distribución: Los calificativos de la evaluación son los siguientes:
3 8 6 5 1 3 1 8 4 5
RESULTADOS DEL NUEVO MÉTODO EN EL GRUPO EXPERIMENTAL 0 1 19 17 5 16 0 18 12 11
Rendimiento Nº de Alumnos 7 5 16 19 13 17 16 20 7 19
[00 - 05] 7 12 7 10 3 2 11 18 14 0 17
[06 - 10] 20 6 1 11 8 4 9 19 10 9 3
[11 - 15] 34
[16 - 20] 9 Con los datos elaborar lo siguiente:
(a) Una tabla de distribución de frecuencias donde se haga visible la escala cualitativa y la
Total 70
cuantitativa
(b) Un reporte tomando como referencia los códigos D, C, B, A, AD.
RESULTADOS DEL MÉTODO TRADICIONAL (c) Un reporte que indique a donde están más concentrados los calificativos. ¿Si están
Rendimiento Nº de Alumnos concentrados para calificativos desaprobatorios? ó ¿Si están concentrados para
[00 - 05] 15 calificativos aprobatorios?
18
Mc2 - Madre | 135 54.66 |*********************************
Mc3 - Hermano(a) | 32 12.96 |********
PREGUNTA 11: Mc4 - Amiga | 71 28.74 |******************
Los ingresos por concepto de matricula de la Institución Educativa “Gran ----------------------------+-----------------+------------------------------------------------
16 . Sientes que tus padres:
Mariscal Andrés Avelino Cáceres” en el mes de enero y febrero del 2008, Spa1 - Te adoran
Spa2 - Te toleran
| 186
| 55
75.30 |**********************************************
22.27 |**************
son los siguientes: Los datos están expresados en soles. Spa3 - Les eres indiferente | 6 2.43 |**
----------------------------+-----------------+------------------------------------------------
936 776 548 793 651 653 901 880 563 940 697 949 17 . Capacidades que crees están en ti o has conquistado:
CQ01 - 1457 | 142 57.49 |***********************************
616 626 619 952 946 578 962 517 832 574 688 675 CQ02 - 1246 | 71 28.74 |******************
773 878 542 826 825 975 650 852 998 588 625 619 CQ03 - 2567 | 34 13.77 |*********
----------------------------+-----------------+------------------------------------------------
936 611 512 842 514 976 717 694 827 935 621 786 20 . Te sientes un miembro importante dentro de tu familia por que te escuchan y valoran:
Mif1 - Si | 200 80.97 |*************************************************
947 920 723 600 715 783 973 737 538 609 857 Mif2 – No | 47 19.03 |************
----------------------------+-----------------+------------------------------------------------
23 . Eres capaz de hacer las cosas y enfrentar los obstáculos a presentarse:
Con los datos realizar: Eoc1 - Si | 216 87.45 |***************************************************
(a) Una tabla de distribución de frecuencias con sus elementos. Eoc2 - No | 31 12.55 |********
----------------------------+-----------------+------------------------------------------------
(b) Elaborar un grafico apropiado con sus elementos esenciales. 24 . Registra las frases que se adaptan a tu rutina de vida:
(c) Interpretar las frecuencias absolutas máxima y mínima, así como las frecuencias h 2%, h4%, 3Mr1 - 1256 | 54 21.86 |**************
H2% y H4 %. 3Mr2 - 246
3Mr3 - 346
| 130
| 63
52.63 |********************************
25.51 |****************
(d) Si el gasto de mantenimiento de la institución Educativa es de 1500 soles mensuales, ----------------------------+-----------------+------------------------------------------------
¿Alcanzara el importe recaudado por concepto de matricula para cubrir los gastos de 27 . Te siente obligada por tus amigos a realizar algunas …,pero por no contraríales les das el
gusto
mantenimiento del año? ¿Justifique su respuesta? Orc1 - Siempre | 3 1.21 |*
(e) ¿Podrá ahorrar la institución Educativa a pesar de pagar los gastos de mantenimiento y gastos Orc2 - A veces | 83 33.60 |*********************
Orc3 - Nunca | 161 65.18 |****************************************
en refaccionar la infraestructura que asciende a 10000? ¿justificar su respuesta? ----------------------------+-----------------+------------------------------------------------

PREGUNTA 12:
Con la información adjunta en la tabla describir el perfil de estudiantes

TABLA Nº 01: Distribución de frecuencias de las variables del perfil Psico – Sociodemográfico y
el desarrollo integral de las alumnas del I.E. “Santa Teresa de La Inmaculada”, año IV. MÉTODOS PARA EL ANÁLISIS DESCRIPTIVOS DE DATOS CUANTITATIVOS
2007.
----------------------------+-----------------+------------------------------------------------
VARIABLES | FRECUENCIAS | GRÁFICO DE LAS MODALIDADES
INTRODUCCIÓN
IDENT MODALIDADES | EFEC. PORCE. | HISTOGRAMAS DE PUNTOS RELATIVOS Las tablas de frecuencias o cuadros estadísticos, los distintos tipos de gráficos y también la razón,
----------------------------+-----------------+------------------------------------------------ los índices, las proporciones, porcentajes y tasas que se han estudiado anteriormente, constituyen
9 . En la balanza de tu vida las características que más pesan son:
Bv1 - Las negativas | 23 9.31 |****** diversos modos de resumir información que sirven para transmitir las características principales de la
Bv2 - Las positivas | 73 29.55 |****************** información presentada en los datos y contienen elementos descriptivos que hacen innecesario el
Bv3 - Positiv/ Negativas | 151 61.13 |*************************************
----------------------------+-----------------+------------------------------------------------ examen de todos los datos.
11 . Registra 3 valores prioritarios que están ligados a tu convivencia: Las cifras descriptivas que se obtienen como función de una muestra (x 1, x2,…, xn); es decir, como
Vp1 - J, D h y solid,Lib | 207 83.81 |***************************************************
Vp2 - Eco,D h, L y solida | 40 16.19 |**********
función de un conjunto de datos (que representa un subconjunto de la población), se llama
----------------------------+-----------------+------------------------------------------------ Estadígrafo o Estadístico los cuales se clasifican en: Estadígrafos de posición, dispersión,
13 . Las relaciones familiares son: concentración y de forma. Los que se detallan a continuación.
Rf1 - Buenas | 142 57.59 |***********************************
Rf2 - Malas | 4 1.62 |**
Rf3 - Regulares | 101 40.89 |**************************
----------------------------+-----------------+------------------------------------------------
I. ESTADIGRAFOS DE POSICIÓN.
14 . Con quien tienes más confianza:
Mc1 - Padre | 9 3.64 |***

19
Son aquellos que describen la posición que ocupan la distribución de frecuencia con respecto a un m
valor de la variable. Se distinguen dos tipos: Los estadígrafos de tendencia central y los de �yi ni m
localización.
M ( y ) = y = i=1 = �hi ni
1. MEDIDAS DE POSICION:
n i =1

MEDIDAS DE TENDENCIA CENTRAL (1.2) PROPIEDADES DE LA MEDIA ARITMÉTICA


En estadística tiene importancia medir la tendencia central, lo que se consigue con los La media aritmética por su forma algorítmica cumple las siguientes propiedades:
“promedios”, los cuales son:
(1) Media Aritmética P 1: Si todos los valores observados son iguales a una constante, entonces la media
(2) Media Geométrica aritmética de este conjunto de datos es la misma constante. Es decir:
(3) Media Armónica x1 , x2 ,..., xn = b
(4) Media Cuadrática
(5) Media de Potencias Entonces:
(6) Mediana M ( x ) = M (b ) = b
(7) Moda
P : Si a cada valor de las observaciones x1 , x2 ,..., xn
2 se le suma o resta una
(1) MEDIA ARITMÉTICA POBLACIONAL
La media aritmética de una población finita de “N” elementos: x1 , x2 ,..., xN se denota por cantidad constante, la media aritmética del nuevo conjunto transformado
 y esta dado por el cociente de la suma de todos los valores de la variable entre el número yi = xi �b , es la media aritmética del conjunto original más o menos la
total de valores. Es decir: constante. Es decir:
y = M ( y ) = M ( x ) �b
N

x1  x2 ... xN � xi
= = i =1

N N P 3: Si a cada valor de un conjunto de observaciones x1 , x2 ,..., xn se le


(1.1) MEDIA ARITMÉTICA MUESTRAL multiplica por una constante diferente de cero, la media aritmética del conjunto
transformado yi = axi , es la media aritmética del conjunto original multiplicado por la
A.PARA DATOS NO TABULADOS. constante. Es decir:
La media o promedio de una muestra x1 , x2 ,..., xn de tamaño de “n” de una variable
esta dado por el cociente de la suma de todos los valores de la variable entre el
y= M(y)= aM(x)
numero total de valores. Es decir: P 4: La suma algebraica de las desviaciones de cada valor observado
n
x1 , x2 ,..., xn , con respecto a su media es cero. Es decir:
x1  x2 ... xn i=1 �xi a. PARA DATOS NO TABULADOS.
M ( x) = x = = n
n n �( xi  x ) = 0
B. PARA DATOS TABULADOS. i =1
b. PARA DATOS TABULADOS
Si los datos han sido clasificados en “m” clases en una tabla de frecuencias con m

marca de clase “ yi ”, la media aritmética esta dado por: �( yi  y )ni = 0


i =1

20
P 5: La suma de los cuadrados de las desviaciones de cada una de las observaciones a. PARA DATOS NO TABULADOS:
x1 , x2 ,..., xn con respecto a su media es mínima. Esta propiedad significa que si La media geométrica simple M G ó xG de n observaciones x1 , x2 ,..., x n positivas esta dada
por la raíz n – ésima del producto de los n valores observados, es decir:
“a” es cualquier valor, entonces:
n
xG = M G = n x1 . x2 .... x n = n C xi
a. PARA DATOS NO TABULADOS i=1
n n b. PARA DATOS TABULADOS:
�( x  x ) ��( x  a)
2 2
Si los datos están agrupados en clases, la media geométrica ponderada, es la raíz n – ésima del
i i producto de las marcas de clases elevadas a sus respectivas frecuencias, es decir:
i =1 i =1
n n n m n
b. PARA DATOS TABULADOS yG = n y11 . y 2 2 .... y mm = n C yi i
i=1
m m
(3) MEDIA ARMÓNICA:
�ni ( yi  y ) ��ni ( yi a )2
2
a. PARA DATOS NO TABULADOS:
i =1 i =1
La media armónica M H ó x H de n términos no nulos x1 , x 2 ,..., x n es el reciproco de la media
aritmética de los recíprocos de estos términos. Es decir:
P 6: Si x1 , x 2 ,..., x n y y1 , y 2 ,..., y n son dos conjuntos de observaciones de “n” valores,
1 n
cada uno de dos variables “x” e “y”, expresados en las mismas unidades, entonces: xH = M H = =
M ( x  y ) = M ( x)  M ( y ) 1 1 1 n 1
  ...  
P 7: En casos especiales, esto es, cuando es apropiado hacerlo, la media aritmética x1 x2 xn i =1 x
i
muestral se puede utilizar para estimar la cantidad total de una población, esta
n
propiedad indica que: b. PARA DATOS TABULADOS:
Total = Nx La media armónica para datos tabulados o media armónica ponderada se define por:
1 n
yH = M H = =
(1.2) MEDIA ARITMETICA A PARTIR DE SUB MUESTRAS. 1 m ni m ni
 
Este procedimiento tiene su base en que en muchas ocasiones hay la necesidad de obtener n i=1 yi i =1 y
i
muestras diferentes de una población, ya sea por cuestiones técnicas o por disponibilidad de
información. (4) MEDIA CUADRATICA
a. PARA DATOS NO TABULADOS:
Supongamos que de una población (o de dos poblaciones diferentes) se obtienen dos n 2
 xi
o más muestras de tamaño n cada una respectivamente. Sean x1 , x2 ,..., x las medias i =1
k k xC = M C ( x ) =
n
aritméticas de las muestras, entonces las medias asociadas a las n1  n2  ...  nk b. PARA DATOS TABULADOS:
m 2
n1 x1  n2 x2  ...  nk xk  ni yi
observaciones esta dado por: X = i =1
yC = M C ( y ) =
n1  n2  ...  nk n

(5) MEDIA DE POTENCIAS


(2) MEDIA GEOMÉTRICA
a. PARA DATOS NO TABULADOS:

21
n r (7) MODA
 xi La moda de una muestra x1 , x 2 ,..., x n es el valor de la variable que cuenta con una mayor
r i=1 frecuencia en una distribución de datos. Y se denota por M o = x%
xr = M r ( x ) = mo
n CALCULO DE LA MODA DE DATOS TABULADOS:
b. PARA DATOS TABULADOS: Cuando los datos están tabulados: la clase que contiene mayor frecuencia será la que
contiene a la moda y se llama clase modal.
m r (a) PARA VARIABLE DISCRETA
 n y En esta caso la moda se determina fijándose en el valor de la variable que mas se repite
r i i
y =M ( y) =
i =1 (frecuencia absoluta máxima)
r r n
(b) PARA VARIABLE CONTINUA
(6) MEDIANA La moda para la variable continua se calcula mediante la siguiente formula:
 n j n j 1 
Dado un conjunto de “n” observaciones x1 , x2 ,..., xn de la variable o característica X, se define la Mo = y C  
j 1  ( n j n j 1 )( n j n j 1 ) 
mediana de este conjunto de los valores; como aquel valor que no es superado, ni supera a más
de la mitad de las “n” observaciones arregladas en orden de magnitud creciente o decreciente.  1 
a. PARA DATOS NO TABULADOS: Mo = y C  
j 1
i. Si el tamaño de la muestra “n” es impar: ordenar en forma creciente o decreciente.  1 2 

x%= xme = Me = x n1 Donde :


( ) V = n j  n j 1
2 1
ii. Si el número de observaciones es par: la mediana es la semi suma de sus valores centrales. V2 = n j  n j 1
x n x n Donde:
( ) ( 1)
x%= xme = Me = 2 2
y j 1 : Límite inferior de la clase modal nj
2 C : Amplitud de la clase modal

b. PARA DATOS TABULADOS (VARIABLE CONTINUA):


nj : Frecuencia absoluta de la clase modal
Se calcula mediante la siguiente formula: n j1 : Frecuencia absoluta de la clase pre modal
�n �
�2  N j 1 � n j1 : Frecuencia absoluta de la clase post modal
Me = y j 1  C � �
�N j  N j 1 �
� � VENTAJAS DE LA MODA:
Donde: 1. La moda, se puede usar como una localización tanto para datos cualitativos como
y j1 : Limite real inferior del intervalo que contiene a Nj cuantitativos.
2. La moda no esta afectada por los valores extremos.
C : Amplitud de la clase mediana
Nj : Frecuencia absoluta acumulada de la clase mediana
RELACIÓN ENTRE MODA, MEDIA Y MEDIANA EN DISTRIBUCIONES SIMÉTRICAS Y
Nj-1 : Frecuencia absoluta acumulada de la clase pre mediana
ASIMÉTRICAS.
n : número de observaciones (tamaño de muestra)

22
1. En una distribución de frecuencias simétricas cuya representación grafica es acampanada y Sea x , x ,..., x un conjunto de observaciones de una variable o características x.
1 2 n

además unimodal; coinciden exactamente en el mismo valor; media, mediana y moda. Entonces para hallar Q 1:
x = Me = Mo 1. Se ordenan los datos en forma ascendente (o descendente): x (1) , x (2) ,..., x (n ) ó
2. Si la distribución tiene la forma acampanada, es unimodal, pero no tiene simetría, las tres
x (n ) , x (n 1) ,..., x 2 , x 1
medidas toman valores diferentes, y la mediana queda comprendida generalmente entre la
moda y la media aritmética: n 1
i. Si la distribución es más alargada para valores grandes de la variable (asimetría a la 2. Se localiza el punto de posición del valor correspondiente a la
derecha o positiva), entonces la situación general, es: 4
x > Me > Mo observación ordenada.
ii. Si la distribución es más alargada para valores pequeños de la variable (asimetría a n 1 Q1 = x
i. Si es un entero, entonces: n 1
 4 
izquierda o negativa), la situación general, es: 4
 

x < Me < Mo ii. Si


n 1
no es un entero, hacemos una interpolación lineal entre los dos valores
4
3. Si la distribución es moderadamente asimétrica y unimodal, se cumple aproximadamente la
correspondientes a las dos observaciones entre las cuales se encuentra la fracción.
relación:
x  Mo = 3(x  Me )
Para otro tipo de distribuciones de forma más complicada, no existen reglas fijas “a priori” sobre (b) PARA DATOS TABULADOS:
la disposición relativa de las tres medidas, debiéndose estudiar aisladamente cada caso. Si los datos están agrupados en clases, entonces Q1 se determina como sigue:
1. Se construye la tabla de frecuencias absolutas acumuladas “Menor que” N i.
Luego de está breve descripción ampliaremos la idea de la mediana para estudiar a n
otros estadígrafos que dividen el conjunto de datos en otras proporciones. Se identifica la clase que contiene a Q 1; con el siguiente procedimiento, se calcula
4
MEDIDAS DE LOCALIZACIÓN n
CUANTILES valor que se ubica entre las frecuencias absolutas acumuladas N j 1  <N j ; De
Los cuantiles es una generalización de la definición de mediana. Así como la mediana divide al 4
conjunto de datos en dos partes, con igual número de elementos cada una; esta idea 2. donde se puede presentar los casos:
proyectada al dividir el conjunto de datos en cuatro partes, diez partes, cien partes, define al n
cuantil. Los principales son: i. Si N j 1 = el primer cuartil es Q1 = y j 1
4

(1) CUARTIL Donde y j 1 es el límite inferior de la clase que contiene a Q 1


(2) DECILES
n
(3) PERCENTILES ii. Si N j 1 < , entonces el primer cuartil debe encontrarse dentro del intervalo y j 1 , y j ,
4
(1) CUARTILES:
DEFINICIÓN: Los cuartiles son valores que dividen a un conjunto de datos ordenados en por lo tanto Q1 se debe localizar a una distancia “d” de y j 1 , expresándose como
forma ascendente o descendente en cuatro partes iguales, y se denotan por: Q i ; i = 1,2,3 Q1 = y j 1  d .
Son tres valores con las siguientes características:
Q 1: Primer cuartil: Es un valor referencial donde el 25% de las observaciones tienen El valor de “d” se calcula mediante regla de tres simples, suponiendo que las
valores menores o iguales a Q 1, en tanto que el 75% de observaciones restante tiene valores observaciones están uniformemente distribuidas en todo el intervalo. Es decir:
superiores a Q 1. n
(a) PARA DATOS NO TABULADOS: Si en una amplitud c j hay N j  N j 1 observaciones. En qué amplitud “d” habrá  N j 1
4
; Es decir:
23
c j  N j  N j 1 Q3 = x

3( n 1 ) �
�4 �
n � �
d   N j 1
4 3(n  1)
ii. Si no es un entero, hacemos una interpolación lineal entre los dos
n  4
 4  N j 1  valores correspondientes a las dos observaciones entre las cuales se encuentra la
Donde d =c j   fracción.
N j  N j 1  (b) PARA DATOS TABULADOS
  Si los datos están agrupados en clases, entonces Q3 se determina como sigue:
n  1. Se construye la tabla de frecuencias absolutas acumuladas “Menor que” N i.
 4  N j 1  2. Se identifica la clase que contiene a Q 3; con el siguiente procedimiento, se calcula
Luego : Q 1 = y j 1  c j   3n
N j  N j 1  valor que se ubica entre las frecuencias absolutas acumuladas
  4
n
Donde: N j 1  <N j ; De donde se puede presentar los casos:
4
y j1 : Limite real inferior del intervalo que contiene a Nj
3n
C: Amplitud de la clase que contiene a Q 1 (1) Si N j 1 = el tercer cuartil es Q 3 = y j 1
4
Nj: Frecuencia absoluta acumulada de la clase que contiene Q 1
Nj-1: Frecuencia absoluta acumulada inmediata anterior a la clase de Q 1 Donde y j 1 es el límite inferior de la clase que contiene a Q3
n: número de observaciones (tamaño de muestra)
3n
N j 1 <
Q 2: Segundo cuartil: El segundo cuartil coincide con la mediana: Es decir: Q 2 = Me (2) Si 4 , entonces el tercer cuartil debe encontrarse dentro del intervalo
Q 3: Tercer cuartil: Es un valor referencial donde el 75% de las observaciones tienen y j 1 , y j y j 1
valores menores o iguales a Q 3, en tanto que el 25% de observaciones restante tiene valores  , por lo tanto Q3 se debe localizar a una distancia “d” de ,
superiores a Q 3 Q 3 = y j 1  d
(a) PARA DATOS NO TABULADOS expresándose como .
Sea x 1 , x 2 ,..., x n un conjunto de observaciones de una variable o características X.
El valor de “d” se calcula mediante regla de tres simples, suponiendo que las observaciones están
Entonces para hallar Q 3 uniformemente distribuidas en todo el intervalo. Es decir:
1. Se ordenan los datos en forma ascendente (o descendente): x (1) , x (2) ,..., x (n ) ó n
Si en una amplitud c j hay N j  N j 1 observaciones. En qué amplitud “d” habrá  N j 1 ; Es
4
x (n ) , x (n 1) ,..., x 2 , x 1
decir:
3(n  1)
2. Se localiza el punto de posición del valor correspondiente a la observación
4
ordenada.
3(n  1)
i. Si es un entero, entonces:
4

24
c j  N j  N j 1 i (n  1)
ii. Si no es exacto, Di se obtiene interpolando linealmente entre los dos
n 10
d   N j 1
4 valores correspondientes a las dos observaciones entre las cuales se encuentra la
 n  fracción.
N j 1
 4 

Donde d = c j   (b) PARA DATOS ABULADOS:
N j  N j 1
 Para datos tabulados se siguen los siguientes pasos:
 
1. Se construye la tabla de frecuencias absolutas acumuladas “Menor que” N i.
 n  in
N j 1
 4 
 2. Se identifica la clase que contiene a D i; con el siguiente procedimiento, se calcula 10
Luego : Q 3 = y j 1  c j  
N j  N j 1
 in
  valor que se ubica entre las frecuencias absolutas acumuladas N j 1  <N j ; De donde
10
Donde:
se puede presentar los casos:
y j1 : Limite real inferior del intervalo que contiene a Nj
in
C: Amplitud de la clase que contiene a Q 3 i. Si N j 1 = el decil es D i = y j 1
10
Nj: Frecuencia absoluta acumulada de la clase que contiene Q 3
Nj-1: Frecuencia absoluta acumulada inmediata anterior a la clase de Q 3 Donde y j 1 es el límite inferior de la clase que contiene a Di
n : número de observaciones
in
ii. Si N j 1 < , entonces el decil debe encontrarse dentro del intervalo y j 1 , y j , por lo
(2) DECILES 10

DEFINICIÓN: Los valores que dividen a un conjunto de datos ordenados en forma ascendente tanto Di se debe localizar a una distancia “d” de y j 1 , expresándose como
(o descendente) en diez partes iguales se llaman DECILES y se representan por:
.
D i = y j 1  d
D i ; i = 1,2,...,9
El valor de “d” se calcula mediante regla de tres simples, suponiendo que las
D 1: PRIMER DECIL: Es el valor referencial que deja 10% de las observaciones menores o observaciones están uniformemente distribuidas en todo el intervalo. Es decir:
iguales a él y el 90% superiores a él.
Si en una amplitud c j hay N j  N j 1 observaciones. En qué amplitud “d” habrá
D 2: SEGUNDO DECIL: Es el valor referencial que deja el 20% de las observaciones menores
o iguales a él y el 80% de las observaciones mayores a él. in
 N j 1 ; Es decir:
10
Análogamente ocurre con los deciles D3,.......D9. El decil 8, por ejemplo, deja el 80% del conjunto
de datos menores o iguales a él, y el 20% de las observaciones superiores a él.

CÁLCULO DE LOS DECILES:


(a) PARA DATOS NO TABULADOS:
Cuando los datos no están tabulados primero se ordenan en forma ascendente o
descendente las observaciones. Luego se localiza la posición del valor correspondiente a
i (n  1)
la observación ordenada. Entonces:
10
i (n  1) Di = x
i. Si es exacto, �
i ( n 1) �
� 10 �
10 � �

25
c j  N j  N j 1 39 49 59 64 69 74 78 84
in
d   N j 1 Con la información realizar lo siguiente:
10
(d) una tabla de frecuencias
 in  (e) Elaborar un grafico para la frecuencias relativas porcentuales
 N j 1
 10  (f) Interprete la frecuencia H2 y H4
Donde d =c j  
N j  N j 1

  2. Los 40 estudiantes de la serie 200 de la Escuela Profesional de Educación Primaria
 in  matriculados en Estadística Aplicada, rindieron su primer examen parcial obteniendo los
 N j 1 siguientes resultados:
 10 
Luego : Di = y j 1  c j   08 13 08 14 05 11 12 16 11 17
N j  N j 1
 09 16 08 07 13 12 15 19 12 11
 
11 12 13 04 09 14 12 11 12 11
12 10 11 13 13 10 15 11 16 08
Donde:
y j1 : Limite real inferior del intervalo que contiene a Nj Con la información determine lo siguiente:
(d) Elaboré una tabla de frecuencias relativas acumuladas.
C: Amplitud de la clase que contiene a Di (e) Construya un polígono de frecuencias relativas acumuladas.
Nj : Frecuencia absoluta acumulada de la clase que contiene D i (f) Interprete los resultados de la tabla de frecuencias determine si se lograron los
Nj-1 : Frecuencia absoluta acumulada inmediata anterior a la clase de D i objetivos de la cátedra.
n : número de observaciones
3. Supongamos que la población de notas en una determinada materia son: 11, 12, 13, 14,
(3) PERCENTILES 15. con la información calcular:
Hay 99 percentiles que se denotan: P 1, P2, P3,.......,P98, P99. Así P90, por ejemplo, deja por debajo (a) Media poblacional.
de él el 90% de los elementos. El procedimiento de cálculo es similar a la de los Cuartiles y (b) Seleccione 10 muestras diferentes de tamaño 2 y con cada una calcular la media
Deciles. aritmética muestral.
La fórmula para realizar el cálculo del percentil Pi , Será: (c) Determinar cuántas muestras proporcionan una estimación exacta de la media
 in  poblacional.
 100  N j 1  4. Los resultados de un examen practicado a 20 estudiantes en un curso de matemáticas, en
Pi = y j 1  c j   orden ascendente son: 39, 46, 57, 65, 70, 71, 71, 72, 72, 75, 77, 79, 81, 84, 84, 87, 93, 94,
 N j  N j 1  97y 97 puntos. Determine:
  (a) La media aritmética de los datos
PRÁCTICA 04: MEDIDAS DE TENDENCIA CENTRAL Y DE LOCALIZACIÓN (b) Si a cada observación de la muestra se le suma 3 puntos. ¿Cuáles es el
promedio del nuevo conjunto de datos?
INSTRUCCIÓN: Lee cada una de las preguntas y responde puntualmente lo que se solicita. (c) Supongamos que la calificación se transformará a la escala de 0 a 20. ¿Cuál es
el nuevo promedio.
1. Los datos que se presentan a continuación son los gastos de 5. La información que se presenta a continuación son el número de faltas de los docentes
mantenimiento diarios de la I.E. “Santa Teresita” durante el año 2006. 1, 2, 3, 4, 5. Con los datos determine:
31 41 53 61 65 69 74 78 (a) La media aritmética.
34 41 54 62 68 69 75 78 (b) La media geométrica
34 48 55 63 68 70 76 79 (c) La media armónica
38 48 56 64 68 73 77 83 (d) La media cuadrática.
(e) La media cúbica.
26
(f) Ordene en forma ascendente los promedios. Dependiendo del tipo de diferencia usada, se obtienen distintas expresiones que
6. Supongamos que se tiene una Institución Educativa que tiene dos locales en lugares entregan visiones parciales de la forma en que los datos varían.
diferentes, de los cuales se selecciona una muestra de recibos en el local A: donde hay un Las medidas de dispersión son de dos tipos:
gasto mensual de luz de: 150, 200, 180, 190, 160 soles y en el local “B” registra un pago de
luz de: 250, 150, 230, 200, 280 soles. Con los datos determinar: A) MEDIDAS DE DISPERSIÓN ABSOLUTAS
(a) Cuanto es el pago promedio mensual por concepto de consumo de luz de la Las medidas de dispersión absolutas se caracterizan por ser valores expresados en las mismas
Institución Educativa. unidades de la variable en estudio. Dependen de las unidades de medida
(b) Cual es la diferencia entre los pagos promedios por consumo de luz. Estas son:
(c) Estimar cuanto dinero pagará en un año por consumo de luz. (1) RECORRIDO DE LA VARIABLE ( R ):
7. A continuación se presenta la tabla de distribución de frecuencias del Recorrido de la variable ó rango (Intervalo de variación)
coeficiente intelectual de estudiantes. Dada una serie de valores x1, x2, ..., xn, su recorrido “R” es la diferencia aritmética entre el
máximo y el mínimo de estos valores:
Li Ls Yi ni Ni hi Hi hi%
88 96 92 5 5 0.125 0.125 12.50
R = x máx  x mín
96 104 100 8 13 0.200 0.325 20.00
104 112 108 15 28 0.375 0.700 37.50 (2) RECORRIDO INTERCUARTÍLICO ( R I ):
Se define como la diferencia aritmética entre el tercer cuartil y primer cuartil ó también la
112 120 116 3 31 0.075 0.775 7.50
diferencia entre los P75 y P25. Llamado también intervalo intercuartil.
120 128 124 5 36 0.125 0.900 12.50
128 136 132 2 38 0.050 0.950 5.00 RI = Q 3 Q1 = P75  P25
136 144 140 2 40 0.050 1.000 5.00
(3) INTERVALO SEMI–INTERCUARTILICO (Q D):
Total 40 1.000 100.00
Definida como la mitad del recorrido intercuartil. Conocida también como desviación cuartil.
Con la información determinar:
(a) La media aritmética
(b) La media geométrica. Q 3 Q1
QD =
(c) La media armónica 2
(d) La media cuadrática.
(e) La media cúbica. (4) INTERVALO INTERDECIL ( R ID ):
(f) La mediana Es la diferencia aritmética entre los deciles noveno y décimo, llamada desviación del cuartil.
(g) La moda
(h) Que tipo de asimetría tienen los datos comparando la media, mediana y moda.
RID = D 9  D1 = P90  P10
(i) Calcular los tres primeros cuartiles
(j) Calcular el Decil uno, el Decil cinco y el Decil nueve. (5) DESVIACIÓN MEDIA ABSOLUTA ( D M ):
(k) Calcular el Percentil diez, cincuenta y noventa. Sea x1, x2, ..., xn, una muestra de tamaño “n” de una variable, la desviación media absoluta es la
(l) Calcular las siguientes constantes: media aritmética de los valores absolutos de las desviaciones de los valores observados respecto
Q 3  2Q 2 Q1 Q 3 Q1 de la media aritmética.
C As = K3 =
Q 3 Q 1 2(P90  P10 ) (a) PARA DATOS NO TABULADOS:
n

x i x
2. ESTADÍGRAFOS DE DISPERSIÓN DM = D X = i =1

Las medidas de dispersión nos indican si una serie de valores de la variable observada son muy n
cercanos entre sí o por el contrario son muy dispersos.

27
(b) PARA DATOS TABULADOS: Sea x1, x2, ..., xn, una muestra de tamaño “n” de una variable, se define como la media
m aritmética del cuadrado de las desviaciones de los valores observados con respecto a su
y i  y ni media. Denotado por V(x).
DM = D y = i =1
n
Donde: (a) PARA DATOS NO TABULADOS:
n
m: número de clases  (x  x )
2

ni: frecuencia absoluta de la clase i i =1 i


V (x ) = M ( x  x ) 
2 2
=S =
x
yi: marca de clase n

(6) DESVIACIÓN MEDIANA ABSOLUTA (D Me): (b) PARA DATOS TABULADOS:


Sea x1, x2, ..., xn, una muestra de tamaño “n” de una variable, la desviación mediana absoluta m 2
 n (y  y )
es la media aritmética de los valores absolutos de las desviaciones de los valores observados i =1 i i
respecto de la mediana. V (y ) = M ( y  y ) 
2 2
=S =
y
n
Donde:
(a) PARA DATOS NO TABULADOS: m: número de clases
ni: frecuencia absoluta de la clase i
n

x i  Me yi: marca de clase


La formula anterior se puede escribir de la siguiente forma:
DMe = i =1
2 m 2
n V ( y ) = S y =  hi (y i  y )
i =1

(b) PARA DATOS TABULADOS:


n
NOTA: Si conocemos la media poblacional  y sustituimos en la siguiente formula:
y i  Me n i
( x  x ) 
2 2
n
 (x  x )
i =1 i
2

DMe = i =1 V (x ) = M =S =
x
n n
se cumple la siguiente relación:
n 2 n 2
(7) VARIANZA Y DESVIACIÓN TÍPICA:  (x  x ) <  (x   )
i =1 i i =1 i
7.1 VARIANZA POBLACIONAL: n 2 n 2
 (x  x )  (x   )
Sea x1, x2, ..., xN, una población de tamaño N de una variable, La varianza poblacional se La misma que implica que hay una diferencia entre i =1 i i =1 i
define como la media aritmética del cuadrado de las desviaciones de los valores
<  2
n n
observados con respecto a su media  . Y se denota por: y para solucionar esta diferencia de estimación de la varianza muestral es necesario
N 2 realizar una corrección apropiada
 (x   )
2 2 i =1 i n 2 n 2 n
 = M ( x i   )  = 2
 N
 (x  x )
i =1 i
 (x  x )
i =1 i
 (x   )
i =1 i 2
  
n n 1 n

7.2 VARIANZA DE UNA MUESTRA:

28
n 2 n 2
 (x  x )  (x  x ) Si x 1 y x 2 son las medias aritméticas de dos submuestras de tamaño n1 y n 2
La diferencia entre i =1 i i =1 i es grande para muestras pequeñas,
y respectivamente y S 12 , S 22 sus varianzas correspondientes. Entonces la varianza de la
n n 1
y es mínima para muestras grandes, prácticamente son iguales. Entonces para muestras muestra de tamaño n = n1  n 2 está dado por:
grandes n  60 , puede usarse cualquiera de las formulas. Para muestras pequeñas se 2 2 2 2
(n  1) s  (n  1) s  n (x  x ) n (x x)
n 2 S
2
=
1 1 2 2 1 1 2 2
 (x  x )
usa V ( x ) = M ( x  x ) 2  = S 2 i =1 i , llamada varianza corregida. n 1
=
  x
n 1
donde:
n1 x 1  n 2 x 2
x =
Finalmente las varianzas corregidas son: n
n 2
 (x  x ) En general se tiene:
Para datos no tabulados: V '( x ) = M ( x  x )2  = S '2 i =1 i Para datos tabulados: n n
= 2 2

x  n 1 2
 (n  1) s
i i  n (x  x )
i i
i =1 i =1
S = 
m 2
 n (y  y ) n 1 n 1
2 2 i i
V '(y ) = M ( y  y )  = S ' y =
i =1 donde:
  n 1 k
 n x
i =1 i i
x =
7.3. PROPIEDADES DE LA VARIANZA: n
P1: La varianza de un conjunto de observaciones x 1 , x 2 ,..., x n , siempre es un número no Esta varianza total se puede descomponer en:
negativo. Es decir: INTERVARIANZA: Mide la variabilidad entre los estratos o submuestras.
V (x )  0 k 2
 n (x  x )
2 i =1 i i
P2: La varianza de una constante es cero. Esto significa, que si x 1 = x 2 = ... = x n = b sb =
n 1
constante, entonces:
V ( x ) =V ( b ) = 0
INTRAVARIANZA: Mide la variabilidad dentro de los estratos.
k 2
P3: Si a cada observación x 1 , x 2 ,..., x n se adiciona o se le resta una constante “b > 0”, la  (n  1) s
2 i =1 i i
sw =
varianza del nuevo conjunto de valores y 1 , y 2 ,..., y n donde y i = xi b , i = 1, 2, …,n, n 1
coincide con la varianza del conjunto original. Es decir: 8. DESVIACIÓN TÍPICA O DESVIACIÓN ESTÁNDAR.
V ( y ) =V ( x  b ) =V ( x ) La desviación estándar es la media de distancias que tienen los datos respecto de su media
aritmética, expresada en las mismas unidades que la variable.
P4: Si cada valor de un conjunto x 1 , x 2 ,..., x n se multiplica por una constante “a”, la La desviación estándar es simplemente el "promedio" esperado con respecto de la media
varianza del nuevo conjunto de valores y 1 , y 2 ,..., y n , donde y i = ax i , i = 1, 2, …,n, es aritmética, o indica que tan distante están los puntos de la media.
La desviación estándar se define como la raíz cuadrada positiva de la varianza: Es decir:
igual a la varianza del conjunto original multiplicada por el cuadrado de la constante. Es
2
decir: D (x ) = s x = v (x ) = s x
2
V (y ) = a V (x )
7.4. VARIANZA CALCULADA A PARTIR DE SUB MUESTRAS. PROPIEDADES DE LA DESVIACIÓN TÍPICA:
P1: La desviación típica de un conjunto de observaciones x 1 , x 2 ,..., x n , siempre es un número no
negativo. Es decir

29
D (x ) = s > 0 X
máx
P2: La desviación típica de una constante es cero. C .A =
X
D (c ) = s c = 0 mín
2. RECORRIDO RELATIVO:
P3: Si a cada observación x 1 , x 2 ,..., x n se adiciona o se le resta una constante “b > 0”, la Se define como el cociente del recorrido de la variable entre la media aritmética, Es decir, es el
desviación típica del nuevo conjunto de valores y 1 , y 2 ,..., y n donde y i = xi b , i = 1, 2, número de veces que contiene el recorrido de la variable a la media aritmética.
X X R
…,n, coincide con la desviación típica del conjunto original. Es decir: RR =
máx mín
=
s y = s x b = s x x x

P4: Si cada valor de un conjunto x 1 , x 2 ,..., x n se multiplica por una constante “a”, la desviación 3. RECORRIDO SEMI – INTERCUARTILICO RELATIVO:
típica del nuevo conjunto de valores , donde
y 1 , y 2 ,..., y n , i = 1, 2, …,n, es igual a
y i = ax i Definida como el cociente del intervalo semi – intercuartil entre la media aritmética. Es decir,
cuantas veces contiene la desviación cuartil a la media aritmética.
la desviación típica del conjunto original multiplicada por el valor positivo (valor absoluto) de la
constante. Es decir: (Q 3  Q1 ) / 2 QD
RQ D = =
s y = s ax = a s x x x

4. COEFICIENTE DE VARIACIÓN:
NOTA:
El Coeficiente de Variación (CV) representa el número de veces que la desviación típica
La desviación estándar tiene su aplicabilidad para confeccionar intervalos confidenciales. Es
contiene a la media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión y menor
decir:
la representatividad de la media.
INTERVALO CONFIDENCIAL PARA LA MEDIA:
s
CON UNA DESVIACIÓN : x s CV =
x
CON DOS DESVIACIONES : x  2s Generalmente el coeficiente de variación se expresa en porcentaje para su interpretación.
3. MEDIDAS DE FORMA DE LA DISTRIBUCIÓN
CON TRES DESVIACIONES : x  3s
La distribución de datos observados desde el punto de vista gráfico permite determinar como están
CON CUATRO DESVIACIONES : x  4s distribuidos los datos a lo largo del eje horizontal, así como la altura alcanzada por la distribución
sobre el eje vertical. Esta simple inspección, intuitivamente forma la idea, de cual es la tendencia
TEOREMA DE TCHEBYSHEV: Dado un conjunto de observaciones x 1 , x 2 ,..., x n , entre la de los datos, diferenciando dos medidas conocidas factibles de medir, estas son: La Asimetría y
Apuntamiento o Curtosis de la distribución.
1
media aritmética y  ks , existe por lo menos, el 100(1 
2
)% con k 1 de las
k ASIMETRÍA:
observaciones sin que importe como se distribuye el conjunto de datos. Es la deformación horizontal de las distribuciones de frecuencias.
En las diferentes distribuciones se puede observar sobre el eje horizontal los siguientes tipos
de forma:
B) MEDIDAS DE DISPERSIÓN RELATIVAS
Las medidas de dispersión relativas se caracterizan por ser valores expresados Distribución Simétrica, si se le puede doblar a lo largo del eje vertical de manera que
independientemente de las unidades en que se expresa la variable en estudio. coincidan los dos lados.
Distribución Asimétrica Positiva o a la derecha , si tiene una ramificación más extendida
1. COEFICIENTE DE APERTURA: hacia la derecha o hacia valores grandes de la variable.
Se define como el cociente entre el valor máximo y el mínimo del recorrido de la variable. Es Distribución Asimétrica Negativa o a la izquierda, si tiene una ramificación más
decir, es el número de veces que contiene el valor máximo al mínimo. extendida hacia la izquierda o hacia valores pequeños de la variable.

30
Existen algunos algoritmos para calcular la deformación de la distribución sobre eje Si, C As > 0 , la distribución es asimétrica positiva o sesgada hacia la derecha.
horizontal; en este contenido se realizará el cálculo mediante los cuantiles.
Si, C As = 0 , la distribución es simétrica.
Si, C As < 0 , la distribución es asimétrica negativa o sesgada hacia la izquierda.

APUNTAMIENTO O CURTOSIS:
Es la medida de deformación vertical de una distribución de frecuencias, es la medida de
apuntamiento o achatamiento de una distribución. (Indica la menor o mayor altura del máximo
central)
En la distribución de los datos se puede presentar los siguientes casos de apuntamiento:

Si, la distribución de datos presenta un apuntamiento muy pronunciado o más apuntada que la
(a) COEFICIENTE DE ASIMETRÍA EN FUNCIÓN DE CUARTILES: normal, se llama LEPTOCÚRTICA.
Si, la distribución de datos presenta un apuntamiento moderado o apuntamiento normal, se
Q  2Q  Q llama MESOCÚRTICA.
c = 3 2 1
As Si, la distribución de datos presenta menos apuntamiento que la normal o achatada, se llama
Q  Q1
3 PLATICÚRTICA.

INTERPRETACIÓN DEL COEFICIENTE DE ASIMETRÍA:


Si, C As > 0 , la distribución es asimétrica positiva o sesgada hacia la derecha.

(b) COEFICIENTE DE ASIMETRÍA EN FUNCIÓN DE PERCENTILES.

P  2P  P
C = 90 50 10
EL CÁLCULO DE LA CURTOSIS EN FUNCIÓN DE LOS CUANTILES.
As P P
90 10 Q Q
k = 3 1
INTERPRETACIÓN DEL COEFICIENTE DE ASIMETRÍA: 2(P  P )
90 10
Si, C As = 0 , la distribución es simétrica. PRÁCTICA 05: MEDIDAS DE DISPERSIÓN Y DE DEFORMACIÓN DE LA
DISTRIBUCIÓN
Si, C As < 0 , la distribución es asimétrica negativa o sesgada hacia la izquierda.
INSTRUCCIÓN: Analiza las preguntas y responde aplicando las medidas de tendencia, dispersión y
de deformación

INTERPRETACIÓN DEL COEFICIENTE DE CURTOSIS “K”: 1. La siguiente tabla de distribución de frecuencias presenta el comportamiento del proceso de
Si, k > 0.263 , la distribución es LEPTOCÚRTICA. aprendizaje de estudiantes evaluados en un trabajo dirigido por el Docente cuyo calificativo es
Si, k = 0.263 , la distribución es MESOCÚRTICA. de 0 a 75
Si, k < 0.263 , la distribución es PLATICÚRTICA
Li-Ls Ym ni hi Ni Hi
05 - 15 10 8 0.04 8 0.04

31
15 - 25 20 20 0.10 28 0.14 ejecutarlo selecciona al azar un centro educativo y de el selecciona una muestra de 5 alumnos,
25 - 35 30 42 0.21 70 0.35 para hacer mediciones de la frecuencia cardiaca. Estas son: 130, 127, 132, 132, 129. Hallar la
35 - 45 40 60 0.30 130 0.65 varianza muestral y luego la varianza corregida.
45 - 55 50 42 0.21 172 0.86
55 - 65 60 20 0.10 192 0.96 5. Los datos que se muestran en la siguiente tabla son los egresos semanales de la Institución
65 - 75 70 8 0.04 200 1.00 Educativa “PULGARCITO”, por concepto de mantenimiento de equipos e infraestructura y
Total 200 1.00 servicios básicos.

Con los datos realizar lo siguiente: Li - Ls Ym ni


(a) Calcular la media muestral. 00 - 100 50 5
(b) Calcular las medidas de dispersión absolutas y relativas. 100 – 200 150 10
(c) Calcular las medidas de asimetría y apuntamiento. 200 - 300 250 18
(d) Interpretar cada uno de los estadígrafos de los ítems anteriores 300 - 400 350 22
400 - 500 450 5
500 - 600 550 2
2. Dos empresas que compiten en el mismo rubro tienen la siguiente distribución de sueldos en el 600 - 700 650 1
2006. Total 63
Empresa “A”
sueldos ni Con la información, calcular e interpretar los siguientes estadígrafos:
150-180 30 (a) La variabilidad de los datos
180-210 40 (b) El coeficiente de variación
210-240 20 (c) La asimetría y el apuntamiento de la distribución de los datos
Total 90 (d) Elaborar intervalos confidenciales para el promedio aplicando el teorema de
Empresa “B” TCHEBYSHEV
sueldos ni
160-190 30 6. Del ejercicio número (2) determine el coeficiente de variación de cada una de las empresas y
190-220 50 compárelos, para luego escribir algunas observaciones.
220-250 40
Total 120
Con la información realice lo siguiente:
Considere que las dos muestras provienen de la misma población y estime la media total
de los sueldos de los obreros y la varianza total, e intérprete los resultados.

3. Consideré que las siguientes notas con respecto a un curso corresponden


a toda la población de notas: 11, 12, 13, 14, 15, 16. las mismas que tienen como media
poblacional  = 13.5 . Seleccione una muestra de tamaño n = 3, y pruebe la siguiente relación.

n 2 n 2
 (x  x ) <  (x   )
i =1 i i =1 i 4. DISTRIBUCIONES BIDIMENSIONALES

4. El programa Sistema Integral de salud “SIS” desarrolla asistencia en las Instituciones INTRODUCCIÓN:
Educativas y hace un programa piloto para el despistaje de corazón en los estudiantes, para En la naturaleza investigamos unidades de estudio o unidades experimentales de las que nos
interesa dos o más características.
32
Por ejemplo, en un estudiante observamos la habilidad mental con el rendimiento rectangular donde las k modalidades de X: x1, x2, …, xk representan a las filas y las ℓ
académico; donde a la variable habilidad mental se puede representar por “X” y a la variable modalidades de Y: y1, y2, …, yℓ representan a las columnas.
rendimiento académico por “Y”, de tal forma que al asociar ambas variables mediante el par
ordenado (x,y) se construye una variable bidimensional que expresa la observación DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS ABSOLUTAS
simultánea de la habilidad mental y rendimiento académico en un estudiante. Presentamos a continuación dos variables X e Y de naturaleza discreta, donde:
En efecto, estadísticamente interesa estudiar de la variable bidimensional dos aspectos X : x , x ,..., x ,..., x
importantes: 1 2 i k
(a) Las distribuciones bidimensionales de frecuencias, que se pueden presentar mediante Y : y , y ,..., y ,..., y l
tablas bidimensionales de frecuencias y la reducción de datos bidimensionales a través de 1 2 j
estadígrafos o medidas de resumen. Luego se organizan las modalidades de las variables en una tabla de doble entrada,
(b) Elaborar o construir modelos asociando las variables para medir la relación entre ellas; formando un arreglo rectangular donde en la intersección de la i – ésima fila con la j – ésima
estos modelos determinan la dependencia entre variables. columna, se ubica la frecuencia nij , que indica cuantas veces se presentan
1. TABLAS BIDIMENSIONALES DE FRECUENCIAS: simultáneamente la modalidad x i y la modalidad y j .
En la tabulación de la variable bidimensional (x,y)
se puede presentar una Y
combinación de variables unidimensionales según su naturaleza, las que y1 y2 … yj … yl n i.
X
determinan la siguiente clasificación: x1 n11 n12 … n1j … n1l n1.
TIPOS VARIABLES (x,y) x2 n21 n22 … n2j … n2l n2.
Dos Categórica / Categórica
característica Ejemplo:
.
s cualitativas Sexo y color de pelo . … … … … … … …
Discreta / Discreta .
Ejemplo: xi ni1 ni2 nij nil ni.
Número de personas y número de .
habitaciones . … … … … … … …
Dos
Continua / Continua .
característica
Ejemplo: xk nk1 nk2 … nkj … nkl nk.
s
Perímetro craneal y perímetro toráxico n .j n.1 n.2 … n.j … n.l n..
cuantitativas
Discreta / Continua Donde:
Ejemplo: l
Pulsaciones y temperatura n =  n es la suma total de las frecuencias absolutas n ij según el índice j
i . j =1 ij
Categórica / Discreta k
Una Ejemplo: n =  n es la suma total de las frecuencias absolutas n ij según el índice i
. j i =1 ij
cualitativa y Nivel educativo y número de hijos
una Categórica / continua k l k l
n.. =   n ij =  n i . =  n. j = n es la suma total de las frecuencias absolutas nij
cuantitativa Ejemplo: i =1 j =1 i =1 j =1
Profesión y ingreso económico según los índices i y j, así como también la suma total de los totales n i. y n .j

En la construcción de la tabla de distribución de frecuencias bidimensionales primero se OBSERVACIONES:


determina las categorías de la variable “X” e “Y” que implícitamente se genera un arreglo (a) La frecuencia absoluta n i. es el número de observaciones que presenta la modalidad
o valor xi de la característica X, independiente de las modalidades o valores de la

33
característica Y. De la misma forma, n .j es el número de observaciones que n
.j k
corresponden a la modalidad o valor yj de la característica E independiente de las h = = h
modalidades o valores de la variable X. .j n i =1 ij
(b) Si la naturaleza de la variable X (y/o variable Y) es continua, x i (y/o yj) representara la k l
marca de clase número i o j, de tal manera que se reducirá el caso continuo al caso  hi . =  h. j = 1
discreto, de la misma forma como se estudio en las variables unidimensionales. i =1 j =1
(c) Si las variables X e Y son cualitativas, la tabla de distribución bidimensional se llama TABLA (c) En algunas situaciones de acuerdo a objetivos específicos, podrá definirse las
DE CONTINGENCIA. frecuencias relativas con relación al total de cada columna o de cada fila. Es decir se
tendrá:
DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS RELATIVAS n ij nij
DEFINICIÓN 01: Se llama frecuencia relativa o simplemente frecuencia de la pareja de y
valores o modalidades xi o yj a la proporción de observaciones que presentan n n
i. .j
simultáneamente los valores o modalidades xi e yj
DISTRIBUCIÓN MARGINALES
n
Es decir: h = ij
ij n DISTRIBUCIÓN MARGINAL DE “X”
La tabla de distribución de frecuencias relativas es la siguiente: Consideremos la columna marginal (columna de los totales horizontales) de la tabla de doble
entrada. Las frecuencias absolutas ni. definen lo que se denomina DISTRIBUCIÓN MARGINAL
Y DE “X”. Es una distribución de una sola característica:
y1 y2 … yj … yl h i. l k
X n =  n y  n = n.. = n
i . j =1 ij
x1 h11 h12 … h1j … h1l h1. i =1 i .
x2 h21 h22 … h2j … h2l h2. La frecuencia relativa marginal del valor o modalidad xi es igual a hi. ; es decir:
.
. … … … … … … … n k
h = i . y  hi . = 1
. i. n i =1
xi hi1 hi2 … hij … hil hi.
. DISTRIBUCIÓN MARGINAL DE “Y”
. … … … … … … … De la misma forma, la distribución marginal de la característica “Y” está definida por las frecuencias
. absolutas marginales n.j
xk hk1 hk2 … hkj … h kl hk. k l
h .j h.1 n.2 … h.j … h.l h.. n =  n y  n. j = n.. = n
. j i =1 ij j =1
OBSERVACIONES: La frecuencia relativa marginal del valor o modalidad y j es igual a h.j ; es decir:
(a) La suma de las frecuencias relativas de todos los pares de valores o modalidades n l
posibles es igual a la unidad. . j y  h =1
h =
k l .j n j =1 . j
Es decir:   hij = 1 TABLA DE DISTRIBUCIÓN MARGINAL DE “X”
i =1 j =1
.
(b) Las sumas parciales se designan igualmente por un ( ) en lugar del índice, que Valores Frec.
Frec. Rel hi.
hace la función de sumatoria. de X Abs ni.
n l
x1 n1. h1.
h = i. =  h x2 n2. h2.
i. n j =1 ij .
34
. … … DEFINICIÓN 02: La distribución absoluta de la variable X condicionada a que la variable
. n
Y toma el valor fijo y j (Y=yj), j = 1, 2, …, l, se denota por “ x /y =y ” y esta dada por la j
xi ni. hi. j
. – ésima columna de la tabla de doble entrada de distribución de frecuencias absolutas. Es
. … … decir:
.
xk nk. hk. n =n
x /y =y ij i =1,...,k
j
Total n..=n h..=1
Esta distribución condicionada es una distribución de una sola variable.
TABLA DE DISTRIBUCIÓN MARGINAL DE “Y ”
Existen l distribuciones condicionadas según la variable X que corresponden a cada uno de
Valores Frec. Frec. Rel los valores de yj de la variable Y.
de Y Abs n.j h.j
y1 n.1 h.1 DEFINICIÓN 03: La distribución de frecuencias relativas de la variable X condicionada a
y2 n.2 h.2 que la variable y tome un valor fijo yj (y=yj) con j = 1, 2, …, l es igual a:
. n ij
. … … h = , i = 1, 2, …, k
x /y =y
. j n.j
yj n.i h.j
. TABLA DE LA DISTRIBUCIÓN DE X CONDICIONADA A QUE LA VARIABLE Y
. … … TOME UN VALOR FIJO y j
. Valores Frec. Abs. Frec. Rel.
de X Condicionada Condicionada
yl n.l h.l por y = yj por y = yj
Total n..=n h..=1
n h
x /y =y x /y =y
j j
n1j n1 j / n. j
DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS ABSOLUTAS x1
ACUMULADAS n2j
x2 n 2 j / n. j
Las frecuencias absolutas acumuladas bidimensionales están definidas por:
i j .
N =   nrp . … …
ij r =1 p =1
.
nij n ij / n. j
xi
DISTRIBUCIÓN BIDIMENSIONAL DE FRECUENCIAS RELATIVAS ACUMULADAS
Las frecuencias relativas acumuladas bidimensionales están definidas por: .
. … …
i j .
H =   hrp
ij r =1 p =1 nkj. n kj / n . j
xk
Total n.j 1
DISTRIBUCIONES CONDICIONADAS EJERCICIO:

35
En una muestra de 50 viviendas familiares de la ciudad de Ayacucho, l
 y j n. j
se considera como primera variable (X) el número de personas por La media marginal para Y: j =1
vivienda, y como segunda variable (Y) el número de habitaciones por M (y ) = y =
n
vivienda. Los valores observados fueron:
X 6 4 6 5 5 6 5 6 8 (b) Cuando las dos variables son dependientes, de la misma naturaleza y están
Y 2 2 3 4 3 3 3 3 4
X 7 7 6 9 5 5 5 9 7 expresadas en las mismas unidades, definen una función U = f ( x , y )
Y 4 3 4 5 2 3 3 6 3 Luego el promedio de las variables esta dado por:
X 8 4 4 6 5 5 4 9 6
Y 5 2 4 3 3 3 4 5 2
 k l xi y j 
 
X 5 8 5 5 9 4 7 7 5 1
Y 2 6 2 3 6 4 6 4 2 M f (x , y ) =   ( )n ij 
X 5 4 7 9 6 7 4 7 4 n i =1 j =1 2 
Y 4 2 5 3 2 4 3 5 3
O también se puede calcular en función de las medias marginales.
X 6 6 9 6 5
Y 5 3 4 4 3
x y
 
Con la información determinar lo siguiente:
a) Elaboré una tabla de Frecuencias absolutas y las frecuencias marginales. Interprete n25, n.5 y n4. M f (x , y ) =
b) Halar el promedio de cada variable e intérprete cada promedio. 2
c) Confeccione la tabla de distribución de frecuencias absolutas acumuladas Nij
donde
k
 x i ni .
x = i =1
n
2. ESTADÍGRAFOS DE UNA VARIABLE CUANTITATIVA BIDIMENSIONAL
l
 y j n. j
MEDIAS MARGINALES j =1
y =
n
En el cálculo de las medias para el caso bidimensional, se pueden distinguir dos
casos: MEDIAS CONDICIONALES
En la tabla de frecuencias bidimensionales se puede analizar el comportamiento de
(a) Cuando las variables (X,Y) son de distinta naturaleza y están expresadas en una variable condicionada a un valor particular de la otra variable.
distintas unidades. En general, si observamos la tabla bidimensional en toda su dimensión cada fila o
columna constituyen una distribución unidimensional.
Por ejemplo: Entonces, se puede condicionar la media aritmética de una variable con respecto a un
(X = Edad, Y = Ingreso) valor particular de la otra variable, y de esta forma definir las MEDIAS
(X = Estatura, Y = Peso) CONDICIONALES :
En este caso se calculan independientemente la media de cada variable X e Y, La media condicional de X respecto a un valor de Y.
llamadas medias marginales
k
k  n x
 x i ni . i =1 ij i
M (X / y = y j ) =
La media marginal para X: i
M ( x ) = X = =1 n. j
n
La media condicional de Y respecto a un valor de X.
36
l
 n y
j =1 ij l O su formula desarrollada
M (Y / X = x i ) = n
ni .  x y
i =1 i i
Cov ( x , y ) =  x .y
n
VARIANZA MARGINAL
La varianza marginal está definida por:
Varianza marginal para X: (b) PARA DATOS TABULADOS
k k l
2   n ( x  x )( y  y )
 n (x  x )
2 i =1 i . i i =1 j =1 ij i i
SX = Cov ( x , y ) =
n 1 n
La fórmula desarrollada correspondiente es:
O también por su formula desarrollada: 1 k l
Cov ( x , y ) =   n x y  x .y
ij i j
n i =1 j =1
1 k
 n x  nx 
2 2 2
SX =
n 1 
i =1 i. i  RELACIÓN DE LA VARIANZA Y COVARIANZA.
La varianza de la suma de dos variables es igual a la suma de las varianzas de las
Varianza marginal para Y: variables más el doble de la covarianza de las mismas variables.
l 2 V ( x  y ) =V ( x ) V ( y )  2Cov ( x , y )
 n (y  y )
2 j =1 . j j De la misma forma la varianza de la diferencia de dos variables está dada por:
SY = V ( x  y ) =V ( x ) V (y )  2Cov ( x , y )
n 1

CORRELACIÓN LINEAL:
O también por su formula desarrollada:
DEFINICIÓN: El coeficiente de correlación ó índice de correlación de PEARSON entre
dos variables X e Y se define por:
1  l
 n y  ny 
2 2 2
Sy =
n 1 
 j =1 . j j  Cov ( x , y )
r=
Sx Sy
COVARIANZA
La covarianza es la medida de asociación lineal más simple entre dos variables X e Y Donde:
SX y SY son las desviaciones estándar de X e Y respectivamente.
DEFINICIÓN:
PROPIEDADES DE LA CORRELACIÓN LINEAL:
Sea (x i ,y j ) con i = 1,2,..., k y j = 1,2,..., l los distintos valores de la variable El coeficiente de correlación varía desde -1 hasta 1. 1  r  1
(1) Si r > 0, entonces existe “Correlación directa positiva”
bidimensional (x,y), con frecuencias absolutas n ij , i = 1,2,..., k y j = 1,2,..., l . La (2) Si r < 0, expresa una “Correlación inversa negativa”
covarianza entre las variables X e Y se define: (3) Si r = +1, hay una correlación perfecta positiva.
(4) Si r = -1, hay una correlación perfecta negativa.
(a) PARA DATOS NO TABULADOS (5) Si r = 0, las variables son incorrelacionadas.
n LA INTERPRETACIÓN CLÁSICA DEL COEFICIENTE DE CORRELACIÓN ES LA
 ( x  x )( y  y )
i =1 i i SIGUIENTE:
Cov ( x , y ) =
n (a) Si 0.00  r < 0.20 existe correlación no significativa.

37
(b) Si 0.20  r < 0.40 existe una correlación baja.
(c) Si 0.40  r < 0.70 existe una correlación significativa.
(d) Si 0.70  r < 1.00 existe alto grado de asociación.

3. REGRESIÓN LINEAL
INTRODUCCIÓN:
En la investigación cuando se trabaja con dos o más variables es importante determinar el grado
de relación que hay entre ellas. Por ejemplo, si relacionamos el rendimiento académico con el
tiempo que se dedica al estudio de una materia; así mismo, si relacionamos el peso con la talla de
una persona.
En efecto, Estadísticamente interesa analizar la relación existente entre dos o más
variables, siempre que se tenga un indicio que entre las variables hay algún grado de dependencia
o asociación. Está relación implica un modelo matemático, que expresa la relación funcional que
hay entre las variables en estudio, donde se intenta predecir o explicar el comportamiento o
RELACIÓN NO LINEAL
resultado de una Variable Dependiente (VD) en función de otras Variables Independientes (VI), así
como investigar si ellas están asociadas o correlacionadas entre si.
3.1 DIAGRAMA DE DISPERSIÓN:
Dado “n” observaciones bidimensionales, cada par de valores (X,Y) en el plano cartesiano o
rectangular esta presentado por un punto, y habrá tantos puntos como parejas de
observaciones se tenga. Esta representación gráfica sobre el plano presenta una nube de
puntos que puede tomar diferentes formas y se le conoce como DIAGRAMA DE
DISPERSIÓN.
RELACIÓN LINEAL POSITIVA

SIN RELACIÓN DEFINIDA, INCORRELACIONADA

RELACIÓN LINEAL NEGATIVA

38
Luego de graficar los “n” pares de la variable bidimensional y observar la nube de n n
 y = b  x  na
puntos, es necesario analizar que expresión matemática representa o se ajusta mejor a i =1 i i =1 i
la nube de puntos. A este proceso de modelar la expresión matemática que mejor se n n 2 n
ajusta a la nube de puntos se llama FUNCIÓN DE REGRESIÓN O MODELO DE  y x = b  x a  x
i =1 i i i =1 i i =1 i
REGRESIÓN.
Al solucionar el sistema se obtiene:
3.2 MODELO DE REGRESIÓN
a = y  bx
Dadas las variables (X,Y) se puede estimar el modelo y = f ( x ) que pretende explicar o
n
predecir la variable independiente el comportamiento de la variable dependiente.  x y  nx .y
3.2.1. REGRESIÓN LINEAL SIMPLE i =1 i i Cov ( x ,y )
b= n =
Si la regresión de Y en X es una función lineal, y = a  bx , donde a, b son
2
 x  nx
2 S x2
i =1 i
constantes; se llama regresión lineal simple de Y en X.
Luego de estimar los valores de los parámetros se escribe la recta estimada
El valor de “a” se llama ordenada en el origen, puesto que es el punto en que la línea
recta corta al eje “Y”. La pendiente de la recta se mide por “b” que da el cambio en “Y” yˆ = a  bx , que significa un valor estimado de y
por unidad de cambio en el valor de “X”; el signo de “b” también indica el tipo de
relación entre “X” e “Y”. 2
3.2.3. VARIACIÓN NO EXPLICADA  
3.2.2. ESTIMACIÓN POR EL MÉTODO DE MÍNIMOS CUADRADOS.
2
Uno de los objetivos principales en análisis de regresión es estimar los parámetros El estadígrafo   mide la variabilidad de la recta alrededor de la recta de
“a” y “b” de la recta L : y = a  bx dado un conjunto de datos bidimensionales
regresión.
(X,Y). n 2
El procedimiento de estimación de los parámetros se llama MÉTODO DE  (y  yˆ)
2 i =1 i
MÍNIMOS CUADRADOS y consiste en hallar la recta L, de tal manera que la  =
n 2
suma de los cuadrados de las diferencias de las ordenadas y i y a  bx i de los
O también por su fórmula equivalente:
puntos observados ( x i , y i ) y los puntos sobre la recta L, ( x i ,a  bx i ) sea 2
2 nS y  nbCov ( x , y )
mínima.  =
El Método de Mínimos Cuadrados significa minimizar la siguiente expresión: n 2
n

SCD =  y i  (a  bx i )
i =1
2
 3.2.4. COEFICIENTE DE DETERMINACIÓN:
Indica en que porcentaje la variable independiente “X” explica a la variable
Minimizar significa derivar SCD con respecto a cada uno de los parámetros “a” y “b” dependiente “Y”.
e igualar a cero cada una de las derivadas parciales. Es decir: El coeficiente de determinación esta dado por:
n
 
SCD
= 2  y i  (a  bx i ) ( 1) = 0
a i =1
2 Cov ( x , y )  Cov ( x , y ) 
r =  
n
 
SCD
= 2  y i  (a  bx i ) (  x i ) = 0  S x S y   S x S y 
b i =1
2
Haciendo las operaciones respectivas en ambas ecuaciones se obtiene el sistema:
2 Cov ( x , y ) 
r = 
 S x S y 
PROPIEDADES:

39
(a) El coeficiente de determinación varia desde 0 hasta 1.
(b) Si r 2 es cercano a 1, indica una fuerte correlación entre X e Y.
(c) Si r 2 está cercano a 0 indica una pobre correlación entre X e Y.

EJERCICIO:
En una evaluación a un grupo de 5 alumnos se aplican dos pruebas,
una de ellas mide la habilidad mental y la otra una prueba de
conocimientos, los resultados se registran a continuación:
Habilidad Conocimientos
Estudiantes
Mental X Y
María 18 82
Pedro 15 68
Susana 12 60
(c) Hallando el coeficiente de determinación.
Aldo 9 32
Hallando la varianza de X:
Juan 3 18
Con los datos realice lo siguiente:
(a) Estime la recta de regresión de Y sobre X. 2 1 n 2 2 1 2
S x =  x i  x = (783)  11.4 = 26.64
(b) Elaboré el diagrama de dispersión n i =1 5
(c) Calcular el coeficiente de determinación Hallando la varianza de Y:
(d) Calcular la dispersión de los puntos alrededor de la recta de regresión.
SOLUCIÓN:
2 1 n 2 2 1 2
(a) Hallando los parámetros “a” y “b” S y =  y i  y = (16296)  52 = 555.20
n i =1 5
a = y  bx
n
Hallando la Cov(x,y):
 x y  nx .y 1 n 1
i =1 i i Cov ( x ,y ) Cov ( x , y ) =  x y  x .y = (3558)  (11.4)(52) = 118.8
b= n = i i
2
 x  nx
2 S x2 n i =1 5
i =1 i Hallando el coeficiente de determinación.

Hallando primero “b” 2 2


5 2
Cov ( x , y )   118.8 
r =  =
 x y  nx .y  = 0.95422

b=
i =1 i i
5 2
=
16296  5(11.4)(52)
= 4.4595  Sx Sy   (26.64)(555.20) 

 x  nx 783  5(11.4)
i =1 i r2 = 95.42 % indica que los conocimientos son explicados en un 95.42 % por la habilidad
Hallando “a” mental.
a = y  bx = 52  4.4595(11.4) = 1.1617
Luego el modelo de regresión es: (d) La dispersión alrededor de la recta es:
yˆ = 1.1617  4.4595 x
5(555.2)52(4.4595)(118.8)
 2 = =42.3523
3
(b) El diagrama de dispersión es:

40
41

También podría gustarte