Está en la página 1de 44

UNP Estadstica General Facultad de ciencias

1
Lic. Estadstico Hugo Luis Chunga Gutierrez




ESTADSTICA


Autor: Lic. Ing. Hugo L. Chunga Gutirrez












UNP Estadstica General Facultad de ciencias


2
Lic. Estadstico Hugo Luis Chunga Gutierrez

INTRODUCCIN

La palabra estadstica a menudo nos trae a la mente imgenes de nmeros apilados en grandes
arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, viajes, visitantes,
ingresos, ventas y as sucesivamente.
Algunas personas podran pensar que la enseanza de la estadstica slo interesa a los
profesores, o bien a los investigadores que trabajan en los diferentes departamentos de una
universidad. Esta es una creencia errnea y podemos encontrar Estadsticos en psicologa,
economa, medicina, ingeniera y otras reas.

Qu es la estadstica?

Estadstica es un conjunto de mtodos cientficos para la recopilacin, representacin
condensacin y anlisis de los datos extrados de un sistema en estudio. Con el objeto de
poder hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.

La Estadstica es un mtodo de razonamiento para describir e interpretar informacin, cuya
caracterstica principal es la variabilidad de los datos.
En el medio sanitario es muy adecuada porque permite el manejo de la variabilidad biolgica.

Ejemplos de su aplicacin son:
1) En Administracin de Empresas: la estadstica se utiliza para evaluar un producto antes
de comercializarlo.
2) En Economa: para medir la evolucin de los precios mediante nmeros ndice o para
estudiar los hbitos de los consumidores a travs de encuestas de presupuestos familiares.
3) En Ciencias Polticas: para conocer las preferencias de los electores antes de una votacin
mediante sondeos y as orientar las estrategias de los candidatos.
4) En Sociologa: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.
5) En Psicologa: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en
una empresa).
UNP Estadstica General Facultad de ciencias


3
Lic. Estadstico Hugo Luis Chunga Gutierrez
6) En Medicina: uno entre muchos usos de la estadstica, es para determinar el estado de salud
de la poblacin.
En general en las Ciencias Sociales, la estadstica se emplea para medir las relaciones entre
variables y hacer predicciones sobre ellas.


LA ESTADSTICA Y LA INVESTIGACIN CIENTFICA

El INEI nos dice sobre la Estadstica y la Investigacin Cientfica.

La investigacin cientfica se ejecuta de acuerdo a criterios o reglas
generales, dadas por la teora general, los que son adaptados por cada
investigador segn los requerimientos de sus objetivos de estudio, nivel de
anlisis que desee o pueda alcanzar y las limitaciones tcnicas y financieras
que se presenten al llevar a cabo su trabajo.

La teora debe ser contrastada con la realidad que trata de explicar y la cual se encuentra en
continuo desarrollo y transformacin.

La forma de evidenciar la certeza o el error de nuestras concepciones tericas es precisamente
la prctica cientfica, ya sea mediante observacin, encuestas, mediciones, experimentacin,
reportajes, documentales, entrevistas, censos; justamente una herramienta indispensable para
realizar la prctica cientfica es la Estadstica.

Con la investigacin cientfica se busca obtener un nuevo conocimiento de una determinada
realidad o fenmeno para tal efecto debemos obtener informacin de esa realidad o fenmeno
bajo estudio, entonces una forma objetiva de obtener informacin de la realidad es mediante
la Estadstica.

En general la Estadstica brinda a los investigadores herramientas pertinentes desde las ms
sencillas hasta las ms sofisticada sea para un anlisis estadstico descriptivo o inferencial,
considerando desde el caso univariante hasta el multivariante.

El desarrollo cientfico y la investigacin no son posibles sin la estadstica
UNP Estadstica General Facultad de ciencias


4
Lic. Estadstico Hugo Luis Chunga Gutierrez

DIVISIN DE LA ESTADSTICA

La Estadstica para su mejor estudio se ha dividido en dos grandes ramas: la Estadstica
Descriptiva y la Inferencial.

Estadstica Descriptiva: Se denomina estadstica descriptiva, al conjunto de mtodos
estadsticos que se relacionan con el resumen y descripcin de los datos, como tablas, grficas,
y el anlisis mediante algunos clculos.

Estadstica Inferencial Se denomina inferencia estadstica al conjunto de mtodos con los
que se hacen la generalizacin o la inferencia sobre una poblacin utilizando una muestra. La
inferencia puede contener conclusiones que pueden no ser ciertas en forma absoluta, por lo
que es necesario que stas sean dadas con una medida de confiabilidad que es la probabilidad.
La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra
tomada.
Estas dos partes de la estadstica no son mutuamente excluyentes, ya que para utilizar los
mtodos de la inferencia estadstica, se requiere conocer los mtodos de la estadstica
descriptiva.

TRMINOS DE ESTADSTICA

Los trminos estadsticos que se usan en estadstica es necesario conocerlos para poder
entender el lenguaje estadstico que se utiliza en el desarrollo de la asignatura:

Poblacin: Conjunto de todos los elementos cuyo estudio nos interesa.
En forma general, en estadstica; se denomina poblacin, a un conjunto de elementos (que
consiste de personas, objetos, etc.), que contienen una o ms caractersticas observables de
naturaleza cualitativa o cuantitativa que se pueden medir en ellos.
La poblacin debe estar perfectamente definida en el tiempo y en el espacio.
Ejemplo:
- Pacientes con ITS atendidos en el hospital de Piura en Enero del 2009.
- Nios con caries en las Instituciones Educativas Nacionales de las ciudades de Sullana.
- Personas infectadas con dengue en la ciudad de Chulucanas en el verano del 2009.
UNP Estadstica General Facultad de ciencias


5
Lic. Estadstico Hugo Luis Chunga Gutierrez
Muestra: Es un subconjunto de una
poblacin. Una muestra es representativa
cuando los elementos son seleccionados de
tal forma que pongan de manifiesto las
caractersticas de una poblacin. Su
caracterstica ms importante es la
representatividad.
.
Unidad estadstica o Unidad de anlisis o unidad elemental: Es elemento de la poblacin
que reporta la informacin y sobre el cual se realiza un determinado analisis.

Parmetro: son aquellos valores que caracterizan numricamente a la poblacin como tal. El
parmetro poblacional de inters es nico (media, varianza, etc.), pero una poblacin puede
tener muchas caractersticas de inters.

Indicador estadstico: Es el dato numrico, resultado de un proceso que cuantifica
cientficamente una caracterstica de una muestra. Es el elemento caracterstico que describe
una situacin permitiendo su anlisis

La medicin: Los datos se obtienen a travs un proceso llamado medicin. Desde este punto
de vista, puede definirse medicin como el proceso por el cual asignamos una categora (o un
valor) a una variable, para determinada unidad de anlisis.

Variable: Es una caracterstica que puede tomar diferentes valores. Las variables son
caractersticas observables, susceptibles de adoptar distintos valores o ser expresados en varias
categoras.
Podemos iniciar el tema indicando que definir las variables me permitir dar respuesta a lo
que quiero estudiar.

Datos: Comnmente se le conoce como observaciones. Son los valores que toma la variable
en cada unidad estadstica.
Son todas aquellas caractersticas o valores susceptibles de ser observados, clasificados y
contados.

UNP Estadstica General Facultad de ciencias


6
Lic. Estadstico Hugo Luis Chunga Gutierrez
La forma de medir las variables va a determinar el anlisis matemtico, estadstico, de las
mismas.
Elementos de una variable:
La identificacin y definicin de variables es la tarea ms delicada de toda investigacin y
del trabajo estadstico. Tngase presente que las variables se deducen a partir de los
objetivos de un estudio o investigacin. En consecuencia, para tener xito en la seleccin
de variables, es recomendable distinguir los siguientes elementos:
a) Nombre o denominacin de la variable.
b) Definicin o conceptualizacion de la variable.
c) Un conjunto de categoras o niveles, que es definida por el investigador. Las
categoras no son nicas, lo mnimo es dos categoras y dependen de los objetivos de
la investigacin.
Ejemplo:
Veamos la variable Cualitativa Estado Civil:
a) Nombre: Estado Civil o conyugal
b) Definicin: Es la situacin de la persona empadronada en relacin con las leyes y
costumbres del pas.
c) Categoras:
1) Soltero 2) Casado 3) Conviviente 4) Divorciado 5) Viudo

Veamos la variable cuantitativa, Ingreso:
a) Nombre: Ingresos
b) Definicin: Son los recursos monetarios netos, incluyendo todas las bonificaciones
que percibe una persona por su ocupacin principal y secundaria durante el periodo
de referencia de la encuesta.
c) Categoras: Puede proponerse en forma de niveles o simplemente intervalos.
Primera forma: Segunda forma:
(01) Alto
(02) Medio
(03) Bajo
(01) Menos de 300
(02) De 301 a 500
(03) De 501 a 700
(04) De 701 a mas



UNP Estadstica General Facultad de ciencias


7
Lic. Estadstico Hugo Luis Chunga Gutierrez

CLASIFICACIN DE LAS VARIABLES


Segn su naturaleza:

VARIABLES CUALITATIVAS:

Miden una caracterstica, en trmino de cualidad, nunca de forma numrica.
Cada uno de los valores que puede tomar la variable se llama categoras. Deben incluir
todas las opciones posibles que puede adoptar la variable.

Nominal: Son aquellos variables que establecen la distincin de los elementos en diversas
categoras, sin implicar algn orden entre ellas, distribuye a la unidad de anlisis en dos o
mas categoras. Ejemplo: Sexo, Estado Civil, profesiones, etc.

Ordinal: Son aquellas variables que implican orden entre sus categoras, pero no grados
de distancias iguales entre ellas; estn referidas a un orden o jerarqua, donde las
categoras expresan una posicin de orden.
Ejemplo: Grado de instruccin, clases sociales, orden de merito, ciclo de estudios, escala
de dolor: Sin dolor, con poco dolor, con mucho dolor.

Si las variables cualitativas tienen solo dos categoras se llama variable cualitativa
dicotmica (Ejemplo: Sexo: Hombre. Mujer), y si tiene ms de dos, variable cualitativa
politmica (color de cabello: negro, rubio, castao, pelirrojo)

VARIABLES CUANTITATIVAS:
Miden una caracterstica de forma numrica. Pueden ser:

Variables Discretas: Cuando el valor de la variable resulta de la operacin de contar, su
valor representado solo por nmeros naturales (enteros positivos) o entre dos valores
consecutivos no existe otro valor.
Ejemplo; Nmero de hijos de las pacientes con cncer de mama, Nmero de pacientes
atendidos hospitales.
UNP Estadstica General Facultad de ciencias


8
Lic. Estadstico Hugo Luis Chunga Gutierrez

Variables Continuas: Cuando la variable es susceptible de medirse, es toda variable cuyo
valor se obtiene por medicin o comparacin con una unidad o patrn de medida. Las
variables pueden tener cualquier valor dentro de su rango o recorrido, por tanto se expresa
por cualquier nmero real. Entre dos valores consecutivos se pueden encontrar infinitos
valores.
Ejemplo: Peso de los pacientes con tuberculosis, El grado de glucosa en la personas con
diabetes, la talla de los recin nacidos, etc.



Segn escala de medicin:

De escala nominal: Son aquellos variables que establecen la distincin de los elementos
en diversas categoras, sin implicar algn orden entre ellas, distribuye a la unidad de
anlisis en dos o mas categoras. Ejemplo: Sexo, Estado Civil, profesiones, etc.

De escala ordinal: Son aquellas variables que implican orden entre sus categoras, pero
no grados de distancias iguales entre ellas; estn referidas a un orden o jerarqua, donde las
categoras expresan una posicin de orden. Ejemplo: Grado de instruccin, clases
sociales, orden de merito, ciclo de estudios, escala de dolor: Sin dolor, con poco dolor, con
mucho dolor.

De escala Intervalo: Mediante esta escala, adems de existir una relacin de orden como
la anterior, implica una relacin de igualdad de diferencias entre pares de objetos respecto
CUALITATIVAS CUANTITATIVAS

VARIABLES
Continua Discreta Nominal Ordinal
UNP Estadstica General Facultad de ciencias


9
Lic. Estadstico Hugo Luis Chunga Gutierrez
a una caracterstica determinada. Adems las diferencias entre los nmeros se
corresponden puntualmente con las diferencias entre los objetos en la propiedad del objeto
de medicin. Pero el valor cero es arbitrario y convencional. Ejemplos: Temperatura,
inteligencia, rendimiento acadmico y personalidad.

De escala Razn o Proporcin: Mediante esta escala adems de existir una relacin de
igualdad de diferencias como la anterior, considera un punto de origen fijo o natural, el
cero absoluto. El valor cero significa la nulidad o ausencia de la caracterstica o variable
que se estudia; y la proporcin tiene sentido, ejemplos: Peso, estatura y edad de los
alumnos. Nmero de alumnos, de computadoras, y de fotocopiadoras que posee un
colegio.

UNP Estadstica General Facultad de ciencias


10
Lic. Estadstico Hugo Luis Chunga Gutierrez


UNP Estadstica General Facultad de ciencias


11
Lic. Estadstico Hugo Luis Chunga Gutierrez
Segn relacin:

Variables dependientes (VD): Son aquellas que se explican por otras variables, son los
efectos o resultados respecto a los cuales hay que buscar su motivo, causas o razn de ser.
Es la variable que traduce la consecuencia del efecto de una o varias razones o causas, de
otras variables.
En los estudios experimentales es la variable que el investigador manipula, asignando
categoras o valores distintos y con el fin de observar como influye la manipulacin sobre
otra variable a la que llamamos dependiente.

Variables independientes (VI): Son las variables explicativas o predictivas, cuya
asociacin, relacin o influencia en la variable dependiente se pretende descubrir en la
investigacin. Las VI son los que traducen o explican las causas o razones de las
variaciones en la VD.
Simplificando, en la relacin de variables, las causas o antecedentes serian las VI y el
efecto o consecuente es la variable VD.

Variables intervinientes o interfirientes: Son aquellas que coparticipan con al variable
independiente condicionando el comportamiento de la variable dependiente.

UNP Estadstica General Facultad de ciencias


12
Lic. Estadstico Hugo Luis Chunga Gutierrez
EJERCICIOS 01

De los enunciados siguientes Identificar la poblacin, muestra, unidad de anlisis,
dato y la variable (tipo de variable y sus elementos)

1) Se desea saber el estado civil, grado de hemoglobina y el tiempo de gestacin que
llegaron a tener las mujeres que abortaron en ESALUD de la ciudad de Piura en los
seis primeros ltimos del ao anterior.

2) En la a UCV - Piura se quiere saber cul es el deporte ms practicado, el tiempo de
dedicacin a este y que das lo practica, de los alumnos la cual se tomo informacin
de 200 alumnos elegidos al azar de las diferentes escuelas de esta universidad en el
presente ciclo de estudios.

3) Se desea saber cul es la estatura, el peso y la edad de los nios menores de 5 aos
con enfermedades respiratorias atendidos en los hospitales de la ciudad de Piura, la
cual para obtener esta informacin para la estimacin se eligi solo a tres hospitales
de esa ciudad y a 50 nios por cada hospital del presente mes.

4) Una Institucin publica recin creada empleara a 345 personas de las cuales ya estn
seleccionadas, y a travs de los registros de vida obtenemos de que universidad
proceden, que profesin tienen, que cargo ocuparan, estado civil, y el numero de
hijos, esta institucin recin creada en la cuidad de tumbes.











UNP Estadstica General Facultad de ciencias


13
Lic. Estadstico Hugo Luis Chunga Gutierrez

ESTADISTICA DESCRIPTIVA

REPRESENTACIN DE TALLO Y HOJA

Un mtodo para iniciar el anlisis exploratorio de los datos, previo al uso de los
mtodos estadsticos tradicionales, y que adems proporciona informacin rpida, visual
y es relativamente nueva, es la representacin grfica de tronco y hoja.
Esta representacin se basa en la ordenacin de los datos a manera de grfico, pero sin
llegar a ello, utilizando las decenas y las unidades.

Ejemplo:
Supongamos la siguiente distribucin de frecuencias que representan la edad de un
colectivo de n = 20 personas y que vamos a representar mediante un diagrama de Tallos
y Hojas.
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es
decir 3, 2, 4, que reordenadas son 2, 3 y 4.
A continuacin efectuamos un recuento y vamos aadiendo cada hoja a su tallo
Tallos Hojas






Por ltimo reordenamos las hojas y hemos terminado el diagrama

Tallos Hojas






UNP Estadstica General Facultad de ciencias


14
Lic. Estadstico Hugo Luis Chunga Gutierrez
Ahora supongamos que tenemos las siguiente series edades de otro grupo de personas
35 38 32 28 30 29 27 19 48 40
39 24 24 34 26 41 29 48 28 22

Luego de haber construido el tallo y hoja de estos datos nos que comparar








1.- El siguiente ejemplo que contiene las calificaciones obtenidas en una prueba de
matemticas:
78 93 61 100 70 83 88 74 97 72
66 73 76 81 83 64 91 70 77 86

2.- representar mediante un diagrama de tallo y hojas los siguientes datos, expresadas en
cm:
114 125 114 124 142 152 133 113 172 127 135 161 122 127 134 147

3.- Construir una representacin tallo-hoja para el siguiente conjunto de 20
calificaciones.
82 74 88 66 58 74 78 84 96 76 62 68 72 92 86 76 52 76 82 78










UNP Estadstica General Facultad de ciencias


15
Lic. Estadstico Hugo Luis Chunga Gutierrez

DISTRIBUCION DE FRECUENCIAS

El anlisis y toma de decisiones en las diferentes actividades profesionales y la
investigacin cientfica en las diferentes ramas de la ciencia factual, dependen cada vez
ms del anlisis de grandes conjuntos de datos, debido especialmente, a las facilidades
para el almacenamiento en potentes computadoras.
Cuando se tiene gran cantidad de datos se hace necesario resumirlos de tal manera que
se facilite la descripcin y el anlisis del comportamiento de las variables de inters.
La estadstica descriptiva proporciona diversas tcnicas para lograr este resumen, siendo
una de ellas la distribucin de frecuencias.

Qu es una distribucin de frecuencias?
Distribucin de frecuencias es una forma de organizar y resumir los datos con la
finalidad de describir del comportamiento de las variables de inters. Esta organizacin,
en su forma tabular, consiste en presentar la lista de valores de una variable, clases o
categoras de datos junto con el nmero de veces que se repite cada valor de la variable
o el nmero de valores que caen dentro de cada clase o categora respectivamente.
El nmero de veces que se repite cada valor de la variable o el nmero de valores que
caen dentro de cada clase o categora se denominan frecuencias.


Tipos de frecuencias
Absolutas simples f
i
Absolutas acumuladas F
i
Relativas simples h
i
Relativas acumuladas H
i
Porcentuales simples h
i
x 100
Porcentuales acumuladas H
i
x 100
Las frecuencias acumuladas pueden ser de dos tipos: menor que y mayor que


UNP Estadstica General Facultad de ciencias


16
Lic. Estadstico Hugo Luis Chunga Gutierrez

CUADROS O TABLAS ESTADSTICAS

Un cuadro estadstico es el arreglo ordenado, columnas y filas, de datos estadsticos o
caractersticas relacionadas, con el objeto de ofrecer informacin estadstica de fcil
lectura, comparacin e interpretacin. Un cuadro estadsticos es le resultado de trabajos
previos (planeamiento, recopilacin, tabulacin, clculos, etc.)

Partes principales:

1) Nmero del Cuadro, es le cdigo o elemento de identificacin que permite ubicar el
cuadro en el interior de un documento.

2) Titulo, es la descripcin resumida del contenido del cuadro.
Responder a las clsicas preguntas: Que, Donde, Como y Cuando
- Que: Qu informacin contiene el cuadro?
Que hay en el cuadro, se refiere al hecho observado o la caracterstica principal.
- Donde: A dnde corresponde la informacin tabulada?
Se refiere al lugar geogrfico o institucin a la que corresponde la informacin.
- Como: Cmo est arreglada o clasificada la informacin?
Como estn ordenados o clasificados los datos en el cuadro.
- Cuando: A qu perodo de tiempo se refiere la informacin?
A que momento o periodo de tiempo esta referida la informacin puede ser un
momento especifico o puntual, como tambin un periodo de varios aos, mese o
semanas, etc.

3) Encabezamiento o conceptos, Es la descripcin resumida sobre contenido de las
filas y columnas que contiene el cuadro de informacin.

4) Cuerpo, Comprende al contenido numrico de la informacin del cuadro.


UNP Estadstica General Facultad de ciencias


17
Lic. Estadstico Hugo Luis Chunga Gutierrez
5) Columna Matriz, En esta columna se designa la naturaleza del contenido de cada
fila. Se anotan las categoras o las diferentes clases de la escala de clasificacin
utilizada.

6) Fuente, Se anotar el nombre de la unidad responsable de la formulacin y
presentacin del tabulado de informacin estadstica.

7) Elaboracin, Se debe anotar el nombre de la institucin o de la investigacin de
donde se han tomado los datos individuales.

CUADRO N 01
ALUMNOS DE LA UCV SEGN SU CALIFICATIVO
EN PIURA, ABRIL DEL 2008
Notas f
i
h
i
F
i
10
11
12
13
14
15
2
4
8
10
4
2
0.07
0.13
0.27
0.33
0.13
0.07
2
6
14
24
28
30
Total 30 1
Fuente: Oficina de Asuntos Acadmicos
Elaboracin: Formacin General












Numero
de cuadro
Titulo

Encabezamiento
Columna
matriz
Cuerpo
UNP Estadstica General Facultad de ciencias


18
Lic. Estadstico Hugo Luis Chunga Gutierrez

GRFICOS ESTADSTICOS


En estadstica denominamos grficos a aquellas imgenes que, combinando la
utilizacin De sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un
sistema de referencia (coordenadas), permiten presentar informacin cualitativa y
cuantitativa.
La utilidad De los grficos es doble, ya que pueden servir no slo como sustituto a las
tablas, sino que tambin constituyen por s mismos una poderosa herramienta para el
anlisis De los datos, siendo en ocasiones el medio ms efectivo no slo para describir y
resumir la informacin, sino tambin para analizarla.

Grficos estadsticos

Los grficos son medios popularizados y a menudo los ms convenientes para presentar
datos, se emplean para tener una representacin visual de la totalidad de la informacin.
Los grficos estadsticos presentan los datos en forma de dibujo de tal modo que se
pueda percibir fcilmente los hechos esenciales y compararlos con otros.
Una grfica o diagrama es un dibujo complementario a una tabla o cuadro, que permite
observar las tendencias de un fenmeno en estudio y facilita el anlisis estadstico de las
variables all relacionadas.

IMPORTANCIA:

- Son esenciales en el estudio y presentacin de trabajos estadsticos.
- Permite observar en forma instantnea el comportamiento de la variable.
- Permite formar una idea sobre la tendencia de las variables en el futuro.






UNP Estadstica General Facultad de ciencias


19
Lic. Estadstico Hugo Luis Chunga Gutierrez
PRINCIPALES PARTES DE UN GRAFICO

1) Numero del Grafico
2) Titulo: El cual debe ser claro y conciso, que responda a las preguntas: Qu
relaciona, cundo y dnde se hicieron las observaciones.
3) Los Diagramas: grfico en s, cuya eleccin debe considerar el o los tipos
variables a relacionar, el pblico a quien va dirigido y el diseo artstico del
grfico.
4) Escalas: Para graficar se utiliza el sistema cartesiano, compuesto por dos ejes:
una horizontal y otro vertical, ambos se cortan en un punto llamado origen.
Vienen a ser la graduacin de ambos ejes, segn la naturaleza de las variables y
frecuencias correspondientes.
5) Leyenda: son indicaciones donde se precisa la correspondencia entre los
elementos del grafico.
6) Fuente: Indica el origen de los datos estadsticos que se estn representando en
el grfico.












UNP Estadstica General Facultad de ciencias


20
Lic. Estadstico Hugo Luis Chunga Gutierrez

CUADROS ESTADSTICOS PARA VARIABLES CUALITATIVAS
En una muestra se recolecto datos sobre el estado civil de 30 personas que laboran en la
empresa EXPORT S.A de la cuidad de Talara.
co ca se co ca
ca co ca ca se
se co se co co
co se co ca co
so co ca ca co
co co co co ca

Ejercicios
1. Se escogi un saln de clases de cuarto grado, con un total de 25 estudiantes, y se les
pidi que calificaran del 1 al 5 un programa televisivo.
(5 = Excelente 4 = Bueno 3 = Regular 2= No muy bueno 1 = Malo)
Estos fueron los resultados:
1 3 3 4 1 2 2 2 5 1 2 1 2 4 5 1 5 3 5 1 4 1 2 3 5
2. En el ltimo del mes del ao pasado se realizo en Chile la Reunin del Grupo
Andino donde se tomo datos de los participantes acerca de su nacionalidad.
C B P E P P C V P V
P V C B P P C E P B
Donde: P = Per B = Bolivianos C = Colombianos E = Ecuatoriano V =
Venezolano

3. En una encuesta de opinin acerca de las preferencias de una marca de bebida
gaseosa por sus colores: Negro(N), Blanco(B), Rojo(R), 20 consumidores dieron las
siguientes respuestas:
B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.

4. Al investigar el nivel socioeconmico en los valores: Bajo(B), medio (M), alto(A),
20 familias dieron las siguientes respuestas:
Donde:
ca: casada
co: conviviente
se: separada
so: soltera
UNP Estadstica General Facultad de ciencias


21
Lic. Estadstico Hugo Luis Chunga Gutierrez
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.


5. Una empresa encuestadora de mercados pregunta a un conjunto de personas acerca
de la preferencia de un cierto candidato para las prximas elecciones. Los candidatos
son A, B, C, D, E, la pregunta fue: Si las elecciones fueran maana por quien
votaria usted?. Los resultados fueron:
E D A E A B A B A D A B A C A C A B A C A C A B
A B A B A B A B A B A C A C A D A B E B A A B D
A E

6. Se identifico una muestra de autos robados en la ciudad de Piura y se registro la
marca de cada auto. A continuacin se presenta los datos que se obtuvo: (T = Toyota;
D = Daewoo; N = Nissan; W = Volkswagen; H = Hyundai)
T D T H T W D T W T
D W H N H H T H N N
T D T D T H N W H T
N T T D H T W N T D
D N T T N T T D T D



7. Los siguientes datos corresponden a una muestra de 19 reclusos de un Centro
penitenciario, segn el tipo de delito.
V R D D R R D D R V D D R R V R D D V
Donde:
V : violacin, R : robo agravado, D = Trfico ilcito de drogas













UNP Estadstica General Facultad de ciencias


22
Lic. Estadstico Hugo Luis Chunga Gutierrez

GRFICOS PARA VARIABLES CUALITATIVAS

Los grficos ms usuales para representar variables cualitativas son los siguientes:

DIAGRAMA DE BARRAS VERTICAL: Es una forma grafica de representar
datos cualitativos que se han resumido en una distribucin de frecuencias de
frecuencias relativas o porcentuales.
C
A
N
T
I
D
A
D
0
15
30
45
60
75
P
r
i
m
a
r
i
a
A
n
a
l
f
a
b
e
t
o
S
e
c
u
n
d
a
r
i
a
S
u
p
e
r
i
o
r
GRADO DE INSTRUCCIN


GRFICOS SECTORIALES, CIRCULAR O DE PASTEL: Se usa para
representar y comparar la dimensin de las partes de un fenmeno con el fenmeno
total. Para su elaboracin se utiliza la circunferencia, siendo necesario que los
valores absolutos y/o porcentuales, sean traducidos en GRADOS.
Xi= (360 Fiabs) / N o Xi= (360 %) / 100


Otros tipos de grficos estadsticos para datos cualitativos:

GRFICO DE BARRAS COMPUESTAS: Para su elaboracin se debe contar
con una tabla o cuadro de entrada doble.
UNP Estadstica General Facultad de ciencias


23
Lic. Estadstico Hugo Luis Chunga Gutierrez
MASCULINO
0
10
20
30
40
P
r
i
m
a
r
i
a
A
n
a
l
f
a
b
e
t
o
S
e
c
u
n
d
a
r
i
a
S
u
p
e
r
i
o
r
GRADO DE INSTRUCCIN
FEMENINO
C
A
N
T
I
D
A
D


PACIENTES ATENDIDOS POR TUBERCULOSIS PULMONAR POR GRADO DE
INSTRUCCIN SEGN SEXO
LIMA: ABRIL DEL 2005
GRADO DE
INSTRUCCIN
SEXO TOTAL
MASCULINO FEMENINO
Analfabeto
Primaria
Secundaria
Superior
13
35
09
02
15
28
07
01
28
63
16
03
TOTAL 59 51 110
FUENTE: Hospital Loayza, Oficina de Estadstica


Investigador piensa que existen variaciones en los abortos en funcin de la condicin
socioeconmica de las familias. Para ello selecciona a seis mujeres de 50 aos
pertenecientes a tres niveles de condicin socioeconmica. El nmero total de hijos
nacidos por mujer se refleja en la siguiente tabla.

Nivel Socioeconmico
Alto Medio Bajo
2 3 1
1 1 1
3 3 2
2 4 4
1 3 1
1 1 1





UNP Estadstica General Facultad de ciencias


24
Lic. Estadstico Hugo Luis Chunga Gutierrez
GRFICO LINEAL O DE TENDENCIA:

Se usa para representar una distribucin de frecuencias dada en el tiempo (das,
semanas, meses, aos, etc.) llamada tambin serie cronolgica. Pueden incluir hasta
tres hechos o situaciones, razn por la cual pueden ser simples o compuestos.
1
9
9
8
400
800
200
0
600
1000
1400
1200
1
9
9
9
2
0
0
0
2
0
0
1
2
0
0
2
2
0
0
3
2
0
0
4
2
0
0
5

Ejercicios
ALUMNOS EGRESADOS POR AOS 1998- 2005
AOS CANTIDAD
EX - ALUMNAS
1998
1999
2000
2001
2002
2003
2004
2005
300
710
950
820
790
980
1.085
1.220

PACIENTES ATENDIDOS POR ENFERMEDADES CARDIOVASCULARES Y
TUBERCULOSIS 2000 20005
AO TIPO DE ENFERMEDAD TOTAL
CARDIOVASCULAR TUBERCULOSIS
2000
2001
2002
2003
2004
2005
30
20
50
60
100
120
50
80
100
100
110
110
800
100
150
160
210
230

POBLACIN (EN MILES) DE UNA CIUDAD DE 1975 A 1990
Ao Hombres Mujeres Total
1975 8 17 25
1980 12 20 32
1985 10 30 40
1990 18 27 45

UNP Estadstica General Facultad de ciencias


25
Lic. Estadstico Hugo Luis Chunga Gutierrez
CUADROS ESTADSTICOS PARA VARIABLES CUANTITATIVAS

PARA DATOS AGRUPADOS SIN I NTERVALOS.

i. Se tomo a 20 empresas de transportes de la Ciudad del norte del pas la cual se
tiene datos de la cantidad de quejas por parte de los turistas que visitaron los
diferentes puntos tursticos del norte del pas:
6 5 4 4 3
3 4 4 5 5
4 5 6 2 4
3 4 6 5 3

ii. Ante la pregunta del nmero de hijos por familia (variable X) una muestra de 20
hogares, marc las siguientes respuestas:

2, 1, 2, 4, 1, 3, 2, 3, 2, 0,
3, 2, 1, 3, 2, 3, 3, 1, 2, 4.

iii. En una clase de 25 alumnos hemos preguntado la edad de cada uno, obteniendo
estos resultados:

14, 14, 15, 13, 15, 14, 14, 14, 14, 15, 13, 14, 13, 14, 14, 14, 15,
14, 16, 14, 15, 15, 13, 14, 15













UNP Estadstica General Facultad de ciencias


26
Lic. Estadstico Hugo Luis Chunga Gutierrez
PARA DATOS AGRUPADOS CON INTERVALOS.

Recorrido R: Valor mximo Valor mnimo
Numero de intervalos m: 1 + 3,322*log(n) tambin m: 2.5
4
n

Amplitud C: R/m
Exceso E: R R donde R: C x m

Ejemplo:
a. Estos datos corresponden a las puntuaciones de 60 ingresantes a la Escuela de
Hoteleria y Turismo en el ltimo examen de admisin para el ingreso a la UCV
Piura.
65 43 88 59 35 76 21 45 62 41
36 78 50 48 62 60 35 53 65 74
49 37 60 76 52 48 61 34 55 82
84 40 56 74 63 55 45 67 61 58
79 68 57 70 32 51 33 42 73 26
56 72 46 51 80 54 61 69 50 35


b. Los ingresos quincenales en dlares (variable X) de 45 personas son:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60


c. Suponga que usted es el estadstico oficial de un hospital y que el director de esta
institucin le ha pedido que recoja y organice datos relativos a las cirugas que se
realizaron los mdicos en los ultimos 50 meses. Ha obtenido estos datos de
mensuales de cirugas en los ltimos 50 meses y ha reflejado esta informacin:
68 72 50 70 65 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 57 70 59 85 74 78 79 91 102
83 67 66 75 79 82 93 90 101 80
79 69 76 94 71 97 95 83 86 69




UNP Estadstica General Facultad de ciencias


27
Lic. Estadstico Hugo Luis Chunga Gutierrez
GRFICOS PARA VARIABLES CUANTITATIVAS

HISTOGRAMA:
Es una grafica que se utiliza para representar la distribucin de frecuencias absolutas
o relativas simples.
Consiste en un grupo de rectngulos adyacentes que tienen sus bases en el eje de las
abscisas (donde se representa los intervalos de clase de la variable) y altura igual a
las frecuencias de cada clase.

POLGONO DE FRECUENCIA:
Tambin es un grafico que se utiliza para representar la distribucin de frecuencias
absolutas o relativas simples.
Consiste en un grafico lineal que se obtiene uniendo los puntos hallados, mediante
el par de valores de marca y frecuencia correspondientes. Para fines de grfico, se
hace necesario incrementar un intervalo de clase en cada extremo, con frecuencias
cero.

C
A
N
T
I
D
A
D
0
5
10
15
20
25
7
30
35
EDAD (aos)
12 17 22 27 32 37










UNP Estadstica General Facultad de ciencias


28
Lic. Estadstico Hugo Luis Chunga Gutierrez

MEDIDAS DE RESUMEN Y MEDIDAS DE DISPERSION

MEDIDAS DE RESUMEN:
En las tres semanas anteriores estn referidos, con cierto detalle, a la clasificacin de
variables, recoleccin de datos, construccin de tablas de frecuencia y a la
representacin grafica, como fase preliminar en la descripcin y anlisis estadstico. El
objetivo principal de estas primeros temas, ha sido determinar la naturaleza y formas de
la distribucin de frecuencias, como base para la reduccin de datos a travs de
ciertas caractersticas descriptivas y medidas de resumen.

En el problema de comparar dos o mas distribuciones de frecuencias, puede resultar
fcil hacer una comparacin grafica de las frecuencias, sin embargo, existen dificultades
para hacer comparaciones cuantitativas. Estadsticamente para facilitar este anlisis
comparativo es necesario disponer de algunos indicadores o medidas de resumen.

Para ello estudiaremos las medidas de posiciones centrales y no centrales.


MEDIDAS DE DISPERSIN:

Las medidas de dispersin o variabilidad son nmeros que miden el grado de separacin
de los datos con respecto a un valor central, que generalmente es la media aritmtica.
Las principales medidas de dispersin son:
El rango, el rango intercuartil, la varianza, la desviacin estndar, y el coeficiente de
variacin.










UNP Estadstica General Facultad de ciencias


29
Lic. Estadstico Hugo Luis Chunga Gutierrez
MEDIDAS DE POSICIONES CENTRALES PARA DATOS NO
AGRUPADOS

Son valores que reflejan el centramiento o punto central de la variable estudiada. Son
tres: la media, la mediana y la moda.

MEDIA ARITMTICA (
x
)
La media aritmtica de un conjunto de valores de una variable es el promedio de todas
las observaciones. Esto es, se suman todos los valores de la variable y se divide por el
nmero de valores. Esta medida se obtiene mediante la siguiente expresin:
n
x
x
n
i
i

=
=1

n
x x x x
n
x
X
n
i
+ + + +
= =

. ..........
3 2 1



LA MEDIANA ( Me)
La mediana de un conjunto de valores ordenados de una variable, es el valor central.
Si el conjunto de datos tiene un nmero impar de valores entonces la mediana es el
valor de la variable que esta localizado en la parte central y si es par el nmero de
valores, entonces la mediana es el promedio simple de los dos valores de la variable que
estn localizados en la parte central.

- Cuando se tiene un numero impar

- Cuando se tiene un numero par



LA MODA O EL VALOR MODAL (MO):
Es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia
absoluta es mayor. No tiene porque ser nica.
Ejemplo:
- El conjunto: 2 2 5 7 9 9 9 10 10 11 13 tiene la moda Mo = 9
- El conjunto: 3 5 8 10 12 16 18 no tiene moda.
- El conjunto: 2 3 4 4 4 5 5 7 7 7 9 tiene dos modas 4 y 7; es una
distribucin bimodal.
1
2
1
2 2
2
n
n n
si n es impar
Me x
si n es par
x x
Me
+
+
=
+
=
+
+
=
+
=
1
2
1
2 2
2
n
n n
si n es impar
Me x
si n es par
x x
Me
UNP Estadstica General Facultad de ciencias


30
Lic. Estadstico Hugo Luis Chunga Gutierrez

EJERCICIOS

1.- Consideremos el peso en kilogramos de una muestra de 13 alumnos deportista de
esta universidad:
65 76 48 48 68 78 90 87 67 72 78 77 84

2.- Supongamos que tenemos datos sobre las edades de 10 alumnos de esta
universidad:
18 22 20 19 18 17 21 20 18 23

3.- Tenemos los calificativos de 11 alumnos en el curso de estadstica:
09 10 08 17 14 08 11 14 12 14 14



























UNP Estadstica General Facultad de ciencias


31
Lic. Estadstico Hugo Luis Chunga Gutierrez
MEDIDAS DE POSICIONES NO CENTRALES PARA DATOS NO
AGRUPADOS


LOS CUARTILES (Qk):
Los cuartiles son los tres valores de la variable que dividen a
un conjunto de datos ordenados en cuatro partes iguales.
Q
1
, Q
2
y Q
3
determinan los valores correspondientes al 25%, al 50% y al 75% de
los datos.

CUARTIL
Posiciones
Cuando n es impar Cuando n es par
Q1
4
1 + n

4
n

Q2 Me Me
Q3
4
) 1 ( 3 + n

4
3n



LOS DECILES (Dk):
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

Cuando n es impar Cuando n es par
10
) 1 ( + n k

10
kn


LOS PERCENTILES (Pk):
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

Cuando n es impar Cuando n es par
100
) 1 ( + n k

100
kn

UNP Estadstica General Facultad de ciencias


32
Lic. Estadstico Hugo Luis Chunga Gutierrez

MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS


Varianza: es el promedio del cuadrado de las distancias entre cada observacin y la
media aritmtica del conjunto de observaciones.

Desviacin tpica o Desviacin estndar: La varianza viene dada por las mismas
unidades que la variable pero al cuadrado, para evitar este problema podemos usar como
medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva
de la varianza.

COEFICIENTE DE VARIACIN DE PEARSON: Cuando se quiere comparar el
grado de dispersin de dos distribuciones que no vienen dadas en las mismas unidades o
que las medias no son iguales se utiliza el coeficiente de variacin de Pearson que se
define como el cociente entre la desviacin tpica y el valor absoluto de la media
aritmtica.

Medida de dispersin Para una poblacin Para una muestra
Varianza
( )
n
x
i

=
2
2

o
( )
1
2
2

n
x x
s
i

Desviacin estndar
= s =
Coeficiente de
variacin



CV representa el nmero de veces que la desviacin tpica contiene a la media
aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la
representatividad de la media.

Si CV < =33% el grupo de estudio es mas Homogneo;
Si CV > 33% el grupo de estudio es mas Heterogneo;




UNP Estadstica General Facultad de ciencias


33
Lic. Estadstico Hugo Luis Chunga Gutierrez
Ejemplos
En la evaluacin a 120 alumnos en 02 asignaturas, se obtienen los siguientes resultados:
1. Examen de Estadstica: 12 3 5 ; . x s = =
2. Examen de Investigacin: 45 7 4 ; . x s = =
En cual de las pruebas el grupo tiene mayor variabilidad?

Analizar comparativamente la distribucin de los sueldos de los 45 trabajadores de
cierta empresa
Desv. Estndar Media
Directivos 70 700
Empleados 60 300
Obreros 90 250






















UNP Estadstica General Facultad de ciencias


34
Lic. Estadstico Hugo Luis Chunga Gutierrez
MEDIDAS DE POSICIONES CENTRALES PARA DATOS
AGRUPADOS


LA MEDIA ARITMTICA

Los datos se pueden presentar en tablas sin intervalos y en tablas con intervalos, en
ambos casos se usa la Media aritmtica Ponderada
M(Y) =
1
y
i i
i
Y f
n
=



LA MEDIANA

1. La mediana en tablas sin intervalos
a) Que
2
n
no coincide con algn Nj se tiene que:


b) Que
2
n
coincide con algn Nj, se tiene que:


Entonces:
( )
1
2
:
j i j
Me Y Y

+




2. La mediana en tablas con intervalos
a. Hallamos
2
n


]






UNP Estadstica General Facultad de ciencias


35
Lic. Estadstico Hugo Luis Chunga Gutierrez
LA MODA

La moda en tablas sin intervalos
Una vez agrupados los datos en una tabla de frecuencia, el valor modal ser el valor
de la variable que mas se repite o que tiene la mayor frecuencia. La mayor frecuencia
se denotara con
j
n .
La moda Mo =
j
n

2. La moda en tablas con intervalos


[

]


MEDIDAS DE POSICIONES NO CENTRALES PARA DATOS
AGRUPADOS


LOS CUARTILAS (Q
K
)



DECILES:



PERCENTILES:








UNP Estadstica General Facultad de ciencias


36
Lic. Estadstico Hugo Luis Chunga Gutierrez

MEDIDAS DE DISPERSION PARA DATOS AGRUPADOS



Medida de dispersin Para una poblacin Para una muestra
Varianza
( )
n
f x
i i

=
2
2

o
( )
1
2
2

n
f x x
s
i i

Desviacin estndar
= s =
Coeficiente de
variacin









EJERCICIOS



CUADRO N 01

NIOS CON ENFERMEDADES RESPIRATORIAS DEL AAHH SAN MARTIN
SEGN EDAD, PIURA JUNIO 2012

Edad
Nio con enfermedad
diarreica (f
i
)
2 1
3 4
4 7
5 5
6 3
Total 20










UNP Estadstica General Facultad de ciencias


37
Lic. Estadstico Hugo Luis Chunga Gutierrez
CUADRO N 02

ALUMNOS DE EPE DE LA UCV PIURA SEGN PUNTAJES OBTENIDOS
EN ESTADSTICA EN EL 2012

Puntaje Alumnos (f
i
)
9 2
10 6
11 10
12 7
13 6
14 5
Total 36


CUADRO N 03

NMEROS DE HOSPITALES SEGN INGRESOS (EN MILES DE SOLES)
OBTENIDOS EN NUESTRO PAS EN DICIEMBRE DE 2012


[L
i
, L
s
>
xi f
i
F
j
[90 120> 11 11
[120 150> 13 24
[150 180> 20 44
[180 210> 17 61
[210 - 240> 15 76
[240 - 270> 3 79
[270 300> 1 80
Total ***** 80 *****


CUADRO N 04

NMEROS DE HOSPITALES SEGN INGRESOS (EN MILES DE SOLES)
OBTENIDOS EN NUESTRO REGION EN DICIEMBRE DE 2012

[L
i
, L
s
>
xi f
i
F
j
[60 120> 14 14
[120 180> 16 30
[180 240> 12 42
[240 300> 10 52
[300 - 360> 6 58
[360 - 420> 2 60
Total ***** 60 *****
UNP Estadstica General Facultad de ciencias


38
Lic. Estadstico Hugo Luis Chunga Gutierrez

MEDIDAS DE DEFORMACIN

Comparan la forma que tiene la representacin grfica, bien sea el histograma o el
diagrama de barras de la distribucin, con la distribucin normal.

MEDIDA DE ASIMETRA
Diremos que una distribucin es simtrica cuando su mediana, su moda y su media
aritmtica coinciden.
Diremos que una distribucin es asimtrica a la derecha si las frecuencias (absolutas o
relativas) descienden ms lentamente por la derecha que por la izquierda.
Si las frecuencias descienden ms lentamente por la izquierda que por la derecha
diremos que la distribucin es asimtrica a la izquierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas
es el Coeficiente de Asimetra de Pearson:
S
Mo x
C
s

=
o
S
Me x
C
s
) ( 3
=

Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a
la derecha y negativo cuando existe asimetra a la izquierda.
La interpretacin del coeficiente (1.10) es como sigue:
S,
0 >
s
C
, la distribucin es con asimetra positiva o con cola a la derecha.
S,
0 <
s
C
, la distribucin es con asimetra negativa o con cola a la izquierda.
S,
0 =
s
C
, la distribucin es simtrica.


Asimetra
Negativa
Asimetra
Positiva
UNP Estadstica General Facultad de ciencias


39
Lic. Estadstico Hugo Luis Chunga Gutierrez
MEDIDA DE APUNTAMIENTO O KURTOSIS

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se
definen 3 tipos de distribuciones segn su grado de Kurtosis:
Distribucin mesocrtica (K = 0.5): presenta un grado de concentracin medio
alrededor de los valores centrales de la variable (el mismo que presenta una distribucin
normal).
Distribucin leptocrtica (K = 1): presenta un elevado grado de concentracin
alrededor de los valores centrales de la variable.
Distribucin platicrtica (K = 0): presenta un reducido grado de concentracin
alrededor de los valores centrales de la variable.

El Estadgrafo de Kurtosis es:
75 25
90 10
P
P P
K Coef i ci ent e er cent i l de Kur t osi s
P P

= =









UNP Estadstica General Facultad de ciencias


40
Lic. Estadstico Hugo Luis Chunga Gutierrez

REGRESION Y CORRELACION LINEAL

REGRESIN LINEAL

La regresin lineal estima los coeficientes de la ecuacin lineal, con una o ms variables
independientes, que mejor prediga el valor de la variable dependiente. Se denomina
regresin lineal simple, a aqulla en la que aparece una sola variable independiente y
regresin lineal mltiple, cuando aparece ms de una variable independiente en la
ecuacin de la regresin lineal.
X b a Y + =

La regresin es una tcnica estadstica utilizada para simular la relacin existente entre
dos o ms variables. Por lo tanto se puede emplear para construir un modelo que
permita predecir el comportamiento de una variable dada.
La regresin lineal es una herramienta estadstica que podemos usar para describir el
grado de relacin lineal entre las variables








UNP Estadstica General Facultad de ciencias


41
Lic. Estadstico Hugo Luis Chunga Gutierrez
DIAGRAMA DE DISPERSIN


Sin embargo obtener el modelo de regresin no es suficiente para establecer la
regresin, ya que es necesario evaluar que tan adecuado es el modelo de regresin
obtenido. Para esto se hace uso del coeficiente de correlacin R, el cual mide el grado
de relacin existente entre las variables. El valor de R varia entre -1 y 1, pero en la
prctica se trabaja con el valor absoluto de R, entonces, a medida que R se aproxime
a 1, ms grande es el grado de correlacin entre los datos, de acuerdo con esto el
coeficiente de correlacin se puede clasificar de varias formas.

( )

=
2
2
2
.
. .
X X n
XY X Y X
a
o X b Y a =



EL ERROR ESTNDAR: llamado tambin desviacin estndar de regresin, es una
medida de esparcimiento alrededor de una lnea de regresin. Es la desviacin estndar
de los valores observados Y con respecto a los valores Y estimados por la lnea de
regresin.
UNP Estadstica General Facultad de ciencias


42
Lic. Estadstico Hugo Luis Chunga Gutierrez




QU ES LA CORRELACI N LI NEAL?

Es una herramienta estadstica que podemos usar para describir el grado de relacin
lineal entre las variables.

Coeficiente r
- Formula propuesta por Pearson:
( )



=
] . [ ] ) ( . [
. .
2
2 2 2
Y Y n X X n
Y X XY n
r


Otra formula:




Donde:




- Formula propuesta por Thurstone:

] [ ] [
2 2 2 2
Y n Y n X n X n
X Y n XY
r


=





UNP Estadstica General Facultad de ciencias


43
Lic. Estadstico Hugo Luis Chunga Gutierrez


1 1 s s r
a) Si r > 0, entonces existe correlacin directa positiva
b) Si r < 0, se trata de una correlacin, inversa negativa
c) Si r
2
= 0, los datos forman una lnea recta

En la interpretacin clsica del coeficiente de correlacin, se sostiene que si:
a) 0.00 s r < 0.20 existe correlacin no significativa.
b) 0.20 s r < 0.40 existe correlacin baja.
c) 0.40 s r < 0.70 existe una significativa correlacin.
d) 0.70 s r < 1 existe alto grado de asociacin.
Coeficiente de determinacin r
2

1 0
2
s s r

En el siguiente ejemplo tenemos datos sobre el Ingreso y consumo de una muestra de
seis familias.
INGRESO CONSUMO XY X
2
Y
2

35 30
40 35
38 30
55 50
42 35
60 50
270 230

Y Y X

X
2

Y



UNP Estadstica General Facultad de ciencias


44
Lic. Estadstico Hugo Luis Chunga Gutierrez