Está en la página 1de 58

Escuela de Postgrado Universidad Nacional de Trujillo

USO DE EXCEL EN LA EDUCACIN


MsC Luis Alberto Rubio Jacobo
INDICE PARTE 1. CONCEPTOS GENERALES
1. 2. 3. 4. 5. 6. 7. 8. 9. 1 0. 1 1. 1 2. 1 3. Definicin de Estadstica Clasificacin de la Estadstica Universo Poblacin Muestra Muestreo Unidad de estudio Observacin Variable Parmetro Estimador Tcnicas de recoleccin de datos Instrumentos de recoleccin de datos

PARTE 2. PRESENTACIN DE LA INFORMACIN


1. 2. 3. 4. 5. 6. 7. 8. 9. 1 0. 1 1. Cuadro de distribucin de frecuencias (CDF) Partes de un CDF Elementos para construir un CDF Propiedades de un CDF Construccin de CDF Excel en la construccin de CDF Grfico estadstico Partes de un grafico estadstico Criterios para construir grficos Tipos de grficos estadsticos Construccin de grficos estadsticos con MegaStat-EXCEL

PARTE 3. MEDIDAS ESTADSTICAS UNIVARIANTES


1. 2. 3. 4. 5. 6. 7. Medidas de tendencia central Medidas de localizacin Medidas de variabilidad Medidas de Forma Formulas para calcular las medidas de tendencia central Formulas para calcular las medidas de dispersin o variacin Medidas estadsticas con MegaStat-EXCEL

PARTE 4. ANALISIS DE CORRELACION Y REGRESIN


1. 2. Anlisis de correlacin Anlisis de regresin

Curso: Uso de Excel en la Educacin

Pgina - 1 -

Escuela de Postgrado Universidad Nacional de Trujillo

3. 1. 2. 3. 4.

Anlisis de regresin con MegaStat-EXCEL La distribucin Binomial La distribucin Poisson La distribucin normal Aplicacin con MegaStat-EXCEL

PARTE 5: DISTRIBUCIONES DE PROBABILIDAD

PARTE 6: ESTIMACION ESTADISTICA


1. 2. 3. Estimacin puntual Estimacin intervlica Aplicacin utilizando MegaStat-EXCEL

PARTE 7: PRUEBA DE HIPOTESIS


1. 2. 3. 4. 5. 6. 7. Definiciones preliminares Clases de Hiptesis Errores que se cometen en una prueba de hiptesis Tipos de pruebas de hiptesis Etapas de una prueba de hiptesis Formulas de algunos estadsticos de prueba Prueba de Hiptesis con MegaStat-EXCEL

Curso: Uso de Excel en la Educacin

Pgina - 2 -

Escuela de Postgrado Universidad Nacional de Trujillo

PARTE 1: CONCEPTOS GENERALES


1. DEFINICIN DE ESTADSTICA: La Estadstica es una ciencia que nos ofrece un conjunto de mtodos y tcnicas para recopilar, organizar, presentar, analizar e interpretar un conjunto de datos respecto a variables en estudio de una poblacin, con el fin de obtener conclusiones y tomar decisiones sobre determinados hechos o fenmenos en estudio. La estadstica es una rama de la matemtica y es parte del mtodo cientfico. En la actualidad, para hacer investigacin cientfica se necesita conocer de estadstica. 2. CLASIFICACION DE LA ESTADSTICA La Estadstica se clasifica de la siguiente manera: 2.1. Estadstica Descriptiva Es aquella rea de la Estadstica que describe y analiza una poblacin, sin pretender sacar conclusiones de tipo general. Es decir, las conclusiones obtenidas con validas solo para dicha poblacin. 2.2. Estadstica Inferencial Es aquella rea de la Estadstica, cuyo propsito es inferir o inducir leyes de comportamiento de una poblacin, a partir del estudio de una muestra. Es decir las conclusiones obtenidas a partir de una muestra, son validas para toda la poblacin. 3. UNIVERSO: Es el conjunto de individuos, objetos o entes que tienen caractersticas comunes, definidas en forma general en un espacio y tiempo. Ejemplo: Conjuntos de alumnos, conjunto de docentes universitarios, conjunto de de pacientes, conjunto de clientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos, conjunto de documentos, etc.; de una determinada regin o zona en un tiempo determinado. 4. POBLACIN: Es un conjunto grande y completo de individuos, elementos o unidades que presentan como mnimo una caracterstica en comn y observable. Para definir una poblacin esta debe contener los siguientes elementos: contenido, espacio y tiempo. Al nmero de elementos de una poblacin de denota por N. Una poblacin puede clasificarse de la siguiente manera: A. Segn su extensin: Poblacin Finita: Es aquella que tiene un determinado nmero de elementos. Poblacin Infinita: Es aquella cuyos elementos no se pueden contar.

Curso: Uso de Excel en la Educacin

Pgina - 3 -

Escuela de Postgrado Universidad Nacional de Trujillo

B.

Segn su mbito o naturaleza: Poblacin Objeto: Esta dada por los elementos que forman la poblacin. Poblacin Objetivo: esta dada por la informacin que da la poblacin objeto

Nota: De un universo se pueden desprender muchas poblaciones, operativamente se pueden hablar indistintamente como poblacin o universo.

pero

5.

MUESTRA Es una parte o un subconjunto de la poblacin en estudio. Tambin se puede decir que es una coleccin de unidades de muestreo seleccionados de un marco muestral o de varios marcos muestrales. Al nmero de elementos de la muestra se denota por n. Una muestra tiene las siguientes caractersticas: a. Es representativa. b. Es adecuada. Para la determinacin del tamao de muestra se utilizan tcnicas de muestreo donde dependiendo de esta, se utiliza correctamente las formulas adecuadas.

6.

MUESTREO Es una tcnica estadstica por la cual se realizan inferencias o generalizaciones para una poblacin examinando solo una muestra de ella. Es una tcnica empleada para seleccionar elementos de una poblacin. Su propsito es proporcionar diferente tipo de informacin estadstica de naturaleza cuantitativa o cualitativa. Por su gran importancia los investigadores lo utilizan en los diferentes campos de saber y tambin lo usamos en la vida diaria.

7.

UNIDAD DE ESTUDIO: Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar la informacin. Es el individuo u objeto del cual se toman las mediciones u observaciones. Ejemplos: Un docente, un auxiliar de educacin, un votante, una factura, una empresa, una botella de cerveza, una universidad, una vaca, una gota de sangre, etc.

8.

OBSERVACIONES: Estadsticamente son los datos que se recolectan para un estudio. Una observacin o dato es cuando una variable en si toma un valor especifico.

9.

VARIABLE: Una variable es una caracterstica de estudio de una poblacin. Una variable es lo que se quiere evaluar en una investigacin. Las caractersticas toma diferentes valores que varan de individuo a individuo o de objeto a objeto. Aquellas caractersticas que permanecen inalterables en las unidades de estudio reciben el nombre de constantes.

Curso: Uso de Excel en la Educacin

Pgina - 4 -

Escuela de Postgrado Universidad Nacional de Trujillo

Generalmente, las variables se designan con las ltimas letras maysculas del abecedario: X, Y, Z; y los valores de las variables se designan con letras minsculas: xi , yi , etc. Las variables se clasifican de la siguiente manera: Por su relacin: Variable dependiente - variable independiente. Por su escala de medicin: Nominal Ordinal Intervalo Razn. Por su naturaleza: Cuantitativas - Cualitativas. Ejemplos: Unidad de estudio Estudiante Empresa PYME Variable Peso, talla, edad, ci, nmero de hermanos, raza, color de ojos, tipo de sangre, etc. Ganancia, costos, produccin, nmero trabajadores, numero de computadoras, etc. de

Nmero de trabajadores, aos de funcionamiento, ganancias, etc.

Variable

Cualitativa

Cualidad o Atributo

Cuantitativa

Cantidad o Nmero

Nominal

Ordinal

Discreta Conteo

Continua Medicin

No orden 10. PARAMETRO:

Orden

Es un valor, una cantidad, un indicador que se obtiene con informacin de la poblacin. Dentro de estos tenemos: a. El promedio poblacional b. La varianza poblacional. c. La proporcin poblacional, etc. 11. ESTIMADOR: Es un valor, una cantidad, un indicador que se obtiene con informacin de la muestra. Dentro de estos tenemos:

Curso: Uso de Excel en la Educacin

Pgina - 5 -

Escuela de Postgrado Universidad Nacional de Trujillo

a. b. c.

El promedio muestral. La varianza muestral. La proporcin muestral, etc.

12.

TCNICAS DE RECOLECCIN DE DATOS: Las tcnicas de recoleccin de datos permiten la obtencin sistemtica de informacin acerca de los objetos de estudio (personas, objetos y fenmenos) y de su entorno. Como ya se mencion, la recoleccin de datos tiene que ser sistemtica, ya que, si los datos se recolectan al azar ser difcil responder las preguntas de investigacin de una manera concluyente. Las tcnicas de recoleccin de datos son 1. 2. 3. 4. 5. 6. Utilizacin de la informacin disponible Observacin Entrevista( cara a cara) Cuestionarios auto administrados Discusin con grupos focales Otras

OBSERVACIN: La observacin es una tcnica que implica seleccionar ver y registrar sistemticamente, la conducta y caractersticas de seres vivos, objetos o fenmenos. La observacin de la conducta humana es una tcnica de recoleccin de datos muy utilizada que puede llevarse a cabo de diferentes formas: a. b. Observacin participativa: El observador participa en la situacin que observa Observacin no participativa: El observador no participa en la situacin que observa

Las observaciones pueden servir para diferentes propsitos. Pueden dar informacin adicional y ms confiable de la conducta de las u.e. que las entrevistas o los cuestionarios. Los cuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o porque los entrevistados olvidan o no desean contestar algunas cosas. Con la observacin se puede, entonces, verificar la informacin recolectada (especialmente sobre temas como alcoholismo, drogadiccin, sida,) pero tambin puede ser una fuente primaria de informacin (observacin sistemtica de los juegos de los nios). La observacin de la conducta humana puede formar parte de algn estudio, pero como consume tiempo se usa con mayor frecuencia en estudios de pequea escala. ENTREVISTA:

Curso: Uso de Excel en la Educacin

Pgina - 6 -

Escuela de Postgrado Universidad Nacional de Trujillo

La entrevista es una tcnica de recoleccin de datos que involucra el cuestionamiento oral de los entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas durante la entrevista pueden ser registradas por escrito o grabadas en una cinta. La entrevista puede conducirse con diferentes grados de flexibilidad. Las entrevistas utilizan una cdula para asegurar que se discuten todos los puntos, pero dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer preguntas adicionales para obtener tanta informacin adicional como sea posible, Las preguntas son abiertas y no hay restricciones para las respuestas. Este mtodo poco estructurado de hacer las preguntas puede ser til para entrevistas individuales o grupales con informantes claves. Un mtodo de entrevista flexible es til si el investigador sabe poco del problema o de la situacin que esta investigando. Se aplica en estudios exploratorios y en los estudios de caso. ENCUESTAS: Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo de obtener informacin de una muestra de individuos. Esta "muestra" es usualmente slo una fraccin de la poblacin bajo estudio. Una "encuesta" recoge informacin de una "muestra." Una "muestra" es usualmente slo una porcin de la poblacin bajo estudio. Las encuestas pueden ser clasificadas en muchas maneras. Una dimensin es por tamao y tipo de muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no humanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas). Mientras que muchos de los principios son los mismos para todas las encuestas, el foco aqu ser en mtodos para hacer encuestas a individuos. Las encuestas pueden ser clasificadas por su mtodo de recoleccin de datos. Las encuestas por correo, telefnicas y entrevistas en persona son las ms comunes. En los mtodos ms nuevos de recoger datos, la informacin se entra directamente a la computadora ya sea por un entrevistador adiestrado o an por la misma persona entrevistada. Un ejemplo bien conocido es la medicin de audiencias de televisin usando aparatos conectados a una muestra de televisores que graban automticamente los canales que se observan OTRAS TCNICAS DE RECOLECCION DE DATOS a. b. c. d. e. f. g. h. i. Tcnica de grupo nominal Tcnica delphi Historias de vida Escalas Ensayos Estudios de casos Mapeo Tcnicas rpidas de evaluacin de sondeo Encuestas participativas.

Curso: Uso de Excel en la Educacin

Pgina - 7 -

Escuela de Postgrado Universidad Nacional de Trujillo

13.

INSTRUMENTOS DE RECOLECCIN DE DATOS: Si tenemos presente el tema de investigacin por el que nos estarnos guiando se percibir que, una vez obtenidos los indicadores de los elementos tericos y definido el diseo de la investigacin, se har necesario estructurar las tcnicas d recoleccin de datos correspondientes, para as poder construir los instrumentos que nos permitan obtener tales datos de la realidad. Un instrumento de recoleccin de datos es, en principio, cualquier recurso de que pueda valerse el investigador para acercarse a los fenmenos y extraer de ellos informacin. Ya adelantbamos que dentro de cada instrumento concreto pueden distinguirse dos aspectos diferentes: una forma y un contenido. La forma del instrumento se refiere al tipo de aproximacin que establecemos con lo emprico, a las tcnicas que utilizamos para esta tarea; una exposicin ms detallada de las principales es la que se ofrece al lector en este mismo captulo. En cuanto al contenido ste queda expresado en la especificacin de los datos concretos que necesitamos conseguir; se realiza, por lo tanto, en una serie de tems que no son otra cosa que los indicadores bajo la forma de preguntas, de elementos a observar, etc. De este modo, el instrumento sintetiza en s toda la labor previa de investigacin: resume los aportes del marco terico al seleccionar datos que corresponden a los indicadores y, por lo tanto, a las variables o conceptos utilizados; pero tambin expresa todo lo que tiene de especficamente emprico nuestro objeto de estudio, pues sintetiza a travs de las tcnicas de recoleccin que emplea, el diseo concreto escogido para el trabajo.

PRCTICA N 01

Docente: Luis Alberto Rubio Jcobo Instruccin: En los siguientes casos identificar la unidad de estudio, tipo de variable, la poblacin y la muestra en los siguientes casos que se presentan. CASO N 01:

TESIS: Aplicacin del Programa Informtico MATHEMATICA en el Rendimiento Acadmico en la asignatura de Matemtica I, en los estudiantes del primer ciclo de la especialidad de Matemtica de la Carrera Profesional de Educacin Secundaria de la Universidad Nacional de Trujillo
Unidad de estudio Variable de estudio Poblacin Muestra

Tipo:

Curso: Uso de Excel en la Educacin

Pgina - 8 -

Escuela de Postgrado Universidad Nacional de Trujillo

CASO N 02 TESIS: Propuesta

metodolgica basada en Infoescuela en el desarrollo de habilidades, destrezas y actitudes para el diseo de programas computacionales en los alumnos de Computacin Aplicada a la Educacin Primaria de la U.N.T.

Unidad de estudio Variable de estudio Poblacin Muestra CASO N 03 Tipo:

TESIS: PROPUESTA METODOLGICA PROTESIPSI Y EL DESARROLLO DE HABILIDADES Y ACTITUDES PARA LA PRODUCCIN DE CUENTOS, FBULAS Y LEYENDAS EN LOS ALUMNOS DEL 6 GRADO DE LA I. E. 80461 DEL DISTRITO DE TAURIJA PATAZ.

Unidad de estudio Variable de estudio Poblacin Muestra CASO N 04 Tipo:

TESIS: Aplicacin del Programa Esquematizando problemas y su influencia en el desarrollo de capacidades de las alumnas del 5to. Grado de Educacin Primaria del Colegio Estatal N 81007 Modelo de Trujillo, en el rea lgico matemtica. Ao 2004

Unidad de estudio Variable de estudio Poblacin Muestra

Tipo:

CASO N 05

TESIS: La implementacin de un Sistema de Gestin Acadmica mejora la Gestin de los Colegios Estatales de la Ciudad de Trujillo.

Curso: Uso de Excel en la Educacin

Pgina - 9 -

Escuela de Postgrado Universidad Nacional de Trujillo

Unidad de estudio Variable de estudio Poblacin Muestra

Tipo:

CASO N 06 TESIS: PROGRAMA DE DESARROLLO DE INTELIGENCIA LINGSTICA Y SU EFECTO EN LA COMPRENSIN LECTORA, EN LOS ALUMNOS DEL 5 GRADO DE PRIMARIA DE LA INSTITUCIN EDUCATIVA REPBLICA ARGENTINATRUJILLO.2005.

Unidad de estudio Variable de estudio Poblacin Muestra Tipo:

Un gran profesional es aquel que no encuentra obstculos sino retos

Curso: Uso de Excel en la Educacin

Pgina - 10 -

Escuela de Postgrado Universidad Nacional de Trujillo

PARTE 2: PRESENTACIN DE LA INFORMACIN


En la Estadstica se trabaja generalmente con una gran cantidad de datos los cuales por facilidad de anlisis y clculos se organizan en Cuadros de Distribucin de Frecuencias (CDF) y Grficos Estadsticos (GE). 1. CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF): Un cuadro de distribucin de frecuencias, es una tabla resumen rectangular de un conjunto de datos que muestra el comportamiento o distribucin de la variable en estudio en forma rpida y resumida. An cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta, generalmente es comn seguir algunos pasos que de alguna forma homogenizan criterios y ayudan a los fines didcticos. Para realizar este anlisis se tienen que tener en cuenta el tipo de variable que se esta evaluando. 2. PARTES DE UN CUADRO DE DISTRIBUCION DE FRECUENCIAS: Las partes de un CDF son las siguientes: a. b. c. d. e. f. g. 3. Nmero del cuadro de frecuencias en forma correlativa. Ttulo: Especificar la variable y la poblacin en estudio Encabezado o conceptos. Cuerpo o contenido del cuadro de frecuencias Nota de pie (no siempre es necesaria) Fuente Elaboracin

ELEMENTOS PARA CONSTRUIR UN CDF: Para construir un cuadro de frecuencias se utilizan los siguientes elementos: A. Valores de la variable Xi: Los valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50 datos sus valores correspondientes no agrupados se representan como X 1, X2, X3, ..., X50 . B. Intervalos de clase: Los intervalos son subconjuntos de la recta real Ron que estn definidos por un lmite menor o inferior Li y un lmite mayor o superior Ls. C. Frecuencia: 1. Frecuencia absoluta simple: Se denotan por fi. Est constituida por el nmero de veces que se repite un valor. En el caso de intervalos es el nmero de observaciones comprendidas en dicho intervalo. Estas frecuencias siempre son enteros positivos y adems la suma de todos ellos es el tamao de la muestra n.

Curso: Uso de Excel en la Educacin

Pgina - 11 -

Escuela de Postgrado Universidad Nacional de Trujillo

2.

Frecuencia relativa: Se denotan por hi. Indica la relacin o proporcin existente entre la frecuencia absoluta simple y el nmero total de datos. Estas frecuencias son numeros fraccionarios positivos entre o y 1. Para fines interpretativos estas frecuencias se expresan en % (hi%) . As:

hi
3.

fi n

hi(%)

fi x100 n

Frecuencia absoluta acumulada: Se denotan por Fi. Resulta de la suma de las frecuencias cuyas marcas de clase son iguales o menores a la marca de clase del intervalo dado o considerado, es decir: F1 = f 1 F2 = f1 + f2 F3 = f1 + f2 + f3 ............................................. Fj = f1 + f2 + f3 + ....... + fi

4.

Frecuencia relativa acumulada: Se denotan Hi. Resulta de la suma de las frecuencias relativas simples hasta la frecuencia del intervalo considerado. As: H4 = H6 = h1 + h2 + h3 + h4 h1 + h2 + ....+ h6

Para fines interpretativos estas frecuencias se expresan en % (Hi%) D. Marca de clase: Se denota por Yi. Es el promedio de los valores correspondientes a los lmites inferior y superior de cada uno de los intervalos determinados.

4.

PROPIEDADES DE UN CDF: A. B. C. D. E. Las fi y Fi son siempre nmeros enteros positivos. Es decir: fi , Fi 0 Las hi y Hi son siempre nmeros fraccionarios positivos comprendidos entre 0 y 1, es decir 0 hi , Hi 1 F1 siempre es igual f1 y H1 siempre es igual a h1. La suma de todas las fi es igual a n y la suma de las hi es igual a 1. Fm siempre es igual a n y Hm siempre es igual a 1.

5.

CONSTRUCCIN DE CUADROS DE FRECUENCIAS:

Curso: Uso de Excel en la Educacin

Pgina - 12 -

Escuela de Postgrado Universidad Nacional de Trujillo

Para la construccin de los CDF hay que tener en cuenta el tipo de variable que se esta analizando, es decir, si es cuantitativa continua, cuantitativa discreta o variable cualitativa. A. CDF PARA UNA VARIABLE CUANTITATIVA CONTINUA: Para la construccin de este cuadro hay que realizar los siguientes pasos: PASO 1. Determinar el Rango del conjunto de datos. R = Valor mximo - Valor mnimo PASO 2. Determinar el nmero de intervalos m. m = 1 + 3.322 log ( n )

Este valor siempre es un nmero entero (Redondeo) PASO 3. Determinar la amplitud A intervlica (de cada intervalo). A = R/m Este valor esta en funcin de la estructura de la base de datos (tomar el inmediato superior) PASO 4. Determinar el nuevo rango R2 (Solamente si se tomo un inmediato superior) R2 = A * m A: es la amplitud teniendo en cuenta el inmediato superior. PASO 5. Determinar los intervalos y finalmente construir el cuadro.

B.

CDF PARA UNA VARIABLE CUANTITATIVA DISCRETA: Para la construccin de un CDF para una variable cuantitativa discreta (valores discretos) ya no se utiliza los pasos anteriores solamente colocar en los intervalos a los diferentes valores discretos.

C.

CDF PARA UNA VARIABLE CUALITATIVA: Para la construccin de un CDF para una variable cualitativa se sigue los mismos pasos que para una variable cuantitativa discreta, es decir, solamente colocar en los en los intervalos a las diferentes categoras de la variable cualitativa.

6.

CONSTRUCCION DE CDF CON EXCEL: Si bien es cierto que el EXCEL no es un programa exclusivamente diseado para anlisis de datos, es muy utilizado dentro del anlisis de estos cuando se realiza una investigacin cientfica. Una de las ventajas y razones de su uso, est en su fcil acceso, pues en todas las computadoras est instalado y as se podr explorar el funcionamiento de las herramientas que se presentan en este programa.

Curso: Uso de Excel en la Educacin

Pgina - 13 -

Escuela de Postgrado Universidad Nacional de Trujillo

A.

CONSTRUCCION DE CUADROS DE FRECUENCIA UTILIZANDO TABLAS DINAMICAS: Para construir cuadros de distribucin de frecuencias a travs de Excel se utiliza la herramienta TABLAS DINAMICAS ver el uso de este programa analizaremos la siguiente base de datos respecto a 50 casos y 10 variables de estudio. (Archivo BASE 01.exe). Teniendo en cuenta esta base de datos realizar los siguientes pasos: Hacemos clic en Insertar /tabla dinmica .. aparece la siguiente pantalla:

Luego aparecen las siguientes ventanas de trabajo.activamos (a) lista de base de datos de Excel y (b) Tabla Dinmica. Luego siguiente seleccionamos el rango respectivo, luego siguiente..luego seleccionamos la opcin diseo. En la opcin diseo seleccionamos la variable que vamos a analizar y con el cursor activamos dicha variable y lo arrastramos hasta la opcin FILA y luego la misma variable la arrastramos hasta la opcin DATOS. Finalmente aceptamos y obtenemos los resultados.

En funcin a lo que se quiera obtener como resultados de la variable analizada, se selecciona OPCIONES DE TABLA DINMICA para obtener ya sea totales, promedio o frecuencia de dicha variable. Esta ventana de trabajo es la siguiente:

B.

CONSTRUCCION MEGASTAT:

DE

CUADROS

DE

FRECUENCIA

UTILIZANDO

Para construir cuadros de distribucin de frecuencias con Megaestat se utiliza la opcin Complementos/MegaStat Distribucin de Frecuencias. Luego se debe seleccionar para variables cuantitativas o variables cualitativas.

Curso: Uso de Excel en la Educacin

Pgina - 14 -

Escuela de Postgrado Universidad Nacional de Trujillo

Si se selecciona variable cuantitativa se aprecia la siguiente ventana, donde debemos ingresar el rango de los datos de la variable, luego se hace la seleccin de datos respectiva y activamos algn tipo de grafico. Se puede realizar algunas modificaciones al CDF dependiendo del investigador como tamao de intervalos, nmero de intervalos, lmite superior, lmite inferior, etc.

7.

GRAFICO ESTADSTICO Un grfico estadstico es una representacin pictrica, cuyo objetivo es expresar el comportamiento de una variable en estudio. Los grficos estadsticos son representaciones de informacin real que existe en nuestro mundo, es una expresin artstica de datos reales y observados. Un grfico sirve tambin para comparar visualmente el comportamiento de dos o ms variables similares o relacionadas.

8.

PARTES DE UN GRAFICO ESTADISTICO: Numeracin. Titulo: Aqu se seala la poblacin en estudio y la variable de inters. Diagrama: esta dado por comportamiento de los datos. el propio dibujo el cual representa el

Escalas y/o leyendas: Son indicadores donde se precisa la correspondencia entre los elementos del grfico y la naturaleza de las medidas representadas. Fuente: Aqu se seala el CDF que permiti obtener el respectivo grfico. 9. CRITERIOS PARA CONSTRUIR GRAFICOS:

Curso: Uso de Excel en la Educacin

Pgina - 21 -

Escuela de Postgrado Universidad Nacional de Trujillo

No existe una regla especfica para la construccin de grficos, pero si es posible considerar algunas recomendaciones o criterios. Se emplea una diversidad de grficos, cuya estructura o forma depender del tipo de variable que se est estudiando. Este grfico debe tener rasgos simples y de fcil comprensin.

10.

TIPOS DE GRAFICOS ESTADISTICOS Hay varias tipos de grficos, los cuales dependen del tipo de variable que esta evaluando. Presentaremos aqu los mas importantes: a. b. c. d. e. f. g. h. Grfico de bastones: Se utiliza cuando se tienen datos de una variable cuantitativa discreta. Histograma: Se utiliza cuando se tienen datos de una variable cuantitativa continua. Grfico de Barras: Se utiliza cuando se tienen datos de una variable cualitativa. Grfico Sectorial o Pastel: Se utiliza cuando se tienen informacin de una variable cualitativa o cuantitativa discreta. Polgono de frecuencias: Se utiliza para indicar el comportamiento de un conjunto de datos. Grfico de series de tiempo: Se utiliza para analizar variables cuantitativas continuas pero expresadas en el tiempo. Grafico de Cajas y Bigote: Se utiliza para analizar el comportamiento de una variable cuantitativa. Se obtiene en base a los cuartiles. Grafico de la telaraa: Sirve para visualizar el comportamiento de una variable cuantitativa cuando evala ciertos criterios de evaluacin.

11.

CONSTRUCCIN DE GRAFICOS ESTADISTICOS DE EXCEL: Excel puede crear grficos a partir de datos previamente seleccionados en una hoja de clculo. El usuario puede insertar un grfico en una hoja de clculo, o crear el grfico en una hoja especial para grficos. En cada caso el grfico queda vinculado a los datos a partir de los cuales fue creado, por lo que si en algn momento los datos cambian, el grfico se actualizar de forma automtica. Los grficos de Excel contienen muchos objetos, ttulos, etiquetas en los ejes que pueden ser seleccionados y modificados individualmente segn las necesidades del usuario. Para crear un grfico con el Asistente para Grficos, se deben seguir los siguientes pasos: 1. Seleccionar los datos a representar. 2. Ejecutar el comando Insertar / Grfico o hacer clic en el botn

Curso: Uso de Excel en la Educacin

Pgina - 22 -

Escuela de Postgrado Universidad Nacional de Trujillo

A continuacin aparece el siguiente cuadro de dilogo del Asistente para Grfico..que permite elegir el tipo y subtipo de grfico que se va a utilizar entre dos listas que son estndares y personalizados.

Luego seleccionar el rango de los datos a evaluar, sealando correctamente las series que estn evaluando.

Luego debemos configurar los aspectos que conciernen a la presentacin del grfico, aportando una vista preliminar del mismo. As, se determinan el ttulo, las inscripciones de los ejes, la apariencia de stos, la leyenda, la aparicin o no de tabla de datos y los rtulos. Las opciones de <Atrs, Siguiente> y Finalizar son las mismas que en los otros cuadros. Finalmente hacer clic en el botn Finalizar, el grfico aparece ya en el lugar seleccionado. Si se quiere desplazar a algn otro lugar sobre la propia hoja en que se encuentra basta seleccionar todo el grfico y arrastrarlo con el mouse.

Curso: Uso de Excel en la Educacin

Pgina - 23 -

Escuela de Postgrado Universidad Nacional de Trujillo

PARTE 3: MEDIDAS ESTADSTICAS


La estadstica descriptiva es una tcnica que consiste en obtener indicadores que describen el comportamiento de un conjunto de datos. Dentro de estas medidas estadsticas tenemos: A. Las medidas de Posicin: Dentro de estas tenemos: a. b. B. C. Medidas de tendencia central: Media, Moda, Mediana. Medidas de localizacin: cuartiles, deciles y percentiles.

Las medidas de variacin: rango, varianza, desviacin estndar, coeficiente de variacin. Las medidas de deformacin: asimetra y kurtosis.

1.

MEDIDAS DE TENDENCIA CENTRAL 1.1. MEDIA ARITMTICA: Se denota por

Es la medida estadstica ms fcil de calcular. La media o promedio es el punto central de un conjunto de datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 1.2. MEDIANA: Se denota por Me. Es un valor que divide al conjunto de datos en dos partes iguales, es decir, cada segmento tiene el 50% de los datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 1.3. MODA: Se denota por Mo. La moda es el valor que ms se repite en un conjunto de datos. En un conjunto de datos se presentan los siguientes casos: a. No existir datos b. 1 moda c. 2 modas d. 3 a ms modas Amodal Unimodal. Bimodal Multimodal

Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

2.

MEDIDAS DE LOCALIZACIN:

Curso: Uso de Excel en la Educacin

Pgina - 24 -

Escuela de Postgrado Universidad Nacional de Trujillo

2.1. CUARTILES: Se denotan por Qk, donde k=1,2,3 Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir, cada sector tiene el 25% de los datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 2.2. DECILES: Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9 Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir, cada sector tiene el 10% de los datos. 2.3. PERCENTILES: Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, , 99 Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir, cada sector tiene el 1% de los datos. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados.

3.

MEDIDAS DE VARIABILIDAD: 3.1. RANGO: Se denota por R y la medida de variabilidad ms fcil de calcular. Es la diferencia que existe entre el valor mximo y el valor mnimo del conjunto de datos. 3.2. VARIANZA: Mide la variabilidad de un conjunto de datos respecto a un valor central(promedio) Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilgica su interpretacin. Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin son datos agrupados o datos no agrupados. 3.3. DESVIACIN ESTANDAR: Mide la variabilidad de un conjunto de datos respecto a su valor central pero en unidades originales. Esta es la medida de variabilidad que tiene una interpretacin lgica. Se obtiene al sacra la raz cuadrada de la varianza. 3.4. COEFICIETE DE VARIACIN: Se denota por C.V.

Curso: Uso de Excel en la Educacin

Pgina - 25 -

Escuela de Postgrado Universidad Nacional de Trujillo

El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento homogneo o heterogneo. Para llegar a determinar la homogeneidad se compara con un valor convencional del 33%. Si el CV 33% el conjunto de datos tiene un comportamiento homogneo. Si el CV > 33% el conjunto de datos tiene un comportamiento heterogneo.

4.

MEDIDAS DE FORMA: 4.1. ASIMETRIA: La asimetra se entiende como la deformacin horizontal de un conjunto de datos. Para conocer esta asimetra se calcula el coeficiente de asimetra As. En un conjunto de datos pueden presentar los siguientes casos: a. b. c. As= 0, el conjunto de datos es simtrica. As<0, el conjunto de datos es asimtrica negativa. As>0, el conjunto de datos es asimtrica positiva.

As

Mo S

As

3( X S

Me)

As

Q3 2Q2 Q1 Q3 Q1

4.2. KURTOSIS: Se entiende por Kurtosis a la deformacin vertical de un conjunto de datos, es decir, mide el apuntamiento o achatamiento de un conjunto de datos. Para conocer que tipo de asimetra tiene un conjunto de datos, se utilizan las siguientes formulas: A. Kurtosis en funcin de los momentos: Si K1>3, el conjunto de datos es leptocrtica. Si K1=3, el conjunto de datos es mesoctica. Si K1<3, el conjunto de datos es platicrtica.

K1

M4 (M 2 )2

M4: Momento de orden cuatro respecto a la media M2: Momento de orden dos respecto a la media Curso: Uso de Excel en la Educacin Pgina - 26 -

Escuela de Postgrado Universidad Nacional de Trujillo

B. Kurtosis en funcin de los momentos de orden 4: Si K2>0, el conjunto de datos es leptocrtica. Si K2=0, el conjunto de datos es mesoctica. Si K2<0, el conjunto de datos es platicrtica.

K2

M4 (s) 2

C. Kurtosis en funcin de loscuantiles: Si K3>0.263, el conjunto de datos es leptocrtica. Si K3=0.263, el conjunto de datos es mesoctica. Si K3<0.263, el conjunto de datos es platicrtica .

As
5.

Q3 Q1 2( P90 P 10 )

FORMULAS PARA CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL:


MEDIDAS PARA DATOS NO AGRUPADOS
n

PARA DATOS AGRUPADOS


m

xi n
X
i i

Yi f i n

PROMEDIO

i 1

Xi: datos n = nmero de datos

Yi: Marca de clase o punto medio fi: frecuencia absoluta simple n: nmero de datos.

Procedimiento: Observar la base de datos y determinar el valor que ms se repite. MODA

Mo

Li

A
1

1 2

Li: limite inferior del intervalo modal. A: amplitud intervlica


1 2

fj fj
Me

fj fj
Li

1 1

MEDIANA

Procedimiento: Ordenar la serie ascendente Cuando n impar: Me = valor central Cuando n par: Me = promedio de centrales

n/2 fj

Fj

en

forma

Li: limite inferior del intervalo mediano. A: amplitud intervlica. los valores

n / 2 es el elemento determinante Fj-1: Frecuencia acumulada anterior al intervalo mediano fj: Frecuencia abs. simple del intervalo mediano

Curso: Uso de Excel en la Educacin

Pgina - 27 -

Escuela de Postgrado Universidad Nacional de Trujillo

QUARTILES

Seguir pasos similares a la mediana.

QK

Li

kn / 4 fj kn / 10 fj

Fj

Similar a la Me. Lo nico que cambia es el elemento determinante. CUANTILES

DECILES

Seguir pasos similares a la mediana.

DK

Li

Fj

Similar a la Me. Lo nico que cambia es el elemento determinante.

PERCENTILES

Seguir pasos similares a la mediana.

PK

Li

kn / 100 fj

Fj

Similar a la Me. Lo nico que cambia es el elemento determinante.

6.

FORMULAS PARA CALCULAR LAS MEDIDAS DE DISPERSION O VARIACIN


MEDIDAS PARA DATOS NO AGRUPADOS PARA DATOS AGRUPADOS

RANGO

R V max
N 2

V min
(Xi u)
2

R
m 2 i 1

LS
(Yi

LI
u)2 * fi N

Ls: Limite superior Li: Limite inferior

i 1

POBLACIONAL

Xi : Datos de la poblacin u : promedio poblacional N: Nmero de elementos de la poblacin


n

Yi : Marca de clase u : promedio poblacional N: Nmero de elementos de la poblacin fi: frecuencia absoluta simple
m

VARIANZA

( xi n 1

x)2

( yi s2
i 1

y)2 * fi n 1

s2

MUESTRAL

Xi : Datos de la muestra x : promedio muestral n : Nmero de elementos de la muestra

yi : Marca de clase y : promedio muestral n : Nmero de elementos de la muestra fi: frecuencia absoluta simple

Formulas abreviadas

s2

1 n 1

n i 1

( xi2

n i 1

xi ) 2 n

s2

1 n 1

m i 1

( yi2 f i

m i 1

yi f i ) 2 n

DESVIACION ESTANDAR

s2

D.E. Poblacional

D.E. Muestral

COEFIENTE DE VARIACIN

C.V .

C.V. Poblacional

*100

C.V .

C.V. Muestral

s *100 x

Curso: Uso de Excel en la Educacin

Pgina - 28 -

Escuela de Postgrado Universidad Nacional de Trujillo

7.

MEDIDAS ESTADSTICAS CON MEGASTAT: En Excel los pasos a seguir para obtener estas medidas son las siguientes: a. b. Tener una base de datos respecto a variables cuantitativas. Seleccionar en MegaStat / Estadstica descriptiva/.. aparece la siguiente ventana, luego hay que ingresar los datos respectivos:

APLICACIN: (Evaluacin de un caso) RUBIOJA S.A. es una de las firmas consultoras financieras ms importantes del Per. Ofrece asesora financiera y servicios a firmas particulares y a gobiernos regionales. Grecia Rubio, acababa de ser encargada del departamento de personal de esta empresa. En los tres aos pasados, se han agregado otros ayudantes y hace seis semanas, se sum al departamento un estadstico recin graduado. Damne empez hace poco a revisar las prcticas de contratacin del departamento. Empez la revisin examinando el campo ms crtico, las personas en adiestramiento financiero. La firma contrata entre 60 y 130 de estas personas al ao, segn sea el crecimiento de la firma, el movimiento de empleados y el nmero de perspectivas notables" que encuentre. Prcticamente todos los que estn en adiestramiento financiero se contratan entre los estudiantes del ltimo ao de escuelas superiores con especializacin financiera. Damne seleccion al azar 100 de los 197 candidatos que haban sido contratados hace dos aos y an seguan trabajando. Cada ficha contena la informacin siguiente (los datos van en el apndice adjunto): 1. Genero. (0=Femenino y 1=Masculino) 2. Edad al contratarse 3. Promedio ponderado de sus notas universitarias (escala de 0 a 20). 4. Calidad de la universidad de procedencia. (1=Excelente, 2=Muy buena, 3=Buena y 4=Regular) 5. Nota de la prueba de aptitudes. La prueba produce una puntuacin de 0 (muy improbable que tenga xito en el trabajo) a 100 (muy probable que tenga xito en el trabajo).

Curso: Uso de Excel en la Educacin

Pgina - 29 -

Escuela de Postgrado Universidad Nacional de Trujillo

6. Evaluacin del rendimiento al final del segundo ao. Esta evaluacin produce una puntuacin numrica desde 0 (muy malo) hasta 100 (excelente). La Gerencia de RUBIOJA S.A. estn seguros de que la escala es de intervalo y tambin han decidido, con base en los tres aos de experiencia con dicha escala, que una puntuacin inferior a 50 es insatisfactoria, 50-69 es satisfactoria, 70-89 por sobre el promedio, y por encima de 89 es excelente. Grecia llama al estadstico a su oficina y le dice: "Estoy encantada de tener un estadstico que nos ayude. No estamos an listos a desarrollar un modelo estadstico acabado de lo que constituye una buena contratacin, pero es tiempo de empezar a evaluar algunas de las variables de que tenemos informacin. El gran nmero de personas que contratamos, el alto costo de adiestrarlas y el hecho de que no podemos evaluar realmente los rendimientos, hasta fines del segundo ao, significan que cualquier mejora en nuestra eficacia de contratacin tendr por resultado ahorros sustanciales para la firma. Para comenzar a tratar el tema, Podras dar respuesta a las siguientes preguntas? 1. Necesitamos un resumen de la edad del personal al contratarse, del promedio de calificaciones de grado y de la evaluacin del rendimiento en el segundo ao, para tener una apreciacin general del grupo en adiestramiento financiero. Cul es el perfil de este personal? Es ms alto el puntaje de varones en la nota de la prueba de aptitudes que el de mujeres? Y en la evaluacin del rendimiento? Un criterio inicial en RUBIOJA S.A era mantener la calificacin promedio de grado de los contratados por encima de 14.00. Se sigue manteniendo este criterio? Otro criterio era mantener por lo menos un tercio de los contratados que provengan de escuelas de categora 2. Se sigue manteniendo este criterio? Son diferentes los rendimientos en la prueba de entrada para las diferentes calidades de escuelas de donde provienen los candidatos? Y en la Evaluacin del rendimiento del segundo ao?

2. 3. 4. 5.

Si Ud. fuera el analista que conclusiones le dara a Grecia Rubio respecto al anlisis que realiz. Utilice la siguiente base de datos.
No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Genero 1 1 1 1 1 1 0 1 1 1 1 0 0 1 0 1 1 Edad 22 26 22 23 25 26 27 23 23 26 24 24 36 27 26 24 26 Calificacin 15,41 15,71 12,45 15,69 16,05 16,21 14,42 12,87 13,08 16,30 15,82 14,85 13,31 16,67 16,35 12,50 12,32 Calidad Universitaria 3 1 2 2 1 3 2 3 2 3 4 3 4 4 2 1 1 ndice-xito 62 60 80 86 86 64 54 80 62 77 61 67 95 62 50 62 81 Rendimiento 2 72 71 66 91 48 95 82 92 73 81 67 95 96 59 79 88 52

Curso: Uso de Excel en la Educacin

Pgina - 30 -

Escuela de Postgrado Universidad Nacional de Trujillo

18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75

1 1 1 0 1 1 0 1 0 1 1 1 0 1 1 1 1 1 0 1 0 1 0 1 1 1 1 1 1 1 0 1 1 1 0 1 1 1 0 1 1 1 0 1 1 1 1 0 1 0 1 1 1 1 1 0 0 0

23 24 24 25 23 23 26 25 25 24 23 22 30 24 25 23 24 26 23 26 26 26 23 22 26 24 26 25 24 25 24 22 25 25 23 25 24 24 23 23 26 26 23 24 24 27 22 23 24 25 24 22 23 22 24 26 28 26

14,72 13,94 16,92 13,14 14,92 13,81 15,53 15,33 12,95 12,24 14,94 12,57 12,92 15,94 13,80 14,42 14,72 12,60 14,53 14,76 13,12 13,35 14,76 15,27 17,00 16,57 14,02 13,08 13,93 14,17 14,65 13,92 13,28 12,96 13,97 13,92 14,92 16,33 14,25 15,29 15,23 15,73 12,94 15,96 16,96 12,23 15,35 16,77 16,12 14,34 14,69 14,67 15,56 12,35 13,39 16,99 15,29 15,93

2 2 2 3 3 2 3 3 2 4 4 3 3 1 4 3 2 3 3 4 3 4 2 4 2 2 3 1 3 2 3 1 3 2 2 3 3 2 4 1 3 3 1 1 2 3 2 2 2 3 3 2 2 2 3 1 4 2

76 87 73 85 57 89 70 65 89 87 89 94 71 63 67 96 73 92 88 82 84 86 72 82 77 66 73 85 58 58 79 50 93 75 82 57 67 60 56 94 92 81 73 91 72 85 96 85 89 92 66 85 54 85 65 76 63 89

71 75 75 93 84 90 83 73 97 88 81 74 67 80 64 82 82 81 77 89 95 58 74 89 68 77 67 99 96 97 92 95 67 52 82 83 87 73 67 72 66 95 82 84 98 93 87 57 85 81 95 90 80 48 71 63 87 97

Curso: Uso de Excel en la Educacin

Pgina - 31 -

Escuela de Postgrado Universidad Nacional de Trujillo

76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100

1 1 1 0 1 1 1 1 0 0 1 1 0 1 0 0 0 0 1 1 1 1 1 1 1

25 25 25 23 24 25 23 24 24 25 24 23 23 29 22 26 22 30 25 23 26 23 22 26 23

13,41 15,55 13,97 12,81 12,99 15,67 12,47 12,77 14,67 13,94 14,90 15,44 16,03 12,15 13,42 12,02 13,04 14,35 13,65 12,66 13,22 13,43 15,54 16,51 16,91

3 2 1 4 2 2 3 3 1 3 1 2 4 4 2 4 3 4 2 2 3 3 4 3 3

83 57 96 72 73 53 86 64 80 77 52 70 90 74 95 84 68 92 52 82 56 85 85 64 61

97 79 71 72 89 94 78 89 84 91 69 89 91 89 94 95 78 84 85 69 71 58 93 97 83

Curso: Uso de Excel en la Educacin

Pgina - 32 -

Escuela de Postgrado Universidad Nacional de Trujillo

PARTE 4: ANALISIS DE CORRELACION Y REGRESION


1. ANALISIS DE CORRELACIN: El anlisis de correlacin es una tcnica estadstica que mide el grado de asociacin o afinidad entre las variables cuantitativas consideradas en un estudio. Se llamar CORRELACION SIMPLE cuando se trata de analizar la relacin entre dos variables. Se llamar CORRELACION LINEAL O RECTILINEA si la funcin es una recta, y de CORRELACION NO LINEAL cuando la funcin es una curva o una funcin de grado superior. El COEFICIENTE DE CORRELACION DE PEARSON, es el estadgrafo que mide el grado de asociacin o afinidad entre las variables cuantitativas y se denota por r la cual se define como:

n r n
i 1 n

n i 1

X iYi
n

n i 1

Xi
n

n i 1

Yi
n

X i2

(
i 1

X i )2

n
i 1

Yi 2

(
i 1

Y1 ) 2

Interpretacin: -1 -0.7
Perfecta Alta

-0.4
Baja

0
Baja

0.4
Regular

0.7
Alta

+1
Perfecta

Regular

NEGATIVA

POSITIVA

2.

ANALISIS DE REGRESION 2.1. ANALISIS DE REGRESION LINEAL SIMPLE: El anlisis de regresin es una tcnica estadstica que consisten en determinar la relacin funcional entre dos variables cuantitativas en estudio. Esta relacin funcional entre las variables, es una ecuacin matemtica de la forma Y= A + B X, que recibe el nombre tambin de Funcin de Regresin o Modelo de Regresin. A la variable Y se le denomina variable dependiente, a la variable X independiente y a A,B se les llama parmetros de la ecuacin de regresin. La finalidad del Anlisis de Regresin es hacer pronsticos es decir, hacer estimaciones futuros de la variable dependiente. PASOS A SEGUIR: a. Realizar el diagrama de dispersin y ver el comportamiento de la variable.

Curso: Uso de Excel en la Educacin

Pgina - 33 -

Escuela de Postgrado Universidad Nacional de Trujillo

b.

Aplicar el mtodo de los Mnimos Cuadrados Ordinarios para estimar los parmetros de la ecuacin. Las formulas son las siguientes:
n B
n i 1

X i Yi
n

n i 1 n

Xi

n i 1

Yi

A Y

BX

i 1

X i2

i 1

X i )2

c.

Para hacer el pronstico o el valor estimado de Y, reemplazar en la ecuacin matemtica el respectivo valor de Xo, de la siguiente manera: Y = A + B (Xo)

2.2. REGRESION LINEAL MULTIPLE: El ARLM es una tcnica estadstica que consiste en determinar el modelo de regresin linel mltiple de una variable respuesta (Y) y un conjunto de variables independientes (Xs). El modelo de regresin lineal mltiple esta dado por la siguiente ecuacin:

X1

X 2 ...

XK

Para encontrar este modelo, es decir, estimar sus coeficientes tambin se utiliza el Mtodo de los Mnimos Cuadrados Ordinarios. Los elementos de este modelo de regresin mltiple son los siguientes: Y es la variable dependiente o variable respuesta. A las Xs se le llama variables independientes. Bs se les llama coeficientes de regresin. En el ARLM se prueban las siguientes Hiptesis: Ho: Los Bs son iguales a cero (No hay efecto de las variables independientes en Y); H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y). Para dar respuesta a esta Hiptesis se utiliza el anlisis de varianza. 2.3. REGRESION LINEAL CON EXCEL (MEGASTAT): Para realizar estos ejercicios se deben realizar los siguientes pasos: Hacer clic en Complementos / MegaStat / y aparece la siguiente ventana.

Curso: Uso de Excel en la Educacin

Pgina - 34 -

Escuela de Postgrado Universidad Nacional de Trujillo

Luego aparece la ventana de dialogo donde hay que ingresar el rango de Y, el rango de X, activar rtulos, las opciones de salida y algunas alternativas de inters para el investigador.

Luego tomar las decisiones respectivas. APLICACIN 01 LA EMPRESA HIDRANDINA de la ciudad de Trujillo, esta haciendo un estudio sobre los consumos de energa (en miles de kilowatts hora) y el nmero de reas de trabajo en un conjunto de Empresas Privadas Para este estudio se selecciona una muestra aleatoria de 10 Empresas Privadas, en la cual se obtuvo los siguientes resultados: a. Estimar la ecuacin de regresin lineal. b. Evale el consumo (en miles de kilowattshora), para una Empresa que tiene 6 reas de trabajo.
N de casa Nmero de reas de trabajo Consumo de energa (miles de kw) 4 11 10 5 3 6 3 18 14 7

1 2 3 4 5 6 7 8 9 10 Total

2 4 4 3 1 3 1 5 5 3

SALIDA DEL MEGASTAT:


Regression Analysis

r r Std. Error

0.857 0.926 2.021

n k Dep. Var.

10 1 Consumo de energa (miles de kw)

ANOVA table Source Regression Residual Total SS 196.2333 32.6667 228.9000 df 1 8 9 MS 196.2333 4.0833 F 48.06 p-value .0001

Curso: Uso de Excel en la Educacin

Pgina - 35 -

Escuela de Postgrado Universidad Nacional de Trujillo

Regression output variables Intercept Nmero de reas de trabajo coefficients -1.8889 3.2222 std. error 1.5763 0.4648 t (df=8) -1.198 6.932 p-value .2651 .0001

confidence interval 95% lower 95% upper 5.5237 1.7460 2.1504 4.2941

APLICACIN 02:
N de maquina 1 2 3 4 5 6 Tiempo de antigedad (aos) 1 1 2 2 3 3 Costo de mantenimiento. ($) 14 16 20 24 30 28

Total

El Gerente de la UNT est haciendo un estudio entre el gasto de mantenimiento de sus computadoras y el ao de antigedad de dichas maquinas. Para esto recurre a la oficina de Mantenimiento y Contabilidad obteniendo la siguiente informacin: a. Estime la ecuacin de regresin lineal. b. Estime cuanto sera el costo de mantenimiento de una computadora que tiene 7 aos. c. Calcule e interprete el valor del coeficiente de regresin lineal r

APLICACIN 03: El jefe de personal de una institucin educativa cree que existe una relacin entre la tardanza al trabajo y la edad del trabajador. Con el propsito de estudiar el problema tom en cuenta la edad de diez trabajadores escogidos al azar y contabiliz los das de tardanza durante todo un ao. Los resultados fueron como se observa en la tabla que sigue: a. Construya el diagrama de dispersin. b. Obtenga la ecuacin de la recta de regresin c. Si un docente tiene 38 aos, Cuntos tardanzas se espera que falte al ao? d. Si un trabajador tiene 3 tardanzas al ao Qu edad se puede esperar que tenga este trabajador? e. Determinar el grado de relacin entre las variables en estudio

N 1 2 3 4 5 6 7 8 9 10 Total

Edad en aos 25 50 35 20 45 50 30 40 62 40

N de Tardanza e un ao 20 5 10 20 8 2 15 12 1 8

Curso: Uso de Excel en la Educacin

Pgina - 36 -

Escuela de Postgrado Universidad Nacional de Trujillo

PARTE 5: DISTRIBUCIONES DE PROBABILIDAD


1. LA DISTRIBUCIN BINOMIAL La Distribucin Binomial es una las distribuciones de probabilidad discretas ms importantes, la cual tiene muchas aplicaciones en Ingeniera, Administracin, etc.. Esta distribucin se origina en los Ensayos o Experimentos Bernoulli que consiste en realizar 1 experimentos que tiene dos resultados posibles, llamados xito y fracaso. Ejemplos: 1. Lanzar una moneda 2. Rendir un examen. Ensayos de Bernoulli 3. Observar el sexo de un recin nacido. 4. Encender una maquina, etc Experimento Binomial: Es aquel que consiste en realizar n veces ensayos de Bernoulli, en el cual se debe cumplir lo siguiente: a. Cada ensayo tienen solo dos resultados posibles. b. Los ensayos son independientes. c. La probabilidad de xito p es constante en cada ensayo. Esta distribucin tienen las siguientes caractersticas: 1. Su variable aleatoria esta definida como: X: Numero de xitos en n ensayos. 2. Su recorrido o rango es: Rx = {0,1,2,3,4,5, , n} 3. Su funcin de probabilidad esta dada por:

f ( x)
4.

P( X

x)

n x n p q x

,x

0,1,2,..., n

5. 6.

Sus parmetros son : n : Numero de veces que se repite el experimento o tamao de muestra. p : Probabilidad de xito en cada uno de los ensayos o proporcin de inters. Su notacin es : X B ( n, p ) Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente A. B. C. D. E. F. G. P P P P P P P ( ( ( ( ( ( ( Xa X>a Xa X=a aX aX a<X ) = Usar directamente la tabla )=1- P(Xa) )=1- P(Xa-1) )=P(Xa)-P(Xa-1) b ) = P ( X b ) - P ( X a-1 ) < b ) = P ( X b-1 ) - P ( X a-1 ) < b ) = P ( X b-1 ) - P ( X a )

Curso: Uso de Excel en la Educacin

Pgina - 37 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN CON MEGASAT: APLICACIN 01: En el almacn de la Empresa MAESTROS, hay 12 artculos elctricos de los cuales 3 de ellos son defectuosos. Si se extrae una muestra aleatoria de 5 a partir del grupo. Cual es la probabilidad de que: a. Exactamente 1 sea defectuosos. b. Ninguno sea defectuoso. c. Menos de 2 sean defectuosos. d. Ms de 3 sean defectuosos. SOLUCION:

Binomial distribution 5 n 0.25 p cumulative probability 0.23730 0.63281 0.89648 0.98438 0.99902 1.00000

X 0 1 2 3 4 5

P(X) 0.23730 0.39551 0.26367 0.08789 0.01465 0.00098 1.00000

1.250 expected value 0.938 variance 0.968 standard deviation

Curso: Uso de Excel en la Educacin

Pgina - 38 -

Escuela de Postgrado Universidad Nacional de Trujillo

Binomial distribution (n = 5, p = 0.25) 0.60 P(X) 0.40 0.20 0.00 0 1 2 X 3 4 5

APLICACIN 02: En la UNT Escuela de Postgrado se est aplicando un nuevo mtodo de enseanza del aprendizaje del Idioma Portugus. Despus de completar con la aplicacin de este mtodo se evala que el 1% salio desaprobado. El director acadmico selecciona en forma aleatoria estudiantes al azar de la Universidad: a. Cual es la probabilidad de que exista ms de 3 desaprobados. b. Cual es la probabilidad de que exista menos de 3 desaprobados. c. Cual es la probabilidad de que haya entre 2 y 4 desaprobados inclusive. APLICACIN 03: Segn informacin de Secretara Acadmica de la UNT, el 65% de los estudiantes son del sexo masculino y el resto mujeres. Para la aplicacin de una encuesta por parte de la asistenta social, se selecciona aleatoriamente a 10 estudiantes: a. Cual es la probabilidad de encuestar a menos de 5 hombres. b. Cual es la probabilidad de encuestar mas de 5 hombres c. Cual es la probabilidad de encuestar a 3 y 8 hombres inclusive. d. Cual es la probabilidad de encuestar a ningn hombre.

2. LA DISTRIBUCIN POISSON La Distribucin de Poisson es otra de las distribuciones de probabilidad discretas ms importantes por que se aplica en muchos problemas reales. Esta distribucin se origina en problemas que consiste en observar la ocurrencia de eventos discretos en un intervalo continuo (unidad de medida). Ejemplos: 1. Numero de manchas en un metro cuadrado de un esmaltado de un refrigerador. 2. Numero de vehculos que llegan a una estacin de servicios durante una hora. 3. Numero de llamadas telefnicas en un da. 4. Numero de clientes que llegan a un banco durante las 10 y 12 p.m. 5. Numero de bacterias en un cm3 de agua. Esta distribucin tienen las siguientes caractersticas: 7. Su variable aleatoria esta definida como: X: Numero de ocurrencias en 1 unidad de medida (Tiempo, Volumen, Superficie, etc) 8. Su recorrido o rango es:

Curso: Uso de Excel en la Educacin

Pgina - 39 -

Escuela de Postgrado Universidad Nacional de Trujillo

Rx = {0,1,2,3,4,5, .} 9. Su funcin de probabilidad esta dada por:

f ( x)

P( X

x)

e ( )x , x!

0,1,2,...

10. Su parmetro es : tasa promedio de ocurrencia en 1 unidad de medida. 11.Su notacin es : X P( ) 12. Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente H. I. J. K. L. M. N. P P P P P P P ( ( ( ( ( ( ( Xa X>a Xa X=a aX aX a<X ) = Usar directamente la tabla )=1- P(Xa) )=1- P(Xa-1) )=P(Xa)-P(Xa-1) b ) = P ( X b ) - P ( X a-1 ) < b ) = P ( X b-1 ) - P ( X a-1 ) < b ) = P ( X b-1 ) - P ( X a )

APLICACIN CON MEGASTAT APLICACIN 01: En un estudio de Satisfaccin del Cliente en la UNT, se determino que las personas llegan aleatoriamente a la ventanilla de caja, con una tasa promedio de 24 personas por hora, durante la hora punta comprendida entre 11:00 am y 12:00 am de cierto da. El jefe administrativo desea calcular las siguientes probabilidades: a. Cual es la probabilidad de que lleguen exactamente 5 personas durante esa hora? b. Cual es la probabilidad de que lleguen mas de 5 personas durante esa hora? c. Cual es la probabilidad de que lleguen menos de 5 personas durante esa hora? d. Cual es la probabilidad de que lleguen ms de 8 personas durante esa hora? SOLUCION:

Curso: Uso de Excel en la Educacin

Pgina - 40 -

Escuela de Postgrado Universidad Nacional de Trujillo

Poisson distribution
mean rate of 24 occurrence cumulative probability 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00001 0.00005 0.00015 0.00043 0.00108 0.00252 0.00540 0.01072 0.01983 0.03440 0.05626 0.08713 0.12828 0.18026 0.24264 0.31393 0.39170 0.47285 0.55400 0.63191 0.70382 0.76774 0.82253 0.86788 0.90415

X 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

P(X) 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.00001 0.00003 0.00010 0.00027 0.00066 0.00144 0.00288 0.00531 0.00911 0.01457 0.02186 0.03086 0.04115 0.05198 0.06238 0.07129 0.07777 0.08115 0.08115 0.07791 0.07191 0.06392 0.05479 0.04534 0.03628 0.90415

24.000 expected value 24.000 variance 4.899 standard deviation

Curso: Uso de Excel en la Educacin

Pgina - 41 -

Escuela de Postgrado Universidad Nacional de Trujillo

Poisson distribution ( = 24) 0.10 0.08 P(X) 0.06 0.04 0.02 0.00 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 X

APLICACIN 02: Si la secretaria de la Escuela de Postgrado de la UNT, recibe un promedio de 2 llamadas cada 3 minutos por motivos acadmicos. Calcular lo siguiente: a. Cual es la probabilidad de que reciba ms de 3 llamadas en 3 minutos. b. Cual es la probabilidad de que reciba menos de 2 llamadas en tres minutos. c. Cual es la probabilidad de que reciba exactamente 2 llamadas en tres minutos. d. Cual es la probabilidad de reciba 5 llamadas en 6 minutos. e. Cual es la probabilidad de que reciba menos de 2 llamadas en un minuto. APLICACIN 03: En un estudio por parte del Ministerio de Transporte y Comunicaciones (MTC), se ha determinado que en la carretera panamericana con destino a Lima, hay en promedio de 20 accidentes por semana (7 das), calcular las siguientes probabilidades: a. Cul es la probabilidad de que en una semana no haya ningn accidente. b. Cual es la probabilidad de que en dos semanas haya 10 accidentes. c. Cual es la probabilidad de que en 1semana ocurra menos de 15 accidentes. d. Cual es la probabilidad de que en un da haya tres o menos accidentes. e. Cual es la probabilidad de que en un da haya tres o ms accidentes. APLICACIN 04: En el Centro de impresiones de la UNT se comete dos fallas en las impresiones debido a causas externas cada vez que imprime 2,500 hojas como promedio. Con esta informacin determinar: a. La probabilidad de que en una impresin de 500 hojas, ocurra uno ms errores. b. La probabilidad de que no ocurrirn errores en una impresin de 50 hojas. APLICACIN 05: Los clientes de una empresa llegan a la tienda de venta aleatoriamente a una tasa de 300 personas por hora. Calcular la probabilidad de que: a. Una persona llegue durante un periodo de 1 minuto b. Por lo menos dos personas lleguen durante un periodo dado de un minuto. c. Ninguna persona legue durante un periodo de 1 minuto

Curso: Uso de Excel en la Educacin

Pgina - 42 -

Escuela de Postgrado Universidad Nacional de Trujillo

3. LA DISTRIBUCIN NORMAL: La distribucin normal, llamada tambin Curva de Gauss (en recuerdo al cientfico que lo descubri), es la distribucin de probabilidad ms importancia en la Estadstica y por ende del Calculo de Probabilidades. Esta distribucin de probabilidad es importante porque las variables aleatorias continuas (peso, edad, talla, produccin, gasto en publicidad, temperatura, ventas, PBI, ganancias, etc) que son variables que ms se evalan en una investigacin cientfica o investigacin de mercados se aproximan a esta distribucin de probabilidad. Tambin es importante porque se utiliza como aproximacin de las distribuciones discretas tales como: la Binomial, la Poisson, etc. CARACTERSTICAS 1. Tiene como parmetros a y 2. Su funcin de probabilidad est dada por:

f ( x)
-

1 2
Adems: < <+

1 X 2

,
>0

X
+

3. El promedio puede tomar valores entre y + mientras que > 0, entonces existen infinitas curvas normales. 4. Esta funcin de probabilidad es asinttica con respecto al eje X, (a pesar de tener recorrido infinito, la curva nunca toca el eje X); adems es unimodal y es simtrica con respecto a la media . 5. El are bajo esta funcin o curva es 1 100%, de la misma manera se sabe que las reas comprendidas bajo la curva normal son : 1. 2. 3. 2 3 = 68.3% = = 95.5% 99%

5. Para calcular probabilidades en la distribucin normal se necesitaran infinitas tablas de probabilidad.

Curso: Uso de Excel en la Educacin

Pgina - 43 -

Escuela de Postgrado Universidad Nacional de Trujillo

4. LA DISTRIBUCIN NORMAL ESTNDAR: 1. Es una distribucin a la cual se le ha modificado la escala original; esta modificacin se ha logrado restando la media al valor de la variable original y dividiendo este resultado por , la nueva variable se denota por Z y recibe el nombre de variable estandarizada

2. La modificacin de la escala ha permitido elaborar una tabla para el clculo de las probabilidades; si esto no hubiera sido posible, sera necesario construir una tabla para cada valor de y . 3. La funcin de densidad de la variable estandarizada es:
1

f ( z)

1 2

e2

z2

4. El promedio (valor esperado) y la varianza de Z son: E(Z) = 0 , V(Z) = 1 5. Notacin: Si X es v.a. continua distribuida normalmente con media y varianza 2 , la denotamos por : X N( , 2). Aplicando esta notacin a la variable normal estandarizada Z, escribimos: Z N(0 , 1) , esto se interpreta como, Z tiene distribucin normal con media 0 y varianza 1. 6. La superficie bajo la curva normal Z estandarizada tambin es igual a 1. Por consiguiente, las probabilidades pueden representarse como reas bajo la curva normal escandalizada entre dos valores. 7. Debido a que la distribucin normal es simtrica muchas de las tablas disponibles contienen solo probabilidades para valores positivos de Z. USO DE TABLA: Si se conoce el comportamiento de una variable, es decir, se sabe que tienen una distribucin normal, para calcular las diferentes probabilidades se tiene que estandarizar la variable. Una vez estandarizada la variable, recin utilizar la tabla de la distribucin normal estandarizada o tabla Z. FORMULAS: a. b. c.

P( x P( x
P( a

a)

P(

P( Z x
x

a a
b

) ) 1 P( Z
) P( x a

a) 1 P( x
x b)

a) 1 P(

a
)

P( x b) P( x a)

P(

Curso: Uso de Excel en la Educacin

Pgina - 44 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN CON MEGASTAT APLICACIN 01: El rendimiento acadmico de los estudiantes de la UNT-Escuela de Postgrado, tiene una distribucin normal con media igual a 15 y varianza igual a 4. Si se selecciona un estudiante de esta Universidad, encuentre la probabilidad de que: a. El rendimiento sea menor que 16 b. El rendimiento sea menor que 14 c. El rendimiento este entre 14 y 18 d. El rendimiento sea mayor 15.5 SOLUCION

Reemplazando valores:

Curso: Uso de Excel en la Educacin

Pgina - 45 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN 02: Los salarios mensuales de los trabajadores administrativos de la UNT tiene un comportamiento normal cuya media es S/. 2100 y una desviacin estndar de S/. 50. Cuantos trabajadores tienen salarios: a. Menores de S/. 2150. b. Menos de S/. 2200. c. Mas de S/. 2180. d. Entre 2080 y 2150 soles. APLICACIN 03: El tiempo de duracin de los focos elctrico de los caones proyectores tienen una distribucin normal con una media de 1000 horas y una desviacin estndar de 250 horas. Determinar la probabilidad de que: a. Un foco tomado al azar se queme antes de las 990 horas de funcionamiento b. Un foco se que queme entre 980 y 1120 horas de funcionamiento. c. Un foco dure mas de 998 horas APLICACIN 04: NEUMA Per, es una empresa que produce llantas para automviles en nuestro pas. La vida til de estas llantas se distribuye aproximadamente como una normal con media y desviacin estndar iguales a 32000 y 1000 millas respectivamente. Esta empresa quiere exportar estas llantas por lo que empieza a hacer ciertos clculos acerca de la calidad de estas llantas, para lo cual se hace las siguientes preguntas: a. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida til de 31900 millas. b. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida til desde 31000 y 33000 millas. c. Si las empresa fija una garanta de 30000 millas. Qu porcentaje de esta produccin necesitar ser reemplazada?

Curso: Uso de Excel en la Educacin

Pgina - 46 -

Escuela de Postgrado Universidad Nacional de Trujillo

PARTE 6: ESTIMACIN ESTADSTICA


ESTIMACIN: Es el proceso mediante el cual se intenta determinar el valor del parmetro de la poblacin a partir de la informacin de una muestra. Al realizar una estimacin siempre se va a cometer un error. Existen dos tipos de estimacin: A. ESTIMACIN PUNTUAL B. ESTIMACIN INTERVLICA

A. ESTIMACION PUNTUAL: Es aquel nico valor que se obtiene de la muestra, es decir, que para su clculo se debe tener informacin muestral. Las formulas para calcular o realizar estas estimaciones son las siguientes: PROMEDIO PARAMETRO
n

VARIANZA
2

PROPORCION

P
( xi n 1 x )2

ESTIMACION PUNTUAL

xi n

i 1

i 1

a n

B. ESTIMACIN INTERVLICA: Al realizar una estimacin, siempre se va a cometer un error. Entonces, cuando estimamos un parmetro nunca va a ser exacto, ese valor ser mayor o menor al verdadero. Entonces se obtendr un intervalo de valores posibles. Ese intervalo se llama estimacin intervlica. A esa diferencia mayor o menor se llama error de estimacin, el cual esta en relacin directa con la variabilidad del estimador y el nivel de confianza determinado por el investigador. La estimacin intervalica para un parmetro en general, esta dada por:

/2

/2

Error de Estimacin Tambin se puede escribir de la siguiente manera:

Error de estimacin

/2

Para determinar este intervalo se necesita de: a. La estimacin puntual b. La desviacin estndar del estimador. c. Nivel de confianza, el cual ser repartido para cada lado del intervalo.

Curso: Uso de Excel en la Educacin

Pgina - 47 -

Escuela de Postgrado Universidad Nacional de Trujillo

FORMULAS DE LOS INTERVALOS DE CONFIANZA I. INTERVALO DE CONFIANZA PARA EL PROMEDIO POBLACIONAL A. Si la muestra (n) es mayor de 30 y la varianza poblacional es conocida:

:x

/2

n s n

B. Si la muestra (n) es menor o igual a 30 y la varianza poblacional es desconocida:

:x

t(

/ 2 , n 1)

II. INTERVALO DE CONFIANZA PARA LA PROPORCION POBLACIONAL A. Si la proporcin poblacional se conoce:

P: p

/2

PQ n

B. Si la proporcin poblacional No se conoce: (entonces hay que calcularla en la muestra)

P: p

/2

pq n

III. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS A. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas poblacionales se CONOCEN:

: ( x1

x2 )

2 1 /2

2 2

n1

n2

B. Si las muestras son de tamao n1<30 y n2<30 (pequeas) y adems las varianzas poblacionales DESCONOCIDAS:
1 2

: ( x1

x2 ) t(

/ 2 , n1 n 2 2 )

sc2 (

1 n1

1 ) n2

Donde :

sc

(n 1 1)s 12 (n 2 1)s 2 2 n1 n 2 2

, se llama varianza mancomunada

IV. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES: A. Si p1 y p2 se determinan a partir de muestras:

P1

P2 : ( p1

p2 )

/2

p1 q1 n1

p2 q2 n2

Curso: Uso de Excel en la Educacin

Pgina - 48 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN UTILIZANDO MEGASTAT


RESPECTO AL PROMEDIO: APLICACIN 01: Los estudiantes de Administracin de Empresa de una Universidad realizaron un trabajo de aplicacin respecto a los sueldos de los trabajadores de la mina YANACOCHA, para lo cual seleccionaron una muestra aleatoria de 24 trabajadores en el cual se determin que el sueldo promedio semanal es de $160 y una varianza de 10 dolares 2. a. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza. b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza. SOLUCION:

Curso: Uso de Excel en la Educacin

Pgina - 49 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN 02: La Gerencia de la empresa HAMILTON LIGH esta interesado en conocer el contenido de nicotina promedio de su marca de cigarrillos. Para lo cual selecciona una muestra de 14 cigarros obteniendo un promedio de 25 miligramos y una varianza de 16 miligramos 2. a. Calcular un intervalo de confianza para el sueldo promedio con el 99% de confianza. b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza. c. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza. APLICACIN 03: Nuestro amigo BRUNO se dedica al negocio de los AUTOS, el sospecha que su margen de beneficios mensual promedio por auto vendido est por debajo del promedio nacional de S/. 700. Para evaluar su margen de beneficio toma informacin (muestra) respecto a 8 meses cuya informacin es la siguiente: MES BENEFICIO a. b. c. 1 800 2 840 3 780 4 850 5 810 6 790 7 805 8 800 Promedio Varianza

Calcular un intervalo de confianza para el margen de beneficio promedio con el 99% de confianza. Calcular un intervalo de confianza para el margen de beneficio promedio con el 95% de confianza. Calcular un intervalo de confianza para el margen de beneficio promedio con el 90% de confianza.

RESPECTO A LA PROPORCION: APLICACION 04: Segn un vendedor de automviles, de todos los vehculos adquiridos por los docentes universitarios, en ms del 80% de los casos el color es elegido por la mujer. Para verificar esta hiptesis se toma una muestra de 400 parejas que han comprado autos nuevos durante el ltimo ao, hallndose que en 310 casos el color fue en efecto elegido por la dama. Calcular: a. El intervalo confidencial para la proporcin considerando el 99 % de confianza. b. El intervalo confidencial para la proporcin considerando el 90% de confianza. SOLUCION

Curso: Uso de Excel en la Educacin

Pgina - 50 -

Escuela de Postgrado Universidad Nacional de Trujillo

RESPECTO A LA DIFERENCIA DE PROMEDIOS: 1. La SUNAT esta haciendo auditoria en ciertos grifos gasolineras. Selecciona en forma aleatoria 05 grifos de 2 empresas diferentes (Texaco y Repsol). Los ingresos en miles de soles semanales se presentan a continuacin: TEXACO : 90 85 95 76 80 REPSOL : 84 87 90 92 90 a. Estimar un intervalo de confianza para la diferencia de medias (DIFERENCIA DE LOS INGRESOS PROMEDIOS) con el 90% de confianza. b. Estimar un intervalo confidencial para la diferencia de medias (DIFERENCIA DE LOS INGRESOS PROMEDIO) con el 99% de confianza. RESPECTO A LA DIFRENCIA DE PROPORCIONES: 1. Se toman muestras independientes para determinar el la proporcin de personas que esta a favor de un impuesto al combustible. La primera muestra consiste en 100 personas que solamente trabajan en Trujillo y la segunda muestra es de 100 personas del cercado de Trujillo. Se determina que 50 y 60 personas de las respectivas muestras estn de acuerdo con el aumento. a. Calcular un intervalo de confianza para la diferencia de proporciones considerando el 99% de confianza. b. Calcular un intervalo de confianza para la diferencia de proporciones considerando el 90% de confianza.

Curso: Uso de Excel en la Educacin

Pgina - 51 -

Escuela de Postgrado Universidad Nacional de Trujillo

PARTE 7: DETERMINACION DEL TAMAO DE MUESTRA


MUESTREO
Es una TCNICA ESTADSTICA por la cual se realizan inferencias a la poblacin examinando solo una parte de ella, sta parte recibe el nombre de MUESTRA, la cual debe ser estadsticamente representativa y adecuada. Ventajas: Desventajas: Costo reducido Presencia del error de muestreo Mayor rapidez y exactitud Presencia de gran variabilidad de las obs. Minimiza los costos.

TCNICAS DE MUESTREO
Existen 2 tipos de tcnicas de muestreo: A. TECNICAS PROBABILISTICAS: B. TECNICAS NO PROBABILISTICAS Muestreo aleatorio simple El muestreo a criterio o juicio. Muestreo aleatorio estratificado El muestreo por cuotas. Muestreo sistemtico El muestreo por conveniencia. Muestreo por conglomerados etc Etc.

DETERMINACIN DEL TAMAO DE MUESTRA :


Para determinar el tamao, primeramente hay que identificar la variable a estudiar (Cuantitativa o cualitativa). Luego depende de cuatro factores o elementos que son los siguientes: PARA UNA VARIABLE CUANTITATIVA: a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%, 95% o 99% y que origina el valor de Z. b. El error de estimacin (E): Que tambin es fijado por el investigador c. La desviacin estndar varianza: que son valores que se obtienen por estudios anteriores, por la muestra piloto o por la distribucin de la poblacin. d. El Tamao de la poblacin (N): Que generalmente no se conoce. PARA UNA VARIABLE CUALITATIVA: a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%, 95% o 99% y que origina el valor de Z. b. El error de estimacin (E): Que tambin es fijado por el investigador c. La proporcin poblacional (P): que son valores que se obtienen por estudios anteriores, por la muestra piloto y si no se conoce asumir p=0.5. d. El Tamao de la poblacin (N): Que generalmente no se conoce.

Curso: Uso de Excel en la Educacin

Pgina - 52 -

Escuela de Postgrado Universidad Nacional de Trujillo

FORMULAS PARA DETERMINAR EL TAMAO DE MUESTRA:


VARIABLE POBLACION INFINITA (Cuando no se conoce N) POBLACION FINITA (Cuando se conoce N) Cualitativa (Proporcin Poblacional) Cuantitativa (Promedio Poblacional)

n0

Z 2 P(1 P) E2
n

n0

Z 2S 2 E2

Z 2 P(1 P) N E 2 ( N 1) Z 2 P(1 P)

Z 2S 2N E 2 ( N 1) Z 2 S 2

Z= es el valor de la distribucin normal estandarizada para un nivel de confianza fijado por el investigador. S= Desviacin estndar de la variable fundamental del estudio o de inters para el investigador. Obtenida por estudios anteriores, muestra piloto, criterio de experto o distribucin de la variable de inters. P= es la proporcin de la poblacin que cumple con la caracterstica de inters. E= % del estimador o en valor absoluto (unidades). Fijada por el investigador. N= Tamao de la poblacin.

PASOS A SEGUIR PARA DETERMINAR LA MUESTRA PTIMA:


A. B. C. Identificar eL tipo de variable a analizar. Asumir que la poblacin es infinita y aplicar la formula respectiva sealadas anteriormente. Esta muestra se llama muestra previa. Luego si se conoce el tamao de la poblacin N, obtener la fraccin de muestreo

n0 N

n0 N n0 Si N
Si

5% , entonces la muestra definitiva es n0 (muestra previa)


5% , entonces se ajusta la muestra.

D. Para ajustar la muestra se tiene que aplicar la siguiente formula:

n0 n0 1 N

, n es la muestra final.

ESTIMACION DE LOS VALORES A APLICAR EN LAS FORMULAS


A. Valor de Z: es el valor de la abcisa de la distribucin normal estandarizada teniendo en cuenta el nivel de confianza fijado por el investigador, por lo tanto este valor se encuentra en las tablas estadstica respectiva. Para hacer el trabajo menos tedioso, presentamos a continuacin los diferentes valores de Z

Curso: Uso de Excel en la Educacin

Pgina - 53 -

Escuela de Postgrado Universidad Nacional de Trujillo

TABLA N 01 VALORES DE LA DISTRIBUCIN NORMAL ESTANDARIZADA(Z) Nivel de confianza (1- ) 90% 95% 98% 99% = = = = 0.90 0.95 0.98 0.99 Nivel de significancia ( ) 10% = 0.10 5% = 0.05 2% = 0.02 1% = 0.01 Valor Z Bilateral 1.64 1.96 2.32 2.57 Unilateral 1.28 1.64 2.05 2.32

B. Clculo del Valor de P: Se calcula este valor cuando la variable de estudio es cualitativa.
TABLA N 02 P 0.05 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95 COMPORTAMIENTO DE P y Q Q=1-P 0.95 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.05 PQ 0.0475 0.090 0.160 0.210 0.240 0.250 0.240 0.210 0.160 0.090 0.0475

C. Clculo del Valor de la varianza (Si la variable es CUANTITATIVA): este valor es obtenida por estudios anteriores, muestra piloto, criterio de experto o distribucin de la variable de inters. D. Clculo del error de estimacin: Generalmente se asume 2%, 5%, y 8% de error. Este valor es fijado por el investigador. Es la diferencia entre el parmetro (poblacin) y el estimador (Muestra). Es decir: E

o o .Este error puede ser

absoluto o relativo. Si E=0.35 se denomina error absoluto. Si consideramos un error del 10% de la media, es decir, E=10%( x )=0.10(3.5)=0.35 se denomina error relativo.

APLICACIN UTILIZANDO MEGASTAT APLICACIN 01:


Cul ser el tamao de corridas de produccin adecuado si se requiere estimar el tiempo promedio para efectuar la produccin de un producto qumico con una confianza del 95%. Adems en un estudio piloto se encontr el investigador asume E = 0.35 horas. APLICANDO MEGASTAT:

3.5

horas y s = 2.2 horas y adems

Curso: Uso de Excel en la Educacin

Pgina - 54 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN 02: El Director de la seccin de control de la rabia del Dpto. de Salud Pblica de la Ciudad de Chiclayo desea obtener una muestra de los registros de dicho Dpto. acerca de las mordidas de perro reportadas durante el ao anterior, para estimar la edad media de las personas mordidas. El director desea una seguridad del 95%, con un E=2.5 y en base a estudios anteriores conoce que la desviacin estndar es de 15 aos. De que tamao debe ser la muestra? APLICACIN 04: Se desea estimar el tiempo medio de duracin de artefactos elctricos (focos) producidos por la empresa PHILIPSS. Se sabe por un estudio piloto de 10 focos que la desviacin estndar del tiempo de duracin es de 20 meses. De que tamao debe ser la muestra para estimar el tiempo medio de duracin con un error mximo de 4 meses y con una confianza del 95%?. APLICACIN 05: Por estudios cientficos se sabe que el Coeficiente de Inteligencia promedio para jvenes segn la escala de Weshler es de 100 puntos con una desviacin estndar de 15 puntos. Determinar el tamao de muestra para realizar una investigacin sobre niveles de inteligencia en la UPN, si se admite un error del 2% del promedio y una seguridad del 95%. APLICACIN 06: Se desea estimar la proporcin de jvenes de la ciudad de CHICLAYO que hacen uso de Internet como mnimo una hora diaria con un 95% de confianza. De estudios anteriores se conoce que P=0.70 y se desea un E = 5%. Cual debe ser el tamao de muestra.

Curso: Uso de Excel en la Educacin

Pgina - 55 -

Escuela de Postgrado Universidad Nacional de Trujillo

PARTE 8: PRUEBA DE HIPOTESIS


1. DEFINICIONES PRELIMINARES: a. HIPTESIS: Es una respuesta a priori a un problema. b. HIPTESIS ESTADSTICA: En un enunciado acerca del valor de un parmetro poblacional. c. PRUEBA DE HIPOTESIS: Es un procedimiento basado en la informacin muestral y en la teora de probabilidad, para determinar si una hiptesis estadstica debe ser aceptada o rechazada. 2. CLASES DE HIPOTESIS: 2.1. HIPOTESIS NULA. Se denota por Ho. Es una afirmacin o enunciado tentativo que se realiza acerca del valor de un parmetro poblacional. Por lo comn es una afirmacin acerca del parmetro de poblacin cuando toma un valor especfico. 2.2. HIPOTESIS ALTERNATIVA. Se denota por H1. Es una afirmacin o enunciado contraria a la presentada en la hiptesis nula. ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPOTESIS : Error Tipo I:

3.

Se comete este error cuando se rechaza la hiptesis nula, cuando es verdadera. Se denota por = P(Rechazar Ho/Ho es verdadera)
Error Tipo II:

Se comete este error cuando se acepta la hiptesis, cuando es falsa. Se denota por = P(Aceptar Ho/Ho es falsa)

Decisin posible Aceptar Ho

Ho Verdadera Decisin correcta Error tipo I

Ho Falsa Error Tipo II Decisin Correcta

Rechazar Ho

Curso: Uso de Excel en la Educacin

Pgina - 56 -

Escuela de Postgrado Universidad Nacional de Trujillo

4.

TIPOS DE PRUEBAS DE HIPOTESIS: A. PRUEBA BILATERAL O PRUEBA DE DOS COLAS Ho: H1: = 0 0

/2

/2

B. PRUEBA UNILATERAL O PRUEBA DE UNA SOLA COLA:

Prueba de cola inferior o izquierda


Ho: H 1: = <
0 0

Prueba de cola superior o derecha


Ho: H 1: = >
0 0

5.

ETAPAS DE UNA PRUEBA DE HIPOTESIS:

Curso: Uso de Excel en la Educacin

Pgina - 57 -

Escuela de Postgrado Universidad Nacional de Trujillo

6.

FORMULAS DE ALGUNOS ESTADSTICOS DE PRUEBA:

FORMULAS DE LOS ESTADISTICOS DE PRUEBA I. PRUEBA DE HIPOTESIS PARA EL PROMEDIO POBLACIONAL: C. Si n es mayor de 30 y la varianza poblacional es conocida: Estadstico de prueba:

x n

Zt

/2

(distribucin normal)

D. Si n es menor o igual a 30 y la varianza poblacional es desconocida: Estadstico de prueba:

x s n
p P PQ n

tt

t(

/ 2 , n 1)

(distribucin t de student)

II. PRUEBA DE HIPOTESS PARA LA PROPORCION POBLACIONAL Estadstico de prueba:

Zt

/2

Esta formula es tanto para muestras grandes como para muestras pequeas. III. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS C. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas poblacionales se CONOCEN: Estadstico de prueba:

( x1
1

x2 )
2

D n2

Zt

/2

n1

D. Si las muestras son de tamao n1<30 y n2<30 (pequeas) y adems las varianzas poblacionales DESCONOCIDAS:

( x1 Sc

x2 ) 1 n1

D 1 n2

tt

t(

/ 2 , n 1)

(distribucin t de student)

Donde :

sc

(n 1 1)s 12 (n 2 1)s 2 2 n1 n 2 2
( p1 p1 q1 n1 p2 ) D

, se llama varianza mancomunada

IV. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES: B. Si p1 y p2 se determinan a partir de muestras:

p2 q2 n2

Zt

/2

Esta formula es tanto para muestras grandes como para muestras pequeas.

Curso: Uso de Excel en la Educacin

Pgina - 58 -

Escuela de Postgrado Universidad Nacional de Trujillo

PRUEBA DE HIPOTESIS CON MEGASTAT:

PRUEBA DE HIPOTESIS PARA LA MEDIA:

PRUEBA DE HIPTESIS PARA LA PROPORCION:

Curso: Uso de Excel en la Educacin

Pgina - 59 -

Escuela de Postgrado Universidad Nacional de Trujillo

PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES:

PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES:

PRUEBA Z PARA COMPARAR PROPORCIONES:

Curso: Uso de Excel en la Educacin

Pgina - 60 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN UTILIZANDO MEGASTAT:


APLICACIN 01: Las ganancias en miles de dlares de 10 centros educativos de nuestro medio han producido la siguiente informacin: 15.8, 12.7, 13.2 16.9, 10.6, 18.8, 11.1, 14.3, 17.0 y 12.5. Otro conjunto de centros educativos fueron evaluados tambin respecto a sus ganancias en miles dlares, obteniendo los siguientes resultados: 24.9, 23.6, 19.8, 22.1, 20.4, 21.6, 21.8 y 22.5 Realizar una prueba de hiptesis para verificar si las ganancias de este ltimo grupo es superior a las ganancias de las empresas de nuestro medio. Para probar esta hiptesis utilice un = 0.05. SOLUCION: (Aqu se utiliza la prueba T para muestras independientes)

Hypothesis Test: Independent Groups (t-test, pooled variance)


T1 14.290 2.738 10 T2 22.088 mean 1.637 std. dev. 8 n 16 -7.7975 5.3911 2.3219 1.1014 0 df difference (T1 - T2) pooled variance pooled std. dev. standard error of difference hypothesized difference

-7.08 t 2.61E-06 p-value (two-tailed)

Curso: Uso de Excel en la Educacin

Pgina - 61 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN 02:: JORGE MELENDEZ, Administrador deL BCP est interesado en saber si existe diferencia significativa entre los tiempos de atencin al cliente de los mismos empleados que trabajan en los dos turnos: maana y tarde. Al respecto, ayer personalmente registr los tiempos que utilizaron los empleados para atender a sus clientes en ambos turnos. Los tiempos en minutos que registr fueron los siguientes: Maana 2.10 4.10 4.70 3.70 6.00 3.90 Tarde 4.00 4.50 3.70 4.00 4.10 3.45 A la luz de estos resultados, A qu conclusin lleg Jorge Melndez?. Utilice un nivel de confianza del 95%. SOLUCION: (Aqu se utiliza la prueba T para muestras pareadas)

Hypothesis Test: Paired Observations


0.00000 4.08333 3.95833 0.12500 1.30987 0.53475 6 5 hypothesized value mean Maana mean Tarde mean difference (Maana - Tarde) std. dev. std. error n df

0.23 t .8244 p-value (two-tailed)

Curso: Uso de Excel en la Educacin

Pgina - 62 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN 03: Un fabricante de microcircuitos esta interesado en determinar si dos diseos diferentes producen un flujo de electricidad equivalente. El ingeniero responsable ha obtenido la siguiente informacin: Diseo 1 20.3 22.5 23.3 29.1 26.5 22.1 20.8 28.6 23.3 21.5 Diseo 2 Diseo 3 Diseo 4 23.5 29.1 20.3 26.5 26.5 22.5 23.6 22.1 25.5 21.5 25.6 26.7 26.4 23.5 28.9 27.9 26.5 17.3 22.5 25.5 21.5 25.5 26.7 20.4 26.7 20.3 27.9 23.9 22.5 26.5

Con =0.01, se desea determinar si existe alguna diferencia significativa en el flujo de electricidad entre los dos diseos. SOLUCION: (Aqu se utiliza anlisis de varianza)

One factor ANOVA Mean 23.80 24.80 24.83 23.75 24.30 ANOVA table Source Treatment Error Total SS 10.833 327.266 338.099 df 3 36 39 MS 3.6110 9.0907 F 0.40 p-value 0.7558 n 10 10 10 10 40 Std. Dev 3.163 Diseo 1 2.089 Diseo 2 2.657 Diseo 3 3.865 Diseo 4 2.944 Total

Comparison of Groups 30.00 25.00 20.00 15.00 Diseo 1 Diseo 2 Diseo 3 Diseo 4

Curso: Uso de Excel en la Educacin

Pgina - 63 -

Escuela de Postgrado Universidad Nacional de Trujillo

APLICACIN 04: Una compaa desea estudiar el efecto que tiene la pausa para el caf, sobre la productividad de sus obreros. Selecciona 6 obreros y mide su productividad en un da cualquiera (sin pausa para el caf), y luego mide la productividad de los mismos 6 obreros en un da que se concede la pausa para el caf. Las cifras que miden la productividad son las que siguen: Con = 0,05. A qu conclusin llegar la compaa?. TRABAJADOR 1 2 3 4 5 6 Sin pausa 23 35 29 33 43 32 Con pausa 28 38 29 37 42 30

APLICACIN 05: En fecha reciente fue descubierto un neurotransmisor cerebral endgeno llamado galanina. Segn parece, ste afecta de manera directa el deseo de ingerir alimentos con un alto contenido de grasa. Mientras ms alta sea la cantidad de este neurotransmisor de origen natural en un individuo, mayor ser el apetito que este sienta por la comida con alto contenido de grasa. Recientemente una compaa farmacutica desarroll una sustancia experimental que bloquea la galanina sin alterar el apetito por otros alimentos ms saludables (es decir con menos grasas). Un neurocientfico piensa que esa sustancia experimental ser muy til para controlar la obesidad. Se realiza un experimento para lo cual se elige 10 mujeres obesas todas ellas voluntarias y se les administra el medicamento experimental durante 06 meses. Se registra el peso inicial y el peso final (despus de 6 meses) de cada persona. Los pesos se presentan en la siguiente tabla. Probar si el uso del medicamento experimental produce prdida de peso en las personas. Utilice un nivel de significancia de 0.05. Persona PESO INCIAL PESO FINAL (libras) (libras) 1 165 145 2 143 137 3 175 170 4 135 136 5 148 141 6 155 138 7 158 137 8 140 125 9 172 161 10 164 156

Fin
Curso: Uso de Excel en la Educacin Pgina - 64 -