Está en la página 1de 365

ESTADSTICA MDULO NICO CARRERA: CONTADOR PBLICO ADMINISTRACIN DE EMPRESAS CURSO: 3 AO PROFESOR: Lic.

ROBERTO CADAR SALTA - 2007

Educacin
A DISTANCIA

AUTORIDADES DE LA UNIVERSIDAD CANCILLER


Su Excelencia Reverendsima Mons. MARIO ANTONIO CARGNELLO Arzobispo de Salta

RECTOR
Dr. ALFREDO GUSTAVO PUIG

VICE-RECTOR ACADMICO
Dr. GERARDO VIDES ALMONACID

VICE-RECTOR ADMINISTRATIVO
Ing. MANUEL CORNEJO TORINO

SECRETARIA GENERAL
Prof. CONSTANZA DIEDRICH

DELEGADO RECTORAL del S.E.A.D.


Dr. OMAR CARRANZA

Indice general
CURRICULUM VITAE .................................... 9 I. Fundamentacin ........................................ 13 II. Objetivos .................................................. 13 III. Programa de la asignatura ....................... 13 IV. Bibliografa ............................................... 16 V. Evaluacin y Condicin para regularizar la materia ................................................. 17 VI. Gua de Estudios ..................................... 21 7. Organizacin de los Datos ........................ 43 7.1. Correccin ............................................. 43 7.2. Clasificacin........................................... 43 7.3. Tabulacin ............................................. 44 8. Presentacin de los datos estadsticos ..... 46 8.1. Introduccin ........................................... 46 8.2. Cuadros estadsticos ............................. 46 8.3. Grficos Estadsticos ............................. 52

UNIDAD I
SIGNIFICADO Y ALCANCE DE LA ESTADSTICA ......................................... 21 1. La Estadstica como disciplina cientfica ... 21 2. Aplicaciones de la estadstica ................... 22 2.1. Aplicacin en distintas disciplinas .......... 22 2.2. Aplicacin en la Economa y los Negocios .................................................. 22 3. La Falsedad estadstica ............................ 23

UNIDAD III
DISTRIBUCIN DE FRECUENCIAS .......... 65 1. Introduccin .............................................. 65 2. Series estadsticas ................................... 65 3. Distribucin de frecuencias ....................... 66 4. Distribucin de frecuencias para variables continuas .................................. 66 4.1. Organizacin de los datos ...................... 67 4.2. Construccin de las tablas de frecuencias .............................................. 68

UNIDAD II
LA INVESTIGACIN ESTADSTICA ........... 25 1. Etapas de un trabajo estadstico ............... 25 2. Variables ................................................... 26 3. Datos estadsticos .................................... 28 4. Poblacin y Muestra ................................. 30 4.1. Poblacin ............................................... 30 4.2. Poblacin finita y poblacin infinita ......... 31 4.3. Muestra .................................................. 32 4.4. Parmetro y Estadgrafo ........................ 33 5. Objetivos del Anlisis Estadstico ............. 36 5.1. Estadstica Descriptiva .......................... 36 5.2. Estadstica Inferencial ............................ 37 6. Relevamiento de datos estadsticos .......... 40 6.1. Concepto ............................................... 40 6.2. Clases de fuentes .................................. 40 6.3. Experimentos y Encuestas. Mtodos de recoleccin de datos ................................ 41 6.4. El proceso de obtener datos .................. 42

4.3. Tabulacin de los datos ......................... 70 4.4 Marca de clase (xi) ................................. 71 4.5. Distribucin de frecuencias relativas simples (fr) ............................................... 71 4.6. Grficos de distribucin de frecuencias simples ................................. 73 4.7. Algunas situaciones particulares con las tablas de frecuencias .......................... 75 4.8. Distribuciones de frecuencias acumuladas .............................................. 78 5. Distribucin de frecuencias para variables discretas ................................... 81 6. Distribucin de frecuencias para variables cualitativas ................................ 83

UNIDAD IV
RESUMEN DE INFORMACIN A TRAVS DE MEDIDAS DESCRIPTIVAS ............... 93 1. Concepto .................................................. 93 2. Medidas de posicin ................................. 93

2.1. Media aritmtica ..................................... 94 2.2. Mediana ............................................... 100 2.3 Moda ..................................................... 101 2.4. Media aritmtica, mediana y moda para datos agrupados ............................ 105 Media aritmtica combinada ........................ 106 2.5. Otras medidas de posicin ................... 118 Uso de la G para obtener tasas promedio de crecimiento ........................................ 120 3. Medidas de Dispersin ........................... 131 3.1 Rango ................................................... 132 Caractersticas del Rango .......................... 132 3.2 Desviacin Absoluta Promedio ............. 132 Caractersticas de la DM ............................ 133 3.3 Varianza ............................................... 134 3.4 Desviacin tpica o estndar ................. 135 Principales caracterstica de la desviacin tpica .................................... 136 3.5. Varianza y desvo tpico de una muestra .................................................. 137 3.6. Coeficiente de Variacin ...................... 141 3.7 Varianza y desvo tpico para datos agrupados .............................................. 145 3.8 Otras medidas de dispersin ................ 148 4. Formas de la distribucin ........................ 149 4.1 Simetra y Asimetra .............................. 149 4.2 Distribuciones asimtricas .................... 151 4.3. Coeficiente de Asimetra de Pearson ... 153 4.4. Curtosis ............................................... 154 EL GRFICO DE CAJA ............................ 156

3.2.- Frecuencia relativa de ocurrencia ....... 169 3.3.- Probabilidad subjetiva ......................... 170 4.- Axiomas de Probabilidad ....................... 173 5.- Reglas de Probabilidad .......................... 174 5.1.- Eventos mutuamente excluyentes y no excluyentes. Reglas de la adicin ..... 174 5.2.- Eventos independientes y dependientes. Reglas de la multiplicacin .......................................... 179 Probabilidades conjuntas utilizando tablas de contingencias .......................... 181 6.- Reglas de conteo ................................... 188 6.1.- Regla de la multiplicacin .................... 188 6.2.- Permutaciones .................................... 189 6.3.- Variaciones ......................................... 190 6.4.- Combinaciones ................................... 191 6.5.- Aplicacin de permutaciones y combinaciones para determinar probabilidades ... 192 7.- Teorema de Bayes ................................ 195

UNIDAD VI
DISTRIBUCIN DE PROBABILIDADES ... 209 1.- Distribucin probabilstica ...................... 209 1.1.- Concepto de Funcin .......................... 209 1.2.- Variable aleatoria ................................ 209 1.3.- Funcin probabilstica ......................... 210 1.4.- Distribucin probabilstica ................... 211 2.- Valor esperado ...................................... 213 3.- Media y varianza de la poblacin ........... 214 3.1.- Media de la poblacin .......................... 214 3.2.- Varianza de la poblacin ..................... 215 4.- Distribuciones de probabilidades discretas ................................................ 218 4.1- Distribucin binominal .......................... 218 Uso de las tablas ........................................ 221 4.2.- Distribucin de Poisson ...................... 225 Aproximacin de la distribucin de Poisson a la distribucin binomial ........... 226 4.3.- Distribucin hipergeomtrica ............... 229 5.- Distribucin de probabilidades continuas................................................ 232

UNIDAD V
TEORIA DE LAS PROBABILIDADES ........ 163 1.- Introduccin ........................................... 163 2.- Conceptos bsicos ................................ 163 2.1.- Evento aleatorio - Espacio muestral Experimento ........................................... 164 2.2.- Eventos aleatorios simples y compuestos ........................................... 164 3.- Los tres enfoques de la Probabilidad ..... 168 3.1.- Probabilidad clsica ............................ 168

5.1. Distribucin Normal .............................. 232 5.2. Distribucin exponencial ...................... 246

UNIDAD IX
TEST DE HIPOTESIS ................................ 301 1. Generalidades......................................... 301 2. Procedimiento de las pruebas de hiptesis ................................................. 301 3. Hiptesis exactas e inexactas ................ 305 4. Pruebas de hiptesis con muestras grandes .................................................. 305 4.1 Prueba de una media poblacional .......... 305 4.2 Prueba de la proporcin de la poblacin 307 4.3 Prueba para la diferencia de medias ..... 308 5. Error de tipo II. Curva Caracterstica Operativa y Curva de Potencia de Contraste ............................................... 309 6. Inferencia para muestras pequeas. La Distribucin t de Student ................. 317 6.1 Introduccin ......................................... 317 6.2 Caractersticas 3.................................. 317 6.3 Uso de la tabla ...................................... 318 6.4 Inferencia estadstica utilizando la distribucin t ........................................... 319 6.5 Grados de libertad 4 ............................. 326

APNDICES
Apndice 1 .................................................. 257 Distribucin Probabilisticas Binomiales ....... 257 Apndice 2 .................................................. 260 Probabilidades acumuladas para distribuciones binomiales ....................... 260 Apndice 3 .................................................. 263 Probabilidades Poisson .............................. 263 Apndice 4 .................................................. 267 Apndice 5 .................................................. 268 Valores de e-l .............................................. 268 Diagrama de Contenido - Unidad VII ........... 269

UNIDAD VII
DISTRIBUCION EN EL MUESTREO ........ 271 1. Introduccin ............................................ 271 2. Importancia de la muestra ....................... 271 3. Error muestral ......................................... 272 4. Distribucin en el muestreo ..................... 272 5. Error estndar ......................................... 273 6. Distribucin muestral de medias ............. 273 7. Distribucin muestral de proporciones .... 275 8. Teorema del lmite central ...................... 277

UNIDAD X
LA DISTRIBUCIN JI CUADRADA (c2) ... 333 1. Caractersticas de la distribucin ............ 333 2. Uso de las tablas de c2 .......................... 334 3. Aplicaciones de c2 .................................. 334 3.1 Prueba para la bondad de ajuste ........... 336 3.2 Test de Independencia .......................... 346 3.3 Prueba de Homogeneidad ..................... 348 3.4 Prueba de una varianza de la poblacin 353

UNIDAD VIII
TEORA CLSICA DE LA ESTIMACIN ... 285 1. Introduccin ............................................ 285 2. Estimador y Estimacin .......................... 285 3. Tipos de Estimaciones ............................ 285 4. Propiedades de un buen estimador ......... 286 5. Estimaciones puntuales .......................... 287 6. Estimacin por intervalo ......................... 289 6.1 Introduccin .......................................... 289 6.2 Nivel e Intervalo de Confianza .............. 290 6.3 Clculo de Estimaciones por intervalos para muestras grandes .......... 291

APNDICES
Apndice 6 .................................................. 361 Tabla de nmeros aleatarios ....................... 361 Apndice 7 .................................................. 362 Valores porcentuales de la distribucin t ..... 362 Apndice 8 .................................................. 363 Valores porcentuales de la distribucin X2 .. 363

CURRICULUM VITAE

1. DATOS PERSONALES
APELLIDO Y NOMBRES: CADAR, Roberto Oscar DOCUMENTO: D.N.I. N 12.790.108

2. TTULOS
a)Nivel Medio * Perito Mercantil otorgado por el Colegio Salesiano Angel Zerda en 1974. b) Nivel Superior * Licenciado en Administracin de Empresas otorgado por la Universidad Catlica de Salta en 1983. (Matrcula Profesional 059 - Consejo Profesional de Ciencias Econmicas). * Profesor en Ciencias Econmicas otorgado por la Universidad Nacional de Salta en 1988.

3. CARGOS DESEMPEADOS EN LA DOCENCIA


* Director de Estudios (Titular) del Instituto Superior del Profesorado Jos Manuel Estrada desde 01-04-86 hasta la fecha. * Rector (Suplente) del Instituto Jos Manuel Estrada - Niveles Medio y Terciario, desde el 17-02-92 hasta el 24-09-93. * Jefe de la carrera de Administracin de Empresas (interino) dependiente de la Facultad de Economa y Administracin de la Universidad Catlica de Salta desde el 07-03-89 hasta el 01-05 de 1989. * Supervisor Tcnico de la Direccin General de Educacin Superior dependiente del Ministerio de Educacin de la Provincia de Salta desde el 27-09-93 hasta el 10-12-95. * Secretario Acadmico de la Escuela de Negocios de la U.C.S desde el 2-7-95 hasta el 10-03-97.

4. OTROS CARGOS DESEMPEADOS


* Secretario Tcnico de la Direccin de Estadsticas y Censos de la Universidad Catlica de Salta desde el 03-05-88 hasta el 06-03-89 y del 02-07-89. * Secretario Regional de la Sociedad Argentina de Estadstica desde 1992 hasta la fecha.

5. ANTECEDENTES DOCENTES
a)Nivel Medio - Instituto Jos Manuel Estrada Profesor Titular en las siguientes asignaturas: * * * * Estadstica Metodolgica de 5 ao desde el 08-05-80 a la fecha. Organizacin de Empresas de 5 ao desde el 09-03-81 al 13-03-83. Economa Poltica de 4 ao desde el 17-03-81 al 10-03-85. Contabilidad de 1 ao desde el 12-03-84 hasta agosto de 1986. Profesor suplente en las siguientes asignaturas: * Anlisis de Balance de 5 ao desde el 14-03-83 al 16-05-83 y desde el 22-06-84 al 05-08-84. * Organizacin de Oficinas de 3 ao desde el 01-08-83 al 29-11-83. * Contabilidad de 3 ao desde el 22-06-84 al 05-08-84. - Instituto Privado Carlos Guido Spano * Profesor titular de la asignatura Organizacin del Comercio y la Empresa desde el 19-08-80 hasta el 28-02-85. - Colegio Salesiano Angel Zerda Profesor titular en las siguientes asignaturas: * Sistematizacin Administrativa y Contable de 3, 4 y 5 ao desde marzo de 1982 hasta el 11-12-95.
10

* Organizacin del Comercio y de la Empresa desde marzo de 1984 hasta diciembre de 1997. * Contabilidad y Sistematizacin Administrativa - Contable de 3er. ao desde el 01-02-98 a la fecha. - Bachillerato Integral Ral Scalabrini Ortiz * Profesor suplente de la asignatura Probabilidad y Estadstica desde el 08-10-90 hasta el 30-12-90. - Colegio de la Divina Misericordia * Profesor de Contabilidad de 3 ao desde marzo a julio de 1991. b) Nivel Superior No Universitario Profesor titular en el Instituto Superior del Profesorado Jos Manuel Estrada en las siguientes asignaturas: * Estadstica de 3 ao del Profesorado en Ciencias Jurdicas y Contables desde el 01-04-86. * Metodologa y Prctica de la Enseanza de 4 ao de la carrera del Profesorado en Ciencias Jurdicas y Contables del Instituto del Profesorado Jos M. Estrada desde el 01-04-88 a la fecha. c)Nivel Superior Universitario Profesor adjunto a cargo en la Universidad Catlica de Salta en las siguientes ctedras: * Estadstica en la carrera de Servicio Social desde 17-03-86 hasta la fecha. * Estadstica en la carrera de Administracin de Empresas y la carrera de Economa desde el 18-08-86 hasta la fecha. * Estadstica en la carrera de Geografa desde el 23-03-87 hasta diciembre de 1991. * Estadstica en la carrera de Ingeniera Industrial desde el 26-03-90 al 31-12-90. * Estadstica en la carrera de Comunicaciones Sociales desde marzo de 1991 hasta la fecha.

11

* Estadstica Aplicada en la carrera de Turismo desde agosto de 1992 hasta la fecha. * Administracin del Personal desde el 15-08-88 al 31-12-88 y desde el 14-08-89 al 31-12-89. * Mtodos y Modelos Decisionales en la carrera de Administracin de Empresas desde marzo de 1.994 hasta la fecha.

12

Carrera: Contador Pblico - Administracin de Empresas Curso: 3 Ao Materia: Estadstica Profesor: Lic. Roberto Cadar Ao Acadmico: 2007

I. Fundamentacin
La informacin es un recurso fundamental para la toma de decisiones en todo tipo de organizacin. Los directivos enfrentan el desafo de resolver distintos problemas en condiciones de incertidumbre. Gracias al desarrollo de los mtodos cuantitativos, muchos de estos problemas han encontrado soluciones. La Estadstica ha demostrado ser una herramienta til en todas las disciplinas en los procesos de decisin, en trabajos de investigacin y en evaluacin de proyectos.

II. Objetivos

Conocer el significado y alcance de la Estadstica como disciplina cientfica. Aplicar los mtodos y tcnicas estadsticas a los problemas relacionados con la Economa y los Negocios. Valorar la Estadstica como herramienta fundamental en los procesos de investigacin y toma de decisiones.

III. Programa de la asignatura


Unidad I: SIGNIFICADO Y ALCANCE DE LA ESTADSTICA 1. Estadstica. Diferentes significados. La Estadstica como disciplina cientfica. 2. Aplicaciones de la Estadstica en distintas disciplinas. Importancia en la Economa y Negocios. 3. La falsedad estadstica. Unidad II: LA ESTADSTICA COMO DISCIPLINA CIENTFICA. 1. Etapas de un trabajo estadstico
13

2. Variables. Concepto. Clasificacin. Datos estadsticos. 3. Poblacin. Concepto. Poblacin finita y poblacin infinita. Unidades elementales de observacin. Parmetro. 4. Muestra. Conceptos. Razones para el muestreo. Muestras probabilsticas y no probabilsticas. Estadgrafo. 5. Objetivos del anlisis estadstico. Estadstica Descriptiva. Inferencia Estadstica. 6. Relevamiento de datos. Fuentes internas y externas. Fuentes primarias y secundarias. Mtodos de obtencin de datos. 7. Organizacin de los datos recopilados. 8. Presentacin de la informacin. Cuadros y grficos. Elementos estructurales. Distintos tipos. Construccin. Lectura e interpretacin. Instrumentos de anlisis. Unidad III: DISTRIBUCIN DE FRECUENCIAS 1. Serie simple de datos. Arreglo de datos. Diagramas de tallos y hojas. 2. Series de frecuencias para variables continuas y discretas. Distribucin de frecuencias para variables cualitativas. Construccin de las tablas. Consideraciones bsicas. Distribucin de frecuencias relativas. Grficos: histogramas, polgonos de frecuencias y grfico d e bastones. 3. Distribucin de frecuencias acumuladas. Construccin. Grficos: ojivas y grficos escalonados. Unidad IV: RESUMEN DE INFORMACIN A TRAVS DE MEDIDAS DESCRIPTIVAS 1. Medidas de posicin. Concepto. Limitaciones. Media aritmtica. Mediana. Moda. Media geomtrica. Media armnica. Cuartiles. Deciles. Percentiles. Conceptos. Clculos. Caractersticas. Propiedades. Oportunidad de utilizacin de cada una. Diagrama de caja. 2. Medidas de variabilidad. Concepto. Importancia. Clasificacin. Rango. Desvo absoluto promedio. Varianza. Desviacin tpica. Conceptos. Clculos. Caractersticas. Propiedades. Dispersin relativa. Coeficiente de variacin. 3. Formas de la distribucin. Simetra y Asimetra. Curtosis. Unidad V: TEORA DE LAS PROBABILIDADES 1. Introduccin. Conceptos bsicos.
14

2. Eventos aleatorio. Espacio muestral. Experimento. Eventos simples y compuestos. 3. Los tres enfoques de la probabilidad. Probabilidad clsica. Frecuencia relativa de ocurrencia. Probabilidad subjetiva. 4. Axiomas de probabilidad. 5. Eventos excluyentes y no excluyentes. Regla de la adicin. 6. Eventos independientes y dependiente. Regla de la multiplicacin. 7. Probabilidades conjuntas. 8. Reglas de conteo. Permutaciones. Variaciones. Combinaciones. 9. Teorema de Bayes. Unidad VI: DISTRIBUCIN DE PROBABILIDADES 1. Funcin probabilstica. Distribucin probabilstica. 2. Valor esperado. Media y varianza de la poblacin. 3. Distribuciones de probabilidades discretas. Distribucin binomial. Distribucin de Poisson. 4. Distribuciones de porbabilidades continuas. Distribucin normal. Distribucin exponencial. Unidad VII: DISTRIBUCIONES EN EL MUESTREO 1. Importancia de la muestra. 2. Error muestral 3. Distribucin en el muestreo. Error estndar. Distribucin muestral de medias y de proporciones. 4. Teorema del lmite central. Unidad VIII: TEORA CLSICA DE LA ESTIMACIN. 1. Estimador y estimacin. Tipos de estimacin. 2. Propiedades de un buen estimador. 3. Estimaciones puntuales. 4. Estimaciones por intervalos. Estimaciones de la media poblacional y de la proporcin. Estimacin de las diferencias de medias. Unidad IX: TEST DE HIPTESIS 1. Concepto de hiptesis estadstica. Procedimientos de las pruebas de hiptesis. Hiptesis exactas e inexactas.

15

2. Pruebas de hiptesis para muestras grandes. Prueba de la media poblacional. Prueba de la proporcin de la poblacin. Prueba de la diferencia de medias. Error de tipo II. Curva de caracterstica operativa. Potencia de contraste. 3. Inferencia estadstica para muestras pequeas. La distribucin t de Student. Pruebas de hiptesis. Estimaciones. Unidad X: LA DISTRIBUCIN JI CUADRADA 1. Caractersticas de la distribucin ji cuadrado. 2. Aplicaciones. Prueba de bondad de ajuste. Prueba de independencia. Prueba de homogeneidad. Prueba de la varianza.

IV. Bibliografa
BSICA CHAO, Lincoln, Introduccin a la Estadstica C.E.S.C.S.A. CHOU, Ya Lun, Anlisis EstadsticoEd. Mc. Graw. Hill. KAZMIER, Leonard y DIAZ MATA, Alfredo, Estadstica Aplicada a la Administracin y Economa. Serie Schaum. Ed. Mc.Graw - Hill LEVIN, Richard, Estadstica para Administradores Ed. Prenice may. SHAO, Stephen, Estadstica para Economa y Administracin. Ed. Herrero Hnos.

COMPLEMENTARIA

BERENSON, Mark y LEVINE, David, Estadstica para Administracin y Economa Ed. Interamericana. CHRISTENSEN, Howard, Estadstica Paso a Paso. Ed. Trillas. MENDENHALL, W. Y RENMUTH, J. Estadstica para Administracin y Economa Grupo Ed. Iberoamericana. MILLS, Richard Estadstica para Economa y Administracin, Ed. Mc. Graw-Hill. NETER, J. y WASSERMAN, W. y OTT. Lyman, Fundamentos de Estadstica CECSA. SCHEARFFER, R. Y MENDENHALL, W. y OTT. Lyman. Elementos de Muestreos. Grupo Ed. Iberoamericana. YAMANE, Taro. Estadstica Ed. Harla.

16

DOTTONE, Horacio Estadstica. Ed. Copecultura (Sgo. De Chile) RANKE, J. y REITSCH. A., Pronstico de los negocios. Ed. PreniceHall PUBLICACIONES DEL INDEC (Instituto Nacional de Estadsticas y Censos).

V. Evaluacin y Condicin para regularizar la materia


EVALUACIN a) De seguimiento. A travs del desarrollo de actividades de los mdulos y la participacin en los foros y clases satelitales. b) De resultados. Mediante dos exmenes parciales con posibilidad de un solo recuperatorio. - Primer parcial. Unidades I y II - Segundo parcial. Unidad III c) Condiciones de regularidad. Aprobacin de los dos exmenes parciales con una calificacin mnima de 4 (cuatro).

17

18

DIAGRAMA DE CONTENIDO - BLOQUE N 1

UNIDAD I
SIGNIFICADO Y ALCANCE DE LA ESTADISTICA

Concepto de Estadstica Aplicaciones

La falsedad estadstica

BLOQUE N 1 UNIDAD II
LA INVESTIGACIN ESTADISTICA

19

Etapas de un trabajo estadstica

Variables

Relevamiento de datos Datos estadsticos Poblacin y Muestra Organizacin de los datos Presentacin de la informacin Estadstica Descriptiva e Inferencial Cuadros Grficos

20

VI. Gua de Estudios UNIDAD I SIGNIFICADO Y ALCANCE DE LA ESTADSTICA


1. La Estadstica como disciplina cientfica
En el lenguaje cotidiano se utiliza la palabra "estadstica" como un conjunto de cifras referido a alguna actividad, por ejemplo: nmero de accidentes de trnsito durante un ao, cifras de produccin de cereales; ndices mensuales de precios al consumidor, etc. Sin embargo, por "estadstica" debe entenderse algo ms elaborado y ms susceptible de tratamiento cientfico. En la actualidad, todas las disciplinas utilizan la informacin estadstica con el objeto de planificar cursos de accin, y an cuando se trabaja en condiciones de incertidumbre, deben tomarse las decisiones correspondientes. La Estadstica, precisamente, proporciona un conjunto de mtodos para la preparacin de decisiones acertadas frente a la incertidumbre. Trata de la resolucin de problemas, y en consecuencia, se encuentra dentro de los lmites del mtodo cientfico. Queda claro, entonces, que hoy en da los mtodos estadsticos no se aplican nicamente para reunir cifras histricas, sino que deben permitir el tratamiento de la informacin numrica con fines de obtener conclusiones tiles y elaborar pronsticos. Por ejemplo, en el nuevo escenario econmico, un gerente utiliza los datos de ventas no slo para conocer los resultados econmicos, sino con el propsito de hacer estimaciones y analizar tendencias. De todo lo expuesto, se puede resumir el concepto de Estadstica como sigue: Es la disciplina que comprende un conjunto de teoras, mtodos y tcnicas para obtener, describir e interpretar datos e informaciones con el objeto de tomar decisiones y predecir fenmenos que pueden expresarse en forma cuantitativa.

21

2. Aplicaciones de la estadstica
2.1. Aplicacin en distintas disciplinas
Existen dos tipos extremos respecto a la Estadstica: una aceptacin indiscriminada, donde se pretende tomar decisiones basndose solamente en mtodos estadsticos; o bien, una desconfianza sistemtica en ella, lo que lleva a ignorar muchos hechos de la realidad. Es por ello que debe adoptarse una actitud intermedia, es decir utilizar los mtodos y tcnicas estadsticas como herramientas para el logro de objetivos buscados. Ningn procedimiento estadstico, en s mismo, puede conducir directamente a resultados buscados. La utilizacin adecuada depende de la habilidad y exigencias de quienes los emplee(1) . Como en todas las disciplinas se realizan trabajos de investigacin, los mtodos estadsticos son instrumentos fundamentales de aplicacin. Se pueden citar los siguientes ejemplos: - En Agricultura, un rea relacionada con las Ciencias Biolgicas, se utilizan para determinar los efectos de fertilizantes en la produccin de cereales. - En Medicina, se emplean para determinar los posibles efectos de un nuevo tratamiento para una determinada enfermedad. - En Ingeniera Industrial, es fundamental el conocimiento sobre las tcnicas estadsticas de control de calidad. De la misma manera se puede afirmar que la Estadstica es de gran utilidad en Psicologa, Educacin, Sociologa, Antropologa, Geografa, Turismo, Qumica, etc.

2.2. Aplicacin en la Economa y los Negocios


La creciente complejidad de la Economa provoca cada vez mayor incertidumbre para las operaciones de cualquier empresa, pero como ya se dijo, los administradores deben igualmente resolver problemas y tomar decisiones. Particularmente, en el campo de la Administracin, la Estadstica ha demostrado ser una importante herramienta en reas tales como
1. D'Ottone, Horacio. Op. cit. en la bibliografa.

22

investigacin de mercados, evaluacin de proyectos, pronsticos de ventas, etc. En la actualidad, se trata de incluir todos los mtodos relacionados con las decisiones estadsticas en una teora que las abarque por completo denominada "teora de las decisiones". Se debe puntualizar la importancia de los mtodos estadsticos para cualquier gobierno. Por ejemplo, la obtencin de diferentes indicadores como ser el PBI, ndices de precios, tasas de inters, y otros, sirven no slo para describir el estado actual de la economa, sino que proporcionan ideas de la tendencias, lo que permite evaluar las medidas de un plan econmico. Estos indicadores tambin son utilizados por los distintos sectores econmicos que llevarn a decisiones respecto a las operaciones y polticas de cada uno.

3. La Falsedad estadstica
La mala utilizacin de los mtodos estadsticos llevan a resultados errneos que destruyen el valor de cualquier investigacin. Obtencin de datos insuficientes, construcciones inadecuadas de grficos, datos muestrales no representativos, son algunas de las situaciones que llevan a interpretaciones engaosas y conclusiones equivocadas. Por lo expresado, se requiere de cuidado y prudencia en el manejo de datos estadsticos. Los errores cometidos son involuntarios en muchos casos, pero tambin puede mentirse con estadsticas debido a intereses creados. El primer ministro britnico del siglo XIX, Benjamn Disraeli expres burlonamente que "existen tres tipos de falsedades: las mentiras, las mentiras detestables y las estadsticas". A medida que se avance en el desarrollo de los temas se irn haciendo referencias al mal uso de la estadstica en distintos mtodos, tcnicas y procedimientos.

23

Actividad N 1
1. a. Busque en el diccionario las distintas acepciones del vocablo "estadstica". b. De acuerdo a los conceptos desarrollados en el punto 1 de este mdulo y a las acepciones expuestas en (a), construya su propia definicin de estadstica y explquela. 2. Realice un listado de por los menos 5 actividades o mbitos empresariales donde la estadstica resulte esencial. 3. Ilustre con un ejemplo la aplicacin de la estadstica en cada una de las siguientes disciplinas. a) Geografa b) Turismo c) Educacin d) Psicologa 4) En los procesos decisorios se utilizan tambin los modelos proporcionados por la Investigacin operativa y la Econometra. Investigue cul es la finalidad de cada una y establezca la relacin con la Estadstica. 5) Consulte la bibliografa y elabore un resumen sobre la historia de la Estadstica.

24

UNIDAD II LA INVESTIGACIN ESTADSTICA


1. Etapas de un trabajo estadstico
Toda investigacin estadstica es un procedimiento sistemtico que tiene las siguientes etapas: 1.Formulacin del problema: Debe determinarse en forma precisa el objeto de la investigacin, es decir "el qu" y "el para qu" se investiga. Deben indicarse los sujetos del estudio (unidades de observacin) y las caractersticas de inters (variables). 2.Diseo del experimento: Se denomina "experimento" a la observacin planeada de un fenmeno de cualquier ndole con la finalidad de describir su comportamiento y/o tomar una decisin. Formulado el problema, el investigador debe decidir si estudia toda la poblacin (universo) o slo una parte de ella (muestra). En el Primer caso deber realizar un censo (enumeracin completa de la poblacin). Si elige una muestra, deber disear el procedimiento adecuado para obtener una muestra representativa de la poblacin. 3.Relevamiento de datos: Se procede a recopilar los datos de las distintas fuentes disponibles utilizando los distintos mtodos de recoleccin. 4.Organizacin y presentacin de datos: Los datos organizados y presentados en cuadros (tablas) y/o grficos se convierten en informacin til para facilitar la lectura y el anlisis de la misma. 5.Anlisis: Segn sea el objetivo de la investigacin, el anlisis puede ser descriptivo o inferencial. (Ver tema 5). 6.Interpretacin: Los resultados obtenidos, que estn expresados en lenguaje estadstico, deben ser "traducidos" al lenguaje de la disciplina cientfica en la cual se investiga. La interpretacin permite la elaboracin de conclusiones y la toma de decisiones.

25

2. Variables
Cualquier objeto o evento cuyas caractersticas son observables constituye un "fenmeno". En un sentido ms amplio se puede decir que un "fenmeno" indica qu aspectos de la realidad est bajo observacin o estudio. Sea la siguiente informacin sobre el personal de una universidad. ANTIGEDAD (en aos) CARGO Y SEXO Docentes Administrativos V 0-5 5 - 10 10 y ms TOTAL 3 18 45 66 M 5 16 60 81 V 2 19 22 43 M 4 11 24 39

En la informacin del cuadro hay 3 caractersticas observables: antigedad, cargo y sexo. Cada una de ellas constituye una variable. Una variable es una propiedad o caracterstica de un objeto de estudio que puede asumir distintos valores. Tambin puede definirse como una caracterstica observable de un objeto de estudio que se puede describir segn un esquema de clasificacin y medicin bien definida. VARIABLE Antigedad Cargo Sexo VALORES O CATEGORIA DE VARIABLES 0-5 5 - 10 10 y ms Docente - Administrativo Varn - Mujer

Las variables se clasifican: en a) cualitativas y b) cuantitativas. a) Las variables cualitativas, llamadas tambin "atributos", expresa propiedades de los fenmenos que se pueden describir cualitativamente

26

y, desde luego, no estn representadas numricamente. Ej.: Cargo y Sexo. Otros ejemplos: nacionalidad, nivel instruccin, estado civil, etc. b) Las variables cuantitativas son las expresiones numricas de algunas propiedades de los fenmenos. En la informacin sobre el personal, la antigedad es una variable continua. Otros ejemplos: edad, peso, estatura, etc. Las variables cuantitativas pueden ser: "discretas" o "continuas". - Las variables discretas son aquellas que pueden tomar slo ciertos valores es el intervalo considerado y no admiten valores intermedios. Generalmente son valores enteros. Ej.: el nmero de hijos. Una familia puede tener 0,1, 2... hijos, pero no algn valor intermedio. - Las variables continuas son las que pueden tomar cualquier valor en el intervalo considerado. Ej.: el peso. Una persona que pesa 65 kgs., redondeando a enteras se puede tener la certeza que su peso es un valor entre 64,5 y 65,5 kgs. Puede pesar 65 a 65,385 kgs., o cualquier valor entre 64,5 y 65,5 kgs. Hay muchas variables continuas cuyos valores parecen ser discretos. Por ejemplo, la edad de una persona. Si alguien dice que cumpli 25 aos, en realidad tiene 25 aos ms una fraccin de ao. Ahora bien, el empleo de fracciones o decimales no significa que necesariamente las variables sean continuas. En algunas competencias deportivas participantes pueden recibir calificaciones como 7; 7,5; 8; 8,5. Estos valores son discretos ya que no se puede calificar entre 7 y 7,5. En resumen: - Las observaciones para una variable discreta se obtienen por el proceso de "conteo": nmero de acciones vendidas en la Bolsa, unidades de un producto en un inventario, etc. - Las observaciones para una variable continua se obtienen por el proceso de "medicin": peso, estatura, temperatura, etc.

27

3. Datos estadsticos
Un dato es el valor de la variable. Si una persona es "varn", "docente" y tiene una antigedad de "6 aos" en la universidad, cada uno de estos valores individuales constituye un dato para cada variable de inters. De hecho, los datos se presentan con algn tipo de "medicin", es decir que los registros de observaciones deben expresarse en nmeros (o smbolos) de manera que puedan aplicarse los mtodos estadsticos. Las caractersticas cuantitativas pueden transformarse en datos numricos, simplemente por medicin directa en unidades tales como metro, kilogramos, pesos, dlares, etc. Si las caractersticas son cualitativas, las observaciones pueden clasificarse como poseedoras o no de una cualidad o propiedad determinada. Un artculo puede considerarse como "defectuoso" o "bueno". Pero los atributos pueden expresarse numricamente a los efectos de un tratamiento estadstico, por ejemplo, asignar el valor 0 a los artculos defectuosos y el valor 1 a los artculos buenos. En muchos casos, los datos cuantitativos tambin pueden ser tratados cualitativamente segn la naturaleza del problema bajo estudio. La calificacin de exmenes es cuantitativa, pero puede ser tratada como atributo, categorizando la calificacin o resultado como "aprobado" o "desaprobado". Lo ms importante para destacar es que no toda informacin numrica es considerada como dato estadstico. La informacin apropiada para un anlisis estadstico debe ser un conjunto de nmeros que muestren "relaciones significativas", es decir deben ser cifras que puedan ser comparadas, analizadas e interpretadas. Un nmero aislado que no muestre relacin significativa no es un dato estadstico (2).

(2) Shao, Stephen, op. cit. en la bibliografa

28

Actividad N 2
1. Indique si el siguiente enunciado es correcto o incorrecto y fundamentar la respuesta: "Las variables discretas son las que asumen valores enteros" 2. Clasifique las siguientes variables: a) Indices de desocupacin de las provincias argentinas. b) Nmero de asignaturas aprobadas por alumnos de una carrera universitaria. c) Causa de los accidentes de trabajo. d) Densidad de poblacin de los departamentos de la provincia de Salta. e) Pas de destino de las exportaciones argentinas. f) Nmero de ambientes de las viviendas de un barrio. 3. Por qu no cualquier nmero es un dato estadstico? 4. En diarios o revistas, identifique secciones que incluyan datos estadsticos

29

4. Poblacin y Muestra
4.1. Poblacin
En la investigacin estadstica es fundamental definir el marco de referencia de estudio, esto lleva a definir la Poblacin o Universo. Poblacin es la totalidad de posibles mediciones y observaciones bajo consideracin en una situacin dada de un problema. Cada situacin en particular implica definir una poblacin diferente. Si el problema consiste en analizar las evaluaciones del desempeo de todos los empleados de una empresa comercial, entonces la poblacin est constituida por las evaluaciones de todos los empleados de esa empresa. Si el problema consiste solamente en el anlisis del desempeo de los vendedores de la empresa, entonces la poblacin est formada por las evaluaciones de todos los vendedores de la organizacin. Es fundamental que la poblacin quede claramente especificada a fin de identificar los integrantes de la misma. Cada elemento de la poblacin se denomina "unidad elemental de observacin". Sobre cada una de ellas se efectuarn las mediciones de las caractersticas o propiedades que pueden ser cuantitativas o cualitativas. Ejemplo: Durante una auditora en una librera se revisan las cuentas corrientes de los clientes a efectos de determinar el saldo promedio. - La poblacin consiste en todas las cuentas corrientes de los clientes del negocio. - La variable bajo estudio es el saldo. Es cuantitativa. - La unidad de observacin es cada cuenta individual. Es fundamental definir cuidadosamente la unidad elemental y su caracterstica observada. En un estudio sobre viviendas puede interesar el nmero de habitaciones de cada una. Pero, qu es una habitacin? Un dormitorio, un cuarto de bao, una cocina? Se incluirn todas las dependencia de la vivienda o slo algunas? Otro ejemplo puede ser un anlisis sobre la rentabilidad de las pequeas empresas. En este caso habr que precisar qu es una pequea empresa y qu caractersticas se tendrn en cuenta para considerarla como tal.
30

Puede ocurrir que distintos investigadores se opongan en las definiciones sobre una misma cuestin bsica. Por ejemplo, si se toma en consideracin al turista como unidad de observacin para un anlisis cualquiera, puede ocurrir que para un economista, un turista sea la persona que se desplaza de su residencia habitual, ya que tal desplazamiento lo obliga a realizar gastos de hotelera, transporte, comida, etc. cualquiera sea la motivacin del viaje; sin embargo un socilogo puede considerar que un viajante de comercio o un director de una S.A." que asiste a una reunin de trabajo, no es un turista, puesto que la motivacin de su viaje es consecuencia de la actividad laboral. En resumen, la definicin de la poblacin y las caractersticas de sus unidades elementales dependen de la naturaleza del problema que se estudia, lo que importa es que esa definicin sea lo ms precisa posible.

4.2. Poblacin finita y poblacin infinita


Se denomina poblacin finita a la que incluye un nmero limitado de observaciones. Por ejemplo, el conjunto de salarios de los operarios en una compaa. Algunas poblaciones finitas incluyen solamente unos cuantos datos, mientras que otras, consisten en miles o millones de datos. Siempre que sea posible alcanzar el nmero total de observaciones, se considera como finita la poblacin. Poblacin infinita es aquella que incluye una gran cantidad de medidas u observaciones que no pueden alcanzarse por conteo. Una poblacin de este tipo podra ser todas las bateras posibles que fabricara un industrial si continuara trabajando indefinidamente, bajo determinadas condiciones de operacin. Otra poblacin infinita sera todos los resultados posibles al lanzar un dado en forma continua e indefinida. En las poblaciones infinitas, no puede obtenerse informacin completa, por lo que para poder estudiarla se deber trabajar con una muestra.

31

4.3. Muestra
Si las poblaciones que se investigan son infinitas, se dijo que el nico procedimiento posible es el de muestreo; como no puede contarse con todos los elementos de la poblacin, se toma de la misma una parte. En el caso de poblaciones finitas, el muestreo sigue siendo el nico procedimiento prctico, sobre todo si stas son muy grandes y su enumeracin completa es prcticamente imposible. Por ejemplo, si se desea investigar las preferencias de las amas de casa de la ciudad de Salta sobre una marca de jabn, no ser posible entrar en contacto con todas ellas, ms bien se encuestar a una parte de ella, o sea, se obtendr una muestra. Una muestra es un conjunto de observaciones tomadas a partir de una poblacin dada. Es un subconjunto de la poblacin o universo. Fundamentalmente, una muestra se elige por las siguientes razones: a) MENOR COSTO. Cuando los datos se obtienen mediante una muestra, los gastos son menores que si se trabaja con un censo completo. b) MAYOR RAPIDEZ. Los datos se pueden recopilar y procesar ms rpidamente. Esto es importante si la informacin se requiere con urgencia. c) MAYOR ALCANCE. Como se trabaja con una parte de la poblacin, es posible obtener informacin ms completa y precisa que si se trabaja con un censo. d) En otros casos, el examen de los elementos requiere de la destruccin de los mismos, como por ejemplo cuando se desea determinar la calidad de los fsforos; aqu, el control se debe hacer con una muestra porque si se trabajara con el censo esto implicara la destruccin de toda la produccin y no quedaran productos despus del examen. De hecho, toda muestra debe ser representativa del universo que se estudia, para permitirle al investigador extraer conclusiones en cuanto a las relaciones entre sus variables y establecer generalizaciones, es decir inferencias vlidas a la poblacin.

32

Existen varios tipos de diseos de muestras, pero todos ellos producen dos categoras de muestras. Las probabilsticas y las no probabilsticas. En las muestras probabilsticas todos los elementos de la poblacin tienen una probabilidad conocida de ser incluidos en la muestra. Las muestras no probabilsticas son muestras de "juicio" donde el investigador elige los elementos que, en su opinin, son representativas de la poblacin.

4.4. Parmetro y Estadgrafo


Las caractersticas medibles de una poblacin se denominan parmetros. Por ejemplo, se desea realizar un anlisis sobre los resultados de una prueba de ingreso a todos los aspirantes a las carreras universitarias de Ciencias Econmicas en la provincia de Salta. Suponiendo que se trabaje con la poblacin, se puede obtener un promedio de todas las calificaciones de los aspirantes en la prueba. Ese promedio describe una caracterstica del universo, por lo tanto constituye un parmetro. Si se decide trabajar con una muestra, se selecciona un grupo de aspirantes, se registran sus calificaciones en la prueba y se obtiene un promedio. En este caso, ese promedio est calculado sobre una muestra y se denomina estadgrafo o estadstico. Los estadgrafos son las caractersticas medibles de una muestra.

33

Actividad N 3
1) Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte de las amas de casa de la ciudad de Salta. Entre las 200 amas de casas entrevistadas, 120 respondieron que preferan esa marca. a) Cul es la poblacin? b) Cul es la unidad de observacin? c) Qu constituye la muestra? 2) Se lanza una moneda 100 veces y se obtienen 60 caras. a) Qu constituye la muestra? b) Qu constituye la poblacin? 3) Durante una semana, en un cine asistieron 1000 espectadores. Explique las circunstancias bajo las cuales estos 1000 espectadores pueden considerarse. a) como muestra, b) como una poblacin. 4) La Municipalidad de Salta est efectuando una encuesta domiciliaria de opinin sobre el servicio de recoleccin de residuos. Con ese objetivo se ha ideado un esquema para realizar un muestreo aleatorio de las casas en distintos puntos de la ciudad y planea efectuar encuestas durante los das hbiles de 9 a 14 horas. Producir este esquema una muestra aleatoria? 5) En cada uno de los siguientes casos, identifique: 1) 2) 3) 4) 5) el objetivo del trabajo, la variable de inters, la poblacin, la muestra, la unidad de observacin.

34

a) Varias veces durante el da un ingeniero de control de calidad, en una fbrica textil, selecciona diferentes muestras de metros cuadrados de tela, las examina y registra el nmero de imperfecciones que encuentra. b) El Ministerio de Trabajo investiga la seguridad de las empresas industriales de la provincia de Salta. A tal efecto registra los ndices de accidentes de trabajo a 50 establecimientos elegidos al azar. c) A partir del registro de volantes en un distrito electoral, se toma una muestra de 60 electores y encuentra que 30 estn afiliados a algn partido poltico.

35

5. Objetivos del Anlisis Estadstico


Los datos estadsticos se pueden recopilar para fines prcticos (descriptivos) y de conocimiento cientfico (inductivos). Segn el objetivo, la Estadstica puede dividirse en Estadstica Descriptiva y Estadstica Inferencial.

5.1. Estadstica Descriptiva


La estadstica Descriptiva se refiere a aquella parte del estudio que incluye la obtencin, organizacin, presentacin y descripcin de informacin numrica. El anlisis se limita a los datos obtenidos en un caso particular y no implica ningn tipo de inferencia o generalizacin. Por ejemplo, un gerente de ventas desea conocer las aptitudes de cinco vendedores. Obtiene las ventas realizadas por los mismos durante una semana y las presenta en el siguiente cuadro: Vendedor Monto (en miles de $) A 18 B 25 C 20 D 15 E 22

Una medida estadstica para describir esta informacin puede ser la venta media o media aritmtica.

18 + Media =

25 +

20 + 5

15 +

22 = $ 20

En este caso, se utilizan mtodos descriptivos, ya que el promedio resume y describe la informacin obtenida y no hay ninguna generalizacin hacia las aptitudes de los otros vendedores de la compaa.

36

Los datos pueden presentarse en diversos grficos, como por ejemplo, un grfico de barras.
$ 30 25 20 15 10 5 A B C D E Vendedor

5.2. Estadstica Inferencial


Si el inters del gerente de ventas es conocer las aptitudes de todos los vendedores de la compaa, deber recurrir a otros mtodos estadsticos. Si carece de tiempo y de recursos para trabajar con todos los datos, utilizar una muestra como base para realizar una inferencia o estimacin acerca de la venta media de todos los vendedores. Para ello, deber aplicar los mtodos de la Estadstica Inferencial o Inferencia Estadstica. La Inferencia Estadstica es un mtodo mediante el cual se obtienen generalizaciones o se toman decisiones acerca de una poblacin basadas en informacin de una muestra. Se debe observar que la inferencia estadstica se relaciona con la estadstica descriptiva, ya que la informacin parcial de la muestra es obtenida por mtodos descriptivos. La venta media de $ 20 que es el estadgrafo, podra utilizarse para estimar la venta media de todos los vendedores de la empresa, es decir obtener una estimacin del parmetro. Como la Estadstica Inferencial trabaja sobre una muestra, tambin se denomina Estadstica Muestral.

37

En el mbito de la administracin de empresas, los mtodos de inferencias son fundamentales para la toma de decisiones. Se tomarn a modo de ejemplos dos casos tpicos. - Un comerciante mayorista recibe un embarque de artculos comprados. Para determinar la calidad de los mismos, inspecciona 50 unidades y encuentra que 5 son defectuosas. Rechaza el embarque y lo devuelve al proveedor?. - Se emplean dos programas de capacitacin para operarios de una empresa industrial. Se aplican a dos grupos semejantes y al finalizar el perodo de capacitacin, se toma una prueba a ambos grupos. En base a la calificacin promedio de cada grupo, podr evaluarse la efectividad de los dos programas de capacitacin? Visto los conceptos de ambas ramas de la Estadstica, se puede dar una definicin ms especfica de esta disciplina: La Estadstica se refiere a un conjunto de mtodos para manejar la obtencin, presentacin y anlisis de observaciones numricas. Sus fines son describir al conjunto de datos obtenidos (muestra) y tomar decisiones o realizar generalizaciones acerca de las caractersticas de todas las posibles observaciones bajo consideracin. (poblacin)

38

Actividad N 4
1) Cinco bateras marca "Alfa" y cinco bateras marca "Beta" se prueban para determinar su duracin. Las duraciones para Alfa son: 27, 38, 37, 35 y 33 meses; para la marca Beta, las duraciones son : 25, 35, 28, 32 y 30 meses. A partir de las siguientes conclusiones, identifique las que provienen de mtodos descriptivos y las que provienen de mtodos inferenciales: a) La duracin promedio de las 5 bateras Alfa es de 34 meses y la duracin promedio de las 5 bateras marca Beta es de 30 meses. b) La duracin promedio de Alfa es mayor que la de Beta. c) Probablemente, la duracin promedio de todas las bateras Alfa sea mayor que la duracin promedio de todas las bateras Beta. d) Si el precio de Alfa es igual al precio de Beta, es preferible comprar Alfa. 2) Un candidato a ocupar un cargo pblico asegura que ganar la eleccin. Un sondeo de opinin indica que sobre 200 electores 40 votarn por l, 100 favorecern a su oponente y 15 estn indecisos. a) Cul es el parmetro poblacional de inters? b) Cul de los estadgrafos debe utilizar para estimar el parmetro? 3) Proporcione un ejemplo de utilizacin de Estadstica Descriptiva e Inferencia Estadstica aplicada a la Economa y los Negocios.

39

6. Relevamiento de datos estadsticos


6.1. Concepto
El relevamiento consiste en la recopilacin de datos de diversas fuentes.

6.2. Clases de fuentes


a.Fuentes internas y fuentes externas - Las fuentes internas son las que se encuentran dentro de la organizacin. Los datos obtenidos de estas fuentes, denominados internos, son los relacionados directamente con las actividades de la empresa. Estos datos estn registrados en comprobantes (facturas, recibos, etc.), fichas, registros contables, informes, o bien, en forma codificada en discos, disquetes o memoria de una computadora. Por ejemplo: la informacin que proporciona el departamento de ventas sobre el monto de ventas de una compaa en un perodo determinado o los datos sobre la asistencia de los empleados obtenidos de la Oficina de Personal. - Las organizaciones necesitan tambin datos ajenos al funcionamiento y, por lo tanto, deben recurrir a fuentes externas. Los datos externos pueden obtenerse de distintas revistas o publicaciones; por ejemplo: una empresa agrcola requiere informacin sobre exportaciones de granos puede recurrir a publicaciones de la Sociedad Rural Argentina. En otras ocasiones, deben prepararse encuestas para recopilar datos no disponibles en fuentes internas u otras por ejemplo, opiniones de los consumidores de un nuevo producto. b. Fuentes primarias y fuentes secundarias - Las fuentes primarias son fuentes originarias de datos. Se denominan primarias porque los datos son obtenidos de una publicacin editada por el recopilador original. Como los datos se recopilan por primera vez, se pueden utilizar experimentos estadsticos y encuestas como mtodos de recoleccin. En el ejemplo sobre las opiniones de los consumidores de un nuevo producto, la encuesta diseada por la empresa constituye una fuente primaria.

40

- Las fuentes secundarias son aquellas que proporcionan toda la informacin existente sobre el tema bajo estudio. Se denominan secundarias porque los datos son obtenidos de una reimpresin, que es publicada por una persona u organizacin distinta al recopilador original. La utilizacin de fuentes primarias o secundarias depende de la necesidad y disponibilidad de datos, como as tambin del costo y la confiabilidad. Las fuentes primarias son ms costosas, pero pueden ser ms confiables. Si se utiliza una encuesta, sta debe ser cuidadosamente planteada ya que hay que establecer objetivos, disear la muestra, preparar a los encuestadores, realizar pruebas pilotos; todo esto lleva tiempo y dinero. Las fuentes secundarias tienen costos de bsqueda ms bajos, pero se debe evaluar la confiabilidad de las mismas, ya que los datos pueden estar desactualizados, parcialmente publicados o pueden contener errores de impresin. Con respecto a publicaciones y revistas, existen una gran variedad de las mismas confeccionadas por organismos gubernamentales (Ejemplo: publicaciones del INDEC, del Banco Central, etc.). Tambin se encuentran las estadsticas elaboradas por Naciones Unidas (a travs de sus organismos: FAO, OMS, UNESCO, UNICEF), Organizacin de los Estados Americanos y otros organismos internacionales. Se pueden consultar revistas especializadas de cmaras sectoriales, fundaciones, institutos de investigaciones y otras entidades que compilan y publican datos sobre las actividades que les conciernen.

6.3. Experimentos y Encuestas. Mtodos de recoleccin de datos


Un experimento estadstico es un proceso de recoleccin de datos donde se ejerce un control sobre algunos o todos los factores que pueden influir sobre la variable bajo estudio. Por ejemplo, la administracin de una compaa industrial desea conocer si el nuevo plan de capacitacin preparado por el departamento de personal conduce a un aumento en la productividad. Un experimento para averiguar este problema podra consistir en seleccionar a un grupo de operarios y hacerlo participar en el nuevo plan de capacitacin, dejando al otro grupo trabajando en las mismas condiciones. Luego, se compararn las productividades de dos grupos y se evaluar si el plan es o no efectivo.
41

Una encuesta estadstica es el proceso de recopilacin de datos relacionados con las caractersticas de elementos, sin un control especial que influya sobre la variable de inters. Considerando el estudio de la productividad (variable bajo estudio) de los operarios, se pueden obtener datos sobre la productividad durante los ltimos meses y adems se puede obtener informacin sobre el nivel de instruccin, ste es un datos de encuesta. Se puede analizar la relacin entre el nivel de instruccin y la productividad, pero debe observarse que no se ejerce ningn control sobre el factor "instruccin".

6.4. El proceso de obtener datos


En las encuestas o experimentos se pueden utilizar distintos mtodos. Algunos de ellos son: a) Observacin directa: Es muy apropiado y eficiente para recopilar ciertos tipos de datos. Un ejemplo clsico es el estudio sobre el trfico de vehculos con el objeto de organizar el trfico de una ciudad. Los observadores se ubican en un determinado punto de la ciudad para contar y registrar el nmero de vehculos que pasan por el lugar. La cantidad y el tipo de datos que pueden ser recopilados por este mtodo son limitados. Una limitacin puede ser los prejuicios del observador, quien registra algunos hechos, pasando por alto otros que pueden ser importantes. Los observadores deben ser entrenados de manera tal que puedan registrar con precisin los datos relevantes de los fenmenos que se investigan. Por otro lado, la observacin debe ser de suficiente duracin para que pueda obtenerse la cantidad necesaria de datos. b) Respuestas individuales: Los datos mediante respuestas individuales pueden obtenerse por entrevistas personales, entrevistas telefnicas o cuestionarios escritos. El cuestionario est especialmente indicado cuando los datos buscados requieren respuestas muy concretas, o bien cuando las muestras son muy grandes. Los datos para el Censo Nacional de Poblacin y Vivienda, por ejemplo, se relevan mediante un cuestionario. En otras ocasiones, los cuestionarios se envan por correo, como sera el caso de una revista que desea conocer opinio-

42

nes de sus suscriptores acerca de la misma, de esta manera puede recabar los datos en distintos lugares de un rea geogrfica determinada. Si los datos requieren respuestas ms matizadas, y mayor nmero de respuestas por parte de las personas seleccionadas en la muestra, la entrevista personal sera el mtodo adecuado. La decisin de utilizar experimentos o encuestas y alguno de los mtodos mencionados depende de la naturaleza del problema, del costo y el tiempo disponible. Cualquier encuesta o experimento debe planearse y conducirse con cuidado a efectos de conseguir datos relevantes, es decir precisos y tiles. Existe la posibilidad de emplear un mtodo en particular o bien una combinacin de dos o ms, lo importante es disponer de datos precisos y tiles.

7. Organizacin de los Datos


7.1. Correccin
Antes de la presentacin, ser necesario efectuar una correccin de los datos relevados para evaluar la confiabilidad de los mismos. En las entrevistas y cuestionarios, son muy comunes errores cometidos por los entrevistadores o por los respondientes. Puede haber omisiones, respuestas inconsistentes, respuestas incompletas. Si se han utilizado fuentes secundarias, es necesario verificar que los datos sean completos y/o actualizados. Si no se revisan los datos, se corre el riesgo de continuar con una investigacin que no llevar a los resultados deseados y se habr perdido tiempo y dinero.

7.2. Clasificacin
La clasificacin implica el establecimiento de grupos o clases para los resultados de una variable. El criterio de clasificacin depende de los objetivos y el mtodo de estudio. La clasificacin es importante para el anlisis de relaciones entre variables.

43

El monto de ventas, por ejemplo, puede clasificarse por ao o por sucursal de una compaa. Los empleados de una empresa pueden clasificarse por categoras o por nivel de instruccin. Cuando los datos se tabulan conjuntamente en dos o ms sistemas de clasificacin se denominan datos en clasificacin cruzada. Por ejemplo, el monto de ventas de las compaas puede clasificarse por ao y sucursal. Los empleados pueden clasificarse por categora, sexo y nivel de instruccin.

7.3. Tabulacin
La tabulacin implica la determinacin del nmero de casos o el valor de los elementos que se incluyen en cada clase o categora determinada. En otras palabras, la tabulacin es el proceso que permite un arreglo de los datos en forma resumida de acuerdo a las clasificaciones. El siguiente, es un ejemplo de tabulacin manual con una tabla de conteo por medio de marcas. Edad de los empleados 20 - 25 25 - 30 30 - 35 35 y ms Conteo Nmero de empleados 3 8 5 2 18

/// //// /// //// //

Los sistemas de computacin permiten tabulaciones ms extensas en un menor tiempo.

44

Actividad N 5
1) Nombre publicaciones que proporcionan informacin estadstica. 2) Consulte la bibliografa y confeccione un resumen sobre aspectos bsicos para la confeccin de cuestionarios. 3) Identifique, al menos, una falla principal en cada una de las siguientes preguntas diseadas para obtener informacin y redacte nuevamente la pregunta para eliminar la falla. a) "Cuntas veces visit el Shopping en los ltimos 6 meses?" b) "Le viene a la cabeza el nombre de "Pepsi" o de otras marca cuando escucha la palabra "gaseosa"?" c) "Indique qu marca de yerba prefiere Ud. y d 3 razones para su preferencia". 4) Una compaa elabor recientemente una nueva bebida sin alcohol, distribuyndola embotellada a los supermercados y en latas a negocios minoristas. Actualmetne est examinando los datos de ventas para observar qu tipo de envase es preferido por los clientes. a) Por qu estos datos de ventas son encuesta? b) Cmo podra Ud. establecer un experimento para estudiar la preferencia con resepcto al envase? Explique. 5) En cada una de las siguientes situaciones, indique si sera preferible un censo o una muestra para obtener la informacin deseada; explique adems si seran preferibles cuestionarios o entrevistas. a) Un noticiero de TV desea conocer la opinin de los ciudadanos sobre la reforma de la Constitucin. b) El Consejo Profesional de Ciencias Econmoicas desea actualizar los datos de sus matriculados. c) Una compaa con 500 empleados desea determinar las actitudes de los empleados hacia las polticas de la empresa.

45

8. Presentacin de los datos estadsticos


8.1. Introduccin
La presentacin de los datos es la disposicin de los mismos de manera tal que se conviertan en informacin significativa que permitan su anlisis e interpretacin. Las dos tcnicas bsicas de presentacin son los cuadros o tablas y los grficos.

8.2. Cuadros estadsticos


8.2.1. Concepto La tcnica de los cuadros consiste en arreglos de los datos, divididos por uno o ms sistemas de clasificacin, en columnas e hileras. Cuando el cuadro tiene una sola clasificacin se denomina de clasificacin simple, cuando se confecciona con dos o ms clasificaciones se llama cuadro de clasificacin cruzada o de doble entrada. La construccin de una tabla depende de la utilizacin y del tipo de anlisis que se realice. Para que una tabla sea efectiva debe ser clara y precisa para posibilitar su lectura. Se deben evitar tablas complicadas y largas. Cuando se desean hacer comparaciones, las tablas deben ser diseadas para facilitar las mismas. En los cuadros de doble entrada debe tenerse especial cuidado en el orden y disposicin de las clasificaciones. Demasiadas divisiones y subdivisiones pueden tornar confusa la informacin, siendo preferibles varios cuadros simples en lugar de uno con clasificacin cruzada.

8.2.2. Elementos estructurales Una tabla completa debe contener los siguientes elementos estructurales o partes:

46

PRODUCCION ARGENTINA DE PAPEL POR PRINCIPALES TIPOS (En miles de toneladas)


P E R I O D O S TIPOS 1991
(d) Columna Matriz

(a) Ttulo (b) Nota de encabezado (c) Encabezado

1992 208 170 508 36 922

1993 (1) 198 176 504 50 922 (f) Notas al pie (g) Fuente
(e) Cuerpo

Diario Impresin Industrial Domstico TOTALES (1) Datos estimados

221 179 510 38 948

Fuente: Unin Industrial Argentina (UIA)

a) Ttulo: El ttulo describe el contenido de la tabla. Debe ser completo y preciso. b) Nota del encabezado: Es una aclaracin o amplitud del ttulo ya sea para detallar algn elemento importante o para expresar la unidad de medida de los datos. Se coloca debajo del ttulo y entre parntesis. c) Encabezado: Contiene los ttulos de las clasificaciones ubicadas en las columnas. d) Columna Matriz: Contiene los ttulos de las clasificaciones ubicadas en las filas. e) Cuerpo: Es el contenido de los datos estadsticos arreglados de acuerdo a las descripciones de los encabezados. Cada dato se consigna en una celda que es la interseccin entre una fila y una columna. f) Notas al pie: Se utiliza para explicar o aclarar algunos elementos del cuadro. Ayudan al anlisis e interpretacin. g) Fuente: Indica la procedencia de los datos. Permite conocer quin recopil la informacin y evaluar la confiabilidad de la fuente. Adems, saber donde recurrir si se necesita informacin adicional sobre el tema.

8.2.3. Consideraciones adicionales sobre los cuadros 1) Es importante que en cada celda se registre algo. Si el dato es cero, este cero debe ser anotado en la celda. Si la informacin no est disponible, debe indicarse con ND o bien con una aclaracin al pie. Si
47

la celda se deja en blanco, no se sabe si el dato es cero, no est disponible o hubo alguna omisin. 2) Cuando en un informe o texto se presentan varias tablas, se hace necesario numerar las mismas por orden de aparicin a fin de facilitar la referencia de las mismas. El nmero se coloca antes del ttulo. 3) Cuando se quieren analizar relaciones estadsticas entre variabledependiente e independiente, es conveniente ubicar la primera en la columna matriz. La variable de inters fundamental en una investigacin es una variable dependiente. Otras variables, las cuales se cree que afectan las mediciones de las variables dependientes, son las variables independientes. Se puede decir que la variable dependiente est determinada o influenciada por la variable independiente. Por ejemplo: se desea analizar el desempeo de un grupo de empleados; en este caso el desempeo es la variable de inters. Adems se quiere conocer qu factores pueden influir sobre el desempeo, pudindose considerar la instruccin y el sexo que seran en este caso las variables independientes. 4) Presentacin en porcentajes: Cuando se presentan datos en porcentajes, se pueden utilizar distintas bases que dependern del anlisis y/o comparacin que se desee realizar sobre los datos. Ejemplo: Nmero de empleados por sexo y categora-Cifras absolutas
Categora Vendedores Administrativos Maestranza Total Porcentajes conjuntos Categora Vendedores Administrativos Maestranza Total Varones 30 20 10 60% Mujeres 25 10 5 40% Total 55 30 15 100% Varones 60 40 20 120 Mujeres 50 20 10 80 Total 100 60 30 200

48

Porcentajes verticales
Categora Vendedores Administrativos Maestranza Total Varones 50 33 17 100% Mujeres 62.5 25 12.5 100% Total 55 30 15 100%

Porcentajes horizontales
Categora Vendedores Administrativos Maestranza Total Varones 55 67 67 60% Mujeres 45 33 33 40% Total 100% 100% 100% 100%

49

Actividad N 6
1) El Centro de Industriales Siderrgicos present el siguiente informe sobre la produccin siderrgica comparando los meses de enero y febrero de 1997 y 1998. Los productos considerados son hierro primario y acero crudo. Los datos indican que la produccin de hierro primario en enero de 1997 fue de 229.000 toneladas y en enero de 1998 a 256.000 toneladas; para el mes de febrero de cada ao fue de 262.000 y 275.000 toneladas respectivamente. Para el acero crudo la produccin total para los meses de enero y febrero de 1997 fue de 500.000 toneladas, correspondiendo el 45% al mes de enero y el 55% al mes de febrero; en el mes de enero de 1998 la produccin aument un 15% respecto del mismo mes en 1997, mientras que en el mes de frebrero de 1998 disminuy un 10% con respecto a febrero de 1997. La institucin aclar que los datos de 1998 son provisorios. Presente todos datos del informe en cuadro con todos los elementos estructurales asegurando una lectura comprensiva de las cifras. 2) La compaa Aguila estudi los factores que afectaban el ausentismo de los trabajadores de produccin en una de sus plantas. Se obtuvieron los siguientes resultados clasificados; los datos se clasificaron por el sexo y record de asistencia. Records satisfactorios Hombres: 1920 Mujeres: 925 Records no satisfactorios Hombres: 989 Mujeres: 475

a) Convierta estos datos en porcentajes y presntelos en una tabla en forma que pueda estudiarse la relacin entre las variables. Qu base utiliz para el clculo de porcentajes? b) Existe alguna indicacin de relacin estadstica entre las variables de la tabla? Explique. c) Luego se agreg al anlisis la variable "estado civil" y se obtienen los siguientes resultados.

50

Hombres casados 1730 satisfactorios y 630 insatisfactorios. Hombres en otro estado civil 190 satisfactorio y 350 insatisfactorio. Mujeres casadas 304 satisfactorios y 430 insatisfactorios. Mujeres en otro estado civil 621 satisfactorios y 45 insatisfactorio.

Convierta estos datos en porcentajes y presntelos en una tabla para estudiar las relaciones causa-efecto entre las variables dependiente e independiente. Existe una relacin estadstica entre las tres variables? Fundamente su respuesta.

51

8.3. Grficos Estadsticos


8.3.1. Concepto En los grficos, la informacin se presenta en magnitudes que puedan interpretarse visualmente. Deben dibujarse en forma sencilla y atractiva que permitan una rpida comprensin de su contenido. 3.2. Partes de un grfico Ventas mensuales de la empresa xx (en miles de $)
$ 60 50 Escala de y 40 30 20 10 Mes Enero Febrero Escala de x Diagramas

Ttulo Nota del encabezado

Fuente:

Dpto. de Vtas.

Fuentes

- Titulo: Describe le contenido del grfico. - Diagrama: Son los distintos trazos con que se presentan los datos. Pueden ser lneas, barras, etc. - Escala: En el eje de ordenadas (y) generalmente se miden las magnitudes de los datos. El eje de las abscisas (x) es frecuentemente usada para colocar la clasificacin. - Fuente: Indica la procedencia de los datos. Al igual que los cuadros, en los grficos se consignan las notas del encabezado y notas al pie cuando fuese necesario.

52

8.3.3. Tipos de grficos Existen muchos tipos de grficos. Aqu se considerarn los grficos ms sencillos y de uso corriente. a) I. Lineales b) a) b) c) d) Mltiples Simples Mltiples Compuestas Bidireccionales Simples

GRAFICOS

II. De Barras

III. Circulares

Se desarrollarn algunas caractersticas de los grficos en base a los datos hipotticos presentados en los siguientes cuadros: Cuadro N 1 Ventas diarias de la Empresa "Llave" S.R.L. (en miles de $) Da Lunes Martes Mircoles Jueves Viernes Sbado Crdito 5 2 5 11 7 8 38 Contado 3 2 2 4 3 5 19 Total 8 4 7 15 10 13 57

Cuadro N 2 Nmero de ingresantes a 3 carreras en la U.C.S. en los aos 19971998.


53

CARRERA Abogaca Adm. de Empresas Ingeniera Civil

1997 90 40 70

1998 108 80 35

I. Grficos Lineales Los grficos lineales vienen representados en los ejes de coordenadas cartesianas mediante lneas rectas o quebradas. Son tiles para representar series cronolgicas, es decir cuando la observacin de un fenmeno se hace a travs de tiempo (aos, meses, das, etc.). Cuando hay un gran nmero de perodos y existen marcadas fluctuaciones en los datos, este tipo de grfico es el adecuado. a)Grfico lineal simple. Representa una sola serie de datos
$ 16 14 12 10 8 6 4 2 L M M J V S

Ventas totales diarias de la empresa Llave

El tiempo siempre se coloca en el eje de la x.


Da

b)Grfico lineal mltiple Se utiliza para representar dos o ms serie de datos. Se deben diferenciar las lneas con distintos trazos o colores para individualizar cada serie.

54

GRAFICO N 2
$ 16 14 12 10 8 6 4 2 Da L M M J V S

Ventas diarias al contado y a crdito de la empresa LLave

Si se pretende representar ms de 3 series, el grfico puede resultar confuso.

II.Grfico de barras Los grficos de barras son de fcil interpretacin. Los datos se representan mediante barras o rectngulos cuya amplitud es constante y la longitud proporcional al nmero de observaciones. Las barras pueden disponerse en forma vertical u horizontal. Dentro de este tipo de grfico, se encuentran las siguientes variantes: a) Grfico de barras simples: Representa una sola serie de datos. Las ventas totales por da se grafican dibujando una barra para cada da de la semana con una altura igual al volumen de ventas. (Grfico N 3). b) Grfico de barras mltiples: Representan dos o ms series de datos. Son adecuados para efectuar comparaciones. Las ventas al contado y a crdito de la semana se muestran en el grfico N 4. c) Grficos de barras compuestas: Este procedimiento de representar dos o ms series en el mismo grfico consiste en dibujar el diagrama de barras dibujadas con otras de distinto fondo que representarn la segunda (o tercera) serie. Cada barra tendr una longitud igual a la suma de los datos de las dos series. En el grfico N 5, cada barra representa el total de las ventas por da y est en dos: la parte rayada corresponde a las ventas a crdito y la parte de arriba (sin rayar) las ventas al contado.

55

GRAFICO N 3 (Barras Simples)


$ 16 14 12 10 8 6 4 2 L M M J V S Da

GRAFICO N 4 (Barras Mltiples)

d) Grfico de barras bidireccionales. Se utiliza para indicar cambios porcentuales, para ilustrar ganancias o prdidas, produccin y ventas sobre lo normal o bajo lo normal de un perodo a otro, saldos positivos y negativos, etc. Las barras bidireccionales pueden disponerse en forma vertical u horizontal.

56

Se representarn los cambios porcentuales en el nmero de ingresantes en 1998 con respecto a 1997. Carrera: Variacin porcentual Abogaca Adm. de Empresas Ing. Civil

+20%

+100%

-50%

Grfico N 6 - Ingresantes a las 3 Carreras de la U.C.S. en 1998 (cuadro 2)


Carrera

Abogaca

Ing. Civil Adm. De Empresa N de Alumnos 25 50 75 100

GRAFICO N 7
-100 -80 -60 -40 -20 0 -20 -40 -60 -80 -100

Adm. De Empresas Abogaca

Ing. Civil

57

GRAFICO N 5 (Barras Compuestas)

Las barras, como se dijo anteriormente, se pueden disponer en forma horizontal. Esta disposicin es utilizada habitualmente para graficar en series de datos que se presentan en un solo perodo de tiempo. Al igual que las verticales, pueden ser simples, mltiples y compuestas. Una tcnica comnmente usada es disponer los aumentos porcentuales en orden descendente y las disminuciones en orden ascendente.

III. Grficos circulares Los grficos circulares son adecuados para recalcar la magnitud relativa de los componentes del total. Consiste en dividir un circuito en sectores cuyas superficies sean proporcionales a las cantidades correspondientes a cada categora. Dado que los sectores circulares dependen de su ngulo central, stos se determinan estableciendo la proporcionalidad respecto a 360, que es el ngulo de la circunferencia. El mtodo corriente para dibujar este tipo de grfico es reducir los datos a porcentajes del total. Utilizando los datos del cuadro N 2 respecto a los ingresantes en 1997, se construir un grfico de sectores.

58

Carrera Abogaca Adm. de Empresas Ing. Civil

Ingresante 90 40 70 200 100% le corresponde 360

% 45 20 35 100

Abogaca 100 45 360 x 45 x 360 X= 100 Adm. de Empresas 100 20 360 x 20 x 360 x= 100 Ing. Civil 100 35 360 x 35 x 360 x= 100 = 360 126 = 72 = 162

Abogaca 45%

Ing. Civil Adm. De Emp. 35% 20%

Actualmente la construccin de grficos se facilita utilizando programas de computacin que poseen una gran variedad de los mismos. Lo importante es determinar el grfico adecuado segn el tipo de informacin.

59

Adems de los grficos desarrollados, los datos pueden presentarse en mapas estadsticos, pictogramas, grficos de volmenes, etc.

8.3.4. La falsedad estadstica a travs de grficos Una de las formas de mentir con la estadstica es dibujando grficos engaosos. Considrese la siguiente informacin sobre las ventas de 3 vendedores de una compaa para ilustrar un ejemplo.

GRFICO (a)

GRAFICO (b)

El eje vertical debe comenzar en cero para que se tenga una adecuada representacin de la situacin. Los grficos cuyas escalas de los ejes verticales comienzan en cero tienden a enfatizar la magnitud de las cifras consideradas, mientras que en los grficos que omiten el cero tienden a enfatizar la variacin en el nmero sin considerar la verdadera magnitud. Al observar el grfico (a) puede concluirse errneamente que el vendedor B tuvo ventas que apenas superaron la mitad de lo que vendi C. En cambio en el grfico (b) muestra la informacin real ya que destaca que las tres cifras son relativamente grandes, lo cual resta el nfasis puesto a la variabilidad que muestra el grfico. (a)

60

Actividad N 7
1) Identificar en diarios y/o revistas grficos estadsticos distintos a los desarrollados en el mdulo. 2) Cuadro de Ingresos y Egresos de Caja de un Negocio (en miles de $) Mes Ingresos Egresos Enero 50 20 Febrero 45 30 Marzo 70 120 Abril 40 60 Mayo 80 100 Junio 100 130

a) Representar en un grfico lineal los ingresos y egresos b) Representar grficamente la comparacin de ingresos y egresos en un diagrama de barras. c) Obtener los saldos para cada mes y representarlos grficamente.

3)Relacin egresados por cada 100 ingresantes en la Universidad Facultad Agronoma Arquitectura Ingeniera Egresados 22 24 19 Facultad Cs. Exactas y Naturales Farmacia y Bioqumica Ciencias Econmicas Egresados 12 27 12

Representar la informacin en un grfico adecuado. 4)Un informe sobre turismo consigna lo siguiente: - En enero y febrero de 1998 ingresaron a la provinica 15.450 y 12.750 turistas mostrando un aumento del 18% y 12 % con respecto a los mismos meses delao anterior. - De los totales de la temporada 1998, el 48% fueron visitantes extranjeros, el 30% de la regin prxima a Salta y el resto de otros puntos del pas.

61

a) Obtener el nmero de turistas que ingresaron en enero y febrero de 1997. Construir un grfico comparativo. b) Construir un grfico para mostrar las cifras referentes a la procedencia de los turistas.

62

Actividad Obligatoria
1) Explique la importancia que tiene el anlisis estadstico en la organizacin donde Ud. trabaja. 2) Describa una aplicacin de la estadstica en el rea donde Ud. desempea su trabajo. Especifique a) Objetivo de la investigacin. b) La poblacin bajo estudio y las variables de inters. c) Tipos de fuentes de datos disponibles y mtodos de recoleccin a utilizar. 3) Con referencia al punto 2: a) Recopile los datos necesarios b) Organice y presente la informacin en cuadros y grficos. c) Elabore un informe sobre los resultados y conclusiones de su investigacin. d) Si fuera necesario, indique las dificultades que tuvo para realizar este trabajo de aplicacin.

NOTA: En el caso de que Ud. no trabaje, concurra a cualquier empresa u organizacin y realice all esta actividad de investigacin integradora.

63

64

UNIDAD III DISTRIBUCIN DE FRECUENCIAS


1. Introduccin
Una de las etapas de la investigacin estadstica es el anlisis de los datos que puede ser descriptivo o inferencial. Pero tambin en la investigacin puede interesar el estudio de una, dos o tres, o ms variables. Cuando se trabaja con una sola variable, el anlisis es univariado (distribucin de empleados por ingreso); si se trabaja con dos variables, el anlisis es bivariado (distribucin de empleados por ingreso y por antigedad) y el anlisis es multivariado cuando se trabaja con tres o ms variables (distribucin de empleados por ingreso, por antigedad y nivel de instruccin). Este mdulo tratara especficamente el anlisis descriptivo para distribuciones univariadas.

2. Series estadsticas
Una serie estadstica es un conjunto de datos numricos, ordenados y clasificados segn un determinado criterio. Las series pueden clasificarse de la siguiente manera: Temporales o cronolgicas Series estadsticas Espaciales Intemporales De Frecuencia Cualitativas Cuantitativas Discretas Continuas

Las series "temporales" son aquellas cuyos valores de la variable se observan en perodos de tiempos. Por ejemplo, las ventas mensuales de una compaa o la produccin anual de cereales de un pas.
65

En las series intemporales los valores se observan en un perodo fijo o en un momento determinado. Si los valores se estudian en funcin de un espacio geogrfico; las series se denominan "espaciales"; por ejemplo poblacin (nmero de habitantes) de las provincias argentinas en 1997. Las series intemporales de frecuencias son aquellas que se confeccionan cuando se estudia o analiza la repeticin de los valores de una variable. Segn sea el tipo de la variable, estas series pueden ser cualitativas o cuantitativas. Estas series son el objetivo de estudio de esta unidad.

3. Distribucin de frecuencias
Cuando el nmero de valores que toma la variable es grande, se hace necesario resumir la informacin para posibilitar la lectura y la interpretacin. Una manera efectiva de reducir el tamao de la serie y facilitar su tratamiento es mediante la confeccin de distribuciones de frecuencias. Una distribucin de frecuencias es una tabla donde los datos se agrupan en clases o categoras con sus respectivas frecuencias. Con estas tablas se puede apreciar mejor la configuracin de la informacin a la vez que se facilitan los clculos y el anlisis de los datos.

4. Distribucin de frecuencias para variables continuas


Supngase que se analizan los ndices mensuales de accidentes de las empresas industriales de una ciudad determinada. Para el estudio se seleccionan 25 establecimientos y se registra para cada una el nmero de accidentes por mil horas-hombre del ltimo mes. Los datos son los siguientes. 2,7 3.8 3.1 5.3 3.4 1.8 4.8 3.3 3.3 2.1 1.0 2.5 3.6 3.0 5.6 2.2 1.4 3.0 5.8 3.9 4.1 4.5 2.5 4.4 3.4

Estos valores constituyen una "serie simple" de datos. Son datos brutos porque todava no han sido procesados por mtodos estadsticos.
66

4.1. Organizacin de los datos


Una primera tcnica sencilla de organizacin es la "ordenacin" que consiste en una disposicin de los valores en forma ascendente o descendente. 1.0 1.4 1.8 2.1 2.2 2.5 2.5 2.7 3.0 3.0 3.1 3.3 3.3 3.4 3.4 3.6 3.8 3.9 4.1 4.4 4.5 4.8 5.3 5.6 5.8

Una de las ventajas de este arreglo es la identificacin rpida de valores mximos y mnimos. Sin embargo, la ordenacin no resulta prctica para el anlisis y pierde importancia cuando es grande el nmero de datos. Otra tcnica de organizar los datos para la evaluacin del investigador con el objeto de seleccionar extremos, valores tpicos y concentracin de valores, es el "arreglo de tallos y hojas". Se ordenan el (o los) primero(s) dgitos de cada valor, se forman los tallos, y con los dgitos siguientes se forman las hojas. Para los datos del ejemplo los dgitos iniciales 1 - 2 - 3 4 y 5 son los tallos y los dgitos sucesivos (decimales) son las hojas.

Indices de accidentes

Tallos 1 2 3 4 5 8 7 8 8 3 0 1 1 1 6 4 5 4 5 8

Hojas

2 3 4

5 3

Al igual que la ordenacin, la representacin de tallos y hojas tiene una utilidad limitada cuando es grande el nmero de datos.

67

4.2. Construccin de las tablas de frecuencias


La ordenacin y el diagrama de tallos y hojas son tcnicas que ayudan a la organizacin pero no puede reconocerse la configuracin de los ndices de accidentes con slo volcar los registros proporcionados por cada empresa. Para resumir estos datos en una tabla, primero se deben determinar los intervalos de clase. Un intervalo para el conjunto de ndices puede ser: intervalo de clase o clase

Definido el intervalo se determina su frecuencia, o sea la cantidad de observaciones incluida en esa clase. La frecuencia para este intervalo es 3, es decir que en 3 empresas ocurrieron entre 2 y 3 accidentes mensuales. La confeccin de las distribuciones depende de la naturaleza y del nmero de datos. Los intervalos deben seleccionarse adecuadamente para que la configuracin de la distribucin no resulte confusa. Al construir las tablas de frecuencias se pierde un poco de informacin, pero las mismas ofrecen ventajas al momento del anlisis y la interpretacin. Entre las pautas para la confeccin se deben considerar las siguientes: a) El nmero de clases no debe ser ni muy grande ni muy pequeo. Cuando hay muchos intervalos, la amplitud de los mismos es pequea, por lo tanto cada uno tendra pocos datos o ninguno. Si hay pocas clases con intervalos amplios, puede resultar que queden cifras relativamente significativas concentradas en unas cuantas clases. b) Los intervalos deben tener la misma amplitud a efectos de poder hacer comparaciones. En algunas situaciones pueden presentarse intervalos de distinta amplitud, pero se dificulta la interpretacin de la distribucin. En otros casos se debe recurrir a intervalos abiertos. c) La confeccin de la distribucin debe facilitar el trabajo de anlisis, por lo tanto los intervalos de clase deben ser fciles de manejar.

68

Se puede utilizar el siguiente procedimiento para determinar la amplitud de los intervalos. 1') Obtener el rango o recorrido (R). El rango es la diferencia entre el valor mayor y el valor menor de la distribucin. R = Valor mayor - Valor menor Para la distribucin de los ndices de accidentes, el rango es: R R = = 5.8 4.8 - 1.0

2') Seleccionar el nmero de clases (k). La "regla de Sturges" (1) es una pauta que sirve de orientacin para determinar cuntos intervalos debe tener la distribucin: Nmero de valores de la distribucin 10 a 100 100 a 1.000 1.000 a 10.000 Nmero apropiado de intervalos 4a8 8 a 11 11 a 14

Para la distribucin de la serie se eligen 5 clases. 3') Determinar la amplitud o ancho de la clase (A) dividiendo el rango sobre el nmero de intervalos. R A= k 4.8 A= 5 A=1
(1) La frmula de Sturges establece que k = 1 + 3.3 log n (siendo n el nmero de observaciones)

R = 4.8 k= 5

= 0.96

69

Por conveniencia y facilidad de lectura, el ancho del intervalo se redondea a 1. 4') Establecer los lmites de cada clase a fin de evitar superposiciones de clases para que ninguna observacin caiga dentro de ms de una categora; de acuerdo a esto, el primer intervalo es "1,0 pero menos de 2,0". Las 5 clases de la distribucin de los accidentes son: 1.0 2.0 3.0 4.0 5.0 < < < < < 2.0 3.0 4.0 5.0 6.0

4.3. Tabulacin de los datos


Definidos los intervalos de clase, se procede a determinar las frecuencias de clases (fi). La frecuencia de clase es la cantidad de observaciones que se incluye en cada intervalo.

Indices de accidentes 1.0 2.0 3.0 4.0 5.0 2.0 3.0 4.0 4.0 6.0

Conteo

Cantidad de empresas fi 3 5 10 4 3

/// //// //// //// //// ///

Las frecuencias obtenidas se denominan "frecuencias absolutas simples".

70

4.4 Marca de clase (xi)


La marca de clase es el punto medio del intervalo de clase; es el valor que representa a la clase. Se obtienen sumando el lmite inferior y el lmite superior de cada clase dividido entre 2. Li + Ls xi = 2 La marca de clase para el primer intervalo es: 1.0 + 2.0 xi = 2 xi = 1.5 Indices de accidentes 1.0 2.0 3.0 4.0 5.0 2.0 3.0 4.0 5.0 6.0 Marca de clase xi 1.5 2.5 3.5 4.5 5.5 Cantidad de empresas fi 3 5 10 4 3 25

4.5. Distribucin de frecuencias relativas simples (fr)


En muchas ocasiones es preferible trabajar con una distribucin de frecuencias relativas. La frecuencia relativa es la proporcin o porcentaje del total de datos que se incluye en cada clase. La frecuencia relativa se calcula dividiendo la frecuencia absoluta de cada clase entre el nmero total de observaciones

71

fi fr = n Si se expresa en porcentaje

fi fr = n . 100

La frecuencia relativa del primer intervalo es: 3 fr = 25 o fr= 25 3 . 100

fr = 0.12 o 12% Hay un 12% de las empresas que posee un ndice de accidentes entre 1 y 2. La distribucin de frecuencias relativas para los ndices de accidentes de las 25 empresas es la siguiente: Indice de accidentes 1.0 2.0 3.0 4.0 5.0 2.0 3.0 4.0 5.0 6.0 0.12 0.20 0.40 0.16 0.12

fr o o o o o 12% 20% 40% 16% 12%

1.00 o 100% De hecho, la suma de las frecuencias relativas debe ser igual a 1 o al 100%.

72

4.6. Grficos de distribucin de frecuencias simples


Una distribucin de frecuencias simples puede representarse mediante dos grficos: a) Histograma; b) Polgono de frecuencias. a)Histograma El histograma es un grfico de barras. Para cada intervalo se dibuja una barra con altura igual a la frecuencia absoluta simple o frecuencia relativa simple.

12 10 8 6 4 2

Indices (Intervalos)

b) Polgono de frecuencias El polgono de frecuencias es un grfico lineal que se representa con las marcas de clases. Se construye ubicando sobre cada marca un punto a la altura de la frecuencia absoluta (o relativa), uniendo luego los puntos resultantes mediante segmentos de recta.

73

12

10

0.5

1.5

2.5

3.5

4.5

5.5

6.5 Indices (xi)

Obsrvese que el grfico presenta las marcas de clases de los intervalos anterior al primero (0.5) y posterior al ltimo (6.5) para que la figura quede cerrada. De hecho, estas marcas tienen frecuencia cero. El polgono de frecuencias puede construirse conjuntamente con el histograma en los mismo ejes con solo unir los puntos medios de los techos de las barras.
12

10

0.5

1.5

2.5

3.5

4.5

5.5

6.5 Indices (xi)

74

4.7. Algunas situaciones particulares con las tablas de frecuencias


a)Distribuciones con intervalos de amplitudes desiguales En algunos casos se construyen tablas de frecuencias con intervalos de amplitudes desiguales. Esto sucede cuando la variable de inters tiene algunas observaciones extremas altas. En lugar de definir pocos intervalos con igual tamao, pero muy amplios; o bien muchos intervalos de igual tamao, pero ms estrechos, es frecuente definir tamaos variables para los intervalos de clase. La siguiente tabla muestra las ventas semanales de 35 sucursales de una empresa. Ventas (en miles de $) N de sucursales fi 4 7 12 8 4 35

10 20 30 40 60

20 30 40 60 100

Obsrvese que las tres primeras clases tienen una amplitud de 10, la tercera clase, 20 y la ltima tiene una amplitud de 40. Se debe tener cuidado al representar grficamente este tipo de distribuciones ya que se pueden construir grficos inadecuados, como el siguiente histograma para la distribucin de las ventas.

75

fi 12 10 8 6 4 2

10

20 30

40

60

100 Intervalos

Aqu hay una deformacin, porque se exageran demasiado las reas de las barras para los intervalos ms anchos. La forma adecuada consiste en que la altura de cada barra est representada sobre una base de "frecuencia por intervalo estndar" (o una base de porcentaje por intervalo estndar si se trata de una distribucin de frecuencias relativas). Se selecciona una amplitud estndar, en este caso $10 que es la ms tpica, que se utiliza para ajustar las frecuencias sobre este intervalo estndar.

Intervalos Amplitud N de intervalos estandarizados

Frecuencia por intervalo

Frecuencia por intervalo estandarizado 4 7 12 4 2

10 - 20 20 - 30 30 - 40 40 - 60 60 - 100

10 10 10 20 40

1 1 1 2 4

4 7 12 8 4

76

El histograma apropiado ser el siguiente: fi 12 10 8 6 4 2

10 20 30 40

60

100 Intervalos

b) Intervalos abiertos Cuando las series de datos tienen observaciones muy extremas, en lugar de intervalos de tamaos variables, se pueden utilizar intervalos con extremos abiertos.

Ventas (en miles de $) Menos de 20 20-30 30-40 40-50 50 y ms

N de sucursales fi 4 6 10 3 2 25

Los intervalos abiertos son aquellos que no tienen definidos uno de los lmites. En el primer intervalo no est definido el lmite inferior y en el ltimo, el lmite superior.

77

Las clases abiertas se utilizan con fines de presentacin, pero presentan dificultades para los clculos, como as tambin para la representacin grfica. Por ejemplo, es el histograma de la distribucin slo se hace referencia a las clases abiertas pero no se las grafica. fi 12 10 8 6 4 2
4 empresas tienen ventas de menos de 20. 2 empresas tiene ventas de 50 y ms Ventas

10

20 30

40 50

4.8. Distribuciones de frecuencias acumuladas


Las distribuciones de frecuencias acumuladas permiten observar cuntas observaciones se hallan por encima o por debajo de ciertos valores. Considrese la distribucin de frecuencias simples de los ndices de accidentes de las 25 empresas. Indices de accidentes 1.0 2.0 3.0 4.0 5.0 2.0 3.0 4.0 5.0 5.6 Cantidad de empresas fi 3 5 10 4 3 25 Proporcin de empresas fr 0.12 0.20 0.40 0.16 0.12

78

Indices Menor Menor Menor Menor Menor Menor que que que que que que 1.0 2.0 3.0 4.0 5.0 6.0

Frecuencias acumuladas (fa) 0 3 8 (3 + 5) 18 (3 + 5 + 10) 22 (3 + 5 + 10 + 4) 25 (3 + 5 + 10 + 4 + 3)

Esta tabla recibe el nombre de distribucin de frecuencias acumuladas "menor que". Por ejemplo, la frecuencia acumulada 18 indica que 18 empresas tienen un ndice de accidentes menor a 4,0. Ahora se construye la siguiente tabla:

NDICES 1.0 y mayor 2.0 y mayor 3.0 y mayor 4.0 y mayor 5.0 y mayor 6.0 y mayor

FRECUENCIAS ACUMULADAS (fa) 25 22 (25-3) 17 (25-8) 7 (25-18) 3 (25-22) 0

Esta tabla recibe el nombre de distribucin de frecuencias acumuladas "mayores que". Por ejemplo, se observa en la informacin que 17 empresas registran un ndice de 3.0 y ms. Tambin se pueden confeccionar las tablas de frecuencias acumuladas relativas.

79

Frecuencias acumuladas "menor que" ndice Menor que 1.0 Menor que 2.0 Menor que 3.0 Menor que 4.0 Menor que 5.0 Menor que 6.0 fa 0 0.12 0.32 0.72 0.88 1.00

Frecuencias acumuladas "mayor que" ndice 1.0 y mayor 2.0 y mayor 3.0 y mayor 4.0 y mayor 5.0 y mayor 6.0 y mayor fa 1.00 0.88 0.68 0.28 0.12 0

Las distribuciones de frecuencias acumuladas se representan grficamente mediante un "polgono de frecuencias acumuladas" u "ojiva". Para una distribucin acumulada "menor que" la ojiva ser creciente, y para una distribucin acumulada "mayor que" ser decreciente.
fa
1 0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0 1 2 3 4 5 6

Ma
80

ndices

Mediante las ojivas se puede obtener grficamente el valor mediano (3,45) que es el valor que deja dividida la distribucin en la mitad (Ver Unidad IV).

5. Distribucin de frecuencias para variables discretas


Se registra el nmero de hijos para cada uno de los 20 empleados de una compaa. Los datos, ya ordenados, son los siguientes: 1 2 3 4 1 2 3 4 1 2 3 4 2 2 3 5 2 2 3 5

La variable Xi (nmero de hijos) toma valores entre 1 y 5. Como Xi asume pocos valores, puede considerarse cada valor de la variable como una clase, o sea: N de hijos (Xi) : 1 2 3 4 5

La tabla de frecuencias simples (absolutas y relativas) queda conformada como sigue: Nmero de hijos (Xi) 1 2 3 4 5 N de empleados (fi) 3 7 5 3 2 20 Proporcin o porcentaje de empleados (fr) 0.15 0.35 0.25 0.15 0.10 1 o o o o o 15% 35% 25% 15% 10% 100 %

La representacin grfica de esta distribucin se realiza en un "grfico de bastones". Para cada valor de la variable se dibuja un segmento con altura equivalente a la frecuencia (absoluta o relativa).

81

fi 7 6 5 4 3 2 1 0 0 1 2 3 4 5 Xi

Tambin se puede construir una tabla de frecuencias acumuladas para la distribucin del nmero de hijos. N de hijos (xi) Hasta Hasta Hasta Hasta Hasta 1 2 3 4 5 N de empleados (fa) 3 10 15 18 20

(3 (3 (3 (3

+ + + +

7) 7 + 5) 7 + 5 + 3) 7 + 5 + 3 + 2)

Las frecuencias acumuladas se representan en un grfico denominado "escalonado". En el eje horizontal se marcan los valores de la variable (xi) y se levanta en cada uno de los puntos un segmento vertical de longitud igual a la frecuencia acumulada respectiva. Luego, se dibujan los tramos horizontales correspondientes a los intervalos dentro de los cuales no pueden existir datos, ya que la variable discreta no admite valores intermedios.

82

fa 20 18 16 14 12 10 8 6 4 2 0 0 1 2 3 4 5 Xi

Cuando los valores de una variable discreta son numerosos, el tratamiento para la construccin de las tablas de frecuencias puede asimilarse al caso de una variable continua como se estudi en el punto 4.

6. Distribucin de frecuencias para variables cualitativas


Se registran los elementos de una poblacin o muestra con respecto a un atributo y los resultados obtenidos de dichas observaciones se agrupan segn las distintas modalidades que tome al atributo. Por ejemplo, 80 empleados de una compaa pueden clasificarse segn el estado civil.

Estado civil Casado Soltero Divorciado Viudo

N de empleados 45 23 7 5 80

Porcentaje de empleados 56.25 % 28.75 % 8.75 % 6.25 % 100 %

83

Para graficar esta informacin pueden utilizarse grficos de barras o circulares como los desarrollados en la unidad II.
Viudo 6,25%

Divorciado 8,75%

Soltero 28.75%

Casado 56,25%

84

Actividad N 8
Una compaa financiera desea analizar la informacin sobre los montos de prstamos solicitados por 50 personas. A tal fin, obtiene los datos de los formularios correspondientes: Montos (en miles de pesos): 1.85 2.30 1.00 2.35 2.45 2.90 1.85 2.50 2.80 1.20 1.55 1.95 2.65 2.40 2.80 2.10 3.80 1.90 2.85 3.15 3.40 2.15 3.55 1.45 1.45 3.10 1.40 2.20 2.15 1.70 1.55 1.65 1.20 3.30 2.10 3.90 2.25 1.70 2.45 2.70 2.70 3.60 3.60 2.50 2.30 2.40 2.70 3.00 2.60 2.30

a) Identificar la variable bajo estudio y clasificarla. b) Organizar los datos en una tabla de frecuencias con intervalos de amplitud 0,50 ($500). c) Calcular las marcas de clase. d) Confeccionar una tabla de frecuencias relativas. e) Construir un histograma de frecuencias relativas. f) Construir un polgono de frecuencias absolutas. g) Confeccionar las tablas de frecuencias acumuladas "menos que" y "ms que" tanto absolutas como relativas. h) Dibujar las ojivas correspondientes.

85

Actividad N 9
El dueo de una frutera recibi un pedido de cajones de manzanas. Para determinar la calidad, tom una muestra de 20 cajones y encontr las siguientes cantidades de manzanas en mal estado en cada uno. 2 3 2 2 3 2 3 6 4 4 0 2 6 0 2 2 6 3 4 3

a)Identificar las variables bajo estudio y clasificarlas. b)Construir una tabla de frecuencias absolutas simples. c) Representar grficamente la informacin de (b). d)Construir una tabla de frecuencias absolutas acumuladas. e)Representar grficamente la informacin de (d).

86

Actividad N 10
La facultad de Administracin organiz un curso de Marketing para profesionales. Con el objeto de planificar las clases, el cuerpo docente desea conocer las profesiones de los 40 participantes. Los datos se obtienen de las fichas de inscripcin. Ficha Profesin 01 02 03 04 05 06 07 08 09 10 11 12 Mdico Psiclogo Mdico Mdico Ingeniero Abogado Mdico Abogado Odontlogo Psiclogo Ingeniero Arquitecto Ficha Profesin 13 14 15 16 17 18 19 20 21 22 23 24 Mdico Contador Mdico Ingeniero Ingeniero Mdico Contador Abogado Contador Psiclogo Abogado Mdico Ficha Profesin 25 26 27 28 29 30 31 32 33 34 35 36 Psiclogo Abogado Ingeniero Mdico Contador Abogado Ingeniero Mdico Contador Mdico Abogado

a) Identificar la variable bajo estudio. b) Confeccionar una tabla de frecuencias absolutas y otra de frecuencias relativas. c) Representar grficamente la informacin elaborada.

87

Actividad N 11
En una discusin de un grupo de asesores sobre el potencial de ventas de una compaa, un asesor estableci que es un error creer que las personas de edad ms baja representan un nmero relativamente alto para las ventas de uno de los productos principales de la compaa. Para apoyar su argumento, el asesor cit los siguientes datos sobre edades de los clientes, basados en un reciente estudio de investigacin de mercados: Grupo de edad Menos de 16 16 - 17 18 - 19 20 - 19 22 - 25 26 - 29 30 - 39 40 - 49 50 o ms % de clientes 1 6 8 7 12 14 19 25 8 100 %

El asesor dijo que los porcentajes de edad entre 30 y 49 aos son considerablemente mayores que los porcentajes de los grupos de clientes ms jvenes. "De hecho", hizo notar, las personas de edad entre 40 y 49 aos son los mejores clienes del producto. Est Ud. de acuerdo con esta interpretacin de los datos? Si es as, apoye su argumento citando cifras especficas. Si no, explique por qu no est de acuerdo con la interpretacin del asesor.

88

Actividad N 12
Lea la siguiente distribucin de frecuencias: clases: 100 - 150 150 - 200 fi: 5 9 200 - 250 18 300 - 350 10 350 - 450 8

a)Qu particularidad presenta la tabla? b)Construir un histograma.

89

Actividad N 13
La siguiente informacin corresponde a la antigedad (en aos) de 100 docentes universitarios: Antigedad 5-9 10 - 14 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 N de docentes 9 14 18 32 17 5 5 100

a) Cul es la amplitud de las clases? b) Obtener las marcas de clase. c) Calcular las frecuencias relativas. d) Cuntos docentes tienen una antigedad media de 27 aos? e) Qu intervalo tiene la mayor frecuencia? f) Qu porcentaje de docentes tiene por lo menos 20 aos de antigedad? g) Qu porcentaje de docentes tiene a lo sumo una antigedad de 14 aos? h) Qu porcentaje tiene una antigedad mnima de 15 aos pero no mayor de 30? i) Representar grficamente la informacin de la tabla.

90

Actividad N 14
La siguiente tabla corresponde a los salarios pagados a 53 periodistas:

Salarios ($) N de empleados (fi)

Menos de 300 10

300-500 22

500-700 15

700 y + 6

a) Cuntas clases tiene la distribucin? b) Cuntas clases distintas hay? c) Cmo definira el 1 intervalo si su amplitud fuera igual al 2? d) Qu limitacin existe para construir los grficos?. Qu modificacin debe hacerse?

91

92

UNIDAD IV RESUMEN DE INFORMACIN A TRAVS DE MEDIDAS DESCRIPTIVAS


1. Concepto
Las medidas descriptivas son valores representativos de una distribucin, son cifras individuales que resumen la informacin. Se utilizan para describir ciertas caractersticas de los datos, permitiendo una comprensin ms precisa. Adems, a partir de estas medidas se podrn realizar inferencias y pronsticos. El anlisis de la informacin se puede realizar a travs de: Medidas de posicin. Medidas de dispersin. Medidas de asimetra (sesgo) Medidas de apuntamiento (curtosis)

2. Medidas de posicin
Estas medidas habitualmente se denominan "promedios". Desde el punto de vista estadstico un promedio es una medida de tendencia central, es decir tiende a ubicarse en el centro de la distribucin. Las medidas de posicin o localizacin son: - Media aritmtica - Mediana - Moda - Media geomtrica - Media armnica - Cuartiles - Deciles - Percentiles

93

2.1. Media aritmtica


2.1.1. Concepto La media aritmtica de un conjunto de observaciones numricas es la suma de los valores del conjunto dividida por el nmero de observaciones.

Siete trabajadores de una compaa perciben los siguientes salarios: 320 360 330 340 355 325 346

El salario medio es: 320 + 360 + 330 + 340 + 355 + 325 + 346 Media = 7 Media = 339,43 = 7 2376

320

330

340

350

360

a)Sean x1, x2 ...........xn los N datos correspondientes a una poblacin. La media poblacin (simbolizada por m) es: = x1 + x2 + ... + xn N = xi (1) N

b)Sean x1, x2 ..., xn los n datos correspondientes a una muestra. La media muestral (simbolizada por x) es: x1 + x2 + ... + xn X= n
94

xi (2) n

xi = representa a cada valor de la distribucin. N = representa al total de observaciones de la poblacin. n = representa al total de observaciones de la muestra. = Suma de los valores de la variable. 2.1.2. Principales caractersticas de la media aritmtica a) La media aritmtica se calcula con todos los valores de un conjunto. Cada valor del conjunto afecta el valor de la media. Cuando existen valores extremos, la media puede llegar a ser menos representativa. Ejemplo: Obtener la media de los siguientes valores 8 = 5 10 12 15 50

8 + 10 + 12 + 15 + 50 = 19

10

11 12

13

14 15

16

17

18

19 50

x La media est afectada por el valor extremo. 50 En la escuela se puede observar que el promedio tiende hacia los valores altos. b) La media aritmtica est definida algebraicamente. Conociendo dos de los tres trminos de la expresin, se puede determinar el tercero. Ejemplo: Durante una semana 5 corredores de seguros vendieron un promedio de 4,8 plizas. Cul fue el total de plizas vendidas?

95

x = 4.8 xi x= n

n=5

xi (Total) = ? xi = n (x) xi = 5 (4,8) = 24 plizas

c) La media aritmtica tiene las siguientes propiedades: (1) La suma algebraica de los desvos (d) de los valores de la variable con respecto a su media es siempre igual a cero. d = xi - x (xi - x) = 0 o d=0 Ejemplo: Cuatro operarios perciben los siguientes jornales semanales 25 El jornal medio es 30 34 41

x = $32.5

Los desvos de los valores con respecto a la media son: xi 25 30 34 41 d = (xi - x) 25 30 34 41 32.5 32.5 32.5 32.5 = - 7.5 = - 2.5 = 1.5 = 8.5 = 0

(2) La suma del cuadrado de las desviaciones con respecto a la media es mnima. Esto significa que la suma del cuadrado de las desviaciones con respecto a la media es menor que la suma del cuadrado de las desviaciones con respecto a cualquier otro valor. Esto es: (xi - x )2 es menor que (xi - cualquier valor)2

96

Ejemplo: Considerando los datos del ejemplo anterior, cuya media es 32.5, se elige arbitrariamente el valor 33. xi 25 30 34 41 d = xi - x - 7.5 - 2.5 1.5 8.5 (xi - x)2 56.25 6.25 2.25 72.25 =137 (xi - 32.5)2 137 < < xi 25 30 34 41 d = xi - 33 -8 -3 1 8 (xi - 33)2 64 9 1 64 =138 (xi - 33)2 138

(3) Si a cada valor de la variable se le suma (o se le resta) una constante, la media queda sumada (o restada) por esa constante. Si y = xi + c entonces y=x+c

Ejemplo: Los jornales de los cuatro operarios son: x1 25 x2 30 x3 34 jornal medio x4 41

Jornales (xi) =

x = $32.5

Supngase que se decide un aumento de $10 para todos los jornales. Los nuevos valores son: Jornales (yi): x1 + c yi : yi: 25 + 10 35 x2 + c x3 + c x4 + c

30 + 10 34 + 10 41 + 10 40 44 51

La media despus del aumento es: 170 y= 4


97

= $42.5

y=x+c 42.5 = 32.5 + 10 (4) Si a cada valor de la variable se le multiplica (o se divide) una constante, la media queda multiplicada (o dividida) por esa constante. Si Si y = xi . c y = xi /c entonces entonces y=x.c y = x/c

2.1.3 Media aritmtica ponderada Cuando los datos de un conjunto de datos tienen distintas importancias en el grupo, al calcular la media aritmtica debe considerarse esta importancia que est expresada en una ponderacin. La media aritmtica se denomina "ponderada" y se obtiene multiplicando cada valor de la variable (xi) por su ponderacin (pi ) y la suma de los productos se divide por el total de las ponderaciones. Sean x1, x2 ... xn los valores de la variable y p1, p2 ... pn sus ponderaciones correspondientes. La media ponderada (w) es: x1 p1 + x2 p2 + ... xn pn w= p1 + p2 + .... + pn xi pi w= pi (3) xi: Cada valor de la variable pi: cada ponderacin

Un ejemplo prctico es el ndice acadmico de la Universidad Catlica de Salta. Cada asignatura en el plan de estudios tiene asignada un nmero de "crditos". Estos crditos indican la importancia de la materia en el plan. El promedio aritmtico final de un egresado se obtiene teniendo en cuenta los crditos, es decir es un promedio ponderado y no un promedio simple.

98

Ejemplo: un estudiante de Administracin de la U.C.S. obtuvo las siguientes calificaciones en 3 asignaturas: Filosofa: 10 (diez); Economa: 6 (seis); Costos: 4 (cuatro) La calificacin media (promedio simple) es: 20 x= 7 Pero cada materia tiene el siguiente nmero de crditos: Filosofa: 2 crditos; Economa: 3 crditos y Costos: 4 (crditos). La calificacin media (ndice acadmico) de este alumno cambiar ya que ser un promedio ponderado: = 6,67

Asignatura Filosofa Economa Costos

Calificacin (xi) 10 6 4

Crditos (pi) 2 3 4

10 (2) + 6 (3) + 4 (4) Indice acadmico = w = 2+3+4 w=6 =

54 9

El promedio ha disminuido por el efecto de las ponderaciones. En Costos, la asignatura de mayor ponderacin, el alumno obtuvo una calificacin baja.

99

2.2. Mediana
2.2.1. Concepto La mediana es el valor que se ubica en el centro de un conjunto de datos ordenados. La mediana deja dividida a la distribucin en dos partes iguales, o sea que tiene tantos trminos inferiores como superiores a ella. Para el clculo debe considerarse dos situaciones. a) Nmero impar de datos La mediana es el valor que se ubica en la posicin [(n+1)/2]. Los salarios de los 7 trabajadores ordenados de menor a mayor. 320 325 330 340 346 355 360

La mediana se ubica en la posicin [(7 + 1)/2] = 4 lugar. Md = $ 340

320

330

340

350

360

Md b) Nmero par de datos La mediana es el valor que se ubica en las posiciones. (n/2) y [(n + 2)/2] Los salarios de 8 trabajadores ordenados son: 320 325 330 340
100

346

355

360

365

La mediana se ubica entre el 4 y 5 lugar, o sea: 340 + 346 (8/2) = 4 y [(8/2)/2] = 5 Md = 2 = $343

2.2.2 Principales caractersticas de la mediana a) La mediana no esta afectada por valores extremos porque no utiliza todos los valores para su clculo. Ejemplo: Dados los valores 8 10 12 15 50

La mediana es el valor que se ubica en el 3 lugar. Md = 12 Si el valor 50 se incrementa, la media aritmtica si aumenta, pero la mediana sigue siendo la misma. b) La mediana no est definida algebraicamente. c) En algunos casos, como cuando el nmero de datos es par, la mediana es un valor aproximado, ya que es el valor medio de los dos valores centrales.

2.3 Moda
2.3.1 Concepto La moda es el valor que se presenta con la mayor frecuencia. Ejemplo: Los salarios de 10 trabajadores son: 365 - 320 - 340 - 370 - 380 - 340 - 355 - 340 - 326 - 340 Como el nmero de trabajadores que percibe $340 es mayor que cualquier otro, la moda es 340.
101

Mo = $ 340

320

330

340

350

360

370

380

2.3.2 Principales caractersticas de la moda a) La moda no est definida algebraicamente. b) No est afectada por valores extremos. c) Es una medida adecuada para el anlisis de variables cualitativas. Por ejemplo: estado civil modal, nivel de instruccin modal, etc. d) En un conjunto de datos puede haber una, dos o ms modas y en algunas distribuciones puede no haber moda ya que no hay ningn valor que se presente con la mayor frecuencia. Si la distribucin tiene una moda se denomina unimodal, si tiene dos, se denomina bimodal y si tiene tres o ms modas se denomina multimodal.

102

Actividad N 15
1. Un negocio de electrodomsticos que posee diez sucursales registr el nmero de heladeras vendidas por cada una durante una semana. Sucursal A B C D E F G H I J

Nmero de heladeras vendidas 4

a) Calcular la venta media, la venta mediana y la venta modal. b) Se estima que para la semana siguiente las ventas aumentarn un 20% en cada sucursal Cul es la nueva venta media? 2. Una agencia de turismo recibi un total de $3.800 por parte de los estudiantes de un colegio en concepto de sea por un viaje de egresados. Si la sea media por alumno es $95, cuntos estudiantes participarn del viaje? 3. Una compaa tiene tres productos A, B y C, cuyos mrgenes de utilidades son respectivamente 15%, 13% y 10%. Si las ventas mensuales correspondientes a cada producto son (en miles de $) 4.0 - 2.5 y 1.8, cul es el margen medio de ganancia? 4. Cinco jvenes fueron beneficiados con becas para estudios universitarios siendo el importe medio de $150 y el importe mediano de $135. a) Cul fue el importe total entregado a los 5 estudiantes? b) Supngase que al estudiante que reciba el mayor importe se le incrementa la beca en $20. i) Cul es el nuevo importe medio? ii) Cul es el nuevo importe mediano? 5.Un informe sobre el turismo en Salta muestra los siguientes datos: a) La mayora de los turistas que visitan Salta provienen de la provincia de Buenos Aires.

103

b) Los hoteles de tres estrellas registran un promedio de 2 pernoctes por noche. c) La mitad de los hoteles de tres estrellas logr un ndice de alojamiento menor que 70% y la otra mitad logr un ndice superior al 70%. Indicar qu promedio (media, mediana o moda) se utiliza en cada una de la conclusiones mencionadas. 6. En una discusin salarial, el gerente general de una compaa sostiene que el salario promedio pagado a los trabajadores es de $380 por mes. En cambio, el delegado gremial afirma que el salario prevaleciente es de $350 Quin maneja los verdaderos valores?

104

2.4. Media aritmtica, mediana y moda para datos agrupados


2.4.1 Media aritmtica Las frmulas (1) y (2) estudiadas en el punto 2.1.1. se utilizan para calcular la media aritmtica cuando los datos estn presentados en una serie simple. Si cada valor x1, x2, ... xn est agrupado en una tabla con su frecuencia respectiva, f1, f2, ... fn, la media aritmtica se obtiene multiplicando cada valor (xi) por su frecuencia (fi) y la suma de los productos se divide por el total de observaciones de la muestra o de la poblacin, o sea: = x1 f1 + x2 f2 + ... + xn fn f1 + f2 + ... + fn = xi fi fi (4) x = xi fi fi (5)

Media poblacional

Media muestral

Como fi = N (en caso de una poblacin) y fi = n (en caso de una muestra), las frmulas (4) y (5) se puede expresar como: = xi fi (6) N x = n xi fi (7)

Ejemplo: Se toma una muestra de 40 familias para determinar el nmero medio de hijos. Los datos se presentan en la siguiente tabla: Nmero de hijos xi 2 3 4 5 Cantidad de familias fi 10 15 9 6 40
105

Utilizando la frmula (6) 2 (10) + 3 (15) + 4 (9) + 5 (6) x= 11 + 14 + 9 + 6 x = 3.3 hijos Cuando los datos estn agrupados en una tabla con intervalos de clase, el xi de las frmulas (6) y (7) representa a la marca de clase de cada intervalo. Para el clculo de la media, se multiplica cada marca de clase (xi) por su frecuencia de clase (fi) y la suma de los productos se divide por el total de observaciones de la distribucin. Ejemplo: Calcular el ndice medio de accidentes de la muestra de 25 empresas (Punto 4.4. - Unidad III). Indices Marca de clase xi 1.5 2.5 3.5 4.5 5.5 Nmero de empresas fi 3 5 10 4 3 25 86.5 = 25 x = 3.5 ndice medio de accidentes 25 = 40 131

1 2 3 4 5

2 3 4 5 6

1.5 (3) 2.5 (5) + 3.5 (10) + 4.5 (4) + 5.5 (3) x=

Media aritmtica combinada


Cuando se analizan distintas muestras (o distintos conjuntos de datos) donde se obtiene la media aritmtica de cada una, y se desea calcular la media para todas las muestras, la media aritmtica se denomina "combinada" (x).
106

La media combinada se obtiene multiplicando cada media muestral (x) por su tamao (n) y dividiendo la suma de los productos por el total de los tamaos de las muestras, o sea: x1n1 + x2 n2 + ... + xn. nn x= n1 + n2 + ... + nn xi . ni x= ni xi: media de cada muestra ni: tamao de cada muestra

Ejemplo: la empresa A tiene 100 operarios cuyo sueldo medio es de $320, mientras que la empresa B que tiene 50 operarios tiene un sueldo promedio de $390. Cul es el salario medio para los operarios de ambas empresas? 320 (100) + 50 (390) x= 100 + 50 x = $ 343.33 = 150 51.500

107

Actividad N 16
1. Calcular la media aritmtica para la siguiente distribucin de los alquileres de 100 locales comerciales.

Alquileres

N de locales fi 22 30 19 10 12 7 100

200 300 400 500 600 700

300 400 500 600 700 800

2. En una empresa hay 15 tcnicos, 20 empleados administrativos y 300 operarios. Las edades medias de cada grupo son 42,5 aos; 34,5 aos y 28,7 aos respectivamente. Calcular la edad media para todos los trabajadores. 3. El promedio general de calificaciones de dos cursos A y B es 7,1. El curso A tiene 20 alumnos y una calificacin media 6,4 y el curso B tiene una calificacin media de 7,5. Cuntos alumnos tiene el curso B?

108

2.4.2 Mediana La mediana para datos agrupados en una tabla de frecuencias con intervalos de clase es un valor aproximado a la verdadera mediana. Se puede obtener por dos mtodos: a) el mtodo grfico y b) el mtodo de interpolacin. a) Mtodo grfico Como ya se analiz el punto 4.8 de la unidad III, la mediana se puede obtener grficamente mediante las ojivas. Las dos ojivas se intersectan en la mitad del total de las frecuencias (12,5), siendo el valor mediano 3,45, es decir que el 50% de las empresas tiene un ndice menor a 3,45 y el otro 50% tiene un ndice mayor a 3,45. Indices N de empresas fi 3 5 10 4 3 25 Frecuencias acumuladas fa 3 8 18 22 25

12345-

2 3 4 5 6

109

fa 25

20 18 15 n/2 = 12.5 10 8.0 5 Indices 1 2 3 Li Md b) Mtodo de interpolacin En primer lugar se debe identificar el "intervalo mediano". Observando el grfico la mitad del total de datos (n/2 = 12,5) se localiza en la clase 3 - 4, por lo tanto este es el intervalo que contiene a la mediana. Hasta el intervalo 2 - 3 hay 11 observaciones; en el intervalo 3 - 4 se incluye desde el dato nmero 12 hasta el dato nmero 18, o sea que los 12.5 primeros datos se encuentran en esta clase que es el intervalo mediano. Luego, se aplica la siguiente frmula: 4 5 6 4.5 A B D C 10 E

n/2 - fa Md = Li + fi . Ci (9)

110

Li: lmite inferior del intervalo mediano n: total de datos promediados fa: frecuencia acumulada anterior al intervalo mediano fi: frecuencia absoluta simple del intervalo mediano Ci: amplitud del intervalo mediano. Esta frmula se fundamenta en una distribucin uniforme de los distintos valores de la variable dentro del intervalo que contiene la mediana. Se puede establecer la siguiente relacin de proporcionalidad. AB = CB ED AD donde AB = ED CB . AD

Del grfico se desprende que: Md = Li + AB Sustituyendo AB por la expresin hallada CB . AD Md = Li + ED donde: CB = n/2 - fa entonces CB = 12.5 - 8 = 4.5

que indica los elementos que faltan para llegar a la mitad del total de datos. Hasta la clase anterior al intervalo mediano hay 8 observaciones, por lo que faltan 4,5 para la mitad. A su vez ED = fi o sea ED = 10. De las 10 observaciones que hay en el intervalo mediano, se necesitan 4,5 para alcanzar la mitad, por eso se divide n/2 - fa sobre fi que es una fraccin del intervalo de clase. n/2 - fa = fi 10 12,5 - 8 = 10 4,5

111

Por ltimo AD = Ci o sea AD = 1 (amplitud del intervalo). La fraccin anterior se multiplica por la amplitud que da la posicin de la mediana dentro del intervalo. n/2 - fa . Ci = fi 10 4,5 .1 = 0.45

El valor 0.45 se agrega al lmite inferior de la clase mediana (Li ) para obtener el valor de la mediana. n/2 - fa Md = Li + fi 12.5 - 8 Md = 3 + 10 Md = 3 + 0.45 = 3.45 .1 Ci

112

Actividad N 17
La siguiente distribucin corresponde a los alquileres pagados por 100 locales comerciales: Alquileres $ 200 300 400 500 600 700 300 400 500 600 700 800 N de locales fi 22 30 19 10 12 7 100

Obtener la mediana: a) por el mtodo grfico b) por el mtodo de interpolacin

113

2.4.3 Moda La moda, para una distribucin de frecuencias, no puede calcularse exactamente, sino en forma aproximada. Los mtodos de clculos son: a)el mtodo directo; b)el mtodo de interpolacin mediante grfico y c) el mtodo de interpolacin mediante frmula. La tabla de frecuencias de los ndices de accidentes de las 25 empresas se utilizarn para ejemplificar la aplicacin de los 3 mtodos. Indices N de empresas fi 3 5 10 4 3 25 Cada uno de los puede dar un valor diferente a la moda. a) Mtodo directo La moda directa en una distribucin de frecuencias es la marca de clase o punto medio del intervalo modal. El intervalo modal es el que tiene la mayor frecuencia. En la distribucin de los ndices de accidentes el intervalo modal es 3 4 porque all se concentra la mayor frecuencia que es 10. Como el punto medio 3,5 es el valor que representa a la clase modal por lo tanto se considera la moda de la distribucin. Mo = 3.5 accidentes Marca de clase xi 1.5 2.5 3.5 4.5 5.5

12345-

2 3 4 5 6

114

b) Interpolacin mediante grfico (1) Se construye un histograma fi clase modal fn = 10 10 8 6 4 2 f1 = 5 f2 = 4 d1 d2

3 4 moda 3,4

Indices

(2) Se dibujan dos lneas diagonalmente en el interior de la barra de la clase modal, partiendo de las esquinas superiores de la barra a las esquinas superiores de las barras adyacentes. (3) Se dibuja una lnea perpendicular desde la interseccin de las dos diagonales hasta el eje de las x. La moda se localiza en dicho eje y es 3,4. Obsrvese que se han empleado los valores y la frecuencia de la clase modal y las frecuencias de las clases inmediatamente anterior y posterior a la clase modal.

c) Interpolacin por frmula La frmula para el clculo de la moda es: d1 Mo = Li + d1 + d2 . Ci (10)

115

Li : Lmite inferior del intervalo modal d1 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase premodal (d1= fn - f1) d2 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posmodal (d2 = fn - f2). Ci: Amplitud de la clase modal. Aplicando la frmula (10) para la distribucin de ndices de accidentes se tiene: Li = 3 d1 = 10 - 5 = 5 d2 = 10 - 4 = 6 Ci = 1 5 Mo = 3 + 5+6 Mo = 3 + 0.45 = 3.45 Mo ~ 3.45 accidentes .1

Si el grfico fue dibujado exactamente, la moda calculada mediante frmula deber ser el mismo valor que la moda obtenida el histograma.

116

Actividad N 18
Calcular la moda por los tres mtodos desarrollados para la distribucin de alquileres de los 100 locales comerciales. Alquileres N de locales fi 22 30 19 10 12 7 100

200 300 400 500 600 700

300 400 500 600 700 800

117

2.5. Otras medidas de posicin


2.5.1 Media Geomtrica La media geomtrica (G) se define como la raz n-sima de los productos de los valores de un conjunto de datos. G = x1 . x2 ... xn Ejemplo: Calcular la media geomtrica de los valores 5 - 7 - 10 - 12 G = (5) (7) (10) (12) G = 8,05
4 4 n

4.200

La media geomtrica tiene las siguientes caractersticas. (1) Es susceptible de tratamiento algebraico. Si se conocen dos de los tres trminos de la expresin, el tercero puede ser determinado. G = Producto de n valores Ejemplo: Si un conjunto de 5 valores tiene una media geomtrica de 3 Cul es el producto de los 5 valores? G=3 Producto de n valores = = n=5 Gn 35 = 243
n

(2) El clculo de G se basa en todos los valores de un conjunto de datos. Cada valor del conjunto afecta el valor de G. Si uno de los valores es cero, el valor de G es cero.
118

Ejemplo: 12 - 8 - 0 G = (12) (8) (0) G=0 (3) La media geomtrica es afectada por los valores extremos pero en menor cantidad que lo es a la media aritmtica. Ejemplo. Sean los valores 4 - 7 - 25 La media aritmtica es: xi x= n 36 x= 3 La media geomtrica es: G = (4) (7) (25) G = 8,9 El valor de G es siempre menor que la media aritmtica. (4) Cuando se obtienen las razones de los valores de un conjunto con respecto a cada valor inmediato anterior, la media geomtrica es el nico promedio apropiado para las razones. Ejemplo: Las ventas de un negocio durante cuatro meses fueron: Mes Enero Febrero Marzo Abril Ventas ($) Razn con respecto al mes anterior (xi) 1.000 1.10 1.100 1.70 1.870 1.70 3.740 2.00
3 3

= 12

119

Se calcula la media geomtrica de las razones. G = (1.10) (1.70) (2.00)


3 3

3.74

G = 1.5522 o 155.22 %

En el cuadro siguiente se muestran las ventas mensuales basadas en G. Mes E F M A Ventas 1.000 1.100 1.870 3.740

1.000 (1.5522) = 1.552.20 1.552.20 (1.5522) = 2.409.32 2.409.32 (1.5522) = 3.739.75 = 3.740

Con la media geomtrica se llega al ltimo valor (3.740), mientras que si se hubiera utilizado la media aritmtica de las razones, el resultado no hubiera sido consistente. Cuando un nmero es obtenido multiplicando el nmero anterior por la razn promedio, la secuencia de los nmeros se denomina progresin geomtrica. Los valores de las ventas constituyen una progresin geomtrica con una razn promedio de 155.22%.

Uso de la G para obtener tasas promedio de crecimiento


Considerando la secuencia de valores de una progresin geomtrica, se tiene: Po: Valor del primer perodo (perodo base) Pn: valor del ltimo perodo n: nmero de valores excluyendo el primero de ellos. G: la razn promedio.

120

Enero (base) = 1.000 Febrero = 1.000 (1.5522) = 1.552.20 Marzo = 1.552.20 (1.5522) = 2.409.32 Abril = 2.409,32 (1.5522) = 3.739.75

Simblicamente Po Po . G Po G(G) = Po G2 Po G2 (G) = PoG3

En general, el valor al final del n-simo perodo es: Po . Gn = Pn G = Po Pn G =n (12) Po


n

Pn

La tasa promedio de crecimiento (r) es: r = G - 100% (13)

La base de una razn expresada en % es igual al 100%. Po = 1.000 G=? Pn = 3.740 r=? 3.740 G=
3

n = 3 (se excluye el perodo base)

1.000

G = 1.5522 o 155.22 % r = 155.22 - 100 r = 55.22% Las ventas tienen una tasa promedio de crecimiento mensual del 55,22%.
121

2.5.2 Media Armnica Se define la media armnica (H) como el inverso de la media aritmtica de los inversos de los valores de la variable. 1 H= 1 x por lo tanto n H= 1 + x1 x2 1 + .... + xn 1 entonces H= 1 x n (14)

Ejemplo: Dados los valores 2 - 3 - 6 - 8 4 H= 1 + 2 3 1 + 6 1 + 8 48 1 = 54 4

H = 3.55

La media armnica se obtiene utilizando todos los valores del conjunto, por lo tanto es afectada por valores extremos, pero en menor cantidad que la media geomtrica. Ejemplo: x = 12 4 - 7 - 25 G = 8.9

122

3 H= 1 + 4 H=7 En resumen: H < G < x 7 1 + 25 1

El significado de la media armnica se puede ilustrar con el siguiente ejemplo: Se ha recorrido la distancia Salta - Tucumn a razn de 80 km por hora y el regreso Tucumn - Salta a razn de 60 km por hora Cul es el trayecto total de ida y vuelta? La media aritmtica dar como respuesta: 80 + 60 = 70 km/h 2 El resultado es errneo. El tiempo invertido en recorrer la distancia (D) entre Salta y Tucumn ser: D/80 y el regreso D/60. La velocidad media de ida y vuelta ser: Espacio H (velocidad media) = Tiempo = 1 + 80 H = 68.57 km/h 60 1 2

123

2.5.3 Cuartiles As como la mediana divide la distribucin en dos partes iguales, los cuartiles dividen a la distribucin en cuatro partes iguales (o casi iguales). Existen tres cuartiles: - Primer cuartil (Q1) es el valor de la variable por debajo del cual queda el 25% de los elementos de la serie estudiada. - Segundo cuartil (Q2) es el valor por debajo del cual queda el 50% de los elementos de la distribucin. El segundo cuartil es igual a la mediana. - Tercer cuartil (Q3) es el valor por debajo del cual queda el 75% de los elementos de la distribucin. Para calcular los cuartiles en los datos sin agrupar se debe seguir el siguiente procedimiento. 1') Ordenar los datos de menor a mayor. 2') Encontrar la posicin que ocupa el Q1, Q2 o Q3 a travs de las siguientes frmulas: n+1 Orden Q1 = 4 ; Orden Q2 = 4 2(n + 1) ; Orden Q3 = 4 3 (n + 1)

3') Buscar el dato que ocupa la posicin hallada en el peso anterior. Ejemplo: Los siguientes datos corresponden a las puntuaciones de 15 exmenes tomados a postulantes a un cargo en una empresa de servicio. 45 62 - 47 49 50 52 52 57 65 65 68 70 74 78 60 -

* El primer cuartil ser: n+1 Orden Q1 = 4

124

15 + 1 Orden Q1 = 4 El dato que ocupa el 4 lugar es 50, o sea: Q1 = 50 puntos El 25% de los postulantes tiene una puntuacin inferior a 50 puntos: * El segundo cuartil ser: 3 (n + 1) Orden Q3 = 4 3 (15 + 1) Orden Q3 = 4 El dato que ocupa el lugar nmero 12 es 68 , o sea: Q3 = 68 puntos El 75% de los postulantes tiene una puntuacin inferior a 68 puntos. - Si el valor resultante de la posicin es un entero, se selecciona el dato correspondiente al orden del cuartil buscado. Este es el caso del ejemplo anterior. - Si el punto de posicin est a la mitad entre dos puntos de posicin, se selecciona la media de sus valores correspondientes. - Si el valor del orden no es un entero ni un valor a la mitad entre los otros dos puntos de posicin se utiliza la siguiente regla emprica para aproximarse al cuartil: redondearlo al punto de posicin del entero ms cercano y seleccionar el valor de la observacin correspondiente. = 12 lugar = 4 lugar

125

Ejemplo: Dados los siguientes valores: 10 12 14 18 18 n+1 Orden Q1 = 4 = 4 20 22 25 27 30 10 + 1 = 2.75

El 1 cuartil se ubica entre el 2 y 3 lugar, o sea entre los valores 12 y 14. Como el orden (por redondeo) se acerca a 3, se considera 14 como valor aproximado del 1 cuartil. Q1 = 14 3 (n+1) Orden Q3 = 4 = 4 3(10+1) = 8.25

El 3 cuartil se ubica entre el 8 y 9 lugar, o sea entre los valores 25 y 27. Como el orden (por redondeo) se acerca a 8, se considera 25, como valor aproximado del 3 cuartil. Q3 25 Cuando los datos estn agrupados en una tabla de frecuencias, los cuartiles se calculan por el mismo procedimiento que el clculo de la mediana. 1') Se identifica el intervalor que contiene el 1' y el 2' o el 3' cuartil. 2') Luego se utiliza una de las siguientes frmulas:

126

n/4 - fa Q1 = Li + fi 2n/4 - fa Q2 = Li + fi 3n/4 - fa Q3 = Li + fi Li: Lmite inferior de la clase a la que pertenece el 1', el 2' o el 3' cuartil n/4: Orden del 1 cuartil 2n/4: Orden del 3' cuartil. - 2n/4: Orden del 2 cuartil. . Ci (17) .Ci (16) . Ci (15)

fa: Frecuencia acumulada anterior a la clase que contiene el cuartil buscado. f i: Frecuencia simple de la clase cuartlica. Ci: Amplitud de la clase cuartlica. Ejemplo: Calcular el Q1 y el Q3 de la distribucin de frecuencias de los ndices de accidentes de las 25 empresas. Indices N de empresas fi 3 5 10 4 3 25
127

Frecuencia Acumulada fa 3 8 18 22 25

12345-

2 3 4 5 6

fa 25 20 15 10 5

2 Q1

5 Q3

Indices

Orden 1 cuartil n Q1 = 4 = 4 25 = 6.25

Orden 3' cuartil 3n Q3 = 4 = 4 3(25) = 18.75

La clase del 1' cuartil se localiza en el intervalor 2 - 3. Luego, se aplica la frmula (15) 3.25 - 3 Q1 = 2 + 5 .1

La clase del 3' cuartil se localiza en el intervalor 4 - 5. Luego se aplica la frmula (17) 18.75 - 18 Q3 = 4 + 4 .1

Q1 = 2.65

Q3 = 4.1875

Una de las aplicaciones importantes de los cuartiles es en la confeccin del diagrama de caja que se desarrollar ms adelante.

128

2.5.4 Deciles y Percentiles - Los deciles (D) dividen a la distribucin en diez partes iguales. As, por ejemplo, el decil 1 (D1), deja el 10% de los valores por debajo de l; el decil 2 (D2) deja el 20% de los valores por debajo de l. Anlogamente ocurre con los deciles D3, D4... D9. - Los percentiles (P) dejan dividida a la distribucin en cien partes iguales. Los percentiles se denotan por P1, P2, P3 ... P99. As, por ejemplo, el P80 deja por debajo el 80% de los elementos de la distribucin. Debido a que estas medidas no son de uso frecuente en el campo de la Administracin, no se desarrollarn las frmulas para su clculo. No obstante, los procedimientos de dichos clculos son anlogos a los utilizados para la mediana y los cuartiles.

129

Actividad N 19
1) Dados los siguientes valores: 2 - 7 - 8 - 15 - 10 - 4 - 9 - 10 Calcular: a) La media geomtrica; b) La media armnica; c) El tercer cuartil. 2) Segn el censo de 1970, la poblacin de la ciudad de Salta era de 176.216 habitantes. De acuerdo a los datos del censo 1991 la poblacin aument a 373.857. Obtener la tasa promedio de crecimiento anual por cada mil habitantes de la poblacin de la ciudad. 3) Dada la distribucin de los alquileres de los 100 locales comerciales. a) Calcular el Q1 y Q3 b) Interpretar las medias calculadas.

Alquileres

N de locales fi 22 30 19 10 12 7 100

200 300 400 500 600 700

300 400 500 600 700 800

130

3. Medidas de Dispersin
Las medidas de dispersin describen la variabilidad de las observaciones de un conjunto de datos con respecto a un valor promedio. Rango Rango inter-cuartil (*) Desviacin cuartlica (*) * Desviacin absoluta promedio * Varianza * Desviacin tpica * Desviacin intercuartlica (*)

De distancia Absolutas Medidas de Dispersin De desviacin promedio

Relativa Coeficiente de Variacin

Considrese el nmero de plizas vendidas durante una semana por dos sucursales de una compaa de seguros. Lunes 5 9 Martes 12 8 Mircoles Jueves Viernes 8 14 11 10 12 11

Sucursal "A" Sucursal "B" A 0 A 0 1 2 3 1 2 3

10 11 12 13 14

10 11 12 13 14

La media de ambas sucursales es 10 plizas. A = 10 B = 10

Si bien ambas sucursales tiene la misma venta media, se puede observar que los valores de la Sucursal "A" estn ms dispersos que los valores de la Sucursal "B" respecto a la media.
* Se tratan en el punto 3.8

131

3.1 Rango
Es la diferencia entre el valor mximo y el valor mnimo de un conjunto de datos.

R = xn - x1 RA = 14 - 5 = 9

(18)

xn = valor mximo; x1 = valor mnimo

RB = 12 - 8 = 4

Caractersticas del Rango


1. Es una medida de clculo sencillo. 2. El rango no est afectado por los valores comprendidos entre el valor mximo o mnimo, al utilizar los extremos no proporciona una medida efectiva de variabilidad en relacin el valor promedio.

3.2 Desviacin Absoluta Promedio


La desviacin absoluta promedio es la media aritmtica de las desviaciones de los valores individuales de la distribucin con respecto a su promedio (generalmente se utiliza la desviacin media). xi - Dm = N Los signos de las desviaciones se ignoran, ya que de acuerdo la propiedad de la media ya estudiada, la suma de los desvos es cero. (19)

132

SUCURSAL "A" xi 5 12 8 14 11 xi - 5 - 10 = 11 - 10 = 8 - 10 = 14 - 10 = 11 - 10 = -5 2 -2 4 1 =0 Valor absoluto de los desvos 5 2 2 4 1 d = 14

SUCURSAL "B" xi 9 8 10 12 11 xi - 9 - 10 = 8 - 10 = 10 - 10 = 12 - 10 = 11 - 10 = -1 -2 0 2 -1 =0 Valor absoluto de los desvos 1 2 0 2 1 d = 14

14 DmA = 5 = 2,8 DmB =

6 = 1,2 5

Caractersticas de la DM
1. El clculo est basada en todos los valores e indica la dispersin con relacin a un valor promedio. 2. Al ignorarse los signos de las desviaciones, la medida no resulta adecuada para un manejo matemtico.

133

3.3 Varianza
La varianza es el promedio de los cuadrados de las desviaciones de los valores de la variable con respecto a su media. La varianza poblacional se simboliza con sigma cuadrado (2) y la frmula se expresa: 2 = (xi - )2 (19) N

L Sucursal A (xi - )2 Sucursal B (xi - )2 50 5 2A = 10 25 1

M 4 4

M 4 0

J 16 4

V 1 1 = 50 = 10

2A =

2B =

10 5

2B = 2

Principales caractersticas de la varianza 1. La varianza es matemticamente lgica ya que considera los signos de los desvos, de all su ventaja con respecto a la desviacin absoluta promedio. 2. La varianza no est expresada en unidades originales, sino en una unidad al cuadrado. Esto es debido a la operacin de elevar al cuadrado las desviaciones. 3. Cuando las varianzas son grandes se hace difcil su interpretacin. Para calcular la varianza se pueden emplear las variantes de la frmula:

134

(20)

=
2

xi2 N

xi N

(21) =
2

xi N

- ()2

Para aplicar estas frmulas se utilizarn los datos de la sucursal B. xi xi2 9 81 8 64 10 100 12 144 11 121 = 50 = 510

Utilizando la frmula 20 510 =


2

Utilizando la frmula 21
2

50 5

510 =
2

- (10)2 5

5 2 = 102 - 100 2 = 2

2 = 102 - 100 2 = 2

3.4 Desviacin tpica o estndar


Debido a que la varianza no est expresada en unidades originales y para restaurarlas se obtiene la raz cuadrada de esta medida. La medida as obtenida recibe el nombre de "desviacin tpica o estndar" La desviacin tpica es la raz cuadrada del promedio de los cuadrados de las desviaciones de los valores con respecto a su media. La desviacin tpica poblacional se simboliza con s (sigma) y la frmula se expresa.

135

(xi - )2 (22) N

La desviacin tpica de A es A = 50 5 = 10

La desviacin tpica de B es: B = 10 3 = 2

A = 3,2 plizas

B = 1,4 plizas

La frmula (22) se puede expresar como: xi2 N N xi xi N

(23)

- ( ) 2

(24)

Principales caracterstica de la desviacin tpica


1. Como la varianza, la desviacin tpica se calcula en base a todos los valores. Mide la dispersin alrededor de la media y no con respecto a ciertos valores como el rango. 2. La desviacin estndar es matemticamente lgica, ya que al igual que la varianza, tiene en cuenta los signos positivos y negativos de los desvos individuales. 3. Como ya se seal anteriormente, el desvo tpico est expresado en unidades originales lo que facilita su anlisis e interpretacin. 4. a)Si a cada valor de la variable se le suma (o se le resta) una constante, el desvo tpico no se modifica.
136

b)Si a cada valor de la variable x lo multiplica (o se lo divide) por una constante, el desvo tpico queda multiplicada (o dividida) por dicha constante. 5. Hasta ahora se hizo referencia a la varianza y el desvo tpico poblacional, por cuanto las frmulas de ambas medidas calculadas a partir de una muestra tienen la siguiente variante: el denominador se divide por n-1. La explicacin se desarrolla en el punto 3.5. La varianza y el desvo tpico muestrales se simbolizan por S2 y S respectivamente.

3.5. Varianza y desvo tpico de una muestra


La varianza muestral (S2) se obtiene mediante la siguiente frmula: (x1 - x)2 (25) n-1 La desviacin tpica muestral (S) se obtiene por: (x1 - x)2 S= (26) n-1

S2 =

El denominador se divide por n-1. Este trmino se denomina "grados de libertad". Ejemplo: las edades de una muestra de cinco personas son: 20; 24; 28; 35; 40. La media es: xi x= n Al calcular la desviacin tpica muestral, se utiliza una estimacin de la medida de la poblacin. Se introduce un sesgo debido a que el valor =(x1 - x)2 es un valor mnimo para cualquier distribucin dada. Si a cada elemento se hubiera restado cualquier otro valor distinto de 29,4 aos, la suma de las diferencias sera mayor que = (x1 - 29.4)2.
137

x = 29.4 aos.

Al utilizar en el clculo la moda muestral como estimador de la media poblacional, por lo regular se obtendr una desviacin estndar menor que la desviacin estndar poblacional. Este sesgo se puede corregir dividiendo = (xi - x )2 entre los grados de libertad n - 1. Debido que la media muestral se us como estimacin de la media poblacional en el clculo del desvo muestral, solo cuatro de las edades son libres de varias, ya que la quinta edad se puede determinar porque = (xi - x) = 0. Slo se requiere de cuatro edades para tener toda la informacin. Los grados de libertad en un conjunto de datos indican el nmero de elementos de datos que son independientes de los otros y que se constituyen como piezas nicas de informacin.

138

Actividad N 20
1) Las ventas de una compaa (en miles de pesos) durante una semana fueron: Da Ventas ($) L 8 M 4 M 6 J 7 V S

10 7

a) Obtener las siguientes medidas: i) Rango; ii) Desviacin absoluta promedio; iii) varianza iv) Desviacin tpica b) El gerente estima que las ventas disminuirn un 10% la prxima semana Qu ocurrir con el desvo tpico? 2) Un productor cinematogrfico elige un grupo de extras para una pelcula. Las edades de los primeros 10 entrevistados son: 50 57 56 56 55 57 49 56 52 59

El productor quiere extras cuya edad se agrupe estrechamente alrededor de los 55 aos como aceptable,pero que la variabilidad no supere los 3 aos. Cumple este grupo con los requisitos? 3) En uno de los departamentos de produccin de una empresa industrial la produccin diaria media por operario era de 374.3 unidades y la desviacin tpica de la produccin diaria por operario de 34.7 unidades. Se condujo un programa de entrenamiento para los operarios menos eficientes. Subsecuentemente, la produccin diaria media subi a 421.6 unidades por operario y la desviacin tpica se redujo a 29.3 unidades. Describir los cambios que tuvieron lugar despus del entrenamiento.

139

4) Se toman las medidas a 80 personas y resulta una estatura media de 1.70 mts. y una desviacin tpica de 0.02 mts. Posteriormente se verifica que el instrumento usado en la medicin tena 3 cm menos. Ratifique o rectifique los valores mencionados.

140

3.6. Coeficiente de Variacin


Cuando se desea comparar dos distribuciones, las medidas absolutas de dispersin son tiles si los promedios de ambas son aproximadamente del mismo tamao y las unidades de medida de los conjuntos son iguales, de lo contrario la comparacin de la dispersin se hace complicada. Ejemplo: la media y el desvo tpico de los salarios de dos compaas: Ca. I 1 = 400 1 = 65 Ca. II 2 = 200 2 = 48

A simple vista, la Ca. I tiene mayor dispersin que la Ca. II debido a que el desvo tpico es mayor. Pero esta conclusin no es cierta, ya que la desviacin tpica es significativa slo en relacin con la media respecto a la cual se calcula. Para la comparacin se requiere una medida relativa que describa una idea general de la magnitud del desvo estndar en relacin con la magnitud de la media. Esta medida se denomina "coeficiente de variacin" que se obtiene dividiendo el desvo tpico sobre la media aritmtica. (27) cv = Poblacin

S (28) cv = x Si se expresa en porcentaje se multiplica por 100 Compaa I 65 cv = 400


141

Muestra

Compaa II 48 cv = 200

cv = 0.1625 o 16.25%

cv = 0.24 o 24%

La distribucin I tiene una variacin absoluta mayor que la distribucin II, pero la variacin relativa es menor porque es mayor su media aritmtica. Existen dos propiedades: a)Cuando a cada valor de la variable se le suma (o se le resta) una constante, el cv disminuye (o aumenta). Ejemplo: El salario medio de una muestra de trabajadores una compaa es de $200 con una desviacin tpica de $ 20. Sx cv = x cv = 200 20 = 0,10

Se decide aumentar los salarios en $40. y = $ 240 La nueva media se incrementa a 240 Sy cv = y cv = 204 20 = 0.08 el nuevo CV disminuye Sy = $20 El nuevo desvo no se modifica

b)Cuando a cada valor de la variable se multiplica (o se divide) por una constante, el cv no se modifica. Ejemplo: se decide duplicar los salarios originales: y = $400 La nueva media tambin se duplica Sy = $40 El nuevo desvo tambin se duplica

142

Sy cv = y cv=

400 = 0.10 40 el nuevo CV no se modifica

143

Actividad N 21
1) Una compaa mayorista estaba estudiando la posibilidad de convertirse en proveedor de 3 minoristas, pero la escasez de inventario la oblig a seleccionar un solo minorista. El gerente de crdito de la compaa est evaluando los crditos de los tres. En los ltimos 5 aos, sus cuentas por cobrar se han atrasado el siguiente nmero promedio de das. El gerente de crdito considera que la consistencia, adems de un promedio mnimo, es de suma importancia. Basndose en la dispersin relativa. Cul minorista ser mejor cliente? Lpez Guzmn Snchez 62.2 62.5 62.0 61.8 61.9 61.9 63.4 62.8 63.0 63.0 63.0 63.9 61.7 60.7 61.5

2. La media de una distribucin de un centenar de artculos es 50 y la suma de los cuadrados de las desviaciones respecto de la media es 3.600, por lo que el coeficiente de variacin es igual a 0.08. Es correcto este enunciado?.

144

3.7 Varianza y desvo tpico para datos agrupados


La varianza y la desviacin tpica para datos de una poblacin agrupados es una tabla de frecuencias se obtienen con las siguientes frmulas: Varianza 2 = (xi - )2 . fi (29) N = Desvo tpico (xi - )2 . fi (30) N

Si se trata de una muestra, el denominador se divide por n - 1. Varianza 2 = (xi - x)2 . fi (31) n-1 Desvo tpico = (xi - x)2 . fi (32) n-1

donde: xi = valor de la clase o punto medio del intervalo m = media poblacional x = media muestral fi = frecuencia de clase. N = total de observaciones de la poblacin n = total de observaciones de la muestra. La desviacin al cuadrado para cada clase se multiplica por su frecuencia y la suma de los productos se divide por N o en n - 1. La varianza y el desvo tpico para la distribucin del nmero de accidentes de la muestra de 25 empresas, cuya media es 3.5, se obtienen a continuacin.

145

Indices Marca de N de empresas 1-2 2-3 3-4 4-5 5-6 1.5 2.5 3.5 4.5 5.5 3 5 10 4 3 25

(xi - x)2 (1.5 - 3.5)2 = 4 (2.5 - 3.5)2 = 1 (3.5 - 3.5)2 = 0 (4.5 - 3.5)2 = 1 (5.5 - 3.5)2 = 4

(xi - x)2 f 4 (3) = 12 1 (5) = 5 0 (10) = 0 1 (4) = 4 4 (3) = 12 33

Aplicando las frmulas (31) y (32). =


2

33 = 25 - 1

33 24

33 25 -1 = 1.17

= 1.375

2 = 1.375

Las frmulas equivalentes de (29) y (30) son: 2 = xi2 - fi N - 2 (33) = xi2 - fi N 2

(34)

Las frmulas equivalentes de (33) y (34) son: xi2fi - n x n-1 xi2fi - nx n-1

2 =

(35)

(36)

146

Actividad N 22
El nmero de cheques cobrados diariamente en 5 sucursales de un banco durante 100 das tuvo la siguiente distribucin de frecuencias: N de cheques fi 0-200 10 200-400 13 400-600 17 600-800 42 800-1000 18

El director de operaciones del banco, sabe que una desviacin standard o tpica en el cobro de ms de 200 cheques diarios crea problemas de organizacin y dotacin del personal en las sucursales, debido a una carga de trabajo no uniforme Debe preocuparse en este momento?.

147

3.8 Otras medidas de dispersin


3.8.1 Rango intercuartil El rango intercuartil (RI) representa la distancia entre el tercer cuartil (Q1) y el primer cuartil (Q3). RI = Q3 - Q1 (37)

Considrese nuevamente los datos correspondientes a las puntuaciones de 15 exmenes tomados a postulantes (ver punto 2.5.1). 45 - 47 - 49 - 50 - 52 - 57 - 60 - 62 - 65 - 65 - 68 - 70 - 74 - 78 El primer cuartil (Q1) y el tercer cuartil calculados fueron: Q1 = 50 El rango intercuartil es: RI = 68 - 50 RI = 18 puntos Q3 = 68

3.8.2 Desviacin cuartlica (QD)(*) La desviacin cuartlica consiste en la divisin del rango intercuartlico entre dos.

Q3 - Q1 QD = 2 (38)

(*) Shao, Stephen, op. cit. en bibliografa.

148

68 - 50 QD = 2 QD = 9 puntos

Las principales caractersticas de QD son: (1) La QD est basada en dos valores: Q1 y Q3. No est afectada por valores extremos, los cuales son menores que Q1 o mayores que Q3. El 50% de los datos est entre Q1 y Q3. Una QD baja indica una pequea variacin entre el 50% de los datos centrales. En cambio, una QD alta significa que la variacin entre los elementos centrales es grande. (2) La QD tiene el inconveniente de que no est basada en cada valor de una distribucin. Los cuartiles y el rango intercuartil son utilizados para confeccionar el diagrama de caja que se trata en el anexo de este mdulo, reproduciendo el artculo de la revista Capacitando en Calidad - N VII del Dpto. de Matemtica de la Universidad Nacional del Sur.

4. Formas de la distribucin
4.1 Simetra y Asimetra
Distribucin simtrica Considrese la distribucin A Intervalos 10 20 30 40 50 20 30 40 50 60 fi 3 5 9 5 3 25 xi 15 25 35 45 55

149

Se construye a continuacin el polgono de frecuencias. fi 10 9 8 7 6 5 4 3 2 1 xi 65

15

25

35

45

55

El polgono se vuelve cada vez ms suave y curvo a medida que aumenta el nmero de observaciones. El Polgono suavizado recibe el nombre de curva de frecuencia.

150

Se puede observar que la distribucin es simtrica por la forma del polgono. En este caso los valores de la media aritmtica, la mediana y la moda son iguales o casi iguales. x = 35 Md = 35 Mo = 35

4.2 Distribuciones asimtricas


Se presenta a continuacin otras dos distribuciones B y C. (B) Intervalos 10 20 30 40 50 20 30 40 50 60 fi 3 12 5 3 2 25 xi 15 25 35 45 55 (C) Intervalos fi 10 20 30 40 50 20 30 40 50 60 2 3 5 12 3 25

xi 15 25 35 45 55

151

Se construyen el polgono y la curva de frecuencias para ambas distribuciones y se calculan los 3 promedios.
fi 12 10 8 6 4 2 0
x = 30,6 md = 27,9 mo = 25

fi 12 10 8 6 4 2 0

fi 12 10 8 6 4 2 0
x = 39,4 md = 42,1 mo = 45

fi 12 10 8 6 4 2 0

En la distribucin (B) hay una asimetra (sesgo) hacia la derecha, ya que la media es mayor que la mediana y sta mayor que la moda. En este caso x es afectada por algunos valores extremos altos. La distribucin (C) tiene una asimetra hacia la izquierda. La media es menor que la mediana y sta menor que la moda. La media es afectada por valores extremos bajos. En resumen

152

Media Mediana Moda

Moda Mediana Media

Moda Mediana Media

Distribucin simtrica

Distribucin asimtrica hacia la derecha o asimtrica positiva

Distribucin asimtrica hacia la izquierda o negativa

x = Md = M o

Mo<Md< x

x < Md < Mo

4.3. Coeficiente de Asimetra de Pearson


La asimetra puede medirse a travs de un coeficiente. Uno de los ms utilizado es el coeficiente de asimetra de Pearson que se obtiene de la siguiente manera: x - MO Sk = S Si Sk = 0 Si Sk < 0 Si Sk > 0 (39) Sk = 3 (x - Md) S (40)

distribucin simtrica. distribucin asimtrica negativa. distribucin asimtrica positiva. Distribucin B S = 11,2 30,6-25 Sk = Sk = 11,2 Sk = 0.50 Positiva
153

Distribucin A S = 11,9 35 - 35 Sk = 11,9 Sk = 0 Simtrica

Distribucin C S = 11,2 39,4-45 11,2 Sk = -0.50 Asimtrica negativa

Mientras ms marcada sea la asimetra menos representativa es la media, siendo la mediana una medida ms conveniente debido a que no recibe influencias de valores extremos.

4.4. Curtosis
La curtosis mide el grado de apuntamiento de una distribucin, es decir se mide su grado de pico. Existen medidas para describir la curtosis que se tratan en el mdulo III. Slo se har referencia a que una distribucin con respecto al apuntamiento puede ser: leptocrtica, mesocrtica o platocrtica. fi Leptocrtica Alto apuntamiento. Lepto: palabra griega que significa esbelto.

fi Mesocrtica Apuntamiento intermedio. Meso: palabra griega que significa mitad.

fi

Platocrtica Achatada Platos palabra griega que significa ancho o plano.

154

Actividad N 23
Dada la siguiente distribucin: Intervalo 0 - 200 200 - 400 400 - 600 600 - 800 800 - 1000 fi 10 13 17 42 18 100

a)Calcular la media, la mediana, la moda y el desvo tpico. b)Calcular e interpretar el coeficiente de asimetra.

155

EL GRFICO DE CAJA
Lic. ALICIA QUINTANA Seor Supervisor, Seor Operario: supongamos que en sus tareas diarias de trabajo haya tenido que analizar un conjunto de datos y se ha encontrado con la presencia de unos pocos valores que le han llamado la atencin, le han parecido extraos, raros, por ser muy grandes o muy pequeos en relacin al resto de los datos. El problema es que, tal vez, Usted no ha sabido qu hacer. En el presente artculo se le brinda una solucin. El Grfico de Caja es una tcnica estadstica que se construye para cumplir con dos objetivos principales: - visualizar las caractersticas o propiedades que tiene un conjunto dado de datos. - detectar la presencia de valores "outliers", o sea valores que resultan ser sospechosos. Paso 3: buscar la observacin que ocupa el lugar encontrado en el Para poder iniciar el paso 2. tema, necesitamos de algunos conceptos pre- Como ilustracin veavios, a saber: mos los siguientes ejemplos: I. Mediana. II. Cuartiles. Ejemplo 1: III. Rango intercuartlico. 16 18 11 13 8 11 9 I. MEDIANA Siguiendo el esquema de La mediana (M) es el va- los pasos, ordenamos lor que divide al conjun- los datos de menor a to de datos ordenados mayor: de menor a mayor en dos partes iguales. O 8 9 11 11 13 16 18 sea, el 50% de los datos es inferior a M y el otro El lugar que ocupa la 50% es superior a M. mediana es (7+1)/2=4. Por lo tanto, la mediana Los pasos a seguir para ocupa el 4 lugar que es el clculo son los si- igual a 11. guientes: Ejemplo 2: Paso 1: ordenar los datos de menor a mayor. 16 4 18 11 13 8 9 8 Paso 2: hallar el lugar o posicin ocupada por la mediana a travs de la frmula (n+1)/2 siendo la n la cantidad de datos. Ordenando los datos de menor a mayor obtenemos: 4 8 8 9 11 13 16 18 INTRODUCCIN PREVIA

156

El lugar que ocupa la mediana es (8+1) / 2 = 4,5. Como el lugar 4,5 no existe, en estos casos, cuando la cantidad (n+1)/2 no es un nmero entero, procedemos de la siguiente manera: podemos afirmar que la mediana se encuetra entre el 4 y el 5 lugar. Luego, la mediana ser igual al promedio de los valores, que ocupan el 4 y el 5 lugar. O sea, M ser igual a (9-11)/2=10. II.- CUARTILES Se trata de valores que dividen al conjunto de datos ordenados de menor a mayor en cuatro partes iguales (o casi iguales). Existen tres cuartiles que notaremos Q1, Q2 y Q3. - Q1, llamado cuartil de orden 1, es tal que el 25% de los valores es inferior a l. - Q2, llamado cuartil de orden 2, es tal que el 50% de los valores es inferior a l. Por lo tanto, coincide con la mediana. - Q3, llamado cuartil de orden 3, es tal que el 75% de los valores es inferior a l.

Existen varios mtodos es igual a 16. para calcular Q1 y Q3. A continuacin se expo- Ejemplo 2: nen los pasos de uno solo de ellos. El lugar que ocupa Q1 es (8+1)/4=2.25. Como Paso 1: ordenar los da- el lugar 2.25 no existe, tos de menor a mayor. entonces promediamos los valores que ocupan Paso 2: hallar la posicin 2 y 3 posicin. Luego, que ocupa Q1 a travs Q1= (8+8)/2=8. de la frmula (n+1)/4 siendo n la cantidad de El lugar que ocupa Q3 datos y hallar la posicin es 3 (8+1)/4=6.75. Por que ocupa Q3 a travs lo tanto, prome-diamos de la frmula 3(n+1)/4. los valores que ocupan la 6 y 7 posicin. O sea, Paso 3: buscar la obser- Q3=(13+16)/2=14.5 vacin que ocupa la posicin encontrada en el III. RANGO paso 2 para Q1 y bus- INTERCUARTILICO car la observacin que ocupa la posicin encon- El rango intercuartlico trada en el paso 2 para (R1) representa la disQ3. tancia entre Q1 y Q3. O sea, R1=Q3-Q1. Como ilustracin, calculemos Q1 y Q3 de los EL GRFICO DE ejemplos dados ante- CAJA. CONCEPTO. riormente: El aspecto de un grfico Ejemplo 1: de caja es como el que se muestra en la figura 1. El lugar que ocupa Q1 es (7+1)/4=2. Luego, Q1 Como su nombre lo inocupa el 2 lugar que es dica se trata de una caja igual a 9. rectangular de largo igual la rango El lugar que ocupa Q3 intercuartlico. La altura es 3(7+1)/4=6. Luego de la caja es arbitraria. Q3 ocupa el 6 lugar que
157

entonces la distribucin de los datos es asimtrica.


L1 Q1 M Q3 outlier Fig. 1 L2

EL GRAFICO DE CAJA COMO METODO PARA LA DETECCION DE LOS "OUTLIERS" En ocasiones, al seleccionar una muestra, se observa que uno o ms de los datos parece ser muy grande o muy pequeo en relacin al resto de los datos. Tal medicin recibe el nombre de "outliers" y se presenta un problema. Debemos conservarlo en la muestra o desecharlo?. La presencia de outliers puede deberse a varias causas, entre ellas: - a algn error de medicin o registro. Estos a su vez pueden ser provocados por un instrumento de medicin deficiente, la misma unidad experimental puede estar defectuosa o tal vez el experimentador registr equivocadamente la medicin.

El lado izquierdo representa a Q1 y el lado derecho a Q3. Por lo tanto, la caja contiene el 50% de los datos. En el interior de la caja se dibuja una lnea vertical que representa a la medicina. De la caja salen dos lneas horizontales que llegan hasta los valores limtrofes L1 y L2. L1 representa a la menor observacin que es, a su vez mayor o igual que Q1-1.5 * R1. L2 representa a la mayor observacin que es, a su vez, menor que Q3 + 1.5 * R1. EL GRAFICO DE CAJA COMO METODO PARA ANALIZAR UN CONJUNTO DE DATOS. Permite visualizar las carac-tersticias ms importantes de un conjunto de datos, su posicin, su variabilidad y la forma de la distribucin.

En cuanto a su posicin, cuanto ms grandes sean las observaciones, esto se manifiesta con un desplazamiento de la caja hacia la derecha. En cuanto a su variabilidad, cuanto ms dispersas estn las observaciones, mayor ser la amplitud de la caja. En cuanto a la forma de la distribucin, podemos establecer una regla general para averiguar si la distribucin de los datos es simtrica o no: - Si la caja interna izquierda es igual a la caja interna derecha (o sea, la mediana se localiza a la mitad de la caja: entonces la distribucin de los datos es simtrica.

- Si la caja interna izquierda es ms gran- - la presencia de un vade que la caja interna lor muy grande o muy derecha o viceversa, pequeo en relacin al
158

resto de los datos pue- que lo produjo para dede tratarse de un acon- cidir su eliminacin o tecimiento que tiene conservacin. muy poca probabilidad de ocurrir. No quiere decir que no ocurre nunca. De hecho, algu30 29 30 na vez ocurre. Para decidir si un outlier debe ser desechado o conservado en la muestra se deber investigar la causa que lo produjo. Si se debi a un error de medicin o registro se podr eliminar de la muestra. Pero si no puede encontrarse una razn que indique que el outlier se debi a un error de medicin o registro, se ha de mantener en la muestra. Es peligrosa su eliminacin pues ese valor puede contener informacin importante.

34 35

40

Fig. 2

EJEMPLO Quiero finalizar este artculo con un ejemplo simple de construccin de un grfico de caja que Usted puede realizar a mano pero, hoy en da, existen software estadsticos modernos que los realizan muy eficientemente. Los siguientes datos representan 15 mediciones del espesor de las asas de unas latas de pintura:

M=34 Q1=30 Q3=35 R1=5 Para la deteccin de outliers calculamos: Q1 - 1.5 * R1=30 -1.5 * 5 =22.5 Q3 + 1.5 * R1= 35 + 1.5 *5=42.5 No existen observaciones superiores a 42.5 pero si existe una observacin inferior a 22.5 que es el dato 20. Luego, 20 es considerado un outlier. Para completar la caja, debemos calcular L1 y L2 que resultan ser 29 y 40 respectivamente. El grfico de caja correspondiente se expone en la figura 2. Se observa que los datos presentan una marcada asimetra.

29 29 34 35 30 34 30 20 El grfico de caja permi- 30 te detectarla la presencia de outliers de la si- 35 34 38 34 40 34 guiente manera: Siguiendo los mtodos Toda observacin supe- vistos en la primera parrior a Q3+1.5 * R1 o in- te de este artculo calferior a Q1 - 1.5 * R1 es culamos M, Q1, Q3 y considerada un outlier. R1: Luego deber investigarse la causa
159

FINAL Seor Supervisor, Seor Operario: se ha dado cuenta de la utilidad de esta tcnica?. No slo permite hacer resaltar las propiedades ms relevantes de los datos sino que lo tranquiliza ante la duda de considerar a una medicin como outlier o no. Slo resta que Usted investigue la causa que lo produjo. Ponga esta herramienta en prctica. Lo ayudar a realizar su trabajo con datos que representan muy bien!! a la poblacin en estudio.

160

Actividad Obligatoria
Los desempleados, en porcentajes A continuacin se detallan los niveles de desocupacin en los 28 distritos urbanos del pas, ms Ro Negro, considerado aparte por el INDEC como un aglomerado urbano-rural, de acuerdo con el relevamiento realizado en octubre ltimo. DESOCUPACIN Baha Blanca 13,4 Gran La Plata 14,7 Mar del Plata y Batn 17,0 GBA y Capital 14,3 Catamarca 13,2 Corrientes 13,4 Gran Crdoba 16,1 Ro Cuarto 13,1 Chaco (Gran Resistencia) 10,1 Chubut (Comodoro Rivadavia) 11,8 Paran 12,2 Concordia 13,7 Formosa 6,3 Jujuy (San Salvador, Palpal) 15,5 La Pampa (Sta. Rosa) 9,3 La Rioja 9,7 Mendoza 6,1 Misiones (Posadas) 4,9 Neuqun y Plottier 11,3 Salta 14,3 Gran San Juan 8,6 San Luis y El Chorrillo 11,5 Santa Cruz (Ro Gallegos) 4,6 Gran Rosario 13,2 Sta. Fe y Sto. Tom 16,2 Santiago del Estero 9,4 Tierra del Fuego 10,3 Tucumn 15,5 Ro Negro 13,9

1) 2) 3) 4) 5) 6) 7) 8) 9) 10) 11) 12) 13) 14) 15) 16) 17) 18) 19) 20) 21) 22) 23) 24) 25) 26) 27) 28)

161

Con los datos del informe sobre el desempleo, efectuar los siguientes ejercicios: 1. a) Construir un diagrama de caja. b) Analizar la informacin a partir del grfico elaborado 2. a) Organizar los datos en un diagrama de tallos y hojas. b) Construir una tabla de frecuencias absolutas simples y una tabla de frecuencias relativas simples. c) Construir un histograma de frecuencias relativas. d) A partir de la serie de frecuencias, calcular la media aritmtica, la mediana, el desvo tpico y el coeficiente de variacin. e) Analizar la asimetra de la distribucin.

162

UNIDAD V TEORIA DE LAS PROBABILIDADES


1.- Introduccin
Hasta ahora, se ha desarrollado una estadstica descriptiva, es decir el tratamiento de datos consisti en una descripcin a travs de tablas, grficas y medidas resumidas (de posicin y de dispersin). Por ejemplo, un negocio posee 100 cuentas por cobrar. Un auditor toma una muestra de 15 cuentas y obtiene la media y el desvo tpico de los montos. El anlisis se limita a la muestra, sin hacer ningn tipo de generalizacin hacia la poblacin o sea a las 100 cuentas. Si el auditor en base a los montos por cobrar de la muestra desea estimar la media de montos de las 100 cuentas deber utilizar mtodos y tcnicas de la inferencia estadstica. Toda conclusin a la que llegue el auditor respecto a las 100 cuentas estar basado en una generalizacin que es mucho ms amplia que la conclusin que obtiene de las 15 cuentas; pero esa generalizacin no es totalmente vlida, el auditor debe determinar la probabilidad de que sea verdadera. La inferencia estadstica ayuda a la toma de decisiones en condiciones de incertidumbre, sta incluye afirmaciones y generalizaciones sobre la probabilidad de su validez. En conclusin, la teora de las probabilidades es la base de la estadstica inferencial (1). El desarrollo de las teoras de las probabilidades se debe a la atencin prestada a los juegos de azar en el siglo XVII en Francia e Inglaterra (2).

2.- Conceptos bsicos


Las probabilidades existen porque hay fenmenos aleatorios. Un fenmeno es aleatorio cuando su ocurrencia est determinada por factores fortuitos o por el azar. En cambio, en los fenmenos deterministas hay seguridad de la ocurrencia o no de un hecho.

1. Levin, Richard, Estadstica para Administradores. Prentice Hall. 2. Chao, Lincoln, Estadstica para las Ciencias Administrativas, Mc. Graw Hill.

163

El resultado de la tirada de una moneda o de un dado es un ejemplo clsico de un fenmeno aleatorio ya que situaciones aleatorias determinarn si ocurre cara o sello en la moneda o, los nmeros 1, 2, ..., 6 en el dado. Tambin son ejemplos de fenmenos aleatorios el nmero de accidentes de trnsito en una ruta, el resultado de un partido de ftbol o el nmero de defectuosos de un producto en un proceso productivo.

2.1.- Evento aleatorio - Espacio muestral - Experimento


a) Evento aleatorio: es uno o varios de los resultados posibles que se obtienen al hacer algo, es decir son los resultados conseguidos a travs de un experimento. b) Experimento: es un proceso, operacin o actividad que producen un evento. c) Espacio muestral: es el conjunto de todos los resultados posibles de un experimento. El espacio muestral es un conjunto universal. Ejemplo: Considrese los posibles resultados al arrojar un dado: - Espacio muestral (U) U = {1, 2, 3, 4, 5, 6}

Todos los posibles resultados (las 6 caras del dado) - Experimento: arrojar el dado - Eventos o Resultados posibles: cada cara del dado.

2.2.- Eventos aleatorios simples y compuestos


Un experimento puede implicar muchos y hasta un nmero infinito de resultados. Ya sea dijo que un resultado de un experimento constituye un evento aleatorio o suceso aleatorio. Los eventos pueden ser simples o compuestos.

164

a) Un evento aleatorio simple es el resultado de un solo ensayo en particular. Supngase el experimento de tirar dos monedas para determinar la ocurrencia del nmero de caras (c) o sellos (s). El espacio muestral es: U = {CC; CS; SC; SS}, o sea hay 4 resultados posibles. Cada uno de estos resultados es un evento simple. b) Un evento compuesto contiene dos o ms eventos simples. En el ejemplo anterior, los resultados de obtener por lo menos una cara son CC; CS; SC. Esto es un evento compuesto que es un subconjunto del espacio muestral porque est formado por 3 eventos simples distintos para un mismo resultado. Cada uno de los eventos simples constituye un punto muestral. En el ejemplo desarrollado hay 4 puntos muestrales:

CC CS SC SS

165

Actividad N 24
1) Un encuestador entrevista a 4 personas para conocer si est de acuerdo (S) o no (N) con la reeleccin presidencial. a) Cuntos posibles resultados hay? b) Cul es el espacio muestral de este experimento? 2) En un establecimiento secundario, se proyecta crear el nivel superior no universitario. Se estudian 3 posibles orientaciones: carreras de formacin docente (D), carreras de formacin tcnica (T) y/o carreras de formacin artstica (A). Observar el diagrama e indicar la zona o zonas de los siguientes posibles eventos. a) que se implementen nicamente carreras tcnicas, b) que no se implementen ninguna de las 3 orientaciones, c) que no se implementen ni carreras tcnicas ni artsticas, d) que no se implementen carreras docentes, e) que se implementen las 3 orientaciones. D 5 3 7 2 1 4 T 6 8 A

3) En el experimento de arrojar un dado, se sabe que el espacio muestral es U = {1,2,3,4,5 y 6}. Indicar si los siguientes eventos son simples o compuestos.

166

a) b) c) d)

El El El El

evento evento evento evento

de de de de

obtener obtener obtener obtener

un cuatro. un nmero par. un nmero mayor que 3. un nmero menor que 2.

167

3.- Los tres enfoques de la Probabilidad


Los conceptos de probabilidad estn relacionados con los 3 enfoques diferentes: el clsico, el de frecuencia relativa y el subjetivo.

3.1.- Probabilidad clsica


La probabilidad clsica, llamada tambin terica o matemtica, de que un evento ocurra se define como:

Nmero de resultados favorables P (E) = Nmero de resultados posibles (1)

Por ejemplo: Cul es la probabilidad de que en un mazo de naipes de la baraja espaola se obtenga una sota? 4 P (E) = 40 = 10 1 = 0,1

- El evento (E) es obtener una sota. - El nmero de resultados posibles es 40 que es la totalidad de naipes en la baraja espaola. - El nmero de resultados favorables es 4 ya que en la baraja hay 4 sotas. Otro ejemplo: Un cliente de una relojera desea comprar un despertador. Tiene la posibilidad de elegir entre 300 relojes marca A, 12 marca B y 8 marca C. Cul es la probabilidad de que compre un reloj marca C? 8 P (C) = 50 Obsrvese que en este enfoque todos los posibles resultados se conocen de antemano, por eso la probabilidad clsica se denomina probabili168

0,16

dad a priori . El espacio muestral est constituido: por resultados equiprobables puesto que cada resultado tiene la misma probabilidad de ocurrencia. Sin embargo, no en todos los problemas se pueden indicar de antemano las probabilidades de los experimentos, por ejemplo, la probabilidad de que una persona viva hasta los 70 aos, la probabilidad de que las ventas de una empresa aumenten en los prximos tres meses, probabilidad de ocurrencia de un accidente de trnsito, etc. En estos casos son tiles los otros dos enfoques.

3.2.- Frecuencia relativa de ocurrencia


Este enfoque tiene su origen en Inglaterra durante la dcada de 1800 cuando los estadsticos intentaban encontrar un fundamento terico para calcular el riesgo de las prdidas en los seguros de vida y comerciales, comenzaron definiendo las probabilidades de los datos estadsticos referidos a nacimientos y muertes(3). El enfoque de la frecuencia relativa define la probabilidad de dos maneras: a)Frecuencia relativa observada de un evento en un gran nmero de ensayos. Se determinan las frecuencias de que algo ha sucedido en el pasado y mediante esta cifra se puede estimar la probabilidad de que nuevamente ocurrir en el futuro. Se requiere de la observacin y recopilacin de datos y no est implcita ninguna suposicin de igualdad de probabilidades, por ello este enfoque tambin se denomina probabilidad emprica. Por lo tanto, de acuerdo a este enfoque, la probabilidad de que ocurra el evento (E) es: Nmero de observaciones de E P (E) = Tamao de la muestra n (E) = frecuencia = n n(E)/n = frecuencia relativa n (E) (2)

Ejemplo: Una muestra aleatoria de empresas industriales con un total de 10.000 empleados registr 300 accidentes de trabajo en un perodo de
3. Levin, Richard op. cit

169

12 meses. Cul es la probabilidad de ocurrencia de accidentes de trabajo durante este ao? 300 P (E) = 10.000 Este valor de probabilidad est calculado sobre una muestra, por eso es una estimacin del valor verdadero. Adems, se hace la suposicin de que los parmetros de seguridad industrial no han variado con respecto al perodo anterior en que se tom la muestra. b) La proporcin de las veces que un evento ocurre en el largo plazo cuando las condiciones son estables. Esta segunda caracterstica de la probabilidad de frecuencia relativa indica que a ms ensayo hay mayor exactitud. Un ejemplo clsico es el lanzamiento de una moneda correcta. La probabilidad de que ocurra cara o sello es 0,50 (1/2). Si se arroja 50 veces, la probabilidad de cara esta lejos de 0,5. Al aumentar el nmero de lanzamientos, hay una mayor estabilidad y mayor probabilidad de acercarse a 0,50. En resumen, si un experimento se realiza n veces con f xitos, se supone que la frecuencia relativa f/n tiende a un lmite cuando n aumenta. Entonces, la probabilidad de xito es: = 0,03

lim f / n

La probabilidad no est dada por este lmite, lo que puede hacerse es estimarla a partir de una muestra grande.

3.3.- Probabilidad subjetiva


Los dos enfoques anteriores dan como resultados valores de probabilidad objetivos porque indican la proporcin o porcentaje de ocurrencia del evento a largo plazo. En cambio, el enfoque subjetivista, la probabilidad de un evento es el grado de confianza que tiene una persona de que ese evento ocurra en base a la evidencia disponible, es un juicio personal. Un

170

enfoque personalista es apropiado cuando hay probabilidad de que el evento ocurra (o no) una nica vez o muy pocas veces. Muchas decisiones administrativas para problemas particulares requieren de probabilidades subjetivas ya que no existen situaciones idnticas anteriores como referencias; de esta manera debe contar con toda la informacin sobre el tema a efectos de tomar una decisin acertada. El siguiente ejemplo ilustra muy bien este enfoque. Un juez debe decidir si permite o no la instalacin de una planta de energas nuclear en una zona donde existe una falla geolgica. Puede preguntarse cul ser la probabilidad de que ocurra un grave accidente nuclear en ese lugar. El hecho de que no haya frecuencia relativa de evidencia de accidentes anteriores en el lugar no lo exime de tomar la decisin. Deber recopilar toda la informacin posible y actuar con gran sabidura para determinar la probabilidad o no de un accidente nuclear (4).

4. Levin, Richard, op. cit.

171

Actividad N 25
1) Para cada uno de los siguientes casos, indicar cul de los 3 enfoques es el ms apropiado (clsico, de frecuencia relativa o subjetiva) es el ms apropiado para determinar el valor de probabilidad. a) b) c) d) La probabilidad de que Ud. efecte un viaje a Europa este ao. La probabilidad de que aparezca un nmero par al tirar un dado. La probabilidad de anotar un gol en un partido de ftbol. La probabilidad de que un producto elegido al azar de un pedido grande resulte defectuoso. e) La probabilidad de que salga el 0 en la ruleta. 2) Elabore ejemplos de determinacin de probabilidad con los tres enfoques aplicados a problemas de la Administracin o Economa.

172

4.- Axiomas de Probabilidad


Un axioma o postulado es una declaracin que se acepta sin prueba. En general, el valor de probabilidad de un evento est entre 0 y 1. 0 < P (E) < 1 De aqu se desprende que: a) P (E) > 0: La probabilidad de cualquier evento debe ser siempre un valor positivo. Cuando la probabilidad es cero, significa que el evento no ocurrir. b) P (E) < 1: Significa que la probabilidad de un evento nunca puede ser mayor que 1. c) P (U) = 1: Significa que hay certeza que el evento ocurrir. U indica el espacio muestral que incluye todos los resultados posibles. P (E) + P (E) = 1 P (E) probabilidad de que ocurra el evento E. P (E) probabilidad de que no ocurra el evento E por lo tanto, P (E) = 1 - P (E) complemento de E P (E) + P (E) = 1 o P (E u E) = U (conjunto universal) y P (E) = 1 - P (E)

complemento de E

173

5.- Reglas de Probabilidad


5.1.- Eventos mutuamente excluyentes y no excluyentes. Reglas de la adicin
a) Eventos mutuamente excluyentes Dos eventos A y B son mutuamente excluyentes cuando la probabilidad de A excluye la probabilidad de ocurrencia de B y viceversa. Esto significa que ocurre A o B pero no ambos. Por lo tanto: P (A o B) = P (A) + P (B) P (A u B) = P (A) + P (B)

(3)

Esta regla se denomina regla especial de la adicin. Como A y B no tienen elementos en comn, entonces A B = 0. Ejemplos: Determinar la probabilidad de obtener una sota en un rey en las 40 cartas de la baraja espaola. P (S) = probabilidad de sota P (R) = probabilidad de rey. P (S o R) = P (S u R) = P (S) + P (R)

=
P (S o R) =

4 4 8 = = 40 40 40

1 = 0,02 5

Utilizando el diagrama de Venn S R P (S) + P (R) = 0,20 P (otra carta) = 1 - P (S u R) = 1 - 0,20 = 0,80 0,80

4 = 0,10 40

4 = 0,10 40

174

* La regla de la adicin se puede aplicar para tres o ms eventos. b) Eventos no excluyentes Dos eventos A y B no son mutuamente excluyentes cuando es posible que ocurran ambos. Por ejemplo si se desea determinar la probabilidad de obtener una sota o una carta de copa. Los eventos sota y copa pueden ocurrir simultneamente ya que se puede obtener una sota de copa. Entonces sota y copa son eventos no excluyentes. La frmula (3) debe modificarse para evitar un conteo doble, deber reducirse la posibilidad de ocurrencia de sota y copa. Entonces: P (A o B) = P (A) + P (B) - P (A y B) P (A u B) = P (A) + P (B) - P (A n B)

(4)

Esta es la regla general de la adicin. Pueden ocurrir A o B o ambos. Recordar que si son mutuamente excluyentes (A n B) = Ejemplo: P (S) = probabilidad de sota P (C) = probabilidad de copa P (S o C) = P (S) + P (C) - P (S y C)

4 10 1 13 + = 40 40 40 40
S S y C C los eventos se intersectan parcialmente

Otros ejemplos: - En un negocio de 40 empleados hay 8 cajeros, 20 vendedores, 7 administrativos y 5 empleados de maestranzas. 5 cajeros, 14 vendedores, 4 administrativos y 2 son empleados de maestranzas son varones.

175

Sean C = Cajero, A = Administrativo, V = vendedores, M = empleado de maestranza, H = hombre, F = mujer. Se elige un empleado al azar. Determinar: a)la b)la c) la d)la a) P (V o A) = P (V) + P (A) probabilidad de que sea vendedor o administrativo. probabilidad de que no sea vendedor. probabilidad de que sea cajero o mujer, probabilidad de que sea empleado de maestranza o varn.

=
b)

20 7 27 + = = 0,675 (eventos excluyentes) 40 40 40

P (V) = P (C) + P (A) + P (M)

=
o bien:

8 7 5 20 + + = = 0,50 (eventos excluyentes) 40 40 40 40

P (V' ) = 1
c)

20 = 0,50 40

P (C o F) = P (C) + P (F) - P (C y F)

P (Cop) =
d)

8 15 3 20 + = = 0,50 (eventos no excluyentes) 40 40 40 40

P (M o H) = P (M) + P (H) - P (M y H)

P (M y H) =

5 25 2 28 + = = 0,70 (eventos no excluyentes) 40 40 40 40

- La probabilidad de que una persona invierta en acciones de la compaa A es 0,20 y en acciones de la compaa B 0,30 y en ambas A y B, 0,10. Cul es la probabilidad de que:
176

a)Invierta en A o en B o en ambas. b)Invierta en A o en B pero no en ambas. c) No invierta en ninguna de las dos. A 0,10 0,10 B 0,10 0,60

a)P (A o B)

= P (A) + P (B) - P (A y B) = 0,20 + 0,30 - 0,10 = 0,50 (sucesos no excluyentes) = P (A o B) - P (A y B) = 0,40 - 0,10 = 0,30 (sucesos excluyentes)

b)P (A o B)

c) P (ni A ni B) = 1 - 0,40 = 0,60

177

Actividad N 26
1) El Sr. Gmez tiene una suma de dinero y piensa gastar el mismo en tres cosas: en una computadora (C), en vacaciones (V) o en una video grabadora (G). Las probabilidades de los tres eventos son respectivamente 0,28; 0,20 y 0,35. a) Cul es la probabilidad de que gaste el dinero en una de estas 3 cosas? b) Cul es la probabilidad de que gaste el dinero en otra cosa distinta (hacer un diagrama de Venn). 2) En una caja hay 30 artculos marca X, 15 marca Y, 35 marca Z. Entre los artculos X hay 10 defectuosos, entre los artculos Y hay 5 defectuosos y entre los de marca Z hay 8 defectuosos. Sea P (D) = defectuoso y P (D) = bueno. Si se selecciona al azar un producto, cul es la probabilidad de que: a) b) c) d) Sea defectuoso Sea Y o Z. Sea X o defectuoso o ambos Sea Z o bueno o ambos

3) Las probabilidades de que un vendedor de automviles venda en una semana cero, uno, dos, tres, cuatro o cinco y ms automviles son: 0,05; 0,10; 0,18; 0,25; 0,20 y 0,22 respectivamente. Cul es la probabilidad de que venda en una semana. a) dos o ms automviles; b) tres o menos automviles.

178

5.2.- Eventos independientes y dependientes. Reglas de la multiplicacin


a) Eventos independientes Dos eventos A y B son independientes cuando la ocurrencia de A no afecta a la probabilidad de que ocurra B y viceversa. Si A y B son eventos independientes, la probabilidad de A y B es igual al producto de sus probabilidades respectivas. P (A y B) = P (A) P (B) P (A n B) = P (A) P (B) (5) Regla especial de la multiplicacin.

P (A B) indica que tanto A como B ocurren, por lo tanto la interseccin es una probabilidad conjunta. Ejemplo: se arroja una moneda dos veces, cul es la probabilidad de que en cada tirada aparezca cara. Se sabe que P(C) = Sea C1 = C2 =

1 1 = 0,50 ; P (S) = = 0,50 2 2

evento de cara en la primera tirada. evento de cara en la segunda tirada.

La probabilidad conjunta es: P (C1 n C2) = = P (C1) P (C2) (0,50) (0,50)= 0,25

Las probabilidades conjuntas se pueden mostrar a travs de un diagrama de rbol. Considrese el lanzamiento de una moneda.

179

1 lanzamiento

2 lanzamiento

Probabilidades conjuntas

P (C1) = 0,50

P (C2 ) = 0,50 P (S 2 ) = 0,50 P (S 2 ) = 0,50

P (C1) P (C2 ) = 0,25 P (C1) P (S 2 ) = 0,25 P (S1) P (S 2 ) = 0,25 P (S1) P (C2 ) = 0,25 1

P (S1) = 0,50 P (C2 ) = 0,50

La probabilidad de cara, P (C) = 0,50 y la probabilidad de sello, P (S) = 0,50. Cada una de estas probabilidades es una probabilidad marginal o incondicional, es decir la simple probabilidad de que ocurre un evento. Por lo tanto, la probabilidad conjunta en condiciones de independencia estadstica es el producto de las probabilidades marginales. Otro ejemplo: Considrese en una baraja espaola, la probabilidad de que se obtengan una sota y luego un rey teniendo en cuenta que despus de sacar la primera carta se la repone. Por lo tanto: P (S n R) = P (S) . P (R)

4 4 1 = = 0,01 40 40 100

Obsrvese que la P (R) es la misma que P(S) porque al haber reposicin no est condicionada por la ocurrencia de S. b) Eventos dependientes Dos eventos A y B son dependientes cuando la ocurrencia de A afecta la probabilidad de ocurrencia de B y viceversa. Si A y B son eventos dependientes, la probabilidad de que ocurran A y B es igual a la probabilidad de A por la probabilidad de B con la condicin de que haya ocurrido A. P (A n B) =
180

P (A) . P (B/A)

(6)

P (B/A) denota la probabilidad condicional de B dado que ocurre A. La ecuacin (6) se denomina regla general de la multiplicacin. Es general porque se aplica tanto a eventos dependientes como independientes. Si los eventos son independientes P (B/A) = P (B). De la frmula (6) se obtiene la probabilidad condicional P (B/A):

P (A B) (7) P (B/A) = P (A )
Ejemplo: Considrese el mismo ejemplo anterior de obtener una sota y luego un rey en una baraja espaola, pero en este caso al sacar la primera carta no se la repone. Por lo tanto. P (S o R) = P (S) . P (R / S)

4 4 16 4 = = = 0,0103 40 39 1560 390

En este caso la P (R) si est condicionada por P (S) debido a que no hubo reposicin. Al sacar la primera carta P(S) = 4/40, al sacar la segunda quedan 39, por lo tanto P(R/S) = 4/39.

Probabilidades conjuntas utilizando tablas de contingencias


Para determinar las probabilidades conjuntas tambin se pueden utilizar una tabla de contingencia. En la asignatura Contabilidad de la carrera de Contador Pblico de la Universidad Norte se analiza el rendimiento de los alumnos de 1 ao considerando si provienen de colegios secundarios con carreras comerciales o de otras carreras. Sea: B = rendimiento bueno B= rendimiento pobre C = provienen de colegios de carreras comerciales. C = provienen de colegios con otras carreras. Se muestran las probabilidades conjuntas en la siguiente tabla:

181

CARRERA Rendimiento B B Total C 0,08 0,32 0,40 C 0,12 0,48 0,60 Total 0,20 0,80 1,00

- En cada celda se anotan las probabilidades conjuntas P(B n C); P (Bn C); P (B n C); P (B n C). - El total de cada fila y de cada columna son las probabilidades marginales P (C) = 0,60; P (C) = 0,40; P (B)= 0,20; P (B) = 0,80. A travs de esta tabla se puede determinar si los eventos rendimiento y carrera son independientes o no. En este caso son independientes ya que cada probabilidad conjunta es igual al producto de las probabilidades marginales. Esto indica que el rendimiento no tiene nada que ver con la carrera secundaria. Se puede demostrar de la siguiente manera: P (B) = 0,20 P (B n C) P (B/C) = P (C) P (B/C) = P (B) Supngase que se analiza la misma situacin en la Universidad Sur. Se confeccional la siguiente tabla de contingencia o de probabilidades conjuntas: = 0,40 0,08 = 0,20

182

CARRERA Rendimiento B B Total C 0,15 0,25 0,40 C 0,05 0,55 0,60 Total 0,20 0,80 1,00

En este caso, los eventos son dependientes, es decir que el rendimiento si depende de la carrera. Las probabilidades conjuntas no son iguales al producto de las probabilidades marginales. Esta situacin de dependencia se puede comprobar de la siguiente manera: P (B) = 0,20 P (B C) P (B/C) = P (C) P (B/C) P (B) Los ejemplos anteriores sirvieron para analizar la dependencia o independencia de los eventos. En el siguiente ejemplo se ver como se confecciona una tabla de contingencia. Se presentan 100 postulantes, 40 mujeres (M) y 60 varones (V) para un examen de admisin a distintos cargos en una empresa. De las mujeres aprobaron (A) el 90%, mientras que el 20% de los varones desaprobaron (D) el examen. P (M) = 0,40 P (A/M) = 0,90 P (D/M) = 0,10 P (V) = 0,60 P (A/V) = 0,80 P (D/V) = 0,20 = 0,40 0,15 = 0,375

183

Primero se confeccionar un diagrama de rbol:


Probabilidades Conjuntas

P(A/M) = 0,90
= M) ( P 0 0,4

P(M) . P(A/M) = 0,40 (0,90) = 0,36 P(M) . P(D/M) = 0,40 (0,10) = 0,04

P(D/M) = 0,10

P( V

)=

P(A/V) = 0,80
0,6 0

P(V) . P(V/A) = 0,60 (0,80) = 0,48 0,12

P(D/V) = 0,20

P(V) . P(D/V) = 0,60 (0,20)= 1,00

Ahora se construir una tabla: Resultado A Sexo M V Total 0,36 0,48 0,84 0,04 0,12 0,16 0,40 0,60 1,00 D Total

Determinar a)P (A) b) P (V n D) C) P (V/A) d) P (A/V)

e)Si sexo y calificacin son independientes. a)P (A) = 0,84 b) P (V n D) = 0,12 0,48 = P (A) P (A n V) d)P (A/V) = P (V) = 0,60
184

P (V n A) c) P (V/A) =

= 0,57 0,84 0,48 = 0,80

P (M n A) e)P (M) = 0,40 P (M/A) = P (A) P (M/A) = P (M) no son independientes. =

0,36 = 0,43 0,84

185

Actividad N 27
1) Una bolsa contiene 30 tarjetas: 8 blancas, 10 rojas, 12 azules. Se extraen dos tarjetas sin reemplazos, Cul es la probabilidad de extraer? a) Dos tarjetas azules una despus de la otra? b) Una blanca y una roja despus? c) Dos del mismo color? 2) Resolver el ejercicio anterior con reposicin de tarjetas. 3) Dos divisiones de productos distintos de una empresa son Alfa y Beta. Se estima que la probabilidad de que productos Alfa tenga un margen de utilidad del 10% este ao es 0,30; la probabilidad de que Beta tenga un margen de utilidad del 10% es 0,20 y la probabilidad de que ambos productos tengan un margen de utilidad del 10% es 0,06: a) Cul es la probabilidad de que ambos productos tengan la utilidad del 10%? b) Cul es la probabilidad de que Beta tenga el margen de utilidad del 10% dado que Alfa alcanza ese criterio de ganancia? c) Aplicar una prueba apropiada para determinar si el logro de utilidades de ambos productos es estadsticamente independiente. 4) Un profesor de estadstica sabe por experiencia anterior que un alumno que estudia regularmente la asignatura tiene una probabilidad de aprobar del 0,80, mientras que el alumno que no lo hace regularmente tiene una probabilidad del 0,20 de aprobar. El docente sabe que el 60% de los estudiantes estudian regularmente. Si un estudiante aprueba la asignatura, cul es la probabilidad de que haya estudiado regularmente? Sea A = aprob, R= Estudia regularmente. 5) La siguiente tabla de probabilidad conjunta muestra las reacciones de los votantes ante un nuevo decreto presidencial:

186

REACCIN AFILIACION A FAVOR NEUTRAL (F) (N) 0,30 0,125 0,125 0,55 0,05 0,075 0,025 0,15 EN CONTRA (C) 0,05 0,15 0,10 0,30 TOTAL

P.J.(J) UCR (R) OTROS (O) TOTAL

0,40 0,35 0,25 1,00

I) Con referencia a la tabla determinar las siguientes probabilidades: a) de que el votante est en contra, b) de que el votante sea afiliado del P.J. y est en contra, c) de que el votante sea afiliado a otros partidos polticos. d) de que el votante est a favor del decreto dado que pertenece a la U.C.R. e) de que el votante sea del P.J. o de la U.C.R. f) de que el votante sea de la U.C.R. o sea neutral. II) Son afiliacin y reaccin eventos independientes?

187

6.- Reglas de conteo


En el enfoque clsico para determinar la probabilidad se requiere del nmero total de posibles resultados. En problemas sencillos es posible contar todos los posibles resultados, pero en otros se necesita del uso de los mtodos de combinatoria (permutaciones, variaciones y combinaciones).

6.1.- Regla de la multiplicacin


Esta regla puede considerarse bajo dos situaciones: a)Si se realizan un cierto nmero (n) de operaciones o actos, y cada operacin o acto puede realizarse en el mismo nmero de formas (k), el nmero total de posibles resultados para n operaciones o actos: (k) . (k) ... (k) = kn Ejemplo: se lanzan 4 monedas para determinar cuntas caras salen. Hay 4 actos y cada uno tiene dos posibles resultados (formas): cara o sello. Entonces, el total de posibles resultados para los 3 actos es: kn = 24 = 16 posibles resultados Listando los resultados se tiene: CCCC CCCS CCSC CSCC SCCC CCSS SSSS SSSC SSCS SCSS CSSS SSCC SCSC CSCS CSSC SCCS 16 Resultados

b)Si hay n actos u operaciones que pueden realizarse en k1, k2, .... kn formas, respectivamente, el nmero total de posibles resultados diferentes para los n actos u operaciones es:

188

(k1) . (k2) .... (kn) Ejemplo: Un men consta de 3 comidas, 2 tipos de bebidas y 2 tipos de postres. De cuntas formas posibles puede seleccionarse dicho men? (3) (2) (2) = 12 formas posibles Diagrama de rbol Comidas Bebidas Postres P1 B1 P2 C1 P1 B2 P2 P1 B1 P2 C2 P1 B2 P2 P1 B1 P2 C3 P1 B2 P2 C3 B2 P2 C3 B2 P1 C3 B1 P2 C2 B2 P2 C3 B1 P1 C2 B1 P1 C2 B1 P2 C1 B2 P2 C2 B1 P1 C1 B2 P1 C1 B1 P2 Resultados C1 B1 P1

6.2.- Permutaciones
Una permutacin es un arreglo ordenado de todos los n elementos de un conjunto.
189

Pn = n (n-1) (n-2) (n-3) ... (3) (2) (1)


n

Pn = n! (8)

n! factorial de n Si n = 0, 0! = 1 Ejemplo: Encontrar el nmero total de permutaciones del conjunto de letras a b c tomadas todas a la vez.
3

P3 = 3! = 3 x 2 x 1 = 6 permutaciones bac bca cab cba

abc acb

6.3.- Variaciones
Una variacin es una forma especial de permutacin. Se refiere a un arreglo ordenado de r elementos tomados de conjunto de n elementos. Es un arreglo de una parte de los elementos. El nmero total de posibles variaciones es:
n r

V=

n! (n r )!

(9)

Ejemplo: Encontrar el nmero total de variaciones del conjunto de letras abc tomadas de dos a la vez: n=3
3 2

r=2

V =

3! 3 x 2 x1 = = 6 (3 2)! 1
3

V2 ac ca

3x2

ab ba

bc cb

6 formas posibles. Obsrvese que como aqu interesa el orden, ab no es lo mismo que ba190

Otro ejemplo: En un concurso hay 3 premios (primero, segundo y tercero) para 10 participantes. De cuntas formas pueden obtenerse los 3 premios? n = 10 r = 3. Hay 10 formas de obtener el primer premio, 9 de obtener el segundo y 8 el tercero. Por lo tanto:
10

V3 =

(10) (9) (8) =

720 formas posibles

o bien

10 3

V =

10! (10) (9) (8) (7! ) = = 720 (10 3)! 7!

6.4.- Combinaciones
Una combinacin es un arreglo de r elementos tomados de un conjunto de n elementos sin importar el orden. El nmero total de posibles combinaciones es:

C=
n r

n! r! (n r )!

(10)

Ejemplo: Encontrar el nmero total de combinaciones del conjunto de letras abc tomadas de a dos a la vez. n=3 r=2

C =
3 3

3! (3) (2) (1) = = 3 2! (3 2!)! (2) (1)


3 formas posibles

ab - ac - bc

Obsrvese que como aqu no interesa el orden ab = ba Otro ejemplo: Entre 15 personas, se desea formar una comisin de 5 miembros. De cuntas maneras posibles puede formarse dicha comisin?

C =
15 5

15! = 3.003 5! (15 5 )!

191

El nmero total de combinaciones posibles de un conjunto de n elementos tomados todos a la vez es igual a 1.
n

Cn = 1

6.5.- Aplicacin de permutaciones y combinaciones para determinar probabilidades


Sea el siguiente problema: Una caja contiene 15 tarjetas, 6 rojas y 9 verdes. Se sacan 4 tarjetas aleatoriamente. Determinar la probabilidad de que: a)Sean 4 rojas o 4 verdes. b)Sean 2 rojas y 2 verdes. 1) Se deben calcular el nmero total de posibles resultados (combinaciones) de sacar 4 tarjetas entre las 15.

C =
15 4

15! = 1.365 4! 11 !

2) A continuacin se resuelven los puntos a y b. a) El nmero de combinacin de 4 rojas tomadas de las 6 tarjetas rojas es:

C=
6 4

6! = 15 4! 2!

El nmero de combinaciones de 4 tarjetas verdes tomadas de las 9 verdes es:

C=
9 4

9! = 126 4! 5!

Por regla de la adicin, el nmero total de combinaciones de 4 rojas o 4 verdes es:


6

C4 +

C4 =

15 +
192

126 =

141

La probabilidad de sacar 4 rojas y 4 verdes es:

C + C R (4R o 4V) =
6 4 9 4

C
15 4

141 = 0,103 1.365

b) El nmero de combinaciones de 2 rojas entre 6 tarjetas de ese color es:

C=
6 2

6! = 15 2! 4!

El nmero de combinaciones de 2 verdes entre 9 tarjetas de ese color es:

C=
9 2

9! = 36 2! 7!

Por regla de la multiplicacin, el nmero total de combinaciones de 2 rojas y 2 verdes es: -6C2 . 9C2 = 15 . (36) = 540 La probabilidad de sacar 2 rojas y 2 verdes es:

C C P (2R y 2V) =
6 2 9 2

C
15 4

540 = 0,396 1.365

193

Actividad N 28
1) Una prueba consiste en 10 preguntas de verdadero/falso. De cuntas formas posibles puede resolverse la prueba? 2) Un contratista de construccin ofrece casas con cinco distintos tipos de ambientes, tres tipos de techos y dos tipos de pisos. De cuntas maneras puede elegir un comprador una casa? 3) El presidente, vicepresidente, secretario y tesorero de una determinada asociacin, se elegirn de entre 10 candidatos. Determinar el nmero de maneras distintas que esos puestos pueden ocuparse. 4) Un profesor recomienda doce textos en la bibliografa de su materia. Siete de los libros son de autores nacionales y el resto de autores extranjeros: Si el profesor indica a los alumnos la lectura de 3 libros: a) De cuntas formas posibles pueden seleccionar 3 libros de autores nacionales o 3 de autores extranjeros; b) de cuntas formas pueden seleccionar 2 libros de autores nacionales y 1 de autor extranjero. 5) Una compaa tiene dos puestos disponibles y los asignar eligiendo al azar 2 personas de una lista de 2 mujeres y 2 hombres, todos ellos con una larga trayectoria dentro de la compaa. a) Cul es la probabilidad de que al menos una mujer sea seleccionada? b) Cul es la probabilidad de que ninguna de las mujeres sea seleccionada?

194

7.- Teorema de Bayes


La regla de Thomas Bayes (1702-1761) es una tcnica para calcular probabilidades condicionales. La importancia de Bayes radica en el uso de probabilidades subjetivas para tomar decisiones en condiciones de incertidumbre. Su inters se centr en el desarrollo de un mtodo para encontrar la probabilidad de una causa especfica cuando se observa un efecto particular. El evento B ha ocurrido, cul es la probabilidad de que la causa sea A1 o A2. Sea la siguiente ecuacin: P (A1) . P(B/A1) = P (B) P (A1/B)

P ( A 1 / B) =

P (A1) P (B / A1) = P (B)

(11)

Si hay n eventos mutuamente excluyentes A1 A2,...An que pueden causar el evento B (efecto), entonces B puede ser determinado por una de las causas, la probabilidad de que el evento B ocurra es: P(B)= P [(A1 n B) U P (A2 n B) U....U + P (An n Bn)] Como los eventos son mutuamente excluyentes, entonces (Ai n B) y (Aj n B) son tambin mutuamente excluyentes. Por regla especial de la adicin. P(B)= P (A1 n B) + P (A2 n B) +...+ P (An n B) Por regla general de la multiplicacin: P(B)= P (A1) P (B/A1) + P (A2) P (B\A2) +...+ P (An) P (B/An) Sustituyendo en (11) P (A1) . P(B/A1) (12) P(A1/B) = P(A1).P(B/A1)+P(A2)P(B/A2) +...+ P(An).P(B/An

195

P ( A1 / B ) =

P ( A1 n B ) P (B)

(13) igual a la frmula (7)

En resumen: Conociendo P(B/A1) puede calcularse P(A1/B). Ejemplo: Los productos de un negocio son comprados a 3 proveedores X, Y, Z. El 50% de los artculos se compran en X, el 30% a Y y 20% a Z. Se sabe que X se retrasa en los pedidos el 3% de las veces, Y, el 5% de las veces, y Z el 2%. Se recibe un pedido retrasado, cul es la probabilidad de que sea del proveedor Y? R = retraso P (R/X) = 0,03 P(R/Y) = 0,05 P (Y) . P (R/Y) P(Y/R)= P (X). P(R/X) + P(Y) P(R/Y) + P(Z) P(R/Z) = P (R) P (R/Z)= 0,02 P (RnY)

0,50 (0,05) = 0,30 (0,03) + 0,50 (0,05) + 0,20 (0,02) =

0,025 0,038

P(Y/R) =

0,658

Con el uso de las tablas de probabilidades conjuntas se simplifica el clculo de probabilidades condicionales para el teorema de Bayes. Se constituye la tabla para el ejemplo anterior: R = retraso Proveedor X Y Z Total R= sin retraso R 0,009 0,025 0,004 0,038 R 0,291 0,475 0,196 0,962 Total 0,30 0,50 0,20 1,00

196

P(Y n R) P(Y/R) = P (R) =

0,025 = 0,658 0,38

El teorema de Bayes es, en un sentido, lo que se espera que haga el mdico al diagnosticar un paciente. El mdico conoce los sntomas de cada enfermedad P(B/Ai) y la frecuencia relativa de cada enfermedad P (Ai). Lo que el mdico observa en el paciente es un sntoma y debe determinar (diagnosticar) la probabilidad de que ese paciente tenga una enfermedad particular, dado ese sntoma P(Ai/B) (5).

5. Mills, Richard, Estadstica para Economa y Administracin. Ed. Mc Graw-Hill.

197

Actividad N 29
1) Una vendedora a domicilio sabe por experiencia que de todas las visitas realizadas el 15% dieron como resultado grandes ventas (G), el 30% pequeas ventas (S) y el 55% no fueron ventas (N). De aquellos que hicieron grandes compras, el 75% viven en zona cntrica (C); de los que realizaron pequeas compras, el 50% vive en zona cntrica y el 30% que no realiz compras vive en esa zona. Si la siguientes visita se realiza en la zona cntrica, Cul es la probabilidad de una gran venta? Una venta pequea?, Ninguna venta? 2) Hay 3 cajas iguales (I, II, III) que contienen alhajas de oro. La caja I contiene un anillo, la II un reloj y dos pulseras y la III un anillo, dos pulseras y dos relojes. Se selecciona al azar una caja y extrae una alhaja. Si la alhaja es un reloj, cul es la probabilidad de que provenga de la caja I? De la caja II? De la caja III?

198

Ejercicios de Repaso
1) Una compaa telefnica est considerada la conveniencia de distribuir los fondos de una campaa promocional tendiente a incrementar las llamadas a larga distancia en una provincia. La siguiente tabla contiene los mercados en los que, en opinin de la empresa, vale la pena centrar las promociones: Segmentos del mercado A B C D E Costo de la Campaa $ $ $ $ $ 350.000 550.000 250.000 200.000 250.000

Se cuenta con $800.000 para destinarlos a esas campaas: a) Preparar una lista mutuamente excluyente de los eventos posibles de la decisin referente a los gastos. b) Suponer que la compaa decidi destinar la totalidad de los $800.000. Cambia esto la respuesta de (b)? Fundamentar. 2) De 100 postulantes que se presentaron a una empresa, 40 tenan experiencia anterior (E) y 30 profesionales (F). Sin embargo, 20 de los solicitantes reunan ambos requisitos y ya han sido incluidos en los conteos anteriores. a) Elaborar un diagrama de Venn que describa esta poblacin. b) Cul es la probabilidad de que un solicitante elegido al azar tenga experiencias previa o sea profesional? c) Cul es la probabilidad de que un solicitante tenga experiencia previa o sea profesional pero no ambas cosas? d) Cul es la probabilidad de que un solicitante elegido al azar sea profesional, dado que tiene experiencia anterior?

199

3) Un canillita ofrece 3 diarios: Tribuno, Nacin y Clarn. Posee 10 ejemplares del diario Tribuno, 7 del diario Nacin y 4 del diario Clarn. Un comprador adquiere 3 ejemplares, Cul es la probabilidad de que: a) los 3 sean de distintos diarios? b) los 3 sean del mismo diario? 4) Los empleados de una universidad fueron clasificados de acuerdo a su edad y ocupacin. Los resultados se dan en el siguiente cuadro: X Edad Ocupacin Administrativo Docentes Personal de Apoyo W Y Z

21 - 30 2 1

31 - 40 24 40

41 - 50 16 36

51 y ms 17 28

16

20

14

Considerando que se selecciona un empleado al azar, obtener la probabilidad de que el elegido: a) Sea administrativo o tenga 51 aos o ms. b) No sea docente. c) Sea docente dado que tiene entre 41 y 50 aos. 5) Un hombre de 40 aos contrata un seguro diferido a 20 aos. Su mujer tiene la misma edad. Se sabe que la probabilidad de que un hombre de 40 aos sobreviva 20 aos es 0,80 y la probabilidad de que una mujer de 40 aos sobreviva 20 aos es 0,90. Cul es la probabilidad de que por lo menos uno est vivo para que cobre el seguro? 6) Un gerente bancario estudia la relacin entre la condicin de empleo al momento de un prstamo y el hecho de que si despus del prstamo se vuelve o no moroso. Elige al azar 100 cuentas, y obtiene los siguientes resultados:
200

Condicin del Prstamo Moroso (M) No moroso (M) Total

Condicin de empleo Total Con empleo (E) 10 60 70 Sin empleo (E) 8 22 30 18 82 100

a) Confeccionar una tabla de probabilidades conjuntas. b) Obtener las siguientes probabilidades indicando el significado de cada una: i) P (M) ii) P (M y E) iii) P (M / E) iv) P (M o E) v) Son condicin de prstamos y condicin de empleo independiente.

7) De un grupo de 20 personas, 10 hablan francs (F), 8 hablan ingls (I) de los cuales 3 tambin hablan francs y 5 no hablan ninguno de estos idiomas. Se selecciona un individuo al azar. a) b) c) d) e) Cul es la probabilidad de que hable francs? Cul es la probabilidad de que hable ingls? Cul es la probabilidad de que no hable ninguno de estos idiomas? Cul es la probabilidad de que hable francs e ingls? Cul es la probabilidad de que hable francs sabiendo que habla ingls? f) Cul es la probabilidad de que hable ingls sabiendo francs? g) Cul es la probabilidad de que hable francs o ingls o ambas? 8) Sean los siguientes eventos: A1 :la familia tiene auto. A2 :la familia no tiene auto. B1 :el ingreso familiar es menor que $4.000. B2 :el ingreso familiar est entre $4.000 y $8.000. B3 :el ingreso familiar es mayor que $8.000 y en la poblacin bajo estudio se tiene:

201

P (A1) = 0,70 P (A1 / B2) = 0,85 Hallar:

P (B2) = 0,45 P (A1 / B3) = 0,90

P (B3) = 0,08

a) P (B3 y A1) c) P (B2 / A1)

b) P (A1 o B3) d) P (A1 /B2)

9) Para contribuir a la seleccin de empleados idneos para el desempeo de un puesto determinado, el departamento de personal toma una prueba de aptitud a todos los solicitantes. A fin de determinar la efectividad de la prueba, se contrast con una muestra de solicitantes que reprobaron y se los puso a prueba durante un lapso de tiempo corto. Se encontr que del 30% que pasaron la prueba slo el 80% fueron satisfactorios y de aquellos que no pasaron la prueba, el 10% fueron satisfactorios. a) Determinar la probabilidad de que un solicitante sea satisfactorio para este puesto. b) Determinar la probabilidad de que un solicitante sea satisfactorio habiendo sido reprobado. 10) Indicar si los siguientes enunciados son correctos o incorrectos (C o I). a) ( ) El resultado de un experimento se llama actividad. b) ( ) Si A y B son eventos mutuamente excluyentes, entonces P (A B) ) = c) ( ) La probabilidad clsica supone que todos los resultados posibles de un experimento tienen igual probabilidad de presentarse. d) ( ) Si A y B son estadsticamente dependientes, entonces P (A y B) = P (A) . P (B). e) El teorema de Bayes es la frmula de la probabilidad condicional en condiciones de dependencia estadstica.

202

Respuestas a los ejercicios de la Unidad V


Puntos 1 y 2 1) a) 16 SSSS, SSSN, SSNS, SNSS, NSSS, SSNN, SNNS, SNSN b) (U) = NSNS, NNSS, NSSN, NNNS, NNSN, NSNN, SNNN, NNNN

2)a) 6

b) 8

c) 5 y 8 d) 4 - 6 - 7 y 8 b) Compuesto;

e) 1 d) Compuesto.

3)a) Simple;

c) Compuesto;

Punto 3 1) a) Subjetiva; b) Clsica; c) Frecuencia relativa; d) Frecuencia relativa; e) Clsica.

Puntos 4 y 5.1 1) C 0,28 V 0,20 G 0,35 a) P (C o V o G) = 0,83 b) P (otra cosa distinta)= =0,17 o bien 1-0,83= 0,17

0,17 2)a) P (D) = 23/30 b) P (Y o Z) = 5/8 c) P (X o D) = 43/80 (eventos no excluyentes) d) P (Z o D) = 13/16 (eventos no excluyentes) 3) a) P (2 o ms) = 0,85 b) P (3 o menos) = 0,33

203

Punto 5.2 1) a) P (A1 n A2) = 22/145 = 0,152 b) P (B1 n R2) = 8/87 = 0,092 c) P (A1 n B2) u P (R1 n R2) u P (A1 n A2) = 0,32 2)a) 0,16 ; 3)a) b) 0,09 ; c) 0,34

P (Alfa y Beta) = 0,06 0,06

b)

P (Beta/Alfa) = 0,30

= 0,20

c)

P (Beta)

P (Beta/Alfa)?

P (Beta) = 0,20 P (Beta/Alfa) = 0,20 son independientes P (R n A) 4)P (R/A) = P (A) 5)I) a) P (C) = 0,30 c) P (O) = 0,25 e) P (J o R) = 0,75 II) O son independientes = 0,56 b) P (J y C) = 0,05 d) P (F/R) = 0,36 f) P (R o N) = 0,425 0,48 = 0,86

Punto 6 1) kn = (2)10 = 1024 2) (5) (3) (2) = 30

204

3) 4)

10

V4 = 5040 a) 7C3 + 5C3 = 45 ; b) 7C2 . 5C1 = 26.


2 2

C + C
5)

C = 6
4 2

a)

2 1

C
4 2

2 1 = = 6 3

C b)
2 2

C
4 2

1 6

Punto 7 1) C G S N Total 0,1125 0,15 0,165 0,4275 C 0,0375 0,15 0,385 0,5725 Total 0,15 0,30 0,55 1,00

P (G/C) = 0,26 2) a) P (I/R) = 0

P (S/C) = 0,35

P (N/C) = 0,39

b) P (II/R) = 0,45 c) P (III/R) = 0,55

205

Ejercicios de Repaso
1) a) Hay 17 subconjuntos que pueden abarcarse con el presupuesto A BCD E A,C - A,D - A,E - B,C - B,D - B,E - C,DC,E - D,E - A,C,D - A,D,E - C,D,Eb) Los nicos subconjuntos donde se gasta todo el presupuesto son B,C - A,C,D - B,E - A,C,E. 2) a) E 20 20 50 F 10 b) P (E o F) = 0,50 c) P (E o F) = 0,30 d) P (F \ E) = 0,50

3) a) 280/1330 = 0,21

b) 159/1330 = 0,12.

4) a) P (A o Z) = 0,41; b) P (A o S) = 0,51; c)P (D/Y) = 0,24 5) 0,98 6) a) M M Total E 0,10 0,60 0,70 E 0,08 0,22 0.30 Total 0,18 0,82 1,00

b) i) Prob. de moroso = 0,18 ii) Prob. de no moroso y sin empleo = 0,22 iii) Prob. de moroso dado que tiene empleo = 0,14 iv)Prob. de no moroso o sin empleo = 0,90 v) No son independientes.

206

7)

I 5 3

F 7 5

a)P (F) = 0,5 b)P (I) = 0,4 c) P (I n F) = 0,25 d)P (F n I) = 0,15 e)P (F / I) = 0,375 f) P (I / F) = 0,30 g)P (F o I) = 0,75 8) B1 A1 A2 Total 0,2455 0,2245 0,47 B2 0,3825 0,0675 0,45 B3 0,072 0,008 0,08 Total a) 0,072 0,70 b) 0,708 0,30 c) 0,546 1,00 d) 0,85 9)a) Satisf. (S) 0,80 Aprobaron (A) 0,30 No satisf. (S) 0,20 Satisf. (S) 0,10 Reprobaron (R) 0,70 No Satisf. (S) 0,90 b)P (S) = 0,31 10) a) I b) c) P (S / R) = 0,10 C c) C d) I e) C 0,24 0,06

0,07 0,63 1,00

207

208

UNIDAD VI DISTRIBUCIN DE PROBABILIDADES


1.- Distribucin probabilstica
1.1.- Concepto de Funcin (6)
Se define una funcin como una asociacin especial entre un elemento (x) de un conjunto y un elemento (y) de otro conjunto, donde cada elemento x se relaciona con uno y slo uno de los elementos y. x e y consideran un par ordenado (x,y). Por ejemplo, un par ordenado (5,3) que se muestra en el siguiente grfico. El primer elemento del par se representa en el eje horizontal y el otro en el eje vertical.
y

5 4 3 2 1 1 2 3 4 5

(5.3)

Cada par ordenado est representado por un punto en el plano. Los dos conjuntos de elementos representan a todos los posibles valores que x e y pueden tomar; cualquier regla que defina una relacin entre ellos ser una ecuacin. Considrese y = x + 2; y es una funcin de x. Al asignar un valor a x le corresponde uno y solo un valor de y; por ej.: x=6; y=8. Se utiliza f para designar funcin y la notacin funcional es f(x) (valor de f en x). La ecuacin x+2 puede expresarse como f(x) = x+2 o sea y = f(x).

1.2.- Variable aleatoria


Las letras x e y se consideran variables. El valor de variable y se obtiene cuando se sustituye el valor de la variable x en la funcin. Entonces x es la variable independiente e "y" la variable dependiente.
6. Chao, Lincoln, op. cit.
209

La mayora de las funciones en estadstica son funciones probabilsticas. A cada evento aleatorio se le asigna un nmero y dicho nmero es el valor de la variable aleatoria. Si los valores que toma un smbolo tal como x estn asociados con los eventos aleatorios de un experimento, y depender de ocurrencias aleatorias, a ese smbolo se le denominavariable aleatoria. Por ejemplo, sea X el nmero de caras al arrojar 2 monedas: Espacio muestral SS CS SC CC Valor de la variable aleatoria (X) 0 1 1 2 (ninguna cara) (una cara) (una cara) (dos caras)

1.3.- Funcin probabilstica


Una funcin probabilstica es una regla que asigna una fraccin probabilstica a cada uno de los valores de la variable aleatoria. La funcin probabilstica para el nmero de caras al lanzar 3 monedas es la siguiente: Espacio muestral SS CS 1 SC CC 2 1/4 1,0 2/4 X 0 P (X) probabilidad 1/4

210

P(x) 2/4 1/4

1.4.- Distribucin probabilstica


Las funciones probabilsticas tambin se denominan distribuciones probabilsticas, ya que la probabilidad total (1 o 100%) se distribuye entre todos los posibles valores de la variable aleatoria. Una distribucin probabilstica es una distribucin de probabilidades donde cada fraccin probabilstica est asociada con uno de los posibles valores diferentes de la variable aleatoria. De acuerdo a la naturaleza de la variable aleatoria, las distribuciones probabilsticas pueden ser discretas o continuas (ver mdulo 1). La distribucin probabilstica es una distribucin de frecuencias relativas a largo plazo. La distribucin probabilstica es una distribucin terica mientras que la distribucin de frecuencias relativas es una distribucin emprica.

211

Actividad N 30
1) Cuatro tarjetas marcadas con los nmeros 1 - 2 - 3 y 4 se colocan en una caja y se mezclan. Sea X la variable aleatoria que indica el nmero de la tarjeta que se extrae con reemplazo. Obtener la distribucin probabilstica de X. 2) Un vendedor ofrece dos modelos de video grabadoras R y S. La preferencia de ambos modelos es la misma: el 50% de los posibles compradores prefieren R y el otro 50% prefieren S. Hay en existencia 3 videos de cada modelo y supngase que en un slo da se venden 3 videos: a) Cul es la probabilidad de que en un cierto da se vendan 3 videos del mismo modelo? b) Definir la variable aleatoria de este experimento. c) Definir los eventos simples y sus valores correspondientes de la variable aleatoria. d) Cul es la distribucin probabilstica de X?

212

2.- Valor esperado


La media a largo plazo de una variable aleatoria x se denomina valor esperado y se simboliza E(X). Para una variable aleatoria discreta el valor esperado es igual a la suma de los distintos valores multiplicados por sus probabilidades correspondientes: n E (X) = Xi P (Xi) i=1 xi P (xi)

(14)

= x1 P(x2) + x2 P(x2) + ... + Xn P(xn)

El valor esperado llamado tambin esperanza matemtica de una variable aleatoria es un promedio ponderado, donde las probabilidades correspondientes son utilizadas como ponderacin. Ejemplo: En el ejemplo del lanzamiento de las 2 monedas, el valor esperado de X es:

E(X) = 0

1 2 1 +1 + 2 =1 4 4 4

El valor esperado 1 es un promedio a largo plazo, esto significa que a medida que el nmero de tiradas se acerque al infinito, el promedio de las tiradas estarn cercano a 1. Otro ejemplo: un inversor tiene un milln de pesos para una inversin. X indica la cantidad de dinero con la que terminar. X (millones) 1 2 3 4 5 0,2 0,3 0,2 0,2 0,1 1,0 P (X)

213

Cul es la ganancia esperada de este inversor? E(X) = xi P (xi) E(X) = 1 (0,2) + 2 (0,3) + 3 (0,2) + 4 (0,2) + 5 (0,1) E(X) = 2,7 millones. Ganancia esperada = 2,7 - 1= 1,7 millones

3.- Media y varianza de la poblacin


3.1.- Media de la poblacin
Ya se estudi en el mdulo 3 que la media de una poblacin ( m ) se obtiene de la siguiente manera: = xi (15) N Esta frmula se emplear cuando la poblacin sea finita. Si la poblacin es infinita, la frmula anterior no puede utilizarse para el clculo de la media poblacional. En este caso la manera de trabajar las poblaciones infinitas es conociendo los valores probabilsticos de cada valor de la misma, por lo tanto estas poblaciones se manejan como distribuciones probabilsticas. La media de una poblacin infinita se obtiene calculando la media de la distribucin probabilstica. En resumen: Cualquier distribucin probabilstica, continua o discreta, se denomina distribucin de la poblacin. Ejemplo: Se marcan 4 nmeros (1 - 2 - 3 y 4) en un conjunto de tarjetas. El 30% de las tarjetas estn marcadas con 1; el 20% con 2; el 10% con 3 y el 40% con 4. Las tarjetas se mezclan en una bolsa, se saca una y se anota su nmero. Luego se la repone, antes de sacar la siguiente y as sucesivamente. Cul es la media de x? (Obsrvese que la poblacin es infinita debido a que hay reposicin de las tarjetas). x: 1 P (x): 0,30 2 3 4 0,20 0,10 0,40 Distribucin probabilstica

214

La media de X es el valor esperado E (X) = E(X) = 1 (0,30) + 2 (0,20) + 3 (0,10) + 4 (0,40) E(X) = 2,6

Se calcula de esta manera debido a que cada nmero tiene distinta probabilidad de salir. En caso de que cada nmero tuviera la misma probabilidad de salir (1/ 4) la media sera:

1 + 2 + 3 + 4 10 = = 2,5 4 4

3.2.- Varianza de la poblacin


Si la poblacin es finita, la varianza se calcula de la siguiente manera:
2 2 = (XI )

(16)

Y el desvo tpico

2 = ( XI )

(17)

Para una poblacin infinita, es necesario utilizar la distribucin probabilstica para obtener la varianza. La notacin promedio de es reemplazado por el signo de valor esperado para expresar la varianza de la poblacin, porque el valor esperado es el promedio a largo plazo de la variable. Por lo tanto:
s
2

E (x - )2 X2 - 2 X +
2

(X - )2 = Entonces E (x - )2 = =

E (X2 - 2 X + 2) = E (X2) - E (2 X) + E ( 2)
215

Como 2 y son constantes, el valor esperado del producto de una constante por una variable es igual a la constante multiplicada por el valor esperado de la variable o sea: E (2 X) = 2 E(X). Adems E (2) = 2. Por lo tanto: E (X -)2 = E (X2) - 2 E (X) + = E (X2) - 2 + = E (X2) - 2 2 + En consecuencia
2 2

2 = E (X2) - 2 = x2 P (X) - 2

Ejemplo: Obtener la varianza de x correspondiente al problema de las tarjetas: x 1 2 3 4 P(x) 0,30 0,20 0,10 0,40 x2 1 4 9 16 x2 P (x) 0,30 0,80 0,90 6,40

8,40 Recordar que = E (X) = 2,6 entonces: 2 = X2 P (x) - 2 2 = 8,40 - (2,6)2 2 = 1,64 y el desvo tpico es =

1 ,65 = 1,28

216

Actividad N 31
1) Una empresa est evaluando dos proyectos de inversin cuyos valores actuales netos y tasas de retornos son iguales. No obstante, se sabe que un proyecto es ms conveniente que otro desde el punto de vista del riesgo que est relacionado con la dispersin relativa (a mayor dispersin, mayor riesgo). Las siguientes cantidades, expresadas en moneda constante, corresponden a los flujos de fondos anuales de los dos proyectos con sus respectivas probabilidades de ocurrencia. Decidir qu proyecto es ms conveniente. Proyecto 1 Flujos $ $ $ $ $ 1.200 2.800 1.000 3.000 2.000 Prob. 0,05 0,15 0,25 0,35 0,20 Proyecto 2 Flujos $ $ $ $ $ 1.700 1.200 3.100 1.500 2.500 Prob. 0,10 0,15 0,18 0,30 0,27

2) Se ha determinado que las ventas de una revista en quioscos tiene la siguiente distribucin probabilstica: Nmero de revistas (x) 100 - 150 - 200 - 250 - 300 - 350

P (x) 0,05 - 0,10 - 0,25 - 0,30 - 0,20 - 0,10 Calcular el valor esperado y las varianza de las ventas de la revista.

217

4.- Distribuciones de probabilidades discretas


4.1- Distribucin binominal
La distribucin binominal es una distribucin discreta de probabilidad que es til en la aplicacin para la toma de decisiones. El proceso de inters describe datos resultantes de un experimento denominado proceso de Bernoulli. El proceso de Bernoulli es un proceso de muestreo en las siguientes caractersticas: a) Hay solamente dos posibles resultados que son mutuamente excluyentes en cada ensayo u observacin: xito y fracaso (ocurrencia o no). b) Los ensayos son estadsticamente independientes. c) La probabilidad de xito (p), permanece constante de un ensayo a otro, esto significa que el proceso es estacionaria. Para determinar la probabilidad de un evento se requiere: 1) el nmero de xitos u ocurrencias (x), 2) el nmero de ensayos u observaciones (n), 3) la probabilidad de xito en cada ensayo (p) La frmula que se aplica es: P ( x n p) = q = 1-p La obtencin de la frmula (18) se puede demostrar con el siguiente ejemplo del nmero de caras (x) en el lanzamiento de 3 monedas:
n

Cx px qn-x

(18)

218

Re sultados SSS SSC SCS CSS SCC CCS CSC CCC

x 0

Distribucin probabilstica P(x )


3 1 (1p) = = 1 3

3(p )

(1p)

1 12 3 =3 = 2 2 8

2 1 3 1 3(p ) (1 p) = 3 = 2

2 2

(p) = 1 = 1 8
3

Cara

Sello

p = (xito)= 1/2

(1-p) o q (fracaso) = 1/2

Para X = 0 hay solamente un posible resultado P (X = 0) = = P (SSS) (1-p) (1-p) (1-p) = (1-p)3 = 1/8

Para X = 1 hay 3 posibles resultados P (SSC) = (1-p) (1-p) . p = (1-p)2 . p P (SCS) = (1-p) (p) (1-p) = (1-p)2 . p P (CSS) = p (1-p) (1-p) = (1-p)2 . p Como hay 3 posibles resultados P (X = 1) = 3 (p) (1-p)2 = 3/8 y lo mismo para P (X = 2) y P (x = 3).
219

El total de posibles resultados para cada valor de x para una muestra de 3 elementos no es otra cosa que una combinacin de x elementos entre 3 elementos. Entonces:
X Combinaciones
3

0 1 2 3 Por lo tanto si tenemos: P (x=2 n=3 p=1/2) =


3

C0 = 1 C1 = 3 C2 = 3 C3 = 1

C2 (1/2)2 (1/2) = 3/8


n

P (x n p) =

Cx px qn-x

La distribucin binomial de este ejemplo se puede graficar de la siguiente manera: P (X)

3 8 2 8 1 8
0 1 2 3 x

Ejemplo: La seleccin argentina de ftbol jugar 10 partidos durante una gira. Se sabe que en la regin donde se realizarn los partidos el 20% de los das son lluviosos. Cul es la probabilidad de que 3 partidos se jueguen bajo la lluvia?

220

x=3 P (x =3

n = 10 p = 0,20 n =10 10!


p = 0 , 2 0

q = 0,80
) =

10

C3 (0,20)3 (0,80)7

P (x = 3) = 3! 7!

(0,20)3 (0,80)7 = 0,20133

Uso de las tablas


El clculo de las probabilidades con la frmula de la binomial resulta tediosa sobre todo cuando n es grande. Esto se simplifica utilizando las tablas de la distribucin binomial (Tablas 1 y 2 del Anexo). La tabla 1 corresponde a las distribuciones de probabilidades individuales y la 2 a la distribucin de probabilidades acumuladas. Para cada tamao de la muestra se consignan los valores de probabilidades para cada nmero de xitos (x) que se ubican en la columna y las probabilidades de xito (p) que se ubican en la fila. El valor de probabilidad est en la interseccin de x y p. Sean los siguientes ejercicios utilizando el mismo ejemplo: a) Cul es la probabilidad de que 5 partidos se jueguen en la lluvia? P (x = 5 n =10 p = 0,20) = 0,02642 segn tabla 1

b) Calcular la probabilidad de que no ms de dos partidos se jueguen en la lluvia, o sea: P (x<2 n =10 p=0,20) = P (x = 0) + P (x = 1) + P (x = 2) = 0,10737 + 0,26844 + 0,30199 = 0,6778 segn tabla 1

221

En lugar de sumar las probabilidades individuales, se puede utilizar la tabla 2 que contiene las probabilidades acumuladas: P (x<2 n=10 p=0,20) = 0,6778 segn tabla 2

c) Cul es la probabilidad de que a lo sumo 4 partidos se jueguen en la lluvia? P (x<4 n=10 p=0,20) = 0,96721 segn tabla 2

d) Determinar la probabilidad de que 3 o ms partidos se jueguen en la lluvia, o sea: P (x > 3 n=10 p=0,20) Usando la tabla 2 obtenemos la probabilidad de que hasta 2 partidos se jueguen bajo la lluvia. P (x< 2 n=10 por lo tanto p=0,20) = 0,6778

P (x > 3) = 1 - P (x < 2) = 1 - 0,6778 = 0,3222

Media y desviacin tpica en la distribucin binomial

La distribucin binomial tiene un valor esperado o medio ( m ) y una desviacin tpica ( s ). n = nmero de ensayos p = probabilidad de xito q = probabilidad de fracaso 1 - p.

m=np s=

npq

Ejemplo: Se sabe que el 10% de los productos fabricados por una compaa son defectuosos.

222

Se toma una muestra aleatoria de 25 artculos, cul es el nmero esperado de defectuosos (promedio de largo plazo)? Cul es la desviacin tpica? = 25 (0,20) = 5 artculos =

(25) (0,20) (0,80) =

4= 2

223

Actividad N 32
1) En un barrio de la ciudad de Salta el 40% de las familias no tiene telfono. Se toma una muestra de 15 familias. Determinar la probabilidad de que: a) b) c) d) e) f) 7 familias no tengan telfono. Ninguna familia tengan telfono. A lo sumo 5 familias no tenga telfono. Por lo menos 8 familias no tengan telfono. No ms de 3 familias s tenga telfono. Entre 8 y 10 familias tengan telfono.

2) En una empresa nueva slo el 35% de los empleados tiene el legajo completo. Si en un control se revisan 15 legajos, calcular y .

224

4.2.- Distribucin de Poisson


Esta distribucin se llama as por el francs Simon Dennis Poisson (1781-1840) quien desarroll esta distribucin. Puede utilizarse la distribucin de Poisson para determinar la probabilidad de que ocurra un nmero de eventos, en un continuo de tiempo o espacio. El proceso de Poisson es similar al proceso de Bernoulli, pero los eventos no ocurren en ensayos fijos, sino en un continuo (por ejemplo, en un intervalo de tiempo), como ser la distribucin de llamadas telefnicas que estn en un conmutador, la demanda de servicios de asistencia mdica, etc. Estos casos pueden ser descriptos por una variable discreta. El nmero de pacientes que llega a una guardia mdica en un intervalo de tiempo ser 0, 1, 2, 3 o algn nmero entero. El proceso de Poisson, como el de Bernoulli es estacionario y los eventos son independientes. Para determinar la probabilidad de un evento en un proceso de Poisson slo se requiere el nmero promedio a largo plazo de eventos para el intervalo de tiempo o dimensin especfica. La media se representa por la letra griega (lamda). La frmula para el clculo de probabilidad de X ocurrencias en la distribucin de Poisson es: P (x ) =
x

e
X!

(19)

donde: X: nmero de xitos (u ocurrencias) l: nmero medio de ocurrencias por intervalo de tiempo e: constante 2,7183 base del sistema de logaritmos naturales.
Ejemplo: En un banco de la ciudad de Salta, en promedio cinco personas utilizan un cajero automtico cada hora. Cul es la probabilidad de que en una hora elegida aleatoriamente, 2 personas utilicen el cajero automtico?
225

(5)2 (2,7183)-5 P (X=2 l = 5) = 2!


Uso de tablas

= 0,0842

En forma alternativa, y para facilitar los clculos, se puede utilizar la tabla de probabilidades de Poisson (Tabla 3). En las filas se consignan los valores de l y en las columnas el nmero de ocurrencias (x). La interseccin de l y X indica el valor de probabilidad buscada.
Ejemplo: Considerando el ejercicio anterior, cul es la probabilidad de que:

a) una persona utilice el cajero? b) no ms de dos personas utilicen el cajero? Utilizando la tabla 3 a) P (x = 1 = 5) = 0,0337 b) P (x < 2 = 5) = P (x = 0) + P (x =1) + P (x =2) = 0,0067 + 0,0337 + 0,0842 = 0,1246

Aproximacin de la distribucin de Poisson a la distribucin binomial


Si el nmero de ensayos (n) en el proceso de Bernoulli, es grande, los clculos se vuelven tediosos. La distribucin de Poisson puede usarse como aproximacin de la binomial si se cumplen dos requisitos: 1) n grande 2) p pequeo Una regla para una buena aproximacin es trabajar con un n > 30 y n p < 5.

226

Ejemplo: un informe indica que en el 10% de las empresas industriales se producen graves accidentes de trabajo. Si se toma una muestra de 30 empresas, cul es la probabilidad de que en 5 de ellas hayan ocurrido graves accidentes de trabajo?

-Utilizando la binomial P (x = 5 n = 30 p = 0,10) = 0,10230 -Utilizando Poisson = np = 30 (0,10) = 3 P (x = 5 = 3) = 0,1008 La diferencia entre los dos valores es de 0,0015 por lo que la aproximacin es buena. As como define la media de la distribucin de Poisson, la desviacin tpica de esta distribucin es

227

Actividad N 33
1) Una tienda recibe 4,2 reclamos de clientes por semana. Determinar la probabilidad de que en una semana elegida al azar:
a) Ningn cliente haga un reclamo. b) No menos de 5 clientes hagan reclamos. c) No ms de 1 cliente haga un reclamo.

2) El 2% de operarios de una fbrica padecen de problemas en la vista. En 100 operarios elegidos al azar, cul es la probabilidad de que a lo sumo 5 tengan problemas en la vista?

228

4.3.- Distribucin hipergeomtrica


Cuando el muestreo es sin reemplazo para cada uno de los elementos tomados de una poblacin, no es aplicable el proceso de Bernoulli, ya que hay un cambio sistemtico en la probabilidad de xito mientras se extraen elementos de la poblacin. En este caso, la distribucin discreta de probabilidad apropiada es la distribucin hipergeomtrica. Para la determinacin de las probabilidades hipergeomtricas se requiere conocer: X: nmero designado de xitos N: nmero de elementos de la poblacin T: nmero total de xitos en la poblacin n: nmero de elementos de la muestra Luego aplicar la siguiente frmula:
N-T T

Cn - x P (x) =
N

Cx (20) Cn

Ejemplo: Una biblioteca posee 10 textos de Estadstica, de los cuales 6 son de autores extranjeros. Si se eligen al azar 5 textos, cul es la probabilidad de que 2 de ellos sean de autores extranjeros? X=2 N = 10 T= 6 n=5
10 - 6 6 4 6

C5 - 2 P (x = 2) = C5 (4) (15) = 252

C2
10

C3 =

C2
10

6! 3! 1! 2! 4! = 10! 5! 5!

4!

C5 = 0,24

229

Debe observarse que la distribucin hipergeomtrica es una aplicacin del anlisis combinatorio desarrollado en el punto 6.4. Se resolver el ejercicio (a) que se utiliz como ejemplo en esa oportunidad utilizando la frmula (20). Tarjetas rojas X=4 N = 15 T=6 n=4
15 - 6 6 15 -9

Tarjetas verdes X=4 N = 15 T=9 n=4


9

C4 - 4 P (4 rojas o 4 verdes) =
15

C4 + C4

C4 - 4
15

C4 C4

C0 =
15

C4 + C4

C0 C4 141

C4
15

15 = 1365 +

126 = 1365

1365

0,103

230

Actividad N 34
1) Un producto industrial se embarca en lotes de 20 unidades. Para reducir el nmero de unidades defectuosas enviados a los clientes, se implement un programa de inspeccin que consiste en tomar una muestra de 5 unidades de cada lote y rechazar el lote si se observa ms de un artculo defectuoso. Si un lote contiene 4 artculos defectuosos, cul es la probabilidad de que sea aceptado?

2) En el departamento de ventas de una compaa hay 15 empleados de los cuales 10 tienen legajo incompleto. Si se controla una muestra de 5 legajos, determinar la probabilidad de que 3 estn incompletos.

231

5.- Distribucin de probabilidades continuas


5.1. Distribucin Normal
5.1.1. Naturaleza e Importancia

La variable aleatoria normal es de naturaleza continua ya que su espacio muestral consiste en un nmero infinito de valores reales y la variable puede asumir cualquier valor de una gama de ellos. La distribucin normal es la ms conocida y la ms usada de las distribuciones tericas. Muchas variables aleatorias parecen seguir un patrn de distribucin que es semejante a la distribucin normal, como ser peso, estatura y otras relacionadas con la produccin de procesos fsicos (dimensiones y rendimientos). Si bien no todas las poblaciones se distribuyen normalmente, muchas distribuciones pueden aproximarse a la normal a medida que aumenta el tamao de la muestra.

5.1.2.- Caractersticas

Figura A
Puede describirse a la distribucin normal como una curva regular en forma acampanada que est definida por la media y por la desviacin estndar de la variable aleatoria x. Es simtrica alrededor de su media; la altura y la dispersin estn dadas por la desviacin estndar. Matemticamente puede describirse de la siguiente manera:

232

P(x ) =

1 2 [(x \ )] 2

(21)

para - < x < +

x e

= = = = =

valor de la variable aleatoria continua. la media o valor esperado de x desviacin estndar de x constante 3,1416... base de los logaritmos naturales 2,718.

De acuerdo a lo expuesto, se resumen a continuacin las caractersticas de la distribucin normal. 1') Como la curva normal presenta una distribucin probabilstica de una variable continua es imposible referirse a algn punto en particular sobre la curva como probabilidad de x. Para determinar probabilidades, se deben establecer intervalos, como por ejemplo, el intervalo entre a y b indica el rea sombreada bajo la curva que proporciona la probabilidad de que la variable aleatoria tome cualquier valor entre a y b. El rea total bajo la curva es igual a 1. La ecuacin (20) se define como una funcin probabilstica de densidad. El trmino densidad es obtenido de la fsica, donde la palabra se usa para designar probabilidad.

Figura B

2') La curva normal tiene forma de campana. El componente exponencial da la forma general de la curva. 3') La curva tiene un solo pico (por lo tanto es unimodal) y es simtrica con respecto a su media ( ). 4') Una curva normal est definida por tres constantes ( y 2) y dos parmetros, la y de x.
233

5') Como x es una variable continua, puede asumir cualquier valor real entre - y + . La curva normal no toca el eje de las x. Cuando, x aumenta o disminuye apartndose de la media, la curva es asinttica al eje x.

5.1.3.- Regla de la Normal

Ya se dijo que el rea bajo la curva normal es igual a 1, cualquiera sea el valor de y el valor de . Esto significa que los valores bajo la curva son valores de probabilidades. Si los valores de una poblacin se distribuyen normalmente puede aplicarse la denomina regla de la normal que se enuncia a continuacin. 1') Aproximadamente el 68% de los valores de una poblacin se encuentran dentro de 1 desviacin estndar respecto de la media, o sea
m + 1 s = 68% de los casos.

2') Aproximadamente el 95,5% de los valores de una poblacin se encuentran dentro de 2 desviaciones estndar respecto de la media, o sea:
m + 2 s = 95,5% de los casos

3') Aproximadamente el 99,7% de los valores de una poblacin (casi el 100%) se encuentran dentro de 3 desviaciones estndar respecto de la media, o sea:
m + 3 s = 99,7% de los casos

16 % del rea

68 % del rea

16 % del rea

2,25 % del rea

95,5 % del rea

2,25 % del rea

Figura C

Figura D

234

15 % del rea

99,7 % del rea

15 % del rea

Figura 3
Ejemplo: La distribucin de los salarios de los vendedores de una tienda es normal con m =$300 y s =$10. El negocio cuenta con 80 vendedores.

Aplicando la regla de la normal, se tiene. 1') + 1 o 300 + 10 = 68% de los casos 290 < < 310 Aproximadamente 54 vendedores (0,68.80) tienen un salario entre 190 por 310 pesos. 2') + 2 o 300 + 2 (10) = 95,5% de los casos 280 < < 320 Aproximadamente 76 vendedores (0,955 x 80) tienen un salario entre 280 y 320 pesos. 3') + 3 o 300 + 3 (10) = 97,7% de los casos 270 < < 330 Aproximadamente 78 vendedores (0,977 x 80) tienen un salario entre 270 y 330 pesos.

235

5.1.4.- Importancia de los parmetros

Los dos parmetros, media ( ) y desviacin tpica ( ) determinan la forma y ubicacin de la curva normal. Si las distribuciones tienen la misma media pero con diferentes desviaciones tpicas, las curvas tienen el mismo centro. Cuando es pequea la curva tiende a ser leptocrtica (alto apuntamiento). Si es ms grande la curva tiende a ser ms achatada (Ver figura F).

=3
=5 =5

= 10

= 18

=5

= 10

Figura G

Figura F

Cuando las distribuciones tienen la misma desviacin tpica, pero con medias distintas, las formas de las curvas son iguales, pero la curva se mueve a lo largo del eje de las x.

5.1.5.- Distribucin normal estndar

Para calcular probabilidades dentro de un intervalo es necesario conocer la distribucin probabilstica. Como hay tantas variables normales no es prctico desarrollar una distribucin probabilstica distinta para cada una. Este problema se soluciona debido a que existe una distribucin probabilstica aplicable a cada una de las posibles variables normales que se denomina distribucin normal estndar . Esta distribucin probabilstica de la variable normal estndar Z, se define como:

x-m Z=
s

(22)

236

donde: x Z = = = =
valor de la variable aleatoria de inters. media de la distribucin de la variable aleatoria. desviacin tpica de la distribucin. es la diferencia entre el valor observado de X y su media, expresada en trminos de su desviacin tpica. El valor de Z es igual al nmero de desviaciones tpicas de x respecto de la media.

Considrese el ejemplo de la distribucin de salarios con = 300 y = 10. Cul es la probabilidad de que un vendedor seleccionado al azar tenga un salario mayor o igual que $320? x = 320. Aplicando la ecuacin (2) se transforma x en Z.

320 - 300 Z= 10 = 2

Cambiando la pregunta, Cul es la probabilidad de que el salario de un vendedor seleccionado aleatoriamente sea mayor o igual que 2 desviaciones tpicas a partir de su media?

P (x < ) = 0,50

P (x > ) = 0,50

Figura H

Como Z se expresa la desviacin del valor observado de X a partir de la media, el control de la distribucin de Z no representa ninguna desviacin, la media de Z es igual a cero (0). Como Z est expresada en unidades de desviaciones tpicas, la desviacin tpica de Z es igual a 1. La distribucin se define completamente por la media 0 y el desvo tpico 1. Hay una y solamente una distribucin probabilstica para la variable estndar Z.
237

En el ejemplo anterior el valor 2 significa 2 desviaciones tpicas por encima de la media o bien Z es igual a 2. Si el rea bajo la curva es igual 1 (o 100%) entonces P(X > ) = 0,50 y P (X < ) = 0,50.

0,4775

0,4775

280 2

300 0

320 +2

Volviendo al ejemplo 320 - 300 Z= 10 Por regla de la normal + 2 = 0,955 (95,5%) de los valores. Como la curva normal es simtrica, + 2 = 0,4775 - 2 = 0,4775 (Ver figura) Se pide la probabilidad de que un vendedor tenga un salario mayor o igual a 320, o la probabilidad de que Z > 2. =2

P (300 a 320) = 0,4775 Z=2 P (x 320) = 0,0225 300 320

238

El valor de probabilidad entre 0 y Z o 0 y 2 es igual a 0,4775. Como P ( > 300) = 0,5, para conocer el valor de probabilidad de x > 320 o Z > 2 se debe restar 0,5 - 0,4775 = 0,0225. Esto significa que existe una probabilidad de 0,0225 (o del 2,25%) que un vendedor gane un salario igual o mayor que 320.

5.1.6.- Clculo de probabilidades. Uso de la tabla

El valor de probabilidad para cualquier valor de x puede obtenerse usando la tabla 4. La tabla proporciona los valores de probabilidad de 0 a Z.
Por ejemplo: - Si Z = 1,50, el valor de probabilidad es 0,4332. - Si Z = 1,56, el valor de probabilidad es 0,4406.

Las puntuaciones de Z se listan en la columna del lado izquierdo y en el rengln superior. La columna del lado izquierdo tiene el dgito de las unidades y dcimos, mientras que en el rengln superior se halla el dgito de los dos centsimos. Z 1,5 0,00 0,4332 ... 0,06 0,4406

Por ejemplo la probabilidad de que Z > 1,50 es 0,0668 (0,5 - 0,4332) y la probabilidad de que Z < -1,56 es 0,0594 (0,5 - 0,4406).
0,4332 0,0668 0,0594 0,4406

1,5

- 1,56

239

Con el siguiente ejercicio se analizarn distintos casos para obtener valores de probabilidades para x con la distribucin normal. La factura mensual de telfono por casa en una zona cntrica se distribuye normalmente con una media de $80 y una desviacin tpica de $6. Si se selecciona aleatoriamente una factura, determinar la probabilidad de que la misma: a) b) c) d) e) sea de $70 y menos est entre $78,50 y $82,50; est entre $85 y $95; sea de $75 de ms; sea igual a $90; x- Z= 70 - 80 Z= = -1,67

a)P (x < 70)

70
- 1,67

80
0

Area entre 0 y -167 = 0,4525 y como el rea entre - y 0 es 0,50.

P (x < 70) = 0,50 - 0,4525 = 0,0475

b) P (78,50 < x < 82,50)

Z= Z=

78,50 80 -0,25 0 82,50 0,42

78,50 80 = 0,25 6 82,50 80 = 0,42 6

Area entre 0 y -0,25 = 0,0987 Area entre 0 y 0,42 = 0,1628

P (78,50 < x < 82,50) = 0,0987 + 0,1628 = 0,2615


240

c) P (85 < x < 95) 85 - 80 Z= 6 95 - 80 Z=


80 0 85 0,83 95 2,5

= 0,83

= 2,5 6

Area entre 0 y 2,5 (entre 80 y 95) = 0,4938 Area entre 0 y 0,83 (entre 80 y 85) = 0,2967 P (85 < x < 95) = 0,4938 - 0,2967 = 0,1971

d) P (x > 75) 75 - 80 Z= 6 = -0,83

75 -0,83

80 0

Area entre 0 y -0,83 = 0,2967 Area entre 0 y + = 0,50

H P (x > 75) = 0,2967 + 0,50 = 0,7967

e) P (x = 90) Se estableci que como se trabaja con una distribucin probabilstica continua es imposible determinar la probabilidad de un valor en particular, sino que deben establecerse intervalos. En el caso de P(X = 90) se deber buscar P (89,5 < X < 90,5). Es el mismo caso de (c).

241

90,5 - 80 Z= 6 89,5 - 80
80 89,5 90,5

= 1,75

Z= 6

= 1,58

Area entre 0 y 1,75 = 0,4599 Area entre 0 y 1,58 = 0,4429 P (X = 90) = 0,4599 - 0,4429 = 0,017

5.1.7.- Aproximaciones de la Normal a otras distribuciones

Una de las importancias que la distribucin normal es que puede aproximarse a otras distribuciones. Se estudiarn a continuacin las aproximaciones de una distribucin continua como la normal a distribuciones discretas como la binomial y Poisson.
I) Aproximacin normal a la binomial

Cuando el nmero de observaciones (n) es grande, puede utilizarse la distribucin probabilstica normal a las probabilidades binomial. Una regla conveniente es la que indica que las aproximaciones son aceptables cuando n>30 y np>5. Al usar la normal como base de aproximacin a la binomial. = np (nmero promedio de xitos u ocurrencias). =

npq (desviacin estndar del nmero de xitos).

Como la distribucin normal es continua los valores de X deben ajustarse mediante una correccin de continuidad, ya que un evento discreto representa un intervalo continuo desde un lmite exacto superior.

242

Ejemplo: En un barrio de la ciudad de Salta el 20% de las casas no poseen gas natural. Si se investigan 30 casas de ese barrio, cul es la probabilidad de que 50 ms no haya gas natural.

- Se utilizar primeramente la distribucin binomial. P (X>5\n=30\p=0,20) = 0,7448

- Aproximacin de la normal n = 30 np = 30 (0,20) = 6

se cumplen los dos criterios de aproximacin. = np = 6 = npq = = 2,2 Si bien se busca P (X > 5) al utilizar la correccin de continuidad P (X > 4,5). El evento discreto 5 casas representa el intervalo continuo entre 4,5 y 5,5. En general: Cuando P (X > Xi) y Cuando P (X < Xi) Cuando P (X < Xi) y cuando P (X > Xi) se resta 0,5

30 (0,20) (0,80)

se suma 0,5

En el ejercicio como P (x > xi) se resta 0,5 (5 - 0,5 = 4,5). 4,5 - 6 Z= 2,2 Area entre 0 y -0,68 = 0,2518 Area entre 0 y + = 0,50
4,5 -0,68 6 0

= -0,68

P (X > 5) = 0,2518 + 0,5 = 0,7518


243

La diferencia entre el valor obtenido por la binomial y el obtenido por la normal es solamente 0,007 por lo que la aproximacin es buena.
II) Aproximacin normal a la distribucin de Poisson

Cuando la media de la distribucin de Poisson es grande, puede aproximarse la distribucin normal a probabilidad de Poisson. Una regla que indica una buena aproximacin es considerar > 10. Recordar que - y =

Ejemplo: En un banco, en promedio 10 personas utilizan el cajero automtico cada hora. Determinar la probabilidad de que no ms de 5 personas utilicen el cajero en una hora seleccionada al azar.

- Utilizando Poisson (tabla 3) P (x < 5 \ =10) = P (X=0) + P (X=1) + P (X=2) + P (X=3) + + p (X=4) + P (X = 0,5) = 0 + 0,0005 + 0,0023 + 0,0076 + 0,0189 + + 0,0378 = 0,0671

- Utilizando la Normal m = = 10 se cumple el criterio de aproximacin P(x < 5), al aplicar la correccin de continuidad P (x>5,5), se suma 0,5 debido a que P(X < x1). = 20
Z=

10 = 3,16

5,5 10 = 1,42 3,16 Area entre 0 y -1,42 = 0,4222


5,5 - 1,42 10 0

P (X < 5,5) = 0,5 - 0,4222 =0,0778

La diferencia entre los valores de probabilidad calculados con ambas distribuciones es muy pequea, lo que indica una aproximacin aceptable.

244

Actividad N 35
1) Las exportaciones de productos agrcolas de nuestro pas se distribuyen normalmente con un promedio de 8.000 millones de dlares anuales y un desvo tpico de 1.000 millones. Hallar: a) P (X > 10.000) b) P (X < 7.000) c) P (X = 6.000) d) P (9.000 < X < 11.000) e) P (6.000 < X < 8.500) f) P (X > 9.000 o X < 8.000) 2) El 20% de los clientes de un negocio son morosos. Si se toma una muestra de 60 clientes, Cul es la probabilidad de que a lo sumo 5 sean morosos? 3) Un conmutador recibe en promedio 12 llamadas por minuto. Hallar la probabilidad de que lleguen por lo menos 6 llamadas en un minuto.

245

5.2. Distribucin exponencial


El modelo de probabilidad exponencial tiene su origen en el proceso de Poisson. Una probabilidad de Poisson se relaciona con la probabilidad de ocurrencia de un nmero especfico de xitos en una unidad especificada finita, donde el nmero de xitos es la variable aleatoria. Al invertir los papeles de una variable de Poisson y su unidad especificada finita, se tiene un modelo de probabilidad exponencial. Una variable "exponencial" x es el intervalor de tiempo, o espacio requerido para obtener un nmero especfico de xitos (7). En su libro, Kazmier establece que si se presentan eventos en el contexto de un proceso Poisson, la longitud de tiempo o el espacio entre eventos sucesivos tiene una "distribucin exponencial de probabilidad". Al ser el tiempo y el espacio son continuos, una medicin de este tipo es una variable aleatoria continua. Para cualquier variable continua, no se pregunta, por ejemplo, "cul es la probabilidad de que la primera solicitud de servicio llegue exactamente en un minuto?, sino que se debe determinar un intervalo dentro del cual debe ocurrir el evento; por lo tanto la pregunta sera "cul es la probabilidad de que la primera solicitud de servicio llegue en un minuto?". La distribucin exponencial se aplica cuando interesa el tiempo (o espacio) hasta la ocurrencia del primer evento, o el tiempo entre dos eventos sucesivos, o bien el tiempo que transcurre hasta que se presenta el primer evento, despus de cualquier punto en el tiempo elegido al azar (8). La probabilidad exponencial de que ocurra el primer evento dentro del intervalo designado de tiempo o espacio es: P (t < t) = 1 - e
-

(23)

La probabilidad exponencial de que el primer evento no ocurra dentro del intervalo designado de tiempo o espacio es: P (T > t) = e
-

(24)

representa el nmero promedio de ocurrencias para el intervalo de inters.


7. Chou, Ya Lun "Anlisis Estadstico" Ed. Mc Graw-Hill 8. Kazmier, Leonard "Estadstica Aplicada a la Administracin y a la Economa" Serie Sahaon "Ed. Mc. Graw-Hill"
246

Ejemplo 1

Una empresa mayorista recibe 8 pedidos de compra por hora es promedio. Determinar la probabilidad de que se reciba el primer pedido dentro de un lapso de quince minutos. Promedio por hora = 8 = Promedio por quince minutos: 2 P (T < 15') = 1 - e
-2

= 1 - 0,13534 = 0,8647 Los valores de e-l se pueden obtener de la tabla V.

Ejemplo 2:

Considerando el ejemplo anterior, cul es la probabilidad de que el primer pedido no llegue durante la primera hora. = 8 por hora P(T>8) = e-8 = 0,00034 El valor esperado de una distribucin exponencial es E(T) = 1/ y la varianza en V(T) = 1/ 2.

247

ACTIVIDAD INTEGRADORA
En promedio, 6 personas utilizan un cajero bancario automtico cada hora. Determinar la probabilidad de que: a) Cuando menos pasen 10 minutos entre las llegadas de dos clientes. b) Despus de que salga un cliente, no llegue otro cuando menos 20 minutos. c) De que llegue un segundo cliente antes de que pase un minuto despus de que el primer cliente comienza su transaccin bancaria?

248

Ejercicios de Repaso
1) Una empresa dedicada a la investigacin de mercados efecta una encuesta postal sabiendo que la probabilidad de contestar es de 0,20. Si se enviaron 20 cartas, hallar la probabilidad de: a) 8 respuestas, b) no ms de 3 respuestas, c) por lo menos 16 sin respuestas. 2) La DGI ha clausurado en promedio 6,4 negocios por mes. Encontrar la probabilidad de que: a) Ningn negocio sea clausurado durante una semana. b) Entre 3 y 5 negocios sean clausurados durante un mes. 3) La compaa Click fbrica encendedores de cigarrillos. Un componente importante de este producto es una pequea rueda de acero dentada que gira y crea la chispa para el encendido. Esta rueda de acero est fabricada con un acero comprado por la compaa "Click". La caracterstica ms importante del acero es su dureza. El departamento de ingeniera industrial ha especificado que los lingotes de acero deben tener una dureza de cuando menos 425 Unidades Brinell (UB). Es tambin conveniente que el material sea uniforme. Se ha decidido comprar todo este material a un solo proveedor, ya que ello implica ahorro en costos. La lista de posibles proveedores se redujo a dos firmas A y B. a) La dureza media de los lingotes producidos por A es de 510,2 UB, mientras que la dureza media de los lingotes de B es 492,8 Ub. Es la calidad de B inferior a la de A? Explicar la respuesta, aclarando cul es la interpretacin del trmino calidad. b) La dureza de los lingotes producidos por cada proveedor est distribuida normalmente. La desviacin tpica de la dureza de los lingotes de A es 53,9 UB y la desviacin tpica de la dureza de los lingotes de B es 31,4 Ub. Qu forma presenta mayor uniformidad? Explicar. c) Cul es la proporcin de lingotes con 425 o ms UB producidas por cada proveedor?

249

d) Sobre la base de la informacin anterior, qu firma seleccionara Ud? Fundamentar la respuesta. e) Qu otros factores adems de la calidad, considerara al hacer la seleccin del proveedor? 4) La duracin de las pilas fabricadas por la compaa Luxor est normalmente distribuida con = 795 minutos y =37 minutos. a) Cul es la probabilidad de que una pila dura entre 775 y 820 minutos? b) Cul es la probabilidad de que una pila dure ms de 800 minutos? c) Existe una probabilidad de 0,95 de que una pila dure menos de cuntos minutos? d) El 50% de las pilas duran entre y . Usar lmites simtricos alrededor de la media. 5) La media de las puntuaciones de los exmenes de 80 postulantes es de 75 con un desvi tpico de 8. La distribucin es normal. El departamento de personal determin que aquellos postulantes que hayan obtenido 60 puntos o ms pasarn a una entrevista. Cuntos de ellos sern entrevistados?

250

Respuestas a los ejercicios de la Unidad VI


Punto 1

1) X: 1 2 3 4 P(X): 1/4 1/4 1/4 1/4 = 4/4 = 1 2) a) 0,25; b) Nmero de videos del mismo modelo. c) Eventos simples RRR - RRS - RSR - SRR - SSR - SRS - RSS - SSS Valor de X 1 0 0 0 0 0 0 1 d) X= 0 1 2/8

P(X)= 6/8

Punto 2 y 3

1) CV1= 38,2% - CV2= 33,51% - Conviene el 2. 2) E(X)= 240 2 = 4.150 = 64,4

Punto 4.1.

1) a) P(X=7) = 0,17708; b) P(X=0) = 0,00047; c) P(X 5) =0,40321 d) P(X 8) = 0,21311; e) P(X 3) = 0,00193; f) P(8 X 10) = 0,56962 2) = mp= 5,25 = 1,85 (Aprox. Posson a la Binamial)

Punto 4.2.

1) a) 0,0150; 2) 0,9834

b) 0,4101;

c) 0,078

251

Punto 5

1) a) 0,0228; e) 0,6687 f) 0,6587

b) 0,1587;

c) 0,0005;

d) 0,1574;

2) P(X 5,5)= 0,0179 (Aprox. Normal a la Binomial) 3) P(X 5,5)= 0,9686 (Aprox. Normal a Posson)

252

Ejercicios de Repaso
1) a) 0,02216; b) 0,41145; c) 0,62965 2) a) 0,2019 b) 0,3375 3) a) No, porque ambos cumplen las especificaciones. b) B c) A= 0,9429 B= 0,9846 d) B cumple con todas las condiciones e) precio, condiciones de pago, etc. 4) a) 0,4572; c) 855,9 minutos, 5) 78 postulantes. b) 0,4443; d) Entre 770 y 820 minutos.

253

254

APNDICES

255

256

Apndice 1
Distribucin Probabilisticas Binomiales
n x n x Las anotaciones en la tabla son valores de p q x

257

258

259

Apndice 2
Probabilidades acumuladas para distribuciones binomiales
CP (x ) =

k 0

n k nk p q k

260

261

262

Apndice 3
Probabilidades Poisson

263

264

265

266

Apndice 4

267

Apndice 5
Valores de e-

268

Diagrama de Contenido - Unidad VII


Errores muestrales y no muestrales

Importancia de la muestra

Distribucin en el muestreo

Distribuciones Muestrales

269

Distribucin muestral de medias

Distribucin muestral de proporciones

Teorema del lmite central

270

UNIDAD VII DISTRIBUCION EN EL MUESTREO


(1)

1. Introduccin
Luego de haber estudiado la teora de las probabilidades como base de la inferencia estadstica, se desarrollar la distribucin en el muestreo que es un tema fundamental para entender el proceso de inferencia estadstica. Se analizarn los puntos bsicos para el estudio de la Estimacin y el Test de Hiptesis.

2. Importancia de la muestra
En la unidad I (mdulo 1) se expusieron algunas caractersticas importantes de una muestra. Se hizo referencia a la necesidad de que una muestra debe ser representativa para que pueda ser usada con fines de realizar inferencias acerca de la poblacin. Los mtodos para seleccionar muestras son muchos, dependiendo del objetivo del estudio, del tiempo, del dinero y de la naturaleza de los elementos individuales de la poblacin. En este mdulo no se desarrollar este tema, sino que el mismo ser investigado por el alumno a travs de la gua propuesta en las actividades de pg. 17. No obstante, se har la diferencia entre muestras probabilsticas y muestras no probabilsticas. Una muestra probabilstica es aquella en la que los sujetos de la muestra se eligen sobre la base de probabilidades conocidas. En cambio, una muestra no probabilstica est basada en los puntos de vista subjetivos de una persona que utiliza su conocimiento y su opinin para identificar los elementos de la poblacin que sern incluidos en una muestra, por ello se denomina tambin muestreo de juicio. Las muestras probabilsticas son preferidas porque la seleccin de los elementos es objetiva y el error muestral puede ser medido en trminos
1 Shao, Stephen: "Estadstica para Economa y Administracin de Empresas", Herrero Hnos.
271

de probabilidad. Si bien una muestra de juicio es fcil de obtenerla y su costo es bajo, no permite medir el error muestral. Recurdese que los valores que describen caractersticas de la muestra se denominan estadgrafos y los valores que describen caractersticas de una poblacin se denominan parmetros. Los smbolos a utilizar son:
Medida Muestra (Estadgrafo) Poblacin (Parmetro)

Media Desviacin tpica Proporcin Nmeros de elementos

x s p n

p N

3. Error muestral
La diferencia entre el resultado obtenido de una muestra y el resultado el cual deberamos haber obtenido de la poblacin se llama error muestral. El error muestral es medido por el error estndar del estadgrafo, en trminos de probabilidad, bajo la curva normal (ver punto 5). Esta medida indica la precisin de la estimacin de la poblacin basada en una muestra. Mientras ms pequeo sea el error muestral, mayor precisin hay en la estimacin. Debe hacerse notar que hay errores que se cometen en las encuestas, en las tabulaciones de datos, en los clculos, etc. que no son debidos a la muestra por eso se denominan errores no muestrales.

4. Distribucin en el muestreo
Cuando el tamao de la muestra (n) es ms pequeo que el tamao de la poblacin (N), pueden extraerse dos o ms muestras de la misma poblacin. De cada muestra, puede ser calculado un estadgrafo. Una distribucin del estadgrafo obtenida de las muestras se denomina distribucin en el muestreo del estadgrafo. Por ejemplo, de una poblacin de tamao

272

3, con los elementos A, B y C, es posible extraer 3 muestras de tamao 2 (sin reposicin). Si se calcula la media de cada muestra, habr 3 medias muestrales. Estas 3 medidas forman una distribucin que se denomina distribucin de medias muestrales o distribucin muestral de medias.

5. Error estndar
La desviacin estndar de una distribucin muestral de un estadgrafo, se denomina error estndar del estadgrafo. Por ejemplo, la desviacin tpica de la distribucin muestral de medias se denomina error estndar de la media. La desviacin estndar se refiere a los valores originales, mientras que el error estndar se refiere a valores calculados. Los estadgrafos son valores calculados a partir de una muestra.

6. Distribucin muestral de medias


Tmese como ejemplo, esta poblacin finital pequea compuesta por los jornales de 4 trabajadores de una empresa industrial.
Trabajador Jornal ($) A 2 B 5 C 6 D 3

La media es =

x i = 16 4 = $4
N

( x )2 = $ 1,58 La desviacin tpica es = N


A continuacin se obtendr todas las muestras posibles de tamao 2 y se calcular la media para cada una (El muestreo es sin reposicin).

C = C = 2! 2! = 6 combinaciones posibles n r 4 2

4!

273

Muestras

Jornales

Medias muestrales

A-B A-C A-D B-C B-D C-D

222556-

5 6 3 6 3 3

3,5 4,0 2,5 5,5 4,0 4,5 24,0

El total de las 6 medias muestrales es 24, por lo tanto, la media de las medias muestrales es:
X = 24 6 = $4 Esta media es igual a la media de la poblacin. Las medias muestrales pueden presentarse en la siguiente distribucin:
Medias Muestrales (X) Nmero de medias muestrales (f)

2,5 3,5 4,0 4,5 5,5

1 1 2 1 1 6

La media de esta distribucin puede calcularse:

X=

24 = $4 6

El desvo tpico de la distribucin muestral de medias (Simbolizado por x) se puede obtener por la frmula:

x =

x2 f

x2 =

10 1 6

42

x = 0,83 = 0,91

274

El desvo tpico obtenido es el error estndar de la media, que en la prctica se calcula por:

x =

(1)

Si la poblacin es finita, se agrega el factor de correccin, o sea:

x =

Nn N 1

(2)

En el ejemplo

= 1,58 ; N = 4 ; n= 2

x =
En resumen:

1,58 2

42 = 0,91 4 1

La distribucin de las medias obtenidas de todas la muestras posibles, se denomina distribucin muestral de medias. La media de esta distribucin es igual a la media poblacional y la desviacin tpica es igual al error estndar de la media. El error estndar disminuye a medida que aumenta el tamao de la muestra.

7. Distribucin muestral de proporciones


La distribucin en el muestreo de la proporcin es un conjunto de proporciones de todas las muestras posibles del mismo tamao, extradas de una poblacin. Hay 4 empleados en una empresa, A, B, C y D. Los empleados A y B son profesionales universitarios; C y D son no profesionales. Supngase los 4 empleados como una poblacin. Desgnese con el valor 1 a un profesional y con 0 a un no profesional.

275

Empleado

La proporcin de los profesionales es

A B C D

1 1 0 0 2

p=

2 = 0,50 Parmetro y el desvo tpico: 4

= p.q =

0,50(0,50) = 0,50

Se obtendrn todas las muestras posibles (sin reposicin) de tamao 3 y se calcular la proporcin de profesionales.
Muestra ABC ABD ACD BCD Proporcin muestral 2/3 = 0,67 2/3 = 0,67 1/3 = 0,33 1/3 = 0,33 2,00

La media de las proporciones muestrales es:

p=

2,00 = 0,50 4

====

igual a la proporcin de la poblacin.

El error estndar de la proporcin obtenida por la frmula 22 (Mdulo 3) es: p = 0,17 El clculo del error estndar de la proporcin se simplifica por:

(3)

p =

p.q n

p =

p.q N n n N 1

(4)

para poblaciones finitas

p =

0,50(0,50) 4 3 = 0,17 3 4 1

276

8. Teorema del lmite central


Como resulta impracticable obtener todas las medias muestrales la distribucin normal se utiliza para aproximar las probabilidades de las medias muestrales en un a distribucin muestral. La normalidad de la distribucin muestral de medias queda establecida en el teorema del lmite central cuyo enunciado dice: - Si una poblacin es bastante grande y est normalmente distribuida, la distribucin de las medias muestrales tambin ser normal. - Si una poblacin no est normalmente distribuida, la distribucin muestral de medias se aproximar a una distribucin normal si el tamao es suficientemente grande. La distribucin normal de las medias muestrales tiene una media igual a E(X) y el error estndar x. Si se desconocen los valores de y x, pueden estimarse a partir de X y S. El erro estndar estimado a partir de S, se obtiene por:
S= S n

(5)

Ejemplo:

La media de las cuentas a cobrar de 1.500 clientes en una tienda es de $250 y una desviacin tpica de $45. Cul es la probabilidad de seleccionar una muestra aleatoria de 100 cuentas con una media de $260 y ms?

Z=

x x = x n

(6)

Z=

260 250 10 = = 2,22 4,5 45 100


Area entre 0 y 2,22 = 0,486 0,50 - 0,4868 = 0,0132 P (X $ 260) = 0,0132 250 260
277

Cuando N es grande y el tamao de la muestra n, es pequea, el factor de correccin

Nn N 1
se aproxima a 1, por lo tanto puede obviarse y utilizar slo

x =

p =

p.q n

segn corresponda para el clculo del error estndar.

278

Actividad N 36
1) Contestar las siguientes preguntas: a) b) c) d) e) f) Cules son las principales caractersticas de una muestra? Qu diferencia hay entre un parmetro y un estadgrafo? Qu diferencia hay entre error muestral y erro no muestral? A qu se denomina distribucin en el muestreo? Qu mide el error estndar? Cmo se obtiene este error? Por qu es importante el teorema del lmite central?

2) Las plizas vendidas por 5 vendedores de seguros durante un perodo dado son: Vendedor Plizas Vendidas A 2 B 3 C 4 D 5 E 1

I) Considerar los 5 vendedores como una poblacin. a) Obtener la media aritmtica y la desviacin tpica. II) Elegir todas las muestras posibles de tamao 2 (sin reposicin). a) Obtener las medias de todas las muestras posibles. b) Construir un a distribucin muestral de medias. c) Obtener la media de la distribucin muestral y el error estndar de la media. 3) Con los datos de la poblacin del ejercicio (2), elegir todas las muestras posibles de tamao 3 (sin reposicin) y realizar las mismas actividades consignadas en el punto II. 4) La duracin promedio de 2.000 bateras producidas por una compaa es de 38 meses y una desviacin tpica es de 8 meses. Cul es la probabilidad de seleccionar una muestra al azar de 50 bateras con una duracin de por lo menos 35 meses? 5) De 50.000 familias en una ciudad, el 30% no tiene televisin por cable. Determinar la probabilidad de seleccionar una muestra aleatoria de 500 familias con una proporcin de 33% o ms.

279

6) Consultar la bibliografa consignada en el programa y desarrollar la siguiente gua de estudio sobre el tema Mtodos de Muestreo. a) Efecte una lectura global sobre el tema de referencia. b) Lea atentamente el tema "Muestras Probabilsticas". b.1. Conteste: a qu se denomina "muestra probabilstica". b.2. Cules son los 4 tipos de muestras probabilsticas? c) Lea el tema "Muestreo Simple al Azar". c.1. Explique el procedimiento de este tipo de muestreo. c.2. Supngase que los 70 alumnos de una carrera reciben nmeros de identificacin del 01 al 70. Se desea entrevistar a 10 de ellos eligindolos aleatoriamente. Utilizando la tabla de nmeros aleatorios, cules sern los seleccionados? (Ver Anexo I) c.3. Cules son las principales ventajas y desventajas de este tipo de muestreo? d. Lea el tema sobre "Muestreo sistemtico" d.1. Explique el procedimiento de este tipo de muestreo. d.2. Cmo seleccionara la muestra del punto c.2. por este mtodo? d.3. Cules son las ventajas y desventajas del muestreo sistemtico? e. Lea el tema "Muestreo Estratificado". e.1. Explique en qu consiste este diseo de muestra. e.2. Supngase que de un total de 1.000 empleados de una gran compaa, se desea obtener una muestra de 100 para una investigacin. El nmero total de empleados se distribuye segn su instruccin. Instruccin Primaria Secundaria Superior No Univ. Superior Univ. N de Trabajadores 50 500 150 300 1.000 a) Cmo seleccionara la muestra estratificada proporcional? b) Cmo seleccionara la muestra estratificada no proporcional? c) Cul de las dos es ms apropiada?

280

e.3. Seale ventajas y desventajas de este diseo de muestra. f. Lea el tema "Muestreo por Conglomerados" f.1. En qu consiste este tipo de muestreo? f.2. Qu diferencias hay con el muestreo estratificado? f.3. Determine ventajas y desventajas. g. Lea el tema "Muestras no Probabilsticas". g.1. A qu se denomina "muestras no probabilsticas? g.2. Explique cul es la diferencia con las muestras probabilsticas? g.3. Seale, en general, ventajas y desventajas.

281

Respuestas a los ejercicios de la Unidad VII


1) Consultar el marco terico del mdulo y de la bibliografa. 2) I) = 3 = 1,41

II) a) 10 muestras b) Media N de muestras 1,5 2,0 2,5 3,0 3,5 4,0 4,5 1 1 2 2 2 1 1 = 10

c) Media: 3 plizas Error estndar de la media = 0,87

3)a) 10 muestras b) Media N de muestras 2,0 2,33 2,67 3,0 3,33 3,67 4,0 1 1 2 2 2 1 1 = 10

c) Media: 3 plizas Error estndar de la media = 0,58

4) P (X 35 meses) = 0,9960

5) P (X 0,33) = 0,0668

282

Diagrama de Contenido - Unidad VIII

TEORA CLSICA DE LA ESTIMACIN

Tipos de estimacin Estimador y Estimacin

Propiedades de un buen estimador

283

^ Puntual

^ Por intervalo Nivel e Intervalo de Confianza Estimaciones para muestras grandes: - Estimacin de la Media Poblacional - Estimacin de la Proporcin de la Poblacin - Estimacin de la Diferencia de dos medias

284

UNIDAD VIII TEORA CLSICA DE LA ESTIMACIN


1. Introduccin
Por lo general, los parmetros de la poblacin son desconocidos y se hace necesario estimarlos a partir de valores muestrales (estadgrafos). El empresario recurre a las estimaciones por cuanto sus decisiones se basan en una informacin incompleta y con una gran incertidumbre. La estimacin, una de las bases de la inferencia estadstica, permitir la generalizacin respecto de las caractersticas de la poblacin a partir de la informacin de las muestras.

2. Estimador y Estimacin
- Un estimador es un estadgrafo con el cual se estima un parmetro poblacional. La media muestral (X), por ejemplo, puede ser un estimador para la media poblacin (m). - Estimacin es un valor especfico observado de un estadgrafo. Supngase que se toma una muestra de focos y se prueban para determinar la duracin media que es X = 4.000 hs. Si nos servimos de este valor especfico para estimar la duracin media de todos los focos, el valor 4.000 hs. ser una estimacin.

3. Tipos de Estimaciones
Una estimacin de un parmetro puede ser expresada de dos maneras: por punto y por intervalo. - Una estimacin puntual es un nmero nico que se utiliza para estimar el parmetro. Si en el ejemplo anterior se afirma que la duracin media de los focos es de 4.000 hs., se est haciendo una estimacin puntual. Este tipo de estimacin es insuficiente ya que hay un acierto o una equivocacin. Si la estimacin de 4.000 hs. es equivocada, no se conoce el grado de error y no hay seguridad de la confiabilidad de la estimacin.
285

Si el margen es de solamente de 50 hs., 4.000 hs. puede ser una buena estimacin, pero si el error es de 500 hs., se rechazar como estimacin. Esta estimacin debe incluir una estimacin del error (2). - La estimacin por intervalos es una gama o recorrida de valores dentro del cual se puede esperar que est el parmetro. Si la estimacin de la duracin de los focos se expresa como entre 3.950 hs. y 4.050 hs., es una estimacin por intervalo. Este tipo de estimacin indica el error por el grado de su intervalo y por la probabilidad de que el verdadero parmetro se encuentre dentro de l.

4. Propiedades de un buen estimador


La calidad de un estadgrafo como estimador se puede evaluar de acuerdo a los siguientes criterios: a) Insesgabilidad. Se dice que un estadgrafo es un estimador insesgado de la poblacin si el valor esperado de su distribucin muestral es igual al parmetro poblacional. X es un estimador insesgado de , ya que E(X) = p es un estimador insesgado de P, ya que E(p) = P b) Consistente . Debido al error de muestreo, un estimador, generalmente, no es idntico al parmetro a estimar. Un estimador es consistente si al aumentar el tamao de la muestra, se logra una seguridad casi absoluta de que el valor del estadgrafo se acerca mucho ms al valor del parmetro de la poblacin. c) Eficiencia. La eficiencia hace referencia al tamao del error estndar del estadgrafo. Un estimador es ms eficiente que otro si el primero tiene un error estndar menor. Un estimador con esta propiedad tiene mayor probabilidad de lograr una estimacin ms cercana al parmetro poblacional. d) Suficiencia. Un estimador es suficiente si utiliza la informacin de la muestra, de modo tal que ningn otro estimador proporcione ms informacin de esta muestra referente al parmetro de la poblacin.
2. Levin, Richard, "Estadstica para Administracin". Ed. Prentice-Hall.
286

5. Estimaciones puntuales
La media muestral es el mejor estimador de . Cumple con todas las propiedades mencionadas en el punto anterior. Si la muestra es grande su distribucin muestral puede aproximarse a una distribucin normal. Al conocer la distribucin muestral de X se puede realizar una estimacin basada en la muestra. Recordar que la X se obtiene con la frmula ya conocida:

x=

xi
n

En cuanto a la varianza, se utiliz la siguiente frmula al estudiar las medidas de dispersin (unidad IV).

(x x ) s = n
2

Pero al utilizar S2 como estimador de 2, la frmula anterior se vuelve:

(x x ) s = n 1
2

(7)

Al usar n-1, se obtiene un estimador insesgado de s. Si se hubiera trabajado slo con n, el valor tendra algn sesgo.
Ejemplo: Una compaa desea conocer el nmero de plizas vendidas durante por los vendedores. Obtiene los siguientes datos durante una semana con una muestra de 20 vendedores.

1 5

2 6

2 6

3 7

3 8

3 8

4 9

4 5 5 10 10 10

x=

111 = 5,6 20

S 2 = 8,26

S=

8,26 = 2,9

287

Actividad N 37
Ejercicios - Puntos 1 al 5

1) Contestar las siguientes preguntas: a) Diferenciar entre estimador y estimacin. b) Explicar la ventaja que tiene una estimacin por intervalo sobre el estimacin puntual. 2) Indicar si los siguientes enunciados son correctos (C) o incorrectos (I). a) ____Se dice que un estimador es eficiente del parmetro poblacional, con un tamao creciente de la muestra, se tiene casi la certidumbre de que el valor del estadstico se acerca ms al parmetro poblacional. b) ____El intervalo es una gama de valores que se usan para estimar la forma de la distribucin de una poblacin. c) ____Cuando se elige un estimador del parmetro poblacional, la propiedad ms importante para evaluar su calidad es la insesgabilidad. 3) El propietario de una sala de espectculos est considerando la posibilidad de ampliar su capacidad y necesita conocer el nmero promedio de personas que asisten a los distintos espectculos y la variacin de dicho nmero. La asistencia a 9 espectculos seleccionados, aleatoriamente (en miles) fue: 13,0 8,5 14 20,5 7,6 12,5 20,6 14,2 10,2

Obtener las estimaciones puntuales de la media y la varianza de la poblacin.

288

6. Estimacin por intervalo


6.1 Introduccin
Ya se defini en el punto 3 que la estimacin por intervalo indica un grado de error. Si se estima la duracin media de los focos fabricados por una compaa, se puede seleccionar una muestra de 300 unidades a travs de un control de calidad cuya X = 4.000 hs. Se sabe que la desviacin tpica de la poblacin es de 1.500 hs. Si se utiliza X para estimar , se hace necesario un dato sobre la incertidumbre que acompaa a esta estimacin, o sea establecer un intervalo donde posiblemente se encuentre la media poblacional desconocida. Por lo expresado, se necesita obtener el error estndar de la media. Por el teorema del lmite central, la distribucin muestral de medias se aproxima a una distribucin normal. Recurdese que la dispersin de la distribucin muestral se mide a travs del error estndar. Como n = 300 es una muestra bastante grande, se puede aplicar el teorema de referencia. El error estndar de la media es:

x =

1500 = = 86,6 hs. n 300

Ese resultado es el error estndar que acompaa a la estimacin. Es decir, la duracin media verdadera de todos los focos puede estar en el intervalo entre 3.913,4 y 4.086,6. No obstante, falta determinar la probabilidad de que la verdadera duracin de los focos se halle en el intervalo. Por regla de la normal (Unidad VII) hay una probabilidad de 0,683 de que la media de una muestra de tamao 300 se encuentre dentro de un error estndar positivo y negativo de . En otras palabras el 68,3% de todas las medias muestrales se encuentra a un error estndar positivo o negativo de m . En el ejemplo de la duracin de focos, hay una confianza del 68,3% de que la duracin se encuentre en el intervalo 3.913,4 o 4.086,6 (4.000 1 ). Anlogamente: 3.826,9 a 4.173,2 hs. con el 95,5% de confianza (4.000 2 ). 3.740,2 a 4.259,8 hs. con el 99,7% de confianza (4.000 3 ).
289

6.2 Nivel e Intervalo de Confianza


- La probabilidad asociada a una estimacin por intervalo se denomina nivel de confianza. Por ejemplo 80%; 90%; 95%; 99% y otros. El nivel de confianza se expresa como 1 - . - El intervalo de confianza es la estimacin, es decir el recorrido dentro del cual se espera que se encuentre el parmetro. Como estamos trabajando con una distribucin normal estndar, la diferencia entre el valor de x y su media, expresada en trminos de su desviacin tpica est dada por z. El valor de z es igual al nmero de desviaciones tpicas. Por lo tanto, los intervalos de confianza se expresan como:

x + zsx x - zsx

lmite superior de intervalo de confianza lmite inferior de intervalo de confianza

Si se estima la duracin media de los focos con 90%(*) el intervalo de confianza es: 4000 + 1,64 (86,6) = 3.858 a 4.142 (*) Para 1 - a = 90%, z = 1,64 (ver la tabla) Una proporcin 1 - a del rea bajo la curva normal estndar queda entre -z a /2 y z a /2. Si 1 - = 90% = 0,10 y / 2 = 0,05.
1 0,90

/2 0,005

/2 0,005

/2 x /2 x /2 0 + /2

Interpretacin

La estimacin obtenida anteriormente no significa que haya una probabilidad de 0,90 de que la duracin media de todos los focos se encuentre dentro del intervalo establecido, sino que debe interpretarse as:
290

Si se seleccionan muchas muestras aleatorias de tamao 300 y se calcula el intervalo de confianza de todas esas muestras, en el 90% de ellas, la media de la poblacin se encuentra dentro de ese intervalo.

Valores de z para los coeficientes de confianza ms utilizados: 1- z 50% 0,6745 68,27% 1,00 90% 1,645 95% 1,96 95,45% 2,00 99% 2,58 99,73% 3,00

6.3 Clculo de Estimaciones por intervalos para muestras grandes


6.3.1 Estimacin de una media poblacional

Si se conoce el desvo estndar de la poblacin, el error estndar se calcula como:

x =

x n

por lo tanto el intervalo de confianza para estimar m se obtiene de la siguiente manera:

x z / 2 x < < x + z / 2 . x

(8)

Si el desvo estndar de la poblacin se desconoce, se utiliza el desvo estndar de la muestra, S para estimar . De acuerdo a lo estudiado en el punto 5 de la unidad, se estima por:

(x x ) S=
n

En este caso, el error estndar de la media se obtiene:


Sx = S n

(9)

siendo los lmites de confianza x + Sx


291

Ejemplo: El Dpto. de Personal de una empresa est interesada en estimar el nmero promedio de das que los empleados faltaron por razones particulares. Un anlisis de los legajos de 49 trabajadores elegidos al azar dio una media de 12 das. Si el desvo estndar poblacional es de 2,5 das, determinar el intervalo de confianza del 95% para el verdadero promedio.

xz 12 1,96 (2,5 / 49) 12 1,96 (0,36) 11,3 12,7

Determinacin del tamao de la muestra para la estimacin

En la distribucin normal z x = E y E = z E = es el error muestral o sea la diferencia entre x y En el problema anterior E = 1,96 (0,36) = 0,7
E = z. n y n= z. E

z . 2 n= E donde:

(10)

E: error muestral mxima que se acepta. z: se establece mediante el nivel de confianza. : desvo estndar de la poblacin que si se desconoce se puede estimar por .
Ejemplo: Supngase que el Jefe de Personal desea estimar la media de inasistencia utilizado la misma desviacin tpica y con el mismo nivel de confianza pero acepta como error mximo 0,5. El tamao de la muestra que deber elegir es:

292

n=

(1,96)2 . (2,5)2 (0,5)2

= 96,04 = 96 trabajadores

6.3.2 Estimacin de la proporcin de la poblacin

Para construir un intervalo de confianza para estimar la proporcin poblacional se debe utilizar la distribucin binomial. Como los clculos de probabilidades binomiales son complejos, se puede aproximar por medio de una distribucin normal que puede servir para aproximar la distribucin muestral. Para aproximarse debe cumplir que:

n 30 y np 5, donde = np y = n.p.q
La proporcin de xitos en la muestra se expresa por p. Como np es igual al nmero medio de xitos, se divide np entre n para obtener slo a proporcin p. La media de la distribucin muestral de proporciones es: p = p Anlogamente, se modifica la desviacin tpica dividiendo n.p.q entre n para convertir nmero de xitos en proporcin de xitos. La desviacin estndar de la proporcin de xitos se representa por:

p =

p.q n

error estndar de la proporcin

Si se desconoce la proporcin de la poblacin: Sp = p.q n (11)

Por lo tanto el intervalo de confianza para estimar la proporcin de la poblacin p es;

p z / 2 . p p p + z / 2 p
Si se desconoce la proporcin de la poblacin:

(12)

p z / 2 Sp

293

Ejemplo: Otro problema del jefe del personal es estimar la verdadera proporcin de legajos de los empleados que estn incompletos. Elige una muestra de 50 legajos y encuentra 14 incompletos. Determinar el intervalo de confianza del 99% para p.

p=

14 = 0,28 50

p + z / 2 . Sp 0,28 2,58 . 0,28 (0,72) 50 0,12 p 0,44

Determinacin del tamao de la muestra para estimar la proporcin de la poblacin

E = z p = z .
donde:

p.q n

p.q E = n z

p . q E2 = 2 n z z2 .p . q E2

n=

(13)

Ejemplo: Supngase que para la estimacin del ejercicio anterior, el jefe desea un error no mayor de 0,10. El tamao de la muestra ser:
n= (2,58)2 . (0,28) . (0,72) (0,10)
2

= 134,2

n = 134 legajos

294

6.3.3 Estimacin de la diferencia entre dos medias


Si dos medias muestrales x1 y x2 son independientes, el procedimiento para construir el intervalo de confianza para (delta), verdadera entre las dos medias poblaciones 1 y 2 es similar a los anteriores.

D z / 2 . D D + z / 2 . 2
Siendo D = x1 - x2
D = error estndar de la diferencia de medias

(13)

D =

2 1 2 + 2 n1 n2

(15)

se puede estimar a partir de S2 cuando se desconoce la varianza de la poblacin.

Ejemplo: se desde estimar la verdadera diferencia de medias en la duracin de dos marcas de bateras. Se obtiene los siguientes datos. Marca A n1 = 100 x1 = 38 meses 12 = 36 meses Marca B n2 = 100 x2 = 35 meses 12 = 25 meses

Tamao de la muestra Media muestral Varianza poblacional

Obtener el intervalo de confianza del 95% para , verdadera diferencia de las dos medias: D + z / 2
2 1 2 + 2 n1 n2

D = 38 35 = 3

1,96

36 25 + 100 100

3 1,96 (0,78) 1,5 4,5 meses

295

Actividad N 38
Ejercicios del punto 6
1. Una fbrica de golosinas desea estimar el peso medio de los paquetes de caramelos envasados automticamente por una mquina. De la produccin de un da se sac una muestra de 120 paquetes y se obtuvo una media de 855 gramos y un desvo tpico de 47 gramos. Estimar m con un nivel de confianza de 99%. 2. La oficina de Extensin Universitaria de una Universidad desea estimar la proporcin de ingresantes que estudiarn carreras humanistas. Selecciona aleatoriamente una muestra 80 fichas de inscripcin y encontr que 12 ingresantes estudiarn dichas carreras. Estimar p con un nivel de confianza de 95%. 3. Un examen estndar se aplica a un grupo de estudiantes de nivel superior universitario y a un grupo de estudiantes de nivel superior no universitario. Se obtienen los siguientes docentes:

Muestra Puntuacin media Varianza

Sup. Univ. n1 = 72 x1 = 84 12 = 40

Sup. No Univ. n2 = 36 x2 = 80 12 = 64

Determinar el intervalo de confianza del 90% para la verdadera diferencia de medias entre las puntuaciones medias de ambos grupos de estudiantes. 4. Supngase que es la estimacin de ejercicio 1, se pretende que el error de la estimacin no sea mayor a 3 gramos. Cul debe ser el tamao de la muestra para dicha estimacin? 5. Si en el ejercicio 2, se desea un error mximo de 2,5%, cul debe ser el tamao de la muestra para la estimacin? 6. Se realiza un estudio sobre el ingreso de los operarios de una gran compaa metalrgica. Una muestra de 100 operarios dio como resultado ingreso medio de $520 y una desviacin tpica de $30. De

296

esos 100 trabajadores, se encontr que 20, tenan un ingreso menor a $350. a) Estimar con el 95% de confianza, la verdadera media de ingreso de todos los operarios. b) Estimar con el 95% de confianza, la verdadera proporcin de operarios con ingresos menores de $350.

297

Respuestas a los ejercicios de la Unidad VIII


Puntos 1 al 5
1) Consultar el marco terico del mdulo. 2) 3) a) I ; = 13,5 b) I ; c) I

= 4,6

Punto 6
1) 2) 3) 4) 5) 6) 843,9 866,1 0,07 p 0,23 1,49 6,51 n = 16,34 n = 784 a. 514,12 525,88 b. 0,12 p 0,28

298

PRUEBAS DE HIPTESIS PRUEBAS DE HIPTESIS

TEST DE HIPOTESIS

MUESTRAS PEQUEAS

Distribucin t PROCEDIMIENTO DE LA PRUEBA DE HIPTESIS

MUESTRAS GRANDES

Diagrama de Contenidos - Unidad IX

299

Caractersticas

Prueba de una media poblacional

Inferencia estadstica Prueba de proporcin de la poblacin Pruebas para la media poblacional y para la diferencia de medias Estimaciones de la media poblacional y de la diferencia de medias

Prueba de la diferencia de dos medias

300

UNIDAD IX TEST DE HIPOTESIS


1. Generalidades
Una hiptesis estadstica es una declaracin tentativa acerca del valor del parmetro de una poblacin. Mediante las pruebas de hiptesis se pueden tomar decisiones sobre una media poblacional, sobre una proporcin de la poblacin o cualquier otro parmetro, basndose en la informacin proporcionada por una muestra. La afirmacin es tentativa debido a que los verdaderos valores de los parmetros se desconocen.

2. Procedimiento de las pruebas de hiptesis


Los pasos esenciales en este procedimiento son:

(1) Identificacin de la distribucin de la poblacin


Es necesario conocer la distribucin terica de la variable aleatoria que se estudia, ya que la decisin sobre la hiptesis se toma en base a las probabilidades de ocurrencias. Cualquier procedimiento estadstico que requiere identificar la distribucin probabilstica se denomina enfoque paramtrico, de lo contrario se denomina enfoque no paramtrico.

(2) Planteamiento de las hiptesis


Se confrontan dos tipos de hiptesis: a) la hiptesis nula que se simboliza por H0 y b) la hiptesis alternativa simbolizada por H1. La hiptesis nula es una declaracin tentativa de que el parmetro de la poblacin es igual a un valor especfico. El nombre de nula expresa la idea de que no hay diferencia. Por ejemplo; H0: = 10

301

La hiptesis alternativa es una afirmacin tentativa de que el parmetro de la poblacin tiene un valor diferente del especificado en la hiptesis nula: H1: = 10 El valor de H1 se obtiene a partir de una muestra que se utiliza para apoyar este hiptesis. Obsrvese que H1 se plante como distinto, esto significa que si los datos muestrales muestran un valor muy bajo o un valor muy alto se rechaza H0. Como la hiptesis alternativa no indica la direccin de la diferencia, esta prueba se denomina de dos colas o de dos extremos. H1 puede especificar una sola direccin, es decir una alternativa unilateral. H1: > 10 o H1: < 10

En estos casos, H0 se rechaza solo si el valor muestral indica un valor muy alto (H1 > 10) o solo si el valor de la muestra es muy bajo (H1 < 10). Como aqu se especifica la direccin, la prueba se denomina un extremo o de una cola.

(3) Especificacin del nivel de significacin


La finalidad de un test de hiptesis no es poner en tela de juicio el valor de un estadgrafo, sino emitir un juicio sobre la diferencia que hay entre ese valor y el supuesto parmetro poblacional. El nivel de significacin es el estndar estadstico que se determina para rechazar H0. Si se especifica, por ejemplo, un nivel del 5%, entonces se rechaza H0 slo si el resultado muestral es tan diferente del valor hipottico que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoriamente con una probabilidad del 0,05 o menos. Al usar un nivel de significacin del 5%, existe una probabilidad del 0,05 de rechazar H0 si sta es verdadera. Este error se denomina de tipo I que es siempre igual al nivel de significacin.

El error de tipo I se simboliza por (alfa)


Se incurre en error de tipo II si se acepta H0 siendo falsa. Este error se simboliza por (beta).
302

(4) Planteo de la regla de decisin


Para tener un criterio de decisin se requiere establecer:

a) b)

el estadstico de prueba y la regin crtica.

a) El estadstico de prueba es una variable aleatoria, cuyo valor se utiliza para decidir de rechazar o aceptar H0. Un estadgrafo muestral como la media aritmtica, la puntuacin z o cualquier otra variable pueden ser estadsticos de prueba. b) La regin crtica es el conjunto de valores para el estadstico de prueba que llevar el rechazo de H0. Desde luego, la regin de no rechazo es el conjunto de valores para el estadstico de prueba que llevar a aceptar H0. Ambas regiones estn separadas por un valor crtico (C).

1-
c

regin de aceptacin

valor crtico

regin de rechazo

Las reglas de decisin pueden ser:

/2 -c

/2 c c

303

Rechazar H0 si el valor del estadsti co de prueba es que C o que C (Test de dos colas)

Rechazar H0 si el valor del estadstico de prueba es que C. (Test de una cola)

Rechazar H0 si el valor del estads tico de prueba es que C (Test de una cola)

(5) Toma de decisiones


La decisin de aceptar o rechazar H0 lleva a cuatro posibles resultados: - Si H 0 es verdadera y se rechaza, se comete error de tipo I. La probabilidad de cometer este error es . - Si H0 es verdadera y se acepta la decisin es correcta y la probabilidad de tomar esta decisin es 1- . - Si H0 es falsa y se acepta, se comete error de tipo II. La probabilidad de cometer este tipo de error se denomina . - Si H0 es falsa y se rechaza la decisin es correcta. La probabilidad de tomar este decisin es 1- .

En resumen:
H0 Verdadera Error de tipo I () Decisin correcta (1- ) H0 Falsa Decisin correcta (1- ) Error de tipo II ()

Decisin

Rechazar H0 Aceptar H0

Debe tenerse cuenta que los dos tipos de error estn relacionados inversamente. En los grficos se representan las reas de y . Cuando disminuye, la recta vertical se traslada hacia la derecha, aumenta el rea de . Cuando la recta vertical se traslada hacia la izquierda, aumenta a medida que el rea de disminuye.

304

0 1 est comprendida slo cuando H0 es verdadera. est comprendida slo cuando H1 es verdadera.

3. Hiptesis exactas e inexactas


Una hiptesis es exacta cuando se especifica un valor nico para el parmetro poblacional: Ejemplo: H0 : = 100 H1: = 90

Una hiptesis es inexacta cuando se especifica un conjunto de valores que puede tomar el parmetro: Ejemplo: H0: 100 H < 100

4. Pruebas de hiptesis con muestras grandes


4.1 Prueba de una media poblacional
El gerente de una compaa de telfonos asegura que el importe medio de las facturas por el servicio de uso familiares a lo sumo de $90. La distribucin de los importes es normal con = $ 25. La oficina de facturacin eligi al azar 100 facturas y encontr una media de $98. Con un nivel de significacin del 5%, probar la aseveracin del gerente.

305

1 La distribucin en normal. 2 Las hiptesis quedan planteadas as:


H0: 90 H1: > 90

3 = 0,05. El valor crtico z es 1,645 que es el valor normal estndar. 4 Regla de decisin
Se utilizar como estadstico de prueba, la puntuacin z. Rechazar H0 si z 1,645

0 1,645 z= z= x 0 / n 98 90 = 3,2 25 / 100 Como Z > 1,645 se rechaza H0 es decir la afirmacin del gerente. Se puede utilizar tambin como estadstico de prueba, la media crtica XCR .
X CR = 0 z x

(16)

XCR 90 + 1,645 (2,5) = 94,11

90

94,11

306

Rechazar H0 si X es mayor que la media crtica. Como la media muestral 98 es mayor que X CR se rechaza H0 Desde luego, empleando cualquiera de los dos estadsticos de prueba lleva a la misma decisin.

4.2 Prueba de la proporcin de la poblacin


Un gerente de comercializacin sostiene que el 80% de los cliente de la empresa estn conforme con un nuevo servicio que brinda la compaa. Una consultora entrevist a 200 clientes y 148 de ellos estn conformes con el servicio. Probar la hiptesis de que la proporcin es menor con = 0,01. 148 H0: p = 0,80 H1: p 0,80 = 0,01 - z crtico = - 2,33 Rechazar H0 si z - 2,33 p= 200 = 0,74

z=

p p p.q n
-2,33 0

z=

0,74 0,80 = 2,12 0,80(0,20) 200

Se acepta H0 ya que z > - 2,33.

307

4.3 Prueba para la diferencia de medias


Esta prueba tiene como finalidad decidir si la diferencia entre dos medias obtenidas de muestras independientes es lo suficientemente grande que indiquen que las muestras se tomaron a partir de poblaciones distintas o si dicha diferencia es tan pequea que se debe al azar. La H0 de inters no slo se refiere a que las medias muestrales se obtuvieron de poblaciones con medias iguales, sino que las dos muestras se obtuvieron de la misma poblacin. Esto significa que 1 = 2. Las hiptesis se plantean de la siguiente manera: H0: 1 - 2 = 0 H1: 1 - 2 0 1 = 2 1 2

El estadstico de prueba utilizando la puntuacin z es:

( ) (1 2) z = x1 x 2 D
Como 1 - 2 = 0 , entonces:

z = x1 x 2 D

(17)

D = x1 x 2

Recordar que el error estndar de la diferencia de medias es:

D = 1 + 2 n1 n2
2 2

Ejemplo: se desea probar si la duracin promedio de las bateras marca A es igual a la duracin promedio de las bateras marca B. Con este propsito se toman de 100 bateras de cada marca, cuyas medias son xA = 38 meses y xB= 35 meses. Las varianzas poblacionales son respectivamente A2 = 36 meses y B2 = 25 meses. Utilizar = 0,05.

308

H0: 1 = 2 (no hay diferencias en las duraciones de ambas marcas). H1: 1 2 (si existe diferencias entre las duraciones de A y B). La prueba es de dos colas. Con =0,05, el valor crtico en 1,96.

Rechazar H0 si z 1,96 z -1,96

-1,96 Aplicando el estadstico de prueba:

1,96

z=

38 35 3 3 = = 36 25 0,61 0,78 + 100 100

z = 3,85
Como z es > 3,84, se rechaza H0, las duraciones de A y B son distintas. El problema anterior se podra haber planteado como prueba de una cola si se deseaba probar que la duracin de A es mayor que la de B. Entonces: H0 : 1 = 2 H1: 1 > 2

El valor crtico es 1,645. Como z > 1,645, se rechaza H0 y se concluye que la duracin de las bateras A es mayor que B.

5. Error de tipo II. Curva Caracterstica Operativa y Curva de Potencia de Contraste


Ya se estableci que es el error de tipo II, o sea la probabilidad de aceptar H0 cuando es falsa. En el problema del punto 4.1, la regla de decisin era:

309

Rechazar H0 si z 1,645. Esta regla puede replantearse como: Aceptar H0 si z < 1,645. Para obtener es necesario trabajar con la media crtica, o sea x CR = 94,11. Aceptar H0 si la media muestral es menor que 94,11. 1- 0,95 90 0.06 94,11 1- 0,94 98

94,11

= P (x < 94,11 / = 98)


z= 94,11 98 = 1,56 2,5

Area entre 0 y -1,56 = 0,4406 Area entre 0 y - = 0,50 0,5 - 0,4406 = 0,0594 = 0,06 P (error de tipo II) = 0,06

por lo tanto 1 - = 1 - 0,06 = 0,94 El valor 0,06 indica, entonces, la probabilidad de aceptar H0 cuando H1 es verdadera es decir = 98. El valor 0,94 significa la probabilidad de rechazar correctamente H0. El valor 1- se denomina potencia de contraste o potencia de prueba.
310

Al mantener constantes el nivel de significacin y el tamao de muestra de la muestra, disminuye a medida el valor de la media alternativa se aleja del valor de H0. Esta probabilidad aumenta al acercarse el valor alternativo al valor de H0. La probabilidad de aceptar H0 con diversos valores alternativos de la media verdadera se puede graficar mediante una curva denominada de caracterstica operativa (CO). Para el ejemplo anterior, considrense los siguientes valores alternativos de 92; 95; 98 y 100.

92

94,11

z=

94,11 92 = 0,84 2,5

Area entre 0 y 0,84 = 0,2995

= P (x 94,11) = 0,50 + 0,2995 = 0,7995 = 0,80 1 - = 1 - 0,80 = 0,20

94,11
z=

95

94,11 95 = 0,36 Area entre 0 y 0,36 = 0,1406 2,5

= P (x 94,11) = 0,50 - 0,1406 = 0,3594 = 0,36 1 - = 1 - 0,36 = 0,64

311

94,11
z=

98

94,11 98 = 1,56 Area entre 0 y 1,56 = 0,4406 2,5

= P (x < 94,11) = 0,50 - 0,4406 = 0,0594 = 0,06 1 - = 1 - 0,06 = 0,94

94,11
z=

100

94,11 100 = 2,36 Area entre 0 y 2,36 = 0,4909 2,5

= P (x < 94,11) = 0,5 - 0,4909 = 0,0091 = 0,01 1- = 1- 0,01 = 0,99 Valor de 90 92 95 98 100 = valor de CO 0,95 0,80 0,36 0,06 0,01 1- = Potencia 0,05 0,20 0,64 0,94 0,99

= Probabilidad de aceptacin de H0 1 - = Probabilidad de rechazo de H0.


312

La curva CO queda graficada de la siguiente forma:


1.00

0.50

0 90 91 92 93 94 95 96 97 98 99 100

Rechazar H0 cuando es falsa significa decidir correctamente un valor alto de 1- de muestra que la prueba est funcionando bien (ya que se rechaza H0 cuando es falsa). Si 1 - es bajo significa que la prueba no funciona bien, puesto que no est rechazando H0 cuando es falsa. El valor 1- mide la eficacia de la prueba, es por ello que se denomina potencia de contraste o poder de la prueba. La curva de potencia de contraste muestra la probabilidad de rechazar H0 con distintos valores de la media verdadera.
1-

90

92

95

98

100

313

Valores crticos para los niveles de significacin ms utilizados

a z crtico (1 cola) z crtico (2 colas)

0,10 1,28 1,645

0,05 1,645 1,96

0,01 2,33 2,58

314

Actividad N 39
Ejercicios - Puntos 1 al 5
1) Contestar las siguientes preguntas: a) Cul es la finalidad de la prueba de hiptesis? b) Qu diferencia hay entre un enfoque paramtrico y un enfoque no paramtrico? c) Explicar brevemente los pasos para el procedimiento de prueba de hiptesis. 2) Completar los siguientes conceptos: a) Cuando la prueba de hiptesis tiene una sola regin de rechazo, se dice que la prueba es de...................................................... b) expresa y el error de tipo ............................................. y significa ............................................................................................... c) En la prueba de diferencias entre dos medias, la hiptesis nula se plantea como H0: 1 = 2 , esto indica que 1 - 2 = ................ ............................................................................................... 3) El propietario de un cine sabe que una pelcula de gran xito se exhibir un promedio de 84 das en cada ciudad, y la desviacin estndar es de 10 das. El dueo quera comparar la popularidad de la pelcula en su ciudad con la que alcanz en otras ciudades del pas. Seleccion aleatoriamente 36 cines de la ciudad y descubri que exhibieron la pelcula un promedio de 81 das. a) probar las hiptesis para ver si el promedio de das de exhibicin baj, con un nivel de significacin del 5%. Utilizar xCR y z. b) Obtener la probabilidad de cometer error de tipo II y la potencia de contraste. 4) Un fabricante de salsa de tomate est a punto de decidir si producir una marca nueva con ms condimento. El departamento de

315

investigacin aplic una encuesta a 200 familias y averigu que la salsa sera comparada por 120 de ellas. Un estudio hecho el ao pasado revel que el 55% de las familias compraran la nueva marca. Con un nivel de significacin del 1%, deber la compaa concluir que hay un mayor inters en la nueva salsa condimentada? 5) Dos laboratorios de investigacin han producido independientemente dos medicamentos que dan alivio a los que sufren artritis. El primer frmaco fue probado en un grupo de 90 enfermos, dando un promedio de 8,5 horas de alivio, con una desviacin estndar de 1,8 horas. El segundo fue probado en 80 enfermos y produjo un promedio de 7,9 horas de alivio con una desviacin estndar de 2,1 horas. Con un nivel de significacin de 0,05, probar si hay diferencia en los dos medicamentos. 6) Dado los siguientes valores alternativos de m para el ejercicio 3: 84, 83, 81y 78. a) determinar los valores de y 1 - ; b) graficar las curvas de CO y de potencia de contraste.

316

6. Inferencia para muestras pequeas. La Distribucin t de Student


6.1 Introduccin
Hasta el momento se han manejado estimaciones de distribuciones normales donde la desviacin tpica de la poblacin es conocida. No obstante, se presentan problemas de inferencia estadstica para muestras pequeas (n < 30) cuando es desconocida. Este caso fue resuelto a principios de siglo cuando W.S. Gosset, utilizando el seudnimo de Student, public una distribucin terica que lleva el nombre de Distribucin t de Student.

6.2 Caractersticas

La distribucin t se basa en la consideracin de que la poblacin a partir de la cual se obtiene la muestra es normal o aproximadamente normal. Se pueden mencionar las siguientes caractersticas:

Normal

t, n = 10 t, n = 2

- La distribucin t es continua, acampanada y simtrica, pero a diferencia de la distribucin normal tiene mayor variabilidad. La curva t est ms extendida en la parte de las colas y es ms achatada en el centro. - A medida que aumenta el tamao de la muestra, la curva t se acerca a una curva normal. Cuando n tiende a infinito, la curva t se vuelve idntica a la curva normal. En otras palabras, el estimador s se acerca a ; si el n se acerca a N, s se acerca a y no existen diferencias entre t y z.
3. Caho, Lincoln: "Introduccin a la Estadstica". C.E.C.S.A.
317

- Mientras que z contiene slo una variable aleatoria que es x, ya que n y son constantes, la razn t contiene dos variables aleatorias que son x y s, estas variables son independientes unas de las otras. En resumen, t tiene una media igual a 0 (cero) y una desviacin tpica generalmente mayor que 1. Esta desviacin tiende a 1 cuando n tiende a infinito. Por lo tanto, mientras el valor z tiene solamente una distribucin, el valor t tiene una familia de distribuciones, donde cada una tiene la misma media pero una desviacin tpica diferente que depende del valor n. El nico parmetro de la distribucin t es el nmero de grados de libertad (gl) que es igual a n-1. Entonces, la curva t est definida cuando est dado el tamao de la muestra y en consecuencia el nmero de gl. (ver punto 6.7.).

6.3 Uso de la tabla


Los valores crticos para probar hiptesis o efectuar estimaciones utilizando la distribucin t se pueden obtener de la tabla del Anexo II. En los dos renglones superiores se consignan los valores de probabilidad que se utilizan con mayor frecuencia para realizar inferencias. En el rengln Q se encuentran las probabilidades iguales al rea de la cola superior o de la cola inferior para los grados de libertad que deben utilizarse para las pruebas de una cola. En el rengln 2Q se encuentran las probabilidades iguales a la suma de ambas reas (colas superior e inferior) que son utilizadas para pruebas de dos colas (y para las estimaciones de parmetros por intervalo). Los valores para los gl se listan en la primera columna. El valor resultante de la interseccin del nmero de gl especificado y el valor de probabilidad establecido corresponde al valor crtico.

Ejemplo N 1: Obtener el valor crtico t para una prueba de una cola con n = 10 y =0,05.
El nmero de gl = n-1 o sea 9. Se utiliza el valor de Q = 0,05 (1 rengln) ya que es una prueba de un extremo tgl = tg = 1,833

Ejemplo N 2: Obtener el valor crtico t para una prueba de dos colas con n = 10 y = 0,10 tgl = tg = 2,262.
318

Obsrvese que el valor de 0,10 en el rengln 2Q es equivalente al valor de 0,05 en el rengln Q.

Ejemplo N 3: Obtener los valores crticos t para cada uno de los siguientes casos.
a) n = 15 = 0,01 para prueba de una cola t14 = 2,624 b) n = 20 = 0,05 para prueba de dos colas t19 = 2,093

6.4 Inferencia estadstica utilizando la distribucin t


6.4.1 Prueba para la media poblacional
Si la muestra es pequea, el valor de s puede desviarse mucho, si se utiliza la puntuacin z hay una gran probabilidad de que se cometa un serio error. En este caso, corresponde usar el estadstico de prueba perteneciente a la distribucin t.

t=

x x = Sx s/ n

(18)

El valor calculado se compara con el valor crtico t (tabla) y se toma la decisin.

Ejemplo N 1: Un fabricante de bateras para automviles afirma que la duracin promedio de las mismas es de 38 meses. Se toma una muestra de 16 bateras y se encuentra que la duracin media es de 35 meses con un desvo tpico de 6,2 meses.
Probar la hiptesis con un nivel de significacin del 5% de que la duracin promedio de las bateras es menor que la establecida por el fabricante.

- Planteo de la hiptesis
H0: = 38 meses H1: < 38 meses
319

Prueba de una cola. El valor crtico de t con = 0,05 y con gl = 16-1 = 15 es igual a -1,753 (extremo izquierdo).
-1,753 -t

- Regla de decisin
Rechazar H0 si t -1,753

- Estadstico de prueba

t=

35 38 = 1,935 6,2 / 16

Como el valor -1,935 es menor al valor crtico, se rechaza H0 y se concluye que la duracin de las bateras es menor.

Ejemplo N 2: Considerar el mismo ejercicio anterior, pero probar que la duracin promedio es distinta a la especificada por el fabricante. - Planteo de hiptesis
En este caso la prueba es de dos colas: H0: = 38 H1: 38 El valor crtico de t para 15 grados de libertad con =0,50 es t15 = 2,131.

Regla de decisin
Rechazar H0 si t 2,131 o t -2,131

-t -2,131

0
320

t 2,131

- Estadstico de prueba
t = -1,935 En este caso, se acepta H0 ya que t es mayor que 2,131.

6.4.2 Estimacin de la media poblacional


El mtodo de construir el intervalo de confianza para estimar es el mismo empleado para una distribucin normal, excepto que se trabaja con valores de t en lugar de valores de z. El intervalo de confianza con 1 - para estimar en base a la media de una muestra pequea es:

x t gl / 2 s x x + t gl / 2 s x

(19)

Ejemplo: El propietario de una librera desea estimar el importe medio de las cuentas por cobrar. Para tal fin selecciona una muestra de 12 fichas de clientes y se registran los siguientes saldos (en $).
180 90 240 170 150 350 320 270 215 100 80 240

Estimar m con un nivel de confianza del 99%. Se obtienen la media y el desvo tpico.

x x= n

( x x )2 s= n 1

x = $ 200,42

s = $ 88,17

t con 11 grados de libertad es t11,0,01 = 3,106

x tgl

a/2

. Sx

200,42 3,106

88,17 = $ 121,27 a $ 279,57 12

121,27 279,57

321

6.4.3 Prueba de la diferencia entre dos medias a)Muestras independientes


Dos muestras son independientes cuando las observaciones de una no estn relacionadas con las observaciones de las otras. Al probar la hiptesis debe suponerse que las varianzas de las dos poblaciones son idnticas o sea 12 = 22, es decir la varianza de la diferencia de medias es:
2 D 2 2 1 1 1 + 1 2 = + 1 = n + n n1 n2 1 2

(20)

Para obtener la varianza de la diferencia de medias, es necesario estimar. Por lo tanto:

1 1 2 SD = S2 (21) n + n 1 2
El estimador S2 se obtiene de la siguiente manera:

S =
2

(n1 1)S2 + (n2 1) S2 2


n1 + n2 2

(22)

Por lo tanto, el error estndar de la diferencia de dos medias muestrales se obtiene sustituyendo la ecuacin (21) por la siguiente:

SD =

(n1 1) S2 + (n2 1)S2 1 2 . +


n1 + n2 2 n 1

1 n2

(23)

El estadstico de prueba utilizado es:

t = x1 x 2 SD

(24)

322

Ejemplo: una fbrica produce dos marcas distintas de tubos fluorescente A y B. De cada marca se toma una muestra de 15 unidades y se calcula la duracin media y la varianza muestral de cada una los resultados son: Marca A
Muestra Duracin media Varianza n1 = 15 x1 = 1.600 hs. S21 = 14.4000 hs.

Marca B
n2 = 15 x2 = 1.570 hs. S22 = 12.100 hs

Probar la hiptesis de que no hay diferencias entre las duraciones de ambas marcas con = 0,05. Se trata de una prueba de dos colas, entonces: H0: 1 = 2 (no hay diferencias entre las duraciones de A y B) H1: 1 2 (si hay diferencias entre las duraciones de A y B) El nmero de grados de libertad es n1 + n2 - 2, es decir: 15 + 15 - 2 = 28 t26,0,05 = 2,048

Rechazar H0 si t 2,048 t -2,048

-2,048 Empleando el estadstico de prueba:

2,048

323

t=

(15 1).14.400 + (15 1).12 .100


14 + 14 2

1600 1570

1 1 + 15 15

30 = 0,714 42,03

t < 2,048 es decir que la diferencia entre las duraciones de A y B no es significativa, por lo tanto se acepta H0. Dicha diferencia es debida al azar.

b) Muestras dependientes
En muchos casos, las observaciones se muestran por pares donde cada observacin de una muestra se relaciona con una observacin de la otra muestra, por lo tanto se dice que las muestras son dependientes. El procedimiento para probar hiptesis de diferencias de dos medias de muestras dependientes requiere los siguientes datos: 1') D: que es la diferencia entre dos observaciones entre cada par coincidente. 2') D: media de D para n, observaciones:

D D= n
3') El desvo tpico de D:

(25)

D2 SD = D2 n
4') El error estndar de D: SD = 5') El estadstico de prueba: SD n 1 (27)

(26)

t=

D SD

(28)

324

Ejemplo: Diez trabajadores de una fbrica son entrenados con un nuevo mtodo de trabajo. Se desea saber si con dicho entrenamiento la productividad ha aumentado. A continuacin se muestran las producciones (en unidades) de cada uno del entrenamiento.
Trabajador 1 2 3 4 5 6 7 8 9 10 Despus (L) 85 92 94 88 82 95 94 82 85 89 Antes (A) 80 90 95 80 79 88 90 87 86 84 D=L-A 5 2 -1 8 3 7 4 -5 -1 5 D2 25 4 1 64 9 49 16 25 1 25

= 27 = 219

D=

27 = 2,7 10

SD =

219 (2,7 )2 = 3,82 10

SD =

3,82 = 1,273 10 1

error estndar

H0: 1 = 2 (no hay diferencia entre la productividad antes y despus del entrenamiento). H1: 1 > 2 (el entrenamiento ha aumentado la productividad) Si se prueba con = 0,01, el valor crtico es: t9,0,01 = 2,821 Rechazar H0 si t 2,821:
t= 2,7 = 2,12 1,273

Se acepta H0, el entrenamiento no aument la productividad de los trabajadores.


325

6.4.4 Estimacin de la diferencia de dos medias muestrales


El intervalo de confianza (1- ) para estimar la diferencia entre dos medias muestrales se obtiene:
D t gl / 2 SD D + t gl / 2 SD

(29)

Ejemplo N 1: Considerar el problema de muestras independientes del punto 4-3 (a). Estimar d con el 95% de confianza.
D tgl,
a/2

SD

30 2,048 (42,03) = 56,1 a 116,1 Como el lmite inferior es negativo se considera 0, por lo tanto,

116.1

Ejemplo N 2: Considerar el problema de muestras dependientes del punto 4.3.(b). Estimar con el 99% de confianza.
2,7 3,250 (1,273) = -1,4 a 6,8

6,8

6.5 Grados de libertad 4


Los grados de libertad se refiere al nmero de valores que puede variar libremente en un conjunto de datos bajo ciertas condiciones. Por ejemplo, la suma de 4 valores de como resultado 15. a + b + c + d = 15 Si a = 4; b = 6; c = 3, el valor de d queda determinado automticamente, ya que: 4 + 6 + 3 + d = 15 d = 15 - 13 = 2
4. Shao, Stephen - op. cit.
326

El nmero de valores que puede variar libremente en el conjunto es 2. Por lo tanto, si hay n elementos y la suma de ellos es un valor fijo, el nmero de grados de libertad es igual a n-1. Cuando se estudi la varianza muestral como estimador de la varianza poblacional, se determin que en la frmula, la suma del cuadrado de las desviaciones ( x -x)2 se divide entre el tamao de la muestra menos 1. Dados los siguientes valores x1, x2, x3, x4 y x5 cuya x = 8. Libremente asignamos valores para x1, x2, x3 y x4: x1 = 10 ; x2 = 6 ; x32 = 9 ; x4 = 7

El valor de la varianza queda determinada automticamente, ya que el quinto valor es fijo. (x - x) = 0 (10-8) + (6-8) + (9-8) + (7-8) + (x5 -8) = 0 2 + (-2) + 8 1 + (-1) + (x5 -8) = 0

x5 =

En el clculo de la varianza interesa las desviaciones de n-1 elementos, o sea:

(x x ) S =
2

n 1

( 10 8 )2 + (6 8 )2 + (9 8 )2 + (7 8 )2 + (8 8 )2 =
4

S2 = 2,5

327

Actividad N 40
Ejercicios del punto 6
1) Contestar las siguientes preguntas: a) Cul es la utilidad de la distribucin t? b) Cules son las semejanzas y diferencias entre la distribucin normal y una distribucin t? 2) El jefe de personal de una compaa afirma que el promedio de horas trabajadas en una semana por los trabajadores administrativos es de 23 horas. Al tomar al azar 10 tarjetas reloj las horas extras registradas durante una semana en cada una eran:

Tarjeta

Horas extras 18

22 20 15 24 18 19 21 22 20

Probar la hiptesis del jefe de personal con un nivel de significacin del 5%. 3) Con los datos del problema anterior, determinar el intervalo de confianza del 95% para estimar . 4) Dos mquinas producen pernos idnticos. Las longitudes tienen la misma varianza, pero se sospecha que la longitud promedio de los pernos de la mquina I no es igual a los de los fabricados por la mquina II. Se toman dos muestras independientes y se obtienen los siguientes datos:

Mquina I Tamao de la muestra


Promedio muestral (en pulgadas)

Mquina II

n1 = 8

n2 = 10

x1 = 2,6
328

x2 = 2,5

Varianza muestral

S21 = 0,0054

S22 = 0,0046

a) Indicar los datos que existe una diferencia significativa entre las dos medias con = 0,01. b) Obtener el intervalo de confianza del 99% para la verdadera diferencia de las dos medias poblacionales. 5) Se desea determinar si un grupo de 10 estudiantes puede desempearse bien en Matemtica y en Fsica. Las calificaciones de una evaluacin de la siguiente nmina no son independientes.

Estudiante Matemtica Fsica

84 55 85 98 80 55 80 64 91 85 84 57 90 97 74 53 75 63 90 82

a) Probar la hiptesis de que la puntuacin media en Matemtica es la misma que en Fsica contra la hiptesis alternativa de que son diferentes con el = 0,005. b) Determinar el intervalo de confianza del 95% para la verdadera diferencia de las medias.

329

Respuestas a los ejercicios de la Unidad IX


Puntos 1 al 5
1) Consultar el marco terico del mdulo y de la bibliografa 2) a) una cola b) error de tipo II y significa la probabilidad de aceptar H siendo falsa. c) No hay diferencia entre las medias. 3) a) Z = - 1,8 b) = 0,43 4) Z = 1,44 5) Z = 1,99

X CR = 81,3 Rechazar H
1 - = 0,57

(Test de 1 cola)

Aceptar H0 Aceptar H0

(Test de 1 cola) (Test de 2 colas)


1 84 0,95 0,05 83 0,85 0,15 81 0,43 0,57 78 0,02 0,98

6) Valores alternativos de C 1- Potencia

Punto 6
1) Consultar el marco terico del mdulo y de la bibliografa. 2) t = - 3,8 Rechazar H0 (Test de 1 cola)

3) 18,1 21,7 4) a) t = 3,03 Rechazar H b) 0,003 0,197 5) a) t = 1,19 Aceptar H b) -1,08 3,48 o 0 3,48
330

CHI CUADRADO

CARACTERSTICAS

APLICACIONES

Diagrama de Contenidos Unidad X

331

- BONDAD DE AJUSTE - TEST


DE INDEPENDENCIA

- PRUEBA DE HOMOGENEIDAD - PRUEBA DE LA VARIANZA POBLACIONAL

332

UNIDAD X LA DISTRIBUCIN JI CUADRADA (2)


1. Caractersticas de la distribucin
La funcin de densidad de probabilidad para ji cuadrada se representa matemticamente con la siguientes ecuacin: f (X2) = (k) (2)
(gl / 2) -1

(e-X2/2)

(30)

donde k depende slo de gl, es decir de los grados de libertad, 2 es ji cuadrada, y es la base de los logaritmos naturales. No se tratar el desarrollo de la ecuacin anterior, sino que se har referencia a las caractersticas de 2 que permitirn su aplicacin para la inferencia estadstica. Estas caractersticas son las siguientes:

1') 2 es una variable aleatoria que no puede asumir valores negativos. 2') La distribucin 2 tiene un slo parmetro: los grados de libertad (gl). 3') La distribucin 2 es continua y unimodal. Al igual que z y t, el rea bajo la curva 2 representa probabilidades. 4') La distribucin 2 tiene sesgo a la derecha. A medida que aumenta gl, el sesgo es menor, y se aproxima a una distribucin normal. 5') La media de 2 est dada por los grados de libertad, E ( 2) = gl. La varianza es el doble de los grados de libertad, Var (2) = 2 gl. 6') La ecuacin representa una familia de distribuciones. Hay una distribucin diferente para cada grado de libertad.
0.60 0.50 0.40 0.30 0.20 0.10 0 2 4 6 8 10 12 14 16

f (x )

=1

= 5 = 10
x
2

333

2. Uso de las tablas de 2


Ya se estableci que la curva 2 representa probabilidades. Para cada posible valor de gl puede construirse una tabla de probabilidades. No obstante, puede utilizarse la tabla 2. La tabla del Anexo III muestra los valores crticos 2 que se denota por 2(gl,a). El subndice tiene dos nmeros, gl indica los grados de libertad y a indica el porcentaje cortado bajo la cola superior de la distribucin. Las probabilidades ms comnmente utilizadas se consignan en el encabezamiento de la tabla, siendo representadas por el rea de la cola superior de la curva. En la columna izquierda se muestran los grados de libertad. El valor por una gl y para una probabilidad dada constituye el valor crtico 2 que corta la cola superior (o lado derecho) bajo la curva. Por ejemplo el valor 2 que corta el 5% de la distribucin con 8 grados de libertad es: 2(8,0,05) = 15,507

5%

5%

15,507

El grfico tambin muestra el valor que corta el 5% inferior del rea bajo la curva (o el 95% superior de la distribucin) con 8 grados de libertad. 2(8,0,95) = 2,732

3. Aplicaciones de 2
Existen problemas donde deben realizarse inferencias acerca de la distribucin de toda una poblacin en base a observaciones muestrales donde las hiptesis de las pruebas no son aseveraciones acerca del parmetro de una poblacin, sino verificar hiptesis tales como una moneda es
334

regular o las variables desempeo e instruccin son independientes. Los datos son categorizados y los resultados se muestran en forma de conteo. Por ejemplo, los salarios de los empleados de una compaa representados a travs de una tabla de frecuencias. Cada frecuencia se anota en una celda o clase. Las frecuencias observadas de la muestra se denotan por f01 f02, ....f0n. La suma de todas las frecuencias observadas es igual al tamao de la muestra, o sea:
f01 + f02 + .... + f0n = n Estos valores observados, se comparan con frecuencias esperadas o tericas fe1, fe2 + ... + fen que se obtienen de distribuciones tericas especficas, tambin en este caso: fe1 + fe2 + .... + fen = n La prueba consiste en determinar si las frecuencias observadas concuerdan o discrepan con las esperadas. El estadstico de prueba es:

=
2

(f0 . fe )2
fe

(31)

El numerador es la diferencia al cuadrado, la cual slo puede tomar valores positivos. Mientras menor sea la diferencia, menor ser el valor de 2. Los valores pequeos de 2 indican concordancia, mientras que los valores grandes indican discrepancia, entre los dos conjuntos frecuencias. Debe observarse que es comn que estas pruebas son de una sola cola. Los valores calculados del estadstico de prueba 2 se basan en datos discretos, pero la distribucin 2 es continua. Si las fe son grandes, la distribucin del estadstico de prueba puede aproximarse a la distribucin de 2. Una regla prctica es que la fe para cada clase debe ser por lo menos 5. Las categoras que no cumplen este criterio deben combinarse con otras adyacentes cuando sea posible. El estadstico de prueba (31) se utiliza para las pruebas de bondad de ajuste, de independencia y de homogeneidad. La distribucin 2 tambin se utiliza para probar el valor de un parmetro, como es la prueba de la varianza. (punto 3.4.)
335

3.1 Prueba para la bondad de ajuste


En esta prueba, H0 especifica una distribucin uniforme (todos los valores posibles de una variable aleatoria son igualmente probables), binomial, Poisson, etc. Se elige una muestra y se prueba si la distribucin muestral sigue a la distribucin terica especificada en H0. La hiptesis alternativa afirma que la muestra no ha sido tomada de la distribucin especfica. La prueba implica n observaciones que se clasifican en k clases o categoras, donde en cada celda se anotan las frecuencias observadas que se comparan con las esperadas a travs de los clculos, utilizando el estadstico de prueba de 2. El valor que se requiere de la estadstica 2 para rechazar o aceptar H0 depende del nivel de significacin y de los grados de libertad (gl). Para la prueba de bondad de ajuste, los grados de libertad son iguales al nmero de categoras o clases menos 1, es decir: gl = k - 1 (32)

Si el valor del estadstico de prueba es mayor o igual al valor crtico se dice que el ajuste es malo y se rechaza H0. Si el valor 2 es pequeo, se dice que el ajuste es bueno y se acepta H0.

Ejemplo: Una empresa dedicada a estudios de mercados est interesada en las preferencias de las amas de casa de 4 zonas de la ciudad respecto a una marca de arroz. Selecciona una muestra al azar de 200 amas de casas con los siguientes resultados: ZONA
Preferencias (f0)

A
35

B
43

C
64

D
58

TOTAL
200

Estas preferencias constituyen las frecuencias observadas. Bajo la hiptesis de que pA = pB = pC = pD todas estas probabilidades son iguales a 1/4. Entonces las frecuencias esperadas son cada una igual a 50 (1/4.200).

336

Planteando las hiptesis: H0: Las preferencias estn distribuidas de manera uniforme en las cuatro zonas. H1: Las preferencias no estn distribuidas de manera uniforme en las cuatro zonas. Las categoras son 4, por lo tanto los grados de libertad son 3, ya que: k=4 gl = k - 1 gl = 4 - 1 = 3

Utilizando un nivel de significacin del 5%, el valor crtico con 3 grados de libertad es: 2(3,0,05) = 7,814

7,814

Rechazar H0 si 2 es mayor o igual a 7,814. Los clculos para obtener 2 se muestran a continuacin:

Zona
A B C D

f0
35 43 64 58

fe
50 50 50 50

f0-f e
-15 -7 14 8

(f 0-f e) 2
225 49 196 64

f0-fe)2/ fe
4,5 0,98 3,92 1,28 10,68

=
2

(f0 . fe )2 = 10,68
fe

337

Como 2 es mayor que 7,814, se rechaza H0 es decir no hay uniformidad en las preferencias en las 4 zonas. En el clculo de las frecuencias tericas, puede haber restricciones adicionales. Si la media de la muestra X se utiliza para estimar para obtener las frecuencias esperadas, esta restriccin reduce el nmero de grados de libertad en 1. En general, si hay m estimaciones muestrales utilizadas para m parmetros desconocidos en el clculo de frecuencias tericas, el nmero de grados de libertad est an ms reducido por m, es decir: gl = k - 1 - m (33)

Ejemplo: una consultora desea demostrar que la distribucin de los ndices de accidentes de trabajo en empresas industriales es normal. Selecciona una muestra de 50 establecimientos y la distribucin de ndices se muestra en la siguiente tabla de frecuencias. Indices 1 - 1,5 1,5 - 2,0 2,0 - 2,5 2,5 - 3,0 3,0 - 3,5 frecuencias observadas (9) 6 10 18 9 7 50

Se calculan la media y el desvo tpico a travs de las frmulas estudiadas en el mdulo 3.

xf X= n

X = 2,3
2

(x x ) f S=
n 1
- Planteo de hiptesis

S = 0,60

H0: la distribucin de frecuencias tiene distribucin normal. H1: la distribucin de frecuencias no sigue una distribucin normal.

338

- El nmero de clases est dado por el nmero de intervalos, o sea k = 5. - Clculo de las frecuencias esperadas. Como se desconocen y , se utilizarn x como estimacin puntual de y S como estimacin de .
En primer lugar se debe encontrar la probabilidad de un valor de x dentro de los intervalos de clase. Como la normal es una distribucin de una variable continua que puede tomar valores de - a +, P(x < 1,0) y P(x > 3,5) no son igual a 0. Debido a que P0 = Pe = n, no pueden ignorarse las colas de la curva. Por lo tanto, las clases pueden definirse de la siguiente manera: Menos 1,5 2,0 2,5 3,0 y de 1,5 2,0 2,5 3,0 ms

Los lmites de clase se transforman a valores de z y se utiliza la para calcular las frecuencias tericas.

Desv.est.normal Li
- 1,5 2,0 2,5 3,0

Area de clase ZLs P(ZLi z Zls)


0,0918 0,2167 0,3208 0,2497 0,121 1,0000

Frec. esp. 50 (Area de Clase)


4,6 10,8 16,0 12,5 6,1 50,0 Ls = Lmite superior

Ls
1,5 2,0 2,5 3,0

ZLi

- -1,33 -1,33 -0,5 -0,5 0,33 0,33 1,17 1,17

* Li = Lmite inferior

* ZLi y ZLs son las desviaciones estndares normales.


ZL i = L i 2,3 0,6
339

ZL s =

L s 2,3 0,6

Por ej. ZLs en la primera clase


ZL s = 1,5 2,3 = 1,33 0,6

* P (ZLi Z ZLs) representa el rea de la clase. Por ejemplo la probabilidad para el rea de la primera clase.

-1,33

Area entre 0 y -1,33 = 0,4082 segn tabla 4 Area entre - y 1,33 = 0,5 - 0,4082 = 0,0918 P (- z 1,5) = 0,0918 * Las frecuencias tericas se obtienen multiplicando n por el rea de la clase. n . P (ZLi Z ZLs) La frecuencia esperada de la 1 clase es: 50 (0,0918) = 4,59 = 4,6

- Grados de libertad. Recordar que:


gl = k - 1 - m k = es el nmero de clases m = es el nmero de parmetros a estimar

340

En nuestro ejemplo: k=5 m = 2, ya que son dos los parmetros desconocidos a estimar y . Por lo tanto: gl = 5 - 1 - 2 = 2 grados de libertad.

- Determinacin del nivel de significacin ( )


Para esta prueba = 0,05

- Valor crtico
Para X22,0,05 = 5,991

- Regla de decisin
Rechazar H0 si X2 5,991 Aceptar H0 si X2 5,991

- Clculo de X2
Frecuencias Observadas (f0 ) 6 10 18 9 7 50 Frecuencias Esperadas (fe ) 4,6 10,8 16,0 12,5 6,1 50,0 X2 = 1,848 (f0 -fe ) 2 1,96 0,64 4 ,00 12,25 0,81 0,426 0,059 0,25 0,98 0,133 1,848
2 f0 fe fe

341

Como X2 es menor que el valor crtico, se acepta H0, lo que indica que la distribucin de frecuencias sigue una distribucin normal. Considrese el siguiente problema. Un estudio sobre la propiedad de parcelas de tierra es una zona durante un perodo de 10 aos proporcion la siguiente informacin. Cuando una parcela cambia de dueo debido a un juicio hipotecario o abandono se clasifica como traspaso. Una muestra de 50 parcelas aport los siguientes datos. Nmero de Traspasos (x) 0 Nmero de Parcelas (f0) 6 1 9 2 3 4 7 5 4 6 2 7 2 8 1 9 0 = 50

11 8

Se plantea la hiptesis de que la distribucin de traspasos se ajusta a una distribucin de Poisson. - En primer lugar se determinar el valor de l para probar la hiptesis.

X=

x . f0 137 = = 2,74 n 50

x = = 2,7

- Luego, se obtendrn las frecuencias esperadas con base a la distribucin de Poisson con = 1,8.

Nmero de Traspasos (x)


0 1 2 3 4 5 6 7 8 9

P (x) con =2,7 (tabla 3)


0,0672 0,1815 0,2450 0,2205 0,1488 0,0804 0,0362 0,0139 0,0047 0,0014

Frecuencias
e s p e r a d a s ( f

n.P (x)
3,4 9,1 12,3 11,0 7,4 4,0 1,8 0,7 0,2 0,1 50,0

342

(*) Diferencia por redondeo de datos. - Con la informacin obtenida se plantean las hiptesis: H0: La distribucin de traspasos se ajusta a una distribucin de Poisson. H1: La distribucin no se ajusta a la distribucin de Poisson.

X
0 1 2 3 4 5 6 7 8 9 6 9 11 8 7 4 2 2 1 0

f0
15

fe
3,4 9,1 12,3 11,0 7,4 4,0 1,8 0,7 0,2 0,1 12.5

2 f0 fe fe

0,5 0,001 0,137 0,818 0,022

6,8 0,712

2,189 X2 = 2,189 Obsrvese que para cumplir el requisito de que cada fe sea de cuando menos 5, se combinaron las dos primeras y las cinco ltimas categoras por lo que K = 5 Como se estima el parmetro gl = k - m - 1 gl = 5 - 1 - 1 = 3 en base a una muestra, gl = 3, ya que:

- Si se utiliza un nivel de significacin del 1%, el valor crtico es X23,0,01 = 11,3449. Como la regla de decisin es:

343

Rechazar H0 si X2 > 11,3449 Aceptar H0 si X2 < 11,3449 Se acepta H0, por lo tanto la distribucin de traspasos de las parcelas se ajusta a una variable con distribucin de Poisson.

344

Actividad N 41
Ejercicios del punto 1
1) El nmero de accidentes fatales en una ruta durante una semana se distribuye de la siguiente forma:

Da N de accidentes

J
8

28 12 10 7

11 24

Probar la hiptesis de que tanto, el sbado como el domingo tiene el 25% y cada uno de los otros 5 das el 10% de todos los accidentes fatales con = 0,025. 2) Un fabricante de heladeras ofrece tres lneas bsicas de su producto que pueden describirse en trminos comparativos de su precio como bajo, intermedio y alto. Antes de llevar a cabo una campaa de promocin para resaltar las virtudes de las heladeras de precio alto, los porcentajes de ventas de las 3 categoras eran de 45%, 30% y 25%. De una muestra aleatoria de 50 heladeras que se vendieron despus de la promocin, el nmero de productos que se vendieron en cada categora fue 15, 15 y 20. Probar la H0 de que el patrn histrico de ventas no difiere del patrn histrico, utilizando el 5% como nivel de significacin. 3) Se desea probar si la distribucin de jornales de operarios de una industria es normal. Una distribucin de frecuencias de jornales de 40 operarios, elegidos aleatoriamente, es la siguiente:

Jornales ($) 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60

N de operarios 6 10 14 7 3 40

Utilizar con = 0,01 para probar la hiptesis.

345

3.2 Test de Independencia


En los tests de independencia existen dos variables categricas y la prueba consiste en suponer que ambas variables son estadsticamente independientes. La independencia implica saber que la categora en la que se clasifica una observacin con respecto a una variable, no tiene ningn efecto sobre la probabilidad de caer tambin en alguna de las diversas categoras de las otras variables5. Dicho de otra manera, el problema es determinar si existe alguna relacin entre dos conjuntos de atributos de una poblacin. La prueba X2 de independencia tiene una metodologa parecida a la prueba de bondad de ajuste. La misma se explicar con el siguiente problema. En una empresa se desea conocer si hay alguna relacin entre la asistencia de los empleados y el sexo. La asistencia se clasifica en satisfactoria (S) y no satisfactoria (NS). Para la prueba se toma una muestra de 100 empleados. 1') Planteo de Hiptesis H0: Sexo y Asistencia son variables independientes. H1: Sexo y Asistencia son variables dependientes. 2') Las frecuencias observadas de la muestra se anotan en una tabla de contingencia (o de clasificacin doble) de dimensin r . k, donde: r = el nmero de renglones. k = el nmero de columnas.

Sexo Asistencia
S NS Total

V
45 15 60

M
25 15 40

Total
70 30 100

5. Kazmier, Leonard: "Estadstica Aplicada a la Economa y Administracin". Ed. Mc. Gral. Hill.
346

La tabla tiene dos categoras de rengln (V y M) y dos de columnas (S y NS), por lo tanto es una tabla de 2 x 2. 3') Las f0 deben compararse con las frecuencias esperadas. La fe de cada celda de la tabla debe ser proporcional al total de f0 es la frecuencia total del rengln y fk es la frecuencia total de la columna, la frecuencia esperada se determina como:

f0 =

fr . fk n

(33)

La tabla de frecuencias esperadas para el problema del ejemplo queda confeccionada as:

Sexo Asistencia
S NS Total

V
42 18 60

M
28 12 40

Total
70 30 100

La fe de la primera celda (S y V) se obtiene:

fe =

(60)(70 ) = 42
100

4') Los grados de libertad para la prueba de independencia se determinan por la siguiente frmula: gl = (r - 1) (k - 1) Para este problema r = 2 y k = 2 gl = (2-1) . (2-1) = 1 5') Si se usa a = 0,05, el valor crtico es: X2(1,0,05) = 3,841, por lo tanto la regla de decisin es: (34)

347

Rechazar H0 si X2 3,841 Aceptar H0 si X2 < 3,841 6') El estadstico de prueba es el mismo que se utiliz para la bondad de ajuste o sea: X =
2

(f0 fe )2
fe

En este caso, se eleva el cuadrado la diferencia entre f0 y fe de cada celda y se divide entre la fe de dicha celda.

( 45 42 )2 (25 28 )2 (15 18 )2 (15 12 )2 = + + + = 1,789


42 28 18 12

X2 = 1,786 es menor que el valor crtico. Se aceptar H0 y se demuestra que la asistencia y el sexo son independientes, es decir no hay ninguna relacin.

3.3 Prueba de Homogeneidad


Esta prueba para X2 es una extensin del test de independencia donde tambin se trabaja con datos clasificados cruzadamente y se utiliza el mismo estadstico de prueba. Las diferencias entre ambas pruebas son las siguientes: 1) Las pruebas de independencia tienen como objetivo decidir si dos variables son independientes, mientras que las pruebas de homogeneidad se aplican cuando se desea saber si diferentes muestras provienen de la misma poblacin. 2) El test de independencia supone una sola muestra obtenida de una sola poblacin; la prueba de homogeneidad suponen dos o ms muestras independientes, donde cada una procede de cada una de las poblaciones distintas bajo estudio. 3) El aspecto anterior implica que en la prueba de independencia, todas las frecuencias marginales son cantidades al azar, mientras que en el criterio de homogeneidad, los totales de los renglones (o filas) son tamaos de muestras que son nmeros elegidos.

348

Considrese el siguiente problema. Los tcnicos de un establecimiento que fabrica fiambres y embutidos deben decidir la adopcin de un nuevo proceso para elaborar jamn cocido tipo A. Eligen 200 piezas obtenidas mediante le proceso nuevo y 200 mediante el proceso tradicional. Los resultados son:

Piezas Proceso
Nuevo (a) Tradicional (b) Total

(1) Defectuosos
22 36 58

(2) Buenas
178 164 342

Total
200 200 400

La hiptesis nula puede plantearse como que las dos muestras proceden de la misma poblacin, es decir que las dos clasificaciones son homogneas en lo que respecta al estado de las piezas. Esto significa que no hay diferencia entre los dos mtodos. S se define: p1a: probabilidad p2a: probabilidad p1b: probabilidad p2b: probabilidad p1a = p1b H0 p2a = p2b Con la expresin alternativa de H0 se puede determinar porque se denomina homogeneidad. Al decir homogneas se entiende que las cosas son iguales o tiene algo en comn. Ahora, se estiman las proporciones de defectuosas y buenas, es decir: 58/400 y 342/400. Las frecuencias esperadas, por ejemplo, para el mtodo nuevo son:
349

de de de de

nuevo y defectuoso nuevo y buena tradicional y defectuosa tradicional y buena.

(7)

58/400 (200) = 29

342/400 (200) = 171

Las frecuencias esperadas se muestran en el siguiente cuadro:

Piezas Proceso
Nuevo (a) Tradicional (b) Total

Defectuosos
29 29 58

Buenas
171 171 342

Total
200 200 400

En resumen:
p1a = p1b H0 p2a = p2b H1: alguna igualdad no se cumple. Los mtodos son diferentes. Los grados de libertad son: gl: (r-1) (k-1) gl: (2-1) (2-1) = 1 Si = 0,01, entonces el valor crtico de X2 = 6,634, por lo tanto: Rechazar H0 si X2 6,634 Aceptar H0 si X2 < 6,634 Aplicando el estadstico de prueba: Los mtodos son iguales

X =
2

(f0 fe )2
fe

7. fe = fr fk/n

350

( 22 29 )2 (178 171)2 (36 29 )2 (164 171)2 = + + + = 3,952


29 171 29 171

X2 = 3,952 Se acepta H0.

351

Actividad N 42
Ejercicios del punto 2
1) Un centro Comercial tiene 5 divisiones. De una muestra aleatoria de 500 clientes se obtuvo la siguiente clasificacin doble:

DIVISION DE COMPRAS
Tipo de Pago Contado efectivo Contado Cheque Tarjeta de crdito Cuenta Corriente Total Ropa y Comes- ElectroBazar Juguetes Total Calzado tibles domstico 10 15 5 5 15 50

20

15

15

60

70

75

25

20

50

240

50

45

15

10

30

150

150

150

10

50

100

500

Con un nivel de significacin del 0,05, son tipo de pago y tipo de compra independientes? 2) Se eligen 3 muestras aleatorias de docentes de los 3 nivel. La primera contiene 300 docentes de nivel primario; la segunda contiene 200 de nivel medio, y la tercera, 100 de nivel superior. A cada docente se le pide una opinin sobre la reforma educativa y las opciones son a favor y en contra muestral.

352

Docentes

A Favor 182 68 32 282

Neutral

En Contra 33 72 15 120

Total

Nivel Primario Nivel Medio Nivel Superior Total

85 60 53 198

300 200 100 600

Probar con un nivel de significacin del 0,05, si hay uniformidad en las opiniones.

3.4 Prueba de una varianza de la poblacin


Para una poblacin con distribucin normal, el estadstico de prueba

( n 1) S 2 =
2

(36)

se distribuye como X2 con (n-1) grados de libertad. Como n y 2 son constantes, la distribucin muestral de S2 est asociada con distribucin X2 cercanamente. A partir de S2, puede probarse la hiptesis para una varianza poblacional aplicando ji cuadrada. La prueba puede ser de una cola o de dos colas y las hiptesis pueden plantearse H0: 2 = 02 H1: 2 > 02 H1: 2 < 02 H0: 2 = 02 H1: 2 02

Desde luego, H0 puede tambin ser una hiptesis inexacta como H0: 2 02 o H0: 2 02 .

353

Dado un nivel de significacin () y especificando los grados de libertad se puede tomar la decisin comparando el valor del estadstico de prueba con el valor crtico.

Ejemplo: los salarios de los empleados de una compaa se distribuye normalmente. Se afirma que la desviacin tpica de la poblacin no es superior a $100. Una muestra de 15 salarios dio como resultado una media de $670 y un desvo tpico (S) de $125.
Probar la hiptesis con = 0,05 de que 2 es mayor que 02 H0: 2 10.000 gl = 15 -1 = 14 X214,0,05 = 23,68 H1: 2 > 10.000

23,684

Rechazar H0 si X2 23,684 Aceptar H0 si X2 < 23,684

X2 =

14 (15.625 ) = 21,875 10.000

Se acepta H0. Considrese el problema anterior suponiendo que la varianza poblacional es igual a 100 y se desea probar que 2 es distinto de 100. En este caso se plantea una hiptesis de dos colas. H0: 2 = 100 H1: 2 100

Para = 0,05 y gl = 14, los valores crticos son: X214,0,025 = 26,118 y X214,0,975= 5,628

354

10%

26,118

Rechazar H0 si X2 26,118 o X2 5,628.

X2 =

14 (15.625 ) = 21,875 10.000

Se acepta H0.

Construccin del intervalo de confianza para estimar


El estadgrafo S2 es un buen estimador de 2 , por lo tanto el intervalo de confianza (1- ) para estimar 2 se obtiene:

(n 1)S 2 2 (n 1)S 2
X2 gl, X2 gl,

(37)

Ejemplo: Estimar la varianza poblacional para la distribucin de salarios con base a la varianza muestral S2 = 15.625 con el 95% de confianza.

14 (15.625 ) 2 14 (15.625 ) 26,118 5,628 8.375,45 2 38.868,16 91,52 197,15

355

ACTIVIDAD OBLIGATORIA
Ejercicios punto 3
1) Cuando un proceso de produccin est funcionando adecuadamente, la varianza de las medidas de las unidades producidas es de 4 cm. Se sugiere que el proceso de produccin se encuentra ahora fuera de control. Se selecciona una muestra de 7 unidades producidas y se obtiene las siguientes medidas en centmetros. 9 a) Obtener S2. b) Probar la hiptesis de que el proceso de produccin sigue funcionado adecuadamente, con = 0,05. c) Determinar el intervalo de confianza del 95% para estimar 2 . 2) Una fbrica de neumticos para camiones afirma que la duracin media de los productos es de 26.000 km y un desvo tpico de 340 km. Sin embargo, se sospecha que la variabilidad aument. Se toma una muestra de 16 neumticos, se prueban bajo ciertas condiciones hasta que se desgastan y se encuentra que la media se mantiene, pero el desvo es de 350 km. a) Probar la hiptesis con = 0,10. b) Determinar el intervalo de confianza con el 90% para estimar 2. 10 13 12 8 6 12

356

Respuestas a los ejercicios de la Unidad X


Punto 1
1) 2 = 14,45 2) 2 = 7 3) 2 = 0,24 Aceptar H0 Aceptar H0 Aceptar H0

Punto 2
1) 2 = 25,8 2)2 = 77,5 Rechazar H0 Rechazar H0

(Prueba de independencia) (Prueba de homogeneidad)

Punto 3
1)a) b) c) S = 6,33

2 = 9,495 Aceptar H0 2,63 2 30,69 2 = 15,89

2)a) b)

Aceptar H0

82362,17 2 214.912,28 286,99 463,59

357

358

APNDICES

359

360

Apndice 6
Tabla de nmeros aleatarios

361

Apndice 7
Valores porcentuales de la distribucin t

362

Apndice 8
Valores porcentuales de la distribucin X2

363

364

FICHA DE EVALUACIN MDULO NICO


Sr. alumno/a:

El Instituto de Educacin Abierta y a Distancia, en su constante preocupacin por mejorar la calidad de su nivel acadmico y sistema administrativo, solicita su importante colaboracin para responder a esta ficha de evaluacin. Una vez realizada entrguela a su Tutora en el menor tiempo posible.
1) Marque con una cruz

MDULO 1. Los contenidos de los mdulos fueron verdadera gua de aprendizaje (punto 5 del mdulo). 2. Los contenidos proporcionados me ayudaron a resolver las actividades. 3. Los textos (anexos) seleccionados me permitieron conocer ms sobre cada tema. 4. La metodologa de Estudio (punto 4 del mdulo) me orient en el aprendizaje. 5. Las indicaciones para realizar actividades me resultaron claras. 6. Las actividades propuestas fueron accesibles. 7. Las actividades me permitieron una reflexin atenta sobre el contenido 8. El lenguaje empleado en cada mdulo fue accesible.
CONSULTAS A TUTORIAS

En gran medida Medianamente Escasamente

SI

NO

1. Fueron importantes y ayudaron resolver mis dudas y actividades. 2) Para que la prxima salga mejor... (Agregue sugerencias sobre la lnea de puntos) 1.- Para mejorar este mdulo se podra ................................................................................................................................
.......................................................................................................................................................................................................

3) Evaluacin sinttica del Mdulo.


.......................................................................................................................................................................................................

Evaluacin: MB - B - R - I 4) Otras sugerencias.............................................................................................................................................................


.......................................................................................................................................................................................................

365