Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Castegnaro
3. ETICA EN LA ESTADISTICA
5. ALFABETO GRIEGO
6. NORMAS IRAM
9. BIBLIOGRAFIA UTILIZADA
0
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Ju. 17/05/2018
Lu. 21/05/2018 TEST DE HIPOTESIS
10 Mi. 23/05/2018 TEST DE HIPOTESIS
Ju. 24/05/2018 TEST DE HIPOTESIS
REGRESIÓN LINEAL. DIFERENCIAS CON CORRELACION.
Lu. 28/05/2018
SUPUESTOS DE LA REGRESIÓN
11 Mi. 30/05/2018 EL MODELO DE LA REGRESIÓN LINEAL. TABLA ANOVA
Ju. 31/05/2018 REGRES. LINEAL
Lu. 04/06/2018 REGRES. LINEAL
12 Mi. 06/06/2018 SERIES CRONOLOGICAS
Ju. 07/06/2018 SEGUNDO PARCIAL
FECHAS DE REMANENTES
Inscripción en el sistema interactivo Rinden entre las fechas:
TURNO: MARZO==> 7 Y 8 MARZO 20 DE MARZO A LAS 9.00 HS
TURNO: MAYO==> 2 Y 3 MAYO 14 AL 18 DE MAYO
TURNO: AGOSTO==> 8 Y 9 AGOSTO 27 A 31 AGOSTO
TURNO:OCTUBRE==> 3 Y 4 OCTUBRE 16 AL 22 OCTUBRE
TURNO: DICIEMBRE==> 21 Y 22 NOVIEMBRE 10 A 14 DICIEMBRE
Contenido Teórico
2
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Actividad: Autodiagnóstico
Consideración importante
Excel en Estadística
NOTA IMPORTANTE
CIERTOS CONTENIDOS Y LOS EJERCICIOS ESCOGIDOS DE LA BIBLIOGRAFÍA CITADA EN
ESTA GUÍA (VER REFERENCIAS BIBLIOGRAFICAS) HAN SIDO REPRODUCIDOS EN LA
PRESENTE GUÍA.
ASIMISMO, ALGUNOS CONCEPTOS TEÓRICOS HAN SIDO EXTRACTADOS DE SU LIBRO
ORIGEN (Kurincic, Gabriela; Loureiro de Pérez, Emma; Levin Balderas, del Valle y otros.)
MI RECONOCIMIENTO
Se agradece toda la colaboración al PROF. ACTUARIO FÉLIX FRANCO quien fuera mi Profesor en
mi época de estudios en la carrera de Ciencias Económicas y quien me brindara colaboración a
posteriori y muchísimo material de lectura y de apoyo didáctico para el curso junto a largas charlas, lo
que me ha dado un crecimiento en la materia, como así también se agradece al Prof. Act. Juan Ramón
Garnica Hervas por todo su apoyo, confianza, recomendaciones y material brindado.
A todos los alumnos con quienes compartiendo cursos e inquietudes seguimos mejorando esta guía
para beneficios de la comunidad educativa.
Para los profesionales de Ciencias Económicas, La matemática aislada, carece de sentido. Necesitamos
experimentarla en la realidad, justificarla como una necesidad para analizar e interpretar los hechos.
Como matemática aplicada a problemáticas especiales, para comprender la realidad, le damos sentido
a lo que enseñamos y por qué lo enseñamos.
3
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
4
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
ETICA Y ESTADISTICA
Objetivos del Aprendizaje Reconocer los aspectos éticos en el manejo de la información estadística a partir de las consideraciones
tratadas en cada una de las unidades temáticas.
REFERENCIAS BIBLIOGRÁFICAS……………………………………………..
ALFABETO GRIEGO…………………………………………………………...
NORMAS IRAM…………………………………………………………………
TABLAS ESTADÍSTICAS.……………………………………………………...
5
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Los datos son valores correspondientes a los atributos o propiedades que identifican y describen a cada
unidad de análisis, unidad experimental
Pueden ser de dos tipos: cualitativos y cuantitativos cuando además permiten establecer las diferencias
entre los valores en cantidad y grado.
Este conjunto de datos cuando son procesados se transforman en información para ser utilizada en la
toma de decisiones.
La Estadística podemos decir que en principio permite recolectar los datos de las unidades de análisis para
que a través de un proceso se pueda transformarlos en información y ser tomados para decisiones en
condiciones de incertidumbre.
Los datos se recolectan por alguna inquietud, para probar alguna conjetura, para investigar.
En general, se dice que las razones básicas para recolectar los datos son:
satisfacer una curiosidad
medir el desempeño de un proceso de producción, relacionado con la evaluación, control de calidad
cursos de acción alternativas para ampliar la toma de decisiones
satisfacer una curiosidad
decisiones sobre causas-efectos
Es el investigador el que está en contacto con esos datos como fuente de su investigación. La palabra
investigación proviene del latín Investigare, en inglés, Research y refiere a un conjunto de pasos, por eso
remite a un proceso cuidadoso, sistemático y empírico para conocimiento.
Como dice Sampieri en su libro Metodología de la Investigación han surgido distintas corrientes de
pensamiento para la búsqueda del conocimiento, polarizándose en dos muy diferenciados enfoque, el
6
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
cualitativo y el cuantitativo. Según la procedencia del profesional que tiene la investigación se apoya en
uno u otro enfoque. Pero, se trata de un proceso cuidadoso, sistemático y empírico en un esfuerzo para
generar conocimiento, cada uno de los enfoques tienen sus propias características que lo llevara a realizar
observaciones, recoger datos con distintas técnicas, compilar y evaluar el fenómeno objeto de estudio.
Sin embargo, entre ambos hay un tercer tipo de investigación el enfoque mixto.
Enfoques de
Investigación
- El enfoque cualitativo: es aquel conjunto de prácticas interpretativas, que utiliza los datos
recolectados sin medición numérica para descubrir o afinar preguntas de investigación en un
proceso de interpretación. Es decir que se basa en un proceso inductivo –de lo particular a lo
general de explorar y describir-.
Acá la realidad se define a través de las interpretaciones de los participantes en la investigación
respecto de sus propias realidades.
En este enfoque la reflexión es el puente que vincula la investigación con los participantes. Se dice
que es holista y sin pretensión de generalizar
La recolección de datos es no estandariza –subjetiva-.
- El enfoque cuantitativo: es aquel que utiliza los datos recolectados para probar hipótesis, con base
en la medición numérica y el análisis estadístico para establecer patrones de comportamiento y
probar teorías. Pretende generalizar los resultados.
Esos datos del mundo real se miden (Sampieri & Otros, 2006, pp. 5-6) y le cabe dos tipos de análisis
estadístico a través de:
o la estadística descriptiva que permite obtener información sobre las características de los
datos y,
o la estadística inferencial que permite poner a prueba las hipótesis del investigador.
Datos
Estudio Datos Textos.
secundarios Trabajo de
Censo Experimento Observaciona secundarios Diarios.Histor Ensayos
de campo
l estadísticos ias de vida
documentos
Nos interesa conocer las etapas de investigación cuantitativa que hace uso de la estadística.
En este curso de Estadística observamos que los saberes y técnicas que nos suministra nos
permitirán abordar el tipo de enfoque cuantitativo, utilizando las técnicas que le son propias para
la recolección de datos.
8
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
• Idea de investigación
Fase 1
• Alcance de estudio
Fase 4
Los diferentes tipos de estudios aplicando la estadística que se pueden realizar son:
o Estudio exploratorio: investiga un problema poco estudiado, del que se sabe poco; indagan en
forma innovadora, ayuda a identificar conceptos o preparan para oros estudios, describen.
o Estudio descriptivo: busca identificar propiedades, características, perfiles de personas, grupos,
objetos, procesos o cualquier otro fenómeno que se somete a análisis. Por lo que miden concepto,
describen tendencias de un grupo o población.
o Estudio correlacional: asocia variables con el propósito de conocer la relación que existe entre dos
o más conceptos, categorías o variables en un contexto en particular, midiendo el grado e
asociaciones entre las mismas. Tiene un valor explicativo, aunque parcial. Tiene que haber cuidado
en el investigador en determinar en esa relación una aparente asociación de las variables que en
realidad no es así, llevando a correlaciones espurias.
Este tipo de estudio ofrece predicciones, explican la relación entre variables y cuantifican relaciones
entre variables.
o Estudio explicativo: pretende establecer las causas de los eventos , sucesos o fenómenos que se
estudian, por lo que van más allá de la descripción
o Estudio de diferencias entre grupos
En este enfoque cuantitativo el investigador es neutral, pues deja de lado sus propios valores,
creencias y con procedimientos rigurosos y objetivos hace el estudio distanciado físicamente y
también distanciado psicológicamente del fenómeno de investigación.
Ahora, la pregunta ¿Qué es la estadística? pues resulta que es útil para la investigación.
Ante la pregunta, además de constituir una herramienta para investigar ¿de qué se ocupa la
estadística?
9
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
¿QUE ES LA ESTADÍSTICA?
La Estadística
como disciplina científica
es el conjunto
de métodos sistemáticos
que se aplican a la
a. Recopilación
b. Presentación
c. Análisis e
d. Interpretación
de los datos
Para poder abordar los conocimientos de ambas ramas es necesario pasar por la Probabilidad.
En el campo curricular, la estadística como asignatura brindada en los cursos de las carreras de Ciencias
Económicas responde a necesidades concretas, destinado a resolver situaciones específicas, cuyo objetivo
es brindar una estadística aplicada, a diferencia de la estadística matemática más propia de estadística
II, en una sola materia que concentra diferentes contenidos en amplitud dada la riqueza de conocimientos
que contiene el programa de la asignatura.
Por eso, de ciencia abstracta ser estudiada como ciencia fáctica o empírica que toma los conocimientos
de origen matemático para ser usados en forma instrumental a la resolución de determinados problemas
en determinados contextos.
Aplicaciones
Las aplicaciones concretas de los conocimientos de estadística a las siguientes áreas:
Contabilidad/Auditoría: en la selección de muestras para evaluar la razonabilidad de EECC
Administración : descripción y características de la población
Producción: control de calidad
Economía: en los pronósticos de inflación, tasas de interés y desempleo
Finanzas: en los pronósticos, evaluación de proyectos y volatilidad de los mercados
Gubernamental: Censos
Mercado Investigación de mercado.
Probabilidad: Tipos
Distribucione de
Recolección de Datos
muestreo
Variables Aleatorias
Regresión Lineal
Simple
Presentación de Datos Distribuciones de Estimación de
en Tablas y Gráficos Probabilidad Discretas Intervalo de Confianza Números Indices
Series Cronológicas
Distribución Normal
Medidas Descriptivas
Cuantitativas o Prueba de Hipótesis
Numéricas Otras Distribuciones
Continuas
11
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Comparación de dos Pruebas para la diferencia en las Prueba Z para la diferencia entre
medias de dos poblaciones dos proporciones
grupos
independientes Prueba de Chi Cuadrada para la
Prueba de Prueba F para la diferencia dif. entre dos prop.
entre dos varianzas
Comparación de más Análisis de varianza de una vía Prueba de Chi cuadrado para la
diferencia entre más de dos
de dos grupos
proporciones
12
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
ESTADISTICA DESCRIPTIVA
ETAPAS DE LA ESTADISTICA DESCRIPTIVA
ETAPA 3
ETAPA 1
ETAPA 2
DE PRESENTACIÓN DE DATOS
DATOS DE ANÁLISIS E
INTERPRETACIÓN
•ENCUESTAS DATOS
•OBSERVACIÓN •TABLAS
•EXPERIMENTACIÓN •GRAFIC0S
Fuentes Secundarias
PRECISAS Y
¿Le gusta a Ud. el deporte? Le gusta usted el deporte verlo en TV,
COMPRENSIBLES VAGUEDAD escucharlo en radio o prácticarlo? y de
DE los términos qué deporte se trata?
¿Votará usted en las próximas, elecciones? En las próximas elecciones para elegir
Presidente…del día ….¿piensa ir a votar?
¿Es estable su empleo? Múltiples ¿Es estable en su empleo, considerando
significados: que tiene 1 año o más en el mismo?
caract. De la
-Ha asistido recientemente al cine? temporalidad
(que es reciente: 1 semana, 1 mes, ) ¿qué es estable? Durante las últimas 2 semanas ha ido Ud.
¿qué es reciente al cine?
¿qué edad es
-Ha trabajado desde joven? joven? -A partir de que edad empezó a trabajar?
13
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2 BREVES (CONCISAS) Como Ud. sabe el próximo …. serán las DEMASIADAS En las próximas inscripciones del
inscripciones a las materias virtuales, nueva PALABRAS 2°Cuatrimestre a cursos virtuales ¿piensa
modalidad de distancia en nuestra FCE ¿piensa inscribirse?
Ud. acudir a la inscripción de materias virtuales
para el segundo cuatrimestre de este año?
VOCABULARIO DIRECTO, ¿ pernocta Ud. cerca de la Facultad? Vocabulario ¿Vive cerca de la Facultad a menos de 10
SIMPLE Y FAMILIAR PARA no familiar cuadras?
LOS PARTICIPANTES
3 NO DEBEN INDUCIR A ¿Acostumbra a ingerir algún tipo de bebida? Incomoda la Algunos de sus amigos acostumbran
RESPUESTAS verdad de la consumir algún tipo de bebida
(PREGUNTAS INCÓMODAS) respuesta alcohólica?
Y luego, preguntar
¿Cuál es su tipo de bebida favorita?
4 . NO DEBEN INDUCIR A una ¿Son los trabajadores argentinos poco Tendenciosa ¿Qué tan productivos son los trabajadores
determinada RESPUESTA productivos? argentinos? Sumamente productivos- Más
(PREG. TENDENCIOSAS) bien productivos-Más bien
improductivos- Sumamente
improductivos.
¿Suele tener tiempo para leer el diario? Y
¿Acostumbra a leer el diario? luego: ¿Con qué frecuencia?
5 NO PUEDEN APOYARSE EN El Gobierno Nacional entregó planes conectar Tendenciosa. ¿Considera beneficioso la entrega de
INSTITUCIONES porque considera que beneficia a una mejor computadoras para la educación en un
educación ¿Considera Ud. que es beneficioso? plan de ayuda?
6 PREG. Con Considera que la mayoría de las mujeres que NEGACION Considera que la mayoría de las mujeres
NEGACIONES:EVITARLAS están casadas preferiría no trabajar? prefieren estar en sus casas?
Objetivo: Identificar la fuente de Datos, para ello indique Cuáles de los siguientes procedimientos
será considerado “Experimento” “Encuesta” o “Estudio Observacional u Observación Directa”
Experimento Encuesta
Un sondeo político de intenciones de voto individuales en las próximas elecciones
Clientes de un centro comercial que serán entrevistados acerca del motivo por el
cual compran allí en Unicentro.
Comparación de dos métodos para comercializar una póliza anual de seguro
mediante la aplicación de cada método en áreas geográficas comparables.
14
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Características:
Características: Características: Características:
Son el tipo de datos que responden a preguntas del tipo ¿Dónde vivis? ¿cuál es tu sexo? cuyas variables si
se lo pondrían una denominación podría ser del estilo de “Zona de Residencia” “Sexo”.
Las respuestas son los datos que respectivamente se registran en categorías y luego se presenta su frecuencia.
16
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
ETAPA 3
ESTADISTICA DESCRIPTIVA
–DATOS CUANTITATIVOS : DISCRETOS-
ORGANIZACIÓN, PRESENTACIÓN y DESCRIPCIÓN DE LOS DATOS SIN AGRUPAR
1.1) Defina la Variable en Estudio y Organice los datos y especifique los valores en una “Tabla de
distribución”
1.2) Grafique los resultados de las Frecuencias absolutas simples en un gráfico de bastones.
1.3) Grafique los resultados de las Frecuencias absolutas acumuladas en un gráfico escalonado.
1.4) En una tabla complete la distribuc. de frecuencias relativas de la variable “N° de materias aprobadas”
1.5) Determine el porcentaje de alumnos que tienen: a. exactamente 2 materias aprobadas
b. a lo sumo 2 materias aprobadas
c. al menos 2 materias aprobadas
1.6) Integre las medidas estadísticas media, varianza, desvío, tanto poblacional como muestral
Rta.: a) 0,20 b) 0,35 y c) 0,85 media: 2,9; varianza poblac: 1,39; muestral 1,463157895; desvio poblacional: 1,178982612
y muestral: 1,209610638
2) El gerente de personal determinó que los 19 empleados de la Planta de Ezeiza han faltado en el término
de un año el siguiente número de días.
5,10,10,8,10,17,12,8,16,6,15,6,5,7,10,6,16,5 y 8
2.1 Defina la Variable de interés para el estudio. ¿Qué puede concluir o interpretar con estos datos?
2.2. Calcule la media aritmética, geométrica, la moda y la mediana Rta:
2.3. Calcule la amplitud de la variación, la desviación media Media 9,47368421
2.4. Calcule la varianza, el desvío estándar y el coeficiente de variabilidad Error típico 0,9188361
2.5 Comente los resultados devueltos por Excel y sus cálculos. Mediana 8
Moda 10
Desviación estándar 4,00511369
La devolución de los valores En Excel Varianza de la muestra 16,0409357
La devolución de los valores En SPSS Rango 12
Mínimo 5
Máximo 17
17
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
3) Cuando el gerente de personal decide hacer el relevamiento completo de la empresa, le falta incluir a la
Planta de Ezeiza las ausencias de la Planta Matriz ubicada en San Isidro conformada por 31 empleados. Por
lo tanto, recogido los datos, en esta Planta Matriz las ausencias han sido:
1,1,5,8,9,11,12,16,14,15,11,12,5,8,4,9,23,12,20,21,21,22,23,24,2,1,9,6,20,31,15
TRATAMIENTO CUANTITATIVO
MEDIDAS DESCRIPTIVAS O MEDIDAS ESTADISTICAS
Una descripción informativa de cualquier conjunto de datos está dada por la frecuencia de repetición u arreglo
distribucional de las observaciones en el conjunto.
El número de observaciones en una clase recibe el nombre de frecuencia absoluta de esa clase. También resulta
interesante y funcional para determinadas medidas estadísticas trabajar con frecuencia acumulada u ojiva.
A partir de una organización por tablas y una presentación por gráficos se puede descubrir patrones de distribución
ocultos en el conjunto de datos. Además se pueden caracterizar a través de las medidas numéricas que describen
la población en estudio.
Existen medidas numéricas de interés para cualquier conjunto de datos: la localización de su centro y su
variabilidad, luego tenemos las denominadas medidas de orden superior, que también son de forma o de
deformación.
MEDIDAS DE TENDENCIA CENTRAL: son los valores de variable que se ubican en la zona de la escala donde
se encuentra la mayor concentración de frecuencias. Es decir habla de la disposición del conjunto de datos
para agruparse ya sea alrededor del centro o de ciertos valores numéricos
MEDIDAS DE DEFORMACIÓN: comparan una serie de frecuencias con una distribución normal estándar.
CUADRO RESUMEN DE MEDIDAS EN DATOS SIN AGRUPAR –DISCRETOS
18
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
MEDIDAS
PROMEDIO Y DE POSICIÓN
SUBCLASIFICADAS en las MEDIDAS ESTAD.
Media
Mediana Primer Cuartil Asimetría
Varianza Rango
Deciles
Aritmética Geométrica Desvío estándar
ó Desvío medio
Desvío típico Percentiles
ó
Dispersión
Modo Coeficiente de
Variabilidad
Algunos Cuantiles
Es el valor tal que por lo menos “el …%” de los datos son menores o iguales que ese valor y el resto
son mayores o iguales que ese valor
Denominación Mediana Cuartil Decil Percentil
Notación me Qk Dk Pk
Se aplica cuando el conjunto
de datos se divide (en partes
iguales) en
Paso 1) Dado los DATOS SIN
AGRUPAR: se ORDENAN me° = Qk° = Dk° = Pk° =
Paso 2) Se halla el Orden
(orden es posición del cuantil)
Objetivo: Permite luego hallar
en esa posición u orden el valor
del cuantil. Para ello, primero
debe estar la serie ordenada en
forma creciente
Paso 3) En el orden hallado De la serie de los datos ordenados de menor a mayor, se selecciona aquel
se busca el Valor del cuantil que le corresponde a la posición del cuantil.
Ayuda la distribución de frecuencias. (Tabla)
19
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Cuadro de Propiedades
MEDIA VARIANZA
Notación Notación
Características Características
m (c) VAR(c)
m (c + X) VAR (c + X)
m (c - X) VAR (c - X)
m (c . X) VAR (c . X)
X X
m VAR
c c
m(X + Y) VAR(X + Y)
*
*
El AE.D. permite detectar obervaciones atípicas que son datos inconsistentes con el resto de los
otros datos. Son los datos extremos, pero para considerarse inusuales debe verificarse que estén
fuera de los límites Inferior y Superior.
20
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
RESUMEN
DE LOS
CINCO NÚMEROS
Xm Q1 Me Q3 XM
menor valor
Primer Cuartil Mediana Tercer Cuartil Mayor valor
R.I.C.
Rango Intercuartílico
Dispersión media
1) Complete en el cuadro Comparativo del resumen de los cinco números que describe
Rango Intercuartílico
el tipo de distribución de datos, cuáles de los signos corresponde
Rango Intercuartílico
COMPARACIÓN Tipo de distribución de datos
ASIMÉTRICA A LA SIMÉTRICA ASIMÉTRICA
IZQUIERDA A LA DERECHA
La distancia de
Xm a me Xm a me Xm a me Xm a me
Contra
la distancia de
me a XM >= < >= < >= <
(Tachar los signos que no (Tachar los signos que no (Tachar los signos que no
correspondan) correspondan) correspondan)
me a XM me a XM me a XM
La distancia de
Xm a Q1
Contra Xm a Q1 Xm a Q1 Xm a Q1
la distancia de
Q3 a XM
>= < >= < >= <
(Tachar los signos que no (Tachar los signos que no
correspondan) (Tachar los signos que no correspondan)
correspondan)
Q3 a XM Q3 a XM Q3 a XM
La distancia de Q1 a me Q1 a me Q1 a me
Q1 a me
Contra
la distancia de >= < >= < >= <
(Tachar los signos que no (Tachar los signos que no (Tachar los signos que no
me a Q3 correspondan) correspondan) correspondan)
me a Q3 me a Q3 me a Q3
2) Deberá seleccionar, cual corresponde Si ¿ >, <? tachando aquellos que no correspondan:
21
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Cuánto más esparcidos están los datos Son > = < Rango
R.I.C
Varianza
Cuánto más concentrados u homogéneos están los datos Son > = < Desvío
RECUERDE que:
NINGUNA MEDIDA DE VARIACIÓN (Rango, RIC, VAR, DESVIO) ES MENOR A CERO
* *
*
*
*
*
22
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
PROMEDIO: Para calcular un promedio se debe utilizar todos los valores de una serie de datos
MEDIDAS DE POSICIÓN: No utiliza todos los valores de una serie de datos. Su resultado
depende de la posición que ocupa dentro de la distribución de datos.
Identifique con una cruz y justifique si las siguientes medidas son promedios o posición?
PROMEDIO POSICIÓN Justificación
Media
Mediana
Modo
Primer cuartil
Decimo Decil
Tercer Cuartil
Rango
Semirango (Xmax - Xmin )/2
RIC (Rango Intercuartilico)
Varianza
Desvío Medio
Desvío estándar o típico
Todos los momentos
1) Las tasas de rentabilidad de los inmuebles han sido del 4%, 6%, 8%, 10% y 11% en los últimos cinco meses.
Determine: a) la media aritmética y b) el factor de expansión o crecimiento acumulado. c) el factor de expansión
o crecimiento medio y d) la media geométrica.
Rta: 0,078 –en tanto por uno- 7,8% b. 1,4537 c. 1,0777 d. 0,0777 -en tanto por uno- 7,32%
2) El número de habitantes en Pueblo Chico ha registrado la siguiente evolución demográfica: 10.000 a fines de
2005; 10500 a fines de 2006; 12600 a fines del 2007 y 18900 a fines del 2008. Halle:
a. la tasa de crecimiento anual (para cada uno de los años) b.el factor de expansión demográfico acumulado
c. el factor de expansión demográfico medio d. la tasa de crecimiento promedio anual
Rta: a) 0,05; 020 y 0,50 - en tanto por uno- b) 1,89 c) 1,23638559 d) 0,23638559
3) La población de bacterias en un cultivo creció de 1000 a 4000 en el lapso de tres días. Determine cuál fue el
crecimiento promedio diario en tanto por ciento Rta. 58,7%
4) Los salarios mensuales de cuatro empleados del Sector Cobranzas son $ 1650, $ 1500: $ 1.600 y $ 4.000. Halle:
la media aritmética, la mediana y la moda Rta: m=2187,50; me= 1625 y mo= no existe.
23
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
5) De los 80 operarios de la empresa “Cable sur” 60 cobran $ 14 la hora y el resto $ 26 la hora. ¿Cuánto cobran en
promedio por hora? Justifique el resultado Rta: $17
Recuerde que: “las ponderaciones son valores que permiten asignar a cada variable en estudio una
determinada importancia”
6) Calcule la tasa media resultante de una inversión de $ 100.000 que al cabo de un año genera un valor final de
$ 50.000 y al cabo de 2 años de $ 100.000. Rta.: 0
8) Un depósito por $ 10.000 en una cuenta devengó las sig. tasas de interés del 7% el 1°año, 8% el 2°año, 10% el
3°año, 12% el 4°año y 18% el 5°año, generando un valor final de $ 16.800. Halle el factor medio de crecimiento
anual y la tasa de crecimiento anual –en %- . Rta: 1,109 y la tasa de crecimiento anual del 10,9%
24
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
1) La cuantía de las cuotas que cobra mensualmente una compañía en concepto de Préstamos línea
Personales a reintegrar en 24 mensualidades, iguales y consecutivas han sido las siguientes:
CUANTÍAS MENSUALES en concepto de cuota cobrada por préstamos personales.
900 500 450 1900 1200 1250 2500 550 1650 1200
1000 550 950 600 750 1300 850 350 1400 700
300 1100 300 1600 1500 1000 1800 900 500 650
2000 1000 2000 450 750 850 600 3000 350 1500
SUMAS
X*i fi
25
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Varianza codif 1,224375 Varianza codif 1,577500 Varianza codif 2,399375 Varianza codif 3,260000
Desvío codif. 1,106515 Desvío codif. 1,255986 Desvío codif. 1,548992 Desvío codif. 1,805547
Coef. de Asimet1,05784457 Coef. de Asimet1,07844912 Coef. de Asimet0,98242203 Coef. de Asimet1,03872129
Coef.de Kurtosis
0,52018758 Coef.de Kurtosis
0,65861297 Coef.de Kurtosis
0,27659763 Coef.de Kurtosis
0,43513117
Rta:
𝑋𝑖 −𝐶 𝑋𝑖 −𝐶
𝑚(𝑋𝑖∗ ) = 𝑚 ( ) 𝑉𝐴𝑅(𝑋𝑖∗ ) = 𝑉𝐴𝑅 ( )
𝑤 𝑤
𝑋𝑖 𝐶
𝑉𝐴𝑅 (𝑋 ∗ ) = 𝑉𝐴𝑅 ( 𝑤 ) + 𝑉𝐴𝑅 ( 𝑤)
𝑋𝑖 −𝐶 1
𝑆𝑖 𝑋𝑖∗ = ; 𝑉𝐴𝑅 (𝑋 ∗ ) = 𝑤2 𝑉𝐴𝑅( 𝑋) + 0
𝑤
𝑋𝑖 𝑐 1
𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝑚(𝑋𝑖∗ ) = 𝑚 ( 𝑤 ) − 𝑚 ( 𝑤) 𝑉𝐴𝑅 (𝑋 ∗ ) = 𝑤2 𝑉𝐴𝑅( 𝑋)
1 𝑐
̅̅̅̅
𝑋 ∗ = 𝑤 𝑋̅ − ( 𝑤) 𝑽𝑨𝑹( 𝑿) = 𝑽𝑨𝑹 (𝑿∗ ) . 𝒘𝟐
𝑋 −𝑐 ̅
̅̅̅̅
𝑋 ∗ = 𝑤 despejo 𝑋̅
̅ = ̅̅̅
𝑿 𝑿∗ . 𝒘 + 𝒄
/___________/___________/___________/___________/
Xi enValores Originales
/____________/___________/___________/___________/___________/___________/
Xi - C
CAMBIO DE ORIGEN
/_/_/_/_/_/_/_/_/
𝑋𝑖 −𝐶
-4- 3-2 -1 0 1 2 3 4 𝑋𝐼∗ =
𝑊
CAMBIO DE ESCALA
26
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2) Dada la siguiente información se pide, paso previo a las mediciones la organización de datos y su
representación gráfica (Fte.Brufman, J)
3.1) Construir una serie de frecuencias de amplitud
w=1 (1° intervalo de clase 5,0 – 6,0)
3.2) Represente gráficamente la serie mediante
histograma y polígono de frecuencias
3.3) Represente gráficamente las frec. Acumuladas
3.4) Halle - la media, la mediana, el modo
- el primer cuartil, el segundo cuartil, el
tercer cuartil y el rango intercuartílico
Li - Ls xi fi Fa
i=1,2…h
SUMAS
3) Dada la siguiente información sobre distancia recorrida medida en km –en valores originales-
Distancia en km xi fi Fi
Fronteras de clase i=1,2…h
0 - 1,99 2
2 - 3,99 5
4 - 5,99 4
6 - 7,99 8
8 - 9,99 1
SUMAS 20
Para h= 5 ; w =2 Para h= 5 ; w =2
Se pide: 4.1) histograma 4.2) Gráfico del polígono de frecuencias 4.3) Gráfico media 5,10 media codif 0,050
de la frecuencias acumuladas 4.4) media, el modo y la mediana 4.5) ¿Cuántas Varianza 4,99 Varianza codif 1,248
personas recorren menos de 5,5 km 4.6) los cuartiles de 1° y 3° orden 4.7) la Desvío
C.V.
2,234
43,80%
Desvío codif. 1,12
Coef. de Asimet-0,313812
varianza, el desvío estándar y el coefic de variabilidad 4.8) la forma de la Coef. de Asimet -0,313812
Coef.de Kurtosis-0,996004
Coef.de Kurtosis
-0,996004
27
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
0 - 1,99 2
2 - 3,99 5
4 - 6,99 4
6 - 7,99 8
8 - 9,99 1
Totales 20
Tiempo xi fi Fa
i=1,2…h
4-5 4,5 50
5-6 5,5 250
6-7 6,5 400
7-8 7,5 250
8-9 8,5 30
9-10 9,5 10
10-11 10,5 5
11-12 11,5 3
12-13 12,5 2
Determine:
a) Tiempo medio de fabricación; b) Tiempo modal ; c) Tiempo mediano; d) Varianza; e)Desvío Standard
f) Coeficiente de simetría; g) coeficiente de curtosis ;
h) Complete con los valores codificados y calcule las medidas estadísticas
Tiempo xi X*i fi
4-5 4,5 50
5-6 5,5 250
6-7 6,5 400
7-8 7,5 250
8-9 8,5 30
9-10 9,5 10
10-11 10,5 5
11-12 11,5 3
12-13 12,5 2
∑ 𝑿𝒊 = 𝟓𝟓 ; ∑ 𝑿𝟐𝒊 = 𝟑𝟖𝟓 ; 𝑿 ̅ = 𝟓, 𝟓
29
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
MEDIDAS
CLASIFICADAS
EN
DE
DE
TENDENCIA OTRAS MEDIDAS
VARIABILIDAD
CENTRAL
CUANTILES
Media Mediana Varianza Rango FORMA
ó
FRACTILES
Coeficiente de
Desvio Medio Variabilidad Quintiles CURTOSIS
Deciles
Percentiles
MOMENTOS EMPÍRICOS
Algunas aplicaciones:
Definición de la varianza por diferencia de momentos
Determinación de las medidas de asimetría y curtosis de la distribución a partir de los momentos
30
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
CUADRO RESUMEN
MOMENTOS
EMPÍRICOS
son
Operadores matemáticos
Obtenidos a partir
de los
Valores observados de la variable
se calculan como
MOMENTO
El promedio aritmético MOMENTO
EMPIRICO
de la potencia k-ésima EMPÍRICO
ABSOLUTO CENTRADO
DE de los
DE
ORDEN k
ORDEN k
mak = mck =
La notación convencional:
mk : momento absoluto de orden k µk momento centrado de orden k
1) Complete:
ma1 = mc1 =
ma2 = mc2 =
ma3 = mc3 =
ma4 = mc4 =
2) Exprese los momentos centrados de orden 2,3 y 4 en función a los momentos absolutos
Deducir la fórmula sin omitir pasos intermedios
Complete el cuadro con las medidas y relaciónelas con las resultantes para DATOS DISCRETOS
Algunos Cuantiles
Mediana Cuartil Decil Percentil
Notación me Qk Dk Pk
Si el conjunto de datos se
divide (en partes iguales)
en
DATOS AGRUPADOS
Valor del cuantil mek = Qk= Dk = Pk=
En donde:
N=
Li =
k=
Fi =
Fa =
EXCEL EN ESTADÍSTICA
Los estadísticos descriptivos se pueden calcular a través de planillas
de cálculo como Excel. Para ello, primero es necesario habilitar
el menú de Estadística.
32
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
33
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
En conclusión:
Porcentaje de valores encontrados en intervalos alrededor de la
media
34
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2) La distribución de los pesos en una muestra de 1400 contenedores para carga sigue fundamentalmente una
distribución normal. Con base en la regla empírica ¿ que porcentaje de los pesos se encontrarán entre la media y
dos desviaciones estándar Rta:95%
3) Un auditor detecta que las cuentas a cobrar de la empresa tiene una media de $ 2.950 y desviación típica de $
630. A) Halle el intervalo en el que pueda garantizarse que se encuentra l 60% de estos valores. B) Halle un
intervalo en que pueda garantizarse que se encuentre el 80% de estos valores.
Rta.: a) 1954 y 3946 b)1541 y 4359
4) La cantidad ingresada a la AFIP por Impuesto a las Ganancias año 2015 –en miles-en los integrantes de toda una
empresa son las siguientes
Cantidad Ahorrada N° empleados
$ 30 a $ 35 3
$35 a $ 40 7
$40 a $ 45 11
$ 45 a $ 50 22
$ 50 a $ 55 40
$55 a $ 60 24
$ 60 a $ 65 9
$65 a $ 70 4
Total
5) De acuerdo con el teorema de Tchebyshev ¿al menos que porcentaje de cualquier conjunto de observaciones se
encontrará a no más de 1,8 desviaciones estándar desde la media? Rta: 69%
35
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
COVARIANZA: medida de asociación lineal o de la relación lineal entre 2 variables llamadas variables
bivariantes o bivariados.
COVARIANZA:
Medida de relación lineal entre 2 variables.
Mide la variabilidad conjunta entre dos variables
Es una medida descriptiva de asociación lineal entre 2 variables (X e Y)
La COV. puede tomar cualquier valor No informa sobre la fortaleza de esa relación
Indica el sentido de la relación lineal, si existe entre dos variables. Es decir si:
COV>0 Relación lineal directa o creciente
COV=0 No existe Relación lineal (X e Y son independientes)
COV<0 Relación lineal inversa o decreciente
COEFICIENTE DE CORRELACIÓN: mide la intensidad de esa relación lineal. Es decir indica el sentido pero
también el grado de la relación lineal entre 2 variables.
COEFICIENTE DE CORRELACIÓN:
Medida de relación linealCORRELACIÓN
entre 2 variables que indica la
fortaleza relativa de la asociación lineal entre 2 variables.
Indica sentido y grado de la relación lineal entre 2 variables
𝜎𝑥,𝑦 𝑆𝑥,𝑦
𝜌 = 𝜎 .𝜎 𝑟 = 𝑆 .𝑆
𝑥, ,𝑦 𝑥, ,𝑦
Sus valores oscilan entre
−1 ≤ 𝑟⬚ ≤ 1
Grado de correlación (según el valor hallado)
-1 … 0 … 1
Perfecta Fuerte Moderada Débil SIN CORREL. Débil Moderada Fuerte Perfecta
Una pregunta que podríamos hacernos es la siguiente: Si la varianza muestral arroja un valor distinto al de
la varianza poblacional y por ende, lo mismo ocurre con el desvío por calcularse a partir de esa varianza,
entonces, ¿el coeficiente de correlación también será diferente, según sea muestral o poblacional? Antes de
precipitarse a una respuesta, podría comprobar los resultados y luego pensar que ocurre. Observe que en la
fórmula del coeficiente de correlación se presenta el cociente entre dos valores que tendrán divisor común,
dado que en el numerador y denominador aparece cantidad de datos “n” o “n-1” pues se refiere a promedios
aritméticos de las medidas covarianza y de los desvíos.
36
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Si el coeficiente de correlación da cero significa que ambas variables X e Y no están asociadas linealmente.
Según sean los valores hallados de correlación lineal entre dos variables la representación gráfica es similar
a la siguiente.
2
REGLA PRÁCTICA: Existe una relación si |𝑟| ≥
√𝑛
Recordar que Excel calcula siempre automáticamente la Covarianza Poblacional.
𝑛
Por lo tanto, si trabajo con una muestra puedo hacer COV. POBL . 𝑛−1 = COV. MUESTRAL
¿CAUSALIDAD o SIMPLE CORRELACIÓN?
Las relaciones entre las variables se describen como tendencias, pero no como causa-efecto.
La sola correlación no prueba la exigencia de un efecto de causalidad, es decir, que el cambio en el valor de una
variable causó el cambio de la otra variable.
Debemos recordar que una Correlación Fuerte puede producirse también por:
a) Simple coincidencia: casualidad
b) Por el efecto de una tercer variable que no se tomó en cuenta en el cálculo
c) Por una relación causa-efecto
CORRELACIONES FALSAS O ESPURIAS son aquellos casos en que la correlación es fuerte, es decir que la medida
estadística presenta una relación fuerte entre dos variables pero que es casual. (Ej. Una correlación fuerte entre
la variable: consumo de aspirinetas y la otra variable: consumo de maníes.
Se debe afirmar que la CAUSALIDAD implica CORRELACIÓN, pero la sola Correlación no implica Causalidad.
EJERCICIOS DE APLICACIÓN de
COVARIANZA Y CORRELACIÓN del Producto – Momento de Pearson
1) Halle las siguientes medidas estadísticas: a) la covarianza, b) el desvío estándar de la variable X y
c) el desvío estándar de la variable Y en la siguiente información
37
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
edad estatura en cm
x y
0 56
1 74
2 92
4 104
6 116
10 140
14 159
2) Considerando la siguiente tabla de valores, calcule las medidas estadísticas halladas en el punto
anterior
edad estat en pulg
x y
0 22
1 29
2 36
4 41
6 46
10 55
14 63
3)Compare los resultados obtenidos con la tabla anterior y Complete la línea punteada)¿ Qué conclusiones
extrae?................................. ……………………………………………………………..Otra utilidad que se encuentra en utilizar el
Coeficiente de Correlación es ………………………………………………………………………………………………………………………………
Johnson Kubby también encuentra una forma práctica para determinar el coeficiente de correlación a
través del trazado de un rectángulo que abarca todos los puntos del diagrama de dispersión y encuentra
1
que r 1
k
¿Qué opinión le merece dicha fórmula en el marco de algún ejercicio?
4) Los siguientes datos representan las calorías y la grasa total que contienen las raciones de una
delicatesen para el café o té que se vende en la dietética.
Producto Calorías Grasa total
1 Barra Nature Crops barra Premium (quinoa, frutillas y yogurt) 170 3,0 gramos
1 Barra de Arroz con Semillas (Amaranto, Chia y Sesamo) dulce leche 59 2,7 gramos
1 Galleta de arroz bañada Lulemu tipo alfajor sabor chocolate 45 2,4 gramos
1 Chocolate sin azúcar agregada con leche Georgalos como barra 142 10 gramos
1 Barrita de arroz yamani integral cubierta con chocolate genuino 66 3,1 gramos
1 Nestlé Pop pochoclo acaramelado recubierto con baño repostería 97 4,3 gramos
1 Choco arroz original de dulce leche Gallo 119 6,1 gramos
a) Calcule la covarianza de la muestra
b) Calcule el coeficiente de correlación.
c) ¿Qué le parece de mayor utilidad para expresar la relación que existe entre calorías y grasa: la covarianza
o el coeficiente de correlación? Explique el porque
d) ¿Qué conclusiones deduce acerca de la relación entre calorías y grasa?
38
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
CONSIGNA:
1- ETAPA DE BÚSQUEDA de dos variables que puedan tener algún tipo de relación.
Para ello deberá leer notas de diario, periodísticas o de otras fuentes que marcan una determinada posición
y construir un marco teórico sobre el tema que trata esas variables, tal como..." La cantidad de personas que
viajan al exterior están influenciadas por el tipo de cambio..."
2 - ETAPA DE RECOLECCIÓN DE DATOS. En esta parte del proceso deberán ponerse en contacto con
la fuente de datos. Para ello, podrán buscar algún cuadro del Instituto de Estadística y Censos que informe
acerca de salida de turistas del aeropuerto internacional de Ezeiza y Aeroparque. También debería
confirmarse que no exista otro aeropuerto internacional para no sesgar los datos, pues se estaría omitiendo
parte de la información. Siguiendo este ejemplo, debería conseguir los datos referidos al tipo de cambio en
igual momento.
La muestra deberá estar conformada de por lo menos seis unidades de análisis y se deberán identificar cual
es la variable explicativa (X) y cuál será la variable explicada (Y)
3.2 Presentar los datos en una tabla, identificando cuál será la variable dependiente y cuál será la
independiente. Si bien, para estas medidas estadísticas es indistinto representar las variables en cualquiera
de los ejes por ser de naturaleza simétrica, cuando continuemos este trabajo con la función de regresión, se
necesita identificar la variable dependiente que es la explicada, por lo que para no trabajar dos veces, en esta
instancia lo representamos considerando cuál es X y cuál es Y.
3.3 Construir las columnas necesarias en la tabla, tal que permita hallar en forma manual:
- la Covarianza
- la varianza y el resultante desvío para cada una de las variables
-el Coeficiente de Correlación.
3.4 Cruzar los resultados del punto 3.3. con los valores informados en su calculadora y tildarlos en la tabla
dejando constancia de la forma: o.k. con calculadora
3.5 Realizar la tabla del punto 3.3. en una planilla de cálculo tipo Excel (ver guía del curso sobre
REGRESION) y hallar tanto las medidas estadísticas como la representación del diagrama de dispersión.
3.6 Interpretar las medidas estadísticas de covarianza y correlación en el marco del problema planteado.
3.7 Expresar cuáles de las medidas suministran más información y qué consideraciones deberán tener en la
interpretación de los datos.
39
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
40
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
EXCEL EN ESTADÍSTICA
o bien
se ingresa en la Opción “CORRELACIÓN”
LA ÉTICA EN LA ESTADÍSTICA
Por ser matemática aplicada, cuando se resuelve un determinado problema a partir de datos, se
cubren dos etapas que aluden a dos tipos de tareas con relación al objeto de estudio,
PROCESAMIENTO DE LOS DATOS Tarea que comprende un ANÁLISIS OBJETIVO. La objetividad apunta a
realizar un tratamiento cuantitativo de los datos con aquellas medidas numéricas descriptivas más
apropiadas para lo que se está estudiando.
Ej.: Si los datos presentan asimetría, ¿debería usted reportar solo la media, cuando la mediana es útil?
INTERPRETACIÓN SUBJETIVA Dado que la interpretación la realizan las personas, depende desde la
perspectiva de cómo ve el mundo, por tal razón: debería ser claro y neutral en sus conclusiones.
ÉTICA DEL DISCURSO en la ESTADISTICA Cuando deba exponer resultados de trabajos realizados,
deberá documentar tanto los resultados buenos como los malos y comunicar los mismos de forma
imparcial, objetiva y neutral.
Marcar con una cruz la/s respuestas correctas a las siguientes expresiones:
1) El modo es
- El valor de la variable con máxima probabilidad de ocurrencia
- El valor de la variable que divide a la distribución en dos grupos con igual cantidad de observaciones cada uno
- El valor de la variable que se repite con mayor frecuencia
- Una medida de posición y frecuencia
- Se grafica en el histograma de áreas.
2) La desviación estándar para el conjunto de valores de salarios de 3000, 3000,3000, 3000, 3000 y 3000 es
-3000
-0
-Ninguno de los valores anteriores
6) La mediana es
-El valor de la variable que divide a la distribución en dos grupos con igual cantidad de observaciones cada uno.
-El valor de la variable con máxima probabilidad de ocurrencia
-Una medida de tendencia central y de posición
-El valor de la variable que se repite con mayor frecuencia.
8) Para cualquier distribución de datos, la suma de todas las desviaciones con respecto a su media
42
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
9) La suma de los cuadrados de las desviaciones de los valores observados con respecto a la media
-a veces será negativa.
-Es la varianza
-Es una medida de forma
-Siempre es positiva
-La media es muy representativa de los valores que puede tomar la variable
-Los valores que toma la variable son homogéneos
-Los valores que toma la variable son heterogéneos
-El desvío es significativo con respecto a la media.
16) La varianza es el
-Momento centrado de orden 1
-Momento absoluto de orden 2
-La diferencia entre el momento centrado de orden 2 y el cuadrado del momento centrado de orden 1
-La diferencia entre el momento absoluto de orden 2 y el cuadrado del momento absoluto de orden 1
43
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
44
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Recordemos que Lind, Marchal, Mason consideran como razones para el estudio de Estadística, la presencia de los
datos en todas partes, en donde las técnicas estadísticas se usan para la toma de decisiones y dado que siempre un
ser humano está tomando decisiones lo hace con los datos que cuenta y esa decisión repercute en la vida.
Al respecto, si definimos “decisión” podemos decir que es la resolución que el individuo toma como respuesta a un
problema que debe ser resuelto. Resulta ser el resultado de un proceso mental-cognitivo del ser humano o de un
conjunto de seres humanos que conduce a la selección y ejecución de una acción.
Un cartel en un escritorio de un importante editor de periódicos decía “No me traiga un problema si no trae una
solución”
Para tomar una decisión, no hay duda que es necesario conocer el problema, comprenderlo lo mejor posible y en
función a la información con la que se cuenta poder dar una solución a ese problema.
Por lo tanto, las decisiones pueden ser consideradas bajo certeza, incertidumbre y riesgo.
Pavesi, Pedro y otros, 2004, La decisión, Buenos Aires: Grupo Editorial Norma parte de un concepto general
definiendo Incertidumbre – en sentido amplio- de la siguiente manera: Existe incertidumbre si el decisor cree que
una variable puede adoptar uno de entre, por lo menos, dos niveles posibles, pero no puede asegurar cuál será
dicho nivel. Pero, esta ignorancia puede darse en la propensión a suceder de los niveles de una variable, sino
también de la identificación de los niveles posibles y también de las variables en juego.
Sin embargo, considerando un enfoque estadístico, una decisión bajo incertidumbre significa “el desconocimiento
absoluto de la propensión a suceder, es decir de la probabilidad de un estado determinado de los mundos inciertos.”
Así, en este caso se conocen los estados posibles –sus variables y niveles y otros factores- pero no se conoce la
probabilidad de tales estados.
La resolución a problemas de decisión en tales casos lleva a considerar diferentes métodos, entre los cuales será el
decisor quien adoptará el que en forma subjetiva considere más conveniente. El problema es que cada método
puede arribar a resultados distintos.
Si una variable puede adoptar cuatro niveles cuya probabilidad se desconoce, entonces los cuatro niveles son
equiprobables: no hay razón suficiente para atribuir una probabilidad mayor o menor a cualquiera de ellos.
Dado, que si esa razón existiera para preferir uno u otro, entonces no se estaría en condiciones de
incertidumbre.
- Criterio de Wald:
Pensando en el criterio de la teoría de los juegos, empleado en la guerra, en tonde el enemigo no perdona y
tratará de provocar el mayor daño. Entonces, adoptando una posición de prudencia máxima, denominada
conservadora se elige la alternativa cuyo peor resultado sea mejor que los peores resultados. Sigue diciendo
Pavesi, es como considerar que el fin de la Bolsa es arruinar al inversor. Son los métodos maximin, minimix o
criterio pesimista. El decisor desconoce la propensión a suceder, desconoce la probabilidad de los estados del
mundo incierto, si bien conoce cuáles y cuantos son esos estados.
45
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
- Criterio de Hurwicks:
Adopta una combinación lineal entre el criterio pesimista y el optimista.
- Criterio de Savage:
Considerando el pesimismo del maximín, aplicado al costo de oportunidad de la elección en vez de aplicarlo a
los resultados
Riesgo:
Una decisión bajo riesgo es aquella en la cual conocemos las probabilidades de ocurrencia de los estados posibles
del mundo incierto. Se conoce cuántos estados son posibles y se le puede asignar una probabilidad mayor que cero
a cada uno de ellos.
Se utilizan medidas estadísticas, y se selecciona una vez calculada la esperanza matemática como promedio
ponderado por las probabilidades de los resultados de cada alternativa, la alternativa que tenga mayor esperanza
matemática y otras medidas aún más importantes.
Podemos decir que la PROBABILIDAD es la expresión cuantitativa del sentimiento de incertidumbre respecto del
resultado de un fenómeno. Se basa en que en muchos fenómenos inciertos existen patrones a largo plazo.
El valor numérico hallado NUNCA ASEGURA de lo que ocurrirá en la próxima observación, ensayo.
Pues el resultado da información de lo que ocurrirá si se repite una y otra vez
ese ensayo en igual de condiciones y por lo tanto el resultado
hallado es el resultado a largo plazo, es el valor esperado a
largo plazo.
ENFOQUES DE PROBABILIDAD:
46
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
47
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
U=
{0; 1} El espacio muestral es un conjunto finito
b. Experimento 2: Lanzar un dado
48
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Otro caso: Si repetimos el experimento de lanzar al aire una moneda “n” veces. Cada uno de los resultados
posibles se denomina suceso. El espacio muestral también es un suceso ya que representa la suma de
sucesos simples y el conjunto vacío también es un suceso. Entonces denominamos al suceso A: cara y al
suceso B: ceca. ; n(1): son las veces que sale el suceso A y n(2): las veces que sale el suceso B.
𝑛(1)
La frecuencia relativa del suceso A denotada como 𝑓𝐴 = 𝑛 ; mientras que la frecuencia relativa del
𝑛(2)
suceso B denotada como fB= 𝑛
Las propiedades de la frecuencia relativa:
1) 0 ≤ 𝑓𝐴 ≤ 1
2) 𝑓𝐴 = 1, si solo ocurre el suceso A en las “n” repeticiones
3) 𝑓𝐴 = 0, si no ocurre el suceso A en las “n” repeticiones
4) Si A y B son sucesos excluyentes 𝑓𝐴 +𝑓𝐵 =1
5) Cuando n ∞ la 𝑓𝐴 converge en probabilidad P(A) = 𝑓𝐴
n∞
La probabilidad clásica se define como el cociente entre casos favorables y casos igualmente posibles.
𝐶𝐹 𝑛
Veamos: 𝑃(𝐴) = 𝐶𝑃 𝑃(𝐴) = 𝑁
Las propiedades de la probabilidad
1) 0 ≤ 𝑛 ≤ 𝑁 0 ≤ 𝑃(𝐴) ≤ 1
2) Si S= U n=N y P(S)=1
3) Si = Φ n= 0 y P(S)=0
4) Si 𝑆̅ es complemento de S (N-n) : cantidad de resultados del suceso 𝑆̅
𝑁−𝑛 𝑛
𝑃(𝑆̅) = 𝑁 = 1 − 𝑁 = 1 – P(S) ; es decir: 𝑃(𝑆̅) =1 – P(S), despejando: 𝑃(𝑆̅) + P(S) = 1
El conteo nos permite determinar la cantidad de eventos o sucesos posibles del espacio muestral.
Ej. 1) Una inmobiliaria ofrece la posibilidad de seleccionar el estilo de Viviendas tipo: Casa, Dùplex,
Departamentos, con una sola planta, dos plantas. ¿De cuántas maneras posibles puede un comprador
ordenar una de estas viviendas?
Soluciòn: Dado que N1 = (3) y N2 = (2) Entonces, un comprador puede elegir entre N1 N2 = (3). (2) = 6
viviendas posibles
49
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Entonces el número de formas diferentes en que un cliente puede ordenar un teléfono celular es N1 N2 N3 =
(5). (4). (2) = 40
Ej.3) Halle cuántos puntos muestrales hay en un espacio muestral cuando se lanza 3 dados una sola
vez , es lo mismo que decir un dado que se lanza 3 veces.
Soluciòn: El 1er. Dado puede caer en cualquiera n1 =6 maneras, al igual que el 2do. dado y el 3er. Dado.
Por lo tanto la cantidad de puntos muestrales es N1 N2 N3 = (6). (6). (6) = 216
Veamos:
PRINCIPIO FUNDAMENTAL DEL CONTEO
Caso particular N1 N2 N3 … Nn
N1 =N2 =…=Nn
Nn
cantidad de formas de
combinar “n” objetos
con ”N” opciones c/u.
cantidad de formas o grupos en
que se ordenan “n” objetos de N
n≤N
Si
Dos grupos son diferentes si Dos grupos son diferentes si
Difieren en algún elemento o únicamente cuando tienen
En el orden de los mismos algún elemento diferente
INTERESA LA POSICIÓN INTERESA LA PRESENCIA
-IMPORTA EL ORDEN- - NO IMPORTA EL ORDEN-
VARIACIONES COMBINACIONES
𝑵! 𝑵!
NVn = 𝑽𝑵
𝒏 = (𝑵−𝒏)!
= 𝑵. (𝑵 − 𝟏)(𝑵 − 𝟐) … (𝑵 − 𝒏 + 𝟏) NCn =
(𝑵−𝒏)!𝒏!
Si
n=N
PERMUTACIONES
PN = N!
Es la variación de N elementos tomados de a n.
Recordemos que
50
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Es el número de formas de ordenar “n” objetos seleccionados de “N” objetos, sin interesar el orden. Es
decir, existe un conjunto general denominado “N” del cual extraemos una muestra “n” de forma ordenada.
Entonces, se denomina Variaciones de N elementos tomados de a n, a la cantidad de grupos de “n”
elementos que se pueden formar con N elementos, considerando que dos grupos son distintos, si difieren
en algún elemento o en el orden. Por eso, se dice que “importa el orden”
Condición: N≥n
𝑵!
𝑵 𝑽𝒏 = (𝑵−𝒏)!
2) Deloitte busca estudiantes de la carrera de actuario para ocupar 4 cargos distintos. Si de los avisos que
reciben los alumnos, se presentan 20 solicitudes de empleo. ¿Cuántas posibilidades diferentes se dan,
suponiendo que todos pueden ser elegidos?
3) ¿Cuál es el número de maneras distintas que se pueden presentar las letras ABC tomadas de a 2, importando
el orden de presentación? Rta: 6
AB
AC -IMPORTA EL ORDEN-
BA
𝟑!
BC nVr = (𝟑−𝟐)! = 6
CA
𝑛.(𝑛−1).(𝑛−2)…(𝑛−𝑟+1).(𝑛−𝑟)!
CB nVr =
(𝑛−𝑟)!
= 𝑛. (𝑛 − 1). (𝑛 − 2) … (𝑛 − 𝑟 + 1)
Se trata de Variaciones Simples: Número de formas o maneras de ordenar “r” objetos seleccionados de n
objetos en donde importa el orden. Son permutaciones de n objetos tomados de r en r.
4) ¿Cuántas permutaciones posibles con 5 letras ABCDE se pueden hacer si se las coloca en orden de a 2?
Rta: 20
5) ¿De cuántas maneras pueden quedar asignados los títulos de campeón y subcampeón? Si son cuatro
competidores Rta: 12
AB - BA - CA - DA
AC - BC - CB - DB
AD - BD - CD - DC
51
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
𝟒! 𝟒.𝟑.𝟐
nVr = (𝟒−𝟐)! = =12
𝟐
NVn
= N . (N-1) . (N-2)…(N-n+1)
NVn = número de permutaciones de N objetos tomados de n en n , importa el orden
En donde N es el total de objetos y n: número de objetos del subconjunto y donde 𝑛 ≤ 𝑁
Observemos que si el numerador de NVn lo escribimos como N!= N.(N-1) . (N-2) …(N-n+1). (N-n)!
debemos luego dividir por (N – n)!, para llegar a la expresión de NPn idéntica a la expresión NPn = N .
(N-1) . (N-2)…(N-n+1). Por ello, también podemos expresar el número de permutaciones de N objetos
tomados de n en n como:
𝑵!
NVn = (𝑵−𝒏)! = 𝐍 . (𝐍 − 𝟏) . (𝐍 − 𝟐) … (𝐍 − 𝐧 + 𝟏)
PERMUTACIONES PN
Cada ordenamiento diferente de un conjunto de objetos se denomina permutación.
Se denomina Permutaciones a la variación de N elementos tomados de a N, considerando que dos grupos
son distintos, si difieren en el orden.
Si en la NVn = N=n entonces hablamos de Permutación.
PN = N!
𝑵!
NCn =( 𝑵𝒏. ) = 𝒏! (𝑵−𝒏)!
nCr: número de combinaciones de n objetos tomados de x enx
NV𝑛
NCn = 𝑛!
𝑁! 𝑁!
Si sustituimos NPn por el valor (𝑁−𝑛)! nos queda NCn = 𝑛! (𝑁−𝑛)!
52
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
6) ¿Cuál es el número de combinaciones que se pueden hacer con las letras ABC tomadas de a 2 si no interesa
el orden?
Rta: 3
AB
AC -NO IMPORTA EL ORDEN-
BA
3
BC NCn ( )=3
2
CA
CB
Se trata de Combinación: Número de formas o maneras de ordenar “r” objetos seleccionados de n objetos en
donde NO importa el orden.
Aplicación: Número de muestras posibles en un muestreo aleatorio sin reposición de sus elementos.
53
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
̅̅̅
P(𝐴) Probabilidad del complemento de A Probabilidad de que no ocurra A
P(A/B) Probabilidad condicional de A dado B Probabilidad de que ocurra A dado que ha ocurrido B
P(A⋂ 𝐵) Probabilidad conjunta de A y B Probabilidad de que ocurran tanto A como B
P(A⋃ 𝐵) Probabilidad de la Union A y B Probabilidad de que ocurra A , o bien B, o ambos.
1) Un comercio cuenta con 180 clientes de los cuales 54 son incobrables. Si por cada cliente se cuenta con
un resumen de situación y se extrae al azar un resumen.
a) ¿Cuál es la probabilidad de que pertenezca a un cliente incobrable?
b) ¿Cuál es la probabilidad de que pertenezca a un cliente no incobrable?
Rta: a) 0,30; b) 0,70
2) Una organización vende 1000 billetes de lotería. Hay 10 premios grandes y 100 premios chicos y todos
deben repartirse. El proceso de selección de los ganadores es tal que al principio todos los billetes tienen
las mismas probabilidades de ganar un premio grande y todos tienen las mismas probabilidades de ganar
un premio chico. Ninguno puede ganar más de un premio.
a) ¿Cuál es la probabilidad de ganar un premio grande con un único billete?
b) ¿cuál es la probabilidad de ganar un premio chico?
c) ¿Cuál es la probabilidad de ganar algún Premio?
Rta: a) 0,01 b) 0,10 c) 0,11
3) ¿Cuál es la probabilidad de acertar un pleno (acertar justo al número que sale) en la ruleta? Rta. 1/37
4) YPF observó que el 75% de los clientes compran nafta INFINIA, el 80% nafta SUPER y el 65%
consume las dos. ¿cuál es la probabilidad de que un cliente consuma al menos una de las dos?
Rta: 0,90
5) En una tirada de ruleta ¿Cuál es la probabilidad de:
a. Que salga el número cero.
b. Que salga el número par
c. Que salga el número par, mayor
Rta: a) 1/37; b) 18/37; c) 9/37
7) ¿Cuál es la probabilidad de que en el lanzamiento de dos dados salgan pares obtenidos, si se pueden
diferenciar los dados? Presente el espacio muestral.
Rta: 1/4
54
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
8) ¿Cuál es la probabilidad de que en el lanzamiento de dos dados salgan pares obtenidos si no se pueden
diferenciar los dados? Presente el espacio muestral
Rta: 1/6
9) Se lanza una moneda equilibrada dos veces. a) ¿Cuál es la probabilidad de que ambos lanzamientos de
cara?
b) Responda, si la probabilidad hallada se interpreta como que si el ensayo se repite: la probabilidad
de que suceda es ese valor hallado
Rta: ¼.
10) Se lanzan 3 monedas. ¿Cuál es la probabilidad de obtener: a) ninguna cara; b) dos caras; c) menos de
dos caras d) una o tres caras, d) 4 caras? Rta: a) 1/8; b) 3/8 ; c) 1/2; d) ½ ; e) 0
11) De un mazo de 52 cartas de póker, compuesto por 13 cartas de trébol, 13 de corazones, 13 de diamantes
y 13 de picas, se extrae al azar una carta. Calcular la probabilidad de:
a. Extraer un trébol
b. Extraer un trébol o un corazón
c. Extraer un trébol o un corazón o un diamante
d. No extraer trébol. Rta. a) ¼ ; b) ½; c) ¾; d) 3/4
12) ¿Cuál es la probabilidad de sacar en un mazo de cartas de 52 naipes, un as o un rey? Rta.: 2/13
13) ¿Cuál es la probabilidad de sacar un 1 o una espada o ambos en un mazo de 48 naipes que no tienen
comodines? Rta = 15/48
14) ¿Cuál es la probabilidad de extraer 2 bolas rojas consecutivas sin devolver a la urna que tiene 3 rojas y
dos bolas verdes? Rta: 3/10
15) ¿Cuál es la probabilidad de obtener un as (A), un rey ® o un dos (D) al extraer un naipe de mazo
debidamente barajado de 52 naipes? Rta: 3/13
16) Una carpeta de “Ajustes Manuales para dar de alta en la Cartera Pasiva de Clientes” contiene 12
cuentas de clientes, de las cuales se detectó que 4 de ellas contienen un error de procedimiento en sus
cuantías.
a) Si un auditor selecciona aleatoriamente una cuenta. ¿Cuál es la probabilidad de que ésta contenga el
error?
b) Si un auditor selecciona aleatoriamente dos de estas cuentas (sin reemplazo): b.1) ¿Cuál es la
probabilidad de que las dos contenga un error de procedimiento? b.2) ¿de que ninguna de ellas tenga
error?
c) Si el auditor selecciona aleatoriamente tres cuentas ¿Cuál es la probabilidad de que ninguna de ellas
contenga un error de procedimiento? Rta: 0,33; 0,09; 0,42 y 0,25
17) De una caja que contiene 3 biromes negras y 4 biromes verdes, se extraen 4 sin reposición. Calcule la
probabilidad de que sean:
a. 1 verde y 3 negras (en ese orden)
b. 2 verdes y 2 negras (en ese orden)
Rta: a) 1/35; b) 3/35
18) En una administración de cartera existen 300 clientes, de los cuales 100 son clientes grandes y los
restantes son chicos por su envergadura. De los clientes grandes el 20% son de Azul y el resto de otros
lugares del Gran Buenos Aires. Además, el 10% de la cartera total son clientes chicos y de Azul. Asimismo,
para corroborar los datos también se sabe que en la administración hay 250 clientes de los otros lugares
del Gran Bs.As. Determine la probabilidad de que:
a. Un cliente sea de la zona de Azul Rta 1/6
b. Si se eligió un cliente de Azul que este sea chico. Rta 3/5
55
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
19) En el Aeropuerto de Trelew se registraron 500 pasajes de mujeres y 800 de varones, de los cuales el 3%
de las mujeres son turistas y el 5% de los varones son varones turistas. Determine la probabilidad de que
seleccionado al azar un pasajero sea:
a. turista
b. no sea turista
c. varón y no turista
d. mujer y turista
e. mujer y no turista
f. mujer o turista
g. Luego, determine la probabilidad de que sabiendo que es turista, sea varón.
h. Probabilidad de que sea mujer, si se sabe que no es turista.
Rta: a) 0,0423; b) 0,9577; c) 0,5846; d) 0,0115; e) 0,3731 f) 0,4154 g) 0,73 y h) 0,3896
20) En el bar de la Facultad se consume café y té. Se conoce que el 30% consume café, el 60% consume té
y el 5% consume ambos. ¿Cuál es la probabilidad de que elegida una persona al azar, consuma algún tipo
de bebida? Rta: 0,85
21) En un curso conformado por 100 estudiantes, se selecciona al azar un estudiante y se quiere hallar la
probabilidad de que sea un estudiante varón o sea un estudiante menor o igual a 20 años. Se conoce que el
60% son mujeres y el 48% son mujeres mayores de 20 años y el 80% de la población son mayores de 20
años.
Rta: 0,52
P (Aℎ ). P (B/Aℎ )
P (Aℎ /𝐵) =
∑𝑛𝑖=1 P (A𝑖 ). P (B/A𝑖 )
22) En una fábrica hay 3 máquinas A1, A2 y A3, que producen el 20%, el 30% y el 50% respectivamente,
de la producción total. La máquina A1 genera 5% de defectos La máquina A2 genera 10% de defectos
La máquina A3 genera 15% de defectos. Si se extrae de la producción un artefacto defectuoso, se desea
saber la probabilidad de haber sido fabricada por la máquina A1.
P (A1/B)=0,08695
23) Frente a denuncias de recipientes con menos contenidos de lo indicado, el gerente comercial no sabe
de qué planta puede provenir, por tal razón se comunica con el gerente de control de procesos de producción
y obtiene la siguiente información
Planta A1 55% total de la producción 3% de recipientes defectuosos
Planta A2 45% total de la producción 4% de recipientes defectuosos
Cuál es la probabilidad de que las botellas defectuosas (B) hayan sido llenadas por la Planta “A”
P (A1/B)=0,4782
24) En una entidad financiera hay un sistema de alarma. En una noche cualquiera la probabilidad de que:
Suene la alarma cuando hay robo es 0,99
Suene la alarma si no hay robo es 0,01
Ocurra un robo es 0,002
Calcular la probabilidad de que si suena la alarma (B) haya robo (A1)
P (A1/ B)= 0,16555
56
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
25) Tres bibliógrafos idénticos contienen facturas en dos colores, las blancas son a cobrar dentro de los 30
días y las rosas a cobrar en plazos más extensos. A continuación se indica los colores de las facturas en
cada bibliógrafo:
Bibliógrafo 1 Bibliógrafo 2 Bibliógrafo 3
6 blancas 3 blancas 8 blancas
2 rosas 5 rosas 10 rosas
Si un empleado recibe una factura que otro extrajo de alguno de esos bibliográfos, la que resulta ser blanca.
Calcule la probabilidad de que esta factura blanca provenga del segundo bibliógrafo.
P (A2/B)= 27/113= 0,2389
26) Dos impresoras láser de diferentes marcas Marca Epson y Marca HP imprimen diariamente 700 y 1000
hojas respectivamente. La experiencia nos indica que la impresora Epson imprime hojas con error en la
proporción del 3% mientras que la impresora HP imprime con error en la proporción del 5%. De la
impresión diaria, se elige una hoja al azar y de ella resulta que tiene error de impresión.
¿Cuál es la probabilidad de que la hoja elegida provenga de la impresora HP? P (A2/B)= 50/71
27)En una entidad financiera que tiene cien mil cuentas de ahorro activas se procedió a realizar una auditoría
de la que resultó gran cantidad de cuentas con diferencias las que se informan seguidamente juntamente
con el oficial de inversiones responsable de esas cuentas
Cartera de cuentas de ahorro Cantidad de cuentas Cuentas con diferencias Oficial de Inversiones
Grupo 1 900 40 Díaz, Horacio
Grupo 2 600 50 Benítez, Marcela
Grupo 3 1.700 60 Martínez, Isidoro
Grupo 4 800 100 Opico, Germán
Si se seleccionó una cuenta de uno de los grupos al azar y resulta ser con diferencias. Determine la
probabilidad de que dicha cuenta provenga del oficial de inversiones Martínez, Isidoro que atiende ese
grupo 3.
28) Del total de piezas de una fábrica que ensambla auto- partes, el 65% provienen del proveedor del Sur y
el 35% del proveedor del Norte. Un estudio reveló que el 98% de las piezas compradas al proveedor del
Sur son piezas de buena calidad mientras que el 95% de las piezas compradas al proveedor del Norte son
de buena calidad.
Si una máquina se descompone por ensamblar una pieza mala: a) ¿Cuál es la probabilidad de que sea del
proveedor del Sur? B) ¿Cuál será la probabilidad de que sea del proveedor del Norte?
P (A1/B)= 0,4262 P (A2/B)= 0,5738
29) Un concesionario de auto sabe que el 10% de las personas que ingresan al local y preguntan, compran
un auto. Por ello, la concesionaria decide ofrecer una cena gratis con un vendedor a todas aquellas personas
que están dispuestas a escuchar la presentación completa del vendedor, así aumentaría la probabilidad de
éxito en las ventas. También se sabe que algunas personas hacen cualquier cosa por una cena gratis y
también que otras personas no quieren cenar con un vendedor, aunque tenga ganas de comprar un auto.
Por ese motivo, se pretende comprobar la eficacia del incentivo. El proyecto se hizo durante 6 meses y el
40% de las personas que compraron un auto cenó gratis. También cenó gratis el 10% de las personas que
no compraron un auto.
a) ¿tienen las personas que aceptan la cena una probabilidad mayor de comprar un auto?
b) ¿qué probabilidad hay de que una persona que no acepta una cena gratis compre un auto?
P (A1/B)= 0,308 y P (A1/B)= 0,069
57
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Conteste V (Verdadero) o F (Falso) o de corresponder, integre las líneas que requiere completar
58
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
probabilidad de obtener cara y la probabilidad de obtener cruz son las mismas. d) Por todas las
anteriores.e) a) y b), pero no c).
22. Si Ay B son eventos mutuamente excluyentes, entonces P (A o B) =P(A) +P (B). ¿De qué manera
cambia el cálculo de P(A o B) si A y B no son mutuamente excluyentes?
a)P (AB) debe restarse de P(A) b) P (AB) debe sumarse a P(A) c) Ninguno de los anteriores.
24. La probabilidad de que un valor escogido al azar de una determinada población sea mayor que la
mediana de la población es: a) 0,25 b) 0,50 c) 1 d) 0,67
LA ÉTICA EN LA ESTADÍSTICA
59
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
1) Las tres tablas muestran variables aleatorias asociadas a sus probabilidades. Sólo una de ellas es
realmente una distribución de probabilidad. a) ¿Cuál es?, b) Utilizando la distribución de probabilidad
correcta encuentre la probabilidad que X sea: b.1) exactamente 15 ; b.2) no más de 10 y b.3) más de 5.
c) Halle la varianza, desvío, coeficiente de variación
x 0 1 2 3 4 5
P(x) 2/15 1/3 0 1/5 1/15 4/15
a) Grafique la función de probabilidades.
b) Grafique la función de distribución de las probabilidades acumuladas.
c) Halle
- P(X>2) Rta: 8/15
- P(X 2) Rta: 8/15
- P(X 1) Rta: 7/15
- P(X <1) Rta: 2/15
- F (1) Rta: 7/15
- F (6) Rta: 1
- P (3 X<5) Rta: 4/15
- P (x<1 ó x>4) Rta: 6/15
60
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
3) Describir el espacio muestral y hallar las funciones de probabilidad y de distribución para el tiro
de un dado. Grafique la función de probabilidad.
4) El Gerente de Ventas de una sucursal está analizando el número de ventas que por día se realizó
en un determinado artículo y para ello compiló información de los últimos 50 días. El resultado
fue el siguiente:
a. 1 día con 38 ventas.
b. 2 días con 34 ventas
c. 3 días con 33 ventas
d. 6 días con 32 ventas
e. 13 días con 31 ventas
f. 25 días con 30 ventas
Calcular: a) Probabilidad de que en un día se efectúen a lo sumo 32 ventas
b) Probabilidad de que en un día se efectúen más de 30 ventas
c) Cantidad esperada de ventas diarias, su varianza y su desvío estándar.
X P(x)
0 0,20
1 0,40
2 0,30
3 0,10
6) Un agente colocador de fondos tiene que optar entre tres carteras de inversión alternativas. En base
a información reunida, estima que las condiciones económicas futuras del país pueden seguir tres
escenarios: a) escenario en que desmejoren: probabilidad del 30%; escenario en que sigan sin
cambio: probabilidad del 50% y de que haya un crecimiento en la economía: probabilidad del 20%.
Considerando cada una de las condiciones económicas citadas, los beneficios que obtendría serían
los siguientes
Escenario de la economía Beneficio de la cartera en miles de $
A B C
-Negativo 500 -2000 -7000
- Neutro 1000 2000 -1000
- Positivo 2000 5000 20000
a) Calcule el beneficio esperado para cada cartera. Justifique cuál cartera elegiría.
b) Calcule la desviación estándar para cada cartera y la variabilidad relativa. Justifique utilizando
esta medida qué cartera elegiría.
7) Se define una variable aleatoria como la cantidad de caras que pueden resultar al lanzar una
moneda tres veces. Defina el espacio muestral. Halle la función de probabilidad y la función de
distribución.
61
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Analice para cada una de las situaciones siguientes, si una serie de ensayos Bernoulli
proporciona un modelo razonable y justifique su respuesta.
Situación B: Al finalizar el año, los empleados de una firma son calificados mediante la siguiente
escala de valoración: excelente, aceptable o insatisfactorio. Un ensayo consiste en determinar la calificación
para un empleado de la firma.
Situación D: Una caja tiene 6 gomas de tinta-lápiz y 14 gomas de lápiz o bien de tinta. Se extrae
una goma al azar, se mira y se devuelve a la caja. Cuál es la probabilidad de sacar una goma de tinta-lápiz.
Respuestas:
Situación A: La hipótesis de independencia es dudosa, pues en cualquier período de tiempo hay una
tendencia fuerte de los precios de estos activos a modificar sus precios en forma conjunta, a causa del
cambio en la tasa de interés, noticias políticas…Es decir, que para las acciones de la lista el resultado
depende del cambio en el precio de otras.
Situación B: Los ensayos Bernoulli son buen modeloSi definimos “éxito” tener una calificación
excelente y “fracaso” al complemento (aceptable o insatisfactorio). Pero, si hay restricciones en el número
de calificaciones excelentes no se cumple la hipótesis de independencia.
Situación D: Este experimento tiene dos resultados posibles si definimos: la goma de tinta lápiz es éxito
y el resto es fracaso. Definiendo la V.A.D. como el número de gomas de tinta-lápiz. La probabilidad de
éxito permanece constante, pues existe reposición de elementos.
P(x=1) = p = 6/20 = 3/ 10 = 0,3
La probabilidad de fracaso será P(x=0) = (1-p) = 1 – 0,30 = 0,70
62
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Una distribución de Probabilidad: indica toda la gama de valores que pueden presentarse como resultado
de un experimento. La diferencia con una distribución de frecuencias relativas, es que esta última describe el pasado.
En cambio la distribución de probabilidad describe que tan probable es un evento futuro.
Calcularemos las medidas : media que se denomina esperanza matemática, valor esperado, varianza, desviación
estándar , describiremos sus características y calcularemos probabilidades usando una distribución.
Las medidas estadísticas también serán halladas a partir de la F.G.M, siglas que significan Función Generatriz de
Momentos. Determinaremos la F.G.M. para algunas de las distribuciones.
F.G.M. –Función Generatriz de Momentos- es una Función que permite deducir a través de las derivadas sucesivas,
los momentos absolutos de distinto orden.
Algo de la demostración matemática.: Una F.G.M. para X existe, si existe una constante positiva “b” tal que la FM
es finita para |𝑡| ≤ 𝑏 .
(𝑡.𝑥)2 (𝑡.𝑥)3 (𝑡.𝑥)4
La serie 𝑒 𝑥.𝑡 = 1 + 𝑡. 𝑥 + 2!
+ 3!
+ 4!
+….
Recordemos que la derivada de una suma finita siempre es igual a la suma de las derivadas (suponiendo que todas
las derivadas existen).
En consecuencia, E(ext) es una función de todos los momentos 𝜇𝑘′ alrededor el origen para k= 1,2,3,4…
𝑑 𝑘 𝐹𝐺𝑀(𝑡)
𝜇𝑘′ = 𝑑𝑡 𝑘
¬
t=0
63
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN BINOMIAL
𝑛!
𝑃(𝑥) = 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥
𝑥! (𝐧 − 𝐱)!
Siendo:
P(x)=Probabilidad de x éxitos en “n” pruebas con probabilidad de éxito “p” constante para cada prueba.
X= número de sucesos en la muestra (X= 0, 1,2, ….,n)
n= tamaño de la muestra –número de observaciones de las pruebas.
p = probabilidad de “Suceso éxito”
q= (1-p) = probabilidad de “Suceso fracaso”
2) En un examen final de estadística con 20 preguntas, cada una con 4 respuestas alternativas. Suponiendo
que todas las preguntas son independientes y que las respuestas serán calificadas como “Bien” o “Mal”.
Calcule la probabilidad de obtener:
a) exactamente 7 respuestas correctas. b) 7 o más respuestas correctas
c) ninguna respuesta correcta d) todas las respuestas correctas
Rta: a) 0,1124; b) 0,2143 c) 0,0032 y d) 0
3) El Sector “Control de Calidad” va a inspeccionar los ítems defectuosos. Se conoce que la producción
total de un cierto proceso es perfecta en un 80%. Para detectar los ítems defectuosos es necesario
destruirlos una vez hecha la inspección. Si se extrae una muestra aleatoria de 17 ítems de un cierto día de
producción en donde se completó 20.000 unidades. ¿Cuál es la probabilidad de contar con 3 o menos
unidades defectuosas? Rta: 0,5489
5) En un estudio reciente se encontró que el 5% de los usuarios de telefonía celular tienen equipo Iphone.
En una muestra de 20 usuarios.
a)¿Cuál es la probabilidad de que por lo menos la cuarta parte tenga Iphone?
b) ¿Cuál es la probabilidad de que menos de 5 tengan Iphone?
c) Exprese y represente la forma de este tipo de distribución.
Rta: a) 0,002 Y b) 0,998
64
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
6) El 34% de los clientes de una Sucursal Bancaria tienen Cuenta Corrientes. Se toma una muestra al azar
de 15 clientes.
6.1.- ¿Cuántos clientes con Cuenta Corriente se espera encontrar?
6.2.- Calcule la varianza y el desvío estándar.
6.3.- Calcule la probabilidad de hallar:
i. exactamente 7 clientes con Cuentas Corriente.
ii. A lo sumo 3 clientes con Cuenta Corriente
iii. Menos de 5 clientes con Cuenta Corriente
iv. Como mínimo 8 clientes con Cuenta Corriente
v. Más de 10 clientes con Cuenta Corriente
vi. Entre 4 y 9 clientes con Cuenta Corriente
vii. Por lo menos un cliente con Cuenta Corriente
viii. Como máximo 6 clientes con Cuenta Corriente.
Rta.: 6.1) 5,1; 6.2) 3,366; 6.3) 1,83 i) 0,1217; ii) 0,1941; iii) 0,3829; iv) 0,0977; v) 0,0021; vi) 0,7960; vii) 0,9980 y viii) 0,7806
7) Una compañía telefónica elige al azar una muestra de 8 abonados. Sabiendo que el 64% de los abonados
tienen un servicio adicional, calcular las siguientes probabilidades acerca de los 8 abonados que han sido
seleccionados:
a) Qué entre 7 y 8 abonados no tengan un servicio adicional
b) Que más de la mitad no tenga un servicio adicional
c) Que entre 2 y 6 tenga un servicio adicional
d) Que la cuarta parte no tenga un servicio adicional.
Rta: a) 0,0042; b) 0,1180; c) 0,8409 y d) 0,2494
8) En una organización escolar se sabe que el 35% de los profesores son mujeres. Se seleccionan al azar 4
profesores para ir de viaje de egresados.
8.1. Se pide calcular:
a) la probabilidad de que en dicho equipo haya ninguna mujer.
b) la probabilidad de que en dicho equipo haya más de dos mujeres.
c) la probabilidad de que en dicho equipo haya a lo sumo 3 hombres.
8.2. Si se extrae una muestra al azar de 90 profesores de esa organización. Determinar la cantidad de
mujeres que se espera encontrar en dicha muestra y con qué desvío.
Rta: 8.1.a) 0,1785; b) 0,1265; c) 0,8215 y 8.2) 31,5
9) El 5% de los engranajes sin fin que produce una máquina automática son defectuosos.
a. ¿Cuál es la probabilidad de que al seleccionar al azar 6 engranajes ninguno sea defectuoso?
b. Cuál es la probabilidad de que haya exactamente
- 2 engranajes defectuosos - 3 engranajes defectuosos
- 4 engranajes defectuosos - 5 engranajes defectuosos
- 6 engranajes defectuosos
c. ¿Qué distribución de probabilidades utiliza y por qué?
Rta: 0,735; 0,031; 0,002; 0; 0; 0
10) Construya en una situación binomial para n=6 las distribuciones de probabilidades y su
representación gráfica considerando:
p= 0,05 p=0,10 p=0,20 p= 0,50 p= 0,70 p= 0,95
¿Qué conclusiones extrae?
11) Construya en una situación binomial para p= 0,10 las distribuciones de probabilidades y su
representación gráfica considerando
n= 6 n=12 n=20 n=40
¿Qué conclusiones extrae y que impedimentos ha encontrado?
65
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN POISSON
1) En la intersección de las calles Córdoba y Junín los registros de accidentes dicen que hay 5 accidentes
diarios. El número de accidentes está distribuido de acuerdo a Poisson.
a) Determine la probabilidad puntual de que en el día ocurran 0, 1, 2... accidentes.
b) Determine la probabilidad de que ocurran 0, 1 ó 2 accidentes en el día.
Rta: 0,0067; 0,0337; 0,0842 y 0,1245
2) Un empleado de un call center de una empresa de cable atiende en promedio 1,2 personas cada 10
minutos. Se desea hallar la probabilidad de que dicho empleado atienda:
a) a 2 personas en 10 minutos.
b) a lo sumo 4 personas en 10 minutos.
c) entre 1 y 4 personas inclusive en 10 minutos
d) menos de 4 personas en 10 minutos.
e) 3 personas en 10 minutos, si se sabe que atendió menos de 4.
Rta: a) 0,2169; 0,9922; 0,689; 0,9662 y 0,0897
4) Una máquina de hilar produce piezas con un promedio de 1 falla cada 200 metros. Determinar la
probabilidad de que una pieza tenga
a) exactamente 3 fallas
b) como mínimo 4 fallas.
Rta: 0,0613; 0,01532
5) La Central de Policía atiende en promedio 5 llamadas por día. ¿Cuál es la probabilidad que en un día
determinado atienda 0, 1, 2 y 10 llamadas?
Rta: 0,0025; 0,0337; 0,0842; 0,0181
1.2) Interpretar el ejercicio planteado y su resolución
66
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
.
DISTRIBUCIÓN HIPERGEOMÉTRICA
R N R
N = tamaño de la población
nr
P(r )
R = número de éxitos en la población r
N – R = número de fracasos en la población
n = tamaño de la muestra
r = número de éxitos en la muestra
N
n
n – r = número de fracasos en la muestra
1) Una caja contiene 50 legajos de crédito, siendo 40 legajos de clientes en situación normal y 10 legajos
de clientes con atrasos. Extrayendo 5 legajos al azar.
1.1.) ¿Cuál es la probabilidad de obtener 2 legajos de clientes con atrasos, sabiendo que los legajos se
retiran con reposición?
1.2) ¿Cuál es la probabilidad de que los dos legajos estén con atrasos, ya que es obvio que el auditor
cuando extrae el primer legajo no lo repone a la caja pues no revisará 2 veces el mismo legajo? Luego,
determine su esperanza matemática, varianza y desvío.
Rta: 0,2048; 0,2098
2) Un auditor debe inspeccionar un total de 50 carpetas de cuentas corrientes, de los cuales 35 están en
situación normal y 15 no. Si el auditor selecciona 10 legajos al azar.
¿Cuál es la probabilidad? de que:
- 6 legajos correspondan a carpetas de clientes que no están en situación normal
- Todos los legajos que han sido seleccionados al azar no estén en situación normal.
- 9 o más legajos no cumplan con el requisito de estar en situación normal.
Rta: 0,0255; 0 y 0
67
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
RESUMEN DE DISTRIBUCIONES
1)Complete la tabla con las características para las distribuciones discretas que se indican
Bernoulli Binomial Hipergeométrica Poisson
DEFINICIÓN
RECORRIDO
FUNCIÓN
F.G.M.
ESPERANZA
MATEMÁTICA
VARIANZA
DESVIO
_____________________________________________________________________.
68
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN NORMAL
D.N.G
Z Si μ= 0 y σ=1
-z 0 z
D.N.S
1)Complete
f(z;0;1)=
Características de la Distribución Normal Estándar
DEFINICIÓN
RECORRIDO
FUNCIÓN
F.G.M.
ESPERANZA
MATEMÁTICA
VARIANZA
DESVIO
Una distribución normal con cualquier valor μ y σ puede convertirse en una distribución normal estándar,
restando la media - μ - a cada observación X y dividiendo entre la desviación estándar –σ-.
69
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Así surge el valor Z o puntuación “Z” como medida que indica la dirección y el grado en que un valor
individual se aleja de la media, en una escala de desviación estándar. Por ser independiente de las
unidades empleadas se trata de una cantidad adimensional.
Entonces:
Z: Es la variable que mide la desviación respecto a la media en términos de unidades de desviaciones
estándar y también se le dice puntuación Z, Valor Z
Estas puntuaciones Z son distancias que indican áreas bajo la distribución normal (áreas de probabilidad)
1) Calcule los siguientes valores, utilizando la tablas de “Función de distribución normal estandarizada”
(Probabilidad acumulada hasta un valor de la variable Z)
P(x ≤ 0,85) P (0,21 ≤ x ≤ 0,86)
P(x ≤ -0,85) P (-0,21 ≤ x ≤ 0,86)
P (0 ≤ x ≤ 0,20) P (- 0,86 ≤ x ≤ -0,20)
P (-0.21 ≤ x ≤ 0)
Rta: 0,8034; 0,1976; 0,0796; 0,08317; 0,22194; 0,38828 y 0,22585
2) Calcule para una distribución normal general con media 95 y desviación estándar de 10. P( x ≤
105). ¿Cómo soluciona la búsqueda de la probabilidad?
5) Los ingresos mensuales por ventas de un determinado producto siguen una distribución normal con
media $ 1860 y desvío estándar de $ 270. Encuentre la probabilidad de que las ventas en un mes
seleccionado al azar sean a) inferior a $ 1500 y b) mayor a $ 2100 Rta: 0,09176 y 0,18943
70
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
6) En la Sucursal del Sur de una importante empresa los ingresos semanales de los operarios siguen
una distribución normal con media $ 1000 y desviación estándar $100. ¿Cuál es la probabilidad de
seleccionar al azar un operario cuyo ingreso?
-a) esté entre $790 y $1000 -b) sea inferior de $ 790.
-c) sea superior de $ 1.000 -d) esté entre $ 840 y $ 1200
Rta: 0,48214; 0,01786; 0,50 y 0,92245
3) En un depósito que contiene 120 cajas de remitos por ventas correspondientes a las dos sucursales,
de las cuales se conoce que 90 cajas corresponde a la sucursal Montes de Oca y las 30 restantes a la
Sucursal Retiro. Las cajas no tienen etiquetas que pueda indicar a cuál sucursal corresponden. Se toman
5 cajas al azar.a) ¿Cuál es la probabilidad de encontrar 3 cajas de remitos que correspondan a la
Sucursal Retiro? Rta: 0,0879
1) En una empresa que elabora artículos de computación se ha comprobado que el 0,8% de los artículos
son con defectos.
Si pienso exportar una partida de artículos de computación y el envío será rechazado si encuentran 4 o
más artículos con fallas. ¿Cuál es la probabilidad de encontrar exactamente 4 artículos con defectos en
una partida de 1000 unidades? Rta: 0,0573
2) Se conoce que el 20% de los contactados telefónicamente por un representante de ventas de Seguro
Automotor se adherirá también a la compra de un Seguro de Vida. Si un representante contacta a 30
personas. Determine la probabilidad de que 10 o más contactados realicen la compra del Seguro de
Vida. Rta: 0,0548
3) Se conoce que el porcentaje de envases buenos elaborados por una máquina es del 55%. Determine
cuál es la probabilidad de encontrar como máximo 70 envases buenos de una partida de 100 envases.
Rta: 0,99901
4) Se conoce que el 12% de los cheques que una entidad financiera recibe para acreditar en las cuentas
corrientes son rechazados.
71
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
a) Si de la caja de cuentas corrientes se toman al azaar 20 cheques ¿Cuál es la probabilidad de que por
lo menos 7 cheques sean rechazados?
b) Del total de 800 cheques enviados a la Cámara Compensadora ¿Cuál es la probabilidad de que se
rechacen entre 90 y 95 cheques? Rta: 0,0071 y 0,2381
5) Se estima en que un 48% de la producción de cierto producto resulta defectuoso. ¿Cuál es la
probabilidad de que un comerciante mayorista que compró 100 unidades de ese producto deba
devolver por lo menos 55 por encontrarlas defectuosas? Rta: 0,0968
P (X> xi ) P (X ≤ xi )
+ 0,50
xi xi
Se lee: Probabilidad de más de X Se lee: Probabilidad de X o menos
-0,50
P (X ≥ xi ) P ( X < xi )
xi xi
Se lee: Probabilidad de X o màs; o también Se lee: Probabilidad de menos de X
Probabilidad de por lo menos X
72
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO
DE VARIABLES ALEATORIAS
Y
DISTRIBUCIONES DE PROBABILIDAD
Las preguntas 1 A 5 se responden usando la siguiente tabla que presenta la función de Probabilidad
de una variable aleatoria discreta Y
Y P(y)
1 0
2 0,25
4 0,25
6 0,25
8
1
1. Encuentre P (y=8):
a. 0
b. 0,2
c. 0,25
d. Ninguno
2. Encuentre la esperanza de Y:
a. 5
b. 4
c. 6
d. ninguno
3. Encuentre la varianza de Y:
a. 30
b. 5
c. 2,23607
d. Ninguno
b. 0,1
c. 0,5
d. 1,0
8. Cuál de los siguientes parámetros de esperanza matemática producirá una menor varianza en una
variable aleatoria Poisson:
a. 0,1
b. 5
c. 7
d. 1
9. Una variable aleatoria x tiene una distribución binomial con n=50 y p=0,4. La media y la varianza
para x son:
a. µ=20; 2=12
b. µ=20; 2=3,4641
c. µ=30; 2=12
d. µ=30; 2=3,4641
10. Mencione cuáles son las dos propiedades o condiciones básicas de toda distribución de probabilidad.
12. La varianza
a. Es El momento centrado de orden 3
b. Es un promedio ponderado de los cuadrados de las desviaciones de una variable aleatoria respecto de su media,
en donde los pesos son las probabilidades
c. Es El momento absoluto de orden 2 menos el momento absoluto de orden 1
d. Se mide en las mismas unidades que la variable aleatoria
15. La distribución Poisson puede definirse como una aproximación de la distribución binomial cuando
a. la cantidad de pruebas tiende a cero y la probabilidad de éxito es muy pequeña.
b. la cantidad de pruebas tiende a infinito y la probabilidad de éxito es igual a la de fracaso
c. la cantidad de pruebas tiende a infinito y la probabilidad de éxito es muy pequeña.
d. Siendo en estos casos la varianza de la distribución Poisson igual a la esperanza de la distribución binomial
19.Cuando la probabilidad de éxito en un proceso de Bernoulli es del 50% p = 0.5, su distribución binomial es
simétrica.
20. Una distribución de frecuencias da una lista de las frecuencias observadas para un experimento que ya se ha
llevado a cabo; una distribución de probabilidad da una lista de aquellos resultados que podrían presentarse si el
experimento se llevara a cabo.
22. Una vez que el valor de p ya se ha determinado para un proceso de Bernoulli, el valor de q se calcula como 1 / 2 p.
23. Si el número esperado de llegadas a una oficina se calcula como cinco por hora, uno puede tener una confianza
razonable de que cinco personas llegarán en la siguiente hora.
24. La Distr, binomial no es realmente necesaria, pues sus valores se pueden aproximar siempre por otra Distrib
25. La estatura de los humanos adultos se puede describir mediante una distribución de Poisson.
26. El factor de Corrección de Finitud se utiliza en el cálculo de la varianza de una distribución hipergeométrica
27. Después de 20 ensayos de un experimento, se crea una curva de distribución con su forma definitiva.
29. Una distribución en la que la media y la mediana tienen diferentes valores nunca podrá ser una distribución normal.
32. Para una distribución binomial dada con n fija, si p < 0.5, entonces:
75
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
34. ¿Cuál de las siguientes es una característica de la distribución de probabilidad para cualquier variable aleatoria?
a) Se da una probabilidad para cada valor posible.
b) La suma de todas las probabilidades es uno. c) No se presenta una probabilidad dada más de una vez.
d) Todos los anteriores. e) a) y b), pero no c).
35. ¿Cuál de las variables siguientes nunca podrá ser descrita por una distribución binomial?
a) El número de partes defectuosas producidas en un proceso de ensamblaje.
b) La cantidad de agua utilizada diariamente por una sola ama de casa.
c) El número de personas de su grupo que pueden responder correctamente a esta pregunta.
d) Todos los anteriores pueden ser descritas por una distribución binomial
7! 0,403 0,60 4
36. Si p =0.4 para un proceso de Bernoulli, el cálculo de da la probabilidad de obtener:
3!4!
a) exactamente cuatro éxitos en siete ensayos.
b) exactamente tres éxitos en siete ensayos.
c) tres o más éxitos en siete ensayos.
d) cuatro o más éxitos en siete ensayos.
e) ninguno de los anteriores.
38. ¿Cuál de las siguientes es una condición necesaria para el uso de una distribución de Poisson?
a) La probabilidad de una llegada por segundo es constante.
b) El número de llegadas en cualquier intervalo de un segundo es independiente de las llegadas en otros intervalos.
c) La probabilidad de tener dos o más llegadas en el mismo segundo es cero.
d) Todos los anteriores.
e) b) y c), pero no a).
39. ¿En qué caso sería la distribución de Poisson una buena aproximación de la binomial?
a) n =40, p= 0.32. b) n = 40, q= 0.79. c) n = 200, q = 0.98. d) n = 10, p = 0.03.
e) a) y c). f) Todos los anteriores.
76
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Complete:
Enunciado del TCL
DISTRIBUCIONES DE MUESTREO
1.
2.
3.
4.
TIPOS DE MUESTREO
A-
B-
77
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
78
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
SEGUNDA PARTE
79
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
80
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
𝑵−𝒏
√ Recordar que se aplica el Factor de
𝑵−𝟏 POBLACIÓN DESCONOCIDA
Corrección por Finitud cuando se tiene que con Si n<30
los elementos, la fracción muestral supere el 5% Se deben usar otros métodos: p.e.
Tchebychev para nuestro curso
IC para un (1-α)
𝝈 𝑺
̅±𝒌
𝒙 ̅±𝒌
𝒙
𝒏 √ 𝒏 √
𝝈 𝑵−𝒏 𝑺 𝑵−𝒏
̅±𝒌
𝒙 √ ̅±𝒌
𝒙 √
√𝒏 𝑵−𝟏 √𝒏 𝑵−𝟏
𝟐
(𝒏 − 𝟏)𝑺𝟐 𝟐
(𝒏 − 𝟏)𝑺𝟐
𝝌 = 𝝌 =
𝝈𝟐 𝝈𝟐
Si buscamos “n” a partir del margen de error máximo admitido tendremos que usar
p=q=0,50
1) Una gran población de clientes con deudas vencidas registra un saldo vencido promedio de
$ 1500 con desviación estándar de $ 350.
a. ¿Cuál es la probabilidad de que un cliente con deuda vencida aleatoriamente muestreado tenga saldo
vencido que exceda $ 1600?
b. ¿Cuál es la probabilidad de que la media de una muestra aleatoria de 40 clientes con deudas vencidas
registre un saldo que exceda los $ 1600?
Rta: 0,38591 y 0,03515
81
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2) ¿Cuál es la probabilidad de que la media de una muestra de tamaño 16 esté entre 456 y 461, si
proviene de una población con distribución normal con media 458 y varianza 100?
Rta: 0,673
3) ¿Cuál es la probabilidad de que la media muestral sea superior a 4712 si proviene de una población
con distribución normal de 221 elementos, cuya media es 4650 y desvío típico de 216 y se sacó una
muestra de tamaño 25? Rta: 0,06426
4) ¿Cuál es la probabilidad de que la media muestral de tamaño 100 sea superior a 2314 si proviene de
una población con media de 2302 y desvío típico de 563? Rta: 0,421
5) Se conoce que las ventas realizadas por un comercio sigue una Distribución Normal con media de
$ 168.200 y desvío típico de $ 20.604. De las ventas realizadas en el mes una inspección extrae una
muestra de 9 facturas. ¿Cuál es la probabilidad de que la media de la muestra difiera de la media
poblacional más de $ 12.000? Rta: 0,08
6) La antigüedad media de los títulos de deuda del Estado es de 1750 días con un desvío estándar de
1320 días. La SIGEP toma al azar 90 títulos. ¿Cuál es la probabilidad de que la media de la muestra sea
inferior a 4 años? Rta: 0,0188
7) Los pagos en personal de un Ministerio siguen una Distribución Normal con media de $ 3367 y
varianza de 162409. Si se extrae una muestra de 64 liquidaciones, sabiendo que el total de personas que
trabajan en el Ministerio y reciben sus liquidaciones son 12.800. ¿Cuál es la probabilidad de que el
valor de la media muestral sea superior a $ 3.500? Rta: 0,0042
8) Un auditor toma una muestra aleatoria de 36 cajas de ahorro de una población de 1000 libretas de
cajas de ahorro. El valor medio de los saldos en la libreta de caja de ahorro de toda la población es $ 260,
con desvío estándar de la población de $ 45.
a. ¿Cuál es la probabilidad de que la media muestral sea menor a $250?
b. ¿Cuál es la probabilidad de que la media muestral se encuentre en no más de $ 15 de la media?
Rta: 0,09176y 0,9545
10) Se seleccionó una muestra aleatoria de 50 usuarios de cable para participar en una encuesta
telefónica. La pregunta clave que se les planteó fue: ¿tiene Usted o algún miembro de su familia canal
de cable Premium adicional al canal básico? De los 50 participantes, 35 contestaron que no y 15 que sí.
Si la proporción de la población que tiene Cable Premium es 0,40.
a) Encuentre la proporción muestral 𝑝̅ de familiares con cable Premium
b) Encuentre el error estándar para la proporción.
c) Probabilidad de que la proporción sea superior al 15% y menor al 38%
Rta 0,30; 0,06928; 0,00763
11) El auditor Levin Rubio de una gran entidad financiera sabe que el saldo promedio mensual de
clientes morosos de la cuenta “tarjetas de Crédito” es $ 112 y la desviación estándar de $56. Si éste
audita 50 cuentas seleccionadas al azar ¿cuál es la probabilidad de que el saldo promedio mensual de
la muestra sea: a) menor que $ 100 b) entre $100 y $130 Rta: a) 0,0643 y b) 0,92
82
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
12) A partir de una población de 125 artículos con media de 105 y desviación estándar de 17, se eligen
aleatoriamente 64 artículos: a) cuál es el error estándar de la muestra y b) cuál es la probabilidad de que
la media de la muestra esté entre 107,5 y 109 Rta: a) 1,4904 y b) 0,0428
13) Una investigadora de la empresa Moli Café se encuentra interesada en determinar la tasa de uso de
café por hogar. Ella cree que el consumo mensual por hogar tiene una distribución normal con media
poblacional desconocida y desviación estándar cercana a 1,25 kg.
La investigadora toma una muestra de 36 hogares y registra su consumo de café durante un mes.
a. ¿Cuál es la probabilidad de que la media de la muestra se aleje de la media de la población no
más de ½ kg?
b. Qué tan grande debe ser la muestra que tome para tener el 98% de certidumbre de que la media
de la muestra no se aleje más del medio kilo de la media de la población?
Este punto podrá resolverlo en el capítulo siguiente Rta: a) 0,9819 y b) 34
14) El salario medio por hora del personal de limpieza de laboratorios en la zona de Capital es de
$ 68. ¿Cuál es la probabilidad de encontrar un salario medio por hora de $ 70 o más, si se toma una
muestra de 50 personas, sabiendo que la desviación estándar poblacional es de $ 20 por hora.
Rta:
APLICACIONES
DE
CONCEPTOS TEÓRICOS DE DISTRIBUCIÓN DEL MUESTREO
En c/ de los enunciados, marque con una cruz si es V (Verdadero) o (Falso).En este último caso,
justifique como transforma en verdadero dicho enunciado.
1. Cuando los elementos incluidos en una muestra se basan en el juicio del individuo que conduce la
muestra, se dice que la muestra es no aleatoria. Rta: V___/F___
3. Un plan de muestreo que selecciona miembros de una población a intervalos uniformes con
respecto al tiempo, al orden o al espacio se denomina muestreo estratificado. Rta: V___/F___
9. El error estándar de la media disminuye en proporción directa al tamaño de muestra. Rta: V__/F__
10. Para obtener una distribución teórica de muestreo, consideramos todas las muestras de un
tamaño dado. Rta: V__/F__
11. Si la media de una cierta población fuera 15, es probable que la mayor parte de las muestras
que podríamos tomar de esa población tuviera medias de 15. Rta: V__/F__
13. La fracción de muestreo compara el tamaño de una muestra con el tamaño de la población.
Rta: V__/F__
14. La precisión con la que puede usarse la media de muestra para estimar la media de
población disminuye al incrementarse el error estándar. Rta: V__/F__
15. Elija entre el par de símbolos que se siguen a continuación el que mejor complete el
enunciado: “___________es un parámetro, mientras que _______________es una estadística”
a. N, µ b.𝜎,s c. N,n d. Todos los anteriores e. b) c) ,pero no a)
𝝈
16. ¿En cuál de las siguientes situaciones es la fórmula correcta para calcular
√𝒏
a) El muestreo es de una población infinita.
b) El muestreo es de una población finita con reemplazo.
c) El muestreo es de una población finita sin reemplazo.
d) Sólo a) y b).
e) Sólo b) y c)
17. Suponga que una población con N = 144 tiene µ = 24. ¿Cuál es la media de la distribución
de muestreo de la media para muestras de tamaño 25?
a) 24 b) 2 c) 4.8. d) No puede determinarse de la información dada.
18. El Teorema Central del Límite nos asegura que la distribución de muestreo de la media:
a) Es siempre normal.
b) Es siempre normal para tamaños grandes de muestra.
c) Se aproxima a la normalidad al tiempo que se incrementa el tamaño de muestra.
d) Parece normal sólo cuando N es mayor que 1,000.
84
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
1. Una porción de los elementos de una población elegidos para su examen o medición directa
es una _______________
7. Dentro de una población, los grupos que son similares entre sí (aunque los grupos mismos tengan
una amplia variación interna) se conocen como _______________.
LA ÉTICA EN LA ESTADÍSTICA
85
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
INFERENCIA ESTADÍSTICA
D
Un solo valor Un conjunto de valores posibles, cerrado y acotado, I
del estimador cuyos límites son funciones del estimador S
T
R
I
B
D
E
P
R
O
B
A
B
I
L
La Inferencia Estadística utiliza un “razonamiento inductivo” porque a partir de los resultados de una
muestra se van a obtener conclusiones sobre la población.
PARÁMETRO ESTIMADOR
a estimar
-
-
-
-
-
ESTIMACIÓN PUNTUAL
0,025
Grafica: Suponiendo una Población Infinita proveniente de una distribución Normal conociendo el desvío poblacional
Conceptos:
ERROR DE ESTIMACIÓN
Es la distancia entre una estimación 𝜃̂ y el parámetro θ
SESGO
Es la diferencia entre la esperanza del estimador y el parámetro
Los elementos de la Estimación por Intervalos son los siguientes:
88
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
𝐿𝑠 − 𝐿𝑖
M𝐸 = 𝐸 = 𝑒 =
2
Interpretación
Ejemplo:
P x z. x z. = (1-α)
n n
La Variable Aleatoria x aparece en los extremos con la constante desconocida: µ en la mitad.
M.E. M.E.
b) Centrada en la x y se extiende a de c/lado (caso de desvío conocido y población. infinita
n
c) La longitud o ancho es 2 veces Z. y no es aleatoria
n
d) LO ALEATORIO es la Localización del Punto Medio del Intervalo x
En consecuencia; IC [ x z. ; x z. ]
n n
O más conciso IC x z. IC x ME
n
Encuentre el valor “z” para construir el intervalo de confianza según el nivel de confianza
especificado:
Nivel de Valor “z” Valor “z”
confianza Del Límite inferior Del Límite superior
80% -1,282 1,282
90%
95%
99%
89
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
1) Una asociación de administradores de consorcio desea conocer el promedio de las expensas anuales.
En una muestra aleatoria de 256 administradores, la media es de $ 4542 y la desviación estándar de
$ 205. a) ¿Cuál es la media poblacional?
b) ¿Cuál es el intervalo razonable de valores para la media poblacional?
c) ¿Qué significan los resultados obtenidos?
2) Necesita estimar la media poblacional, en el caso de estudiar la vida útil de determinada lámpara
de proyectores en donde se conoce la desviación estándar de la vida útil poblacional que es de 500
horas, pero se desconoce la vida útil media. Se toma una muestra de 15 lámparas para proyectores y da
una vida útil de 8900 horas.
Resolver suponiendo:
2.1) Que la vida útil de las lámparas sigue la distribución normal, sabiendo que quiere construir
el intervalo de confianza del a) del 95% y b) del 90% Rta: (8647;9153) ; (8688, 9112)
2.2) ) Que la vida útil de las lámparas no se considera normalmente distribuida y por tal razón
la muestra tomada fue de 35 lámparas en lugar de 15 lámparas, sabiendo que quiere construir
el intervalo de confianza para un nivel del 95% Rta: (8734; 9066)
2.3) Que la población está normalmente distribuida pero no se conoce la desviación estándar de
la población. En la muestra tomada de 35 lámparas dio una desviación estándar de 500 horas
frente a la media de la muestra de 8.900 horas. Resuelva solamente para el 90% de nivel de
confianza. Rta: (8761;9039)
2.4) Que no puede suponer la forma de la distribución, y más aún, no conoce tampoco el desvío
poblacional. Sigue tomando una muestra de 35 lámparas lo que arrojó una media de 8.900 horas
y 500 horas de desvío y debe estimar la media poblacional para un nivel de confianza del 99%
Rta: ( 8682; 9118)
2.5) Que el desvío no se conoce, pero el desvío muestral es 500 horas. Construya el intervalo de
confianza con un nivel de confianza del 95% para estimar la media poblacional, sabiendo que
la vida útil sigue una distribución normal. La muestra ha sido de 15 lámparas con una media
muestral de 8.900 horas. Posteriormente, construya el intervalo en donde se encuentra la media
poblacional considerando un nivel de confianza del 90%. Rta: (8623; 9177) ; (8672;9128)
2.6) Que la muestra de 15 lámparas arrojó una media de 8.900 horas y desvío estándar de 500
horas. Estime la media poblacional construyendo el intervalo con un 90% de nivel de confianza
si se supone que la vida media no está normalmente distribuida. Rta (8492; 9308)
3) En una muestra de 40 restaurantes de comida rápida la venta diaria fue de $ 26.800 y la desviación
estándar de $3.020. a) ¿Cuál es la media estimada de ventas diarias y cómo se llama esta estimación?
b) ¿Cuál es el intervalo de confianza de 99% de nivel de confianza? Interprete sus resultados.
Rta: b) IC [ 25570≤ 𝜇 ≤28030]
4) El costo variable de construcción de dúplex en una zona del Gran Buenos, por metro cuadrado sigue
una distribución normal. Se tomó una muestra de 16 viviendas con las que se calculó un costo variable
de construcción promedio de $ 2.100 y un desvío estándar de $ 225.
a) Entre qué valores estará el costo variable promedio de construcción si la estimación se hará con un
nivel de confianza del 95%.
b) Estime la varianza poblacional con una confianza del 90%.
c) Luego estime el desvío poblacional con igual confianza
Rta: a) IC [ 1980,13≤ 𝜇 ≤2219,86] = 0,95; b) IC [30380≤ 𝜎 2 ≤ 104582,7]=0,90; c) IC [174,30≤ 𝜎 ≤ 323,4]=0,90
90
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Para la estimación del IC de la Varianza : expresa Newbold en “Estadística para Administración y Economía” que es peligroso
hacer la estimación cuando la población no sigue una distribución normal. La validez del estimador de un intervalo de la
varianza depende mucho más del supuesto de la normalidad que la del estimador de un intervalo de la media poblacional.”
5) Una empresa con una gran cantidad de empleados están considerando la posibilidad de ofrecer en
conjunto un nuevo servicio de almuerzos para todos. Como integrante en ese estudio de viabilidad del
proyecto se desea conocer el costo diario medio de los almuerzos. En una muestra tomada al azar de
11 empleados se llegó a que los importes consumidos en almuerzo diariamente han sido los siguientes:
$95 $105 $95 $92 $107 $91 $104 $101 $99 $97 $107
a) Determine un intervalo de confianza de 90% para la media poblacional. Interprete su resultado.
Considere una distribución normal para su resolución
b) Estime la varianza con una confianza del 90%
c) Luego estime el desvío poblacional con igual confianza
d) Comente la situación del problema considerando que no se conoce el tipo de distribución.
Rta: a) IC [ 96,17≤ 𝜇 ≤102,55] = 0,90; b) IC [18,60≤ 𝜎 2 ≤ 86,42]=0,90; c) IC [4,313≤ 𝜎 ≤ 9,296]=0,90
6)El negocio de Nicola dedicado a hacer pasteles los comercializa a 50 pastelerías. Nicola desea
saber el nivel de ausentismo entre sus empleados. A continuación, se da el número de días de
ausencia durante una quincena en una muestra de 10 trabajadores.
4 1 2 2 1 2 2 1 0 3
a) Determine la media y la desviación estándar de la muestra.
b) ¿Cuál es la media poblacional? ¿Cuál es la mejor estimación de ese valor?
c) Proporcione un intervalo de confianza de 95% para la media poblacional
d) Explique por qué usa esa distribución en el ejercicio
e) ¿Puede concluir que el trabajador promedio no faltó ningún día durante una quincena?
Rta: a) 𝜇 = 1,8 ; Sn-1 = 1,1353 b) 𝜇 = 1,8 -como mejor estimación. c) IC [0,196≤ 𝜇 ≤3,404] = 0,95
7) En una determinada localidad hay 250 familias. Se realizó una encuesta a 40 familias surgiendo que
la cantidad promedio de consumo anual en turismo es U$s 4.500 con una desviación estándar de U$s
750. Determine un intervalo de confianza de 90% para el consumo anual en turismo.
Rta: a) IC [4320,85≤ 𝜇 ≤4679,15] = 0,90
9)Un analista de investigación de perfumes obtiene información respecto de una muestra de 100
clientes de los 400 que adquieren una oferta especial determinada. Estas 100 personas gastaron en la
Perfumería un promedio de U$s 24,57 con una desviación estándar de U$s 6,60. Si emplea un intervalo
de confianza considerando el nivel del 95% calcule a) el monto medio de compra para los 400 clientes
y b) el monto total de dinero gastado en compras por los 400 clientes.
Rta: a) b) IC [23,45≤ 𝜇 ≤25,69] = 0,95 b) IC [9380; 10276] = 0,9
91
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
10) Un agente bursátil analiza el rendimiento de un fondo de inversión. Para ello, tomó una muestra
mediante la recopilación de los rendimientos medios generados por ese fondo durante 25 días,
obteniendo un rendimiento medio del 6%. Considerando que el rendimiento de los fondos de inversión
siguen una distribución aproximadamente normal con un desvío del 3,2%.
a) Halle con una confianza del 95% el intervalo para el rendimiento medio del fondo.
b) Halle con una confianza del 90% el intervalo para el rendimiento medio del fondo.
c) Compare e interprete los resultados obtenidos en los puntos anteriores.
d) Calcule la cantidad de días que debería analizar para que el error sea inferior al 0,5% con un nivel
de confianza del 90% Rta: a) IC [0,047456≤ 𝜇 ≤0,072544] = 0,95; b) IC [0,049472≤ 𝜇 ≤0,070528] = 0,90 d) n=111
11) Antes reiterados reclamos el Sector de control de calidad decide calcular la proporción de artículos
que no cumplen con los requisitos de calidad. Dado que resulta dificultoso hacer un relevamiento de
todos los artículos fabricados, se ha decidido estimar dicha proporción a través de una muestra de 64
artículos de los cuales 8 no cumplen con las especificaciones de calidad.
Dada esa evidencia muestral, se solicita:
a) Hallar el intervalo de confianza para la proporción de artículos que no cumplen las especificaciones
en la población, considerando un nivel de confianza del 95%
b) Hallar: b.1) el intervalo de confianza para la proporción de artículos que no cumplen las
especificaciones en la población, considerando un nivel de confianza del 90% y b.2) ¿cómo afectaría la
estimación si la cantidad de artículos fabricados por la empresa han sido 1200?
c) Compare los resultados anteriores e interprételos.
d) Si el error estipulado se quiere reducir en un 25% ¿cuál sería el tamaño de la muestra, considerando
un nivel de confianza del 90%?
Rta: a) IC [0,04397≤ 𝑝 ≤0,20603] = 0,95; b.1) IC [0,057≤ 𝑝 ≤0,193] = 0,90; b.2) IC [0,0588≤ 𝑝 ≤0,19119] = 0,90 d) n=114
12) Un concesionario decide analizar la eficiencia de un vendedor nuevo para estudiar la posibilidad
de incrementarle las comisiones; ventas. Para ello, se analizará además del monto promedio de ventas,
la varianza de las mismas. Del total facturado por ventas realizadas por este vendedor se seleccionaron
al azar las siguientes facturas que arrojan los siguientes valores en miles de pesos
108-136-290-410-72-124-320
Utilizando esta información muestral: Construya el intervalo de confianza para las ventas, que se
distribuyen en forma aproximadamente normal, considerando un nivel del 95% de confianza tanto
para: a) la media; b) la varianza y c) el desvío.
Rta: a) IC [88,69≤ 𝜇 ≤328,45] = 0,95; b) IC [6976,46≤ 𝜎 2 ≤ 81472,32]=0,95; c) IC [83,52≤ 𝜎 ≤ 285,43]=0,95
13) La contabilización de facturas produce una proporción desconocida de comprobantes con datos
diferentes a los reales. Por tal razón, se ha tomado una muestra de 60 comprobantes que arrojaron una
proporción de comprobantes con datos diferentes a los reales del 30%.
a) Hallar los límites de confianza del 95% para la proporción de comprobantes con datos diferentes a
los reales.
b) Determinar la cantidad de comprobantes que debieran someterse a análisis para reducir el error en
un 50%especificando el criterio adoptado para determinar el tamaño muestral.
Rta: a) IC [0,184045≤ 𝑝 ≤0,415955] = 0,95; b) n= 286
14) Según una encuesta realizada, se pudo establecer utilizando una muestra de 8740 familias que la
proporción de familias que consumen productos light se encuentra entre el 28,74% y el 31,26%. Se pide
hallar el nivel de confianza si se conoce a partir de la muestra que 2622 familias consumen productos
light.
Rta: (1-α)= 0,99
92
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO
DE
CONCEPTOS TEÓRICOS DE INFERENCIA ESTADÍSTICA
Conteste Verdadero –V- o Faso en los siguientes enunciados y en el caso de ser Falso,
modifique el texto de forma tal que se haga Verdadero.
1. Una distribución del muestreo es la distribución que enlista algunas de las posibles estadísticas muestrales
obtenidas de muestras de igual tamaño que pueden extraerse aleatoriamente de la misma Población, en donde
se considera tanto el muestreo con reposición como el muestreo sin reposición.
Rta: V__/F__
3. El error estándar de la ………., es el nombre que generalmente se usa para expresar la desviación estándar de
la distribución muestral de la estadística que se mencione en el espacio integrado por punto.
Rta: V__/F__
4.El error estándar de la media aumenta a medida que el tamaño de la muestra aumenta.
Rta: V__/F__
6. Los histogramas para representar todas las distribuciones muestrales son simétricos.
Rta: V__/F__
7. Una muestra aleatoria se obtiene en forma tal que todas las muestras posibles de tamaño n tienen igual
probabilidad de ser seleccionadas. Rta: V__/F__
8. Lo que determina la dispersión de una distribución del muestreo dice Anastasia: “es el número de muestras
empleadas” y Tatiana dice que “es el tamaño de cada muestra empleada.
Rta: V__/F__
10. El T.C.L. sintéticamente expresa que la distribución del muestreo se asemejará más estrechamente a la
Distribución normal cuando el tamaño muestral aumenta. Rta: V__/F__
11. Un nivel de confianza del 90% significa que la probabilidad de que el intervalo tome esos valores es del 90%
Rta: V__/F__
12. Las Distribuciones “t” de Student tienen una distribución aproximadamente normal, pero están más dispersas
que la distribución normal estándar, por eso son leptocúrticas
Rta: V__/F__
13. Se dice que un estadístico es un estimador eficiente de un parámetro si, al aumentar el tamaño de la muestra,
es casi seguro que el valor del estadístico se acerca mucho al valor del parámetro.
Rta: V__/F__
93
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
14. Una estimación de intervalo es un intervalo de valores utilizado para estimar la forma de la distribución de
una población.
Rta: V__/F__
15. La probabilidad de que un parámetro de población se encuentre dentro de una estimación de intervalo dada
se conoce como nivel de confianza.
Rta: V__/F__
16.Al aumentar el tamaño de la muestra, la distribución t tiende a una forma más plana.
Rta: V__/F__
17. Debemos utilizar siempre la distribución t, y no la distribución normal, cuando se desconoce la desviación
estándar de la población.
Rta: V__/F__
18.Cuando se utiliza la distribución t para hacer estimaciones, se debe suponer que la población es
aproximadamente normal.
Rta: V__/F__
19. No siempre es deseable utilizar niveles de confianza altos, debido a que producen intervalos de confianza
grandes.
Rta: V__/F__
20. Existe una distribución t distinta para cada posible tamaño de muestra. Rta: V__/F__
21. Una estimación puntual a menudo resulta insuficiente, porque sólo puede ser correcta o incorrecta.
Rta: V__/F__
22. Se dice que una media de muestra es un estimador no sesgado o imparcial de una media de población debido
a que ningún otro estimador podría extraer de la muestra información adicional acerca de la media de la población.
Rta: V__/F__
𝑝.(1−𝑝)
22. El error estándar de la población se calcula como √
𝑛
Rta: V__/F__
23. El número de grados de libertad que se utilizan en una estimación de distribución t es igual al tamaño de la
muestra.
Rta: V__/F__
24. Conforme aumenta el tamaño de la muestra, la distribución t se aproxima menos a una distribución normal.
Rta: V__/F__
25.Conforme aumenta el ancho de intervalo de confianza, el nivel de confianza asociado con el intervalo también
se incrementa. Rta: V__/F__
2. Suponga que se preguntó a 200 miembros de un grupo si les gusta o no un producto en particular. 50 dicen que
sí y 150 dicen que no. Suponiendo que “sí” significa un éxito, ¿cuál de las siguientes es correcta?
a) 𝑝̅ = 0.33.
b) 𝑝̅ =0.25.
c) 𝑝̅ =0.33.
d) 𝑝̅ =0.25.
e) b) y d), solamente.
3. Suponga que está tomando una muestra y calcula es 100. Después calcula el límite superior de un intervalo de
confianza del 90% para m ; su valor es 112. ¿Cuál es el límite inferior de este intervalo de confianza?
a) 88.
b) 92.
c) 100.
d) No se puede determinar a partir de la información proporcionada
4. Después de tomar una muestra y calcular 𝑥̅ y s, un especialista en estadística dice: “tengo el 88% de certeza de
que la media de la población está entre 106 y 122”. ¿Qué es lo que quiere decir en realidad?
a) La probabilidad de que µ se encuentre entre 106 y 122 es de 0.88.
b) La probabilidad de que µ = 114, el punto medio del intervalo, µ5.
c) El 88% de los intervalos construidos que fueron calculados a partir de las muestras de tamaño “n” contendrá
el parámetro poblacional µ
5. ¿Cuál de las siguientes es una condición necesaria para utilizar una tabla de distribución t? a) n es pequeño.
b) Se conoce el desvio muestral , pero no el poblacional .
c) La población es infinita.
d) Todos los anteriores. e) a) y b), pero no c).
6.Suponga que intentamos estimar una varianza de población utilizando 𝜎 2 . No es correcto calcular S2 como ∑(x
– 𝑥̅ )2/n debido a que el valor sería:
a) Sesgado.
b) Ineficiente.
c) Inconsistente.
d) Insuficiente.
7. Suponga que, de una población con N 5 50, se toma una muestra de tamaño 15; se sabe que 𝜎 2 es igual a 36 y
que S 2 para la muestra es 49; la x para la muestra se calcula en 104. ¿Cuál de las siguientes deberá utilizarse para
calcular un intervalo de confianza del 95% para µ?
a) La distribución t de Student.
b) La distribución normal.
c) Multiplicador de población finita.
d) a) y c), pero no b).
e) b) y c), pero no a).
8.. Podemos utilizar la distribución normal para representar la distribución muestral de la población cuando:
a) El tamaño de la muestra es mayor que 10.
b) El tamaño de la muestra es menor que 50.
c) El tamaño de la muestra es mayor que 5.
d) Ninguno de los anteriores.
9. Se sabe que la calificación promedio de los 25 estudiantes del curso de matemáticas de quinto año del colegio
High College es de 66 puntos. Al elaborar un intervalo de confianza del 95% para la calificación promedio de
todos los alumnos del quinto año, deberíamos usar:
a) La distribución normal con 24 grados de libertad.
b) La distribución t con 24 grados de libertad.
c) La distribución t con 65 grados de libertad.
d) La distribución t con 25 grados de libertad.
95
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
10. Cierta población con distribución normal tiene una desviación estándar conocida de 1.0. ¿Cuál es el ancho
total de un intervalo de confianza del 95% para la media de la población?
a) 1.96.
b) 0.98.
c) 3.92.
d) No se puede determinar con la información proporcionada.
1. Un solo número que se utiliza para estimar un parámetro de población desconocido es un(a)
__________________
2. Un intervalo de valores que se utiliza para estimar un parámetro de población desconocido es un(a)
____________________________
3. Una vez que sabemos algo acerca de una muestra, el número de valores de la muestra que podemos
especificar libremente se conoce como _________________
5. Cuando damos una estimación de intervalo de un parámetro de población, hacemos notar qué tan seguros
estamos de que el intervalo contiene al parámetro real de la población, estableciendo
un________________________________
96
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN
NORMAL DESCONOCIDA
AL
DESVÍO DESVÍO
DESVÍO DESVÍO
CONOCIDO DESCONOCIDO
CONOCIDO DESCONOCIDO
DISTRIBUCIÓN NORMAL
DISTRIBUCIÓN NORMAL
97
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
RECORDAR: Para la estimación del IC de la Varianza : expresa Newbold en “Estadística para Administración y Economía”
que es peligroso hacer la estimación cuando la población no sigue una distribución normal. La validez del estimador de un
intervalo de la varianza depende mucho más del supuesto de la normalidad que la del estimador de un intervalo de la media
poblacional.”
DISTRIBUCIÓN NORMAL
LA ÉTICA EN LA ESTADÍSTICA
98
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
DISTRIBUCIÓN EN EL MUESTREO
“No diga: He hallado la verdad, sino he hallado una verdad” Kahlil Gibran
La prueba de hipótesis comienza con una afirmación o suposición acercad de un parámetro poblacional.
HIPOTESIS NULA - Ho -
El planteo de la hipótesis comienza con la denominada Hipótesis Nula –Ho – cuyo subíndice 0
indica no hay diferencia, no hay cambio y convenimos (por convención general en la mayoría
de la literatura estadística) que tiene que contener el signo igual por lo que se trata de la
afirmación de algo.
Es el punto de partida del investigador. Mantiene el status quo
99
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
La hipótesis nula siempre tiene el signo igual y NUNCA el igual aparecerá en la hipótesis
alternativa, porque la Ho es la afirmación y cuando se realizan los cálculos se requiere de un
valor específico.
La Ho es una afirmación que no se rechaza a menos que exista evidencia muestral que nos lleve
a rechazarla, es decir a no aceptarla.
Ahora bien, si la evidencia muestral nos lleva a aceptarla, no significa que sea la Ho verdadera,
sino que no encontramos evidencia suficiente para rechazarla. Para probar que sea la H o
verdadera tendríamos que hacer un censo de la población.
Por ese motivo, cuando se concluye “Aceptar la Ho” en realidad se debe decir “No se rechaza la
“Ho” ya que no se encontró evidencia muestral suficiente que permita rechazarla.
Se concluye expresando: Existe evidencia muestral que indica que la hipótesis nula …….
PARAMÉTRICO NO PARAMÉTRICO
o Requieren hipótesis con respecto a parámetros o La prueba no necesariamente se relaciona con
poblacionales parámetros poblacionales
o El nivel de medición, debe permitir operaciones o Los datos no tienen fuerza suficiente como para
aritméticas que tengan significado (escala de recomendar operaciones aritméticas con
medición intervalar o de razón) verdadero significado (escala de medición
inferiores a la de intervalos)
Tener en cuenta que si los datos son numéricos, utilizar pruebas no paramétricas hacen desperdiciar información.
100
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Lo importante también, es que sirven las no paramétricas para muestras en donde no es posible verificar los supuestos
de las paramétricas para muestras chicas.
Decisión Situación
Estadística Ho –Verdadera- Ho –Falsa-
No rechazar Ho
Rechazar Ho
DE
CORRIDA
101
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
LOS 6 PASOS EN LA
PRUEBA DE HIPÓTESIS
a) Establecer
1. Establecer
hipótesis nula H0
hipótesis alternativa H1
2. Elegir
nivel de significación -máximo riesgo tolerable
de rechazar incorrectamente la H0
tamaño de la muestra
n
3. Determinar
- el estadístico estandarizado de prueba: Z, T, X2
como único número calculado a partir de los datos muestrales
- el valor p: probabilidad calculada usando el estadistico de prueba
4.Hallar
el o los valores críticos, que divide en dos regiones,
rechazo, aceptación de la hipótesis nula
1) Exprese en cada caso, si está bien planteada la hipótesis estadística (V ó F) y por qué. Luego, en
cada caso, exprese el tipo de test a utilizar (bilateral, unilateral contra mayor, unilateral contra
menor) con la representación gráfica.
a) Ho : µ > 200 g) H1 : µ = 200
b) Ho: 𝑥 ̅ = 350
h) Ho: p 0,80
c) Ho : µ = 2
i) H1 : p 1,80
d) H1 : x 0,80 j) H0 : p 0,80
e) Ho: : x <4320 k) H1: µ ≠200
f) Ho: µ < 350
Rta: V: c); j) y k; Test bilateral –contra distinto-: b) ; c) g) y k); Test
unilateral contra mayor: e); f) h) y j). ; Test unilateral contra menor: a); d); i)
2) En el envase de las barras de arroz con semillas de amaranto, chia y sésamo de 12 gramos se informa que
aporta 46 calorías. Responda a las preguntas relacionadas con un test de hipótesis para probar lo expresado
en el envase sobre las calorías. a) Plantee el Ho y la H1 adecuada b) En esta situación, interprete ¿cuál es
el error de tipo I y las consecuencias que genera cometer este tipo de error? c) ¿cuál es el error de tipo II y
las consecuencias de cometer este tipo de error?
3) Se está evaluando implementar un nuevo método de enseñanza si mediante una prueba de hipótesis se
confirma la conclusión de que el nuevo método de enseñanza reduce la proporción de ausentismo en la
materias. a) Plantee la hipótesis nula y la alternativa si la proporción de ausentismos actual en la materia
es del 30% b) En esta situación, interprete ¿cuál es el error de tipo I y las consecuencias que genera cometer
este tipo de error? c) ¿cuál es el error de tipo II y las consecuencias de cometer este tipo de error?
1) En una compañía que vende todo a crédito, se sabe que el valor medio de la totalidad de las cuentas por cobrar
es de $ 2600 con una desviación estándar de $430. Para ello, el auditor de la misma tomará una muestra de 36
cuentas y rechazará el supuesto de $ 2600 solo si es claramente contradicho por la media muestral.
Plantee la hipótesis nula de esta prueba y la hipótesis alternativa. Especifique el tipo de test b) Especifique el nivel
de significancia c) Seleccione el estadístico de la prueba d) Establezca los valores críticos de la estadística de
prueba e) Sabiendo que la muestra arrojó un valor medio de cuentas por cobrar de $ 2400. ¿Acepta la hipótesis
con un error de tipo I del 5%? Además, Halle el valor del estadístico de prueba : (en función a los valores observados
en la muestra):teórico y empírico
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que las ventas a crédito tienen un valor medio diferente a $ 2600.
2) Con relación a los datos anteriores, al auditor anterior no le interesa el promedio de la totalidad de las cuentas
por cobrar que excedan los $ 2.600 sino que está preocupado por las cuentas a cobrar menores a $ 2600.
a) Plantee la hipótesis nula de esta prueba y la hipótesis alternativa. Especifique el tipo de test
b) Especifique el nivel de significancia c) Seleccione el estadístico de la prueba d) Establezca los valores críticos
de la estadística de prueba e) Sabiendo que la muestra arrojó un valor medio de cuentas por cobrar de $
2400.Acepta la hipótesis a un nivel de significancia del 5% Además, Halle el valor del estadístico de prueba :
(en función a los valores observados en la muestra):teórico y empírico
103
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que las ventas a crédito tienen un valor medio menor a los datos anteriores que eran de $
2600. La decisión es informar a la compañía que las ventas a plazo han bajado.
3)Los ingresos promedio anuales para determinado cargo son de $ 670 miles para las mujeres. El Sindicato decide
investigar si es cierto el reclamo presentado por un grupo de mujeres sobre la diferencia de sexo para las
remuneraciones. Se pregunta ¿los varones tienen ingresos promedio mayor a las mujeres? Si tomada la muestra a
40 varones dio un promedio de $ 725 miles con un desvío de $ 102 miles. Considerando un nivel de significancia
del 1% determine si será cierto lo que el investigador está investigando frente al reclamo presentado.
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 1%. Luego,
se concluye que las remuneracioes promedio de los varones son mayores que la de las mujeres. La
Probabilidad de que se tome una decision incorrecta es del 1%
4)El rendimiento diario de la soja ha promediado 880 toneladas en un determinado lugar del Gran Buenos. A la AFIP
le gustaría conocer si este promedio cambió en los meses recientes. Los inspectores seleccionan al azar de la base
de contribuyentes sojeros 50 días y surge como rendimiento diario medio de 871 toneladas con desvío muestral
de 21 toneladas. Contraste la hipótesis con un 5% de nivel de significancia.
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que el rendimiento diario promedio de soja de los valores informados de 880 toneladas.
5)En los estuches de las lámparas se especifica que el ciclo medio de vida útil de esas lámparas de bajo consumo es
de 4200 horas. Como estudio preliminar, ante reiterados reclamos de los consumidores una empresa decide
investigar la situación planteada a partir de una muestra que le ayuda a determinar si el consumo de las lámparas
actualmente es menor a las especificaciones del producto.
Tomada una muestra de 10 lámparas, se extrae que el ciclo medio es de 4000 horas con una desviación estándar
muestral de 200 horas. Dado que el ciclo de vida útil de las lámparas sigue una distribución normal. Probar la
hipótesis nula a nivel de significancia del 5%.
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que el ciclo medio de vida útil de las lámparas es menor al informado en el producto, razón
por la cual se toma la decision de realizer una reunion con el Sector de Producción y de Calidad, para
tomar las medidas correctivas.
6)Se quiere determinar si el proceso de llenado de una caja chica de arroz yamaní funciona de manera adecuada,
es decir que el llenado medio a lo largo de todo el proceso de empaque continúa en 368 gramos especificado en la
caja y no se requiere acción correctiva. Para evaluar el requisito de 368 gramos conociendo además el desvío
estándar poblacional de 15 gramos proveniente de una población normal el gerente de empaque selecciona al azar
una muestra de 25 cajas, pesa cada caja, registra los valores- Procesados los mismos, da una media muestral de
372,5 gramos y debe evaluar la diferencia existente entre el estadístico de la muestra y el parámetro poblacional
establecido. A un nivel de significancia del 5% ¿cuál es la conclusión?
Rta: Existe evidencia muestral suficiente para aceptar la Ho al nivel de significancia del 5%. Luego,
se concluye que el proceso de llenado del arroz funciona de manera adecuada, pues en promedio el
contenido es de 368 gramos con un nivel de significancia del 5%
7)Usted como gerente de Kansas quiere determinar si el tiempo de espera al pedir una orden se ha modificado
durante el último año respecto a su valor de media poblacional de 4,5 minutos. Los tiempos de espera siguen una
Distribución Normal. A partir de experiencias anteriores, se supone que la desviación estándar poblacional es de
1,2 minutos. Seleccionada una muestra aleatoria de 25 pedidos u órdenes en el transcurso de una hora, la media
muestra es de 5,1 minutos.
Determine si hay evidencia muestral que indique con un nivel de significación del 5% que el tiempo de espera medio
para servir un pedido se ha modificado.
Rta: Existe evidencia muestral suficiente para rechazar la H o al nivel de significancia del 5%. Luego,
se concluye que a un nivel de significancia del 5% los tiempos de espera se han modificado de la media
de 4,5 minutos. Sería conveniente, comprobar si los tiempos se redujeron demostrando una eficiencia
104
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
8)Un auditor decide probar el supuesto de que el valor medio de la totalidad de las cuentas por cobrar de clientes
chicos de una Pyme es de $ 260 con una desviación estándar de los montos de las cuentas por cobrar de $ 43,
tomando una muestra de 36 cuentas de clientes chicos y calculando la media muestral. El auditor desea rechazar
el valor supuesto de $260 solo si es claramente contradicho por la media muestral, caso éste en el que el valor
hipotético recibiría el beneficio de la duda en el procedimiento de prueba. Para ello fija un nivel de significancia del
5%. a) ¿Cuáles son las conclusiones del auditor si una vez obtenida la muestra de 36 clientes chicos, la misma arroja
una media de cuentas a cobrar de $240?
Rta: Existe evidencia muestral suficiente para rechazar la Ho al nivel de significancia del 5%. Luego,
se concluye que el valor medio de las cuentas a cobrar es de $260 La probabilidad de que se tome una
decision incorrecta es del 5% y en este caso el auditor puede concluir que los valores informados por
la empresa son razonables y abrir otra auditoria de dicha cuenta.
9)Recientemente una empresa que realiza ventas de lámparas para proyectores ha recibido numerosos reclamos
respecto a que la duración de los repuestos es inferior a 1000 días comprometidos en el prospecto. Toma una
muestra al azar de 9 lámparas y el promedio de vida útil de las lámparas según la muestra de 9 lámparas es de 973
días y el desvío es de 37,50 días. Se pide: a) Realice la prueba a un nivel de significación del 1%, b) Realice la prueba
a un nivel de significación del 5% considerando que la duración de los repuestos de lámparas para proyectores sigue
una distribución aproximadamente normal. c) Determinar la potencia del test considerando que la verdadera
duración promedio es de 990 días.
Rta: a) No se dispone de un test paramétrico por falta de conocimiento de la forma de distribución de
las lámparas. b) Existe evidencia muestral suficiente para rechazar la H o al nivel de significancia del
5%. Luego, se concluye que la duración de las repuestas de lámparas para proyectores es menor. La
probabilidad de que se tome una decisión incorrecta es del 5%. La decisión lleva a presentar un informe
a la Gerencia de Control de Calidad para que tome las medidas correctivas.
10)Usted está convencido de que su instrumento de medición tiene una variabilidad medida por la desviación
estándar σ=2. D. Normal. Se considerará un erro r de tipo I del 10% para probar la hipótesis. Un experimento
realizado registró las siguientes medidas: 4,1; 5,2 y 10,2. ¿Qué conclusiones extrae usted a partir de la evidencia de
esta muestra aleatoria?
Rta: a) Existe evidencia muestral que indica no rechazar la Ho al nivel de significancia del 10%.
Luego, se concluye que el instrumento de medición no registra variabilidad diferente a la de la hip.nula.
11)En el restaurante Clo-Clo el 20% de los clientes al mediodía son mujeres. Para incrementar la proporción de
mujeres se realiza un menú (2*1). Un mes después de realizada la promoción se realiza un estudio observacional
para determinar si la proporción de mujeres aumento. Usando un nivel de significancia del 5% ¿qué concluye?
Considere una muestra de 400 clientes en las que 100 son mujeres.
Rta: a) Existe evidencia muestral suficiente para rechazar la H o al nivel de significancia del 5%. Luego, se
concluye que la publicidad del 2*1 generó un aumento de clientes mujeres, por lo que le resultaría favorable en
los ingresos del restaurante.
12)En una empresa que arma autopartes piensa el Supervisor que existe demasiada variabilidad en el tiempo de
vida útil de los que están armadas durante el turno de los fines de semana. Se sabe que el ciclo de armado funciona
correctamente y deberían durar dichas autopartes 45000 horas con una desviación estándar de 4000 hs. Un
Supervisor encargado de hacer una prueba para determinar si la variabilidad de las autopartes armadas que se hace
en el turno de los fines de semana supera al de la variabilidad del resto de los días, por ello, toma una muestra de
12 autopartes armadas que arrojaron una desviación estándar de 4120 hs. Considerando un nivel de significancia
del 2,5% ¿qué conclusiones extrae?
Rta: Como el valor empírico resulta menor al valor teórico, se acepta la hipótesis nula a un nivel de significancia
del 2,5% . Por lo tanto, existe evidencia muestral que indica que la variabilidad de los tiempos de vida útil del
armado de auto-partes no supera 4000 hs, con un nivel de significancia del 2,5%. Por ello, no sería cierta la
sospecha del Supervisión acerca del funcionamiento incorrecto del ciclo de armado durante los fines de semana.
105
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
13)Se desea conocer a un nivel de significación del 10% si el desvio estándar del peso de las mermeladas de
arándanos para la exportación difieren del límite aceptable de 1,7 kg. por lote. Para ello, se toma una muestra de
25 lotes la que arroja una desviación estándar de 2,2 kg.
Rta: Como el valor empírico se encuentra fuera de los valores críticos o teóricos , se rechaza la hipótesis nula
a un nivel de significancia del 10% . Existe evidencia muestral que indica que el desvío de los pesos de las
mermeladas de arándanos difieren del límite acceptable de 1,7 kg. por lote , con un nivel de significancia del
10%. Consecuentemente, se debe advertir a los responsables de la firma para que generen medidas correctivas.
14)El Departamento de Control de Calidad de una fábrica de cosméticos afirma que el porcentaje de defectos
supera el límite tolerable del 1%. Por ende, se hace una prueba seleccionando 100 envases de los cuales resultaron
con defectos 5 de ellos y se considera un error del tipo I del 2,5%. Determine si es cierta la afirmación del
Departamento de Calidad que lo lleva a realizar esta investigación.
Rta: Como el valor empírico resulta mayor al teórico , se rechaza la hipótesis nula a un nivel de significancia
del 2,5% . Existe evidencia muestral que indica que la proporción de defectos en los cosméticos supera el límite
tolerable del 1%, con un nivel de significancia del 2,5%. Consecuentemente, se debe advertir a los responsables
de la firma para que generen medidas correctivas.
15)Sushi Club ofrece un servicio a domicilio en donde le garantiza al cliente una puntualidad en el tiempo medio de
entrega, por lo que le dice que la entrega es inferior a los 10 minutos. Por otro lado, el Servicio de Personal de Sushi
Club decide dar un premio a fin de año como estímulo a sus empleados, si es cierto que eso sucede. Por tal razón
desea investigar si se mantiene la leyenda de Sushi Club , es decir que la entrega es menor a los 10 minutos. De
los 250 pedidos del día, se tomó una muestra de 20 pedidos calculándose un tiempo medio de 8,5 minutos y un
desvio estándar de 1,3 minutos. Admitiéndose que los tiempos se distribuyen normalmente, con un nivel de
significación del 3% concluya su informe comunicando si es cierta la hipótesis nula y que decisión deberá tomar
Personal.
Rta: Como el valor empírico es menor al valor crítico o teórico , se rechaza la hipótesis nula a un nivel de
significancia del 1% . Existe evidencia muestral que indica que con un nivel de significancia del 1% que la
publicidad que realiza Sushi Club está en lo cierto y por lo tanto Personal podrá dar un premio a fin de año a
sus empleados.
16)En una publicidad de un lavarropas se expresa que a lo sumo el 3% de los lavarropas de marca “GENIUS”
requieren servicio técnico antes del segundo año de uso. Para comprobar dicha publicidad, dada la cantidad de
reclamos de consumidores a la Organización de Derechos del Consumidor, ésta sospecha que los lavarropas de
maca “Genius” que requieren servicio técnico antes del segundo año de uso son más que el 3% que lo publicitado
por esa marca. Por ende, la O.D.C. realizó encuestas a 150 personas que compraron la marca GENIUS de lavarropas
solicitándoles informen si “solicitaron servicio técnico dentro de los dos años de la compra del producto”.
Procesadas las encuestas, se detectó que las respuestas afirmativas ha sido 15. ¿Qué conclusiones puede extraer
con un nivel de significancia del 1,0%?
Rta: Como el valor empírico es mayor al valor crítico o teórico , se rechaza la hipótesis nula a un nivel de
significancia del 1% . Existe evidencia muestral que indica que con un nivel de significancia del 1% que el
porcentaje de lavarropas que requieren servicio técnico antes de los dos años es mayor a lo que dice la publicidad
17)Una empresa controla la calidad de sus productos, porque la exportación de los mismos se concreta si el
porcentaje de productos en mal estado es menor al 3%. Para despachar un lote y verificar que está en condiciones
de exportación se toma una muestra de 500 productos de los 4000 productos que conforman el lote de exportación
y se detectaron 12 productos en mal estado. ¿Cuál es la decisión que toma el encargado de calidad ¿despacha la
mercadería porque se ha comprobado que el lote está en buenas condiciones de exportación? Considere un error
de tipo I del 5%. Realice un test contra menor, por lo que se le pide plantee las hipótesis en función al tipo de test
solicitado.
Rta: Como el valor empírico es mayor al valor crítico o teórico,no se rechaza la hipótesis nula a un nivel de
significancia del 5% . Existe evidencia muestral que indica que con un nivel de significancia del 5% que la
proporción de artículos en mal estado es mayor al 3%. Por lo tanto en esas condiciones no se podrá exportar.
106
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO DE
CONCEPTOS DE INFERENCIA ESTADÍSTICA CON TEST DE HIPÓTESIS
Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser Falso, modifique
el texto de forma tal que se haga Verdadero.
1. La estadística de prueba es una variable aleatoria cuyo valor se calcula a partir de los datos muestrales y al ser
nuestro valor empírico se usa para tomar la decisión de rechazo o no rechazo de la hipótesis nula. Rta: V_/F_
3. Cuando se plantea la hipótesis y se concluye siempre se lo hace sobre la hipótesis alternativa. Rta: V_/F_
4. La Distribución 𝜒 2 es una distribución sesgada cuya forma depende exclusivamente de los grados de libertad.
Rta: V_/F_
5. La estadística de prueba sigue una Distrib. “t” con n-1 grados de libertad y se usa para una muestra en donde
los datos son tomados de manera independiente y representan una muestra aleatoria de tamaño chico, de una
distribución poblacional está distribuida normalmente cuyo desvío poblacional se desconoce. Rta: V_/F
9. Alfa es la medida del área bajo la curva del puntaje estándar que se encuentra en la región de rechazo para la
hipótesis nula. Rta: V_/F_
10. El riesgo de cometer un error tipo I está directamente controlado en una prueba de hipótesis en donde el
investigador establece un nivel para α. Rta: V_/F_
11. Si la estadística de prueba cae en la región crítica, la hipótesis nula ha sido probada verdadera. Rta: V_/F_
12. Cuando la estadística de prueba t y el número de grados de libertad se hacen muy grandes, el valor crítico de t
es muy cercano al de la Z normal estándar. Rta: V_/F_
14. La distribución muestral de la proporción está distribuida aproximadamente como una distribución t de Student.
Rta: V_/F_
15. En la prueba de hipótesis, suponemos que algún parámetro de población toma un valor particular antes de
muestrear. Esta suposición que se va a probar se denomina hipótesis alternativa. Rta: V_/F_
16. Suponiendo que una hipótesis dada acerca de la media de una población es correcta, el porcentaje de medias
muestrales que pudieran caer fuera de ciertos límites de esta media hipotética se denomina nivel de significancia.
Rta: V_/F_
17. En la prueba de hipótesis, la distribución de probabilidad apropiada es siempre la distribución normal.
Rta: V_/F_
18. Si cometiéramos un error tipo I, rechazaríamos una hipótesis nula cuando realmente es verdadera. Rta: V_/F_
107
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
19. Una prueba en la escala sin procesar o en la escala estandarizada nos lleva a la misma conclusión. Rta: V_/F_
20. Sí 1.96 es el valor crítico de z, entonces el nivel de significancia de la prueba es 0.05. Rta: V_/F_
21. Si nuestras hipótesis nula y alternativa son H0: µ≥80 y H1: µ <80, es apropiado utilizar una prueba de cola
izquierda. Rta: V_/F_
22. Si la media de muestra estandarizada está entre cero y el valor crítico, entonces no se rechaza H 0. Rta: V_/F_
23. El valor ( 1 – β ) se conoce como la potencia de la prueba y significa la probabilidad de aceptar la hipótesis nula,
dado que ésta es verdadera. Rta: V_/F_
24. Después de realizar una prueba de una cola y rechazar H 0, se da cuenta de que debió haber hecho una prueba
de dos colas, al mismo nivel de significancia. También rechazará H0 para esa prueba. Rta: V_/F_
25. Elegir el nivel de significancia apropiado es más fácil que elegir la prueba correcta que se debe utilizar.
Rta: V_/F_
26. Existen métodos matemáticos que garantizan que el nivel de significancia seleccionado siempre será el adecuado.
Rta: V_/F_
27. La prueba de hipótesis nos ayuda a sacar conclusiones sobre parámetros estimados por la muestra Rta: V_/F_
28. Una prueba de hipótesis será útil para determinar si una media de población es 45 o 60 (es decir, H0: µ=45; H1:
µ=60). Rta: V_/F_
29. Es apropiado utilizar la potencia de una prueba de hipótesis sólo con pruebas de una cola. Rta: V_/F_
30. La hipótesis nula siempre tiene el signo igual porque se trata de la afirmación a probar y cuando se realizan los
cálculos se requiere de un valor específico. Rta: V_/F
31. Un test paramétrico debe realizarse con datos cuyos niveles de medición sean por intervalos o bien de razón.
Rta: V_/F
32. El supuesto para un test de hipótesis en el caso de una muestra chica es que las observaciones que componen la
muestra sean independientes entre sí y que esa muestra tomada provenga de una población normal o
aproximadamente normal. Rta: V_/F
1. Un fabricante de automóviles importante ha tenido que retirar varios modelos de su línea 1993 debido a problemas
de control de calidad que no fueron descubiertos con los procedimientos finales de inspección aleatoria. Éste es un
ejemplo de:
a) Error tipo I.
b) Error tipo II.
c) Error tipo I y error tipo II.
d) Ningún tipo de error.
108
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2. Si n = 24 y α = 0, 05, entonces el valor crítico de t para probar las hipótesis H 0: µ≥ 38 y H1: µ < 38 es:
a) 2.069
b) 1.714.
c) -1.714.
d) 22.069.
3. Para probar hipótesis acerca de la media de una población normal con desviación estándar conocida, podemos
comparar:
a) El valor observado de x con el valor crítico de x .
b) El valor observado de x con el valor crítico de z.
c) El valor observado de z con el valor crítico de x .
d) El valor observado de z con el valor crítico de z.
e) Cualquiera de a) o d).
4. Suponga que deseamos probar si una media de población es significativamente mayor o menor que 10.
Tomamos una muestra y encontramos x = 8. ¿Cuál debe ser nuestra hipótesis alternativa?
a) m < 10.
b) m ≠ 10.
c) m > 10.
d) No puede determinarse de la información dada.
5. Suponga que se realiza una prueba de hipótesis para un proceso en el que un error tipo I puede ser muy costoso,
pero un error tipo II puede resultar relativamente barato y sin importancia. ¿Cuál de los siguientes sería la mejor
elección para a en esta prueba?
a) 0.01.
b) 0.10.
c) 0.25.
d) 0.50.
e) Ninguno de los anteriores.
6. Cuando usamos la proporción de la muestra p para probar las hipótesis H0: p = 5 pH0 y H1: p ≠ pH0, el error
estándar de p es:
(1−𝑝).𝑞
a) √
𝑛
(1−𝑝).𝑞
b)
𝑛
𝑝ℎ𝑜 .𝑞ℎ𝑜
c) √
𝑛
(1−𝑝).𝑞
d)
𝑛
e) e) Ninguno de los anteriores.
7. Para una prueba de hipótesis de dos colas, con a α = 0,10, la región de aceptación es toda la región:
a) A la derecha del valor crítico negativo.
b) Entre los dos valores críticos.
c) Fuera de los dos valores críticos.
d) A la izquierda del valor crítico positivo.
8. La distribución normal es la distribución apropiada para usar al probar hipótesis respecto a:
a) Una proporción, cuando npH0 > 5 y nqH0 > 5.
10. Cuando la hipótesis nula es H0: µ = 67, la hipótesis alternativa puede ser:
a) H1: µ ≥ 67.
b) H1: µ < 67.
c) H1: µ ≠ 67
d) H1: µ ≠ 40.
e) Ninguno de los anteriores.
11. Con un nivel de significancia más bajo, la probabilidad de rechazar una hipótesis nula que de hecho es cierta:
a) Disminuye.
b) Permanece igual.
c) Se incrementa.
d) Todos los anteriores.
3) Con el fin de usar la distribución t para probar hipótesis acerca de la media de una población, utilizando
una muestra chica debe suponerse que la población tiene una distribución______________ y que su
desviación estándar es ______________.
4) Para estar seguros de que la prueba de hipótesis trabaja correctamente, es mejor que el valor de (1-β) esté
tan cerca de ______________como sea posible.
7) Aceptar una hipótesis nula cuando es falsa constituye un error tipo ______________ y su probabilidad se
identifica con ______________.
9) Una prueba de hipótesis que involucra dos regiones de rechazo se conoce como una prueba de dos
______________.
12. 45. Si la hipótesis nula es µ ≤ 10 y la hipótesis alternativa es µ > 10, la prueba apropiada para este caso sería una
prueba ______________.
110
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
LA ÉTICA EN LA ESTADÍSTICA
de selección
Tipo de datos
Tipo de análisis
Cuantitativos Categóricos
Recomendación: Como en esta guía hemos visto prueba de hipótesis para una sola muestra. Se recomienda a partir de la
bibliografía del Programa trabajar con dos muestras para Probar hipótesis de diferencias de medias, de varianzas, de
proporciones.
111
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Es un número que expresa la variación relativa del precio, la cantidad o el valor, en comparación con un
período base (Lind,)
Es un indicador que sirve para comparar, para poner se relieva cambios en una variable –indice simple- o
cambios en un grupo de variables relacionadas con respecto al tiempo.
PROPIEDADES
IDENTIDAD Si coinciden el Índice del periodo base I(o) y el de comparación I(p); es decir
𝐼(𝑝)
Igual a 100 cuando el índice está expresado en porcentajes. En consecuencia = 1.
𝐼(𝑜)
Ej. Si el Índice de precios a una fecha 2014 de un determinado producto es 123,40
𝐼(𝑝)2014 123,40
La identidad se comprueba porque: I2014/2014= = =1
𝐼(0)2014 123,40
propiedad cíclica. Si Incorporamos un período –en este caso: año- intermedio, 2014
I(p)2014 =115,5
𝐼(𝑝)2015 𝐼(𝑝)2014 118,97 115,50 𝐼(𝑝)2015
Es decir: I2015/2013= ∗ = ∗ = 1,08155
𝐼(0)2014 𝐼(0)2013 115,5 110,00 𝐼(0)2013
EXISTENCIA El índice debe tomar valores reales y finitos para cualquier valor de la
variable observada
112
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
INDICE PONDERADOS
o INDICE DE PRECIOS DE LASPEYRES
o INDICE DE PRECIOS DE PAASCHE
o INDICE DE FISHER
o OTROS
113
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
114
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
115
GUIA PRÁCTICA DE EJERC. BÁSICOS y ORIENTACIONES de ESTADÍSTICA –FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
116
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Los resultados son: 1) a. 103,39 b= 102,15 2) Base junio 1995. Mayo: 100,06; junio: 100;
JULIO 99,46 Y AGOSTO 99,37 - B) BASE AGOSTO 1995. Mayo: 100,68, julio: 100,62, julio
100,08 y agosto: 100. c) La reversión cronológica es una prueba en donde el índice del periodo t con base
0 multiplicado el índice del periodo 0 con base t debe dar 1. Por ej. Índice de agosto (base junio) da 99,37
117
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
y el índice de junio (base agosto) da 100,62. El producto de ambos es 1. 3) Ind. Passche: 103,98 - Ind.
Laspeyres 103,69 - Cantidad Laspayeres 108,51 y Cantidad Fisher 108,8'0
C – INDICE DE VALOR
En función a los datos del ejercicio 3 del punto C. Calcule los Indices de Valor Base 2008-
D - EMPALME DE INDICES
4) Dado los siguientes indices efectuar el empalme de las series, llevando los índices a
la base 1990=100
Años Indice Base Nuevo Indice
1982=100 Base 1990=100
1986 100
1987 104
1988 106
1989 110
1990 115 100
1991 102
118
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO DE
CONCEPTOS TEÓRICOS DE NÚMEROS ÍNDICES
Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser falsos
corregir para transformarlo en verdadero
3. Un índice de valores mide los efectos combinados de los cambios en precios y cantidades.
V:__F:__
4. Siempre se encuentra un número índice al obtener el cociente entre un valor actual y un valor
base y multiplicar por 100. V:__F:__
7.No ponderado se refiere a que todos los valores que son utilizados para calcular el índice
tienen igual importancia. V:__F:__
8. La desventaja del índice de Laspeyres es que no considera los cambios que se producen en los
patrones de consumo V:__F:__
9. El índice de Fisher es la media aritmética de los índices de Laspeyres y de Paasche.
V:__F:__
Seleccione la opción que considera Verdadera
1. Las mercancías sujetas a variaciones considerables de precio se pueden medir mejor mediante:
a) El índice de precios. b) El índice de cantidad. c) El índice de valor d) Ninguno de los anteriores.
RTA: _____
2. Los pesos utilizados en un índice de cantidad son: a) Porcentajes de la cantidad total. b) Precios.
c) Un promedio de cantidades. d) Ninguno de los anteriores. RTA : ______
1. Si todos los valores considerados al calcular un índice tienen igual importancia, el índice es
_____________________
2. El método de índice ponderado en el cual las cantidades consumidas durante el periodo base
se usan como pesos es el método _____________________.
3. El método que utiliza las cantidades consumidas en el periodo actual en cuestión cuando se
calcula un índice ponderado es el de _____________________.
4. Los tres tipos principales de índices son el índice_____________________ , el índice
_____________________y el índice_____________________.
119
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Recordemos:
CORRELACIÓN
Es el grado de interconexión entre variables que intenta determinar con qué precisión describe o
explica la relación entre variables la ecuación lineal o de cualquier otro tipo.
CORRELACIÓN LINEAL
Si X e Y son las dos variables para analizar, un “DIAGRAMA DE DISPERSIÓN” muestra la
localización de los puntos (X, Y) sobre un sistema rectangular de coordenadas. Si todos los puntos
del diagrama de dispersión parecen estar en una recta, la correlación se llama lineal. Cuando más
cercanos estén en la recta será el valor de la correlación más cercano a 1 (en el caso de correlación
lineal positiva) o bien más cercano a -1 (en el caso de correlación lineal negativa).
CORRELACIÓN Y REGRESIÓN
120
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
CORRELACIÓN REGRESIÓN
Objetivo Medir la fuerza de relación lineal Predecir o estimar el valor poblacional
entre dos variables medio de una variable dependiente en
términos de valores conocidos (muestrales)
de la variable explicativa.
121
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
La REGRESIÓN
Técnica que permite establecer relaciones funcionales entre variables de tipo cuantitativas.
4) Cuáles son los pasos para determinar si existe una relación entre dos variables?
122
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
El objetivo es ajustar un modelo matemático (veremos que se trabajará con el modelo lineal simple)
a un conjunto de datos. Así, en el análisis de regresión veremos cómo utilizar el modelo
matemático para poder obtener la estimación y predicción.
Los pasos a seguir serán:
1°) Recolectar los datos que muestren los valores correspondientes de las variables cuantitativas.
3°) Visualizando los puntos podemos Trazar una curva aproximante, o sea una curva suave que
aproxima los datos.
Relaciones curvilíneas: la variable dependiente no cambia con una tasa constante con
incremento
123
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Fuente: Kazmier.
∑ 𝑋𝑌 = 𝑏 ∑ 𝑋 + 𝑚. ∑ 𝑋 2
Estas ecuaciones se llaman “ecuaciones normales para la recta de mínimos cuadrados”
La ecuación de regresión es una expresión matemática que define la relación lineal entre 2
variables X e Y.
124
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Se aclara que cuando los errores de predicción son grandes, que se daría en el caso general de los
pronósticos en la administración de negocios se debe considerar el error de predicción, en donde
se debe agregar al modelo matemático determinista una o más componentes aleatorias para
tomar en cuenta el error aleatorio e inexplicado de la predicción y se transforma el modelo
matemático determinista en modelo matemático probabilístico.
Principio de mínimos cuadrados es el criterio de bondad que establece “escoger como recta
de mejor ajusta aquella que minimiza la suma de los cuadrados de las desviaciones de los valores
observados respecto de los pronosticados. Es una técnica empleada para obtener la ecuación de
regresión y se consigue: Minimizando la suma de los cuadrados de las diferentes verticales entre
los valores Y verdaderos y los valores Ŷ pronosticados. Es un procedimiento estadístico que s e
utiliza para encontrar la recta de “mejor ajuste” para un conjunto de puntos.
( y).( x ) ( x. y).( x)
2
N .( x. y) ( x).( y)
b m
N .( x ) ( x) N .( x ) ( x)2
2 2
2
También ̅−𝒎𝑿
b=𝒀 ̅
Se reitera que no se puede hablar de relación causal entre X e Y, solamente podemos decir que
hay una asociación en donde si Y cambia cuando X varía y que puede ser posible lograr una mejor
predicción para Y al utilizar X y la recta de predicción, que simplemente utilizar Y ignorando a
X.
Para comprobar que la ecuación de estimación sea la correcta, podemos determinar los errores o
perturbaciones estocásticas o residuos individuales y sumarlos, dado que la suma de los errores
positivos y negativos debe dar cero.
125
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
La pendiente m= 7 nos dice que por cada incremento en la productividad predice un cambio
esperado en el índice de 7.0, nos indica que el índice predice incremento del 7% por cada 1% de
incremento en la productividad.
SUPUESTOS DE LA REGRESIÓN
Las cuatro suposiciones básicas de regresión (acrónimo LINE) son
Linealidad : la relación entre las variables es lineal
Independencia de errores: cuando se recolectan los datos, los errores deben ser
independientes. Es decir, hay situaciones en que los errores para un período específico a
menudo están correlacionados con aquellos del período anterior.
Normalidad: los errores se distribuyen normalmente en cada valor de X.
Igual Varianza (HOMOCEDASTICIDAD): la varianza de los errores es constante para
todos los valores de X.
DETERMINACIÒN DE LA VARIANZAS
Grafique las variaciones en el diagrama de dispersión y
TOTAL S.C.T.=
se eee
e 2
n2
126
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Es decir que el eee mide la dispersión de los valores de Y respecto de la línea de medias. A medida
que sea menor la variación de los valores de Y respecto a la recta de medias <o sea cuanto menor
sea el valor de σ >, tanto más cerca se encontrará la recta de mínimos cuadrados de la recta de las
medias.
Cuanto más grande es el eee, entonces mayor será la dispersión de los puntos alrededor de la
recta de regresión. El caso particular es que el eee de cero, en donde no hay dispersión de los
puntos, por ende, todos los puntos se encuentran sobre la línea de regresión.
Podríamos interpretar que si los puntos observados se distribuyen normalmente alrededor de la
línea de regresión, entonces podemos esperar que el 68% de los puntos caerían dentro de ±1𝑠𝑒 ;
el 95,5% de los puntos caerían dentro de ±2𝑠𝑒 y el 99,7% de los puntos caerían dentro de ±3𝑠𝑒 .
El eee también sirve para estimar un intervalo de predicción aproximada. Es decir si tenemos que
estimar un determinado valor de Y dado un valor (dentro del rango de la variable explicativa de
nuestra muestra) de X, lo consideramos ese valor estimado como una estimación puntual y
entonces, para calcular los limites inferior y superior de un intervalo de confianza, a ese valor
puntual le sumamos y restamos 1 eee; 2 eee , 3 eee según, querramos informar que
aproximadamente el 68%, o el 95,5% o el 99,7% del valor de Y estará dentro de 1, 2 o 3,
respectivamente errores estándar de estimación. Pero, para ello necesitamos , dado que
utilizamos la distribución normal que la muestra sea mayor a 30; caso contrario si la muestra es
chica, utilizamos la distribución t.
Coeficiente de Correlaciòn
Es tan solo la raíz cuadrada del coeficiente de determinación, cuyo signo es el de la pendiente de
la línea de regresión.
Estas dos últimas medidas debemos interpretarlas en conjunto. Pues si tenemos un grado de
asociación entre dos variables del 70%, relación bastante fuerte, el coeficiente de determinación
sería del 49%, lo que significa que X explica solo el 49% de la variaciòn en Y.
127
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
ESTADISTICA EN EXCEL
Usando excel
1° Sombreo los datos de x e y. Luego Insertar/Grafico de dispersión y queda:
las celdas que contienen los datos marcadas.
2° ) Con las celdas sombreadas ==> Ir al menú Insertar/Grafíco /Linea de dispersión y nos aparece al clickear
300
250
200
150 Serie1
100
50
0
0 10 20 30 40 50 60
128
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
TAREA:
1- ETAPA DE BÚSQUEDA de dos variables que puedan tener algún tipo de relación.
Para ello deberá leer notas de diario, periodísticas o de otras fuentes que marcan una
determinada posición, o marco teórico sobre el tema que trata esas variables.
SEGUNDA PARTE
Volver a graficar el diagrama de dispersión y ahora sí , la recta que resulta de mejor ajuste
Hacer una tabla con la S.C.T desagregados en S.C.R y S.C.E por la recta de regresión.
Construir la tabla resumen ANOVA.
A partir de la suma de los cuadrados, calcular el coeficiente de determinación y luego el
coeficiente de correlación. Comprobar los valores del coeficiente de correlación con el
calculado en el punto ya hecho en covarianza y correlación.
Determinar el error estándar de estimación.
En cada medida estadística deberá ser interpretado su resultado
129
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
1)
Los gastos anuales en reparación de motores son los que logró informarse la directora del Departamento de Salu-
bridad quien está interesada en la relación que existe entre la antigüedad de un motor y los gastos anuales.
Con el fin de determinar dicha relación , la directora reunió información de cuatro motores
La información es la siguiente
a) Desarrolle una ecuación de regresión que describe la relac. Entre la antig. Y sus gs. Anuales de reparación.
b) Pronostique los gastos anuales de reparacion en miles de dólares si la antigüedad del motor fuese de 4 años
c) Calcule el error estandard de la estimación
2) En la empresa "Tecnobuenosaires" en el Sector Contable "Contabilidad de Costos" se encuentran abocados a la estimación de los gs.gs
con base en el nivel de producción. Por ello, el Supervisor logró reunir información acerca de los gastos generales y de las unidades producid.
en diferentes plantas, y ahora desean estimar una ecuación de regresión para predecir los gastos generales futuros.
La información es la siguiente
Gastos Generales191 170 272 155 280 173 234 116 153 178
Unidades 40 42 53 35 56 39 48 30 37 40
Embarque muestreado 1 2 3 4 5 6 7 8 9 10
Distancia (X) 825 215 1070 550 480 920 1350 325 670 1215
Tiempo de entrega 3,5
(Y) en días1,0 4,0 2,0 1,0 3,0 4,5 1,5 3,0 5,0
130
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Rta:
131
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2 2
Restaurante xi yi XiYi xi yi xi - m(xi) yi - m(yi) [x i -m(x i )][yi -m(yi )] Los resultados del cuadro:
Pobl est Ventas
1 2 58 116 4 3364 -12 -72 864 N 10 Usando excel
2 6 105 630 36 11025 -8 -25 200 ∑x= 140 1° Sombreo los datos de x e y. Luego Insertar/Grafico de dispersión y queda:
3 8 88 704 64 7744 -6 -42 252 ∑y= 1300 las celdas que contienen los datos marcadas.
4 8 118 944 64 13924 -6 -12 72 ∑ x 2= 2528
5 12 117 1404 144 13689 -2 -13 26 ∑ y 2= 184730 250
6 16 137 2192 256 18769 2 7 14 ∑x.y= 21040
7 20 157 3140 400 24649 6 27 162
x
x 14
200
8 20 169 3380 400 28561 6 39 234 N
9 22 149 3278 484 22201 8 19 152 (∑ x)2= 19600
10 26 202 5252 676 40804 12 72 864 150
--------------- --------------- --------------- --------------- --------------- --------------- --------------- --------------- y
y 130
Series1
∑ 140 1300 21040 2528 184730 0 0 2840 N 100
m 14 130
Cálculo de los valores de la pendiente m y de la ordenada al origen b de la ecuación lineal de regresión.
50
( y ).( x ) ( x. y ).( x)
2
b= 340800 0
b 5680 0 10 20 30
N .( x ) ( x) 2
2
b= 60
2° ) Con las celdas sombreadas ==> Ir al menú Insertar/Grafíco /Linea de dispersión y nos aparece al clickear
3°) Se pueden ir completando los datos en las abscisa y ordenada
N .( x. y ) ( x).( y )
haciendo click con el botón derecho dentro del gráfico.
m= 28400 4°) Posesionarse en cualquier punto del diagrama de dispersión y con el botón derecho del mouse vemos
m
N .( x ) ( x) 2
2 5680 que se activan todos los puntos. Pues bien, conel botón derecho hacer click sobre cualquier punto y
m= 5 hacer click sobre "Agregar linea de tendencia" /luego en lineal/luego en Opciones hacer click en
Presentar ecuación en el gráfico
La recta de regresión será
b m x y 60 5 x Presentar valor de R cuadrado en el gráfico.
250
c) Verificación de la ecuación de estimación
Residual ó
200 y = 5x + 60
Cálculo de la suma de los errores individuales de la tabla Valor ajustado Error Individ
y y
2
2
2 R² = 0,9027
e2 y y y y
y ey y
150
Y
1 58 60 + 5* 2 70,00 -12,00 144,00 3600 5184 Series1
2 105 60 + 5* 6 90,00 15,00 225,00 1600 625 100 Lineal (Series1)
3 88 60 + 5* 8 100,00 -12,00 144,00 900 1764
4 118 60 + 5* 8 100,00 18,00 324,00 900 144 50
5 117 60 + 5* 12 120,00 -3,00 9,00 100 169
6 137 60 + 5* 16 140,00 -3,00 9,00 100 49
0
7 157 60 + 5* 20 160,00 -3,00 9,00 900 729
0 10 20 30
8 169 60 + 5* 20 160,00 9,00 81,00 900 1521
9 149 60 + 5* 22 170,00 -21,00 441,00 1600 361
10 202 60 + 5* 26 190,00 12,00 144,00 3600 5184
------------------- ------------------- ------------------- ------------------- ------------------- 5°) Haciendo click con el botón derecho del mouse dentro de la ecuación que presenta el gráfico
1300 ERROR TOTAL =====> 1300,00 0,00 1530,00 14200,00 15730,00 podemos entrar en "Formato de Rotulo de datos" y por ej. En Número: modificar el número de decimales
130
d) Error Estándar de la estimación 6°) El coeficiente de Correlación que presenta excel es R al cuadrado. Para sacar el efecto negativo.
Mirando la linea de tendencia si R2 =Coef. De Correlación dice que tan bien se ajusta la línea recta a los datos
si R2 es cercano a 1==> los datos y la recta se ajustan muy bien. Es decir los datos se ajustan a la Ecuac
SY , X
( y y) 2
e2 1530 si R2 es cercano a 0==> este modelo de regresión lineal no nos sirve para la toma de decisiones, para pro-
SY , X 191,25 13,8293
n2 n2 10 2 nosticar valores dentro de esa ecuación pues no se verifica una relación adecuada entre los datos y la linea de
ajuste.
132
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Coeficiente de determinación r2
Es decir que alrededor del 90,27% de la varianza en en las ventas trimestrales es estadísticamente explicado por la poblac de estud
Además, dada esa poblac. Estudiantil queda sin explicar el 9,73% de las ventas.
2
y y 14200
Coefic. De Correlación -r-
r r 0,9027 0,9501
y y 15730
2
DATOS/ANALISIS DE DATOS/ REGRESION RANGO Y DE ENTRADA(Es la variable Y) RANGO X DE ENTRADA (var X) . ROTULOS(incluye titulos)
Resumen
Estadísticas de la regresión
Coeficiente 0,950123
de correlación múltiple
Coeficiente 0,902734
de determinación R^2
R^2 ajustado 0,890575
Error típico 13,82932
Observaciones 10
ANÁLISIS DE VARIANZA
Grados deSuma
libertad
de
Promedio
cuadrados
de los cuadrados
F Valor crítico de F
Regresión 1 14200 14200 74,24837 2,5489E-05 Datos adicionales
Residuos 8 1530 191,25 FuncEstad= DESVEST.P DESVEST.M
Total 9 15730 PARA X 7,53657747 7,94425019
PARA Y 39,661064 41,8064323
CoeficientesError típicoEstadísticoProbabilidadInferior
t 95% Superior 95%Inferior 99,0% Superior 99,0%
Intercepción 60 9,2260348 6,503336 0,000187 38,7247256 81,2752744 29,0430797 90,95692032
Pobl est 5 0,5802652 8,616749 2,55E-05 3,66190596 6,33809404 3,05298537 6,947014629
DATOS/ANALISIS DE DATOS/ REGRESION RANGO Y DE ENTRADA(Es la variable Y) RANGO X DE ENTRADA (var X) . ROTULOS(incluye titulos)
Resumen tambien TILDO RESIDUALES GRAF DE DISTR NORMAL
Estadísticas de la regresión
Coeficiente 0,950123
de correlación múltiple Pobl est Gráfico de los residuales
Coeficiente 0,902734
de determinación R^2 20
R^2 ajustado 0,890575
Residuos
CoeficientesError típicoEstadísticoProbabilidadInferior
t 95% Superior 95%Inferior 99,0% Superior 99,0%
Intercepción 60 9,2260348 6,503336 0,000187 38,7247256 81,2752744 29,0430797 90,95692032
Pobl est 5 0,5802652 8,616749 2,55E-05 3,66190596 6,33809404 3,05298537 6,947014629
500
Ventas
500
Ventas
Análisis de los residuales Resultados de datos de probabilidad
0 Ventas
Observación
Pronóstico Ventas
Residuos
Residuos estándares Percentil Ventas 0 10 20 30 Pronóstico Ventas
1 70 -12 -0,92036 5 58 Pobl est
2 90 15 1,150447 15 88
3 100 -12 -0,92036 25 105
4 100 18 1,380537 35 117 Gráfico de probabilidad normal
5 120 -3 -0,23009 45 118
6 140 -3 -0,23009 55 137 500
Ventas
7 160 -3 -0,23009 65 149
8 160 9 0,690268 75 157 0
9 170 -21 -1,61063 85 169 0 20 40 60 80 100
10 190 12 0,920358 95 202 Muestra percentil
134
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO
DE
CONCEPTOS TEÓRICOS DE REGRESIÓN LINEAL SIMPLE
Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser falsos corregir para
transformarlo en verdadero.
1) Una de las razones para encontrar una ecuación de regresión es para hacer predicciones fuera o dentro
del dominio muestral de la variable explicativa, para cualquier periodo y población. V:__F:__
2) En el análisis de regresión se mide la fuerza de la relación lineal entre las variables. V:__F:__
3)Un coeficiente de correlación fuerte significa que la variable X es causa de la variable Y que es su efecto.
4) El análisis de correlación es un método de obtener la ecuación que representa la relación entre dos
variables. V:__F:__
5) Un coeficiente de correlación de cero significa que las dos variables están perfectamente correlacionadas.
V:__F:__
6)Cuando el coeficiente de correlación r es positivo, la pendiente de la recta será siempre negativa.
V:__F:__
7)Cuando el valor calculado del coeficiente de correlación es negativo, el valor calculado de la pendiente
de la recta será negativo. V:__F:__
8) La pendiente de la recta de regresión representa la cantidad de cambio que se espera tenga lugar en la
variable explicada, cuando la variable explicativa aumenta en una unidad. V:__F:__
11) La recta de mejor ajuste se emplea para predecir el valor promedio de Y que se puede esperar, ocurra a
un valor determinado de X, dentro del rango de los valores de X, para esa población y periodo en que se
obtuvo las observaciones V:__F:__
12) Dado que la ecuación para una recta es Y = 26 – 24 X, podemos decir que la relación de Y con X es
directa y lineal. V:__F:__
13) Un valor r2 cercano a cero indica una fuerte correlación entre X y Y. V:__F:__
14) Los análisis de regresión y correlación se usan para determinar relaciones de causa y efecto. V:__F:__
16) El error estándar de la estimación mide la variabilidad de los valores observados alrededor de la
ecuación de regresión. V:__F:__
135
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
19) La ecuación de estimación es válida sólo en el mismo intervalo que el dado por los datos originales de
la muestra para los cuales se desarrolló. V:__F:__
20) Si una línea se ajusta a un conjunto de puntos mediante el método de mínimos cuadrados, los errores
individuales positivos y negativos respecto a la línea suman cero. V:__F:__
21) Supongamos que la pendiente de una ecuación de estimación es positiva. Entonces el valor de r debe
ser la raíz cuadrada positiva de r2. V:__F:__
22) Si r = 0.8, entonces la ecuación de regresión explica el 80% de la variación total en la variable
dependiente. V:__F:__
24) Una ecuación de regresión no puede ser válida al ampliarse fuera del intervalo de la muestra de la
variable independiente. V:__F:__
1) Suponga que conocemos la estatura de una estudiante, pero no su peso. Usamos una ecuación de
estimación para determinar una estimación de su peso, basándonos en su estatura. Por tanto, podemos
concluir que:
a) El peso es la variable independiente.
b) La altura es la variable dependiente.
c) La relación entre peso y altura es inversa.
d) Ninguno de los anteriores.
e) b) y c), pero no a).
2) Suponga que le dicen que existe una relación directa entre el precio de los tomates cherry y la cantidad
de lluvia que cayó durante la época de cultivo. Puede concluirse que:
a) Los precios tienden a ser altos cuando la lluvia es alta.
b) Los precios tienden a ser bajos cuando la lluvia es alta.
c) Una gran cantidad de lluvia ocasiona que los precios suban.
d) La falta de lluvia ocasiona que los precios suban.
3) Suponga que se calcula que a es 4 y b es 2 para una línea de estimación particular con una variable
independiente. Si la variable independiente tiene un valor de 2, ¿qué valor debe esperarse para la variable
dependiente?
a) 8.
b) 10.
c) 21.
d) 0.
4). Suponga que se calculó la ecuación de estimación 𝑌̂ = 5 − 2. 𝑥, para un conjunto de datos. ¿Qué es cierto
de lo siguiente para esta situación?
a) La ordenada Y de la recta es 2.
b) La pendiente de la recta es negativa.
c) La recta representa una relación inversa.
d) Todos los anteriores.
e) b) y c), pero no a).
5)27. La variación de los valores de Y alrededor de la recta de regresión se expresa mejor como:
a) ∑(𝑌 − 𝑋)2
b) ∑(𝑌 − 𝑌)2
2
c) ∑(𝑌 − 𝑦̅̂ )
136
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
d) ∑(𝑌 − 𝑦̅) 2
7) En la ecuación Y= A + BX + e, la e representa:
a) La ordenada X de los datos observados.
b) El valor de Y con el cual se comparan otros para determinar el “mejor ajuste”.
c) Variaciones aleatorias respecto a la recta de regresión de la población.
d) Ninguno de los anteriores.
2) Una asociación entre dos variables descrita por una línea curva es una _______________.
3) Toda línea recta tiene una _______________.que representa cuánto cambia la variable dependiente con
cada cambio unitario de la variable independiente.
4) El grado en el que los valores observados difieren de sus valores pronosticados sobre la línea de regresión
se mide por _______________.
8) El método de mínimos cuadrados encuentra la línea de “mejor ajuste” a través de un conjunto de puntos,
esto es, la recta que _______________. el error entre los puntos observados y los puntos estimados sobre esa
recta.
LA ÉTICA EN LA ESTADÍSTICA
137
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
4°) Posesionarse en cualquier punto del diagrama de dispersión y con el botón derecho del mouse vemos
que se activan todos los puntos. Pues bien, conel botón derecho hacer click sobre cualquier punto y
hacer click sobre "Agregar linea de tendencia" /luego en lineal/luego en Opciones hacer click en
Presentar ecuación en el gráfico
Presentar valor de R cuadrado en el gráfico.
250
200
150 Serie1
Lineal (Serie1)
100
50
0
0 10 20 30 40 50 60
Unidades
5°) Haciendo click con el botón derecho del mouse dentro de la ecuación que presenta el gráfico
podemos entrar en "Formato de Rotulo de datos" y por ej. En Número: modificar el número de decimales
6°) El coeficiente de Correlación que presenta excel es R al cuadrado. Para sacar el efecto negativo.
Mirando la linea de tendencia si R2 =Coef. De Correlación dice que tan bien se ajusta la línea recta a los datos
si R2 es cercano a 1==> los datos y la recta se ajustan muy bien. Es decir los datos se ajustan a la Ecuac
si R2 es cercano a 0==> este modelo de regresión lineal no nos sirve para la toma de decisiones, para pro-
nosticar valores dentro de esa ecuación pues no se verifica una relación adecuada entre los datos y la linea de
ajuste.
Aca vemos el coeficiente de correlación que tenemos una diferencia con el realizado en el ejercicio (problemas de
aproximación en los decimales).Pues si pasamos a otro ejemplo: El ejercicio que busca el modelo de regresión entre
los gastos anuales en reparación de motores y su antigüedad, llegamos a iguales resultados también en correlación con
el desarrollo nuestro.
-------------------
8 y = 0,75x + 3,75
7 R2 = 0,75
6
5
Serie1
4
Lineal (Serie1)
3
2
1
0
0 2 4 6
138
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
A diferencia de Regresión, en este caso estudiar la serie nos permitirá PRONOSTICAR o predecir datos a
futuro suponiendo que los patrones de comportamiento pasados se mantienen en el futuro.
La suposición básica que subyace en el tratamiento de las series temporales es que “los factores
que han provocado patrones de comportamiento en el pasado y en el presente continuarán
haciéndolo en el futuro”
Por ello, expresa Berenson Levine que los principales objetivos del análisis de series consiste en identificar
y aislar tales factores de influencia con propósito de hacer predicciones (pronósticos), así como para
efectuar una planeación y un control administrativo
La sugerencia que se hace es que ante el hecho de explicar variaciones en serie de tiempo con datos
históricos en donde no se sabe si el patrón de comportamiento continuará en el futuro, es que se deben
combinar con un análisis que se extiende a buscar respuestas de tipo. ¿Qué pasaría si…? Ya que forman
parte de la planeación estratégica de lo que estoy sometiendo a análisis el marco de referencia de los datos
que se desenvuelvennen diferentes entornos económico, político, sociológico y hasta sicológico.
La Serie Y(t) se descompone si seguimos el modelo multiplicativo clásico (uno de los tantos):
Y(t ) = T(t) * C(t) * E(t) * I(t)
139
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
PROMEDIO MOVIL
El componente irregular de algunas series puede ser tan grande que oculte las regularidades.
Consecuentemente el gráfico real parecerá bastante irregular y lo podemos suavizar para tener una imagen
más clara a través de la media móvil.
La media móvil se basa en la idea que cualquier componente irregular en cualquier mom.ento del tiempo
ejercerá un efecto menor si se promedia el punto con sus vecinos inmediatos (Newbold). El objetivo de usar
medias móviles será la eliminación del componente irregular subyacente en la serie temporal
Una aplicación muy importante para el tratamiento de series que tienen componente estacional es usar las
medias móviles para extraer ese componente. Así, cuando graficamos la serie de medias móviles centradas
–PMC- junto con la serie original hemos eliminado el componente estacional y por otro lado, también se
ha suavizado el componente irregular. El grafico que se pueda representar nos permite juzgar las
regularidades no estacionales de los datos y comenzar a interpretar gráficamente que tipo de tendencia y
ciclo domina en esa serie representada ya suavizada.
Entonces, la serie de PMC de “p” puntos –en donde p representa la cantidad de subperiodos que en el año
están informados los datos observados o relevados- pueden resultar útil para comprender la estructura de
una serie temporal.
140
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
e. Las tasas de interés pasivas en el periodo comprendido entre diciembre 2001 a diciembre
2014.
3) Marque en los ejemplos que se citan a continuación , aquellos en donde Ud. considere que no son
series cronológicas.
a. Series Económicas sobre Tasas de desempleo, Tasas de Inflación, Indicadores Economicos
que informan Índices de Precios, Precios de determinados productos.
b. Series Demográficas: sobre tasas de crecimiento, mortalidad, natalidad
c. Series Físicas sobre Evolución de Precipitaciones, temperaturas.
d. Series Geofísicas sobre Evolución de Movimientos Sísmicos en el área de Mendoza
e. Series de tráfico, series de turismo….
4)
EJERCICIO DE APLICACIÓN DE SERIE DE TIEMPO:
Dado los siguientes valores originales observados en las ventas en miles de $ en esos periodos.
a) Identifique el componente estacional y desestacionalice la serie de observaciones.
Resolución:
Estos valores se pueden representar en la siguiente tabla como una serie de tiempo y luego
graficarlos
Valores .Originales
año TRIM De Ventas en -Miles de $-
1 1 16 ETAPA PREVIA
2 21
3 9
4 18
2 1 15
2 20 Ventas históricas en Valores originales
3 10 30
4 18
3 1 17 20
2 24 10 V.O.
3 13
0
4 22 0 5 10 15 20
4 1 17
2 25
3 11
4 21
5 1 18
2 26
3 14
4 25
141
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
ETAPA DE TRABAJO
Para el caso de series informadas por periodos menores al año, hallaremos el componente estacional para
desestacionalizar la serie. Por eso, comenzamos con
El descomponer la serie en sus elementos, permite con un enfoque mecánico del análisis de serie
de tiempos “Pronosticar”. A diferencia de lo visto en regresión, que podíamos interpolar dentro del rango
de la variable explicativa, en el caso de Series Cronológicas podemos proyectar la tendencia histórica y
variación cíclica en el futuro, cuidando de ver si los patrones están cambiando, pues de nada nos serviría
la proyección en ese caso, como tampoco serviría si no son regulares y duraderas las tendencias pasadas.
SUPUESTO FUERTE: “El patrón de comportamiento histórico se considera válido para el futuro.”
El análisis de la Serie de tiempo también requiere de ver cuán precisos son los datos históricos, ello
incluye considerar en el caso de Series de precios, a diferencia de cantidad, que pueden estar registradas
contablemente a valores corrientes. Por ende, interpretar una tendencia positiva en el comportamiento de
los precios de una determinada serie, sería errónea si se tratase tan solo de la inflación que acompañan
dichos precios. Para dicho análisis, debieran primeramente deflacionarse dichos valores, nos estamos
refiriendo a trabajar en valores homogéneos, lo que equivaldría decir, trabajemos a valores constantes. Allí
necesitamos del manejo de NÚMEROS INDICES.
El componente irregular de algunas series puede ser tan grande que oculte las regularidades.
Consecuentemente el gráfico real parecerá bastante irregular y lo podemos suavizar para tener una
imagen más clara a través de la media móvil
1) Cálcular el total móvil de cada uno de los subperíodos trimestrales que comprenden cada período
anual. El total móvil es el dato que ocupa el lugar medio. Para el período siguiente tomo
nuevamente el promedio de los cuatro trimestres excluyendo el primero e incorporando uno más;
es decir: se incorpora el primero del año siguiente y se excluye el primero del año anterior) y así
sucesivamente .
2) Puede ocurrir que el número de subperiodos en el año es un número impar, por lo que cada
promedio movil se dice que queda ubicado en el centro de aquellos que formaron parte del cálculo.
(Recordemos el cálculo de la mediana que para datos sueltos queda posicionada en el orden
[n+1]/2) . En el caso de que el número de subperiodos en el año sea par, tal como este caso 4
142
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
trimestres, nos queda el PM –Promedio Móvil- ubicado en la posición 2,5, es decir entre dos valores
y así queda posicionado.
3) Si los PM hallados son de orden par debemos centrarlos y entonces para calcular el PMC –
Promedio Móvil Centrado- se procede a centrar el promedio móvil y así poder asociarlo con los
datos reales de cada período , en este caso periodo trimestrAL. Enel caso de datos impares (ej. 5
bimestres) no necesitamos este paso pues, el 1° PM quedaría centrado en el subperíodo 3. Centrar
significa hallar la semisuma de dos PM que en su posición quedarán nuevamente alineados con un
valor original.
Y t T C E I
EI
P.M .C T C
30
25
20
15 V.O.
10 PMC
5
0
0 5 10 15 20 25
Para cada período calculamos el porcentaje de valor original o valor real respecto del valor
promedio móvil centrado para cada uno de los períodos de la serie de tiempo. Con este PMC
observamos que se han eliminado el componente irregular asi como el componente estacional.
La siguiente relación permite recuperar el componente Estacional y la podemos denominar “Valor
Estacional”
Y t
Valor Estacional . 100
P.M .C
143
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2 2 21
16,000
3 3 9 15,875 56,69
15,750
4 4 18 15,625 115,20
15,500
II 1 5 15 15,625 96,00
15,750
2 6 20 15,750 126,98
15,750 62,50
3 7 10 16,000
16,250 197,46
4 8 18 16,750
17,250 96,45
III 1 9 17 17,625
18,000 129,73
2 10 24 18,500
19,000 68,42
3 11 13 19,000
19,000 115,03
4 12 22 19,125
19,250 89,47
IV 1 13 17 19,000
18,750 134,23
2 14 25 18,625
18,500 59,06
3 15 11 18,625
18,750 111,26
4 16 21 18,875
19,000 92,90
V 1 17 18 19,375
19,750 128,40
2 18 26 20,250
20,750
3 19 14
4 20 25
Forma parte del proceso de promediar el componente irregular que se realiza enlistando los
diversos cocientes aplicables al mismo trimestre, eliminando los valores más alto y más bajo y
calculando la media de los cocientes restantes. Esta medida se denomina media modificada, a causa
de la eliminación de los dos valores extremos.La media modificada será el índice de componente
estacional. Esta media modificada es un índice desajustado
Observaremos que El índice estacional se puede utilizar para eliminar los efectos de estacionalidad en una
serie de tiempos haciendo la desestacionalización.
Veremos que las medias modificadas al multiplicarse por un factor de ajuste permiten que la suma del
índice en este caso sea 100 para cada trimestre y 400 en los cuatro trimestres que comprenden el año.
Veamos:
144
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
TRIM I II III IV
AÑO 1 - - 56,69 115,20
AÑO 2 96,00 126,98 62,50 107,46
AÑO 3 96,45 129,73 68,42 115,03
AÑO 4 89,47 134,23 59,06 111,26
AÑO 5 92,90 128,40 - -
Sumas 374,83 519,34 246,67 448,95
mediana 94,45 129,06 60,78 113,15 397,440
Sumas 100 100 100 100 400,000
I.E 95,1 129,9 61,2 113,9 400,000
Interpretación del IE .
El trimestre con mayor efecto estacional positivo es el Segundo Trimestre, cuyas ventas son superiores
en alrededor del 29,9% a las del trimestre normal. Por el contrario, las ventas del Tercer Trimestre son
apenas el 61,2% de las ventas del trimestre normal.
Una empresa puede tomar las variaciones en consideración para planificar su programa de trabajo y
realizar el pronóstico de ventas.
Utilidad: Los datos desestacionalizados o denominados datos con ajuste estacional son pertinentes cuando:
Se desea comparar datos de diferentes subperiodos para determinar si ha tenido lugar un
incremento o decremento en relación con las expectativas estacionales.
𝑌(𝑡)
𝑍(𝑡) = . 100
𝐼𝐸
Ej.
16
𝑍(𝑡) = . 100 = 16,8
95,10
145
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
( y).( x ) ( x. y).( x)
2 N .( x. y) ( x).( y)
b (o ) b(1)
N .( x ) ( x)2
2
N .( x ) ( x) 2
2
La línea de tendencia, en términos estadísticos parece similar a la línea de regresión. PERO, no lo es.
La variable dependiente Y no es una V.A.==> Es Una serie de valores históricos.
Sólo puede haber un valor histórico (no una distribución de valores) para un periodo dado
Es probable que los valores asociados con periodos contiguos sean dependientes y no
independientes.
De todas formas el método de mínimos cuadrados es una base adecuada para la determinación de
la T(t)
146
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Tendencia
x V.O.DESEST xy x2 y2 X Y desestacionalizada
1 -19 16,8 -319,8 361 283,30 -19 16,831462 15,04138
2 -17 16,2 -274,8 289 261,37 -17 16,167051 15,35874
3 -15 14,7 -220,7 225 216,46 -15 14,712674 15,6761
4 -13 15,8 -205,5 169 249,86 -13 15,806894 15,99346
5 -11 15,8 -173,6 121 248,99 -11 15,779496 16,31082
6 -9 15,4 -138,6 81 237,07 -9 15,397192 16,62818
7 -7 16,3 -114,4 49 267,24 -7 16,347416 16,94554
8 -5 15,8 -79,0 25 249,86 -5 15,806894 17,2629
9 -3 17,9 -53,7 9 319,82 -3 17,883429 17,58026
10 -1 18,5 -18,5 1 341,39 -1 18,47663 17,89762
11 1 21,3 21,3 1 451,63 1 21,251641 18,21498
12 3 19,3 58,0 9 373,24
3 19,319537 18,53233
13 5 17,9 89,4 25 319,82
5 17,883429 18,84969
14 7 19,2 134,7 49 370,43
7 19,24649 19,16705
15 9 18,0 161,8 81 323,36
16 11 18,4 202,9 121 340,08 9 17,982157 19,48441
17 13 18,9 246,2 169 358,55 11 18,441376 19,80177
18 15 20,0 300,2 225 400,65 13 18,935395 20,11913
19 17 22,9 389,1 289 523,79 15 20,016349 20,43649
20 19 22,0 417,1 361 481,98 17 22,886382 20,75385
-------------- -------------- -------------- 19 21,95402 21,07121
- --------------- - - ---------------
∑ 0 361,12591 422,0878 2660 6618,88948
m 0 18,056296 21,10439 133 330,944474
y 18,0563 0,1587. X
Luego, armamos la Tendencia desestacionalizada haciendo el cociente entre los valores de las ventas
desestacionalizadas y los valores de la ecuación estimada de tendencia.
Podemos determinar también, el Porcentaje de Tendencia desestacionalizada si multiplicamos por 100 el
cociente entre los valores de las ventas desestacionalizadas y los valores de la ecuación estimada de
tendencia.
30 Observemos que
representamos los valores
25 V.O. hallados en cada uno de los
pasos:
20 - Y(t) : Valores Originales
PMC
- PMC: Promedios Móviles
15
Centrados
Val. Desestac
10 - Z(t): Valores
Desestacionalizados
5 b(o)+b(1).x - Tendencia: b(o)+ b(1) . X
0
0 5 10 15 20 25
Por último el cálculo del Residuo restando 100 al valor de la tendencia desestacionalizada. Ver cuadro
siguiente. Posteriormente, el gráfico nos queda así.
147
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Es lo mismo que calcular el Residuo Cíclico Relativo haciendo La diferencia entre el valor
desestacionalizado de la serie y la tendencia desestacionalizada. Luego esa diferencia la dividimos por la
tendencia desestacionalizada y multiplicamos por 100.
𝑌(𝑡) − 𝑌̂(𝑡)
𝑅𝑒𝑠𝑖𝑑𝑢𝑜 𝑐𝑖𝑐𝑙𝑖𝑐𝑜 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑜 = ∗ 100
𝑌̂(𝑡)
16,8315− 15,0414
Ej. 𝑅𝑒𝑠𝑖𝑑𝑢𝑜 𝑐𝑖𝑐𝑙𝑖𝑐𝑜 𝑟𝑒𝑙𝑎𝑡𝑖𝑣𝑜 = ∗ 100 =
15,0414
Veamos:
𝑌̂(𝑡)=T(t)
Y(t) Tendencia Residuo
X desestacionalizada desestacionalizada cíclico relativo
-19 16,8315 15,0414 11,9010
-17 16,1671 15,3587 5,2629
-15 14,7127 15,6761 -6,1458
-13 15,8069 15,9935 -1,1665
-11 15,7795 16,3108 -3,2575
-9 15,3972 16,6282 -7,4030
-7 16,3474 16,9455 -3,5297
-5 15,8069 17,2629 -8,4343
-3 17,8834 17,5803 1,7245
-1 18,4766 17,8976 3,2351
1 21,2516 18,2150 16,6713
3 19,3195 18,5323 4,2477
5 17,8834 18,8497 -5,1262
7 19,2465 19,1671 0,4144
9 17,9822 19,4844 -7,7100
11 18,4414 19,8018 -6,8701
13 18,9354 20,1191 -5,8836
15 20,0163 20,4365 -2,0558
17 22,8864 20,7538 10,2754
19 21,9540 21,0712 4,1897
CONCLUSION: Expresa Levin, Rubin en su texto “SUGERENCIA: La manera correcta de proceder al analizar
todas las componentes de una serie de tiempo es:
1° Desestacionalizar
2° Encontrar la línea de tendencia
3° Calcular la variación alrededor de la línea de tendencia
4° Identificar la variación irregular en lo que queda.
148
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Dada la siguiente serie “SALIDA DE TURISTAS” extraido de un Cuadro titulado “Turismo emisivo. Salida de turistas,
estadía promedio y gasto gasto diario diario promedio por tipo de alojamiento utilizado
Aeropuerto Internacional de Ezeiza y Aeroparque Jorge Newbery. Años 2010-2015, por trimestre”
Que fuera extraido de http://www.indec.mecon.ar/nivel4_default.asp?id_tema_1=3&id_tema_2=13&id_tema_3=55
Se pide:
a) Grafique la serie de tiempo original.
b) Identifique los componentes que ve presentes en la serie de tiempo.
Desagreguelos en la serie.
c) ¿Hay una tendencia creciente o decreciente en el turismo?
d) Pronostique para el primer trimestre 2015 la tendencia y compárela con
los datos reales. Observe si es necesario corregir el dato real para su
comparación.
149
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
AUTODIAGNÓSTICO
DE
CONCEPTOS TEÓRICOS DE SERIES CRONOLOGICAS
Conteste Verdadero –V- o Falso –F- en los siguientes enunciados y en el caso de ser falsos corregir para
transformarlo en verdadero
1. El análisis de series de tiempo se utiliza para detectar patrones de cambio en información estadística
durante intervalos regulares de tiempo.
V:__F:__
2. Las tendencias seculares representan la dirección a largo plazo de una serie de tiempo.
V:__F:__
3. El residuo cíclico relativo puede calcularse para un elemento de una serie de tiempo restando 10 al
porcentaje de tendencia de ese elemento.
V:__F:__
4. Una vez calculados los índices estacionales de una serie de tiempo, la serie puede ser desestacionalizada
de modo que solamente quede la componente de tendencia.
V:__F:__
5. El porcentaje de tendencia no debe utilizarse para pronosticar variaciones cíclicas futuras.
V:__F:__
6. De los cuatro tipos de variación, la cíclica es la más difícil de pronosticar.
V:__F:__
7. La variación estacional es una variación repetitiva y predecible alrededor de la línea de tendencia que se
da en un periodo de un año.
V:__F:__
8. Los índices estacionales ajustados deben sumar siempre 400. V:__F:__
9. Una serie de tiempo puede ser desestacionalizada si los valores originales se lo multiplican por los PMC
y el valor 100 V:__F:__
10. Una serie de tiempo de datos anuales puede contener los siguientes componentes: a) Tendencia secular.
b) Fluctuación cíclica y c) Variación estacional. V:__F:__
11. El componente irregular de algunas series puede ser tan grande que oculte las regularidades.
Consecuentemente el gráfico real parecerá bastante irregular y lo podemos suavizar para tener una imagen
más clara a través de la media móvil V:__F:__
1 . Al dividir cada valor real de una serie de tiempo por el valor de tendencia correspondiente y multiplicar
el resultado por 100, obtenemos el _______________.
2. El movimiento repetitivo y predecible alrededor de la línea de tendencia que se da en un año o menos es
la variación_______________ .
3. La variación _________________de una serie de tiempo está caracterizada por un movimiento
impredecible y aleatorio que por lo general ocurre durante intervalos cortos.
4. La variación __________________es la componente de una serie de tiempo que oscila alrededor de la
línea de tendencia en periodos mayores que un año.
5. El uso de índices estacionales para eliminar los efectos de la estacionalidad de una serie de tiempo se
conoce como _________ la serie de tiempo.
6. El primer paso para calcular los índices estacionales de los datos de una serie de tiempo consiste en
calcular el ______________________.
7. El resultado de descartar los valores más alto y más bajo antes de promediar se conoce como
___________________.
150
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Su tarea consiste también en explicar y desmistificar las cifras, completándolas con lo que los especialistas denominan metadatos
con la finalidad de garantizar una utilización correcta de los datos y evitar interpretaciones erróneas de las estadísticas.
Las estadísticas son fiables y se convierten en un verdadero instrumento de la democracia cuando son elaboradas por
profesionales que utilizan métodos científicos reconocidos sin ninguna presión. En consecuencia, es de primordial importancia
que el marco jurídico que rige las actividades estadísticas dentro de un país sea favorable a la aplicación de los Principios
fundamentales de las estadísticas oficiales que la Comisión de Estadística de las Naciones Unidas adoptó durante el período de
sesiones extraordinario especial que se celebró del 11 al 15 de abril de 1994.
Los ocho objetivos de desarrollo del Milenio fijados en la Declaración del Milenio de septiembre de 2000 por la comunidad
internacional abarcan desde la reducción de la pobreza extrema a la mitad hasta el logro de la enseñanza primaria universal,
pasando por la detención de la propagación del VIH/SIDA para el año 2015.
Se han fijado también 48 indicadores que permitirán medir los progresos realizados. Tras cada indicador hay estadísticos que a
nivel local, nacional e internacional, se ocupan de obtener todos los datos necesarios para realizar el cálculo. Cada uno
desempeña su papel, desde la definición de conceptos e instrumentos de medición del desarrollo, la programación de las
aplicaciones informáticas de cálculo y la difusión de los indicadores, hasta la compilación y armonización de las estadísticas. La
UNCTAD, por ejemplo, se ocupa de los indicadores de la pobreza y el acceso a los mercados.
Se admite en general que las políticas económicas, demográficas y sociales se elaboran sobre la base de estadísticas fiables y que
el seguimiento de su aplicación implica el cálculo de indicadores. Estos datos e indicadores se usan para diversos fines. Por
ejemplo, en el marco de la contabilidad nacional y de la balanza de pagos, los estadísticos se esfuerzan para presentar los datos
de manera coherente, aunque a menudo , el lector sólo retiene la parte visible que se limita a cifras tales como el Producto
Nacional Bruto (PNB). Por el contrario, también se calculan indicadores claves sobre los flujos financieros, la deuda, o la relación
de intercambio con el fin de evaluar de manera transparente los resultados de los países.
Las organizaciones internacionales retoman las actividades nacionales al reunir en sus bases de datos las estadísticas
proporcionadas por los países. Ofrecen a menudo el espacio de concertación necesario para la armonización de los conceptos y
métodos sin el cual carecen de sentido la comparación y agregación de datos.
Su papel consiste también en estimar los datos que faltan y calcular los indicadores derivados. El resultado de este trabajo se
comunica a las administraciones públicas nacionales, los encargados de formular políticas, los universitarios y los investigadores
gracias a las publicaciones y anuarios tradicionales que, cada vez con mayor frecuencia permiten difundir por vía electrónica las
estadísticas en CD-ROM o en Internet.
Como la armonización de datos es un objetivo de los estadísticos en las organizaciones internacionales, la coordinación de sus
actividades es ineludible. En efecto, permite evitar que los países comuniquen estadísticas similares a diferentes agencias, pero
es también la clave del éxito de las actividades del sistema estadístico internacional destinadas a crear y reforzar las capacidades
estadísticas de los países en desarrollo o en transición.
En particular, es primordial que la oferta de cooperación técnica sirva en primer lugar para cumplir con los objetivos prioritarios
de las estrategias nacionales elaboradas con mucha atención.
La UNCTAD interviene en reuniones de formación organizadas por la División de Estadística de las Naciones Unidas en los países
en desarrollo para mejorar las estadísticas sobre el comercio internacional. En ellas los estadísticos se reúnen con agentes de
aduanas y pueden conocer mejor las repercusiones estadísticas que puede tener SYDONIA, aplicación informática concebida
inicialmente por la UNCTAD para automatizar las operaciones aduaneras.
151
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
La comunidad de los estadísticos que trabajan en las organizaciones internacionales cuenta con medios de coordinación como el
Comité de Coordinación de las Actividades Estadísticas, que adoptó , en septiembre de 2005, una serie de principios que rigen
las actividades estadísticas internacionales. La UNCTAD, al igual que la mayoría de los organismos, se ha comprometido a
aplicarlos.
Declaración de Ética Profesional del Instituto Internacional de Estadística.
ÉTICA EN ESTADÍSTICA:
RESPONSABILIDAD DE LAS UNIVERSIDADES EN LA FORMACIÓN DEL PROFESIONAL
María Teresa Blaconá *Facultad de Ciencias Económicas y Estadística de Rosario - Universidad Nacional de Rosario
Extraido de http://www.saberes.fcecon.unr.edu.ar/index.php/revista/article/view/50/99. Consulta 20 de mayo de 2014
ETICA:
Expresa Blaconá …”Se puede definir la noción de ética como un conjunto de reglas compiladas en una guía o estándares
profesionales que pueden ser importantes en la educación y entrenamiento de los estadísticos. Por ejemplo, el objetivo de la Guía
Ética de la American Statistical Association (1999) expresa: el propósito de la guía ética de la ASA es asegurar que el trabajo
estadístico sea ético y efectivo cuando se realizan trabajos del medio ambiente y asistir a los estudiantes a aprender a desarrollar
el trabajo estadístico razonablemente. Pero por otro lado, el desempeño ético de un profesional estadístico no puede estar
solamente restringido a conocer dichas guías o estándares.
Es importante tener en cuenta lo enunciado por la Comisión de Estadística de la Asamblea General de las Naciones Unidas, cuando
decidió celebrar el Día Mundial de la Estadística (World Statistics Day, WSD), el día 20 de octubre de 2010, en reconocimiento de
los servicios prestados por el sistema estadístico global a nivel nacional e internacional. Al respecto definieron como palabras
claves: Servicio – Profesionalismo – Integridad.
En una democracia es altamente reconocido que el libre acceso a la información estadística es un derecho que tienen los
ciudadanos para obtener información correcta. Para que esto se pueda cumplir los organismos de Estadísticas Oficiales, enfrentan
desafíos éticos los cuales se pueden enunciar brevemente como: a) utilizar una metodología adecuada; b) proteger la
confidencialidad y c) mantener la integridad de las Agencias Estadísticas en el Sistema Estadístico Nacional.
No obstante, que los estudiantes en la Universidad reciban una buena formación en metodología estadística, ¿alcanzará para
permitirles que puedan resolver desafíos éticos que surgen en el desempeño de la profesión?.
En este artículo en la sección 2 se desarrollan algunas premisas sobre las condiciones necesarias para desempañarse éticamente
en estadística, en la sección 3 se enuncian otros aspectos que se deben considerar para desarrollar una actividad ética en
estadística y en la sección 4 se presentan las consideraciones finales.
152
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Todavía no se ha delimitado claramente en los estándares profesionales y éticos de las agencias estadísticas, ni en la comunidad
estadística, las responsabilidades u obligaciones de perjuicios anticipados. De esto surge el dilema, si en estadística a todas las
acciones legales se las puede considerar éticas. Una pregunta para los Estadísticos, es si la sociedad y la comunidad estadística
entiende la ley y las responsabilidades que de ella surgen, así como los estándares profesionales y éticos que de ella se desprenden
y en el mismo contexto si la comunidad estadística tiene alguna responsabilidad u obligación de “anticipar los perjuicios”. Este es
un debate abierto, que las Universidades deberían instalar en su ámbito
c.- Integridad de las agencias estadísticas en el sistema estadístico nacional.Como menciona Seltzer (2005), un importante
tópico del Fundamental Principles of Oficial Statistics, es el mantener e incrementar la integridad del sistema estadístico nacional,
debido a que pueden surgir amenazas a la integridad de muchas formas, incluyendo entre otras, conceptos de manipulación
política arbitraria, definiciones e información de los datos muy atrasada, informando los datos reales manipulados, usando la
agencia para análisis políticos y politizando el personal técnico de la agencia.
Por otro lado, como expresa Habermann (2005), en un sentido amplio, puede existir tensión entre la agencia estadística y el uso
del dato estadístico (especialmente en el contexto de la aplicación de la ley y otras actividades de defensa o inteligencia) y también
con respecto a la autonomía de la agencia estadística y el contexto de la agencia dentro del gobierno. De acuerdo al mismo autor
es importante saber que esta tensión puede no resolverse. Las agencias del gobierno, como pequeñas organizaciones dentro de
una estructura de gobierno mucho más amplia, no están bien equipadas para ejercitar autoridad moral.
En este sentido la Universidad debería colaborar cuando se plantea alguna tensión, especialmente brindando una opinión externa,
basada en el conocimiento académico e incluyendo el tópico ético.
3. Otros aspectos que se deben considerar para desarrollar una actividad ética en estadística
Hasta aquí se han enunciado las condiciones necesarias para el desarrollo ético de un trabajo estadístico, pero en algunos casos
dichas condiciones no resultan ser suficientes.
Para las Naciones Unidas el primero de los principios fundamentales de las estadísticas oficiales es proporcionar un elemento
indispensable en el sistema de información de una sociedad democrática, al servicio del gobierno, la economía y el público con
datos sobre la situación económica, demográfica, social y ambiental. Con este fin, las estadísticas oficiales que encuentran las
pruebas de la utilidad práctica deben ser compiladas y puestas a disposición de manera imparcial, por agencias estadísticas
oficiales, para honrar el derecho de los ciudadanos a la información pública (United Nations Statistical Commission, 1994).
Por otro lado, Habermann (2005) agrega al respecto que, por supuesto, para que el debate tenga lugar, la sociedad debe estar
informada y señala que la agencia Estadística debería abrirse y ser transparente acerca de la solicitud de los datos que se solicitan
y que los datos requeridos sean informados oportunamente para que las respuestas sean ser información pública.
No es fácil resolver tensiones que afectan a las agencias estadísticas. Entre las estrategias de prevención para reducir probables
problemas éticos, Seltzer (2001) menciona: Incluir educación y tratamientos sobre ética en la universidad y programas de
entrenamiento de las agencias y desarrollar planes de la agencia específica para discusiones externas a la agencia sobre temas
éticos y mecanismos específicos de la agencia para responder a lo que se refiere a la ética. Es decir, considera la mirada académica
externa uno de los pilares para resolver problemas éticos en las agencias estadísticas.
La mayoría de lo que se ha expuesto con respecto a ética en Estadística en las agencias oficiales, tiene vigencia para trabajos
profesionales y/o académicos de cualquier área, como por ejemplo, biología, medio ambiente, economía, epidemiología, etc.
En este tópico las Universidades pueden contribuir a que la sociedad esté informada y tenga una mirada externa de especialistas
en el tema, a través de tareas de extensión y divulgación de opiniones.
4. Consideraciones finales
Por lo expresado se podría concluir que las Universidades deben realizar esfuerzos para formar profesionales estadísticos que
puedan enfrentar nuevos temas en nuevos contextos.
Como dice Ostapski et al. (2001), los estadísticos establecen estándares profesionales por su educación continua para asegurar
las ventajas e integridad de su metier. El título significa prometer valores profesionales para cultivar un gran sentido de
responsabilidad (Imrey, 1994) y generalmente acrecienta el profesionalismo para distinguir al estadístico bien entrenado de
aquellos que poseen menos calificación o habilidades. El título no resuelve, por si mismo, cómo cualquier individuo responderá
cuando se enfrente a presiones conflictivas, para arribar a una de las diferentes determinaciones críticas. El título por si mismo no
garantiza que el individuo reflejará las implicaciones éticas de una tarea estadística, cuando realice una acción.
No es fácil resolver tensiones que afectan el comportamiento ético en Estadística. Entre las estrategias de prevención para reducir
probables problemas éticos, se pueden mencionar: incluir educación y tratamientos sobre ética en la Universidad y programas de
entrenamiento específicos para discusiones sobre temas éticos y mecanismos para responder a los mismos.
Una pregunta relacionada es de qué manera se puede investigar la mala conducta ética. Existen algunas profesiones, como por
ejemplo: abogados, médicos, contadores, etc. que tienen desarrollados mecanismos para investigar violaciones éticas. Mientras,
por contraste, muchas organizaciones profesionales y científicas en las ciencias sociales, cuando se estudia una alegación
específica de mala conducta ética, tiene procedimientos de investigación mínima. Por otro lado, tampoco se controla que el
trabajo estadístico sea realmente realizado por profesionales estadísticos.
Una buena preparación universitaria colaborará a que el profesional estadístico tenga herramientas necesarias con el fin de
decidir de acuerdo a sus principios, el camino más acertado para resolver conflictos éticos. En su formación se debe enfatizar la
responsabilidad de que deben actuar éticamente, especialmente porque son profesionales que manejan información sensible y
que diseñan métodos y experimentos donde se involucran seres humanos, animales, medio ambiente, etc.”
153
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
154
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
REFERENCIAS BIBLIOGRÁFICAS
155
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
Alfabeto griego
letra Nombre Sonido AFI Valor HTML (1)
Α α Alfa [a] [aː] 1 α
Β β Beta [b] 2 β
Γγ Gamma [g] siempre 3 γ
Δδ Delta [d] 4 δ
Εε Épsilon [e] 5 ε
Ζζ Dseta [zd] o [dz] o [z] 7 ζ
Η η Eta [ɛː] 8 η
156
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
TERMINOLOGÍA ESTADÍSTICA
Conceptos generales
IRAM TEMA
1. OBJETO
1.1 Establecer las definiciones de los términos de uso más frecuente que se utilizan en estadística. Se excluyen de esta norma los
términos referentes al control estadístico de calidad, por hallarse definidos en las normas IRAM 14 e IRAM 15.
2. DEFINICIONES
2.1 CONCEPTOS INICIALES
2.1.1 elemento Objeto real, convencional o ideal de carácter singular, sobre el cual pueden efectuarse observaciones.
NOTA: Denominado también "unidad" o "unidad estadística".
2.1.4 Datos o datos estadísticos Conjunto de valores observados que pueden ser comparados, analizados, interpretados o
relacionados.
NOTA: Denominado también "información estadística".
2.1.5 Característica Propiedad que permite diferenciar los elementos de una población.
2.1.7 Variable contínua Característica cuantitativa que puede tomar cualquier valor dentro de su dominio.
2.1.8 Variable discreta Característica cuantitativa que solamente puede tomar determinados valores de su dominio.
2.1.10 Valor observado Cantidad o calidad que tiene una característica de un elemento determinado, en el momento que es sujeto
de observación.
NOTA: Denominado también "observación".
2.2.1 Empadronamiento Operativo para identificar y listar todos y cada uno de los elementos de una población // Entrevista
mediante la cual se obtiene y se registra información sobre cada uno de los elementos de la población.
2.2.2 Encuesta Método para recolectar información estadística de una población, contactando cada uno de los elementos de la
misma o a una parte de ella, con el objetivo de deducir características de conjunto relativas a esta población, en un momento dada
o relativas a su evolución en el transcurso del tiempo.
157
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2.2.3 Censo Encuesta exhaustiva de una población realizada en un momento determinado y con respecto a característica especí-
ficas.
2.2.5 Encuesta piloto Encuesta, generalmente de tamaño pequeño, llevada a cabo con anterioridad a la encuesta principal, para
lograr información tendiente a aumentar la eficiencia de la encuesta principal.
2.2.6 Censo por muestreo Operativo censal en el que a todos los elementos de la población se los interroga respecto de las
características básicas y a solo una muestra de ellos, sobre características no básicas.
2.2.7 Cuestionario Documento que contiene una sucesión de preguntas a las que deberá responder el encuestado y que ha sido
planeado para obtener y registrar información sobre una o varias características.
NOTA: Denominado también "cédula" o "formulario".
2.2.8 Tabla Forma de presentación de datos estadísticos arreglados sistemáticamente en columna o filas.
NOTA: También denominada "cuadro" o "tabulado".
2.2.9 Plan de tabulación Conjunto de tablas por medio del cual se prevé ordenar la información estadística y presentar los
resultados provenientes de un operativo de recolección de información.
2.3.2 Limites de clase Valores que define los extremos de una clase.
2.3.4 Frecuencia absoluta Cantidad de veces que se presentan un determinado valor observado o cantidad de valores observados
incluidos en una clase.
NOTA: Denominada también "frecuencia".
2.3.5 Frecuencia relativa Cociente entre la frecuencia absoluta y la cantidad total de valores observados.
2.3.6 Frecuencia acumulada Suma de las frecuencias (absoluta o relativas) para todos los valores inferiores o iguales a un
determinado valor de una característica o al límite superior de una clase.
2.3.7 Distinción de frecuencias Cuadros que presenta en forma ordenada a las clases o a los distintos valores de una variable
(derivados de valores observados) y sus correspondientes frecuencias.
2.3.8 Histograma Representación de la distribución de frecuencia absolutas o relativas, de una variable agrupada en clases
mediante un gráfico de superficies en un sistema de coordenadas cartesianas ortogonales. Sobre el eje de abscisas se presentan
las clases y se levantan sobre cada una de ellas un rectángulo cuya área es igual a la respectiva frecuencia.
2.3.9 Polígono de frecuencias Línea poligonal obtenida en un histograma, uniendo los puntos medios de los lados superiores de
los rectángulos. Los dos extremos del polígono pueden o no ser conectados con el eje de la variable. Cuando ello ocurre, se
emplean dos clases hipotéticas con frecuencia cero, colocada cada una de ellas en ambos extremos del histograma.
2.3.10 Gráfico de bastones Representación gráfica de las frecuencias acumuladas de una variable discreta mediante un gráfico de
puntos, en un sistema de coordenadas cartesianas ortogonales cuya abscisas son valores de una variable y cuyas ordenadas son
las frecuencias absolutas o relativas.
NOTA: Denominado también "diagrama breve".
2.3.11 Polígono de frecuencia acumuladas Representación gráfica de las frecuencias acumuladas de una variable agrupada en
clases, mediante una línea poligonal obtenida uniendo los puntos que tienen por abscisa los límites superiores de clases y por
ordenadas las respectivas frecuencias acumuladas.
158
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2.3.12 Gráfico acumulativo de frecuencias Representación gráfica de las frecuencias acumuladas de una variable discreta
mediante segmentos paralelos al eje de abscisas. Cada segmento se extiende entre dos valores consecutivos de la variable, siendo
las respectivas ordenadas las frecuencias acumuladas correspondientes al valor de variable que es abscisa del punto inicial del
segmento.
NOTA: Denominado también "gráfico escalonado".
2.3.13 Tabla de contingencia simple Cuadro que representa en forma ordenada las categorías de un atributo y sus correspon-
dientes frecuencias.
2.4.1 Medida aritmética Suma de los valores disponibles de una variable, dividida por la cantidad de los mismos.
NOTA: Denominada también "medida" o "promedio aritmético".
2.4.2 Ponderación Coeficiente numérica que expresa la importancia relativa de cada valor.
2.4.3 Medida aritmética ponderada Suma de los productos de cada valor disponible de una variable por su ponderación, dividida
por la suma de las ponderaciones.
2.4.4 Modo Valor o valores de la variable que se repiten la máxima cantidad de veces.
NOTA: Denominado también "moda", "valor tipo" o "valor típico"
2.4.5 Mediana Valor que en un conjunto de valores de una variable, ordenadas de acuerdo con su magnitud, supera a no más de
la mitad de los mismos y es simultáneamente superado por no más de la otra mitad.
2.4.6 Medida geométrica Raíz enésima del producto de los n valores disponibles de una variable.
2.4.7 Medida armónica Inversa de la medida aritmética de las inversas de los valores disponibles de una variable.
2.4.9 Desvío Diferencia entre un valor disponible de una variable y un valor constante.
2.4.10 Desvío con respecto a la medida aritmética Desvío cuyo valor constante es la media aritmética de los valores disponibles
de la variable considerada.
NOTA: Denominada también "desviación".
2.4.11 Desvío medio aritmético Promedio aritmético de los módulos de los desvíos con respecto a la media aritmética.
2.4.12 Variancia Promedio aritmético de los módulos de los desvíos con respecto a la media aritmética.
NOTA: Denominada también "varianza".
2.4.13 Desvío estándar Raíz cuadrada positiva de la variancia
NOTA: Denominado también "desviación típica", "desviación normal" o "desviación estándar".
2.4.14 Coeficiente de variación Cociente entre el desvío estándar y la media aritmética de los valores disponibles de una misma
variable.
NOTA: Denominada también "coeficiente de variabilidad"
2.5.1 Serie cronológica Conjunto de valores ordenados cronológicamente, provenientes de sucesivas observaciones de un mismo
fenómeno que se refieren a diferentes períodos de tiempo. En general los intervalos entre las sucesivas observaciones son
159
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
constantes. Sus factores de variación o componentes se denominan: "tendencia", "variación estacional", "variación clínica" y
"variación residual".
NOTA: Denominada también "serie de tiempo" o "serie temporal".
2.5.2 Serie económica Serie cronológica en la que se analiza el comportamiento de variables económicas.
2.5.3 Tendencia Componente sistemático o regular, no periódica, de una serie cronológica, que describe la evolución básica del
movimiento de la serie en un período extenso. Se representa generalmente por medio de alguna función matemática cuya ecua-
ción describe un movimiento suave a lo largo del tiempo.
NOTA: Denominada también "tendencia secular".
2.5.4 Variación estacionales Componentes periódicas de una serie cronológica, cuyas fluctuaciones se repiten en forma regular,
inscriptas en el marco de cada año y que se reproducen de manera más o menos permanente de un año a otro.
NOTA: Denominadas también "fluctuaciones estacionales" o "movimientos estacionales".
2.5.5 Índice de variación estacional Valor relativo que cuantifica la incidencia de la variación estacional en el comportamiento
periódico de una serie cronológica.
2.5.6 Variaciones cíclicas Componentes periódicas de una serie cronológicas cuyas fluctuaciones se repiten en forma regular con
períodos mayores a un año y que se reproducen de manera más o menos permanente cada cierta cantidad de años, según el
período.
2.5.7 Variaciones residuales Componentes no periódicas de una serie cronológica cuyas fluctuaciones se presentan en forma
irregular e imprevisible. Son debidas a factores perturbadores no permanentes.
NOTA: Denominadas también "variaciones irregulares".
2.6.1 Suceso aleatorio Acontecimiento con relación al cual existe incertidumbre acerca de su ocurrencia; es decir que antes de
realizar el experimento no se lo puede predecir con seguridad completa.
NOTA: Denominado también "evento aleatorio" o "estocástico".
2.6.2 Probabilidad de un suceso aleatorio Medida del grado de incertidumbre. Se puede calcular según la ascripción a una
determinada teoría del cálculo de probabilidades, como:
a) Cociente entre en número de casos favorables que corresponden al suceso aleatorio y el número de casos posibles res-
pectivos, siempre que estos sean igualmente probables, equiprobables o simétricos (definición clásica de probabilidad);
b) Límite hacia el cual tiene la frecuencia relativa del suceso aleatorio cuando el número de experimentos crece indefinidamente
(definición frecuencial, experimental o empirista);
2.6.3 Sucesos aleatorio combinado Combinación de dos o más acontecimientos aleatorios, de los cuales interesa calcular la
probabilidad. Las combinaciones más habituales, son las que se establecen con el uso de las conjunciones disyuntiva o y copulativa
y, cuando se dice la probabilidad de un suceso aleatorio u otro y la probabilidad de un suceso aleatorio y otro. Tales combinaciones
corresponden el Lógica a dos Clases de operaciones: la suma lógica y el producto o intersección.
2.6.4 Probabilidad total Probabilidad de un suceso aleatorio combinado, cuando la combinación se 0establece usando la con-
junción disyuntiva o. En el caso de dos sucesos es la suma de las probabilidades simples correspondientes a cada uno de ellos
menos la probabilidad conjunta de ambos.
2.6.5 Sucesos aleatorios incompatibles Aquellos que no pueden verificarse juntos al realizarse un experimento, es decir aquellos
cuya probabilidad conjunta vale cero. En consecuencia la probabilidad total correspondiente a ellos es la suma de las
probabilidades simples respectivas.
160
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2.6.6 Sucesos aleatorios independientes Dos o más sucesos aleatorios son independientes cuando el hecho de saber que se ha
verificado o no uno de los acontecimiento, no modificada la probabilidad de ocurrencia del otro u otros sucesos compatibles con
el anterior.
2.6.7 Sucesos aleatorios dependientes Dos o más sucesos aleatorios son dependientes cuando el hecho de saber que se ha
verificado o no uno de los acontecimientos modifica la probabilidad de ocurrencia del otro u otros sucesos compatibles con el
anterior.
2.6.8 Probabilidad condicional Probabilidad de un acontecimiento aleatorio dependiente cuando se ha verificado previamente
otro u otros sucesos compatibles con el anterior.
2.6.9 Probabilidad compuesta Probabilidad de un suceso aleatorio combinado cuando la combinación se establece usando la
conjunción copulativa y. En el caso de dos sucesos es el producto de la propiedad simple de uno de ellos por la probabilidad
condicional del otro. Si los sucesos aleatorios son independientes, la probabilidad compuesta es igual al producto de las respectivas
probabilidades simples de cada uno de los acontecimientos.
2.6.10 Variable aleatoria Aquella que puede tomar uno cualquiera de los valores posibles de un conjunto finito o infinito (dominio),
cada uno de los cuales tiene asociada una probabilidad si la variable es discreta o una densidad de probabilidad si la misma es
contínua. La suma de estas probabilidades es igual a uno.
NOTA: Denominada también "variable estocástica".
2.7 INFERENCIA
2.7.2 Muestra Conjunto de elementos tomados de una población dad, destinado a suministrar información sobre ésta.
2.7.3 Muestra probabilística Muestra seleccionada mediante la aplicación de algún método información en el Cálculo de Proba-
bilidades.
2.7.5 Estadístico Relación matemática que vincula los valores de una o más características, los cuales proceden de una o varias
muestras.
NOTA: Denominado también "estadígrafo".
2.7.6 Coeficiente estadístico Denominación que se emplea generalmente para llamar a los estadísticos sin dimensión, es decir
número puro.
2.7.7 Estimación Conjunto de métodos de la Estadística Inductiva que, basado en el Cálculo de probabilidades, permite a partir de
muestras probabilísticas, inferir las leyes de distribución de las características consideradas en la población de la cual provienen,
o juzgar la validez de ciertas hipótesis // Resultado obtenido por la aplicación del método de estimación utilizado.
2.7.8 Estimador Estadístico aplicado a una o varias muestras probabilísticas para estimar un parámetro desconocido de la
población. Es una variable aleatoria.
2.7.9 Estimación puntual Método que permite a partir de los valores muestrales y de un estimador, calcular un único valor como
estimación de un parámetro desconocido. Se utiliza como estimación un sólo punto del dominio de dicho estimador.
2.7.10 Estimación por intervención Método que permite obtener un intervalo aleatorio que tiene una probabilidad (1 - ") definida
previamente, de contener al verdadero valor desconocido de un parámetro. Es un método de estimación que, si se aplicara una
gran cantidad de veces, cubriría al verdadero valor del parámetro en 100 (1 - ") % de los casos.
2.7.11 Intervalo de confianza (1 - ") Es el intervalo (t1, t2) que tiene probabilidad (1 - ") de contener el verdadero valor desconocido
del parámetro que desea estimar.
161
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2.7.12 Límites inferiores y superiores del intervalo de confianza (1 - ") Son los respectivos extremos, t1, t2 del intervalo que tiene
probabilidad (1 - ") de contener al verdadero desconocido del parámetro. Dichos extremos son aleatorios porque se calculan en
función de un estimador.
2.7.13 Nivel de confianza (1 - ") Es la probabilidad (1 - ") definida previamente, de que el intervalo (t 1, t2) cubra el verdadero valor
desconocido del parámetro.
NOTA: Denominado también "coeficiente de confianza".
2.7.14 Nivel de riesgo (") Es la probabilidad " de que el intervalo (t1, t2) no contenga el verdadero valor desconocido del parámetro.
NOTA: Denominado también "coeficiente de riesgo".
2.8.1 Regresión Método estadístico utilizado para establecer y estimar la función que relaciona una variable aleatoria dependiente
con una o más variables independientes, que pueden o no ser aleatorias. En algunos casos a las variables independientes se las
denomina explicativas o descriptivas y a la variable dependiente explicada.
2.8.2 Función de regresión Función matemática que liga los valores de la o las variaciones independientes con la media aritmética
o con la esperanza matemática de las distribuciones de la variable dependiente.
NOTA: Denominada también "ecuación de regresión".
2.8.4 Coeficiente de regresión Cada uno de los parámetros que determinan o identifican una función de regresión.
2.8.5 Correlación Método estadístico utilizado para medir la interdependencia o ligazón aparente dos o más variables aleatorias.
2.8.6 Coeficiente de correlación Medida de la relación o interdependencia existente entre dos o más variables aleatorias.
2.8.7 Asociación Métodos estadísticos utilizado para medir la interdependencia o ligazón aparente entre dos o más características.
2.8.8 Coeficiente de asociación Medida de la asociación existente entre dos o más características.
2.9.2. base de un número índice. Momento, período o punto con respecto al cual se establece la comparación. Generalmente al
índice en la base se le asigna valor 100.
2.9.3. número índice de precios. Aquel que refleja la variación de los precios de un conjunto de bienes o servicios, entre dos
momentos en el tiempo o dos puntos en el espacio.
2.9.4. número índice de cantidades. Aquel que refleja la variación de las cantidades de un conjunto de bienes o servicios, entre
dos momentos en el tiempo o dos puntos en el espacio.
2.9.5. número índice de valor. Aquel que refleja la variación en el valor total (precio multiplicado por cantidad) de un conjunto de
bienes o servicios, entre dos momentos en el tiempo o dos puntos en el espacio.
2.9.6. relativo de precio. Razón del precio de un bien o servicio, en un período o punto dado, respecto al precio del mismo bien o
servicio, en el período o punto base. Estos relativos integran los números índices entre los cuales las fórmulas más frecuentemente
usadas son las de Laspeyres o Paasche.
162
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
2.9.7. relativo de cantidad. Razón del precio de un bien o servicio, en un período o punto dado, respecto a la cantidad del mismo
bien o servicio en el período o punto base.
2.9.8. canasta. Conjunto seleccionado de los bienes y servicios sobre el que se basa el cálculo de un determinado número índice.
La selección se realiza generalmente a partir de la lista exhaustiva de bienes y servicios vinculados con el fenómeno que se desea
reflejar, y debe cumplir la condición de respetar la representatividad o participación de las distintas categorías o capítulos en el
conjunto total.
2.9.9. número índice de precios de Laspeyres. Aquel que se calcula como un conjunto cuyo numerador es la suma de los precios
de un período o punto dado, ponderados por las cantidades del período o punto base. Ambas sumas involucran todos los bienes
y servicios de la canasta respectiva.
2.9.10 número índice de cantidad de Laspeyres. Aquel que se calcula como un cociente cuyo numerador es la suma de las
cantidades de un período o punto dado, ponderados por los precios del período o punto base, y cuyo denominador es la suma de
las cantidades, por los precios del período o punto base.
2.9.11 número índice de precios de Paasche. Aquel que se calcula como un cociente cuyo nominador es la suma de los precios por
las cantidades de un período o punto dado y cuyo denominador es la suma de los precios del período o punto base, ponderados
por las cantidades del período dado.
2.9.12 número índice de cantidades de Paasche. Aquel que se calcula como un cociente cuyo denominador es la suma de las
cantidades por los precios de un período o punto dado y cuyo denominadores es la suma de las cantidades del período o punto
base, ponderadas por los precios del período dado.
****************************
APROBADO SU ENVÍO A DISCUSIÓN PUBLICA POR EL SUBCOMITÉ DE ESTADÍSTICA EN SU SESIÓN DE 14 DE DICIEMBRE DE 1982
(Acta 5-82)
(Firmado) (Firmado)
Lic. J. Ibáñez Lic. S. B. Esrequis
IRAM Secretario del Subcomité
(Firmado)
Dr. E.V. Pineda
Vº Bº Equipo A
163
GUIA PRÁCTICA DE EJERC.BÁSIC.y ORIENT.de ESTADÍST.–FCE-U.B.A. 1°C 2018. –Prof. Aída B. Castegnaro
ESTADÍSTICA
p(r )
R
r nr
. N R
N p( x) nx . p x .q n x
n
e x
p( x)
x!
1
z 1 z2
F ( z)
xm
z .e 2
dz
2
164