Está en la página 1de 14

AUTOR Salomón Acosta Ramírez

CURSO Estadística General

INDICE

1. Introducción …………………………………………………………………. 4

2. Definiciones básicas ........................................................................................ 7


Estadistica Descriptiva e inferencial
Definiciones básicas
Variables y escalas de medición

3. Organización y presentación de datos ........................................................... 15


Tablas de Frecuencias
Gráficos para variables cuantitativas y cualitativas

4. Medidas de Tendencia Central ...................................................................... 30


Media Aritmética
Mediana
Moda
Percentiles

5. Medidas de Dispersión .................................................................................. 37


Rango
Rango Intercuartil
Varianza
Desviación estándar
Coeficiente de Variación

6. Regresión Lineal y Curvilineal ……………………………………………. 44


Regresión lineal
Coeficiente de Correlación
Regresión curvilineal

7. Probabilidades ................................................................................................ 54
Axiomas y teoremas de probabilidad
Probabilidad Condicional
Teorema de la probabilidad Total
Teorema de Bayes
8. Variables aleatorias ........................................................................................ 76
Variable aleatoria Discreta y Continua
Valor esperado y varianza

9. Distribuciones discretas especiales ................................................................. 80


Distribución Binomial
Distribución de Poisson

10. Distribuciones continuas especiales ................................................................ 86


Distribución Uniforme
Distribución Exponencial
Distribución Normal
Distribuciones especiales con Excel ………………………………………… 94

11. Distribuciones muestrales .............................................................................. 103


Distribución muestral de la media
Distribución muestral de la proporción
Distribución muestral de la varianza

12. Intervalos de confianza .................................................................................. 109


Intervalo de confianza para la media
Intervalo de confianza para la proporción
Intervalo de confianza para la varianza

13. Pruebas de Hipótesis ……………………………………………………….. 123


Prueba de hipótesis para un promedio
Prueba de hipótesis para una proporción
Prueba de hipótesis para una varianza

14. Aplicaciones estadísticas con Excel .............................................................. 133


Tablas de Frecuencias, Gráficos
Probabilidades con Excel: Binomial, Poisson
Probabilidades con Excel: Normal y normal Estandar

15. Silabo y Plan calendario: 2009-02 ................................................................ 148

2009 02 2
¿Qué es la estadística?
Entre las varias definiciones que se dan, la más común la define como la
ciencia que proporciona un conjunto de métodos, técnicas y
procedimientos para recopilar, organizar, presentar y analizar un conjunto
de información. La finalidad y utilidad es describir, numérica ó
gráficamente al conjunto de datos, así como también realizar inferencias,
entendidas también como generalizaciones de lo observado.

Para recopilar información los


procedimientos más comunes incluyen: la
entrevista personal domiciliaria, entrevistas
en centros comerciales, entrevistas por
teléfono desde una oficina ó por correo
electrónico.

2009 02 3
PERÚ, PIRÁMIDE DE POBLACIÓN TOTAL: 2005

80 a mas
75 a 79
70 a 74
65 a 69
60 a 64
55 a 59
50 a 54
45 a 49
Edad

40 a 44
35 a 39
30 a 34
25 a 29
20 a 24
15 a 19
10 a 14
5a9
0a4
7 6 5 4 3 2 1 0 1 2 3 4 5 6 7
Porcentajes

% Hombres % Mujeres

La presentación gráfica de la información permite, en la mayoría de casos,


obtener conclusiones descriptivas del comportamiento de la variable que se está
analizando. En la pirámide de población mostrada en la página anterior, se
observa la población de Perú al año 2005 agrupada horizontalmente por rango de
edades y por género.

2009 02 4
La Estadística, como todas las ciencias, no surgió de un momento a otro, sino mediante
un proceso largo de desarrollo y evolución, desde hechos de simple recolección de datos
hasta la diversidad y rigurosa interpretación de los datos que se dan hoy en día. Así pues,
el origen de la Estadística se remonta a los comienzos de la historia y esto se sabe tanto a
través de crónicas, datos escritos, como de restos arqueológicos, y esto es explicable por
cuanto en ese tiempo se estaba formado recién la sociedad y es algo inherente la
necesidad de saber cosas elementales como: cuántos habitantes tiene a tribu, con cuantos
bienes cuenta, etc.

¿Qué debemos entender por “Estadística Descriptiva”?

Aquella rama de la estadística que sólo describe a un conjunto de datos, usando


para ello medidas de resumen, tablas de frecuencias y/o gráficos. Dichos datos
pueden ser obtenidos desde una muestra ó desde una población.

2009 02 5
Por ejemplo, en el siguiente cuadro se describe las principales causas de muerte
ocurridas el año 2005:

Pr

¿Qué debemos entender por “Estadística Inferencial”?


Aquella rama de la estadística que generaliza los resultados hallados en una
muestra representativa, haciéndolos válidos hacia toda la población.

TOTAL
Infecciones respirat
Septicemia, excepto
Para que una muestra sea representativa, ésta tiene que ser adecuada en tamaño y
calidad, es decir, importa la cantidad de elementos analizados en la muestra y la
forma como ésta ha sido seleccionada. Estos temas (muestreo y tamaño de
muestra) se estudiaran en la segunda parte del curso.

Tuberculosis DEFINICIONES BÁSICAS

2009 02
Enfermedad por VIH 6
POBLACIÓN

 Se define así al conjunto de personas ú objetos


que presentan características comunes que los
identifican y que pueden ser medidas.

MUESTRA

 Subconjunto obtenido de la población.


La muestra se hace necesaria cuando no se puede cubrir
todos los elementos de la población, entre otros factores,
debido a: altos costos, escaso tiempo, inaccesibilidad a
los elementos que reportan información.

UNIDAD DE ANÁLISIS

 Se llamará así a cada uno de los elementos de una población sobre el que se hará la
medición de la característica de interés. También se le conoce como “unidad
estadística” ó “unidad elemental”.

UNIDAD DE MUESTREO

 Está determinada por el agrupamiento de una ó mas unidades de análisis. Las


unidades de muestreo deben cubrir a toda la población y no traslaparse en el sentido
de que todo elemento de la población pertenezca a solo una unidad de muestreo.
Además, cada unidad de muestreo debe estar perfectamente definida, ser
identificable y observable.
Por ejemplo:
Si nuestra unidad de análisis en una encuesta son las familias de un distrito,
nuestra unidad de muestreo podría ser las manzanas que conforman ese distrito.

Otro ejemplo:
En una encuesta a realizar en la ciudad de Lima, la unidad de muestreo puede ser
una persona, los miembros de una familia o las personas que viven en una
manzana.

2009 02 7
MARCO DE MUESTREO

 Se llama así a la lista ó mapa de todas las unidades de muestreo.

Por ejemplo:
Si la unidad de muestreo son las manzanas de un distrito, el marco de muestreo
será la relación de todas las manzanas de ese distrito, dicho marco de muestreo
está disponible en el municipio del distrito.

Otro ejemplo
Supongamos que recibimos un lote de 4000 cajas que contienen 25 artículos cada
una. Para realizar una inspección por muestreo, el marco muestral está dado por
la lista de todas las 4000 cajas recibidas. La unidad de muestreo será un caja y la
unidad de análisis un artículo.

PARÁMETRO

 Representa una característica de la población, por ejemplo: promedio poblacional,


varianza poblacional, porcentaje poblacional.
Para obtener su valor se hace necesario contar con toda la información que brindan
los elementos de una población.

ESTADIGRAFO O ESTIMADOR

 Representa una característica de la muestra. Para obtener su valor se utiliza la


información muestral. Cabe mencionar que los valores obtenidos de un estimador se
conoce como estimación.

Los parámetros y estadígrafos de mayor uso son:

NOMBRE: PARÁMETRO ESTADIGRAFO


N n

1. PROMEDIO ∑X i ∑X i
μ= i =1
X= i =1

N n
N

∑( X )
n

∑ (X
2
i − μ) 2 i −X
2. VARIANZA
σ2 = i =1
S2 = i =1

N n-1
3. DESVIACIÓN
σ S
ESTANDAR
Nº de exitos Nºde exitos
4. PROPORCIÓN P= P$ =
N n

2009 02 8
Una breve referencia de los términos mencionados la encontramos en las “Fichas
Técnicas” que actualmente las encuestadoras acompañan a los resultados obtenidos en
sus trabajos de campo. Por ejemplo, la encuestadora IECOS presenta la siguiente ficha
técnica en una de sus publicaciones el 8 de Diciembre del 2005:

FICHA TÉCNICA:
Instituto de Opinión Pública de la pontificia
Universidad Católica del Perú. Registro: 108-
REE/JNE. Financiamiento: PUCP.
Universo: Hombres y mujeres mayores de 18
años, habitantes de 31 distritos de Lima
Metropolitana. Representatividad: 95.88%
de la población electoral total de la provincia
de Lima. Muestra: 449 entrevistados en Lima
Metropolitana. Error permitido: ±4.7% para
Lima M. y ±4.62% para el Callao. Nivel de
confianza: 95%. Cobertura: 28 distritos de
Lima Metropolitana. Muestreo: Probabilística
polietápico. Técnica: entrevistas directas en
las viviendas seleccionadas. Fecha: entre los
días 2 y 3 de Marzo del 2007.

VARIABLES Y ESCALAS DE MEDICIÓN

Variable

 Se define así a toda característica o propiedad que presentan los elementos de una
población y que puede asumir diferentes valores cuando se realiza su medición.

Por ejemplo:
Edad, Sexo,

2009 02 9
Grado de instrucción,
Preferencia electoral, etc.

Escalas de Medición

La medición de una variable consiste en


asignar un “valor” a la característica o
propiedad observada. Por ejemplo si la
característica observada es el género de las
personas, al clasificar a una persona como de
sexo “femenino” le estamos asignando un
valor, estamos haciendo una medición de la
característica.

El proceso de medición utiliza diversas escalas: Nominal, Ordinal, Intervalo y Razón.

Escala Nominal: Sólo permite asignar un nombre, etiqueta o valor al elemento sometido
a medición. Los números que se puedan asignar a las propiedades observadas se utilizan
como “etiquetas” sólo con la finalidad de clasificarlos. Con esta escala no tiene sentido
realizar operaciones aritméticas.

Por ejemplo:
Número de camiseta de un jugador en un equipo de fútbol,
Opinión a favor o en contra del Tratado de Libre Comercio,
Nacionalidad, etc.

Escala Ordinal: Además de asignar un nombre, etiqueta o valor, esta escala permite
establecer un orden entre los elementos sometidos a medición. Los números que se
asignen a las propiedades deben respetar el orden de la característica que se mide. Con
esta escala solo se puede establecer una relación de orden.
Por ejemplo:
Grado de instrucción,
Nivel de satisfacción del servicio de un supermercado,
Etapa de desarrollo de un ser vivo, etc.

Escala de Intervalo: Además de asignar un nombre ó etiqueta y establecer un orden


entre los elementos, esta escala permite calcular diferencias entre los números asignados
a las mediciones. En esta escala el punto cero es relativo.

Por ejemplo:
Temperatura de una persona,

2009 02 10
Ubicación en una carretera respecto de un punto de referencia, etc.

Escala de Razón: Presenta las propiedades de las escalas anteriores y además tiene un
punto cero real en su origen. En esta escala se permite las operaciones aritméticas a los
números asignados.

Por ejemplo:
Altura de una persona,
Velocidad de un auto en la carretera, etc.

Tipos de Variables

Cualitativas: Aquellas que al ser medidas quedan expresadas por etiquetas o


nombres que se utilizan para identificar una característica o atributo. Las
mediciones de estas características emplean la escala nominal ú ordinal.

Cuantitativas: Se expresan en escala de intervalo o de razón. Estas a su vez


pueden llamarse cuantitativa Discreta o Cuantitativa Continua.
Una variable cuantitativa discreta solo asume un número finito ó infinito
numerable de valores, mientras que una variable cuantitativa continua asume
valores en un intervalo real o unión de intervalos reales.
Considere lo siguiente: a las variables discretas se las cuenta y a las continuas se
las mide.

EJERCICIOS:
1. Conteste las siguientes preguntas justificando
adecuadamente las respuestas:
a. ¿Qué importancia práctica tiene determinar la escala
de medición de una variable?
b. ¿Qué diferencias hay entre la escala de intervalos y la
de razón? Muestre ejemplos que sustenten su
respuesta.
c. ¿Que diferencia existe entre dato e información?
Muestre ejemplos que sustenten su respuesta.

2. Indique el tipo de variable y la escala de medición que sea apropiada para cada una
de las siguientes variables:
a. Edad
b. Marca de automóvil
c. Número de personas a favor de la pena de muerte
d. Ventas anuales
e. Tamaño de bebida (pequeño, mediano, grande)
f. Método de pago (efectivo, cheque, tarjeta de crédito)
g. Número del DNI
h. Número en la camiseta de un jugador de fútbol
i. Grado de un miembro del ejército (soldado raso, sargento, cabo, etc)

2009 02 11
j. Placa de automóvil.

3. El objetivo de una investigación, realizada en Lima, fue comprobar si existe o no


una diferencia significativa entre personas de edad adulta (mayores de 65 años) que
realizan actividad física y las que no lo hacen, en relación a la presencia de síntomas
depresivos en esta edad.
Para efectos de la investigación, se analizó un grupo de 40 ancianos de los cuales 30
fueron escogidos del total de ancianos que residen en sus hogares y 10 de un
gimnasio exclusivo para adultos en el rango de edad especificado. De cada lugar se
seleccionó igual cantidad de hombres y mujeres. Se decidió encuestar a un grupo de
ancianos de un gimnasio para compensar el posible riesgo de no encontrar adultos
residentes en su hogar que realizaran algún tipo de ejercicio o actividad física.
Se realizo algunas preguntas sobre la salud mental y física de las personas
pertenecientes a la muestra. Algunos de los resultados encontrados se presentan a
continuación:
• El 45% padece insomnio.
• Puntaje promedio obtenido en una prueba de habilidades cognitivas 78 puntos.
• 32% realiza algún tipo de actividad física o deporte.
• Tempo promedio dedicado a actividades físicas: 118 minutos por semana.
De acuerdo al enunciado propuesto determine:

a) La población y la muestra.
b) Las variables involucradas y su escala de medición respectiva.

4. A la asociación estadounidense “National Health Care” le preocupa un informe


recientemente publicado por una revista especializada en salud que estima una
escasez de enfermeras a futuro. Para investigar el grado actual de satisfacción con la
profesión entre las enfermeras, se ha patrocinado un estudio en hospitales por todo
Estados Unidos. Como parte de este estudio se pidió a 300 enfermeras, elegidas
aleatoriamente, que indicaran su grado de satisfacción en el trabajo y con las
oportunidades que tienen de ascender. Cada uno de los dos aspectos de satisfacción
fue medido en una escala de 0 a 100 puntos donde los mayores valores representan
mayores niveles de satisfacción. Los datos reunidos mostraron también la clase de
hospital donde laboran las enfermeras: Privado (P), Administración de Veteranos
(AV) y Universitario (U). Se registró además la Edad, Lugar de residencia (dividido
en sectores) y el Tiempo que demora en llegar a su centro de trabajo.
Según el enunciado propuesto indique:

a) Población, muestra y marco de muestreo.


b) La(s) variable(s) involucrada(s) y la escala de medición que corresponda.
c) Mencione 2 parámetros y dos estadígrafos que sean de utilidad en el caso
propuesto.

5. Un investigador evalúa la hipótesis de investigación según la cual los adultos


mayores al encontrarse en la última etapa de su vida son más proclive a la depresión.
La investigación se realizará en aquellas personas que tengan entre 65 y 85 años que
residan en hogares de ancianos de diferentes niveles socioeconómicos de la ciudad

2009 02 12
de Lima. La muestra se obtiene al seleccionar al azar 10 personas entre 65 y 85
años, hombres y mujeres de cada uno de los cinco asilos de ancianos existentes. La
forma de elegir a las diez personas de cada hogar fue al azar a partir de una lista con
los nombres de quienes no estaban tomando ningún medicamento, tuvieran un
estado de conciencia normal y no estuvieran en duelo. Algunos resultados se
muestran a continuación:
• El 36% de ancianos opinaba que el servicio de alimentación era bueno.
• El número promedio de hijos es de 3.85.
• Puntaje promedio en una prueba de evaluación de habilidades cognitivas:
48.5 (notas de 0 a 100) .
• Edad promedio 72.25 años.
Según el enunciado propuesto responda a las siguientes preguntas:

a) Identifique la población, muestra bajo estudio y unidad de análisis.


b) A partir de los resultados mostrados, identifique las variables involucradas así
como su tipo y escala de medición.
c) En base a los resultados mostrados, menciones tres estadísticos.

6. Investigaciones científicas han demostrado que el calcio se presenta normalmente en


la sangre de los individuos en concentraciones cuyo promedio se estima en 6
miligramos por cada 100 mililitros del total de sangre. La dispersión de esta
característica (calcio presente en la sangre) que se considera aceptable es de 1
miligramo por cada 100 mililitros de sangre. Además, se sabe que una dispersión
mayor a ésta puede ocasionar graves trastornos en la coagulación de la sangre. Un
grupo de médicos pretende verificar si los valores establecidos son los mismos para
la población del departamento de Arequipa comprendida entre 18 y 60 años. Para tal
efecto el grupo de médicos analiza una muestra aleatoria de 125 personas entre 18 y
60 años recopilando además información sobre: Edad, Estatura y Cociente
intelectual.

a) Según el enunciado propuesto determine: La población y la muestra.


b) Determine las variables investigadas así como la escala de medición de cada
variable.
c) Enuncie un parámetro y un estadístico.
d) Según la investigación que se realiza en Arequipa, se hace uso de “Estadística
descriptiva” ó “Estadística Inferencial”. Sustente su respuesta.

7. La Cooperativa de consumo “La Positiva”, es una entidad dedicada a vender


productos alimenticios de buena calidad y a bajos precios. Actualmente la
cooperativa cuenta con 5500 socios. Para comprar en la cooperativa, las personas
tienen que ser socios. El gerente ha notado que últimamente ha perdido contacto con
los patrones de compra de un producto determinado, por ello tomó una encuesta de
20 preguntas a una muestra de 125 socios. Algunas de las preguntas fueron:

2009 02 13
1. ¿Con qué frecuencia compra e
Respuesta: _______
2 ¿Cuál es el motivo principal d
Calidad del producto
a) Determine la población y muestra bajo estudio.
b) Indique el tipo de variable y la respectiva escala de medición que corresponde a cada
variable de las preguntas de la encuesta parcialmente mostrada.
Precios bajos
Excelente ubicación
Otros
3. ¿Qué le parece la calidad de la
Mala
Regular
Buena
Muy buena
Excelente
2009 02 14

También podría gustarte