CAPTULO 1
CONCEPTOS GENERALES
1.1 Definicin de Estadstica
Utilizar el trmino estadstica es bastante comn. Podemos escucharlo en la radio, la
televisin, o leerlo en peridicos o revistas con bastante frecuencia. Con seguridad hemos
ledo frases como: las estadsticas nos muestran que el pueblo estadounidense, en general,
est contento con el gobierno de Bill Clinton, o bien, segn las estadsticas, el porcentaje de
nios con desnutricin crnica en ciertas comunidades rurales de Mxico es de
aproximadamente el sesenta por ciento.
Y as, en general, podemos leer o escuchar
informacin semejante acerca de la economa, los deportes, la poblacin, etctera.
Usualmente el trmino estadstica es utilizado simplemente para referirse a datos numricos y
no queda claro que la Estadstica puede ser aplicada en muchas reas de la actividad
humana, como las ciencias sociales, fsicas y naturales, y en muchos otros campos.
Si nos referimos a libros sobre la materia, o bien a diccionarios, buscando la definicin de
Estadstica, encontraremos que sta es muy similar en todos ellos. As, por ejemplo, podemos
encontrar:
Estadstica. Es un campo de estudio que se ocupa de la recoleccin, organizacin y
resumen de datos. Nos permite hacer inferencias acerca de un gran conjunto de datos cuando
slo se ha estudiado una parte de ese conjunto.
Estadstica. Se ocupa del desarrollo y aplicacin de procesos, mtodos y tcnicas para
coleccionar, analizar e interpretar datos. Nos ayuda tambin en la toma de decisiones.
Estadstica.
Podemos agrupar los datos estadsticos que obtenemos de las muestras, en dos amplias
clases:
Datos cualitativos. Son observaciones que pueden ser clasificadas en una categora o
un conjunto de categoras. Ejemplo: sexo, escolaridad, estado civil, tipo sanguneo, etctera.
Datos cuantitativos. Son aquellos que pueden ser medidos en unidades de una escala;
por ejemplo: la edad, el peso, la temperatura, etctera.
Podemos separar los estudios estadsticos en dos clases, dependiendo de que sean
estudios observacionales o estudios experimentales.
Estudio observacional. Aqu el investigador analiza las variables de inters observando
los datos o revisando datos histricos. No tiene un control directo para determinar qu sujetos
o unidades experimentales recibirn el o los tratamientos que se piensa tienen un efecto en las
variables de inters en el estudio. Ejemplo: un agente desea ver la relacin que existe entre el
tamao del terreno y la localizacin de ste en cierta regin, y el precio del mismo. En este
caso no puede variar por s mismo ninguna de las variables que segn l influyen en el precio.
____________________________________________________________________________________________
2
Gudelia Figueroa Preciado - Marco Antonio Valencia Arvizu
____________________________________________________________________________________________
4
Gudelia Figueroa Preciado - Marco Antonio Valencia Arvizu
EJERCICIOS
1.4.1 Una empresa publicitaria est interesada en determinar el nmero promedio de
horas que se ve televisin en los hogares de cierto municipio. El municipio comprende dos
pueblos A y B y un rea rural. El pueblo A circunda una fbrica y la mayora de los hogares
son de trabajadores textiles y el pueblo B es un suburbio exclusivo y consta de habitantes ms
viejos con pocos nios en casa. En el rea rural las condiciones entre ellos son muy similares.
El pueblo A consta de 155 hogares, el pueblo B de 62 y el rea rural de 93. Si se desea una
muestra de 30 hogares, cmo efectuara usted el muestreo?
1.4.2 La administracin de una empresa de servicio pblico est interesada en la cantidad
promedio de tiempo que tienen de estar vencidas las cuentas atrasadas. Se extraer una
muestra de 97 cuentas de las 2500 vencidas que se encuentran capturadas en orden
alfabtico. Cmo seleccionara usted la muestra?
1.4.3 Una empresa publicitaria est iniciando una campaa de promocin para un nuevo
producto. La empresa quiere muestrear clientes potenciales en una pequea comunidad para
determinar la aceptacin del producto. Si en cierto registro de la comunidad se tienen listados
los 5000 nombres de los jefes de familia, con su nmero telefnico, cmo seleccionara usted
una muestra de 910 jefes de familia?
1.4.4 Un guardabosques desea estimar la altura promedio de los rboles de una
plantacin. La plantacin se divide en parcelas de un cuarto de hectrea. Si se quiere una
muestra de 20 parcelas de un total de 356 parcelas, qu tipo de muestreo considera
adecuado para ello?
____________________________________________________________________________________________
6
Gudelia Figueroa Preciado - Marco Antonio Valencia Arvizu
Un siclogo desea conocer si las personas con un coeficiente de inteligencia (IQ) alto, son
ms rpidas al resolver un acertijo que las personas con un IQ normal. Basado en
experiencias anteriores, sabe que las personas con un IQ normal resuelven el acertijo en
un promedio de 4.6 minutos. Para justificar su suposicin, presenta el acertijo a un
conjunto de 10 personas con un IQ alto y obtiene los siguientes resultados: 4.0, 4.2, 4.5,
4.3, 4.6, 4.0, 4.2, 4.1, 4.2 y 4.3. Con estos datos tratar de verificar, utilizando cierta
prueba, si el tiempo promedio para resolver el acertijo es de 4.6 minutos, o es menor para
este tipo de personas.
Un contratista compra cemento de un fabricante local. Se supone que cada saco pesa 50
kilogramos y la distribucin de los contenidos se considera normal con varianza conocida.
Para ver si est obteniendo lo correcto, pesa 15 sacos de cemento y calcula el promedio de
stos, obteniendo una media de 49.8 kilogramos. Utilizando esta informacin, desea hacer
una prueba para ver si puede demandar al fabricante por incluir un peso menor al
especificado en los sacos.
Un investigador est estudiando el posible efecto de una dieta especial para retardar el
problema de arteroesclerosis. Se monitorean 846 personas aleatoriamente seleccionadas.
A una mitad de ellas se les administra la dieta y a la otra mitad se les permite comer lo que
ellas deseen. Al final de ocho aos, se analizan los resultados. Si denotamos por p x la
verdadera proporcin de gente que muere por un infarto y que seguan la dieta, y por p y la
proporcin que muere por infarto sin haber seguido la dieta, deseamos entonces probar si
p x = p y o si p x p y .
___________________________________________________________________________
Estadstica
7
Los registros de las cortes estadounidenses parecen indicar que la duracin de las
sentencias para un mismo crimen puede variar considerablemente de juez a juez. Para
comprobar si esto es cierto, se analizan dos muestras de tamao ocho cada una, de las
sentencias aplicadas por los jueces A y B para un delito relacionado con drogas. Los
datos, en meses de prisin, fueron los siguientes:
Juez A
Juez B
30
30
36
32
45
38
42
37
46
42
40
35
32
34
38
Denotemos por A el tiempo promedio real que el juez A dictara para ese tipo de delito y
B el tiempo promedio real que el juez B dictara para el mismo tipo de delito. Queremos
entonces probar si A = B o si podemos concluir que A B .
Se quiere estudiar si existe algn efecto del ejercicio en los niveles de colesterol en la
sangre. Para esto se trabaja con un conjunto de 12 personas con niveles altos de
colesterol y se mide el nivel de ste antes de iniciar un programa de ejercicios y 2 meses
despus de terminar el programa. La investigacin se centrar en probar que el ejercicio
baja los niveles de colesterol en la sangre.
____________________________________________________________________________________________
8
Gudelia Figueroa Preciado - Marco Antonio Valencia Arvizu
Es conocido que conforme las personas envejecen tienden a perder agilidad y a ser un
poco ms lentas. Esto puede aplicarse tambin a los deportistas. En un estudio particular
que se hizo con ciclistas, se midieron dos variables, una fue la edad del deportista y otra el
promedio de velocidad en un recorrido. Los datos se muestran a continuacin:
Edad
22
Velocidad 12.0
17
12.6
54
9.4
39
10.7
45
9.9
30
10.9
17
12.7
42
10.1
36
10.6
Queremos saber si existe una correlacin lineal negativa entre las variables, esto es, si al
aumentar la edad, disminuye la velocidad.
Uno o ms defectos
31
13
9
La siguiente tabla muestra, en libras, los pesos de doce de infantes, al cabo de tres meses
de ser alimentados con tres frmulas lcteas diferentes, que denotaremos por 1, 2 y 3. Se
___________________________________________________________________________
Estadstica
9
Frmula 2
12.5
12.6
12.9
12.7
Frmula 3
12.3
12.5
13
12.7
EJERCICIOS
Trate de identificar si los siguientes problemas corresponden a una muestra, dos muestras
independientes, muestras correlacionadas, etctera.
1.5.1 El personal de 15 hospitales diferentes particip en un programa de vigilancia para
monitorear el nmero de pacientes que experimentan reacciones adversas al medicamento
prescrito. Se conoce por experiencia que, en general, aproximadamente el 5% de los
pacientes sufre cierto tipo de reaccin alrgica. De cada hospital se tom una muestra de 100
pacientes y del total de 1500, 90 sufrieron reacciones alrgicas. Se desea utilizar esta
informacin para verificar si la proporcin poblacional de pacientes que experimentan
reacciones alrgicas se mantiene en el 5% o es mayor que ste.
1.5.2 Para establecer un estndar en lo que puede ser considerada una lectura de calcio
normal, se selecciona una muestra aleatoria de 1000 adultos, aparentemente saludables. Se
toma enseguida una muestra de sangre de cada uno de estos adultos y se estudia la variable
X que representa el nmero de miligramos de calcio por decilitro de sangre.
1.5.3 En un estudio sobre obesidad, en personas con edades entre 20 y 75 aos, se
estudiaron 150 hombres y 200 mujeres. De los hombres, 21 presentaron problemas de
obesidad, mientras que, de las mujeres, fueron 48 las que presentaron estos problemas. Se
desea saber si existe una diferencia, en lo que respecta a sobrepeso, entre hombres y
mujeres.
1.5.4
Se desea comparar los tiempos que tardan 10 obreros, efectuando la misma
tarea, en las mquinas A y B de cierta maquiladora. Se miden primero los tiempos que
tardan en la mquina A y despus todos efectan la misma tarea en la mquina B. Se quiere
determinar si existe alguna diferencia significativa entre estos tiempos.
____________________________________________________________________________________________
10
Gudelia Figueroa Preciado - Marco Antonio Valencia Arvizu
INICIO
CUANTOS
TRATAMIENTOS
ESTAN
INVOLUCRADOS?
DATOS
CATEGORICOS
PROBLEMAS
CON UNA
MUESTRA
REGRESION Y
CORRELACION
MUESTRAS
RELACIONADAS
SON LAS
MUESTRAS
DEPENDIENTES O
INDEPENDIENTES
DOS MUESTRAS
INDEPENDIENTES
BLOQUES
AL AZAR
PROBLEMAS
CON K
MUESTRAS
___________________________________________________________________________
Estadstica
11