Está en la página 1de 13

1-1 Repaso y preámbulo

1-2 Pensamiento estadístico


1-3 Tipos de datos
1-4 Pensamiento crítico
1-5 Recolección de datos
muestrales

Introducción a la
estadística

2
PROBLEMA DEL CAPÍTULO

¿Por qué resultó tan inexacta la encuesta del Literary Digest?


Fundada en 1890, la revista Literary Digest era de este país por un cambio en el gobierno nacio-
famosa por su éxito en la aplicación de encuestas nal. La encuesta de The Literary Digest es un lo-
para predecir quiénes serían los ganadores de gro de gran magnitud; se trata de una encuesta
las elecciones presidenciales. La revista pronos- realizada de forma justa y adecuada”. Pues bien,
ticó de forma correcta a los ganadores de las en las elecciones, Landon recibió 16,679,583 vo-
elecciones presidenciales de 1916, 1920, 1924, tos, una cifra muy distante de los 27,751,597 que
1928 y 1932. En la contienda presidencial de 1936 recibió Roosevelt. En lugar de obtener el 57%
entre Alf Landon y Franklin D. Roosevelt, la revis- de los votos, como sugirió la encuesta de Lite-
ta envió 10 millones de papeletas, de las cuales rary Digest, Landon obtuvo solamente el 37%.
recibió 1,293,669 a favor de Landon y 972,897 a En la figura 1-1 se muestran los resultados de
favor de Roosevelt, de manera que todo parecía Roosevelt. La revista sufrió un humillante fracaso
indicar que Landon conseguiría el 57% de los vo- y pronto salió del mercado.
tos. La cantidad de personas encuestadas fue Durante el mismo proceso electoral de 1936,
sumamente grande, si se compara con el de otras George Gallup aplicó una encuesta a un número
encuestas típicas, por lo que parecía que serviría mucho menor de votantes, 50,000, y pronosticó
para predecir nuevamente de manera correcta al de manera correcta que Roosevelt sería el gana-
ganador. James A. Farley, presidente del Demo- dor. ¿Cómo es posible que la encuesta a gran es-
cratic National Committee en esa época, elogió cala de Literary Digest se haya equivocado con
la encuesta de la siguiente manera: “Ninguna un margen tan considerable? ¿Qué ocurrió? Des-
persona en su sano juicio podría negar la impli- pués de que aprenda los conceptos básicos de
cación de un muestreo tan grande de la opinión estadística en este capítulo, regresaremos a la en-
pública como el observado en el sondeo de The cuesta de Literary Digest y explicaremos por qué
Literary Digest. Considero tal evidencia conclu- resultó tan inexacta para predecir al ganador de
yente como el deseo que tienen los habitantes la contienda presidencial de 1936.

70%

60% Roosevelt en
Porcentaje para Roosevelt

realidad recibió
50% el 61% del voto
popular
40%

30%

20%

10%

0%
Encuesta Encuesta
de Literary Gallup
Digest
Figura 1-1 Resultados de encuestas para las
elecciones donde contendieron Roosevelt
y Landon
4 Capítulo 1 Introducción a la estadística

1-1 Repaso y preámbulo


La primera sección de los capítulos 1 al 14 inicia con un breve repaso de los anteceden-
tes del capítulo, y con la presentación general de su contenido. Este capítulo solo está pre-
cedido por el prefacio, por lo que no haremos un repaso. Sin embargo, podemos repasar
y definir de manera formal algunos términos estadísticos de uso común. En el problema
del capítulo se analizaron las encuestas de Literary Digest y de George Gallup, las cuales
utilizaron datos muestrales. Las encuestas reúnen datos de una porción perteneciente a un
grupo más grande, con la finalidad de conocer algo acerca de este último. Una meta co-
mún e importante de la materia de la estadística es la siguiente: aprender acerca de un
grupo grande examinando los datos de algunos de sus miembros. En dicho contexto, los
términos muestra y población adquieren relevancia. Las definiciones formales de estos y
otros términos básicos se presentan a continuación.

Datos son el conjunto de información recolectada (como mediciones, géneros,


respuestas de encuestas).
Estadística es la ciencia que se encarga de planear estudios y experimentos,
obtener datos y luego organizar, resumir, presentar, analizar e interpretar la
información para extraer conclusiones basadas en los datos.
Población es el conjunto completo de todos los elementos (puntuaciones,
personas, mediciones, etcétera) que se someten a estudio. El conjunto es
completo porque incluye a todos los sujetos que se estudiarán.
Censo es el conjunto de datos de cada uno de los miembros de la población.
Muestra es un subconjunto de miembros seleccionados de una población.

Por ejemplo, la encuesta de Literary Digest incluyó 2.3 millones de participantes, los
cuales constituyen una muestra, en tanto que la población consiste en el conjunto com-
pleto de los adultos en edad de votar. Un objetivo importante de este libro es demostrar
cómo usar los datos muestrales para obtener conclusiones sobre poblaciones. Veremos que
es sumamente importante obtener datos muestrales que sean representativos de la
población de la que se obtienen. Al avanzar en este capítulo y analizar los tipos de datos y
los métodos de muestreo, debemos enfocarnos en los siguientes conceptos clave:
• Los datos muestrales deben reunirse de una forma adecuada, como a través de
un proceso de selección aleatoria.
• Si los datos muestrales no se reúnen de forma adecuada, resultarán tan inútiles
que ningún grado de tortura estadística podrá salvarlos.

1-2 Pensamiento estadístico


Concepto clave En esta sección se introducen los principios básicos del pensamiento
estadístico que se utilizarán a lo largo del libro. Ya sea que realicemos un análisis estadís-
tico con datos que hemos reunido, o que examinemos uno realizado por alguien más, no
debemos aceptar a ciegas los cálculos matemáticos; es necesario tomar en cuenta los si-
guientes factores:
• Contexto de los datos

• Fuente de los datos

• Método de muestreo
1-2 Pensamiento estadístico 5

• Conclusiones ¿Debe usted


• Implicaciones prácticas creer en
un estudio
Para aprender a pensar en términos estadísticos, suelen ser más importantes el sentido estadístico?
común y las consideraciones prácticas que la aplicación irreflexiva de fórmulas y cálculos.
La estadística implica el análisis de datos, por lo que iniciaremos estudiando los datos En el libro Statistical Reasoning
de la tabla 1-1. for Everyday Life, tercera edi-
ción, los autores Jeff Bennett,
William
Tabla 1-1 Datos utilizados para análisis Briggs
y Mario
x 56 67 57 60 64 Triola
y 53 66 58 61 68 estable-
cen los
siguien-
tes
Una vez que el estudiante finaliza el curso de introducción a la estadística, está equipado
ocho
con muchas herramientas. Sin embargo, en algunos casos, si el estudiante decide comen-
linea-
zar a efectuar cálculos sin tomar en cuenta algunos aspectos generales importantes, estará mientos para evaluar de
“equipado peligrosamente”. Para analizar de forma adecuada los datos de la tabla 1-1, forma crítica un estudio
debemos contar con alguna información adicional. Las siguientes son preguntas funda- estadístico. 1. Identificar el ob-
mentales que se deben plantear para obtener esa información: ¿Cuál es el contexto de los jetivo del estudio, la población
datos? ¿De qué fuente se obtuvieron? ¿Cómo se recabaron? ¿Qué se puede concluir a par- considerada y el tipo de estu-
tir de la información? Con base en conclusiones estadísticas, ¿qué implicaciones prácticas dio. 2. Considerar la fuente,
resultan del análisis? especialmente para advertir
Contexto Los datos, tal como se presentan en la tabla 1-1, carecen de contexto. la posibilidad de un sesgo.
No se indica qué representan los valores, de dónde provienen ni por qué se recabaron. 3. Analizar el procedimiento de
muestreo. 4. Buscar problemas
En el ejemplo 1 se plantea un contexto.
en la definición o medición de
las variables de interés. 5. Tener
cuidado con variables confusas
que pudieran invalidar las con-
1 clusiones. 6. Considerar el
Contexto para la tabla 1-1 Los datos de la tabla 1-1 se to-
contexto y la redacción de
maron del conjunto de datos 3 del apéndice B, y representan los pesos (en kilogramos)
cualquier encuesta. 7. Verificar
de estudiantes de la Universidad de Rutgers, en Nueva Jersey. Los valores x son los que las gráficas representen
pesos registrados en el mes de septiembre de su primer año de estudios, y los valores los datos de forma adecuada
y son los pesos correspondientes registrados en abril del siguiente semestre. Por ejem- y que las conclusiones estén
plo, el primer estudiante pesó 56 kg en septiembre y 53 kg en abril. Estos pesos están justificadas. 8. Considerar si las
incluidos en un estudio descrito en el artículo “Changes in Body Weight and Fat conclusiones logran los obje-
Mass of Men and Women in the First Year of College: A Study of the ‘Freshman 15’”, tivos del estudio, si tienen sen-
de Hoffman, Policastro, Quick y Lee, Journal of American College Health, vol. 55, tido y si poseen un significado
núm. 1. El título del artículo nos indica el objetivo del estudio: determinar si los es- práctico.
tudiantes universitarios realmente aumentan 15 libras de peso durante el primer año
de estudios, de acuerdo con la leyenda llamada “Freshman 15”.

La descripción del contexto de los datos incluidos en la tabla 1-1 indica que consisten
en datos pareados, es decir, cada par x-y de valores está conformado de un peso “antes” y
de un peso “después” para cada estudiante específico incluido en el estudio. La compren-
sión de este contexto afectará directamente el tipo de procedimiento estadístico que se
utilice. En este caso, lo importante es determinar si los cambios de peso apoyan o con-
tradicen la creencia de que los estudiantes universitarios suelen aumentar 15 libras de
peso durante el primer año. El problema se puede enfocar utilizando los métodos que se
presentan más adelante en este libro. (Véase la sección 9-4 sobre datos pareados).
Si los valores de la tabla 1-1 fueran los números impresos en las camisetas de juga-
dores de basquetbol de Rutgers, y los valores x pertenecieran al equipo varonil y los valo-
res y al equipo femenil, entonces este contexto sugeriría que no existe un procedimiento
6 Capítulo 1 Introducción a la estadística

La ética en la estadístico significativo que pudiera utilizarse con los datos (debido a que los números no
estadística miden ni cuentan algo). Siempre tome en cuenta el contexto de los datos, ya que este deter-
mina el análisis estadístico que debe emplearse.
El uso inadecuado de la esta- Fuente de los datos Es necesario considerar la fuente de los datos y tomar en
dística a menudo implica pro-
cuenta si esa fuente es objetiva o si existe alguna razón para pensar que está sesgada.
blemas éticos. Un caso con
graves problemas éticos, mora-
les y legales involucra a los in-
2
vestigadores Fuente de los datos de la tabla 1-1 Las mediciones de la ta-
de Tuskegee, bla 1-1 fueron realizadas por investigadores respetables del Departamento de Ciencias
Alabama, que de la Nutrición de la Universidad de Rutgers. Los investigadores no tienen razones
negaron el para distorsionar o modificar los resultados con la finalidad de apoyar alguna postura
tratamiento de beneficio personal; no ganan ni pierden si alteran los resultados. No recibieron un
de penicilina
pago de una compañía que pudiera beneficiarse de resultados favorables. Podemos
eficaz a víctimas
de sífilis para poder estudiar la
tener la confianza de que estos investigadores son imparciales y de que no alteraron los
enfermedad. Este experimento resultados.
continuó por un periodo de
27 años.
No todos los estudios cuentan con fuentes sin sesgo como esta. Por ejemplo, Kiwi
Inventar resultados es una
falta evidente de ética, aunque
Brands, un fabricante de lustrador para calzado, encargó un estudio que concluyó que el
un problema ético más sutil uso de zapatos con raspaduras era la principal razón de que los hombres que solicitaban
surge cuando los autores de un empleo no lograran dar una buena impresión. Médicos que reciben financiamiento de
artículos de revistas científicas compañías farmacéuticas realizan algunos experimentos clínicos con medicamentos, por
omiten información importante lo que tendrían una razón para obtener resultados favorables. Algunas revistas profesio-
acerca del método de muestreo nales, como el Journal of the American Medical Association, ahora exigen que los médicos
o los resultados de otros con- reporten este tipo de hallazgos en artículos científicos. Debemos permanecer atentos y
juntos de datos que no susten- escépticos ante estudios que provienen de fuentes que podrían estar sesgadas.
tan sus conclusiones. John Método de muestreo Al reunir datos muestrales para un estudio, el método de
Bailar era consultor estadístico
muestreo que se elija puede afectar de manera importante la validez de las conclusiones.
del New England Journal of
En las secciones 1-4 y 1-5 analizaremos los métodos de muestreo con mayor detalle.
Medicine cuando, después de
revisar miles de artículos médi-
Por ahora, debemos señalar que las muestras de respuesta voluntaria (o muestras auto-
cos, notó que los informes es- seleccionadas) a menudo están sesgadas, ya que es más probable que los individuos que
tadísticos a menudo omitían tienen un interés especial en el tema decidan participar en el estudio. En una muestra
información fundamental; esto de respuesta voluntaria, los propios sujetos deciden participar. Por ejemplo, el programa
provocaba que las conclusiones de televisión Nightline de la ABC pidió a los espectadores que llamaran y dieran su
de los autores parecieran más opinión sobre si las oficinas centrales de las Naciones Unidas deberían permanecer en
firmes de lo que deberían. Estados Unidos. Luego, los espectadores decidieron si querían llamar para dar su opinión;
Algunos principios básicos desde luego, quienes estaban más interesados en el tema tenían mayores probabilidades de
de ética son los siguientes: hacerlo. Es posible utilizar métodos estadísticos válidos para analizar muestras de respuesta
1. Todos los sujetos de un
voluntaria, aunque los resultados no son necesariamente válidos. Existen otros métodos,
estudio deben dar su consen-
como el muestreo aleatorio, que suelen producir buenos resultados. Véase el análisis sobre
timiento informado. 2. Todos
los resultados de los individuos
las estrategias de muestreo en la sección 1-5.
deben ser confidenciales.
3. El bienestar de los sujetos
3
de estudio siempre debe estar Muestreo utilizado para los datos de la tabla 1-1 Los pesos
por encima de los beneficios de la tabla 1-1 provienen de la muestra más grande de pesos incluida en el conjunto de
que el estudio brinda a la
datos 3 del apéndice B. Los investigadores obtuvieron los datos de sujetos que partici-
sociedad.
paron como voluntarios en una evaluación de salud realizada en septiembre, durante
su primer año de estudios. Los 217 estudiantes que participaron en la evaluación de sep-
tiembre fueron invitados para un estudio de seguimiento en primavera; de ellos, 67 acep-
taron la invitación para ser pesados de nuevo durante las últimas dos semanas de abril.
Se trata de una muestra de respuesta voluntaria. Los investigadores reportaron que “la
muestra obtenida no fue aleatoria y podría haber un sesgo de autoselección”. Los autores
profundizaron en el potencial de sesgo al hacer una lista específica de fuentes potenciales
de sesgo; por ejemplo, es posible que “solo aquellos estudiantes que se sintieron suficien-
temente cómodos con su peso [aceptaran] someterse a medición en ambas ocasiones”.
1-2 Pensamiento estadístico 7

No todos los estudios y los artículos expresan con tanta claridad el potencial de sesgo.
Es muy común encontrar encuestas que utilizan sujetos voluntarios, en los que los in-
formes y las conclusiones no identifican las limitaciones de este tipo de muestras poten-
cialmente sesgadas.
Conclusiones Al obtener conclusiones a partir de un análisis estadístico, es necesario
hacer afirmaciones que sean claras para las personas sin conocimientos de estadística y de
su terminología. Se debe evitar de manera cuidadosa realizar afirmaciones que no estén
justificadas por el análisis estadístico. Por ejemplo, en la sección 10-2 se introduce el con-
cepto de correlación, o asociación entre dos variables, como el tabaquismo y la frecuencia
del pulso. Un análisis estadístico podría justificar la afirmación de que existe una corre-
lación entre el número de cigarrillos fumados y la frecuencia del pulso, pero no justifica la
afirmación de que el número de cigarrillos fumados causa que la frecuencia del pulso de
un individuo cambie. La correlación no implica causalidad.

4
Conclusiones a partir de los datos de la tabla 1-1 La ta-
bla 1-1 incluye los pesos, antes y después, de cinco sujetos tomados del conjunto de
datos 3 del apéndice B. El análisis de tales pesos llevó a las conclusiones reportadas
en el artículo “Changes in Body Weight and Fat Mass of Men and Women in the
First Year of College: A Study of the ‘Freshman 15’”, de Hoffman, Policastro, Quick
y Lee, Journal of American College Health, vol. 55, núm. 1. Al analizar los datos de la
tabla 1-1, los investigadores concluyeron que los estudiantes aumentan de peso du-
rante el primer año de estudios universitarios. Sin embargo, también comentaron que
en el pequeño grupo no aleatorio estudiado, el incremento de peso fue menor que 15
libras, y que esta cantidad no era universal. Concluyeron que la leyenda “Freshman
15” sobre el aumento de peso es un mito.

Implicaciones prácticas Además de plantear conclusiones claras a partir del análisis


estadístico, también se debe identificar cualquier implicación práctica de los resultados.

5
Implicaciones prácticas de los datos de la tabla 1-1 En su
análisis de los datos recolectados para el estudio de “Freshman 15”, los investigadores
señalan algunas implicaciones prácticas de sus resultados. Ellos afirmaron: “Quizá sea
más importante que los estudiantes reconozcan que los cambios aparentemente míni-
mos e incluso inofensivos en los hábitos alimenticios y de ejercicio podrían producir
grandes cambios en el peso y en el contenido de grasa corporal durante un periodo
largo”. Los estudiantes que inician el primer año de la universidad deben reconocer
que las rutinas de alimentación y de ejercicio radicalmente diferentes pueden tener
consecuencias graves en la salud.

La significancia estadística de un estudio difiere de su significancia práctica. Es posi-


ble que, con base en los datos muestrales disponibles, se utilicen métodos estadísticos para
llegar a la conclusión de que algún tratamiento o hallazgo es eficaz, aunque el sentido
común sugiera que no hay una diferencia suficiente debida al tratamiento para justificar
que su uso sea práctico.

6
Significancia estadística y significancia práctica En una prue-
ba del programa Atkins para perder peso, 40 sujetos registraron una pérdida de peso
promedio de 2.1 libras después de someterse al programa durante un año (según
continúa
8 Capítulo 1 Introducción a la estadística

datos de “Comparison of the Atkins, Ornish, Weight Watchers and Zone Diets for
Weight Loss and Heart Disease Risk Reduction”, de Dansinger et al., Journal of the
American Medical Association, vol. 293, núm. 1). Utilizando métodos formales de
análisis estadísticos, podemos concluir que la pérdida media de peso de 2.1 es estadís-
ticamente significativa; es decir, con base en criterios estadísticos, parece que la dieta
es eficaz. Sin embargo, el sentido común indica que no vale la pena seguir un pro-
grama de pérdida de peso que produzca resultados tan insignificantes. Lo más proba-
ble es que una persona que inicie un programa de pérdida de peso quiera perder mu-
cho más de 2.1 libras. Aunque la pérdida media de peso de 2.1 es estadísticamente
significativa, no tiene una significancia práctica. El análisis estadístico sugiere que el
programa es eficaz, pero las consideraciones prácticas sugieren que el programa es bási-
camente ineficaz.

Significancia estadística La significancia estadística es un concepto que se utilizará con


gran frecuencia a lo largo de este libro. Como preparación para tales análisis, los ejem-
plos 7 y 8 ilustran el concepto en un escenario sencillo.

7
Significancia estadística El Genetics and IVF Institute en
Fairfax, Virginia, desarrolló una técnica llamada MicroSort que, al parecer, incrementa
las probabilidades de que una pareja conciba una niña. En una prueba preliminar, los
investigadores localizaron a 14 parejas que deseaban tener una hija. Después de utili-
zar la técnica MicroSort, 13 parejas tuvieron niñas y una pareja tuvo un varón. A par-
tir de estos resultados, se pueden obtener dos conclusiones:
1. La técnica MicroSort no es eficaz y el resultado de 13 niñas en 14 nacimientos
se debe al azar.
2. La técnica MicroSort es eficaz y las parejas que la utilicen tendrán más probabi-
lidades de tener hijas, tal como afirma el Genetics and IVF Institute.
Al elegir entre las dos explicaciones posibles de los resultados, los especialistas en es-
tadística consideran la probabilidad de obtener los resultados por el azar. Ellos son
capaces de determinar que si la técnica MicroSort no tiene efectos, entonces existe
una probabilidad en 1000 de obtener resultados similares. Como la probabilidad es
tan baja, los especialistas en estadística concluyen que los resultados son estadística-
mente significativos, de manera que, al parecer, la técnica es eficaz.

8
Significancia estadística Suponga que, en lugar de obtener
los resultados del ejemplo 7, las parejas tienen ocho niñas en 14 nacimientos. Podemos
ver que 8 niñas es mayor que las 7 niñas que se esperarían con un tratamiento inefi-
caz. Sin embargo, los especialistas en estadística pueden determinar que si la técnica
MicroSort no tiene efecto, entonces existen apenas dos probabilidades en cinco de que
resulten 8 niñas en 14 nacimientos. A diferencia de una probabilidad en 1000, como
en el ejemplo anterior, dos probabilidades de cinco indican que los resultados podrían
ocurrir fácilmente por el azar, lo que indicaría que el resultado de 8 niñas en 14 alum-
bramientos no es estadísticamente significativo. Si nacen 8 niñas en 14 alumbramien-
tos, no podríamos concluir que la técnica es eficaz, ya que es muy fácil (dos posibili-
dades en cinco) obtener esos resultados con un tratamiento ineficaz o sin tratamiento
alguno.
1-2 Pensamiento estadístico 9

¿Qué es el pensamiento estadístico? En general, los especialistas en estadística


coinciden en que el pensamiento estadístico es bueno, aunque existen diferentes pers-
pectivas sobre lo que realmente es un pensamiento estadístico. En esta sección descri-
bimos el pensamiento estadístico en términos de la capacidad para observar el panorama,
para tomar en cuenta factores relevantes como el contexto, la fuente de los datos y el
método de muestreo, y también para obtener conclusiones e identificar implicaciones
prácticas. El pensamiento estadístico incluye el pensamiento crítico y la capacidad de in-
terpretar los resultados. También podría implicar el hecho de determinar si los resultados
son estadísticamente significativos, como en los ejemplos 7 y 8. El pensamiento estadístico
va mucho más allá de la simple capacidad de ejecutar cálculos complejos. A través de nu-
merosos ejemplos, ejercicios y análisis, este libro le ayudará a desarrollar las habilidades
de pensamiento estadístico que son tan importantes en el mundo actual.

1-2 Destrezas y conceptos básicos


Conocimientos estadísticos y pensamiento crítico
1. Muestra de respuesta voluntaria ¿Qué es una muestra de respuesta voluntaria?
2. Muestra de respuesta voluntaria ¿Por qué una muestra de respuesta voluntaria no suele
ser adecuada para un estudio estadístico?
3. Significancia estadística y significancia práctica ¿Qué diferencia existe entre la signi-
ficancia estadística y la significancia práctica?
4. Contexto de los datos Usted reunió una muestra grande de valores. ¿Por qué es importante
entender el contexto de los datos?
5. Significancia estadística y significancia práctica En un estudio del programa Weight
Watchers para la pérdida de peso, 40 sujetos perdieron en promedio 3.0 libras después de 12 meses
(con base en datos de “Comparison of the Atkins, Ornish, Weight Watchers, and Zone Diets for
Weight Loss and Heart Disease Risk Reduction”, de Dansinger et al., Journal of the American Me-
dical Association, vol. 293, núm. 1). Es posible utilizar métodos estadísticos para verificar si la dieta
es eficaz. ¿El programa Weight Watchers para perder peso tiene significancia estadística? ¿Tiene
significancia práctica? ¿Por qué?
6. Método de muestreo En el estudio del programa Weight Watchers de pérdida de peso para el
ejercicio 5, los sujetos se reclutaron utilizando el método descrito de la siguiente forma: “Reclu-
tamos a los candidatos para el estudio en el área de Greater Boston por medio de anuncios en
periódicos y publicidad televisiva”. ¿Se trata de una muestra de respuesta voluntaria? ¿Por qué?

En los ejercicios 7 a 14, utilice el sentido común para determinar si el acontecimiento


descrito es a) imposible, b) posible, pero muy improbable, c) posible y probable.
7. Súper Bowl Los Gigantes de Nueva York derrotaron a los Broncos de Denver en el Súper Bowl
con un marcador de 120 a 98.
8. Multa por exceso de velocidad Mientras conducía a su casa en Connecticut, David
Letterman fue multado por conducir a 205 millas por hora en una ruta con un límite de veloci-
dad de 55 millas por hora.
9. Semáforos Mientras conducía por la ciudad, Mario Andretti se encontró con tres semáforos
consecutivos y todos estaban en verde.
10. Día de Acción de Gracias El año próximo, el Día de Acción de Gracias caerá en lunes.
11. Suprema Corte Todos los magistrados de la Suprema Corte de Estados Unidos tienen la
misma fecha de cumpleaños.
12. Calculadoras Cuando los 25 estudiantes de estadística encienden su calculadora TI-84 plus,
todas funcionan adecuadamente.
13. Dados de la suerte Steve Wynn lanzó un par de dados y obtuvo un total de 14 puntos.
14. Máquina tragamonedas Wayne Newton obtuvo el premio mayor en la máquina traga-
monedas en 10 intentos consecutivos.
1-3 Tipos de datos 11

Risk Reduction”, de Dansinger et al., Journal of the American Medical Association, vol. 293, núm. 1).
Es posible utilizar métodos estadísticos para demostrar que, si esta dieta no tiene efecto alguno,
la probabilidad de obtener esos resultados es de aproximadamente 3 en 1000. ¿El programa Ornish
para la pérdida de peso tiene significancia estadística? ¿Tiene significancia práctica? ¿Por qué?
24. Experimentos genéticos de Mendel Uno de los famosos experimentos de hibridación
con guisantes (o chícharos) de Gregor Mendel produjo 580 vástagos, de los cuales 152 (o el 26%)
tuvieron vainas amarillas. Según la teoría de Mendel, el 25% de los guisantes vástagos deberían
tener vainas amarillas. ¿Los resultados del experimento difieren del porcentaje establecido por
Mendel del 25% en una cantidad estadísticamente significativa?
25. Encuesta sobre el tabaquismo pasivo En una encuesta que aplicó Gallup a 1038 adul-
tos seleccionados al azar, el 85% dijo que el tabaquismo pasivo es un poco dañino o muy dañino,
pero un representante de la industria tabacalera afirma que solo el 50% de los adultos creen que el
tabaquismo pasivo es un poco dañino o muy dañino. ¿Existe evidencia estadísticamente signifi-
cativa en contra de la aseveración del representante? ¿Por qué?
26. Cirugía y entablillado Un estudio comparó los procedimientos de cirugía y entablillado
para individuos que sufrían del síndrome del túnel carpiano, y encontró que de 73 pacientes trata-
dos con cirugía, la tasa de éxito fue del 92%. De los 83 pacientes tratados con entablillado, la tasa
de éxito fue del 72%. Los cálculos realizados con esos resultados demostraron que, si realmente no
existe una diferencia entre las tasas de éxito de la cirugía y el entablillado, entonces existe una pro-
babilidad de 1 en 1000 de obtener tasas de éxito como las obtenidas en este estudio.
a) ¿Debemos concluir que la cirugía es mejor que el entablillado para el tratamiento del síndrome
del túnel carpiano?
b) ¿El resultado es estadísticamente significativo? ¿Por qué?
c) ¿El resultado tiene significancia práctica?
d) ¿La cirugía debe ser el tratamiento recomendado para el síndrome del túnel carpiano?

1-2 Más allá de lo básico


27. Conclusiones Remítase a las cantidades de combustible consumido en la ciudad y en carre-
tera por los diferentes automóviles del conjunto de datos 16 del apéndice B. Compare las canti-
dades de combustible consumido en la ciudad con las cantidades consumidas en carretera; después
responda las siguientes preguntas sin efectuar cálculos.
a) ¿La conclusión de que las cantidades consumidas en carretera son mayores que las cantidades
consumidas en la ciudad parecen estar sustentadas por una significancia estadística?
b) ¿La conclusión de que las cantidades consumidas en carretera son mayores que las cantida-
des consumidas en la ciudad parecen estar sustentadas por una significancia práctica?
c) ¿Cuál sería una de las implicaciones prácticas de una diferencia sustancial entre las cantidades
de combustible consumidas en la ciudad y en carretera?
28. Accidentes de vehículos todo terreno La Associated Press publicó un artículo con el
título “Accidentes de vehículos todo terreno causaron la muerte de 704 personas en 2004”.
El artículo señalaba que se trataba de un nuevo récord y lo comparó con las 617 muertes del año
anterior. También se incluyeron otros datos sobre la frecuencia de lesiones. ¿Qué valor impor-
tante no se incluyó? ¿Por qué es importante?

1-3 Tipos de datos


Concepto clave Un objetivo de la estadística es realizar inferencias o generalizaciones
acerca de una población. Además de los términos población y muestra, que se definieron al
principio de este capítulo, necesitamos conocer el significado de los conceptos parámetro
y estadístico. Estos nuevos términos se utilizan para distinguir entre los casos en que conta-
mos con los datos de una población completa y los casos en los que solo contamos con los
datos de una muestra.
12 Capítulo 1 Introducción a la estadística

Origen de la También necesitamos reconocer la diferencia entre datos cuantitativos y datos categó-
“estadística” ricos, que distinguen entre diferentes tipos de números. Algunos números, como los que
aparecen en las playeras de los jugadores de basquetbol, no son cantidades en el sentido
de que realmente no miden ni cuentan algo, y no tendría sentido realizar cálculos con
ellos. En esta sección se describen distintos tipos de datos, los cuales determinan los
métodos estadísticos que se utilizan para el análisis.
En la sección 1-1 definimos los términos población y muestra. Los siguientes dos
términos se utilizan para distinguir entre los casos en que tenemos datos de una pobla-
ción completa y los casos donde solo tenemos datos de una muestra.

El término estadís-
tica se deriva de la palabra
latina status (que significa Parámetro es una medición numérica que describe algunas características de
“estado”). Los primeros usos
de la estadística implicaron la
una población.
recopilación de datos y la ela- Estadístico es una medición numérica que describe algunas características
boración de gráficas, para des- de una muestra.
cribir diversos aspectos de un
estado o de un país. En 1662
John Graunt publicó informa-
ción estadística acerca de los
1
nacimientos y los decesos.
Al trabajo de Graunt siguieron
1. Parámetro: Hay exactamente 100 senadores en el CIX Congreso de Estados
estudios de tasas de mortalidad
y de enfermedad, tamaño de Unidos, y el 55% de ellos son republicanos. La cifra del 55% es un parámetro
poblaciones, ingresos y tasas porque está basada en la población de todos los 100 senadores.
de desempleo. Los hogares, 2. Estadística: En 1936 Literary Digest encuestó a 2.3 millones de adultos estadouni-
los gobiernos y las empresas
denses, y el 57% dijo que votaría por Alf Landon para la presidencia. La cifra
se apoyan mucho en datos
estadísticos para dirigir sus
del 57% es un estadístico, ya que se basa en una muestra y no en la población
acciones. Por ejemplo, se reúnen completa de todos los adultos de Estados Unidos.
datos de manera cuidadosa y
con regularidad para estable-
cer las tasas de desempleo, las Algunos conjuntos de datos consisten en números (como estaturas de 60 y 72 pul-
tasas de inflación, los índices
gadas), mientras que otros no son numéricos (como los colores de ojos verde y café).
del consumidor y las tasas de
Los términos datos cuantitativos y datos categóricos suelen utilizarse para distinguir entre
nacimientos y muertes; en
tanto que los líderes empre-
ambos tipos.
sariales utilizan los datos resul-
tantes para tomar decisiones
que afectan a futuras contra-
taciones, los niveles de pro- Los datos cuantitativos (o numéricos) consisten en números que representan
ducción y la expansión hacia conteos o mediciones.
nuevos mercados.
Los datos categóricos (o cualitativos o de atributo) consisten en nombres o
etiquetas que no son números y que, por lo tanto, no representan conteos ni
mediciones.

1. Datos cuantitativos: Las edades (en años) de los participantes en encuestas.

2. Datos categóricos: La afiliación a partidos políticos (demócrata, republicano, in-


dependiente, otro) de los participantes en encuestas.
3. Datos categóricos: Los números 24, 28, 17, 54 y 31 se observan en las playeras del
equipo de basquetbol de los Lakers de Los Ángeles. Estos números son sustitutos
de los nombres; no cuentan ni miden algo, por lo que son datos categóricos.
1-3 Tipos de datos 13

Cuando se organizan datos cuantitativos y se elaboran informes sobre ellos, es impor- Medición de la
tante utilizar las unidades adecuadas de medición, como dólares, horas, pies o metros. Al desobediencia
examinar datos estadísticos reportados por otros individuos, debemos observar la infor-
mación proporcionada considerando las unidades de medida utilizadas, como “todas las ¿De qué manera se recolectan
datos sobre algo que parece
cantidades están en miles de dólares” o “todos los tiempos están en centésimas de segundo” o
que no es mensurable, como
“todas las unidades están expresadas en kilogramos”, para interpretar los datos de forma el nivel de desobediencia
correcta. Ignorar unidades de medida como estas nos llevaría a conclusiones incorrectas. de la gente?
La NASA perdió su Mars Climate Orbiter de $125 millones cuando la sonda se estrelló El psicólogo
debido a que el programa de control tenía los datos de aceleración en unidades inglesas, Stanley
pero los operadores consideraron incorrectamente que estaban en unidades métricas. Milgram
Los datos cuantitativos se describen con mayor detalle distinguiendo entre los tipos diseñó el
discreto y continuo. siguiente
experimen-
to. Un in-
vestiga-
dor en-
Los datos discretos resultan cuando el número de valores posibles es un número
señó a un sujeto
finito o un número que “puede contarse” (es decir, el número de valores posibles voluntario a operar un tablero
es 0, 1, 2, etcétera). de control que administraba
Los datos continuos (numéricos) resultan de un número infinito de posibles “descargas eléctricas” cada vez
más dolorosas a una tercera
valores, que corresponden a alguna escala continua que cubre un rango de valores
persona. En realidad no se
sin huecos, interrupciones o saltos. aplicaban tales descargas, y la
tercera persona era un actor.
El voluntario iniciaba con
15 volts y recibía la instrucción
de incrementar las descargas
3
en 15 volts cada vez. El nivel
de desobediencia era el punto
1. Datos discretos: El número de huevos que ponen las galli-
donde el sujeto se negaba
nas son datos discretos porque representan conteos.
a incrementar el voltaje. Fue
2. Datos continuos: Las cantidades de leche que producen las sorprendente que dos terceras
vacas son datos continuos porque son mediciones que pueden partes de los sujetos obede-
tomar cualquier valor dentro de un continuo. Durante un año, cieron las órdenes, aun cuando
el actor gritaba y fingía sufrir
una vaca produce una cantidad de leche que puede ser cualquier
un ataque cardiaco.
valor entre 0 y 7000 litros. Es posible obtener 5678.1234 litros, porque la vaca
no está restringida a cantidades discretas de 0, 1, 2,…, 7000 litros.

Un ejemplo más: los números de latas de bebidas de cola son datos discretos; en tanto
que el volumen de la bebida de cola es un dato continuo.
Otra forma común de clasificar los datos consiste en usar cuatro niveles de medición:
nominal, ordinal, de intervalo y de razón. Cuando se aplica la estadística a problemas
reales, el nivel de medición de los datos es un factor importante para determinar el proce-
dimiento a utilizar. En este libro encontraremos algunas referencias a estos niveles de
medición. Sin embargo, lo importante aquí se basa en el sentido común: no hay que efec-
tuar cálculos ni utilizar métodos estadísticos que no sean adecuados para los datos. Por
ejemplo, no tendría sentido calcular el promedio de los números del sistema de seguridad
social, ya que estos números son datos que se utilizan como identificación, y no represen-
tan mediciones o conteos de algo.

El nivel de medición nominal se caracteriza por datos que consisten exclusiva-


mente en nombres, etiquetas o categorías. Los datos no se pueden acomodar en
un esquema de orden (como del más bajo al más alto).
14 Capítulo 1 Introducción a la estadística

4
Veamos algunos ejemplos de datos muestrales a nivel de
medición nominal.
1. Sí/no/indeciso: Respuestas de sí, no e indeciso en una encuesta (como en el
problema del capítulo).
2. Partido político: La filiación política de los participantes en una encuesta
(demócrata, republicano, independiente, otro).

Puesto que los datos nominales carecen de orden y no tienen un significado numé-
rico, no se deben utilizar para realizar cálculos. Números como 1, 2, 3 y 4 en ocasiones se
asignan a diferentes categorías (especialmente cuando los datos se codifican para utilizarse
en computadoras), pero estos números no tienen un significado computacional real y
cualquier promedio que se calcule con ellos carecerá de sentido.

Los datos están en el nivel de medición ordinal cuando pueden acomodarse en


algún orden, aunque las diferencias entre los valores de los datos (obtenidas por
medio de una resta) no pueden calcularse o carecen de significado.

5
Veamos algunos ejemplos de datos muestrales en el nivel de
medición ordinal.
1. Las calificaciones de un curso: Un profesor universitario asigna calificaciones
de A, B, C, D o F. Tales calificaciones se pueden ordenar, aunque no es posible
determinar diferencias entre ellas. Por ejemplo, sabemos que A es mayor que B
(por lo que hay un orden); pero no podemos restar B de A (de manera que no
es posible calcular la diferencia).
2. Rangos: El U.S. News and World Report clasifica las universidades. Dichas
clasificaciones (primer lugar, segundo, tercero, etcétera) determinan un orden.
Sin embargo, las diferencias entre los lugares no tienen ningún significado.
Por ejemplo, una diferencia “del segundo menos el primero” sugeriría 2 - 1 = 1,
pero esta diferencia de 1 carece de significado porque no es una cantidad exacta
que sea comparable con otras diferencias de este tipo. La diferencia entre Harvard
y Brown no se puede comparar de forma cuantitativa con la diferencia entre
Yale y Johns Hopkins.

Los datos ordinales brindan información sobre comparaciones relativas, pero no so-
bre las magnitudes de las diferencias. Por lo general, los datos ordinales no deben uti-
lizarse para realizar cálculos como promedios, aunque en ocasiones esta norma se infringe
(como sucede cuando utilizamos calificaciones con letras para calcular una calificación
promedio).

El nivel de medición de intervalo se parece al nivel ordinal, pero con la propie-


dad adicional de que la diferencia entre dos valores de datos cualesquiera tiene un
significado. Sin embargo, los datos en este nivel no tienen punto de partida cero
natural inherente (donde la cantidad que está presente corresponde a nada).
1-3 Tipos de datos 15

6
Los siguientes ejemplos ilustran el nivel de medición de in-
tervalo.
1. Temperaturas: Las temperaturas corporales de 98.2⬚F y 98.6⬚F son ejemplos
de datos en el nivel de medición de intervalo. Dichos valores están ordenados,
y podemos determinar su diferencia de 0.4⬚F. Sin embargo, no existe un punto
de inicio natural. Pareciera que el valor de 0⬚F es un punto de inicio; sin em-
bargo, este es arbitrario y no representa la ausencia total de calor.
2. Años: Los años 1492 y 1776. (El tiempo no inició en el año 0, por lo que el
año 0 es arbitrario y no constituye un punto de partida cero natural que
represente “la ausencia de tiempo”).

El nivel de medición de razón es similar al nivel de intervalo, pero con la


propiedad adicional de que sí tiene un punto de partida cero natural (donde
el cero indica que nada de la cantidad está presente). Para valores en este nivel,
tanto las diferencias como las razones tienen significado.

7
Los siguientes son ejemplos de datos en el nivel de medición
de razón. Observe la presencia de un valor cero natural, así como el uso de razones que
significan “dos veces” y “tres veces”.
1. Distancias: Las distancias (en km) recorridas por automóviles (0 km representa
ninguna distancia recorrida, y 400 km es el doble de 200 km).
2. Precios: Los precios de libros de texto universitarios ($0 realmente representa
ningún costo, y un libro de $100 cuesta el doble que un libro de $50).

Sugerencia: Este nivel de medición se denomina de razón porque el punto de partida


cero hace que las razones o los cocientes tengan significado. La siguiente es una prue-
ba sencilla para determinar si los valores se encuentran en un nivel de razón. Considere
dos cantidades en las cuales un número es dos veces el otro y pregúntese si “dos veces”
sirve para describir correctamente las cantidades. Puesto que una distancia de 400 km es
el doble de una distancia de 200 km, entonces la distancia tiene un nivel de razón. Por
otro lado, 50⬚F no significa que la temperatura sea dos veces más cálida que 25⬚F, de modo
que las temperaturas Fahrenheit no están en el nivel de razón. Para una comparación y
un repaso concisos, estudie la tabla 1-2.

Tabla 1-2 Niveles de medición


De razón: Hay un punto de partida cero natural y las Ejemplo: distancias Sugerencia: Considere las can-
razones tienen significado. tidades en que una es el doble
De Las diferencias tienen un significado, pero no Ejemplo: temperaturas corporales en de la otra, y pregunte si “dos
intervalo: hay punto de partida cero natural, y las grados Fahrenheit o Celsius veces” sirve para describirlas
razones no tienen significado. correctamente. De ser así, se
Ordinal: Las categorías están ordenadas, pero no hay Ejemplo: las clasificaciones de las univer- aplica el nivel de razón.
diferencias o estas carecen de significado. sidades en el U.S. News and World Report
Nominal: Solo categorías. Los datos no pueden Ejemplo: el color de los ojos
acomodarse en un esquema de orden.

También podría gustarte