Está en la página 1de 5

Pontificia Universidad Católica de Chile

Departamento de Matemáticas

Mat 0100 Razonamiento Cuantitativo

Clase #14

Interpretando datos

Contenidos

Tipos de variables.
Parámetros poblacionales

Definición de muestra.
Tipos de estudios.

La estadı́stica juega un rol preponderante en la actual sociedad y de hecho, es muy difı́cil pensar en algún tema
que no esté de alguna manera relacionado con las estadı́sticas. Se utilizan para determinar la efectividad de una
cierta droga en el tratamiento del cáncer, en las encuestas de opinión sobre la popularidad de un cierto gobierno,
en los estudios de mercado, en el estudio de las probabilidades que un equipo de fútbol gane un mundial, en la
educación, en la agricultura, en la predicción del tiempo, etcétera. Mientras que la ciencia de la estadı́stica es la
ciencia de recaudar, organizar e interpretar información, las estadı́sticas son los datos que describen o resumen
alguna situación. Por ejemplo, si en un curso hay 30 alumnos cuyas edades fluctúan entre los 18 y 25 años,
entonces los números 30 estudiantes, 18 años y 25 años son las estadı́sticas que describen ese curso.
Los estudios estadı́sticos son realizados de diferentes modos y para una gran diversidad de objetivos, pero todos
comparten algunas caracterı́sticas. Consideremos, por ejemplo, los estudios sobre los ratings televisivos que son
utilizados para estimar el número de personas que vieron un cierto programa durante la semana y ası́ determinar
el programa más popular de la semana. En la edición web de un diario del 24 de septiembre de 2009 aparece el
titular: “Debate presidencial tuvo menos rating que ¿Dónde está Elisa?”. Seguido del comentario: “Mientras que
la teleserie nocturna promedia cada noche alrededor de 40 puntos, el encuentro polı́tico (el primero que se hace
por TV en la presente campaña) apenas superó los 30 puntos en su peak de sintonı́a”. ¿Qué significado tiene esto?
Cada punto de rating representa 1 % de la población que es medida mediante un aparato electrónico colocado
en los televisores de una cierta muestra de la población de Chile. El rating de 30 puntos indica el porcentaje de
hogares con la TV prendida en el canal del debate.
En rigor, la población en un estudio estadı́stico es el conjunto completo de personas u objetos que se están
estudiando y la muestra es un subconjunto de la población de la cual se obtiene la información.
Las caracterı́sticas especı́ficas asociadas a una colección de objetos o individuos bajo estudio que sean sus-
ceptibles de medición u observación (género, edad, nivel socioeconómico) se llaman variables y los datos u
observaciones son los valores que toman las variables como ser, masculino, 37, ABC1.
Las variables se dividen en dos grupos: variables cuantitativas y variables cualitativas.
Las variables cuantitativas se pueden medir o cuantificar y tiene sentido efectuar algunas operaciones aritméti-
cas con ellas, por ejemplo, sumarlas o aumentarlas al doble y siempre son representadas por números.
A su vez, las variables cuantitativas se dividen en dos grupos: variables continuas y variables discretas.
Las variables continuas son aquellas cuyos posibles valores forman un intervalo de números reales y que
resultan normalmente de una medición; como por ejemplo, estatura o peso de un individuo.
Por otra parte, una variable es discreta si para todo dato que no sea el máximo, existe otro dato que es el
inmediatamente superior, es decir, la variable no toma valores entre ellos, por ejemplo, número de hijos o cantidad
de docenas de huevos en un canasto.
Los datos de una variable cualitativa nominal son aquellos cuyos posibles valores son clases o categorı́as,
entre las cuales no se puede establecer ningún ordenamiento sugerido por la magnitud eventual de los valores,
como ser, el color de los ojos o las caras de un dado. Finalmente una variable cualitativa ordinal es una variable

1
2

no numéricas, en las que existe un orden como, por ejemplo, la nota en una evaluación en la que asignamos a cada
alumno la categorı́a de: reprobado, aprobado, notable, sobresaliente.
Se llaman parámetros muestrales a ciertos valores que se obtienen a partir de los datos obtenidos de la muestra
y que determinan la distribución de esta; por ejemplo, promedio, varianza, etcétera. Los parámetros muestrales
nos permiten estimar los verdaderos valores presentes en la población; estos valores se llaman estadı́sticos.

Ejemplo
Algunos antropólogos determinaron el tamaño promedio de los cerebros de los antiguos neandertales en Eu-
ropa, estudiando los cerebros de restos de ellos que fueron encontrados en tres lugares distintos del sur de Europa.
En este ejemplo, la población son los antiguos neandertales de Europa. Especı́ficamente, quieren encontrar
la medida promedio de sus cerebros, lo que constituye el estadı́stico. La muestra son los escasos individuos
que fueron encontrados en los tres lugares del sur de Europa y los estadı́sticos podrı́an ser los promedios de las
medidas de los cerebros de la muestra.

Los pasos básicos en un estudio estadı́stico son:


1. Especificar el objetivo del estudio en forma precisa. Es decir, determinar la población que se quiere estudiar
y qué es exactamente lo que se quiere estudiar de ella.
2. Encontrar una muestra representativa de la población.

3. Recolectar información de la muestra y resumir esta información con estadı́sticos muestrales interesantes.
4. Utilizar los estadı́sticos muestrales para inferir parámetros poblacionales.
5. Obtener conclusiones: Determinar lo que se ha aprendido y si el objetivo original fue alcanzado.
Una muestra representativa es una muestra en la cual las caracterı́sticas relevantes de los miembros de la muestra
coinciden con las caracterı́sticas de la población. Por ejemplo, una muestra que nos entrega una computadora que
selecciona estudiantes al azar, es llamada muestra aleatoria simple y generalmente es una muy buena manera de
escoger una muestra representativa.
Los métodos más comunes para escoger muestras son:
Muestreo random simple : Escogemos una muestra de ı́temes, de tal manera que cada muestra de un cierto
tamaño tenga la misma posibilidad de ser elegida.
Muestreo sistemático : Escogemos un método sencillo de selección; por ejemplo, de una lista seleccionamos un
individuo al azar y leugo contando hasta 10 en forma reiterada, seleccionamos aquellos que se encuentran
en los décimos lugares.

Muestreo conveniente : Usamos una muestra que es conveniente selecciona; por ejemplo, las personas que se
encuentran en una sala de clases. En general, no entrega muestras representativas.
Muestreo estratificado : Subdividimos a la población en al menos dos subgrupos (o estratos) diferentes, de
manera que los sujetos que pertenecen al mismo subgrupo compartan las mismas caracterı́sticas (como el
género o la categorı́a de edad), y luego obtenemos una muestra de cada subgrupo (o estrato). Este método
se utiliza cuando nos preocupan las diferencias entre subgrupos dentro de la población; por ejemplo, niveles
educacionales, niveles económicos o diferencias religiosas, etcétera.
Si deseamos, por ejemplo, realizar un estudio del peso promedio de los estudiantes masculinos universitarios, no
serı́a buena idea escoger como muestra la selección de fútbol de la universidad. Esto se conoce como una muestra
sesgada, que por supuesto llevarı́a a conclusiones erradas. En general, un estudio estadı́stico es sesgado cuando
tiende a favorecer ciertos resultados.
Fundamentalmente, los estudios estadı́sticos caen en dos categorı́as:
Estudio observacional : Se observan o se miden en encuestas las caracterı́sticas de la muestra, pero no se con-
trolan ni se modifican las condiciones a las que los individuos están expuestos. Por ejemplo, una encuesta
sobre hábitos alimenticios.
3

Experimento : Investigadores aplican un cierto tratamiento a una muestra o parte de una muestra y estudian los
efectos del tratamiento. Por ejemplo, un estudio para determinar si grandes dosis de vitamina C pueden ayu-
dar a prevenir los resfrı́os. Para realizar esto, los investigadores deberán utilizar grandes dosis de vitamina C
en parte de su muestra. Es difı́cil determinar si un experimento es exitoso, a menos que se comparen grupos
que reciben el tratamiento versus los que no lo reciben. En este caso tendremos un grupo de tratamiento
(el que recibe el tratamiento) y un grupo de control (el que no lo recibe).

La mayorı́a de las investigaciones estadı́sticas son realizadas cuidadosamente y con integridad; sin embargo,
son lo suficientemente complejas como para que un sesgo pueda aparecer de muchas maneras diferentes. Siempre
debemos examinar las conclusiones de un análisis estadı́stico muy cuidadosamente, buscando cualquier detalle
que pueda hacernos dudar del resultado. Veamos algunos hints que nos permitan contestar la pregunta: ¿debo yo
creer en este estudio estadı́stico?

Hint 1 Identificar el propósito, población y tipo de estudio Antes de evaluar los detalles de un estudio estadı́sti-
co, debemos averiguar de qué se trata exactamente. Para ello, debemos contestar las siguientes preguntas
básicas:

1. ¿Cuál es el propósito del estudio?


2. ¿Cuál era la población estudiada? ¿Esta población estaba definida clara y apropiadamente?
3. ¿Qué tipo de estudio se realizó? ¿Era el tipo apropiado para lograr el propósito del estudio?

Ejemplo

Un periódico afirma lo siguiente: “Investigadores entregaron a los 50 participantes al congreso su carta astral
y se les preguntó si el horóscopo que se les entregó era preciso: 85 % de los participantes contestaron que sı́.
Por lo tanto la conclusión de los investigadores fue que los horóscopos son válidos la mayorı́a de las veces”.
El propósito de este estudio era determinar la validez de los horóscopos. Basados en los horóscopos que
publica un periódico, este estudio fue observacional. Sin embargo, la precisión del horóscopo es de algún
modo subjetivo. Este estudio debió ser un experimento controlado en el cual a algunos participantes se les
entregaba el verdadero horóscopo y a otros uno falso. De esta manera, los investigadores podrı́an haber
estudiado las diferencias entre los dos grupos. En resumen, el tipo de estudio fue inapropiado y por lo tanto
los resultados no tienen sentido.
Hint 2 Tomar en consideración la fuente Los estudios estadı́sticos son objetivos, pero las personas que los rea-
lizan no lo son necesariamente. Por lo tanto, hay que considerar la fuente del estudio para evitar que esté
sesgado.

Ejemplo

Existen muchos estudios que entregan clara evidencia de que el tabaco es perjudicial para la salud. Sin
embargo, hay unos pocos estudios que determinan que no existe daño en fumar y que por el contrario,
podrı́a ser saludable. Estos últimos estudios fueron financiados por compañı́as tabacaleras. Por supuesto
que este es un ejemplo en que debemos considerar la fuente de la información.

Hint 3 Buscar el sesgo en la muestra Buscar el sesgo que pueda hacer que la muestra no sea representativa.
Hay dos formas comunes de sesgo que pueden afectar la muestra:
Sesgo de selección : Ocurre cuando los investigadores seleccionan una muestra que no es representativa
de la población. Por ejemplo, una elección primaria que solo considera a los inscritos en un partido
polı́tico claramente no va a reflejar la opinión de todos los votantes.
Sesgo participativo : Ocurre en general en las consultas voluntarias, pues las personas que participan son
fundamentalmente aquellas a las que el tema en particular les interesa, pero el resultado no refleja la
opinión de la totalidad de la comunidad.
4

Ejemplo

En 1958 se realizó una encuesta para predecir los resultados de la elección presidencial en Chile. Los candi-
datos eran Jorge Alessandri, Salvador Allende, Eduardo Frei Montalva, Luis Bossay y Antonio Zamorano.
Se escogió en forma aleatoria una muestra poblacional muy amplia: un millón de personas, escogidas ar-
bitrariamente dentro de ciertas listas que incluı́an guı́a telefónica, miembros de distintos clubes sociales,
etcétera. A todos ellos se les envió una postal solicitando el nombre del candidato que consideraban como
el triunfador. Solo 400,000 personas contestaron la encuesta, obteniendo como resultado que Alessandri
ganarı́a las elecciones con un porcentaje del 59 % de los votos emitidos.
El resultado de esta elección fue: 31, 52 % para Alessandri, 28, 91 % para Allende y 20, 75 % para Frei con
1,235,553 votos escrutados. ¿Qué pasó con esta encuesta? Aquı́ el problema es que la muestra poblacional
sufrı́a de ambos sesgos. Sesgo de selección porque las personas que en 1958 tenı́an teléfonos eran una
minorı́a absoluta y en general del segmento económico alto, al igual que los que pertenecı́an a algún club
social. Hay sesgo participativo porque los que contestaron voluntariamente eran personas más interesadas
polı́ticamente en la elección.
Hint 4 Buscar problemas en las definiciones o las mediciones de las variables En el siguiente ejemplo, las va-
riables son muy difı́ciles de definir. ¿Qué se entiende por amor verdadero? ¿Amor por un dı́a, por toda la
vida o algo distinto? Lo mismo pasa con las otras variables; por ejemplo sostener una cuchara sobre la nariz,
¿es un talento?

Ejemplo

En Estados Unidos se realizó un estudio que involucraba 1 % más acaudalado del paı́s. A partir de los
resultados obtenidos, estas personas están dispuestas a pagar en promedio:
1. $ 487,000 por amor verdadero.
2. $ 407,000 por una gran inteligencia.
3. $ 285,000 por talento.
4. $ 259,000 por juventud eterna.

Ejemplo

Las autoridades intentan evitar que entren drogas ilegales a Chile. Sin embargo, tienen éxito en confiscar
entre 10 % y 20 % de las que se internan. ¿Deberı́a creer en esta encuesta?
En este ejemplo tenemos dos variables: la cantidad de droga ilegal interceptada y la cantidad no interceptada.
La primera variable es fácil de medir, pero la segunda es imposible, pues la droga es ilegal y por lo tanto es
improbable que alguien la declare.
Hint 5 Buscar variables que confunden Variables que no se pretende que entren en el estudio pueden dificultar
la interpretación correcta de este.

Ejemplo

Queremos hacer un estudio de cómo afecta la contaminación en el cáncer de pulmón. Escogemos dos mues-
tras poblacionales, una en la comuna de Pudahuel y otra en Olmué. Se encuentra que las proporciones de
cáncer pulmonar son similares en ambas comunas, por lo tanto se concluye que la contaminación ambiental
no es un factor significativo en este tipo de cáncer.
5

Aquı́ las variables son cantidad de contaminación y cantidad de casos con cáncer pulmonar. Sin embargo,
dado que la proporción de fumadores está directamente relacionada con cáncer pulmonar, esa es una variable
que confunde, y por lo tanto cualquier estudio que desee relacionar contaminación con cáncer pulmonar
debe considerarla.
Hint 6 Considerar el escenario y la fraseologı́a del estudio Aunque un estudio sea conducido con una muestra
correcta y claramente definidos los términos y las preguntas, es importante detectar los problemas de escena-
rio y de fraseologı́a que pueden producir inexactitudes y respuestas deshonestas. Las respuestas deshonestas
son usuales cuando se trata de situaciones sensibles como hábitos personales o ingresos. Por ejemplo, si la
pregunta es: ¿hace trampa en su declaración de impuestos?, va a ser muy difı́cil identificar a los que dicen
la verdad de los que mienten. En otros casos, inclusive las respuestas honestas no son muy exactas si la
fraseologı́a invita a un sesgo. Por ejemplo, en Alemania se hicieron las dos siguientes preguntas:

1. ¿Usted dirı́a que el tráfico contribuye más o menos a la contaminación ambiental que las industrias?
2. ¿Usted dirı́a que las industrias contribuyen más o menos a la contaminación ambiental que el tráfico?
Con la primera pregunta 45 % contestó el tráfico y 32 %, las industrias, mientras que con la segunda pregunta
solo 24 % contestó el tráfico y 57 % las industrias. Solo con cambiar el orden de las palabras tráfico e
industrias, se produce un cambio dramático en el estudio.

Hint 7 Verificar que los resultados se presentan correctamente Aunque un estudio estadı́stico esté realizado
correctamente, puede ser mal interpretado en gráficos y/o conclusiones. Por ejemplo, un periodista podrı́a
mal interpretar un gráfico u obtener conclusiones no garantizadas para reportar una historia de manera más
espectacular.

Ejemplo

Un estudio se realizó para determinar los costos de las matrı́culas universitarias en comparación con los
mismos en 10 años anteriores. La conclusión es que aumentaron en 150 % durante ese perı́odo. ¿Aceptarı́a
la conclusión?
Dado que la conclusión no entrega ninguna evidencia de cómo se realizó el estudio, en particular, si se
consideró, por ejemplo, la inflación de ese perı́odo, yo tendrı́a que dudar de la conclusión.
Hint 8 Relajarse y considerar las conclusiones Finalmente, aunque el estudio realizado sea razonable de acuer-
do a todos los ı́tems anteriores, debemos analizar las conclusiones, haciéndonos al menos las siguientes
preguntas:
1. ¿El estudio logró sus objetivos?
2. ¿Las conclusiones tienen sentido?
3. ¿Podrı́a encontrar una explicación alternativa para los resultados obtenidos?
4. Si las conclusiones tienen sentido ¿ellas tienen algún significado práctico?

También podría gustarte