14 - Interpretar Datos

Pontificia Universidad Católica de Chile
Departamento de Matemáticas
Mat 0100 Razonamiento Cuantitativo
Clase #14
Interpretando datos
Contenidos
Tipos de variables.
Parámetros poblacionales
Definición de muestra.
Tipos de estudios.
La estadı́stica juega un rol preponderante en la actual sociedad y de hecho, es muy difı́cil pensar en algún tema
que no esté de alguna manera relacionado con las estadı́sticas. Se utilizan para determinar la efectividad de una
cierta droga en el tratamiento del cáncer, en las encuestas de opinión sobre la popularidad de un cierto gobierno,
en los estudios de mercado, en el estudio de las probabilidades que un equipo de fútbol gane un mundial, en la
educación, en la agricultura, en la predicción del tiempo, etcétera. Mientras que la ciencia de la estadı́stica es la
ciencia de recaudar, organizar e interpretar información, las estadı́sticas son los datos que describen o resumen
alguna situación. Por ejemplo, si en un curso hay 30 alumnos cuyas edades fluctúan entre los 18 y 25 años,
entonces los números 30 estudiantes, 18 años y 25 años son las estadı́sticas que describen ese curso.
Los estudios estadı́sticos son realizados de diferentes modos y para una gran diversidad de objetivos, pero todos
comparten algunas caracterı́sticas. Consideremos, por ejemplo, los estudios sobre los ratings televisivos que son
utilizados para estimar el número de personas que vieron un cierto programa durante la semana y ası́ determinar
el programa más popular de la semana. En la edición web de un diario del 24 de septiembre de 2009 aparece el
titular: “Debate presidencial tuvo menos rating que ¿Dónde está Elisa?”. Seguido del comentario: “Mientras que
la teleserie nocturna promedia cada noche alrededor de 40 puntos, el encuentro polı́tico (el primero que se hace
por TV en la presente campaña) apenas superó los 30 puntos en su peak de sintonı́a”. ¿Qué significado tiene esto?
Cada punto de rating representa 1 % de la población que es medida mediante un aparato electrónico colocado
en los televisores de una cierta muestra de la población de Chile. El rating de 30 puntos indica el porcentaje de
hogares con la TV prendida en el canal del debate.
En rigor, la población en un estudio estadı́stico es el conjunto completo de personas u objetos que se están
estudiando y la muestra es un subconjunto de la población de la cual se obtiene la información.
Las caracterı́sticas especı́ficas asociadas a una colección de objetos o individuos bajo estudio que sean sus-
ceptibles de medición u observación (género, edad, nivel socioeconómico) se llaman variables y los datos u
observaciones son los valores que toman las variables como ser, masculino, 37, ABC1.
Las variables se dividen en dos grupos: variables cuantitativas y variables cualitativas.
Las variables cuantitativas se pueden medir o cuantificar y tiene sentido efectuar algunas operaciones aritméti-
cas con ellas, por ejemplo, sumarlas o aumentarlas al doble y siempre son representadas por números.
A su vez, las variables cuantitativas se dividen en dos grupos: variables continuas y variables discretas.
Las variables continuas son aquellas cuyos posibles valores forman un intervalo de números reales y que
resultan normalmente de una medición; como por ejemplo, estatura o peso de un individuo.
Por otra parte, una variable es discreta si para todo dato que no sea el máximo, existe otro dato que es el
inmediatamente superior, es decir, la variable no toma valores entre ellos, por ejemplo, número de hijos o cantidad
de docenas de huevos en un canasto.
Los datos de una variable cualitativa nominal son aquellos cuyos posibles valores son clases o categorı́as,
entre las cuales no se puede establecer ningún ordenamiento sugerido por la magnitud eventual de los valores,
como ser, el color de los ojos o las caras de un dado. Finalmente una variable cualitativa ordinal es una variable
1
2
no numéricas, en las que existe un orden como, por ejemplo, la nota en una evaluación en la que asignamos a cada
alumno la categorı́a de: reprobado, aprobado, notable, sobresaliente.
Se llaman parámetros muestrales a ciertos valores que se obtienen a partir de los datos obtenidos de la muestra
y que determinan la distribución de esta; por ejemplo, promedio, varianza, etcétera. Los parámetros muestrales
nos permiten estimar los verdaderos valores presentes en la población; estos valores se llaman estadı́sticos.
Ejemplo
Algunos antropólogos determinaron el tamaño promedio de los cerebros de los antiguos neandertales en Eu-
ropa, estudiando los cerebros de restos de ellos que fueron encontrados en tres lugares distintos del sur de Europa.
En este ejemplo, la población son los antiguos neandertales de Europa. Especı́ficamente, quieren encontrar
la medida promedio de sus cerebros, lo que constituye el estadı́stico. La muestra son los escasos individuos
que fueron encontrados en los tres lugares del sur de Europa y los estadı́sticos podrı́an ser los promedios de las
medidas de los cerebros de la muestra.
Los pasos básicos en un estudio estadı́stico son:

1. Especificar el objetivo del estudio en forma precisa. Es decir, determinar la población que se quiere estudiar
y qué es exactamente lo que se quiere estudiar de ella.
2. Encontrar una muestra representativa de la población.
3. Recolectar información de la muestra y resumir esta información con estadı́sticos muestrales interesantes.
4. Utilizar los estadı́sticos muestrales para inferir parámetros poblacionales.
5. Obtener conclusiones: Determinar lo que se ha aprendido y si el objetivo original fue alcanzado.
Una muestra representativa es una muestra en la cual las caracterı́sticas relevantes de los miembros de la muestra
coinciden con las caracterı́sticas de la población. Por ejemplo, una muestra que nos entrega una computadora que
selecciona estudiantes al azar, es llamada muestra aleatoria simple y generalmente es una muy buena manera de
escoger una muestra representativa.
Los métodos más comunes para escoger muestras son:
Muestreo random simple : Escogemos una muestra de ı́temes, de tal manera que cada muestra de un cierto
tamaño tenga la misma posibilidad de ser elegida.
Muestreo sistemático : Escogemos un método sencillo de selección; por ejemplo, de una lista seleccionamos un
individuo al azar y leugo contando hasta 10 en forma reiterada, seleccionamos aquellos que se encuentran
en los décimos lugares.
Muestreo conveniente : Usamos una muestra que es conveniente selecciona; por ejemplo, las personas que se
encuentran en una sala de clases. En general, no entrega muestras representativas.
Muestreo estratificado : Subdividimos a la población en al menos dos subgrupos (o estratos) diferentes, de
manera que los sujetos que pertenecen al mismo subgrupo compartan las mismas caracterı́sticas (como el
género o la categorı́a de edad), y luego obtenemos una muestra de cada subgrupo (o estrato). Este método
se utiliza cuando nos preocupan las diferencias entre subgrupos dentro de la población; por ejemplo, niveles
educacionales, niveles económicos o diferencias religiosas, etcétera.
Si deseamos, por ejemplo, realizar un estudio del peso promedio de los estudiantes masculinos universitarios, no
serı́a buena idea escoger como muestra la selección de fútbol de la universidad. Esto se conoce como una muestra
sesgada, que por supuesto llevarı́a a conclusiones erradas. En general, un estudio estadı́stico es sesgado cuando
tiende a favorecer ciertos resultados.
Fundamentalmente, los estudios estadı́sticos caen en dos categorı́as:
Estudio observacional : Se observan o se miden en encuestas las caracterı́sticas de la muestra, pero no se con-
trolan ni se modifican las condiciones a las que los individuos están expuestos. Por ejemplo, una encuesta
sobre hábitos alimenticios.
3
Experimento : Investigadores aplican un cierto tratamiento a una muestra o parte de una muestra y estudian los
efectos del tratamiento. Por ejemplo, un estudio para determinar si grandes dosis de vitamina C pueden ayu-
dar a prevenir los resfrı́os. Para realizar esto, los investigadores deberán utilizar grandes dosis de vitamina C
en parte de su muestra. Es difı́cil determinar si un experimento es exitoso, a menos que se comparen grupos
que reciben el tratamiento versus los que no lo reciben. En este caso tendremos un grupo de tratamiento
(el que recibe el tratamiento) y un grupo de control (el que no lo recibe).
La mayorı́a de las investigaciones estadı́sticas son realizadas cuidadosamente y con integridad; sin embargo,
son lo suficientemente complejas como para que un sesgo pueda aparecer de muchas maneras diferentes. Siempre
debemos examinar las conclusiones de un análisis estadı́stico muy cuidadosamente, buscando cualquier detalle
que pueda hacernos dudar del resultado. Veamos algunos hints que nos permitan contestar la pregunta: ¿debo yo
creer en este estudio estadı́stico?
Hint 1 Identificar el propósito, población y tipo de estudio Antes de evaluar los detalles de un estudio estadı́sti-
co, debemos averiguar de qué se trata exactamente. Para ello, debemos contestar las siguientes preguntas
básicas:
1. ¿Cuál es el propósito del estudio?

2. ¿Cuál era la población estudiada? ¿Esta población estaba definida clara y apropiadamente?
3. ¿Qué tipo de estudio se realizó? ¿Era el tipo apropiado para lograr el propósito del estudio?
Ejemplo
Un periódico afirma lo siguiente: “Investigadores entregaron a los 50 participantes al congreso su carta astral
y se les preguntó si el horóscopo que se les entregó era preciso: 85 % de los participantes contestaron que sı́.
Por lo tanto la conclusión de los investigadores fue que los horóscopos son válidos la mayorı́a de las veces”.
El propósito de este estudio era determinar la validez de los horóscopos. Basados en los horóscopos que
publica un periódico, este estudio fue observacional. Sin embargo, la precisión del horóscopo es de algún
modo subjetivo. Este estudio debió ser un experimento controlado en el cual a algunos participantes se les
entregaba el verdadero horóscopo y a otros uno falso. De esta manera, los investigadores podrı́an haber
estudiado las diferencias entre los dos grupos. En resumen, el tipo de estudio fue inapropiado y por lo tanto
los resultados no tienen sentido.
Hint 2 Tomar en consideración la fuente Los estudios estadı́sticos son objetivos, pero las personas que los rea-
lizan no lo son necesariamente. Por lo tanto, hay que considerar la fuente del estudio para evitar que esté
sesgado.
Ejemplo
Existen muchos estudios que entregan clara evidencia de que el tabaco es perjudicial para la salud. Sin
embargo, hay unos pocos estudios que determinan que no existe daño en fumar y que por el contrario,
podrı́a ser saludable. Estos últimos estudios fueron financiados por compañı́as tabacaleras. Por supuesto
que este es un ejemplo en que debemos considerar la fuente de la información.
Hint 3 Buscar el sesgo en la muestra Buscar el sesgo que pueda hacer que la muestra no sea representativa.
Hay dos formas comunes de sesgo que pueden afectar la muestra:
Sesgo de selección : Ocurre cuando los investigadores seleccionan una muestra que no es representativa
de la población. Por ejemplo, una elección primaria que solo considera a los inscritos en un partido
polı́tico claramente no va a reflejar la opinión de todos los votantes.
Sesgo participativo : Ocurre en general en las consultas voluntarias, pues las personas que participan son
fundamentalmente aquellas a las que el tema en particular les interesa, pero el resultado no refleja la
opinión de la totalidad de la comunidad.
4
Ejemplo
En 1958 se realizó una encuesta para predecir los resultados de la elección presidencial en Chile. Los candi-
datos eran Jorge Alessandri, Salvador Allende, Eduardo Frei Montalva, Luis Bossay y Antonio Zamorano.
Se escogió en forma aleatoria una muestra poblacional muy amplia: un millón de personas, escogidas ar-
bitrariamente dentro de ciertas listas que incluı́an guı́a telefónica, miembros de distintos clubes sociales,
etcétera. A todos ellos se les envió una postal solicitando el nombre del candidato que consideraban como
el triunfador. Solo 400,000 personas contestaron la encuesta, obteniendo como resultado que Alessandri
ganarı́a las elecciones con un porcentaje del 59 % de los votos emitidos.
El resultado de esta elección fue: 31, 52 % para Alessandri, 28, 91 % para Allende y 20, 75 % para Frei con
1,235,553 votos escrutados. ¿Qué pasó con esta encuesta? Aquı́ el problema es que la muestra poblacional
sufrı́a de ambos sesgos. Sesgo de selección porque las personas que en 1958 tenı́an teléfonos eran una
minorı́a absoluta y en general del segmento económico alto, al igual que los que pertenecı́an a algún club
social. Hay sesgo participativo porque los que contestaron voluntariamente eran personas más interesadas
polı́ticamente en la elección.
Hint 4 Buscar problemas en las definiciones o las mediciones de las variables En el siguiente ejemplo, las va-
riables son muy difı́ciles de definir. ¿Qué se entiende por amor verdadero? ¿Amor por un dı́a, por toda la
vida o algo distinto? Lo mismo pasa con las otras variables; por ejemplo sostener una cuchara sobre la nariz,
¿es un talento?
Ejemplo
En Estados Unidos se realizó un estudio que involucraba 1 % más acaudalado del paı́s. A partir de los
resultados obtenidos, estas personas están dispuestas a pagar en promedio:
1. $ 487,000 por amor verdadero.
2. $ 407,000 por una gran inteligencia.
3. $ 285,000 por talento.
4. $ 259,000 por juventud eterna.
Ejemplo
Las autoridades intentan evitar que entren drogas ilegales a Chile. Sin embargo, tienen éxito en confiscar
entre 10 % y 20 % de las que se internan. ¿Deberı́a creer en esta encuesta?
En este ejemplo tenemos dos variables: la cantidad de droga ilegal interceptada y la cantidad no interceptada.
La primera variable es fácil de medir, pero la segunda es imposible, pues la droga es ilegal y por lo tanto es
improbable que alguien la declare.
Hint 5 Buscar variables que confunden Variables que no se pretende que entren en el estudio pueden dificultar
la interpretación correcta de este.
Ejemplo
Queremos hacer un estudio de cómo afecta la contaminación en el cáncer de pulmón. Escogemos dos mues-
tras poblacionales, una en la comuna de Pudahuel y otra en Olmué. Se encuentra que las proporciones de
cáncer pulmonar son similares en ambas comunas, por lo tanto se concluye que la contaminación ambiental
no es un factor significativo en este tipo de cáncer.
5
Aquı́ las variables son cantidad de contaminación y cantidad de casos con cáncer pulmonar. Sin embargo,
dado que la proporción de fumadores está directamente relacionada con cáncer pulmonar, esa es una variable
que confunde, y por lo tanto cualquier estudio que desee relacionar contaminación con cáncer pulmonar
debe considerarla.
Hint 6 Considerar el escenario y la fraseologı́a del estudio Aunque un estudio sea conducido con una muestra
correcta y claramente definidos los términos y las preguntas, es importante detectar los problemas de escena-
rio y de fraseologı́a que pueden producir inexactitudes y respuestas deshonestas. Las respuestas deshonestas
son usuales cuando se trata de situaciones sensibles como hábitos personales o ingresos. Por ejemplo, si la
pregunta es: ¿hace trampa en su declaración de impuestos?, va a ser muy difı́cil identificar a los que dicen
la verdad de los que mienten. En otros casos, inclusive las respuestas honestas no son muy exactas si la
fraseologı́a invita a un sesgo. Por ejemplo, en Alemania se hicieron las dos siguientes preguntas:
1. ¿Usted dirı́a que el tráfico contribuye más o menos a la contaminación ambiental que las industrias?
2. ¿Usted dirı́a que las industrias contribuyen más o menos a la contaminación ambiental que el tráfico?
Con la primera pregunta 45 % contestó el tráfico y 32 %, las industrias, mientras que con la segunda pregunta
solo 24 % contestó el tráfico y 57 % las industrias. Solo con cambiar el orden de las palabras tráfico e
industrias, se produce un cambio dramático en el estudio.
Hint 7 Verificar que los resultados se presentan correctamente Aunque un estudio estadı́stico esté realizado
correctamente, puede ser mal interpretado en gráficos y/o conclusiones. Por ejemplo, un periodista podrı́a
mal interpretar un gráfico u obtener conclusiones no garantizadas para reportar una historia de manera más
espectacular.
Ejemplo
Un estudio se realizó para determinar los costos de las matrı́culas universitarias en comparación con los
mismos en 10 años anteriores. La conclusión es que aumentaron en 150 % durante ese perı́odo. ¿Aceptarı́a
la conclusión?
Dado que la conclusión no entrega ninguna evidencia de cómo se realizó el estudio, en particular, si se
consideró, por ejemplo, la inflación de ese perı́odo, yo tendrı́a que dudar de la conclusión.
Hint 8 Relajarse y considerar las conclusiones Finalmente, aunque el estudio realizado sea razonable de acuer-
do a todos los ı́tems anteriores, debemos analizar las conclusiones, haciéndonos al menos las siguientes
preguntas:
1. ¿El estudio logró sus objetivos?
2. ¿Las conclusiones tienen sentido?
3. ¿Podrı́a encontrar una explicación alternativa para los resultados obtenidos?
4. Si las conclusiones tienen sentido ¿ellas tienen algún significado práctico?

14 - Interpretar Datos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

14 - Interpretar Datos

Cargado por

Copyright:

Formatos disponibles

Pontificia Universidad Católica de Chile

Mat 0100 Razonamiento Cuantitativo

Los pasos básicos en un estudio estadı́stico son:

1. ¿Cuál es el propósito del estudio?

También podría gustarte