Está en la página 1de 8

13- Mat. -Estadisticas.qxd 26/05/2009 04:24 p.m.

PÆgina 97

Estadística
Una herramienta fundamental
de las ciencias

La estadística es una ciencia, con base mate-


13
mática, que se encarga de analizar e inter-
pretar datos de la realidad. En particular, la
estadística se ocupa de recolectar apropiada-
mente datos y de desarrollar herramientas que
sirven para predecir o descartar proyecciones a
futuro.
Tanto la física como las ciencias sociales, pa-
sando por las ciencias de la salud y el control de
calidad, utilizan la estadística como herramienta
para confirmar o descartar hipótesis.
Cada vez que se responden preguntas como
¿cuánto peso soporta cierta viga de un edifi-
cio?, ¿es este remedio más efectivo que este
otro para curar una infección?, ¿qué consumo
de electricidad tendrá nuestra ciudad dentro de
20 años?, la estadística juega un papel funda-
mental.
Te invitamos a descubrir algunos aspectos bási-
cos de esta hermosa ciencia.

1 INICIAL
¿Cuál es el idioma más utilizado en Internet? Descubrí las diferencias entre cantidad
absoluta y cantidad relativa.

2 INTERMEDIO
Imaginemos que somos médicos y trabajemos con estadísticas para averiguar la
temperatura normal de una persona sana.

3 AVANZADO
Hay dos candidatos a la intendencia de Córdoba, y en una encuesta uno obtuvo el
53,6% y el otro el 46,4%. ¿Qué probabilidad de ganar tiene el primero?
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 98

Cantidades de usuarios de Internet


Contar con la posibilidad de acceder a Internet es como tener una puerta abierta a un mundo donde
encontramos diversas formas de comunicarnos y la oportunidad de aprender cosas nuevas y mejorar
nuestros conocimientos. Lamentablemente hay muchas personas que todavía no tienen una manera
sencilla de acceder a esta herramienta.
Es por ello que las autoridades decidieron averiguar, en diferentes ciudades y regiones, qué cantidad
de personas tienen acceso y utilizan Internet, y obtuvieron los siguientes resultados:

Ciudad 1 Ciudad 2 Ciudad 3 Región 1 Región 2 Región 3


Cantidad total de habitantes 180.000 50.000 12.000 125.000 37.000 23.000
Personas que utilizan Internet 55.000 28.000 9.300 10.700 9.800 8.300

¿En cuál de estas ciudades o regiones te parece que convendría que las autoridades promovieran el
uso de Internet? También se interesó en estos datos una empresa que quiere abrir un comercio de ar-
tículos de computación. ¿En cuál de estas ciudades o regiones te parece que convendría que lo hicie-
ra? Antes de seguir leyendo sería bueno que intentaras llegar a una conclusión.

Cantidad absoluta y cantidad relativa


Las dos preguntas anteriores están relacionadas con “cantidades”, pues conviene instalar el comercio de artículos de computa-
ción donde haya “más” gente que use Internet, y las autoridades deben promover el uso de Internet donde haya “menos” gen-
te que la use.
¿Por qué escribimos las palabras “cantidades”, “más” y “menos” entre comillas? Para llamarte la atención sobre el hecho de que
algunas veces debemos considerar cantidades absolutas y otras, cantidades relativas.
Es claro que el comercio necesita muchos clientes. Por lo tanto conviene que esté ubicado donde haya mayor cantidad abso-
luta de usuarios de Internet, en nuestro ejemplo esto sucede en la ciudad 1.
Sin embargo, para elegir dónde el gobierno promocionará el uso de Internet, no es tan importante saber cuál es el lugar con
menor cantidad absoluta de usuarios de Internet, que en nuestro ejemplo es la ciudad 3. En la ciudad 3 ¡casi todos usan Inter-
net! Lo importante es la cantidad relativa de usuarios. Si mirás la región 1, verás que proporcionalmente casi nadie usa
Internet.

Porcentajes
En matemática se utilizan los porcentajes para describir cantidades relativas. Por ejemplo, cuando decimos que el 35% de los
autos son grises, significa que “de cada 100 autos, 35 son grises”; si decimos que el 18% de los habitantes de Argentina
son niños menores de 10 años, significa que “de cada 100 habitantes de Argentina, 18 tienen menos de 10 años”.
Los porcentajes nos describen la cantidad relativa. Con ellos podemos calcular la cantidad absoluta. Por ejemplo, en una ciu-
dad de 100.000 habitantes hay 1.000 grupos de 100 y, por lo tanto, hay 18.000 niños menores de 10 años.

Para decidir en qué lugar las autoridades deben promover el uso de Internet es muy importante comparar las cantidades relati-
vas de usuarios que hay en cada sitio, es decir que debemos comparar los porcentajes de usuarios que hay en cada lugar.
¿Te parece que lo hagamos?

98
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 99

Los porcentajes se utilizan para describir cantidades relativas,


considerando que la cantidad total es 100.

Un poquito más
Para calcular el porcentaje de usuarios de Internet en un lugar debemos encontrar el número N cuya proporción
respecto de 100 sea igual a la proporción que hay entre la cantidad de usuarios y la cantidad total de personas. Es
decir que
N (cantidad de usuarios) (cantidad de usuarios)
debe ser igual a y por lo tanto N = × 100.
100 (cantidad de habitantes) (cantidad de habitantes)

Obtenemos así que:


Ciudad 1 Ciudad 2 Ciudad 3 Región 1 Región 2 Región 3
Cantidad total de habitantes 180.000 50.000 12.000 125.000 37.000 23.000
Personas que utilizan Internet 55.000 28.000 9.300 10.700 9.800 8.300
Porcentajes 30,56% 56,00% 77,50% 8,56% 26,49% 36,09%

Esta tabla confirma que la región 1 es, por lejos, el lugar donde relativamente menos se usa Internet.

1) ¿Qué lugar es el que tiene mayor cantidad relativa de usuarios de Internet?

2) Si una ciudad de 120.000 habitantes tiene 25.000 usuarios de Internet, ¿qué porcentaje
de usuarios tiene?

1) ¿Qué cantidad de usuarios de Internet debería haber en la ciudad 1 para que tuviera la mis-
ma cantidad relativa de usuarios que la ciudad 3?

2) ¿Qué porcentaje de usuarios de Internet hay si sumamos los de las tres regiones?

Sabías que...
...el idioma que tiene más usuarios relativos de Internet es el japonés? La siguiente es una tabla
que describe los usuarios absolutos y relativos de Internet en el mundo.

99
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 100

La temperatura del cuerpo humano


Es muy probable que sepas que la temperatura normal del cuerpo humano es de aproximadamente 36,8°. Pase-
mos entonces a las siguientes preguntas:
¿Cómo se sabe que la temperatura normal del cuerpo humano es de aproximadamente 36,8°?
¿Qué quiere decir en este caso “aproximadamente”? ¿Si tengo 36,6º o 37,1º estoy enfermo?
Las respuestas no son tan sencillas y la estadística es una de las ciencias que se encargan de dar respuesta a es-
te tipo de preguntas. Te invitamos a descubrir qué tiene que ver la estadística con la medicina.

¿Cómo se determina la temperatura normal del cuerpo humano?


En 1992 un equipo de profesionales de la medicina y la estadística llevó a cabo en EE.UU. un estudio que consistió en elegir
cuidadosamente un grupo de personas sanas y medirles, durante tres días, y en distintos horarios, la temperatura
corporal en varias oportunidades. Un paso fundamental del estudio fue elegir, muy profesionalmente, el grupo personas sa-
nas que, en definitiva, representa a todas las personas sanas. En el siguiente cuadro presentamos un resumen de los re-
sultados que obtuvieron en 130 personas que, insistimos, estaban todas sanas y representaban fielmente la población.

35,7 35,8 35,9 35,9 36,0 36,1 36,1 36,2 36,2 36,2 36,2 36,2 36,2 36,3 36,3 36,3 36,3 36,3 36,3 36,4 36,4
36,4 36,4 36,4 36,4 36,5 36,5 36,5 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,7 36,7
36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8
36,8 36,8 36,8 36,8 36,8 36,8 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 37,0 37,0 37,0
37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1
37,1 37,1 37,1 37,1 37,2 37,2 37,2 37,2 37,2 37,2 37,2 37,3 37,3 37,3 37,3 37,3 37,3 37,4 37,4 37,4 37,4
37,5 37,7 37,8 38,2

Esta lista no es muy práctica para ser analizada, pero nos sirve para calcular el promedio. Si sumamos todas las temperatu-
ras y dividimos por 130 obtenemos que el promedio es 36,8°. Esta temperatura es llamada temperatura media de una
persona sana, y este estudio nos permite decir que la temperatura normal del cuerpo humano es de aproximadamente 36,8°.
¿Pero cuán aproximadamente?

¿Cómo presentar mejor la información?


Es conveniente presentar los datos organizadamente contando la cantidad de veces que aparecen temperaturas en un cierto
rango. En la siguiente tabla las hemos agrupado en intervalos de longitud 0,2°.

Temperaturas entre 35,5 y 35,69 35,7 y 35,89 35,9 y 36,09 36,1 y 36,29 36,3 y 36,49 36,5 y 36,69 36,7 y 36,89 36,9 y 37,09
Cantidad de personas
con ese rango de temperatura 0 2 3 8 12 15 29 22
Temperaturas entre 37,1 y 37,29 37,3 y 37,49 37,5 y 37,69 37,7 y 37,89 37,9 y 38,09 38,1 y 38,29 38,3 y 38,49 38,5 y 38,69
Cantidad de personas
con ese rango de temperatura 25 10 1 2 0 1 0 0

Es muy cómodo analizar los datos de es-


ta tabla en un gráfico en el que, sobre el
eje horizontal, marcamos los rangos de
temperatura y, para cada rango, dibuja-
mos una columna de altura igual a la
cantidad de personas cuya temperatura
estuvo en ese rango. Este tipo de gráfi-
cos se llaman histogramas.

100
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 101

Cuando medimos un dato varias veces siempre con el mismo cuidado, el promedio indica el probable valor real
del dato, y la desviación estándar indica el rango probable en el que se encuentran los 2/3 de las mediciones.

Un poquito más
Ya vimos que este estudio dice que la temperatura de una persona sana es de aproximadamente 36,8°. Veamos aho-
ra qué significado tiene en este caso la palabra “aproximadamente”. El estudio también muestra que no todas las per-
sonas sanas tienen 36,8°. Un dato estadístico muy importante es el valor S, que tiene la propiedad de que el rango
de valores entre 36,8° – S y 36,8° + S contiene las temperaturas de 2/3 de las personas. En este caso, 2/3 es casi
87. Contando las personas vemos que hay 84 entre 36,5° y 37,1°; y hay 97 entre 36,4° y 37,2°. Es decir que S está
entre 0,3° y 0,4°. Algunas veces no es muy cómodo tener que contar para calcular S, pero afortunadamente hay una
fórmula que aproxima S. Lo que debemos hacer es elevar al cuadrado las diferencias entre cada temperatura obteni-
da y el promedio. Luego sumar los resultados y dividir por 129 (sí, uno menos que 130). Finalmente se extrae la raíz
cuadrada. Es decir que

El número calculado a través de la fórmula se llama desviación estándar de los datos. Fijate que estamos suman-
do todas las diferencias, por eso aparece repetido (35,9 – 36,8)2.
Conclusión: este estudio dice que más de 2/3 de las personas sanas tienen temperatura entre 36,5° y 37,1°, y que
el promedio de temperaturas es 36,8°.

Tres aclaraciones
- Aquí mostramos una versión simplificada del estudio real, que es mucho más completo.
- El resultado de este estudio no es la verdad absoluta, pero sí es un análisis aproximado de la realidad del cual
se tiene controlado el posible margen de error.
- Si un día no te sentís bien y tu temperatura es de 37,1° es conveniente consultar al médico. Que ha-
ya personas sanas con 37,1° para nada quiere decir que estás sano cuando te sentís mal y tenés 37,1°.

1) ¿Cuál fue la temperatura que apareció mayor cantidad de veces en el estudio?

2) ¿Qué porcentaje de temperaturas cae entre 36,4° y 37,2°?

1) Dibujá un histograma agrupando las temperaturas en rango de 0,3°.

2) La temperatura de 38,2° parece muy rara, ¿se habrán equivocado? No lo sabemos. ¿Cambiará
mucho la temperatura media si no consideramos esta medición? Te invitamos a arriesgar una res-
puesta antes de calcular el promedio sin contar la temperatura 38,2°.

101
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 102

Elecciones en Córdoba y encuestas


Imaginemos que en la ciudad de Córdoba hay dos candidatos a la intendencia: A y B. Antes de las elecciones ha-
cemos una encuesta y salimos a la calle a preguntarles a 1.000 personas a quién votarán. Obtenemos que 536
personas prefieren A y 464 prefieren B. ¿Podemos afirmar que muy probablemente ganará A?

Los primeros pasos de una encuesta


Realizar correctamente una encuesta es una tarea compleja. La primera etapa, y una de las más importantes, es seleccionar
apropiadamente el grupo de personas que vamos a encuestar. Es fundamental que este grupo respete fielmente las propor-
ciones que tiene la sociedad en las diferentes variables demográficas que puedan influir a la hora de elegir un candidato. Por
ejemplo, los jóvenes de 18 años suelen tener preferencias distintas de las de personas de más de 60 años. Lo mismo ocurre
entre personas que viven en el centro de la ciudad y las que viven a más de 5 km del centro, o entre las que ganan más de
$ 12.000 por mes y las que no llegan a $ 2.000. Todos estos sectores deben quedar representados en su justa proporción en
el grupo elegido para la encuesta.
Finalmente, el grupo debe ser elegido al azar entre los grupos que cumplan los requisitos exigidos. También es importante la
capacitación de las personas encargadas de salir a la calle. Los encuestadores deben estar preparados para presentarse co-
rrectamente y resolver situaciones imprevistas que pudieran ocurrir. Todas estas tareas son generalmente coordinadas por
profesionales de la estadística.

Dos preguntas claves


Una vez elegido correctamente el grupo, los encuestadores salen a la calle y vuelven con los datos: en este caso se obtuvo
que, de 1.000 personas encuestadas, el 53,6% votará A y el 46,4% votará B. Hasta acá podemos deducir que probable-
mente el 53,6% de toda la ciudad votará A. Pero... ¿cuán probable es?
Ahora viene un punto importantísimo. Compará las siguientes dos preguntas:
1) ¿Qué probabilidad hay de que A obtenga el 53,6%?
2) En caso de que A saque el x% de los votos, ¿qué probabilidad hay de que nuestra encuesta diga que el 53,6% lo va a votar?
Reflexioná unos minutos sobre la diferencia entre las dos preguntas. La estadística está en condiciones de responder la se-
gunda, pero sólo puede opinar sobre la primera.

Intervalos de confianza
Supongamos que A obtenga un x% de los votos. La estadística utiliza un teorema que dice que si A obtiene x% de los vo-
tos, entonces el 95% de las encuestas que hagamos correctamente con N personas arrojará, a favor de A, un porcentaje P%
tal que el intervalo
contendrá a x.

Este intervalo se llama intervalo de confianza de la encuesta. En nuestro caso N = 1.000 y P = 53,6.
Así obtenemos que
, y por lo tanto el intervalo de confianza es (50,51% , 56,69%).

Conclusión: si el candidato A llega a sacar un porcentaje x% que no esté entre 50,51% y 56,69%, entonces tuvimos tanta mala
suerte que justo hicimos una encuesta que tenía sólo el 5% de probabilidades de obtener esos resultados. Como
creemos que difícilmente hayamos tenido tanta mala suerte nos inclinamos a pensar que es bastante probable que en la próxima
elección el candidato A saque un porcentaje entre 50,51% y 56,69%. Nos arriesgamos a opinar que A ganará.

102
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 103

Una buena encuesta nos permite tener argumentos sólidos para creer que es poco probable
que cierto candidato saque un porcentaje fuera del intervalo de confianza.

Un poquito más
Alguien podría argumentar que no es tanta mala suerte hacer una encuesta que sólo tenía el 5% de proba-
bilidades de obtener esos resultados. Nos gustaría bajar esa probabilidad al 1%. En este caso lo que cambia
en el teorema anterior es que el factor 1,96 pasa a ser 2,58. Es decir que, en el caso en que A obtenga un x%, en-
tonces el 99% de las encuestas que hagamos correctamente con N personas arrojarán, a favor de A, un porcentaje
P% tal que el intervalo
contendrá a x.

Obtenemos que , y por lo tanto el intervalo de confianza es (49,53%, 57,67%).

Conclusión: si el candidato A llega a sacar un porcentaje del 49,8% y, por lo tanto, pierde la elección, nuestra en-
cuesta no tuvo nada de raro, pues 49,8% está en el intervalo de confianza. Por lo tanto no nos arriesgamos a
decir si A ganará o no. Lo que podemos hacer es llevar a cabo una nueva encuesta con más de 1.000 personas. Esto
achicaría el 4,07 obtenido (por ejemplo si N = 5.000, el 4,07 se convierte en 1,82). Sin embargo esta nueva encues-
ta dará nuevos porcentajes para A y B, lo cual podría hacer que nuevamente 49,8% esté en el intervalo de confianza,
por ejemplo si da para A un 51,3%.
Si en tu escuela hacen alguna elección, intenten hacer una encuesta a ver cómo les va.

1) Calculá el intervalo de confianza correspondiente al 95% de una encuesta de 100 per-


sonas en las que A obtiene 57,3%. ¿Te animás a arriesgar que ganará A?

2) ¿Qué habría ocurrido si la encuesta del ejercicio anterior hubiera sido hecha con 200
personas?

Sería muy rara la situación en la que tirando una moneda al aire 200 veces salieran más de 115
caras. Es posible que ocurra pero es menos del 5% probable. ¿Por qué?

Sabías que...
...en muchas fábricas utilizan los intervalos de confianza? En procesos de calibración de máqui-
nas o controles de calidad, se recogen periódicamente muestras para analizar si el intervalo de
confianza obtenido contiene o no los valores esperados de dicho proceso.

103
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 104

MATELOCOS

Letras favoritas del castellano


Don Walter Orio Duilio, experto en literatura, contó las veces
que aparece cada letra del abecedario en la extraordinaria obra
“El amor en los tiempos del cólera”, de su autor favorito, Gabriel
García Márquez. También calculó las cantidades relativas, pues
sabe que la obra tiene en total 654.171 letras. ¿Te animás a adi-
vinar cuál es la vocal y la consonante que más aparecen?

Cálidos y fríos
La expresión “de sangre caliente” es vulgarmente utilizada para
referirse a las especies que mantienen su temperatura corporal
a un nivel aproximadamente constante, independientemente de
la temperatura ambiente. Análogamente, las especies cuya tem-
peratura corporal es básicamente la del medio son llamados “de
sangre fría”. ¿Cuáles de estas especies tienen sangre fría y cuá-
les caliente? Tortuga, elefante, perro, araña, paloma, víbora, la-
gartija.
Sangre caliente: elefante, perro, paloma. Sangre fría: tortuga, araña, víbora, lagartija.

La moneda trucha Tabla 1 Tabla 2

Una de las dos siguientes tablas fue completada


por filas horizontales arrojando una moneda y
escribiendo 1, si salía ceca; y 0 si salía cara. La
otra tabla fue completada sin tirar la moneda y
tratando de imitar lo que haría la moneda. La in-
tuición del imitador no fue buena pues cometió
serios errores. ¿Cuál te parece que es la tabla
de la moneda y cuál es la del imitador? (Ayuda: tivas, y hay más del 95% de que salgan por lo menos 5 cecas o caras consecutivas. La Tabla 2 no tiene más de 3.
mirá la cantidad de 1 y 0 consecutivos.) La Tabla 1 es de la moneda. Hay más del 99% de probabilidades de que salgan por lo menos 4 cecas o caras consecu-

2) 15,57%.
1) 139.500.

2) El promedio casi no cambia, redondeando sigue siendo 36,8°.

valo de confianza correspondiente al 95% da en el caso del problema es (50,6% , 64,4%), y por lo tanto 50% queda fuera.
Porque tirar una moneda 200 veces es como hacer una encuesta en la que sabemos que ambos candidatos (cara y ceca) sacarán el 50%. El inter-

2) 20,83%.
1) La ciudad 3.

2) Son 97, es decir el 75%.


1) 37,1° apareció 18 veces.

2) El intervalo es (50,4%, 64,2%). Podemos arriesgar decir que ganará.


1) El intervalo es (47,6%, 67%). No nos podemos arriesgar a decir que ganará.

104

También podría gustarte