Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PÆgina 97
Estadística
Una herramienta fundamental
de las ciencias
1 INICIAL
¿Cuál es el idioma más utilizado en Internet? Descubrí las diferencias entre cantidad
absoluta y cantidad relativa.
2 INTERMEDIO
Imaginemos que somos médicos y trabajemos con estadísticas para averiguar la
temperatura normal de una persona sana.
3 AVANZADO
Hay dos candidatos a la intendencia de Córdoba, y en una encuesta uno obtuvo el
53,6% y el otro el 46,4%. ¿Qué probabilidad de ganar tiene el primero?
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 98
¿En cuál de estas ciudades o regiones te parece que convendría que las autoridades promovieran el
uso de Internet? También se interesó en estos datos una empresa que quiere abrir un comercio de ar-
tículos de computación. ¿En cuál de estas ciudades o regiones te parece que convendría que lo hicie-
ra? Antes de seguir leyendo sería bueno que intentaras llegar a una conclusión.
Porcentajes
En matemática se utilizan los porcentajes para describir cantidades relativas. Por ejemplo, cuando decimos que el 35% de los
autos son grises, significa que “de cada 100 autos, 35 son grises”; si decimos que el 18% de los habitantes de Argentina
son niños menores de 10 años, significa que “de cada 100 habitantes de Argentina, 18 tienen menos de 10 años”.
Los porcentajes nos describen la cantidad relativa. Con ellos podemos calcular la cantidad absoluta. Por ejemplo, en una ciu-
dad de 100.000 habitantes hay 1.000 grupos de 100 y, por lo tanto, hay 18.000 niños menores de 10 años.
Para decidir en qué lugar las autoridades deben promover el uso de Internet es muy importante comparar las cantidades relati-
vas de usuarios que hay en cada sitio, es decir que debemos comparar los porcentajes de usuarios que hay en cada lugar.
¿Te parece que lo hagamos?
98
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 99
Un poquito más
Para calcular el porcentaje de usuarios de Internet en un lugar debemos encontrar el número N cuya proporción
respecto de 100 sea igual a la proporción que hay entre la cantidad de usuarios y la cantidad total de personas. Es
decir que
N (cantidad de usuarios) (cantidad de usuarios)
debe ser igual a y por lo tanto N = × 100.
100 (cantidad de habitantes) (cantidad de habitantes)
Esta tabla confirma que la región 1 es, por lejos, el lugar donde relativamente menos se usa Internet.
2) Si una ciudad de 120.000 habitantes tiene 25.000 usuarios de Internet, ¿qué porcentaje
de usuarios tiene?
1) ¿Qué cantidad de usuarios de Internet debería haber en la ciudad 1 para que tuviera la mis-
ma cantidad relativa de usuarios que la ciudad 3?
2) ¿Qué porcentaje de usuarios de Internet hay si sumamos los de las tres regiones?
Sabías que...
...el idioma que tiene más usuarios relativos de Internet es el japonés? La siguiente es una tabla
que describe los usuarios absolutos y relativos de Internet en el mundo.
99
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 100
35,7 35,8 35,9 35,9 36,0 36,1 36,1 36,2 36,2 36,2 36,2 36,2 36,2 36,3 36,3 36,3 36,3 36,3 36,3 36,4 36,4
36,4 36,4 36,4 36,4 36,5 36,5 36,5 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,6 36,7 36,7
36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,7 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8 36,8
36,8 36,8 36,8 36,8 36,8 36,8 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 36,9 37,0 37,0 37,0
37,0 37,0 37,0 37,0 37,0 37,0 37,0 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1 37,1
37,1 37,1 37,1 37,1 37,2 37,2 37,2 37,2 37,2 37,2 37,2 37,3 37,3 37,3 37,3 37,3 37,3 37,4 37,4 37,4 37,4
37,5 37,7 37,8 38,2
Esta lista no es muy práctica para ser analizada, pero nos sirve para calcular el promedio. Si sumamos todas las temperatu-
ras y dividimos por 130 obtenemos que el promedio es 36,8°. Esta temperatura es llamada temperatura media de una
persona sana, y este estudio nos permite decir que la temperatura normal del cuerpo humano es de aproximadamente 36,8°.
¿Pero cuán aproximadamente?
Temperaturas entre 35,5 y 35,69 35,7 y 35,89 35,9 y 36,09 36,1 y 36,29 36,3 y 36,49 36,5 y 36,69 36,7 y 36,89 36,9 y 37,09
Cantidad de personas
con ese rango de temperatura 0 2 3 8 12 15 29 22
Temperaturas entre 37,1 y 37,29 37,3 y 37,49 37,5 y 37,69 37,7 y 37,89 37,9 y 38,09 38,1 y 38,29 38,3 y 38,49 38,5 y 38,69
Cantidad de personas
con ese rango de temperatura 25 10 1 2 0 1 0 0
100
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 101
Cuando medimos un dato varias veces siempre con el mismo cuidado, el promedio indica el probable valor real
del dato, y la desviación estándar indica el rango probable en el que se encuentran los 2/3 de las mediciones.
Un poquito más
Ya vimos que este estudio dice que la temperatura de una persona sana es de aproximadamente 36,8°. Veamos aho-
ra qué significado tiene en este caso la palabra “aproximadamente”. El estudio también muestra que no todas las per-
sonas sanas tienen 36,8°. Un dato estadístico muy importante es el valor S, que tiene la propiedad de que el rango
de valores entre 36,8° – S y 36,8° + S contiene las temperaturas de 2/3 de las personas. En este caso, 2/3 es casi
87. Contando las personas vemos que hay 84 entre 36,5° y 37,1°; y hay 97 entre 36,4° y 37,2°. Es decir que S está
entre 0,3° y 0,4°. Algunas veces no es muy cómodo tener que contar para calcular S, pero afortunadamente hay una
fórmula que aproxima S. Lo que debemos hacer es elevar al cuadrado las diferencias entre cada temperatura obteni-
da y el promedio. Luego sumar los resultados y dividir por 129 (sí, uno menos que 130). Finalmente se extrae la raíz
cuadrada. Es decir que
El número calculado a través de la fórmula se llama desviación estándar de los datos. Fijate que estamos suman-
do todas las diferencias, por eso aparece repetido (35,9 – 36,8)2.
Conclusión: este estudio dice que más de 2/3 de las personas sanas tienen temperatura entre 36,5° y 37,1°, y que
el promedio de temperaturas es 36,8°.
Tres aclaraciones
- Aquí mostramos una versión simplificada del estudio real, que es mucho más completo.
- El resultado de este estudio no es la verdad absoluta, pero sí es un análisis aproximado de la realidad del cual
se tiene controlado el posible margen de error.
- Si un día no te sentís bien y tu temperatura es de 37,1° es conveniente consultar al médico. Que ha-
ya personas sanas con 37,1° para nada quiere decir que estás sano cuando te sentís mal y tenés 37,1°.
2) La temperatura de 38,2° parece muy rara, ¿se habrán equivocado? No lo sabemos. ¿Cambiará
mucho la temperatura media si no consideramos esta medición? Te invitamos a arriesgar una res-
puesta antes de calcular el promedio sin contar la temperatura 38,2°.
101
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 102
Intervalos de confianza
Supongamos que A obtenga un x% de los votos. La estadística utiliza un teorema que dice que si A obtiene x% de los vo-
tos, entonces el 95% de las encuestas que hagamos correctamente con N personas arrojará, a favor de A, un porcentaje P%
tal que el intervalo
contendrá a x.
Este intervalo se llama intervalo de confianza de la encuesta. En nuestro caso N = 1.000 y P = 53,6.
Así obtenemos que
, y por lo tanto el intervalo de confianza es (50,51% , 56,69%).
Conclusión: si el candidato A llega a sacar un porcentaje x% que no esté entre 50,51% y 56,69%, entonces tuvimos tanta mala
suerte que justo hicimos una encuesta que tenía sólo el 5% de probabilidades de obtener esos resultados. Como
creemos que difícilmente hayamos tenido tanta mala suerte nos inclinamos a pensar que es bastante probable que en la próxima
elección el candidato A saque un porcentaje entre 50,51% y 56,69%. Nos arriesgamos a opinar que A ganará.
102
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 103
Una buena encuesta nos permite tener argumentos sólidos para creer que es poco probable
que cierto candidato saque un porcentaje fuera del intervalo de confianza.
Un poquito más
Alguien podría argumentar que no es tanta mala suerte hacer una encuesta que sólo tenía el 5% de proba-
bilidades de obtener esos resultados. Nos gustaría bajar esa probabilidad al 1%. En este caso lo que cambia
en el teorema anterior es que el factor 1,96 pasa a ser 2,58. Es decir que, en el caso en que A obtenga un x%, en-
tonces el 99% de las encuestas que hagamos correctamente con N personas arrojarán, a favor de A, un porcentaje
P% tal que el intervalo
contendrá a x.
Conclusión: si el candidato A llega a sacar un porcentaje del 49,8% y, por lo tanto, pierde la elección, nuestra en-
cuesta no tuvo nada de raro, pues 49,8% está en el intervalo de confianza. Por lo tanto no nos arriesgamos a
decir si A ganará o no. Lo que podemos hacer es llevar a cabo una nueva encuesta con más de 1.000 personas. Esto
achicaría el 4,07 obtenido (por ejemplo si N = 5.000, el 4,07 se convierte en 1,82). Sin embargo esta nueva encues-
ta dará nuevos porcentajes para A y B, lo cual podría hacer que nuevamente 49,8% esté en el intervalo de confianza,
por ejemplo si da para A un 51,3%.
Si en tu escuela hacen alguna elección, intenten hacer una encuesta a ver cómo les va.
2) ¿Qué habría ocurrido si la encuesta del ejercicio anterior hubiera sido hecha con 200
personas?
Sería muy rara la situación en la que tirando una moneda al aire 200 veces salieran más de 115
caras. Es posible que ocurra pero es menos del 5% probable. ¿Por qué?
Sabías que...
...en muchas fábricas utilizan los intervalos de confianza? En procesos de calibración de máqui-
nas o controles de calidad, se recogen periódicamente muestras para analizar si el intervalo de
confianza obtenido contiene o no los valores esperados de dicho proceso.
103
13- Mat. -Estadisticas.qxd 26/05/2009 04:25 p.m. PÆgina 104
MATELOCOS
Cálidos y fríos
La expresión “de sangre caliente” es vulgarmente utilizada para
referirse a las especies que mantienen su temperatura corporal
a un nivel aproximadamente constante, independientemente de
la temperatura ambiente. Análogamente, las especies cuya tem-
peratura corporal es básicamente la del medio son llamados “de
sangre fría”. ¿Cuáles de estas especies tienen sangre fría y cuá-
les caliente? Tortuga, elefante, perro, araña, paloma, víbora, la-
gartija.
Sangre caliente: elefante, perro, paloma. Sangre fría: tortuga, araña, víbora, lagartija.
2) 15,57%.
1) 139.500.
valo de confianza correspondiente al 95% da en el caso del problema es (50,6% , 64,4%), y por lo tanto 50% queda fuera.
Porque tirar una moneda 200 veces es como hacer una encuesta en la que sabemos que ambos candidatos (cara y ceca) sacarán el 50%. El inter-
2) 20,83%.
1) La ciudad 3.
104