Está en la página 1de 10

ESTADSTICA, rama de las matemticas que se ocupa de reunir, organizar y analizar datos

numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma


de decisiones.

Historia
Desde los comienzos de la civilizacin han existido formas sencillas de estadsticas, pues ya se
utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de
cuevas para contar el nmero de personas, animales o ciertas cosas. Hacia el ao 3000 A.C. los
babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin
agrcola y de los gneros vendidos o cambiados mediante trueque. Los egipcios anallizaban los datos de
la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XXXI a.C. Los libros
bblicos de Nmerosy Crnicasincluyen,en algunas partes, trabajos de estadstica. El primero contiene
dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus
judas. En China existan registros numricos similares con anterioridad al ao 2000 A.C. Los griegos
clsicos realizaban censos cuya informacin se utilizaba hacia el ao 594 A.C. para cobrar impuestos.
El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin,
superficie y renta de todos los territorios bajo su control. Durante la edad media slo se realizaron
algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron
hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente.
Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg un
censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book.
El registro de nacimientos y defunciones comenz en Inglaterra a principios del siglo XVI, y en 1662
apareci el primer estudio estadstico notable de poblacin, titulado Observations on the London Bills of
Mortality (Comentarios sobre las partidas de defuncin en Londres).
Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691,
fue utilizado por el astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad. En
el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los fenmenos de las
ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la informacin a
valores numricos para evitar la ambigedad de las descricpciones verbales.
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los
valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como
herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo
en reunir y tabular los datos, sino sobre todo el proceso de interpretacin de esa informacin. El
desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica.
Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas
distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos.
La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el
tipo y la cantidad de datos necesarios en un determinado estudio estadstico.

Mtodos Estadsticos
La materia prima de la estadstica consiste en conjuntos de nmeros obtenidos al contar o medir cosas.
Al recopilar datos estadsticos se ha de tener especial cuidado para garantizar que la informacin sea
completa y correcta.
El primer problema para los estadsticos reside en determinar qu informacin y cunta se ha de reunir.
En realidad, la dificultad al compilar un censo est en obtener el nmero de habitantes de forma
completa y exacta; de la misma manera que un fsico que quiere contar el nmero de colisiones por
segundo entre las molculas de un gas debe empezar determinando con precisin la naturaleza de los
objetos a contar. Los estadsticos se enfrentan a un complejo problema cuando, por ejemplo, toman una
muestra para un sondeo de opinin o una muestra electoral. El seleccionar una muestra capaz de
representar con exactitud las preferencias del total de la poblacin no es tarea fcil.
Para establecer una ley fsica, biolgica o social, el estadstico debe comenzar con un conjunto de datos
y modificarlo basndose en la experiencia. Por ejemplo, en los primeros estudios sobre crecimiento de la
poblacin los cambios en el nmero de nacimientos y el nmero de fallecimientos en un determinado
lapso.
Los expertos en estudios de poblacin comprobaron que la taza de crecimiento depende slo del nmero
de nacimientos, sin que el nmero de defunciones tenga importancia. Por tanto, el futuro crecimiento de
la poblacin se empez a calcular basndose en el nmero anual de nacimientos por cada mil habitantes.
Sin embargo, pronto se dieron cuenta de que las predicciones obtenidas utilizando ste mtodo no
utilizaban mtodos correctos.
Los estadsticos comprobaron que hay otros factores que limitan el crecimiento de la poblacin. Dado
que el nmero de posibles nacimientos depende del nmero de mujeres, y no del total de la poblacin, y
dado que las mujeres slo tienen hijos durante parte de su vida, el dato ms importante que se ha de
utilizar para predecir la poblacin es el nmero de nios nacidos vivos por cada mil mujeres en edad de
procrear. El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de
mujeres sin descendencia.
Por tanto, la diferencia entre fallecimientos y nacimientos slo es til para indicar el crecimiento de
poblacin en un determinado periodo de tiempo del pasado, el nmero de nacimientos por cada mil
habitantes slo expresa la taza de crecimiento en el mismo perodo, y slo el nmero de nacimientos por
cada mil mujeres en edad de procrear sirve para predecir el nmero de habitantes en el futuro.
La estadstica es una Ciencia que tiene como finalidad facilitar la solucin de problemas en los cuales
necesitamos conocer algunas caracteristicas sobre el comportamiento de algun suceso o evento.
Caractersticas que nos permiten conocer o mejorar el conocimiento de ese suceso. Adems nos
permiten inferir el comportamiento de suscesos iguales o similares sin que estos ocurran.
Esto nos da la posibilidad de tomar decisiones acertadas y a tiempo, asi como realizar proyecciones del
comportamiento de algn suceso. Esto es debido a que solo realizamos los clculos y el anlisis con los
datos obtenidos de una muestra de la poblacin y no con toda la poblacin. Pues hacerlo con todos los
datos o poblacin en algunos casos seria muy dificil y en otros casos casi imposible o imposible.
Dificil porque podra tratarse de una situacin donde el nmero de datos es muy grande, como por
ejemplo si quisieramos saber el promedio de goles por juego de un equipo de futbol, a pesar de que se

tienen los registros de todos los resultados de sus juegos, son muchisimos los juegos y llevaria tiempo
revisar todos los archivos para obtener esos datos. O bien saber que porcentaje de personas tiene
vehiculos en una determinada ciudad.
Por otra parte podra ser casi imposible o imposible en una situacin, como por ejemplo, donde
necesitamos conocer el promedio de edad de los habitantes en todo el mundo (son muchas personas) y
teniendo en cuenta que para ello es necesario aplicar encuestas, entrevistas; o extraer datos de archivos
y/o de observaciones de campo. Es posible que sea muy dificil y complicado o que simplemente no se
pueda conseguir los datos de todas las personas. O bien saber que porcentaje de vehiculos azules hay en
el mundo.
Analizando esto podemos ver que tambin simplemente puede ser muy sencillo, como por ejemplo
determinar el promedio de edad de los gobernadores de los Estados Unidos, pues son pocos y conocidos
es sencillo obtener los datos.
Esto nos lleva a la conclusin de que la estadstica tiene aplicacin en cualquier campo, sin importar
que tan sencillo o complicado sea. Cuanto ms complicado sea, ms ayuda nos presta para resolver la
situacin.
Mostraremos las ideas expuestas con un caso practico de la vida real, el cual se presenta con muchisima
frecuencia:
Un estudiante que toma un curso en la escuela, siempre le interesa saber con anticipacin como ser su
resultado al finalizar el curso. Que oportunidad tiene de aprobar el curso y con que calificacin, lo cual
no es posible determinar con certeza hasta finalizar el curso.
Pero con el uso de la estadstica puede conocer de forma aproximada esta informacin. El puede tomar
las calificaciones (que son los datos) de todos los cursos anteriores y hacer un promedio (que seria la
media aritmtica). Asi tendria una idea de cuales son en general los resultados que se obtienen en ese
curso. Tambien puede obtener un porcentaje de cuntos estudiantes obtienen una determinada
calificacin.
Lo que luego le permitiria de acuerdo al nmero total de estudiantes en ese curso determinar cual sera
su probabilidad de obtener una determinada calificacin. Tambin puede obtener un porcentaje de las
personas que aprueban o no el curso y as conocer su oprtunidad, de igual forma de acuerdo al total de
lumnos del curso obtener su probabilidad de aprobar o no el curso.
Pero este trabajo que necesita hacer con los datos de todas las calificaciones anteriores de ese curso,
llevara muchisimo tiempo y trabajo. Es muy posible que cuando tenga los resultados ya no le sirvan,
pues ha terminado el curso y ya conoce con certeza sus calificaciones. Es all donde tiene un papel
importante la estadstica.
De todas las calificaciones anteriores, que seria la poblacin, solo se toman algunas, esto seria una
muestra. Para seleccionar la muestra existen varias maneras de hacerlo o mtodos. Como por ejemplo:
tomar solo las del ultimo curso. Tomar cinco calificaciones de cada curso. Tomar cinco calificaciones de
los ltimos diez cursos, dejando a la suerte cuales serian las cinco calificaciones a tomar. Esto sera
seleccin aleatoria, tambin se podra tomar algunos cursos al azar o aleatoriamente y de ellos algunas
calificaciones tambin aleatoriamente.
Un aspecto importante es el tamao de la muestra. Este est relacionado directamente con la precisin
de los resultados que se obtendrn. Cuanto mayor sea el tamao de la muestra mayor presicin tendrn
los resultados, pues el tamao de la muestra estar mas cerca del tamao de la poblacin y cuanto mas

pequea sea el tamao de la muestra, estar mas lejos del tamao de la poblacin por lo que los
resultados seran menos precisos. Por tal motivo existen mtodos para poder establecer o calcular de
acuerdo a la situacin cul es el tamao de la muestra adecuado. Esto no quiere decir que no pueda
selecionarse otro tamao de la muestra, solo es mas recomendable.
Otro aspecto importante podra ser dividir el grupo de estudiantes en cuatro categoras: A, B, C y D.
Pues supongamos se asignan tres tipos de becas a los estudiantes, de la siguiente forma. Al 25% que
saque mayores notas (categora A) se le da una beca por 5 aos. Al 25% que le sigue en calificaciones
(categora B) se le otorga una beca por 3 aos. Al 25% siguiente (categora C) una beca por 1 ao y al
25% restante (categora D) no se le otorga ninguna beca.
Esto quiere decir por ejemplo que en una clase de 20 estudiantes que estn ordenados por calificaciones
en orden descendente: del 1 al 5 se becan por 5 aos, del 6 al 10 se becan por 3 aos, del 11 al 15 se
becan por 1 ao, y del 16 al 20 no reciben beca.
Si quisieramos conocer que oportunidad tenemos de obtener una beca. Podramos tomar un grupo de
notas o datos, de forma aleatoria entre todos las notas de los cursos dictados anteriormente o
poblacin. Esto representara una muestra. Luego determinamos cuales son las calificaciones que
establecen a que categora pertenece el estudiante.
Esto es equivalente a calcular los cuartiles: primer cuartil, segundo cuartil y tercer cuartil. Que no
son otra cosa que los valores correpondientes a la escala de calificaciones, en las cuales se producen los
cambios para cada categora.
Es decir el tercer cuartil representa la calificacin a partir de la cul estn ubicados el 25% de los
estudiantes de categora A, el segundo cuartil (igual a la mediana) es igual a la calificacin en la cual
hay 50 % de los estudiantes por encima y 50% por debajo, los que estn entre el segundo y el tercer
cuartil son el 25% de estudiantes categora B. Y el primer cuartil es representa la calificacin por
debajo de la cual hay 25% de estudiantes categora D, adems los que estn entre el primer cuartil y el
segundo son el 25% categora C.
Esto puede de una forma ms sencilla permitirle tambin tener una buena idea de que oportunidad tiene
de obtener una determinada beca dentro de este curso.
Pero adems de esto tambin es importante conocer la regularidad o normalidad de las calificaciones en
los cursos anteriores, esto quiere decir saber si semantiene o no el mismo comportamiento en todos los
cursos. Lo cual es importante para saber si los resultados obtenidos del anlisis tienen validez o no. Esto
es posible hacerlo calculando la Correlacin entre las notas de los cursos.
Para ilustrar con ms detalles la idea presentada, vamos a resolver un ejemplo con un caso similar. As
veremos como aplicar cada una de las ideas mencionadas anteriormente, adems veremos como se
hacen los respectivos clculos.
Tenemos un curso de Estadsticas que se ha dictado 10 veces anteriormente, las calificaciones obtenidas
por los estudiantes de esos cursos se muestran en la tabla # 1.

Tabla#1.

Fuente: Valdes Fernando (1998).


Lo primero que se tiene que hacer es organizar los datos mediante una Tabla de distribucin de
frecuencias(tabla # 2). Los datos recogidos deben ser organizados, tabulados y presentados para que su
anlisis e interpretacin sean rpidos y tiles.
Por ejemplo, para estudiar e interpretar la distribucin de las notas o calificaciones de un examen en una
clase con 28 alumnos, primero se ordenan las notas en orden creciente: 3,0; 3,5; 5,2; 6,1; 6,5; 6,8; 7,0;
7,2; 7,2; 7,3; 7,5; 7,5; 7,6; 7,7; 7,8; 7,8; 8,0; 8,3; 8,5; 8,8; 9,0; 9,1; 9,6; 9,1; 9,6; 9,7; 10 y 10. Esta
secuencia muestra, a primera vista, que la mxima nota es un diez, y la mnima es un 3; el rango,
diferencia entre la mxima y la mnima es 7.
Grfico # 1.

En un diagrama de frecuencia acumulada, como en grfico # 1, las notas aparecen en el eje horizontal y
el nmero de alumnos en el eje vertical izquierdo, con el correspondiente porcentaje a la derecha. Cada
uno representa el nmero total de estudiantes que han obtenido una calificacin menor o igual que el
valor dado. Por ejemplo, el punto A corresponde a 7,4, y segn el eje vertical, hay diez alumnos, o un
38%, con calificaciones menores o iguales que 7,4.
Para analizar las calificacines obtenidas por 10 cursos de 17 alumnos cada uno tenemos un total de 170
calificaciones, hay que tener en cuenta que la cantidad de datos es demasiado grande para representarlos

como en el grfico # 1. El estadstico tiene que separar los datos en grupos elegidos previamente
denominados intrvalos.
Por ejemplo, se pueden utilizar 10 intrvalos para tabular las 170 calificaciones, que se muestran en las
columnas de la tabla # 1 de distribucin de datos; el nmero de calificaciones por cada intrvalo,
llamado frecuencia del intrvalo, se muestra en la tabla # 2. Los nmeros que definen el rango de un
intrvalo se denominan lmites. Es conveniente elegir los lmites de manera que los rangos de todos los
intrvalos sean iguales y que los puntos medios sean nmeros sencillos.
Una calificacin de 87 se encuentra en el intrvalo entre 81 y 90; una calificacin igual a un lmite de
intrvalo, como 90, se puede asignar a cualquiera de los dos intrvalos, aunque se debe hacer de la
misma manera a lo largo de toda la muestra. La frecuencia relativa y La frecuencia acumulada, son
indispensables en la contruccin de la tabla de frecuencias y para facilitar el clculo.. As, el nmero de
estudiantes con calificaciones menores o iguales a 30 se calcula sumando las frecuencias de la columna
(d) de los tres primeros intrvalos, dando 6.
Tabla # 2.

Fuente: Valdes Fernando (1998).


Un histograma o diagrama de barras (como en el grfico 2), o como un polgono de frecuencias (como
en el grfico 3), nos permiten un anlisis ms rpido de los datos.
De la tabla # 2, o de los grficos #1 y #2 podemos observar por ejemplo, que si el curso se aprueba con
50 ptos. solo hay 21 estudiantes con notas por debajo de 50, por lo cual hay 149 estudiante con
calificaciones sobre 50 puntos.
Por lo tanto 149/170 = 0.88 es la probabilidad que tengo de aprobar el curso y 0.12 es la probabilidad
que tengo de reprobar el curso. Por otra parte si se aprobara el curso con 60 ptos. seran 55 alumnos por
debajo de 60 y 115 alumnos sobre 60 ptos. lo que nos dara una probabilidad de aprobar de 115/170 =
0.68 o 68% de posibilidades de aprobar el curso y una probabilidad de reprobar el curso de 0.32 o un
32% de posibilidades de reprobar el curso.

Grfico # 2.

Grfico # 3.

Luego calculamos algunas medidas de tendencia central y algunas medidas de dispersin:


La media aritmtica de la siguiente forma: se suman todas las notas de los diez cursos y obtenemos
11350, luego dividimos entre el nmero de notas que es 170. y obtenemos una media de 66.76. Lo que
quiere decir que la nota promedio de todos los cursos de estadstica es 67 puntos.
_
X = 11350 / 170 = 66.76
La Mediana de la siguiente forma:

Mediana=
Donde:
Li= frontera inferior de la clase de la mediana.
N= nmero de datos (frecuencia total).

= suma de frecuencia de las clases inferiores a la de la mediana


fmediana= frecuencia de la clase de la mediana
c= anchura del intrvalo de la clase de la mediana.

Esto nos quiere decir que hay 50% de las notas sobre 66.4 y el otro 50% esta por debajo. En otras
palabras de los 170 estudiantes, 85 han obtenido una calificacin por encima de 66.4 puntos.
El Primer Cuartil:se calcula de igual forma que la mediana, solo que el nmero de datos se divide entre
4, solo se toman la cuarta parte de los datos o el 25% de los datos y la frontera inferior correponde a la
del cuartil.

Esto nos dice que hay un 25% de las notas por debajo de 56.3 puntos, o bien aproximadamente 42
estudiantes de los 170 han sacado una calificacin inferior a 56.3 puntos.
El Tercer Cuartil:se calcula de igual forma que la mediana, solo que el nmero de datos multiplica por
tres y se divide entre 4, solo se toman las tres cuartas partes de los datos o el 75% de los datos.

Esto nos dice que hay un 25% de las notas sobre 76.9 puntos, o bien aproximadamente 42 estudiantes de
los 170 han sacado una calificacin sobre 76.9 puntos.
La Moda de la forma siguiente:
La moda es el valor que mas se repite, en este caso tenemos que hay tres modas: las notas 58, 63 y 68 se
repiten siete veces cada una.

La Desviacin Tpica de la forma siguiente:

Si restamos y sumamos la desviacin tpica a la media tenemos el rango de notas en el que se encuentra
el 95% de los estudiantes.
_
X - = 66.7 15.78 = 50.92
_
X + = 66.7 + 15.78 = 82.48
Entonces tenemos que el 95% de los estudiantes, aproximadamente 162 estudiantes, tienen notas entre
51 y 83 puntos. Si la desviacin tpica es pequea, los datos estn agrupados cerca de la media; si es
grande, estn muy dispersos.
Por otro lado tenemos con respecto a las becas, que para obtener una beca tipo A por 5 aos en promedio
hay que obtener mas de 77 puntos que es el valor del Tercer Cuartil, para obtener una beca tipo B por
tres aos, hay que obtener una nota promedio sobre 67 puntos que es la Media Aritmtica o Segundo
Cuartil, para obtener una beca tipo C por un ao, hay que obtener una nota promedio sobre 56 puntos,
que es el valor del Primer Cuartil, y si se obtiene una calificacin inferior a 56 puntos no se obtiene
ninguna beca.
Supongamos ahora que nos inscribimos en un curso de estadstica que tiene 20 estudiantes y queremos
saber que oportunidad de obtener una beca de cualquier tipo tenemos. Entonces debemos calcular la
probabilidad de estar en la cuarta parte del grupo de 20 estudiantes.
La Probabilidad esta definida como:

Casos favorables: son el 75% de 20 estudiantes, es decir 15 estudiantes.


Casos posibles: es el 100% de los estudiantes, es decir 20 estudiantes.

Probabilidad de Obtener una beca de cualquier tipo:

De forma similar obtenemos:

Pero no siempre es fcil manipular o poder obtener todos los datos, entonces es necesario tomar
muestras, vamos a tomar dos muestras por diferentes mtodos, para mostrar como puede hacerse,
adems de mostrar que sencillo seran los clculos con una muestra.
Muestra A: para la muestra a podemos colocar diez bolitas numeradas del 1 al 10 en una bolsa, luego
sin observar sacar una bolita por ejemplo la #7, esto sera que hemos tomado las notas del curso #7 para
hacer los clculos. Segn la tabla #7 tenemos:
Muestra: 84,30,63,58,80,72,56,65,77,78,65,68,77,56,78,67 y 76.
Muestra B: para la muestra A podemos colocar 17 bolitas numeradas del 1 al 17 en una bolsa, luego sin
observar sacar dos bolitas que seran las dos notas que tomara del curso 1, por ejemplo la #5 y la #13,
que serian las notas 73 y 59 de la tabla #1. esto sera que hemos tomado las notas del curso #7 para
hacer los clculos. Y repetir ste proceso hasta completar dos notas de cada curso, con lo que tendramos
20 notas que formaran la Muestra B.
Luego si calculamos la media aritmtica y la desviacin tpica para la muestra A, tenemos:

De lo cual podemos observar como la media calculada con las notas de todos los estudiantes o
Poblacin que es 66.7 ptos. est muy cerca de la media calculada con la muestra que es 67.7. De igual
forma observamos cmo los valores de las desviaciones tpicas son cercanos. Siempre que la muestra
sea tomada de una forma adecuada y de un tamao representativo de la poblacin los resultados
obtenidos sern muy parecidos, como los obtenidos aqui.
Si la muestra es pequea, no es necesario agrupar los datos en una tabla de frecuencia, por lo tanto.
De esta forma esperamos haber contrubuido al conocimiento y uso de la Estadstica, para aquellas
personas que no tenan conocimientos sobre esta ciencia tannecesaria y usada con mayor frecuencia cada
da.

También podría gustarte