Está en la página 1de 16

NOTAS DE

ESTADISTICA Y PROBABILIDAD

Temas:
Introduccin a la Estadstica
Frecuencias y distribuciones

Docente: Oscar F. Giovannini


(Estas notas estn ajustadas al desarrollo del temario de la materia del ao 2.016)

-1-

INDICE
Visin de la materia Estadstica y Probabilidad ................................................................. 3
ESTADISTICA ................................................................................................................... 4
Conceptos bsicos de Estadstica .................................................................................... 4
Definicin de Estadstica ............................................................................................ 4
Grandes divisiones de la Estadstica ........................................................................... 4
Datos estadsticos ........................................................................................................ 5
Categoras de los datos estadsticos ............................................................................ 5
Poblacin Universo - Muestra ................................................................................. 6
Calidad de los resultados de poblaciones y muestras ................................................. 8
Clasificacin, tabulacin y descripcin de los resultados ............................................... 8
Frecuencias y distribuciones ..................................................................................... 10
Frecuencia absoluta (ni) ............................................................................................ 12
Frecuencia relativa (hi).............................................................................................. 12
Ejemplo de aplicacin de frecuencias absolutas y relativas ..................................... 12
Concepto de frecuencias acumuladas (Ni, Hi) .......................................................... 13
Grficos de distribucin de frecuencias ........................................................................ 15

-2-

Visin de la materia Estadstica y Probabilidad


Esta materia contiene conceptos bsicos de estadstica, probabilidad e ndices.
Al abordar la estadstica veremos mtodos que nos permitirn analizar y
relacionar datos a fin de interpretar hechos de la realidad, en mltiples campos: social,
econmico, poltico, biolgico, psicolgico, fsico, etc.
La probabilidad servir para ubicarnos en el campo de la aproximacin de
resultados, ya que a partir del anlisis de una fraccin de la realidad intentaremos
proyectar esos resultados al todo.
Mediante el estudio de ndices podremos ver la evolucin de variables en el
tiempo (principalmente las econmicas).

-3-

ESTADISTICA
Conceptos bsicos de Estadstica
La denominacin Estadstica proviene de la palabra estado por cuanto desde la
antigedad los soberanos, gobernantes y polticos se interesaron en tener informacin
sobre el nmero de habitantes, edades, sexos, oficios, bienes, etc. que contaban en sus
dominios.
Los datos estadsticos obtenidos de muestras, observaciones, experimentos o de
cualquier conjunto de mediciones suelen ser tan numerosos que no tienen ninguna
utilidad salvo que sean condensados o resumidos a expresiones simples y organizadas. La
Estadstica se ocupa de ordenarlos, organizarlos, clasificarlos, sistematizarlos a fin que se
pueda obtener una visin resumida de los hechos en estudio.
Por eso en Estadstica veremos un conjunto de teoras y mtodos que han sido
desarrollados para tratar acerca de la recoleccin, el anlisis y la descripcin de datos que
nos permitan extraer conclusiones tiles.
Definicin de Estadstica
Estadstica es la rama de la matemtica que se ocupa de reunir, organizar y
analizar datos numricos con la finalidad de proporcionar informacin til para tomar
decisiones. La Estadstica tiene aplicacin en todas las disciplinas cientficas: biolgicas,
sociales, polticas, fsicas, ingeniera, etc.
Grandes divisiones de la Estadstica
La Estadstica se divide en dos grandes ramas:
Estadstica descriptiva Describe solamente las caractersticas principales de los
datos reunidos. Estudia los datos coleccionados sin hacer generalizaciones. Muestra los
hechos tal cuales son.
Inferencia estadstica Es el proceso de utilizar los datos resumidos de las
muestras y observaciones para obtener conclusiones extendidas a toda la poblacin de la
cual se extrajeron dichos datos. (Nota: la inferencia estadstica tambin es denominada
estadstica inferencial). Utiliza como importante herramienta el clculo de probabilidades.

-4-

Datos estadsticos
No cualquier informacin numrica puede ser considerada un dato estadstico.
Para cumplir con este requisito debe ser un conjunto (o conjuntos) que presente
relaciones significativas. .Los datos estadsticos deben ser nmeros que puedan ser
comparados, analizados e interpretados. Por lo tanto, un dato estadstico es cada uno de
los valores que se ha obtenido al realizar un estudio estadstico.
Ejemplo: El peso de una sola persona no servira; no permite comparacin. En
cambio, el peso de 100 personas de un cierto grupo puede ser, porque permite
comparacin.
Categoras de los datos estadsticos
Los datos estadsticos pueden ser agrupados en dos categoras:
a) Cuantitativos o tambin variables cuantitativas (simplificadamente: variables).
Son aquellos datos que arrojan respuestas numricas; pueden ser obtenidos ya sea
mediante conteo de unidades o por medicin de una magnitud. Ejemplos; pesos,
longitudes, volmenes, unidades. A su vez una variable cuantitativa puede ser discreta o
continua.
Discreta son respuestas numricas que surgen de un proceso de conteo unidad
por unidad. Ejemplo: el nmero bultos contenidos en un despacho. Continua son
respuestas numricas que surgen de un proceso de medicin. La variable puede asumir
cualquier valor numrico. Ejemplos de variables continuas son; temperatura, humedad,
peso, tiempo; etc.
b) Cualitativos, tambin llamados variables cualitativas o atributos. Son aquellos
que arrojan respuestas categricas y se describen por palabras. Ejemplos: nacionalidad,
estado civil, sexo, cumplir con una especificacin, nivel de agrado de un alimento, etc. A
menudo cada respuesta se la puede asociar a un valor numrico: posee el atributo, 1; no lo
posee, 0.

-5-

Poblacin Universo - Muestra


La fuente de la cual se obtienen los datos estadsticos se denomina poblacin o
universo. (Ntese que se arrastra el trmino poblacin haciendo referencia al concepto de
habitantes de un estado). Si vamos a intentar obtener informacin estadstica de los
alumnos de nuestro profesorado, entonces la poblacin o universo del problema sern
todos los alumnos de dicho profesorado.
Una muestra es la parte de la poblacin que se ha seleccionado para el anlisis. Es
una coleccin de informacin parcial (o incompleta) de esa poblacin. Por lo general se
trabaja con muestras debido a que suele ser menos costosa y ms expeditiva la
recoleccin de datos de solo una parte del total. Generalmente, no justifica
econmicamente el trabajar con poblaciones. Hay ocasiones en que es materialmente
imposible recolectar datos de toda una poblacin y por lo tanto solo queda la posibilidad
de hacer el anlisis con porciones o muestras. Toda vez que se trabaja con muestras, los
resultados del examen de stas se extienden (o proyectan) a toda la poblacin mediante
procesos de inferencia estadstica.

-6-

Es necesario tener presente que en la operacin de la toma de muestras se deben


seguir fielmente procedimientos adecuados que garanticen la representatividad de las
muestras respecto a la poblacin o universo. En otras palabras, las muestras
representativas son aquellas de las cuales se espera que guarden similitud con la
poblacin de la cual han sido extradas. Ms adelante en otros captulos de nuestro
estudio veremos las tcnicas de muestreo para obtener muestras representativas
El ejemplo que sigue nos pone en evidencia que los valores obtenidos de una
poblacin pueden diferir de los que se obtienen de una muestra. Sea una poblacin de 120
alumnos que han rendido un examen, cuyos resultados se encuentran resumidos en esta
tabla.
6

10

10

10

-7-

El promedio de las notas de la poblacin es 6,500. Ahora bien, si quisiramos tener una
idea de conjunto examinando una muestra aleatoria de nada ms que 12 elementos
(hemos elegido al azar los nmeros 5, 6, 8, 7, 4, 10, 9, 10, 4, 6, 5 y 8), habramos
obtenido un promedio igual a 6,833. Si hubiramos tomado otra muestra, probablemente
habramos obtenido un resultado diferente. Al trabajar con muestras tendremos una
aproximacin a la realidad; puesto que es evidente que siempre estar presente algn
margen de error. No obstante esto, la economa de esfuerzos que significa trabajar sobre
una muestra para obtener conclusiones acerca de una poblacin compensa el margen de
error, el cual por otra parte podr acotarse a un nivel previamente establecido.
Calidad de los resultados de poblaciones y muestras
Las conclusiones que se obtienen de una poblacin son exactas; en cambio las que
se obtienen de una muestra para generalizar a una poblacin son aproximadas. En
Estadstica y Probabilidad existen procedimientos que permiten valorar y acotar el grado
de aproximacin ajustndolo a cualquier necesidad operativa. Es obvio que cuanto mayor
sea la muestra en proporcin a la poblacin, ms ajustado ser el resultado que se
obtenga. Los estadsticos calculan ese nivel de aproximacin y por eso es que cuando se
dan a conocer encuestas polticas, dicen que el candidato A tiene una preferencia del 42%
con un error estadstico (o sea el nivel de aproximacin) de 3%.
Clasificacin, tabulacin y descripcin de los resultados
La clasificacin, tabulacin y descripcin de los resultados es la parte central de la
estadstica descriptiva. Se refiere a la organizacin y descripcin de los datos recopilados
a los fines de facilitar su interpretacin y anlisis.

-8-

Cuando los datos son pocos, bastar presentar la informacin mediante una
exposicin escrita (presentacin literal).Siendo numerosos los datos, se los deber
presentar, ordenar y resumir sistemticamente, utilizndose al efecto tablas, grficos y
diagramas.
El ordenamiento, clasificacin y resumen de la informacin es lo que nos permite
extraer conclusiones tiles. Frente a un conjunto numeroso de datos, y para evitar que tal
numerosidad impida la visin de conjunto es que se han ideado medidas de resumen
descriptivas, es decir valores resumidos representativos del total de datos. Ejemplos de
tales medidas representativas son los promedios y las desviaciones de un conjunto de
datos. Si se nos permitiera utilizar una analoga casera, podramos decir que estos valores
representativos son un concentrado de informacin obtenido a partir del conjunto
inicial de datos.
Las medidas o descripciones resumidas de conjunto que se usan son los
estadgrafos (para describir las muestras) y los parmetros (para describir las
poblaciones).

Se tiene entonces:

-9-

En el ejemplo de los 120 alumnos que rindieron examen: el promedio 6,500 es un


parmetro (proviene de una poblacin). El promedio 6,833 es un estadgrafo porque
proviene de una muestra.
Frecuencias y distribuciones
Cuando son numerosos los datos estadsticos es necesario agrupar valores
ordenndolos y clasificndolos para facilitar el anlisis. Este ordenamiento puede ser
ascendente o descendente. Cuando en el agrupamiento se especifica el nmero de veces
que est repetido un valor se est aplicando el concepto de frecuencia absoluta (ni). Dicho
agrupamiento pasa a ser una distribucin de frecuencias. Tambin se dice que es una
serie de valores agrupados.
Mediante la utilizacin de una distribucin de frecuencias la informacin de todo
el conjunto puede ser presentada en forma breve y compacta.

Al construir las distribuciones de frecuencias


los datos se condensan y simplifican. Esto
facilita la interpretacin de los datos

La base de cualquier estudio estadstico es la distribucin de frecuencias.


Veamos cmo se construye una distribucin de frecuencias. Inicialmente los datos
estn todos desordenados, como lo comprobamos en la figura siguiente.
- 10 -

Si ahora simplemente ordenamos los valores en escala ascendente y apilamos los


repetidos obtenemos una distribucin de frecuencias.

Ordenados y clasificados los datos de esta manera alcanzamos a ver las


caractersticas del conjunto.
Tomamos de nuevo el ejemplo de los 120 alumnos y ordenando obtenemos la
siguiente informacin:

- 11 -

Variable

Veces que se repite

La frecuencia ni es:

23

23

16

16

22

22

15

15

28

28

13

13

10

(Nota)

Frecuencia absoluta (ni)


La frecuencia absoluta nos indica la cantidad de veces que se repite el valor de la
variable dentro del total de datos recolectado. Adoptamos la notacin ni. Observamos
que la suma de todas las frecuencias absolutas es igual al nmero de datos recolectados.
La frecuencia absoluta no brinda por s sola ninguna idea de magnitud relativa o
de prevalencia de datos dentro del conjunto de observaciones. Para tener valores que nos
expresen magnitudes relativas es necesario desarrollar el concepto de frecuencia relativa.
Frecuencia relativa (hi)
Frecuencia relativa (hi) es el cociente entre la frecuencia absoluta de un dato y el
nmero total de observaciones n. Su smbolo es hi, luego: hi = ni/n En una serie de datos,
la suma de todas las frecuencias relativas es 1.
El concepto de frecuencia relativa nos informa cuantitativamente que proporcin
del total le corresponde a cada valor de la variable. Opcionalmente se las puede expresar
con valores porcentuales, multiplicando cada frecuencia relativa por el valor 100.
Ejemplo de aplicacin de frecuencias absolutas y relativas
Sea un grupo de n = 25 alumnos cuyas notas de un parcial fueron:
10

10

10

10

- 12 -

En primer lugar ordenamos en forma ascendente los valores:


4

10

10

10

10

Luego podremos construir la tabla de distribucin de frecuencias absolutas y


relativas.
Nota

ni

hi

4
5
6
7
8
9
10

2
4
4
6
3
2
4

2/25=
4/25=
4/25=
6/25=
3/25=
2/25=
4/25=

hi en %
0,080
0,160
0,160
0,240
0,120
0,080
0,160

08,00
16,00
16,00
24,00
12,00
08,00
16,00

Del anlisis de la tabla as construida podemos extraer algunas conclusiones, tales


como:
El rango de las notas obtenidas es 4 10

La nota 6 es la que ms veces se repiti, por lo tanto tiene la mayor


frecuencia

La nota 6 fue obtenida por el 24 por ciento de los alumnos.

Concepto de frecuencias acumuladas (Ni, Hi)


En el concepto de frecuencias acumuladas se distinguen:
Frecuencia acumulada absoluta (Ni)
Frecuencia acumulada relativa (Hi)
Una frecuencia acumulada absoluta se define como la suma de la frecuencia
absoluta de ese dato ms las frecuencias absolutas de todos los datos inferiores al que se
considera. Ejemplo (ver tabla de frecuencias en esta misma pgina), la frecuencia
acumulada absoluta para la nota 6 es la suma de las frecuencias absolutas de 6,5 y 4; el
resultado es 10.

- 13 -

El concepto de frecuencia acumulada absoluta nos permite responder a esta


pregunta: cuntos alumnos han obtenido nota 6 o inferior? La respuesta es la frecuencia
acumulada absoluta de la nota 6, o sea 10 alumnos.
La frecuencia acumulada relativa es un concepto anlogo al de la acumulada
absoluta; la lgica de su formacin es la misma que para aquella.
Si nos preguntamos qu fraccin de alumnos obtuvo nota 6 o inferior, la respuesta
la tenemos leyendo la frecuencia acumulada relativa del dato 6: o sea 0,400.
A tener en cuenta: el concepto de frecuencias acumuladas no puede aplicarse a
variables cualitativas, ya que estas no tienen un orden numrico predeterminado.
Tabla de distribucin de frecuencias;
muestra como se reparten o
distribuyen las frecuencias segn la
serie de datos.

Nota

ni

Ni

hi

4
5
6
7
8
9
10

2
4
4
6
3
2
4

2
6
10
16
19
21
25

2/25=
4/25=
4/25=
6/25=
3/25=
2/25=
4/25=

0,080
0,160
0,160
0,240
0,120
0,080
0,160

Hi

hi en %

0,080
0,240
0,400
0,640
0.760
0,084
1,000

08,00
16,00
16,00
24,00
12,00
08,00
16,00

Frec. Acumulada
Absoluta (hi)

Frec. Acumulada
Relativa (Hi)

- 14 -

Grficos de distribucin de frecuencias


La representacin grfica tiene la ventaja de transmitir la informacin contenida
en una tabla de frecuencias de un modo casi instantneo, expresando mucho con poco.
Confeccionamos una representacin grfica de distribucin de frecuencias
llevando sobre el eje horizontal la variable considerada (notas de un examen, estatura de
personas, rinde de un cultivo, tipo de infracciones de trnsito, etc.). De hecho que la
variable a considerar puede ser cuantitativa o cualitativa. Sobre el eje vertical ponemos la
cantidad de veces (frecuencia) que se repite cada dato.
Los grficos de distribucin de frecuencias se podrn confeccionar con barras o
columnas, con lneas quebradas, con sectores o tortas; dependiendo del tipo de
informacin que se quiera transmitir. A continuacin veremos algunos de estos grficos;
ms adelante en nuestro curso desarrollaremos un capitulo completo del tema grficos
estadsticos.

- 15 -

Estos grficos son versiones de una misma tabla de frecuencias. La eleccin del
tipo de grfico responder al criterio del analista, que buscar que la informacin sea bien
entendida e impactante. Los grficos siempre se acompaan de ttulos breves y
representativos de los hechos
Los grficos de frecuencia se pueden construir con todo tipo de variables:
cuantitativas discretas, cuantitativas continuas y cualitativas. El ejemplo de los candidatos
corresponde a variables cualitativas, .con las cuales solo se pueden determinar
frecuencias absolutas y relativas (ni, hi).

- 16 -

También podría gustarte