Está en la página 1de 10

1

U.T.N.-F.R.R.- Año 2005-

PROBABILIDADES Y
ESTADISTICA
Profesor Titular: Eº Mario J. GARBER

INTRODUCCION TEORICA
RECOPILACION DE DATOS
Unidad 1 - DEFINICIONES BASICAS - SELECCIÓN MUESTRAL

1 - DEFINICION DE ESTADISTICA:
La Estadística es un método científico destinado a recopilar, ordenar, presentar y
resumir datos, para posteriormente analizarlos, extraer conclusiones válidas y tomar, sobre
esa base, decisiones razonables.
Las primeras cuatro acciones indicadas en la anterior definición conforman la
“Estadística Descriptiva”, mientras que las últimas tres, la “Inferencia Estadística”.
Algunas de las aplicaciones actuales más conocidas de la Estadística son:
 en el campo político: la predicción de los resultados electorales
 en el campo del marketing: seleccionar características deseables de los productos y
diseñar estrategias de venta
 en el campo de la medicina: determinar la eficacia de los medicamentos
 en el campo contable: determinar el porcentaje de errores en las registraciones
 en el campo de la zoología: estimar el tamaño real de la población de una especie

2 - POBLACION Y MUESTRA:
Población es un conjunto de elementos, finito o infinito, que responden a una
determinada característica. Luego, el concepto de población en Estadística va más allá de la
clásica definición que se da en la Demografía, esto es, la población de seres humanos
exclusivamente. En la actividad estadística una población puede estar constituida por elementos
de cualquier tipo, no solamente por seres humanos. Por ejemplo, se puede hablar de la población
de viviendas de un barrio; de la población de comprobantes contables de una empresa; de la
población de alumnos de una Facultad, etc.
Muestra es un subconjunto de elementos seleccionado en una población, o sea de tamaño
menor que ésta, que se utiliza para realizar estudios o investigaciones referidas a toda la
población pero en menor tiempo y por supuesto a un menor costo que si se la estudiara en
forma exhaustiva, pero al mismo tiempo sin la exactitud que sólo se puede conseguir en
investigaciones del cien por cien.

------------------------
Probabilidades y Estadística - Año 2005
2

Por eso, la opción entre población y muestra puede ser presentada como la opción entre
un relevamiento caro y un relevamiento económico, o bien entre exactitud y precisión. La
muestra no garantiza, pues, exactitud pero puede asegurar investigaciones estadística rápidas y
económicas que suelen ir acompañadas con la información del grado de precisión con el que se
ha trabajado.

3 – VARIABLES:
Una variable es una magnitud que puede tomar diferentes valores entre dos
previamente determinados, que limitan lo que constituye el campo de variación de la variable.
Ejemplos: la altura de los integrantes de un equipo de básquetbol; la cantidad de alumnos en las
clases de una materia; los ingresos o los gastos de un conjunto de personas.
Las variables pueden ser cuantitativas o cualitativas. Las variables cuantitativas se
expresan mediante cantidades (número, distancia, altura, etc.). Las cualitativas indican atributos
o calidades (colores, sexos, razas), a pesar que se pueden utilizar diferentes cantidades para
indicar cualidades, pero sin que las cantidades utilizadas permitan realizar comparaciones del
tipo mayor – menor.
Las variables cuantitativas pueden ser discretas o continuas. Las variables continuas
son aquellas que pueden tomar cualquier valor en el campo de su variación. Ejemplos: los
ingresos (en dinero); las alturas, las distancias.
Las variables discretas sólo pueden tomar algunos valores en su campo de variación.
Ejemplos: el número de alumnos; la cantidad de hijos; el resultado de un examen calificado
como aprobó-no aprobó.
En términos generales puede decirse que las variables continuas se relacionan con la
operación de medir, en tanto las variables discretas se relacionan con la operación de
contar.
Las variables aleatorias expresan el resultado de un experimento, también denominado
aleatorio, que recibe ese nombre porque se realiza en condiciones de incertidumbre, y que se
presenta con una cierta probabilidad que puede llegar a conocerse. Ejemplos: el resultado al
arrojar un dado; el sexo de un niño en el momento de la concepción.
Las variables no aleatorias se denominan determinísticas.
El siguiente gráfico ilustra sobre la clasificación de las variables:
(colaboración de la Profesora María de los Arcos Martínez)

------------------------
Probabilidades y Estadística - Año 2005
3

ESTADISTICA DESCRIPTIVA
TRATAMIENTO DE LOS DATOS ESTADISTICOS
Unidad 2 – DISTRIBUCION DE FRECUENCIAS
Profesor Titular: Eº Mario J. Garber

1 - DATOS NO ORDENADOS: Son aquellos datos recolectados a partir de una


muestra que no han sido arreglados de acuerdo con algún criterio convencional, por lo que se
presentan en el orden en que han sido obtenidos.

2 - ORDENAMIENTO: Es un arreglo convencional de los datos obtenidos en


una investigación muestral, colocándolos por ejemplo, de menor a mayor, de mayor a menor, o
de cualquier otro modo.
A medida que se avanza en el trabajo estadístico pasando de una etapa a la otra, en cada
paso que se da, el método debe permitir encontrar las soluciones para cada problema que se
presente sin retroceder a la etapa anterior, tomando los datos en su nueva forma de presentación.
Con los datos ordenados puede obtenerse el Rango, que se convierte en la primera
medida estadística que puede ser calculada.

3 - RANGO: Es la primera medida estadística que puede calcularse, y se


obtiene haciendo la diferencia entre los valores extremos del conjunto de datos ordenados.
Sólo puede calcularse, precisamente, con los datos previamente ordenados.
R  xM  xm donde xM es el valor máximo del conjunto y
xm es el valor mínimo del conjunto.

4 - CUADRO DE LA DISTRIBUCION DE FRECUENCIAS: El cuadro de la


distribución de frecuencias es una forma de presentación de los datos que facilita su tratamiento
conjunto y, por consiguiente, permite una comprensión diferente sobre ellos. Los datos pierden
la individualidad (se deja de conocer el valor particular de cada uno) porque se presentan en
clases o categorías que agrupan a un conjunto más o menos amplio de valores. Estos grupos se
denomina intervalos de clases. Los siguientes cuadros constituyen ejemplos de Distribuciones
de Frecuencias. Sus datos originales (que no se encuentran a la vista) fueron obtenidos luego de
consultar sobre diferentes tipos de variables.
A continuación de los cuadros se definen sus elementos componentes.

a) Para ISI: el ingreso mensual de un grupo de personas.


Frecuen. Verdadero Punto Frecuen. Frecuen. Frecuencia
Ingreso absoluta Límite Medio Acum. Relativa Relativa
($) fi VL xi Creciente hi Acumulada
Fi Hi
0 – 999,99 5 0 500 5 5% 5%
1000 – 1999,99 18 1000 1500 23 18% 23%
2000 – 2999,99 42 2000 2500 65 42% 65%
3000 – 3999,99 27 3000 3500 92 27% 92%
4000 – 4999,99 8 4000 4500 100 8% 100%
100 100%
------------------------
Probabilidades y Estadística - Año 2005
4

b) Para IQ-ISI: el nivel de la acidez del vino depositado en toneles en una bodega.
Frecuen. Verdadero Punto Frecuen. Frecuen. Frecuencia
Acidez absoluta Límite Medio Acum. Relativa Relativa
(pH) fi VL xi Creciente hi Acumulada
Fi Hi
1,00 – 1,49 5 1,00 1,25 5 5% 5%
1,50 – 1,99 18 1,50 1,75 23 18% 23%
2,00 – 2,49 42 2,00 2,25 65 42% 65%
2,50 – 2,99 27 2,50 2,75 92 27% 92%
3,00 – 3,49 8 3,00 3,25 100 8% 100%
100 100%

c) Para IEM: el consumo de energía eléctrica en las viviendas de un barrio:


Frecuen. Verda- Punto Frecuencia Frecuen. Frecuencia
Consumo absoluta dero Medio Acumulada Relativa Relativa
(KWh) fi Límite xi Fi hi Acumulada
VL Hi
5,00 – 9,99 5 5,00 7,50 5 5% 5%
10,00 – 14,99 18 10,00 12,50 23 18% 23%
15,00 – 19,99 42 15,00 17,50 65 42% 65%
20,00 – 24,99 27 20,00 22,50 92 27% 92%
25,00 – 29,99 8 25,00 27,50 100 8% 100%
100 100%

Reglas para la construcción del cuadro de la distribución de frecuencias - Definición de sus


elementos:
a) Intervalo de clase: Es un intervalo entre dos valores de la variable bajo estudio,
elegido en forma convencional y conveniente, y constituye la primera columna de la
distribución, que lleva como título el nombre de la variable que se está midiendo o presentando.
Si bien existen fórmulas para definir cuál es el número de intervalos de clase para cada
distribución (la fórmula de Sturges es un ejemplo en la que el Número de Intervalos: NI = 1 +
3,3 log.n), ellas no toman en cuenta todos los elementos disponibles, ya que el Rango, por
ejemplo, podría ser una buena información a tomar en cuenta para definir el número de los
intervalos, pero no aparece participando en ninguna de las fórmulas conocidas. Normalmente
una distribución debería tener entre 5 y 12 intervalos de clase, y depende de cada investigador la
cantidad definitiva que construirá, y su formato.
b) Frecuencia absoluta (fi): Es la cantidad de casos que pertenecen a cada clase.
c) Total de elementos (n): es la suma total de las frecuencias absolutas, lo que da el
total de elementos en la muestra. es decir que n   f i .
d) Límite inferior del intervalo de clase (LI): Es el menor valor de cada intervalo de
clase. En cada uno de los intervalos, los límites inferiores son los valores ubicados a la izquierda.
e) Límite superior del intervalo de clase (LS): Es el mayor valor de cada intervalo
de clase.
f) Verdadero Límite o Límite Real del intervalo de clase (VL): Se obtiene
haciendo la semisuma de un Límite Superior y el siguiente Límite Inferior, es decir

------------------------
Probabilidades y Estadística - Año 2005
5

LS  LI
i 1
VL  i
i 1 2
En las Distribuciones de frecuencias para variables continuas se conviene en que los
Verdaderos Límites coinciden con los Límites Inferiores, por lo que la fórmula de cálculo de los
VL se aplica fundamentalmente en los casos de Distribuciones para variables discretas.
g) Amplitud o tamaño del intervalo de clase (c): Es la diferencia, en valor absoluto,
entre dos Verdaderos Límites consecutivos: c  VLi VLi  1 Si la distribución de frecuencias
tuviera todos sus intervalos con igual amplitud, se la denomina equiespaciada.
En una distribución de frecuencias, existe una relación entre el número de intervalos
(NI), el Rango (R) y la amplitud (c), que se puede observar en la siguiente expresión:
R R
NI   c 
c NI
Esto significa que, conocido el rango, puede establecerse indistintamente uno de los otros
dos valores: o la amplitud c o el Nº de intervalos NI. Si se decide construir una distribución
con una amplitud determinada, se aplica la primera fórmula para obtener el Nº de intervalos. En
cambio, si se desea construir la distribución con un número de intervalos determinado, la
amplitud se puede obtener con la segunda fórmula.
h) Punto medio del intervalo de clase (xi): Se calcula haciendo la semisuma entre dos
Verdaderos Límites inferiores consecutivos, valor que se atribuye al intervalo que corresponde al
menor de ellos. Es decir que
VL VLi  1
xi  i
2
Si la distribución de frecuencias fuera equiespaciada, a partir del primer punto medio se
pueden obtener los siguientes sumándoles sucesivamente la amplitud c.
i) Frecuencia acumulada creciente (Fi): Es el total de elementos menores o iguales que
un límite superior cualquiera LSk. Se obtiene por adición sucesiva de las frecuencias absolutas,
comenzando desde el primer intervalo hasta el último. El resultado final debe coincidir con n.
j)Frecuencia relativa (hi): Es la relación entre las frecuencias absolutas y el total de
f
elementos n: hi  i . Suele expresarse en forma de porcentajes.
n
k) Frecuencia relativa acumulada (H): Es similar a la correspondiente Frecuencia
acumuladas Fi , pero calculada con la frecuencia relativa.

Ejemplo de distribución de frecuencias para una variable discreta:


Se trata de la cantidad de expedientes iniciados en una oficina a lo largo de los veinte
días hábiles de un mes cualquiera. El resultado se presenta a continuación:
Frec. Frec.
Nº de Frec. Verdadero Punto Acumul. Frec. Relativa
Exped. Absoluta Límite Medio Creciente Relativa Acumulada
Fi VL xi Fi hi Hi
1-6 1 0,5 3,5 1 5,0 % 5,0 %
7-12 4 6,5 9,5 5 20,0 % 25,0 %
13-18 7 12,5 15,5 12 35,0 % 60,0 %
19-24 6 18,5 21,5 18 30,0 % 90,0 %
25-30 2 24,5 27,5 20 10,0 % 100,0 %
20 100,0 %
------------------------
Probabilidades y Estadística - Año 2005
6

Nota: Prestar atención a los Verdaderos límites (que ya que no coinciden con los
límites), y al cálculo de los puntos medios de los Intervalos de Clase.

5 - GRAFICO DE LA DISTRIBUCION DE FRECUENCIAS -HISTOGRAMA:


El Histograma es un gráfico de la distribución de frecuencias, que se construye con
rectángulos de superficie proporcional al producto de la amplitud por la frecuencia
absoluta (o relativa) de cada uno de los intervalos de clase. La figura que sigue muestra el
Histograma de las Distribuciones de frecuencias de las variables continuas “Acidez del vino” y
“Consumo de energía”, que fueran presentadas en este fascículo. Se han incluido dos ejes de

abscisas para permitir efectuar la representación de ambos casos en un solo gráfico. (Nota: El
histograma correspondiente al ejemplo del Ingreso de las personas tiene forma similar).
El siguiente gráfico corresponde al caso de la variable discreta “Número de expedientes

iniciados en una oficina”, cuya distribución fuera también presentada precedentemente. Puede
observarse con claridad que los rectángulos correspondientes a cada intervalo de clase se han
construido entre los Verdaderos límites.

------------------------
Probabilidades y Estadística - Año 2005
7

6 - POLIGONO DE FRECUENCIAS:
El polígono de frecuencias es un gráfico lineal que se construye a partir de un histograma
uniendo los puntos medios de los lados opuestos a las bases de los rectángulos, incluyendo
además, si correspondiere (en ambos gráficos anteriores así se ha hecho), el punto medio del
intervalo de clase inmediato anterior al primer intervalo y el punto medio del intervalo de clase
inmediato posterior al último intervalo de clase, lo cual permite obtener una figura poligonal
cerrada con similar superficie que el histograma. En el trazado del polígono hay sectores que se
pierden y otros que se ganan respecto del histograma propiamente dicho. Esas superficies se han
destacado con un gris más claro en el gráfico del histograma correspondiente a la variable bajo
estudio.
El polígono de frecuencias permite mostrar cómo sería, de una manera sumamente
esquemática, la verdadera distribución teórica de la variable bajo estudio, distribución ésta que
nunca puede obtenerse realmente. Si en un histograma se supone que la amplitud de los
intervalos disminuyera al mismo tiempo que aumentara el número total de observaciones, se
produciría un aumento en el número de intervalos. Cuando la amplitud tiende a cero, el número
de intervalos de clase se vuelve infinito, y el histograma se convierte en una línea continua que
debe considerarse como la verdadera distribución teórica. Lo que hace el polígono es, como
ya se dijo, mostrar una aproximación eminentemente práctica de ese proceso.

7 – GRAFICO DE FRECUENCIAS ACUMULADAS - OJIVAS


CRECIENTES:
El gráfico de “Frecuencias Acumuladas” es la representación de esas Frecuencias
Acumuladas en particular, y se construye, al igual que el Histograma, con rectángulos de base y
altura proporcionales a la amplitud y a la frecuencia absoluta de cada intervalo, respectivamente,
pero desplazando hacia arriba el inicio de cada rectángulo hasta coincidir con el nivel
exacto de la terminación del anterior. En los gráficos siguientes se verifica que los rectángulos
oscuros podrían ser, exactamente, la reiteración del histograma desplazado hacia arriba.
Adicionalmente, se unen en forma consecutiva los verdaderos límites para obtener una
línea poligonal creciente, llamada en algunos textos ojiva creciente.

GRAFICOS – FUNCIONES ACUMULADAS


CASO CRECIENTE

------------------------
Probabilidades y Estadística - Año 2005
8

8 - COMENTARIOS SOBRE LA CONSTRUCCION DE


DISTRIBUCIONES DE FRECUENCIAS:
Cuando se trató el tema referido a los Intervalos de clase, se mencionó que la cantidad de
ellos y el formato de la distribución de frecuencias dependían de cada investigador, o, lo que es
lo mismo, del objetivo de cada investigación particular.
A lo largo del texto se presentaron varios ejemplos de distribuciones de frecuencias, todas
con las siguientes características:
 Son equiespaciadas: el tamaño o amplitud de todos sus intervalos es idéntico.
Esto permite imaginar que pueden construirse distribuciones de frecuencias
con intervalos de clase no equiespaciados, lo cual conduciría a que el tamaño
de cada intervalo debería ser variable (ci). El que la distribución sea
equiespaciada resulta una importante ventaja para la organización del trabajo
estadístico debido a la simplificación que eso significa en el uso de las
fórmulas estadísticas y en los cálculos propiamente dichos.
 Tienen sus intervalos de clase cerrados: eso significa que en todos los
intervalos existen, perfectamente identificados, los Límites Inferior y
Superior. Esto también permite pensar en distribuciones de frecuencias con
algún intervalo que no posea, o el Límite Inferior, o el Límite Superior, o
ambos. El ejemplo siguiente ilustra este comentario:

Intervalos fi Imaginemos que el cuadro del ejemplo


Menos de 450 3 de la izquierda se refiere a los ingresos
450-499,99 5 mensuales del personal de una empresa y
500-599,99 12 que incluye a un directivo cuyo sueldo es
600-699,99 10 de $ 1.590.-. Se observa que la distribución
700-799,99 4 tiene trece intervalos de clase (más del nú-
800-899,99 - mero límite, como ya se mencionó). El
900-999,99 - primero es abierto y los últimos siete son
1000-1099,99 - cerrados, de los cuales seis tienen sus
1100-1199,99 - frecuencias absolutas nulas. Esta forma
1200-1299,99 - resulta inconveniente, por lo que es muy
1300-1399,99 - apropiado y conveniente construir una
1400-1499,99 - distribución de frecuencias como la que
1500-1599,99 1 presenta más abajo, agrupando los últimos
intervalos en uno solo. De ese modo se obtiene el siguiente formato:

Intervalos fi En la distribución que se encuentra a la


Menos de 450 3 izquierda, tanto el primero como el
450-499,99 5 último intervalo de clase son abiertos
500-599,99 12 (no tienen alguno de los dos Límites)
600-699,99 10 mientras que los demás intervalos son
700 o más 5 cerrados.

 Se han resuelto algunos inconvenientes de la presentación anterior, ya que se


tiene sólo cinco intervalos y desaparecieron las frecuencias absolutas iguales a
cero. Pero la principal dificultad de una distribución como ésa es la
imposibilidad de calcular alguno de los elementos que forman parte del
------------------------
Probabilidades y Estadística - Año 2005
9

cuadro de la Distribución. En particular no pueden calcularse los puntos


medios, lo cual constituye un impedimento para efectuar posteriores pasos
estadísticos. No obstante esa situación, a menudo se tropieza con distribuciones
que tienen, o bien esta forma o bien sólo el primero o el último de los
intervalos de clase abiertos.

PREGUNTAS TEORICAS SOBRE INTRODUCCION Y DISTRIBUCION DE


FRECUENCIAS:

1) ¿Cuánto vale la suma de las frecuencias relativas?


a) n
b) Fi.
c) 100
2) En una distribución de frecuencias, si se desea saber cuál es la frecuencia de los
valores menores o iguales que un límite superior cualquiera, ¿a través de que dato se la
obtiene?
a) la frecuencia absoluta
b) la frecuencia relativa
c) la frecuencia acumulada

CUADRO SINOPTICO SOBRE ESTADISTICA

Datos no ordenados

Ordenamiento

Datos no agrupados Datos agrupados

Distribución de Frecuencias

Distribución Distribución Distribución Distribución


de de de Frecuencias de Frecuencias
Frecuencias Frecuencias Acumuladas Acumuladas
Absolutas Relativas Absolutas Relativas

Histograma Polígono Ojiva


de
Frecuencias

------------------------
Probabilidades y Estadística - Año 2005
10

Datos no ordenados

Ordenamiento

Datos no agrupados Datos agrupados

Distribución de Frecuencias

Distribución Distribución Distribución Distribución


de de de Frecuencias de Frecuencias
Frecuencias Frecuencias Acumuladas Acumuladas
Absolutas Relativas Absolutas Relativas

Histograma Polígono Ojiva


de
Frecuencias
BIBLIOGRAFIA CONSULTADA:
 Kazmier L. – Díaz Matta A.
“Estadística Aplicada a Administración y Economía”
Editorial McGraw Hill – 2ª Edición
 Berenson – Levine
“Estadística básica en Administración”
Editorial Prentice Hall – 6ª Edición
 Levin – Rubin
“Estadística para Administradores”
Editorial Prentice Hall – 6ª Edición
 Deming W.
“Sobre Teoría del Muestreo”
Editorial Comisión de Educación Estadística del Instituto Interamericano de Estadística – 1952
 Montiel – Ríos – Barón
“Elementos Básicos de Estadística Económica y Empresarial”
Editorial Prentice Hall – Año 1996
 Spiegel M.
“Teoría y Problemas de Estadística”
Editorial Shaum
 Mendenhall – Reinmuth
“Estadística para Administración y Economía”
Grupo Editorial Iberoamérica – Año 1993

------------------------
Probabilidades y Estadística - Año 2005

También podría gustarte