Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidades Y Estadistica: U.T.N.-F.R.R.-Año 2005
Probabilidades Y Estadistica: U.T.N.-F.R.R.-Año 2005
PROBABILIDADES Y
ESTADISTICA
Profesor Titular: Eº Mario J. GARBER
INTRODUCCION TEORICA
RECOPILACION DE DATOS
Unidad 1 - DEFINICIONES BASICAS - SELECCIÓN MUESTRAL
1 - DEFINICION DE ESTADISTICA:
La Estadística es un método científico destinado a recopilar, ordenar, presentar y
resumir datos, para posteriormente analizarlos, extraer conclusiones válidas y tomar, sobre
esa base, decisiones razonables.
Las primeras cuatro acciones indicadas en la anterior definición conforman la
“Estadística Descriptiva”, mientras que las últimas tres, la “Inferencia Estadística”.
Algunas de las aplicaciones actuales más conocidas de la Estadística son:
en el campo político: la predicción de los resultados electorales
en el campo del marketing: seleccionar características deseables de los productos y
diseñar estrategias de venta
en el campo de la medicina: determinar la eficacia de los medicamentos
en el campo contable: determinar el porcentaje de errores en las registraciones
en el campo de la zoología: estimar el tamaño real de la población de una especie
2 - POBLACION Y MUESTRA:
Población es un conjunto de elementos, finito o infinito, que responden a una
determinada característica. Luego, el concepto de población en Estadística va más allá de la
clásica definición que se da en la Demografía, esto es, la población de seres humanos
exclusivamente. En la actividad estadística una población puede estar constituida por elementos
de cualquier tipo, no solamente por seres humanos. Por ejemplo, se puede hablar de la población
de viviendas de un barrio; de la población de comprobantes contables de una empresa; de la
población de alumnos de una Facultad, etc.
Muestra es un subconjunto de elementos seleccionado en una población, o sea de tamaño
menor que ésta, que se utiliza para realizar estudios o investigaciones referidas a toda la
población pero en menor tiempo y por supuesto a un menor costo que si se la estudiara en
forma exhaustiva, pero al mismo tiempo sin la exactitud que sólo se puede conseguir en
investigaciones del cien por cien.
------------------------
Probabilidades y Estadística - Año 2005
2
Por eso, la opción entre población y muestra puede ser presentada como la opción entre
un relevamiento caro y un relevamiento económico, o bien entre exactitud y precisión. La
muestra no garantiza, pues, exactitud pero puede asegurar investigaciones estadística rápidas y
económicas que suelen ir acompañadas con la información del grado de precisión con el que se
ha trabajado.
3 – VARIABLES:
Una variable es una magnitud que puede tomar diferentes valores entre dos
previamente determinados, que limitan lo que constituye el campo de variación de la variable.
Ejemplos: la altura de los integrantes de un equipo de básquetbol; la cantidad de alumnos en las
clases de una materia; los ingresos o los gastos de un conjunto de personas.
Las variables pueden ser cuantitativas o cualitativas. Las variables cuantitativas se
expresan mediante cantidades (número, distancia, altura, etc.). Las cualitativas indican atributos
o calidades (colores, sexos, razas), a pesar que se pueden utilizar diferentes cantidades para
indicar cualidades, pero sin que las cantidades utilizadas permitan realizar comparaciones del
tipo mayor – menor.
Las variables cuantitativas pueden ser discretas o continuas. Las variables continuas
son aquellas que pueden tomar cualquier valor en el campo de su variación. Ejemplos: los
ingresos (en dinero); las alturas, las distancias.
Las variables discretas sólo pueden tomar algunos valores en su campo de variación.
Ejemplos: el número de alumnos; la cantidad de hijos; el resultado de un examen calificado
como aprobó-no aprobó.
En términos generales puede decirse que las variables continuas se relacionan con la
operación de medir, en tanto las variables discretas se relacionan con la operación de
contar.
Las variables aleatorias expresan el resultado de un experimento, también denominado
aleatorio, que recibe ese nombre porque se realiza en condiciones de incertidumbre, y que se
presenta con una cierta probabilidad que puede llegar a conocerse. Ejemplos: el resultado al
arrojar un dado; el sexo de un niño en el momento de la concepción.
Las variables no aleatorias se denominan determinísticas.
El siguiente gráfico ilustra sobre la clasificación de las variables:
(colaboración de la Profesora María de los Arcos Martínez)
------------------------
Probabilidades y Estadística - Año 2005
3
ESTADISTICA DESCRIPTIVA
TRATAMIENTO DE LOS DATOS ESTADISTICOS
Unidad 2 – DISTRIBUCION DE FRECUENCIAS
Profesor Titular: Eº Mario J. Garber
b) Para IQ-ISI: el nivel de la acidez del vino depositado en toneles en una bodega.
Frecuen. Verdadero Punto Frecuen. Frecuen. Frecuencia
Acidez absoluta Límite Medio Acum. Relativa Relativa
(pH) fi VL xi Creciente hi Acumulada
Fi Hi
1,00 – 1,49 5 1,00 1,25 5 5% 5%
1,50 – 1,99 18 1,50 1,75 23 18% 23%
2,00 – 2,49 42 2,00 2,25 65 42% 65%
2,50 – 2,99 27 2,50 2,75 92 27% 92%
3,00 – 3,49 8 3,00 3,25 100 8% 100%
100 100%
------------------------
Probabilidades y Estadística - Año 2005
5
LS LI
i 1
VL i
i 1 2
En las Distribuciones de frecuencias para variables continuas se conviene en que los
Verdaderos Límites coinciden con los Límites Inferiores, por lo que la fórmula de cálculo de los
VL se aplica fundamentalmente en los casos de Distribuciones para variables discretas.
g) Amplitud o tamaño del intervalo de clase (c): Es la diferencia, en valor absoluto,
entre dos Verdaderos Límites consecutivos: c VLi VLi 1 Si la distribución de frecuencias
tuviera todos sus intervalos con igual amplitud, se la denomina equiespaciada.
En una distribución de frecuencias, existe una relación entre el número de intervalos
(NI), el Rango (R) y la amplitud (c), que se puede observar en la siguiente expresión:
R R
NI c
c NI
Esto significa que, conocido el rango, puede establecerse indistintamente uno de los otros
dos valores: o la amplitud c o el Nº de intervalos NI. Si se decide construir una distribución
con una amplitud determinada, se aplica la primera fórmula para obtener el Nº de intervalos. En
cambio, si se desea construir la distribución con un número de intervalos determinado, la
amplitud se puede obtener con la segunda fórmula.
h) Punto medio del intervalo de clase (xi): Se calcula haciendo la semisuma entre dos
Verdaderos Límites inferiores consecutivos, valor que se atribuye al intervalo que corresponde al
menor de ellos. Es decir que
VL VLi 1
xi i
2
Si la distribución de frecuencias fuera equiespaciada, a partir del primer punto medio se
pueden obtener los siguientes sumándoles sucesivamente la amplitud c.
i) Frecuencia acumulada creciente (Fi): Es el total de elementos menores o iguales que
un límite superior cualquiera LSk. Se obtiene por adición sucesiva de las frecuencias absolutas,
comenzando desde el primer intervalo hasta el último. El resultado final debe coincidir con n.
j)Frecuencia relativa (hi): Es la relación entre las frecuencias absolutas y el total de
f
elementos n: hi i . Suele expresarse en forma de porcentajes.
n
k) Frecuencia relativa acumulada (H): Es similar a la correspondiente Frecuencia
acumuladas Fi , pero calculada con la frecuencia relativa.
Nota: Prestar atención a los Verdaderos límites (que ya que no coinciden con los
límites), y al cálculo de los puntos medios de los Intervalos de Clase.
abscisas para permitir efectuar la representación de ambos casos en un solo gráfico. (Nota: El
histograma correspondiente al ejemplo del Ingreso de las personas tiene forma similar).
El siguiente gráfico corresponde al caso de la variable discreta “Número de expedientes
iniciados en una oficina”, cuya distribución fuera también presentada precedentemente. Puede
observarse con claridad que los rectángulos correspondientes a cada intervalo de clase se han
construido entre los Verdaderos límites.
------------------------
Probabilidades y Estadística - Año 2005
7
6 - POLIGONO DE FRECUENCIAS:
El polígono de frecuencias es un gráfico lineal que se construye a partir de un histograma
uniendo los puntos medios de los lados opuestos a las bases de los rectángulos, incluyendo
además, si correspondiere (en ambos gráficos anteriores así se ha hecho), el punto medio del
intervalo de clase inmediato anterior al primer intervalo y el punto medio del intervalo de clase
inmediato posterior al último intervalo de clase, lo cual permite obtener una figura poligonal
cerrada con similar superficie que el histograma. En el trazado del polígono hay sectores que se
pierden y otros que se ganan respecto del histograma propiamente dicho. Esas superficies se han
destacado con un gris más claro en el gráfico del histograma correspondiente a la variable bajo
estudio.
El polígono de frecuencias permite mostrar cómo sería, de una manera sumamente
esquemática, la verdadera distribución teórica de la variable bajo estudio, distribución ésta que
nunca puede obtenerse realmente. Si en un histograma se supone que la amplitud de los
intervalos disminuyera al mismo tiempo que aumentara el número total de observaciones, se
produciría un aumento en el número de intervalos. Cuando la amplitud tiende a cero, el número
de intervalos de clase se vuelve infinito, y el histograma se convierte en una línea continua que
debe considerarse como la verdadera distribución teórica. Lo que hace el polígono es, como
ya se dijo, mostrar una aproximación eminentemente práctica de ese proceso.
------------------------
Probabilidades y Estadística - Año 2005
8
Datos no ordenados
Ordenamiento
Distribución de Frecuencias
------------------------
Probabilidades y Estadística - Año 2005
10
Datos no ordenados
Ordenamiento
Distribución de Frecuencias
------------------------
Probabilidades y Estadística - Año 2005