Documentos de Académico
Documentos de Profesional
Documentos de Cultura
01 Estadistica
01 Estadistica
SEMANA 1
ÍNDICE
INTRODUCCIÓN ............................................................................................................................. 3
POBLACIÓN Y MUESTRA................................................................................................................ 5
COMENTARIO FINAL.................................................................................................................... 13
REFERENCIAS ............................................................................................................................... 14
2
ESTE DOCUMENTO CONTIENE LA SEMANA 1
ESTADÍSTICA DESCRIPTIVA
APRENDIZAJES ESPERADOS
Durante el desarrollo de esta semana, se espera que el alumno logre acercarse a los términos
básicos utilizados en estadística, además se describe la definición y las principales diferencias
entre población y muestra.
INTRODUCCIÓN
El término estadística proviene de la palabra Estado y se refiere al origen histórico de esta
disciplina, relacionada con la descripción cuantitativa de asuntos del Estado. También se llamó
aritmética política. Según definición de William Petty a finales del 1600, su objetivo inicial era
describir cuantitativamente diversos hechos de interés. En tiempos de Julio César (100 a. C.),
Augusto el estadístico era el recaudador de impuestos y en tiempos de Guillermo el Conquistador
(1070 aproximadamente) se editó el primer registro o censo de Inglaterra (Libro Domesday, 1086).
En el siglo XVII, John Graunt (1620-1674) y W. Petty (1623-1687) desarrollaron la estadística vital.
En esta misma época, en forma independiente nació la rama matemática de las probabilidades,
esto surge a raíz del interés en el juego de Antoine Gombaud (el caballero de Merè: 1610-1685) y
de los matemáticos Blas Pascal (1623-1662) y Pierre de Fermat (1601-1665). Posteriormente,
Jacob Bernouilli (1654-1705), Abraham de Moivre (1667-1754), Pierre Simon Laplace (1749-1827)
y Karl Friedrich Gauss (1777-1855) contribuyeron a fortalecer las probabilidades, combinándola
con los datos estadísticos. Adolphe Quetelet (1796-1874) y finalmente Francis Galton (1822-1911)
aplicaron la estadística al análisis de la variabilidad biológica. El desarrollo definitivo de la
estadística, uniendo sus raíces descriptivas y matemáticas viene con Karl Pearson (1857-1936),
William Sealy Gosset, Student (el estudiante), (1876-1937), Jerzy Neyman (1894), Egon Sharp
Pearson (1895), Abraham Wald (1902-1950) y Ronald Aylmer Fisher (1890-1962). Tal vez las
figuras más destacadas que relacionaron la estadística y la biología, dando origen a la biometría,
son K. Pearson, fundador de la revista Biometrika y R. A. Fisher autor de Statistical Methods for
Research Workers (1925).
En paralelo, la estadística matemática ha sido enriquecida con las contribuciones de James Clerk
Maxwell, Ludwig Boltzman y Josiah Willard Gibbs (mecánica estadística) y por Andréi Kolmogórov
(probabilidades axiomáticas) y Henri Lebesgue (Teoría de la Medida). La estadística ha tenido un
desarrollo progresivo e intensivo a partir de los años 70 y esto se refleja en la diversidad de
carreras profesionales que la utiliza, entre ellas, ingeniería, medicina, bioestadística, enfermería,
3
ESTE DOCUMENTO CONTIENE LA SEMANA 1
agronomía, economía, arquitectura, derecho, sicología, publicidad, relaciones públicas y
comunicación social.
En la vida cotidiana se aplican diferentes conceptos relacionados con estadística, esto de manera
consciente o inconsciente. Por ejemplo, un profesor, con el fin de decidir el grado de dificultad al
comienzo de una asignatura interroga a ocho alumnos aleatoriamente de un total de 32.
Frente a cada una de estas tres posibilidades, el profesor resuelve partir con un curso de nivel:
bajo, medio o avanzado.
Observar una muestra (subconjunto de la totalidad) y suponer que las características se
mantienen para toda la población (total fuente de información), claramente puede llevar a
conclusiones erróneas, medir esta incertidumbre y/o minimizar este tipo de error es tarea de la
estadística.
A continuación se entregarán diferentes definiciones sobre los temas mencionados en cada punto.
4
ESTE DOCUMENTO CONTIENE LA SEMANA 1
POBLACIÓN Y MUESTRA
POBLACIÓN: la población es el conjunto de elementos que están en estudio y puede ser infinito o
finito (Anderson, Sweeney & Williams, 2008).
En la práctica observar a la población resulta antieconómico o poco práctico, esto debido a que
realizar un censo de una determinada población tiene un costo importante, la otra razón es el
tiempo que demora hacerlo, por lo tanto, es común llevar a cabo estudios por medio de una
muestra.
MUESTRA: una muestra es una parte (subconjunto) de la población que trata de preservar la
mayor parte de las características de ella (Anderson& otros, 2008).
La forma de tomar la muestra y el tamaño de ella, depende de algunos factores, tales como:
a) Población objetivo.
b) Tamaño del error.
c) Tiempo para el estudio.
d) Cantidad de recursos (como el dinero, entre otros).
5
ESTE DOCUMENTO CONTIENE LA SEMANA 1
Ejemplo: la variable sexo puede tomar dos valores que son: masculino y femenino, para que las
categorías de clasificación sean útiles, deben ser mutuamente excluyentes, complementarias y
exhaustivas. En cada una de ellas se puede obtener la frecuencia. (Anderson& otros, 2008).
ESCALA ORDINAL: con esta escala se miden variables de tipo cuantitativo; estas pueden tomar
diferentes valores, de tal manera que es posible ordenarlos en forma ascendente o descendente,
pero se desconoce la distancia que existe entre las categorías de la variable. Se usa cuando se
detectan diferentes grados del valor de una variable y cuando los datos recopilados a partir de
ella, se pueden ordenar por rangos (Anderson & otros, 2008).
Ejemplo: Si se presentan tres refrescos diferentes a una persona y se le pide que exprese su
preferencia utilizando una escala del uno al tres, esto se evalúa en una escala ordinal, pues se
puede suponer que hay un orden en los resultados, pero la diferencia en las puntuaciones no tiene
importancia, pues no se puede saber si la diferencia entre un tres y un dos es la misma que entre
un uno y un dos.
Observación: corresponde a los datos medidos a las variables en cada uno de los elementos del
conjunto de datos, una observación se designa con una letra minúscula.
Ejemplo aplicado:
Conjunto de datos: habitantes de la ciudad de Santiago.
Variables:
X = Género
Y = Edad
6
ESTE DOCUMENTO CONTIENE LA SEMANA 1
TABLAS O CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS
Una tabla de frecuencia, es el resumen u ordenamiento de la información obtenida en la población
o muestra, se expresa por medio de una tabla de doble entrada, con las siguientes características:
siendo n el tamaño de la muestra y m el número de filas de la tabla (Anderson & otros, -2008).
Frecuencias
absolutas (n° de
Clases
observaciones en
cada clase)
A1 n1
A2 n2
… …
An-1 nn-1
Am nm
Por lo tanto:
Al interior de cada clase, se definen las frecuencias absolutas acumuladas:
Frecuencias relativas:
Marca de clases (variables cuantitativas). En el caso que la clase sea un intervalo, se define como
el valor central y es el representante de todas las observaciones en esa clase, se denotará por Xi.
7
ESTE DOCUMENTO CONTIENE LA SEMANA 1
Ejemplo de una tabla de distribución de frecuencias:
A continuación, otro ejemplo: Se desea estudiar la edad de ingreso de los alumnos de una
universidad. Para esto se toma una muestra de 20 alumnos.
Observaciones:
17 22 21 23 18 19 19 18 20 21
18 19 21 23 22 18 24 22 23 20
8
ESTE DOCUMENTO CONTIENE LA SEMANA 1
VARIABLES CONTINUAS DE INTERVALOS
En el caso de las variables continuas muchas veces es necesario agrupar datos (series agrupadas)
por intervalos llamados intervalos de clase. Estos se anotan como , donde
representa el límite inferior del intervalo e , el límite superior (Yule & Kendall, 1954).
La amplitud de cada intervalo es:
En estas tablas de distribución de frecuencias se define marca de clase como el valor promedio
entre los límites del intervalo su cálculo es:
Ejemplo (edades): En una universidad se desea estudiar la edad de los alumnos que ingresar a
primer año. Para esto se toma una muestra de 20 alumnos.
9
ESTE DOCUMENTO CONTIENE LA SEMANA 1
Si se agrupan estos datos en una tabla o cuadro de distribución de frecuencias, resultaría lo
siguiente:
Nota: No debemos olvidar que a la hora de contar los datos que están en cada intervalo de la
forma [Y'i-1 , Y'i]. El límite superior no se considera, pues se cuenta en el siguiente intervalo.
Donde:
xi: Marca de clases del i-ésimo intervalo.
ni: Frecuencia absoluta del i-ésimo intervalo.
Ni: Frecuencia absoluta acumulada del i-ésimo intervalo.
fi: Frecuencia relativa del i-ésimo intervalo.
Fi: Frecuencia relativa acumulada del i-ésimo intervalo.
hi: Frecuencia porcentual del i-ésimo intervalo.
Hi: Frecuencia porcentual acumulada del i-ésimo intervalo.
10
ESTE DOCUMENTO CONTIENE LA SEMANA 1
Frente a estas dos tablas surgen las siguientes interrogantes: ¿cuántos intervalos o clases se
pueden considerar? ¿Qué tamaño deben tener los intervalos, si se consideran iguales?
Respuesta: no existen reglas fijas para determinar el número de clases y el ancho de cada uno de
ellos. No obstante, existe una fórmula dada por Herbert Sturges (1926), la cual considera
intervalos de igual tamaño.
FÓRMULA DE STURGES
Primero se debe determinar el número de intervalos por medio de la siguiente fórmula:
M = máximo y L= mínimo.
11
ESTE DOCUMENTO CONTIENE LA SEMANA 1
Nota 1: El estudiante que mide 1,86 m fue contabilizado en el intervalo [1,81 , 1,86), pues no
existía otro intervalo posterior.
12
ESTE DOCUMENTO CONTIENE LA SEMANA 1
COMENTARIO FINAL
Una vez concluida esta semana, estamos en condiciones de entender parte de la historia de la
Estadística y quienes fueron los principales investigadores que ayudaron a construir todos los
teoremas que conocemos y estudiamos actualmente, los primeros conceptos que podemos aplicar
son: población y muestra, esto nos servirá en los más variados aspectos cotidianos y en nuestra
vida laboral, ya que entender la diferencia y aplicar un estudio donde se cumple con los elementos
básicos para que una muestra sea representativa es fundamental. Otro de los aprendizajes que
están en condiciones de aplicar es reconocer e identificar claramente el tipo de medida de las
variables que se pueden encontrar en diferentes conjuntos de datos, esto es muy importante, ya
que dependiendo de esa información se define el tipo de análisis o tabla que se construye, además
también tienen todas las herramientas para agrupar variables continuas utilizando la fórmula de
Sturger y construir tablas de distribución de frecuencia.
13
ESTE DOCUMENTO CONTIENE LA SEMANA 1
REFERENCIAS
Anderson David R., Sweeney Dennis J., Williams Thomas A. (2008). Estadística para
administración y economía (10ª edición). Cencage Learning
Pagano, Robert R. (2011). Estadística para las ciencias del comportamiento (9ª edición).
Cencage Learning.
Sir William Petty (1623- 1687) filósofo, médico, economista y estadístico inglés.
14
ESTE DOCUMENTO CONTIENE LA SEMANA 1