Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cuando nos hablan de Estadística en general pensamos en dos significados para esta palabra. Por un
lado, nos imaginamos a alguien elaborando estadísticas, que consiste en recopilar información sobre
algo. Normalmente se piensa en alguien preguntándole a una persona por una serie de datos como
su sexo, edad, estado civil, si trabaja o está desempleado etc. Luego ese alguien trabaja con los
datos: los suma y divide entre el total y otra serie de operaciones y se nos habla de la media o la
varianza de los datos.
Por otro lado, también pensamos en Estadística cuando se tratan los datos y se obtienen
conclusiones, y oímos cosas como a la vista de los resultados de los experimentos se puede concluir
que no hay evidencia empírica para afirmar que tal producto es perjudicial para la salud.
La palabra Estadística tiene dos acepciones en general, por un lado es el hecho de estudiar las
características de una población y sus integrantes; y por otro lado es una disciplina científica que
entre muchas otras utilidades puede usarse para deducir relaciones entre variables, o para extender
los resultados que obtengamos para una parte de la población a toda la población.
Estadística significa ciencia del Estado, y proviene del término alemán Statistik. ¿Por qué la ciencia
del Estado? Porque en sus orígenes la estadística se utilizaba exclusivamente con fines estatales, en
el sentido de que los gobiernos de las distintas naciones tenían (y tienen) la necesidad, por razones
de organización, de conocer las características de su población para gestionar el pago de impuestos,
el reclutamiento de soldados, el reparto de tierras o bienes, la prestación de servicios públicos etc.
Esta necesidad llevó a los gobernantes a establecer sistemas para recoger y procesar de alguna
manera la información obtenida, es decir, a hacer estadísticas sobre la población.
Normalmente los primeros estudios estadísticos que se hacían eran los censos, que son estudios
descriptivos sobre todos los integrantes de una población. La elaboración de censos comenzó en la
Edad Antigua, y sigue dándose en nuestros días. Los censos aportan mucha información, puesto que
se pregunta a todo el mundo, pero su ejecución suele ser cara y lleva mucho tiempo, porque hay que
preguntar a la población y después hay que procesar los datos obtenidos.
Una forma de agilizar la recogida y tratamiento de la información sobre algunas características de la
población era (y es) a través de los registros, que son listados en los que los ciudadanos tienen que
inscribirse cuando por ejemplo nace algún hijo o hija, hay algún matrimonio o alguna defunción etc.
Con el tiempo y el desarrollo científico surgieron alternativas a los censos: las encuestas a sólo una
parte de la población y la posterior generalización a toda la población de los resultados obtenidos
para la muestra, pero para ello fue necesario el desarrollo de la Teoría de la Probabilidad (rama de
las Matemáticas), de la Inferencia Estadística y del Muestreo (ramas de la Estadística) que se dio en
la Edad Moderna y Contemporánea. El desarrollo científico y filosófico también propició la
aplicación de la Estadística a las ciencias sociales con fines no políticos, y además el surgimiento de
nuevas técnicas y herramientas amplió las posibilidades de su uso: aparte de ser estudios
descriptivos, la Estadística también puede emplearse para estudiar y cuantificar relaciones entre
variables (análisis de los datos).
2- Conceptos de estadística.
La estadística estudia la variabilidad sobre cuestiones de la realidad en los que interviene el azar.
Gracias a la estadística se consiguen una serie de datos objetivables mediante los cuales se pueden
extraer una serie de conclusiones.
La estadística son los métodos y procedimientos para recoger, clasificar, analizar y representar los
datos, así como obtener conclusiones a través de ellos, con la intención de formular predicciones y
ayudar en la toma de decisiones.
Existen dos tipos principales de estadística:
Los principales conceptos en estadística a partir de los cuales podemos profundizar en ella son:
Individuo; son las personas o elementos que contienen la información del fenómeno que se
pretende estudiar.
Variables; son las características de la población que se representan en los individuos que
forman la muestra y que son susceptibles de ser medidas. Las variables pueden ser
cuantitativa o cualitativas.
Si las observaciones corresponden a cantidades, las variables pueden distinguirse entre discretas y
continuas. Se dice que una variable es discreta cuando no puede tomar ningún valor entre dos
consecutivos, y que es continua cuando puede tomar cualquier valor dentro de un intervalo.
Ejemplos de variable discreta: número de empleados de una fábrica; número de hijos; número de
cuentas ocultas en Suiza.
Ejemplos de variable continua: temperaturas registradas en un observatorio; tiempo en recorrer una
distancia en una carrera; contenido de alcohol en un cuba-libre; estatura; tiempo de discurso de un
político en las cortes insultando a los del partido contrario.
En la práctica, todas las variables son discretas debido a la limitación de los aparatos de medida.
Pensemos en el ejemplo de la estatura: quizá podría detectarse una diferencia de una cienmilésima
de metro, o de una millonésima pero, dados dos individuos que se diferencien en una millonésima,
seguramente ya no existe otro que tenga una estatura intermedia. De la misma forma, por
insignificante que sea la diferencia entre la llegada de dos corredores olímpicos a una meta, la
limitación de la precisión en la medida siempre puede acabar produciendo un posible (aunque
improbable) empate. Obviando este tipo de limitaciones, las variables continuas se elegirán, desde
un punto de vista teórico, con toda la precisión que deseemos (decimales), de manera que siempre
podamos escribir un valor que esté entre cualesquiera otros dos.
Por ejemplo, hasta hace unos años, cuando uno se subía a una báscula, lo máximo solían ser dos o
tres decimales: (50.35: 50 kilos y 350 gramos…). Realmente, usar más de dos o tres decimales para
el peso en kilos de una persona no ofrece ningún interés. Sin embargo, está claro que podrían
construirse básculas de baño con mucha mayor precisión, ofreciendo un número mayor de
decimales (otra cosa es que se vendieran).
De manera general, consideraremos que una variable continua toma valores en un intervalo (por
ejemplo: el peso de un grupo de personas varía entre 40 y 100 kilos), y un dato podrá ser cualquier
número entre esos dos.
Límites de la clase, cada clase está delimitada por el límite inferior de la clase
y el límite superior de la clase. amplitud de la clase, amplitud de la clase es la
diferencia entre el límite superior e inferior de la clase.
Marca de clase, la marca de clase es el punto medio de cada intervalo y es el
valor que representa a todo el intervalo para el cálculo de algunos
parámetros.
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se
cuenta en el siguiente intervalo.
ci fi Fi ni Ni
[0, 5) 2.5 1 1 0.025 0.025
[5, 10) 7.5 1 2 0.025 0.050
[10, 15) 12.5 3 5 0.075 0.125
[15, 20) 17.5 3 8 0.075 0.200
[20, 25) 22.5 3 11 0.075 0.2775
[25, 30) 27.5 6 17 0.150 0.425
[30, 35) 32.5 7 24 0.175 0.600
[35, 40) 37.5 10 34 0.250 0.850
[40, 45) 42.5 4 38 0.100 0.950
[45, 50) 47.5 2 40 0.050 1
40 1
Determinar el mayor y el menor entre los datos registrados y así encontrar el rango o diferencia
entre el mayor y el menor de los datos
Dividir el rango en un número conveniente de intervalos de clase del mismo tamaño. Si esto no es
posible, utilizar intervalos de clase de diferente tamaño o intervalos de clase abiertos. El número de
intervalos de clase se toma generalmente entre 5 y 20 dependiendo de los datos. Los intervalos de
clase se eligen también de forma que las marcas de clase o puntos medios coincidan con datos
realmente observados.
Determinar el número de observaciones que caen dentro de cada intervalo de clase, es decir
encontrar las frecuencias de clase.
DISTRIBUCIONES DE FRECUENCIA RELATIVA
La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total de frecuencia de
todas las clases y se expresa generalmente como porcentaje.
DISTRIBUCIONES DE FRECUENCIA ACUMULADA, OJIVAS.
La frecuencia total de todos los valores menores que el límite real superior de clase un intervalo de
clase dado se conoce como frecuencia acumulada.
DISTRIBUCIONES DE FRECUENCIA RELATIVA ACUMULADAS.
La frecuencia relativa acumulada o frecuencia porcentual acumulada es la frecuencia acumulada
dividida por la frecuencia total. Ejemplo: 65/ 100 = 65% es decir que los estudiantes tienen una
altura menor de 65%.
CURVAS DE FRECUENCIA. OJIVAS SUAVISADAS.
El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extraída de
una población grande. A causa de las muchas observaciones.
En resumen la distribución de frecuencia es una instrumento muy útil para resumir grandes
conjuntos de datos esta consiste en una representación de las categorías numéricas de la variable
junto con el número de entidades que se clasifican en cada categoría. Las distribuciones de
frecuencia se pueden presentar en forma tabular de tablas o de gráficas.
La lectura que se da en estos histogramas son a partir de los datos, se observan los que
aparecen como centrales y los de las esquinas o desviaciones. Las normas se establecen
a partir de donde se concentran más los datos y los casos poco frecuentes o muy
frecuentes serían los de los extremos
POLÍGONOS DE FRECUENCIA.
8- Columnas y barras.
9- Circular o pastel
Un diagrama circular o de pastel se puede utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas. Estas gráficas son muy frecuentes en
periódicos, revistas y publicaciones especializadas. Los datos se representan en un círculo, de
modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente.
Barra 100 %
Gráfico N°21: se presenta el porcentaje de población ocupada del país para los
años 1995, 2000 y 2005.
El comportamiento de la distribución porcentual de la población ocupada es
similar para cada uno de los años comparados. La Región Central comprende un
porcentaje cercano al 66% de la población ocupada en cada de los años y las
otras cinco regiones comprenden del 34% restante. Esto muestra que no se
presentan cambios significativos en la distribución de la fuerza de trabajo y de las
fuentes de empleo en el país.
Normas de presentación
Los sectores no deben ser muy pequeños. Cuando hay muchos sectores
muy pequeños, se pueden agrupar en un solo sector.
No se deben representar más de ocho categorías; ni menos de tres.
Los sectores se ordenan de mayor a menor.
El primer segmento, el de mayor tamaño relativo, se coloca en la base; y en
orden descendente se van colocando los demás sectores, hasta que el más
pequeño se coloca de último.
Lo más frecuente, cuando se comparan en el tiempo varias barras 100%, es
ordenarlas de acuerdo con el año más antiguo. Pero dependiendo del
interés, se pueden ordenar de acuerdo con el año más reciente, o también,
ordenarlas en forma independiente para cada uno de los años de menor a
mayor.
Si el gráfico no parece muy saturado, es bueno incluir en la barra el
respectivo porcentaje.
Para identificar los sectores se usa la leyenda correspondiente al lado
derecho del gráfico.
Calificaciones de Estadisticas