Facilitacion #1 Estadistica

1- Breve reseña histórica de la estadística.
Cuando nos hablan de Estadística en general pensamos en dos significados para esta palabra. Por un
lado, nos imaginamos a alguien elaborando estadísticas, que consiste en recopilar información sobre
algo. Normalmente se piensa en alguien preguntándole a una persona por una serie de datos como
su sexo, edad, estado civil, si trabaja o está desempleado etc. Luego ese alguien trabaja con los
datos: los suma y divide entre el total y otra serie de operaciones y se nos habla de la media o la
varianza de los datos.
Por otro lado, también pensamos en Estadística cuando se tratan los datos y se obtienen
conclusiones, y oímos cosas como a la vista de los resultados de los experimentos se puede concluir
que no hay evidencia empírica para afirmar que tal producto es perjudicial para la salud.
La palabra Estadística tiene dos acepciones en general, por un lado es el hecho de estudiar las
características de una población y sus integrantes; y por otro lado es una disciplina científica que
entre muchas otras utilidades puede usarse para deducir relaciones entre variables, o para extender
los resultados que obtengamos para una parte de la población a toda la población.
Estadística significa ciencia del Estado, y proviene del término alemán Statistik. ¿Por qué la ciencia
del Estado? Porque en sus orígenes la estadística se utilizaba exclusivamente con fines estatales, en
el sentido de que los gobiernos de las distintas naciones tenían (y tienen) la necesidad, por razones
de organización, de conocer las características de su población para gestionar el pago de impuestos,
el reclutamiento de soldados, el reparto de tierras o bienes, la prestación de servicios públicos etc.
Esta necesidad llevó a los gobernantes a establecer sistemas para recoger y procesar de alguna
manera la información obtenida, es decir, a hacer estadísticas sobre la población.
Normalmente los primeros estudios estadísticos que se hacían eran los censos, que son estudios
descriptivos sobre todos los integrantes de una población. La elaboración de censos comenzó en la
Edad Antigua, y sigue dándose en nuestros días. Los censos aportan mucha información, puesto que
se pregunta a todo el mundo, pero su ejecución suele ser cara y lleva mucho tiempo, porque hay que
preguntar a la población y después hay que procesar los datos obtenidos.
Una forma de agilizar la recogida y tratamiento de la información sobre algunas características de la
población era (y es) a través de los registros, que son listados en los que los ciudadanos tienen que
inscribirse cuando por ejemplo nace algún hijo o hija, hay algún matrimonio o alguna defunción etc.
Con el tiempo y el desarrollo científico surgieron alternativas a los censos: las encuestas a sólo una
parte de la población y la posterior generalización a toda la población de los resultados obtenidos
para la muestra, pero para ello fue necesario el desarrollo de la Teoría de la Probabilidad (rama de
las Matemáticas), de la Inferencia Estadística y del Muestreo (ramas de la Estadística) que se dio en
la Edad Moderna y Contemporánea. El desarrollo científico y filosófico también propició la
aplicación de la Estadística a las ciencias sociales con fines no políticos, y además el surgimiento de
nuevas técnicas y herramientas amplió las posibilidades de su uso: aparte de ser estudios
descriptivos, la Estadística también puede emplearse para estudiar y cuantificar relaciones entre
variables (análisis de los datos).
2- Conceptos de estadística.
La estadística estudia la variabilidad sobre cuestiones de la realidad en los que interviene el azar.
Gracias a la estadística se consiguen una serie de datos objetivables mediante los cuales se pueden
extraer una serie de conclusiones.
La estadística son los métodos y procedimientos para recoger, clasificar, analizar y representar los
datos, así como obtener conclusiones a través de ellos, con la intención de formular predicciones y
ayudar en la toma de decisiones.
Existen dos tipos principales de estadística:
 Estadística descriptiva o estadística deductiva; es la parte de la estadística que se ocupa de

ordenar, sintetizar y representar gráficamente los resultados recogidos durante la
investigación. La estadística descriptiva no solo describe, sino también analiza y representa
los datos utilizando elementos numéricos y gráficos.
 Estadística inferencial o estadística inductiva; es la estadística que tiene como objetivo

obtener conclusiones sobre el total de la población a partir de los datos obtenidos en un
subconjunto de la misma o grupo de elementos representativos (muestra).
Los principales conceptos en estadística a partir de los cuales podemos profundizar en ella son:
 Población; también conocido como universo o conjunto completo de individuos que

cumplen una serie de características y al que harán referencia las conclusiones del estudio.
A partir de la población de estudio se elegirá una muestra representativa.
 Muestra; es un grupo acotado o reducido de todos los individuos de forman la población. Se

considera que una muestra es representativa cuando los individuos de la misma son
seleccionados al azar.
 Individuo; son las personas o elementos que contienen la información del fenómeno que se
pretende estudiar.
 Muestreo; es el procedimiento mediante el cual se obtiene una muestra. El muestreo puede

ser probabilístico o aleatorio y no probabilístico o no aleatorio.
 Aleatoriedad de una muestra; es la característica mediante la cual todos los miembros de

una muestra tienen las mismas posibilidades de formar parte de la misma.
 Homogeneidad de una muestra; es la característica mediante la cual las variables de la

muestra se presentan en la misma proporción que las de la población.
 Independencia en la selección de una muestra; es la característica de la muestra que

determina que la selección de un individuo no influye en la selección de otro individuo.
 Muestreo simple; es el muestreo de tipo probabilístico, mediante el cual cualquier elemento

de la población tiene la misma probabilidad de pertenecer a la muestra.
 Muestreo sistemático; es el muestro de tipo probabilístico, en el que el proceso de selección

de la muestra se realiza mediante una regla sistemática simple como es elegir un número
determinado de individuos.
 Muestreo estratificado; es el muestreo de tipo probabilístico que divide la población en
subgrupos según algunas características para luego extraer una muestra al azar de cada uno
de los subgrupos.
 Muestreo por conglomerados; es el muestreo de tipo probabilístico en el que se extrae una

muestra al azar a partir de grupos naturales de individuos dentro del universo o población.
 Muestreo de conveniencia; es el muestreo de tipo no probabilístico en el que la muestra se

selecciona por su facilidad o directamente se autoselecciona.
 Muestreo por cuota; es el muestreo de tipo no probabilístico, en el que la muestra se

sustenta sobre el buen conocimiento de los grupos o estratos de la población y en los
individuos más representativos para sus fines. También se denomina muestreo accidental.
 Muestreo por criterio; es el muestreo de tipo no probabilístico en el que el investigador

utiliza sus conocimientos sobre la población para elegir los individuos de la muestra.
 Variables; son las características de la población que se representan en los individuos que
forman la muestra y que son susceptibles de ser medidas. Las variables pueden ser
cuantitativa o cualitativas.
 Parámetro; es un índice que resume una determinada característica de la población,

representándose por las letras griegas “μ” o mu y “σ” o ro. Un parámetro es la función
definida sobre los valores numéricos de características medibles de una población.
 Estadístico; es un índice que resume una determinada característica de la muestra,

representándose por las letras del alfabeto latino “x” y “s”. Un estadístico es la función
definida sobre los valores numéricos de una muestra.
3- Población y muestra, estadísticos y parámetro.

POBLACIÓN
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una
población se precisa como un conjunto finito o infinito de personas u objetos que presentan
características comunes.
De esta forma Levin & Rubin (1996). Indica que "Una población es un conjunto de todos los
elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones".
De igual forma Cadenas (1974). Expresa "Una población es un conjunto de elementos que
presentan una característica común".
MUESTRA
La muestra es una pieza de la población a estudiar que sirve para representarla.
Según Levin & Rubin (1996). Apuntan que "Una muestra es una colección de algunos elementos de
la población, pero no de todos".
Según Cadenas (1974). "Una muestra debe ser definida en base de la población determinada, y las
conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia",
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y
lleva menos tiempo.
Una muestra representativa contiene las características relevantes de la población en las mismas
proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra, utilizan esta información para hacer
referencias sobre la población que está representada por la muestra. En consecuencia muestra y
población son conceptos relativos. Una población es un todo y una muestra es una fracción o
segmento de ese todo.
ESTADÍSTICO
Es el elemento que describe una muestra y sirve como una estimación del parámetro de la población
correspondiente.
El estadístico sirve como una estimación del parámetro. Aunque en realidad el interés se fija en el
valor del parámetro de la población, con frecuencia debe haber conformidad con solo calcularlo con
un estadístico de la muestra que se ha seleccionado.
PARÁMETRO
Es un valor, medida o indicador representativo de la población que se selecciona para ser estudiado.
Otra definición podría ser, función definida sobre valores numéricos de una población. Se llama
parámetro a un valor representativo de una población, como la media aritmética, una proporción o
su desviación típica.
4- Variables discretas y continuas.
Si las observaciones corresponden a cantidades, las variables pueden distinguirse entre discretas y
continuas. Se dice que una variable es discreta cuando no puede tomar ningún valor entre dos
consecutivos, y que es continua cuando puede tomar cualquier valor dentro de un intervalo.
Ejemplos de variable discreta: número de empleados de una fábrica; número de hijos; número de
cuentas ocultas en Suiza.
Ejemplos de variable continua: temperaturas registradas en un observatorio; tiempo en recorrer una
distancia en una carrera; contenido de alcohol en un cuba-libre; estatura; tiempo de discurso de un
político en las cortes insultando a los del partido contrario.
En la práctica, todas las variables son discretas debido a la limitación de los aparatos de medida.
Pensemos en el ejemplo de la estatura: quizá podría detectarse una diferencia de una cienmilésima
de metro, o de una millonésima pero, dados dos individuos que se diferencien en una millonésima,
seguramente ya no existe otro que tenga una estatura intermedia. De la misma forma, por
insignificante que sea la diferencia entre la llegada de dos corredores olímpicos a una meta, la
limitación de la precisión en la medida siempre puede acabar produciendo un posible (aunque
improbable) empate. Obviando este tipo de limitaciones, las variables continuas se elegirán, desde
un punto de vista teórico, con toda la precisión que deseemos (decimales), de manera que siempre
podamos escribir un valor que esté entre cualesquiera otros dos.
Por ejemplo, hasta hace unos años, cuando uno se subía a una báscula, lo máximo solían ser dos o
tres decimales: (50.35: 50 kilos y 350 gramos…). Realmente, usar más de dos o tres decimales para
el peso en kilos de una persona no ofrece ningún interés. Sin embargo, está claro que podrían
construirse básculas de baño con mucha mayor precisión, ofreciendo un número mayor de
decimales (otra cosa es que se vendieran).
De manera general, consideraremos que una variable continua toma valores en un intervalo (por
ejemplo: el peso de un grupo de personas varía entre 40 y 100 kilos), y un dato podrá ser cualquier
número entre esos dos.
5- Representaciones. Ordenamientos de datos. Intervalos de clase.

Límites de clases. Número de clases. Marca de clases.
Los intervalos de clase se emplean si las variables toman un número
grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud

denominados clases. A cada clase se le asigna su frecuencia
correspondiente.
Límites de la clase, cada clase está delimitada por el límite inferior de la clase
y el límite superior de la clase. amplitud de la clase, amplitud de la clase es la
diferencia entre el límite superior e inferior de la clase.
Marca de clase, la marca de clase es el punto medio de cada intervalo y es el
valor que representa a todo el intervalo para el cálculo de algunos
parámetros.
Construcción de una tabla con Intervalos de clase

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20,
11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
este caso son 3 y 48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y

que sea divisible por el número de intervalos de queramos poner.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50: 5 = 10

intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se
cuenta en el siguiente intervalo.
ci fi Fi ni Ni
[0, 5) 2.5 1 1 0.025 0.025
[5, 10) 7.5 1 2 0.025 0.050
[10, 15) 12.5 3 5 0.075 0.125
[15, 20) 17.5 3 8 0.075 0.200
[20, 25) 22.5 3 11 0.075 0.2775
[25, 30) 27.5 6 17 0.150 0.425
[30, 35) 32.5 7 24 0.175 0.600
[35, 40) 37.5 10 34 0.250 0.850
[40, 45) 42.5 4 38 0.100 0.950
[45, 50) 47.5 2 40 0.050 1
40 1
6- Reglas generales para formar las distribuciones de frecuencias.
Determinar el mayor y el menor entre los datos registrados y así encontrar el rango o diferencia
entre el mayor y el menor de los datos
Dividir el rango en un número conveniente de intervalos de clase del mismo tamaño. Si esto no es
posible, utilizar intervalos de clase de diferente tamaño o intervalos de clase abiertos. El número de
intervalos de clase se toma generalmente entre 5 y 20 dependiendo de los datos. Los intervalos de
clase se eligen también de forma que las marcas de clase o puntos medios coincidan con datos
realmente observados.
Determinar el número de observaciones que caen dentro de cada intervalo de clase, es decir
encontrar las frecuencias de clase.

DISTRIBUCIONES DE FRECUENCIA RELATIVA
La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total de frecuencia de
todas las clases y se expresa generalmente como porcentaje.

DISTRIBUCIONES DE FRECUENCIA ACUMULADA, OJIVAS.
La frecuencia total de todos los valores menores que el límite real superior de clase un intervalo de
clase dado se conoce como frecuencia acumulada.

DISTRIBUCIONES DE FRECUENCIA RELATIVA ACUMULADAS.
La frecuencia relativa acumulada o frecuencia porcentual acumulada es la frecuencia acumulada
dividida por la frecuencia total. Ejemplo: 65/ 100 = 65% es decir que los estudiantes tienen una
altura menor de 65%.

CURVAS DE FRECUENCIA. OJIVAS SUAVISADAS.
El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extraída de
una población grande. A causa de las muchas observaciones.
En resumen la distribución de frecuencia es una instrumento muy útil para resumir grandes
conjuntos de datos esta consiste en una representación de las categorías numéricas de la variable
junto con el número de entidades que se clasifican en cada categoría. Las distribuciones de
frecuencia se pueden presentar en forma tabular de tablas o de gráficas.
7- Histograma y polígonos de frecuencias.
Un histograma es una representación gráfica de una variable en forma de barras, teniendo en

cuenta que la superficie de cada barra es proporcional a la frecuencia de los valores representados.
Un histograma nos permite ver cómo se distribuyen los valores de la variable en estudio.
Pasos para construir un Histograma
Partimos de una tabla de frecuencias con datos agrupados y se siguen los siguientes pasos:
1. En el eje horizontal (X), colocamos los límites de clase.
2. En el eje vertical (Y), colocamos las frecuencias.
3. Dibujamos las barras de cada clase, teniendo en cuenta que la altura de cada barra es igual a la
frecuencia.
Ejemplo:
La lectura que se da en estos histogramas son a partir de los datos, se observan los que
aparecen como centrales y los de las esquinas o desviaciones. Las normas se establecen
a partir de donde se concentran más los datos y los casos poco frecuentes o muy
frecuentes serían los de los extremos
POLÍGONOS DE FRECUENCIA.
Un polígono de frecuencias es la gráfica que se obtiene al unir en forma consecutiva

con segmentos los puntos de intersección entre los puntos medios de cada clase y su
frecuencia, incluyendo el punto medio anterior a la primera clase y el punto medio
posterior a la última clase
Para construir el polígono de frecuencia se toma la marca de clase que coincide con el
punto medio de cada rectángulo (La construcción de los rectángulos es igual a cuando se
realiza un histograma).
8- Columnas y barras.
Los gráficos de barras y de columnas pueden presentar un determinado número de

campos de cantidad de forma atractiva. Normalmente se puede dibujar una capa
con gráficos de barras y de columnas si la capa contiene una determinada cantidad
de atributos numéricos a comparar. Las gráficas de barra/columna son útiles para
mostrar cantidades relativas más que proporciones o porcentajes.
Los siguientes ejemplos muestran el uso de gráficos de barras y columnas para

mostrar la distribución de la población por edad y condado.
Una capa de gráfico de barras de población por grupo de edad
Una capa de gráfico de columnas de población por grupo de edad.
9- Circular o pastel
Un diagrama circular o de pastel se puede utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas. Estas gráficas son muy frecuentes en
periódicos, revistas y publicaciones especializadas. Los datos se representan en un círculo, de
modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente.
Barra 100 %
Estos gráficos se utilizan para representar la participación relativa de las

categorías o componentes de una característica, con respecto al total de datos.
Es una barra un poco más ancha, cuya altura representa el 100% en el eje de las
ordenadas; está dividida según el número de componentes de la característica y
cada sector representa un área proporcional a su magnitud.
Puede ser una sola barra. También se usa para representar una serie cronológica
por medio de varias barras verticales menos gruesas; si la característica es
cualitativa se usan barras horizontales.
Gráfico N°20: se presenta el porcentaje de la población desocupada del país,
desagregada por región de planificación para el año 2005. Se observa que la
mayor área corresponde a la Región Central (67%) y el resto de las regiones
comprenden el restante 33% de población desocupada.
Gráfico N°21: se presenta el porcentaje de población ocupada del país para los
años 1995, 2000 y 2005.
El comportamiento de la distribución porcentual de la población ocupada es
similar para cada uno de los años comparados. La Región Central comprende un
porcentaje cercano al 66% de la población ocupada en cada de los años y las
otras cinco regiones comprenden del 34% restante. Esto muestra que no se
presentan cambios significativos en la distribución de la fuerza de trabajo y de las
fuentes de empleo en el país.
¿Qué similitudes existen entre el este gráfico de barras 100% y el circular?

Ventajas
 Representa la distribución relativa de una característica cualitativa.
 Utilizando varias barras, se pueden representar varias series cronológicas y
geográficas en un mismo gráfico; a diferencia del gráfico circular, es muy
cómodo y ocupa poco espacio.
Normas de presentación
 Los sectores no deben ser muy pequeños. Cuando hay muchos sectores
muy pequeños, se pueden agrupar en un solo sector.
 No se deben representar más de ocho categorías; ni menos de tres.
 Los sectores se ordenan de mayor a menor.
 El primer segmento, el de mayor tamaño relativo, se coloca en la base; y en
orden descendente se van colocando los demás sectores, hasta que el más
pequeño se coloca de último.
 Lo más frecuente, cuando se comparan en el tiempo varias barras 100%, es
ordenarlas de acuerdo con el año más antiguo. Pero dependiendo del
interés, se pueden ordenar de acuerdo con el año más reciente, o también,
ordenarlas en forma independiente para cada uno de los años de menor a
mayor.
 Si el gráfico no parece muy saturado, es bueno incluir en la barra el
respectivo porcentaje.
 Para identificar los sectores se usa la leyenda correspondiente al lado
derecho del gráfico.
I. Distribuciones de frecuencias acumuladas (ojiva)

En estadística, una ojiva es un gráfico que muestra la curva de una función
de distribución acumulativa dibujada a mano o en software de computadora.
Los puntos trazados son el límite de la clase superior y la frecuencia
acumulativa correspondiente.
¿Qué es una ojiva y para qué sirve?
Ojiva 200 SL es un herbicida de contacto no selectivo para aplicaciones post-
emergentes a la maleza. Ocasiona la muerte de la maleza pocas horas
después de su aplicación. Posee un buen control sobre maleza de hoja ancha y
algunos zacates anuales.
Calificaciones de Estadisticas
Nuestra representación en Ejemplo de información representada en Ojiva

con Frecuencia Acumulada
Otros (lineales, pictógrama y semi-logarítmico)

Linealizar consiste pues en encontrar una función lineal que pueda aproximar una
función dada alrededor de un punto. El primer paso para resolver un problema de
optimización es modelizar la realidad con lenguaje matemático, es decir, reescribirla
mediante variables y relaciones entre éstas.
Un pictograma es un dibujo figurativo o una representación gráfica que hace explícito

un objeto o un mensaje. Permite transmitir una idea o un concepto de forma rápida y
sencilla. El pictograma es especialmente eficaz para enviar un mensaje de carácter
informativo, obligatorio, de señalización o de peligro.
Semilogarítmico Una representación semilogarítmica es una representación gráfica de

una función o de un conjunto de valores numéricos, en la que el eje de abscisas o el eje
de ordenadas tienen escala logarítmica mientras el otro eje tiene una escala lineal o
proporcional.

Facilitacion #1 Estadistica

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Facilitacion #1 Estadistica

Cargado por

Copyright:

Formatos disponibles

1- Breve reseña histórica de la estadística.

 Estadística descriptiva o estadística deductiva; es la parte de la estadística que se ocupa de

 Estadística inferencial o estadística inductiva; es la estadística que tiene como objetivo

 Población; también conocido como universo o conjunto completo de individuos que

 Muestra; es un grupo acotado o reducido de todos los individuos de forman la población. Se

 Muestreo; es el procedimiento mediante el cual se obtiene una muestra. El muestreo puede

 Aleatoriedad de una muestra; es la característica mediante la cual todos los miembros de

 Homogeneidad de una muestra; es la característica mediante la cual las variables de la

 Independencia en la selección de una muestra; es la característica de la muestra que

 Muestreo simple; es el muestreo de tipo probabilístico, mediante el cual cualquier elemento

 Muestreo sistemático; es el muestro de tipo probabilístico, en el que el proceso de selección

 Muestreo por conglomerados; es el muestreo de tipo probabilístico en el que se extrae una

 Muestreo de conveniencia; es el muestreo de tipo no probabilístico en el que la muestra se

 Muestreo por cuota; es el muestreo de tipo no probabilístico, en el que la muestra se

 Muestreo por criterio; es el muestreo de tipo no probabilístico en el que el investigador

 Parámetro; es un índice que resume una determinada característica de la población,

 Estadístico; es un índice que resume una determinada característica de la muestra,

3- Población y muestra, estadísticos y parámetro.

4- Variables discretas y continuas.

5- Representaciones. Ordenamientos de datos. Intervalos de clase.

Se agrupan los valores en intervalos que tengan la misma amplitud

Construcción de una tabla con Intervalos de clase

2º Se restan y se busca un número entero un poco mayor que la diferencia y

Es conveniente que el número de intervalos oscile entre 6 y 15.

En este caso, 48 - 3 = 45, incrementamos el número hasta 50: 5 = 10

6- Reglas generales para formar las distribuciones de frecuencias.

7- Histograma y polígonos de frecuencias.

Un histograma es una representación gráfica de una variable en forma de barras, teniendo en

Un polígono de frecuencias es la gráfica que se obtiene al unir en forma consecutiva

Los gráficos de barras y de columnas pueden presentar un determinado número de

Los siguientes ejemplos muestran el uso de gráficos de barras y columnas para

Una capa de gráfico de columnas de población por grupo de edad.

Estos gráficos se utilizan para representar la participación relativa de las

¿Qué similitudes existen entre el este gráfico de barras 100% y el circular?

I. Distribuciones de frecuencias acumuladas (ojiva)

Nuestra representación en Ejemplo de información representada en Ojiva

Otros (lineales, pictógrama y semi-logarítmico)

Un pictograma es un dibujo figurativo o una representación gráfica que hace explícito

Semilogarítmico Una representación semilogarítmica es una representación gráfica de

También podría gustarte