Está en la página 1de 18

ESTADÍSTICA

NÚCLEO DE APRENDIZAJE 1
Introducción a la estadística descriptiva y
organización de datos en tablas de frecuencia
Contenido

1. Presentación del Curso. ................................................................................................ 3


2. Conceptos Básicos. ...................................................................................................... 5
3. Nivel de medición.......................................................................................................... 6
4. Métodos de recolección de datos. ................................................................................. 7
5. Organización de datos. ................................................................................................. 8
6. Distribuciones de frecuencias. ....................................................................................... 9
6.1. Frecuencia Absoluta. ........................................................................................ 9
6.2. Frecuencia Relativa. ........................................................................................ 10
6.2.1. Frecuencia Acumulada...................................................................................11
6.2.2. Distribuciones de frecuencias para datos cualitativos
(tabla no agrupada). ....................................................................................... 12
6.2.3. Distribuciones de frecuencias para variable cuantitativa discreta
(tabla no agrupada). ....................................................................................... 13
6.2.4. Distribuciones de frecuencias para variable cuantitativa continua
(tabla agrupada) ............................................................................................. 14
7. Bibliografía. ................................................................................................................... 17

2
1. Presentación del Curso

Recolectar

Organizar
Analizar

ESTADÍSTICA
Conjunto de
prodimientos que
permite:
Interpretar Procesar

Presentar Resumir

3
La estadística tiene dos grandes divisiones, la estadística descriptiva y la estadística inferencial.

Recolecta, representa y caracteriza


un conjunto de datos.

st adística
E Para realizar diferentes concluisones
sobre el estudiado de un determinado
Descriptiva conjunto de datos.

Utiliza tablas, graficos y medidas


representativas par mostrar el
comportamineto de los datos.

Trabaja con pequeños grupos


representativos de datos (muestras),
obtenidos de un grupo grande
(población).

Estadística Se realizan inferencias sobre le grupo


grande de datos a partir de los datos
obtenidos del grupo pequeño.
Inferencial
Este proceso no se realiza con certeza
absoluta, aunque si se puede medir el
nivel de confibilidad.

4
2. Conceptos Básicos
Un estudio estadístico debe considerar los siguientes elementos:

Elemento Definición

Conjunto de elementos, o personas a las cuales se les va realizar un estudio, con


características en común de las cuales se desea obtener una determina información.
Población La población se debe definir por medio de tiempo y del espacio, además el tamaño
de la población puede ser finito si es posible determinar la cantidad de elementos
de los cuales se pretende realizar el estudio.

Unidad de análisis Es el objeto del cual se desea obtener una información. Es decir que la población
o elementos es un conjunto de unidades de análisis.

Es el subconjunto de unidades de análisis de una población, este subconjunto


debe ser una parte representativa de la población dada, con el que se pretende
suministrar información sobre la población. Para que este subconjunto de unidades
de análisis sea representativo debe reunir unos requisitos de acuerdo a la población
Muestra a estudiar.
Se elige una muestra cuando la población a analizar tiene una cantidad infinita de
elementos, o cuando la población es tan grande que realizar el estudio completo
tiene un costo muy elevado.

Parámetro Es el número calculado sobre los datos de una población, que cuantifica una
característica de ella.

Es el número calculado a partir de los datos de la muestra, que cuantifica una


Estadística característica de ella.

Es cada uno de los individuos, cosas, entes abstractos, etc., que integran una
Dato población determinada.

Es la característica de la población o muestra que se va observar o a la cual se le


Variable
va a realizar el estudio.

Denominados también atributos, son todos aquellos fenómenos que pueden ser
Variable Cualitativa descritos mediante palabras como clasificación de un grupo de personas por
ocupación, por sexo, por cargo, color de los ojos, etc.

Son todos aquellos fenómenos que pueden ser expresados numéricamente. Por
Variable Cuantitativa
ejemplo: peso, estatura, número de hijos, salarios, etc.

Toman solamente valores enteros, es decir no tienen valores intermedios, por


Variable Cuantitativa
ejemplo, el número de hijos por familia, puesto que no se puede decir que una
Discreta familia tiene dos hijos y medio.

Variable Cuantitativa Son aquellas que admiten valores fraccionarios y de las que se pueden establecer
Continúa intervalos. Por ejemplo, una persona que mide un metro con setenta centímetros.

5
3. Nivel de medición

Las variables pueden ser medidas con mayor o menor grado de exactitud, según la escala de
medida utilizada para su observación. Podemos distinguir los siguientes niveles de medición de una
variable conocidas también como escalas de medida:

Variables
CUALITATIVAS CUANTITATIVAS
Continua
Ordinal Nominal Discreta

permite clasificar, ordenar


Clasifica a los elementos y medir la distancia entre
en distintas categorías clasifica las unidades de Es numérica decimal
las diferentes categorías.
estableciendo relaciones análisis en categorías.
La representación de la
de orden entre las variable es numérica y
mismas. entera

6
4. Métodos de recolección de datos
Para obtener información de la población o muestra a investiga se puede utilizar diferentes
métodos de recolección de datos, dentro de los cuales se tiene el censo, la encuesta o un registro
administrativo.

Es un método de recolección de datos, en el cual la informacion


se obtine del total de datos que componen la población que se
encuentra bajo estudio.

Censo El término censo se aplica a aquellos estudios que comprenden


todas las unidades de todo un país y que se realizan con una
frecuencia de recolección quinquenal o decenal, como es el
caso de los censos de población, económicos, entre otros.

Es un método de recolección, mediante el cual, la información


se obtiene sólo de un subconjunto o muestra de elementos de
la población en estudio, que permite obtener información sobre
él mismo.

Para que la información obtenida con la encuesta sea generalizable


a la población, la muestra utilizada debe ser representativa de la
población de la que proviene. Para lograrlo, se utilizan métodos
Encuesta
de selección de unidades especialmente diseñados con este fin.

Para diseñar correctamente una encuesta es necesario tomar


en consideración algunos elementos básicos tales como: titulo,
instrucciones, cuerpo del instrumento, identificación del
formulario, del encuestrado y del encuentador

Existen oficinas públicas que llevan registros administrativos


para sus propios fines. Por ejemplo; los Registros Civiles que
registran los nacimientos, los casamientos, las defunciones,
Registro etc., los Ministerios de Educación que llevan registros de
matriculación de alumnos, deserción escolar, etc., la
Administrativo Aduana que registra las importaciones y exportaciones, etc.

Esta información puede ser utilizada con fines estadísticos.

7
5. Organización de datos
Cuando se desea obtener información de un conjunto de datos a estudiar, se observan las
variables que encuentran bajo estudio, pero ellas por si solas son difíciles de manejar e interpretar
y no permiten detectar, en primera instancia, hechos importantes acerca del comportamiento de la
variable.

Un primer paso para manejar e interpretar los datos consiste en agrupar la información, clasificando
los datos según los diferentes valores que pueda presentar la característica, valores que constituirán
las diferentes categorías o clases de la clasificación.

Existen métodos para resumir los datos medidos u observados.

Estos métodos dependen del tipo de variable que se esté analizando y de la escala de medida. En
primera instancia debemos identificar a qué tipo de datos nos estamos enfrentando para realizar una
correcta organización.

Variables Cualitativas

No agrupados
Variables cuantitativas
discretas (< 10) datos
diferentes.

Tipos de datos
Variables Cuantitativas
discretas (>10) datos
diferentes.

Agrupados
Variables Cuantitativas
Continuas.

8
6. Distribuciones de frecuencias
En cualquier estudio estadístico, uno de los primeros pasos consiste en resumir la información de
la muestra en una tabla en la que, a cada valor de la variable se le asocia ciertos números denominados
frecuencias. Las frecuencias están asociadas con la cantidad de veces que aparece cada dato en el
conteo.

6.1. Frecuencia absoluta


La frecuencia absoluta de un dato es el número de veces que éste se repite dentro del conjunto
de valores de la variable.

Ejemplo 1: se pregunto a 30 personas acerca de su mascota preferida y se obtuvo los siguientes


resultados:

Gato perro perro pez pájaro Gato


Pez Gato Perro Perro Gato Pájaro
Gato perro perro pez pájaro Gato
Pez Gato Perro Perro Gato Pájaro
Gato perro perro pez pájaro Gato

Mascota Frecuencia Absoluta

Gato 10
Perro 10
Pájaro 5
Pez 5

9
6.2. Frecuencia Relativa

La frecuencia relativa de un dato es aquella que se obtiene como el cociente de su frecuencia


absoluta entre el número total de datos.

La frecuencia relativa se puede expresar en forma de fracción, como un numero decimal o como un
porcentaje

Ejemplo 2: en la tabla se observan las frecuencias relativas de los datos del ejemplo anterior.

Mascota Frecuencia Absoluta Frecuencia Relativa


Fracción Numero Decimal Porcentaje

Gato 10 10/30 0,33 33,3%


Perro 10 10/30 0,33 33,3%
Pájaro 5 5/30 0,16 16,6%
Pez 5 5/30 0,16 16,6%

10
6.2.1. Frecuencia acumulada

La frecuencia acumulada es la suma de la frecuencia absoluta de un dato con todas las frecuencias
absolutas de los datos que la preceden.

Ejemplo 3: en la tabla se observa las frecuencias acumuladas del ejemplo 1

Mascota Frecuencia Absoluta Frecuencia Acumulada

Gato 10 10
Perro 10 20
Pájaro 5 25
Pez 5 30

11
6.2.2. Distribuciones de frecuencias para datos cualitativos
(tabla no agrupada)

El objetivo central de la estadística es el análisis de datos a partir de la recopilación y organización


de ellos. Esto permite tomar decisiones frente a diversos temas que requieren una empresa, compañía
o entidad.

Cuando en una población se hace un estudio de gustos o preferencias se dice que se está analizando
una variable cualitativa en dicha población.

Entonces al realizar una distribución de frecuencias de variables cualitativas donde las categorías
están determinadas, lo único que hay que hacer es contar el número de casos pertenecientes a cada
categoría y normalizar en relación al número total de casos, calculando una proporción, un porcentaje
o una razón.

Ejemplo 4: se pregunto a 30 personas acerca de su mascota preferida y se obtuvo los siguientes


resultados:

Gato perro perro pez pájaro Gato


Pez Gato Perro Perro Gato Pájaro
Gato perro perro pez pájaro Gato
Pez Gato Perro Perro Gato Pájaro
Gato perro perro pez pájaro Gato

f h F

Mascota Frecuencia Absoluta Frecuencia Relativa Frecuencia Acumulada


Fracción Numero Decimal Porcentaje

Gato 10 10/30 0,33 33,3% 10


Perro 10 10/30 0,33 33,3% 20
Pájaro 5 5/30 0,16 16,6% 25
Pez 5 5/30 0,16 16,6% 30

12
6.2.3. Distribuciones de frecuencias para variable cuantitativa
discreta (tabla no agrupada)

Cuando se trata de variables cuantitativas, el resumen de los datos consiste en organizar tablas
que sintetizan los datos originales es decir en tablas de distribuciones de frecuencia.

Ejemplo 5: el departamento de mercadotecnia de una empresa fabricante de productos de belleza


planea poner en el mercado una nueva marca de cremas antiarrugas. Para ello, decide preguntar
cuántas cremas las usuarias han utilizado de su línea facial actual. A continuación, se presentan los
resultados.

2 4 2 4 3 5 4 3 4 2 4 3 2
2 2 4 5 3 4 3 4 1 1 5 3 4
3 4 1 3

Numero de cremas que Frecuencia absoluta Frecuencia relativa


han utilizado las Frecuencia absoluta Frecuencia relativa acumulada acumulada
usuarias f h F H

1 3 0,1 3 0,1
2 6 0,2 9 0,3
3 8 0,266 17 0,566
4 10 0,393 27 0,899
5 3 0,1 30 0,999

13
6.2.4. Distribuciones de frecuencias para variable cuantitativa
continua (tabla agrupada)

Para este tipo de variables se deben tener en cuenta los siguientes elementos:

Intervalos de clases: se ubica en la primera columna de la tabla. En cada intervalo se incluye


el grupo de datos que está entre el valor donde inicia (límite inferior) y el valor en el que termina (límite
superior). Tiene la particularidad de ser disjuntos y ordenados, lo cual implica que cada dato queda
incluido en uno y solo un intervalo.

Frecuencia del intervalo: número de individuos o datos que se está clasificando en cada intervalo
se representa con la letra f.

Frecuencia relativa: relación entre la frecuencia y el total de la muestra o población: se representa


como h. esta relación se expresa mediante el cociente f/n en donde n es el número de datos. Al
multiplicar h por 100 se obtiene el porcentaje de los datos que están en dicha clase.

Frecuencia acumulada: es la sumatoria del número de individuos que están en los intervalos
anteriores y la frecuencia del intervalo anterior. Se representa por F.

Frecuencia relativa acumulada: se representa por H y se plantea como la relación entre la frecuencia
acumulada y el total de la muestra, es decir, H=F/n.

Marca de clase: es el punto medio de cada intervalo y se considera como el dato más representativo
de dicho intervalo. Se representa por Mi.

Para elaborar una tabla de distribuciones de frecuencias se realiza el siguiente procedimiento:

Primero: se calcula el número de intervalos. Para ello se utiliza la siguiente expresión: Nº intervalos
≈ √n

Segundo: se calcula el rango de la distribución, que es la diferencia entre el dato mayor (DM) y el dato
menor (Dm) de la base de datos: Rango= D_M- D_m

Tercero: se calcula el tamaño de cada intervalo Tamaño= Rango/(Nº intervalos)= (D_M- D_m)/√n.

Cuarto: se construyen los intervalos. Para ello, se toma el dato menor como límite inferior del primero
intervalo y a este se le suma el tamaño del intervalo para encontrar el límite superior. Para el segundo
intervalo, se toma como límite inferior, el límite superior del intervalo más uno.

Quinto: se ubica los datos en la tabla comenzando con la frecuencia y luego completando las columnas
mencionadas al inicio de esta explicación.

14
Ejemplo:
Para determinar los factores óptimos de crecimiento de un hongo comestible, un equipo de ingenieros
de alimentos realizó un experimento que consistió en cultivar dicho hongo en 50 muestras diferentes
y observar, después de 60 días, los cuerpos fructíferos que género cada cultivo. Los resultados se
presentan a continuación:

123 116 167 198 165 148 169 110 121 100

145 132 145 126 176 189 163 101 120 109

135 127 178 187 180 166 134 129 118 102

167 185 183 177 156 145 167 143 132 121

145 128 119 117 140 121 164 129 132 140

Primero: Nº de intervalos= √50=7,07 ≈7

Segundo: D_M=198 y D_m=100,


Rango=198-100=98

Tercero: Tamaño= Rango/(Nº intervalos)= (D_M- D_m)/√n= 98/7=14

Cuarto: intervalos

Primer intervalo: Cuarto intervalo:


Límite inferior: 100 Límite inferior: 145
Límite superior: 100 + 14= 114 Límite superior: 450 + 14= 159

Segundo intervalo: Quinto intervalo:


Límite inferior: 115 Límite inferior: 160
Límite superior: 150 + 14= 129 Límite superior: 160 + 14= 174

Tercer intervalo: Sexto intervalo:


Límite inferior: 130 Límite inferior: 175
Límite superior: 130 + 14= 144 Límite superior: 175 + 14= 189

Séptimo intervalo:
Límite inferior: 190
Límite superior: 190 + 14= 204

15
Quinto:

Clase f H % F H Mi

[100, 114] 5 5/50 10 5 5/50 107


[115, 129] 14 14/50 28 19 19/50 122
[130, 144] 8 8/50 16 27 27/50 137
[145, 159] 6 6/50 12 33 33/50 152
[160, 174] 8 8/50 16 41 41/50 167
[175, 189] 8 8/50 16 49 49/50 182
[190, 204] 1 1/50 2 50 50/50 197

Con base en la tabla se puede concluir, entre otras cosas que:

• 14 de los hongos dieron entre 115 y 129 cuerpos fructíferos. Este valor fue el más alto registrado en
el experimento y equivale al 28%.

• 8 hongos estuvieron entre 130 y 144 cuerpos fructíferos, igualmente 8 hongos estuvieron entre 160
y 174, lo mismo pasa con los 8 hongos de dieron entre 175 y 189. En cada caso corresponde al 16%

16
Bibliografía

• Martínez B. C., Estadística y Muestreo. 11 ed., ECOE, 2002.

• Lind D.A., Marchall W.G, Wathen S.A. Estadística para Administración y Economía, Decimo
tercera edición .Mc Graw Hill 2008

• Lincoln L.CH., Estadística para las Ciencias Administativas, 3 ed. Mc. Graw Hill 1993.

17
Politécnico Internacional, Institución de Educación Superior SNIES 4727 Resolución No. 4135 del 11 de nov. de 2004
Todos los derechos reservados ® 2017
Vigilado por el Ministerio de Educación Nacional.

18

También podría gustarte