Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Lectura Nucleo1
Lectura Nucleo1
NÚCLEO DE APRENDIZAJE 1
Introducción a la estadística descriptiva y
organización de datos en tablas de frecuencia
Contenido
2
1. Presentación del Curso
Recolectar
Organizar
Analizar
ESTADÍSTICA
Conjunto de
prodimientos que
permite:
Interpretar Procesar
Presentar Resumir
3
La estadística tiene dos grandes divisiones, la estadística descriptiva y la estadística inferencial.
st adística
E Para realizar diferentes concluisones
sobre el estudiado de un determinado
Descriptiva conjunto de datos.
4
2. Conceptos Básicos
Un estudio estadístico debe considerar los siguientes elementos:
Elemento Definición
Unidad de análisis Es el objeto del cual se desea obtener una información. Es decir que la población
o elementos es un conjunto de unidades de análisis.
Parámetro Es el número calculado sobre los datos de una población, que cuantifica una
característica de ella.
Es cada uno de los individuos, cosas, entes abstractos, etc., que integran una
Dato población determinada.
Denominados también atributos, son todos aquellos fenómenos que pueden ser
Variable Cualitativa descritos mediante palabras como clasificación de un grupo de personas por
ocupación, por sexo, por cargo, color de los ojos, etc.
Son todos aquellos fenómenos que pueden ser expresados numéricamente. Por
Variable Cuantitativa
ejemplo: peso, estatura, número de hijos, salarios, etc.
Variable Cuantitativa Son aquellas que admiten valores fraccionarios y de las que se pueden establecer
Continúa intervalos. Por ejemplo, una persona que mide un metro con setenta centímetros.
5
3. Nivel de medición
Las variables pueden ser medidas con mayor o menor grado de exactitud, según la escala de
medida utilizada para su observación. Podemos distinguir los siguientes niveles de medición de una
variable conocidas también como escalas de medida:
Variables
CUALITATIVAS CUANTITATIVAS
Continua
Ordinal Nominal Discreta
6
4. Métodos de recolección de datos
Para obtener información de la población o muestra a investiga se puede utilizar diferentes
métodos de recolección de datos, dentro de los cuales se tiene el censo, la encuesta o un registro
administrativo.
7
5. Organización de datos
Cuando se desea obtener información de un conjunto de datos a estudiar, se observan las
variables que encuentran bajo estudio, pero ellas por si solas son difíciles de manejar e interpretar
y no permiten detectar, en primera instancia, hechos importantes acerca del comportamiento de la
variable.
Un primer paso para manejar e interpretar los datos consiste en agrupar la información, clasificando
los datos según los diferentes valores que pueda presentar la característica, valores que constituirán
las diferentes categorías o clases de la clasificación.
Estos métodos dependen del tipo de variable que se esté analizando y de la escala de medida. En
primera instancia debemos identificar a qué tipo de datos nos estamos enfrentando para realizar una
correcta organización.
Variables Cualitativas
No agrupados
Variables cuantitativas
discretas (< 10) datos
diferentes.
Tipos de datos
Variables Cuantitativas
discretas (>10) datos
diferentes.
Agrupados
Variables Cuantitativas
Continuas.
8
6. Distribuciones de frecuencias
En cualquier estudio estadístico, uno de los primeros pasos consiste en resumir la información de
la muestra en una tabla en la que, a cada valor de la variable se le asocia ciertos números denominados
frecuencias. Las frecuencias están asociadas con la cantidad de veces que aparece cada dato en el
conteo.
Gato 10
Perro 10
Pájaro 5
Pez 5
9
6.2. Frecuencia Relativa
La frecuencia relativa se puede expresar en forma de fracción, como un numero decimal o como un
porcentaje
Ejemplo 2: en la tabla se observan las frecuencias relativas de los datos del ejemplo anterior.
10
6.2.1. Frecuencia acumulada
La frecuencia acumulada es la suma de la frecuencia absoluta de un dato con todas las frecuencias
absolutas de los datos que la preceden.
Gato 10 10
Perro 10 20
Pájaro 5 25
Pez 5 30
11
6.2.2. Distribuciones de frecuencias para datos cualitativos
(tabla no agrupada)
Cuando en una población se hace un estudio de gustos o preferencias se dice que se está analizando
una variable cualitativa en dicha población.
Entonces al realizar una distribución de frecuencias de variables cualitativas donde las categorías
están determinadas, lo único que hay que hacer es contar el número de casos pertenecientes a cada
categoría y normalizar en relación al número total de casos, calculando una proporción, un porcentaje
o una razón.
f h F
12
6.2.3. Distribuciones de frecuencias para variable cuantitativa
discreta (tabla no agrupada)
Cuando se trata de variables cuantitativas, el resumen de los datos consiste en organizar tablas
que sintetizan los datos originales es decir en tablas de distribuciones de frecuencia.
2 4 2 4 3 5 4 3 4 2 4 3 2
2 2 4 5 3 4 3 4 1 1 5 3 4
3 4 1 3
1 3 0,1 3 0,1
2 6 0,2 9 0,3
3 8 0,266 17 0,566
4 10 0,393 27 0,899
5 3 0,1 30 0,999
13
6.2.4. Distribuciones de frecuencias para variable cuantitativa
continua (tabla agrupada)
Para este tipo de variables se deben tener en cuenta los siguientes elementos:
Frecuencia del intervalo: número de individuos o datos que se está clasificando en cada intervalo
se representa con la letra f.
Frecuencia acumulada: es la sumatoria del número de individuos que están en los intervalos
anteriores y la frecuencia del intervalo anterior. Se representa por F.
Frecuencia relativa acumulada: se representa por H y se plantea como la relación entre la frecuencia
acumulada y el total de la muestra, es decir, H=F/n.
Marca de clase: es el punto medio de cada intervalo y se considera como el dato más representativo
de dicho intervalo. Se representa por Mi.
Primero: se calcula el número de intervalos. Para ello se utiliza la siguiente expresión: Nº intervalos
≈ √n
Segundo: se calcula el rango de la distribución, que es la diferencia entre el dato mayor (DM) y el dato
menor (Dm) de la base de datos: Rango= D_M- D_m
Tercero: se calcula el tamaño de cada intervalo Tamaño= Rango/(Nº intervalos)= (D_M- D_m)/√n.
Cuarto: se construyen los intervalos. Para ello, se toma el dato menor como límite inferior del primero
intervalo y a este se le suma el tamaño del intervalo para encontrar el límite superior. Para el segundo
intervalo, se toma como límite inferior, el límite superior del intervalo más uno.
Quinto: se ubica los datos en la tabla comenzando con la frecuencia y luego completando las columnas
mencionadas al inicio de esta explicación.
14
Ejemplo:
Para determinar los factores óptimos de crecimiento de un hongo comestible, un equipo de ingenieros
de alimentos realizó un experimento que consistió en cultivar dicho hongo en 50 muestras diferentes
y observar, después de 60 días, los cuerpos fructíferos que género cada cultivo. Los resultados se
presentan a continuación:
123 116 167 198 165 148 169 110 121 100
145 132 145 126 176 189 163 101 120 109
135 127 178 187 180 166 134 129 118 102
167 185 183 177 156 145 167 143 132 121
145 128 119 117 140 121 164 129 132 140
Cuarto: intervalos
Séptimo intervalo:
Límite inferior: 190
Límite superior: 190 + 14= 204
15
Quinto:
Clase f H % F H Mi
• 14 de los hongos dieron entre 115 y 129 cuerpos fructíferos. Este valor fue el más alto registrado en
el experimento y equivale al 28%.
• 8 hongos estuvieron entre 130 y 144 cuerpos fructíferos, igualmente 8 hongos estuvieron entre 160
y 174, lo mismo pasa con los 8 hongos de dieron entre 175 y 189. En cada caso corresponde al 16%
16
Bibliografía
• Lind D.A., Marchall W.G, Wathen S.A. Estadística para Administración y Economía, Decimo
tercera edición .Mc Graw Hill 2008
• Lincoln L.CH., Estadística para las Ciencias Administativas, 3 ed. Mc. Graw Hill 1993.
17
Politécnico Internacional, Institución de Educación Superior SNIES 4727 Resolución No. 4135 del 11 de nov. de 2004
Todos los derechos reservados ® 2017
Vigilado por el Ministerio de Educación Nacional.
18