Está en la página 1de 34

ESTADÍSTICA DESCRIPTIVA

Parte 1
Es una colección de métodos / herramientas para planificar y realizar
experimentos o estudios, obtener datos y luego analizar, interpretar, y formular
conclusiones basadas en los datos.
Es la ciencia de los datos; implica la recolección, clasificación, síntesis,
organización, análisis e interpretación de los datos

Proporciona una metodología


La Estadística actúa como nexo
para evaluar y juzgar las
entre los modelos teóricos y los
discrepancias entre la realidad y
fenómenos reales
la teoría

Se la utiliza como tecnología transversal al servicio de las ciencias......


A) Organizar y resumir datos y extraer información relevante.
B) Buscar y evaluar el ajuste de los modelos teóricos con la realidad.
C) Contribuir al diseño de experimentos y encuestas.
D) Facilitar la comunicación entre la ciencia y la sociedad en general.
POBLACIÓN Y MUESTRA

La población representa la colección completa de elementos o


resultados sobre la información buscada.
• Finita: cuando en la práctica puede ser físicamente listada
(Número de lámparas incandescentes producidas en un día).

• Infinita: cuando en la práctica no puede ser físicamente listada


(Cantidad de neumáticos que entran en desuso por año).

La muestra constituye un subconjunto de la población, que contiene


elementos o resultados representativos de dicha población.

Muestra

Población
LA ESTADÍSTICA QUE ABARCA NUESTRO CURSO

La estadística descriptiva se dedica a la organización, síntesis


y descripción de conjuntos de datos

La estadística inferencial se ocupa de utilizar datos de una


muestra (elementos de un subconjunto del total) para inferir algo
acerca de la población (elementos del conjunto total)

Descripción y análisis de un
Estadística grupo de datos, sin sacar
Datos
descriptiva conclusiones sobre un
conjunto mayor

Datos Estimaciones sobre la


Estadística población desconocida
(Muestra)
inferencial a partir de una muestra
VARIABILIDAD DE FENÓMENOS
Longitud (en cm) de 50 varillas de acero
Tiempos de ciclo de un pistón (seg.)
Fuente: Kenett y Zacks.
Fuente: Kenett y Zacks.
1,008 1,117 1,141 0,449 0,215 20,1
1,098 1,080 0,662 1,057 1,107

Longitud de la varilla
1,120 0,206 0,531 0,437 0,348 20,05

Tolerancia
0,423 0,330 0,280 0,175 0,213
20
1,021 0,314 0,489 0,482 0,200
1,069 1,132 1,080 0,275 0,187 19,95
0,271 0,586 0,628 1,084 0,339
0,431 1,118 0,302 0,287 0,224 19,9
0 10 20 30 40 50 60
1,095 0,319 0,179 1,068 1,009
1,088 0,664 1,056 1,069 0,560 Número de medición

ENTRADAS SALIDA V
(Producto) A
P R
Causas Métodos trab. I
R A
Mano de obra
O B
Máquinas C I
Materia prima E L
I
Medio amb. lab. S D
O A
D
ALEATORIEDAD - Ejemplo: Se toman datos del proceso de fabricación de
varillas para ver si las modificaciones realizadas en el proceso lo han mejorado.
Para ello, se tomaron tres muestras de cincuenta mediciones cada una.

¿Podemos afirmar que cada una de las muestras puede ser catalogada como aleatoria?
a) Los valores indican un patrón definido en el tiempo. No es una muestra aleatoria .
b) Los valores muestran una tendencia en el tiempo. No es una muestra aleatoria.
c) Los valores no muestran un patrón o tendencia. Puede ser apropiado tratarlos como una
muestra aleatoria.
¿Es razonable considerar, en los casos d) y e), a los resultados de c) como una muestra
aleatoria representativa, siendo que los datos fueron tomados solo durante la mañana?
d) El proceso productivo se realiza de 7 a.m. a 5 p.m. NO
e) El proceso productivo se realiza de 7 a.m. a 12 a.m. SI
VARIABLES Y DATOS (1)
Estudio observacional: vemos y/o medimos características específicas,
pero no intentamos modificar a los sujetos que estamos estudiando
Experimento: aplicamos algunos tratamientos y luego procedemos a
observar sus efectos sobre los sujetos. En los experimentos, los sujetos se
denominan unidades experimentales

Una unidad experimental es aquella


sobre la cual se efectúan mediciones u Proceso
observaciones
¿Qué
Una variable es una característica que característica
cambia o varía de una unidad de la unidad
experimental a otra, la cual puede ser experimental Muestra
nos interesa?
medible u observable
La longitud
Un dato es un registro en una
determinada escala de una variable de la
unidad experimental, como parte de un
proceso de medición u observación.
Escala
19,95 20 20,05
VARIABLES Y DATOS (2)

Nominales: se consignan mediante etiquetas o


nombres que no se pueden ordenar (profesión;
Variables residencia; nacionalidad; etc.)
cualitativas o Ordinales: se consignan mediante etiquetas o nombres
que se ordenan (clasificación de estaturas: baja, media
categóricas y alta; clasificación de exámenes: malo, regular, y
bueno; etc.)

Discretas: corresponden a valores separados entre sí,


por alguna cantidad, y surgen por conteo. Pueden
comprender un número finito de valores enteros
Variables (Número de defectos en un alambre, etc.)
cuantitativas Continuas: surgen de mediciones efectuadas sobre
o numéricas cada unidad experimental. Pueden tomar infinitos
valores, que corresponden a una escala continua que
cubre un rango de valores sin interrupciones o saltos
(Longitud de varillas de acero, etc.)
VARIABLES Y DATOS (3)
ANALIZAR
VARIABLES Y DATOS (4)
ANALIZAR
ESCALAS DE MEDICIÓN (1)
Una medición es la asignación de un número o código al registro
obtenido a partir de la valoración de una característica de la unidad
experimental.

Una escala es la herramienta sobre la que se referencian los


registros obtenidos en una observación o medición. Un registro sobre
una escala implica un dato.

1 - PARA DATOS CUALITATIVOS o CATEGÓRICOS

Escala nominal: los datos se clasifican en categorías (Ejemplos:


tipo de actividad laboral, tipo de religión, etc.)

Escala ordinal: los datos muestran las propiedades de los datos


nominales, pero además se establece un orden o jerarquía de esos
datos (Ejemplos: nivel de instrucción: muy bueno, bueno, regular,
malo; clase social: alta, media, baja; etc.)
ESCALAS DE MEDICIÓN (2)
2 - PARA DATOS CUANTITATIVOS o NUMÉRICOS

Escala de intervalo: los datos tienen las propiedades de los datos


ordinales, pero además se asignan distancias entre ellos. Establece
intervalos iguales y números consecutivos de registro. Este tipo de
datos siempre es numérico, y el valor cero no indica la ausencia de
la característica evaluada (Ejemplos: lapsos de tiempo de
producción, temperatura en ºC de una ciudad, etc.)

Escala de razón: los datos tienen todas las propiedades de los


datos de intervalo, y la proporción entre ellos tiene sentido. Se
requiere que el valor cero de la escala indique la ausencia de la
propiedad a medir (Ejemplos: peso de una persona, estatura de una
persona, tiempo utilizado para una tarea, temperatura en ºK de una
ciudad, etc.)
ESCALAS DE MEDICIÓN (3)

CARACTERÍSTICAS DE LAS DIFERENTES ESCALAS DE MEDIDA DE VARIABLES

Ochoa Sangrador & Molina Arias (2018)


ESCALAS DE MEDICIÓN (4)
RAZONAR
ESCALAS DE MEDICIÓN (5)

RAZONAR
DATOS / INFORMACIÓN
Datos = Hechos, realidades
Información = Respuestas a preguntas
La “Información incluye “datos”
Los “datos” no necesariamente incluyen “información”
La clave no está en como obtener los datos, sino en, para qué se los
obtiene (que información se necesita)
El proceso de generar información:
1. Formular claramente la pregunta que se desea contestar.
2. Recopilar datos relativos a la cuestión planteada.
3. Analizar los datos para determinar la respuesta a la pregunta formulada.
4. Presentar los datos de forma adecuada para responder claramente cuál
es la respuesta a la pregunta (implica obtener información).
MUESTREO (1)
DEFINICIONES

En una muestra aleatoria los miembros de la población se


seleccionan de forma que cada miembro individual tenga la misma
posibilidad de ser elegido.

Una muestra aleatoria simple de n sujetos se selecciona de


manera que cada posible muestra del mismo tamaño n tenga la
misma posibilidad de ser elegida.

Si los datos muestrales no se reúnen de forma adecuada,


resultarían tan inútiles que ninguna cantidad compleja de
herramientas estadísticas podrá ″salvarlos″.
MÉTODOS DE MUESTREO (2)
Otros procedimientos de muestreo comunes
MÉTODOS DE MUESTREO (3)
MÉTODOS DE MUESTREO (4)
MÉTODOS DE MUESTREO (5)
RAZONAR
DISTRIBUCIÓN DE FRECUENCIAS (1)
Se ha preguntado a un conjunto de n Conjunto de datos
personas qué opinión tienen acerca 756865958657554585426646
de la aprobación de determinada Ley. 484343314565854743534942
Las n respuestas se organizaron en 634241363124462474246446
una escala que va de 1 a 9, donde 1 758576565756454165655546
representa un total desacuerdo con la 255654435594365732447421
Ley, mientras que 9 quiere significar 827455755158567667752565
un acuerdo total. 853655
Intentemos responder a las siguientes preguntas: Tabla 1
1) ¿Cuántas personas fueron encuestadas?
2) ¿Cuál fue la respuesta más frecuente?
3) ¿Cuántas personas contestaron entre uno y cuatro puntos en la escala?
Conjunto ordenado de datos
Conjunto ordenado de datos (menor a mayor)
(indicando repeticiones)
111111222222222223333333333
334444444444444444444444444 1 (6), 2 (11), 3 (12),
444445555555555555555555555 4 (30),
555555555555555555666666666 5 (40),
666666666666666777777777777 6 (25),
77888888888999 7 (14), 8 (9), 9 (3)
Tabla 2 Tabla 3
DISTRIBUCIÓN DE FRECUENCIAS (2)
Se denomina frecuencia ó frecuencia absoluta (f) al número de veces
que se repite un dato en particular.
Tabla de frecuencias
La suma de las frecuencias n
X f
absolutas es igual al número total
de datos u observaciones (n)
∑f
i =1
i =n 1 6
2 11
Los datos pueden ser ordenados de acuerdo a 3 12
determinada característica, llamada clase 4 30
5 40
Un arreglo tabular de los datos por clases junto 6 25
con sus correspondientes frecuencias de clase, 7 14
se denomina distribución de frecuencias ó 8 9
tabla de frecuencias 9 3
Total 150 (n)
Los datos organizados en clases se llaman datos agrupados
Tabla 4

La tabla de frecuencias permite responder con facilidad a las preguntas planteadas:

1) ¿Cuántas personas fueron encuestadas? Solución: 150


2) ¿Cuál fue la respuesta más frecuente? Solución: 5 (para 40 datos)
DISTRIBUCIÓN DE FRECUENCIAS (3)
Para la pregunta: 3) ¿Cuántas personas contestaron entre uno y cuatro puntos en
la escala? Solución: 59 (6+11+12+30)

Se denomina frecuencia absoluta acumulada (F) de la clase j, al número


resultante de sumar la frecuencia de la clase j con las frecuencias de las clases que
la anteceden.
Formulemos la siguiente pregunta: Tabla de frecuencias f y F (Tabla 5)
¿Cuántas personas han respondido con valor 5?
X f F
Solución: 40
Datos (Tabla 6) 1 6 6
Datos nuevos (Tabla 7) 2 11 17
X f X f 3 12 29
1 6 1 200 4 30 59
2 11 2 170 5 40 99
3 12 3 120 6 25 124
4 30 4 60 7 14 138
5 40 5 40 8 9 147
6 25 6 60 9 3 150
7 14 7 120 Total 150
8 9 8 170
9 3 9 200
Total 150 Total 1.140
DISTRIBUCIÓN DE FRECUENCIAS (4)
Distribución de frecuencias absolutas (f) Datos nuevos (T 6) Datos (Tabla 5)
y frecuencias absolutas relativas (fr) X f fr f fr
1 200 0,1754 6 0,0400
Se denomina frecuencia absoluta 2 170 0,1491 11 0,0733
relativa (fr) de la clase j al cociente 3 120 0,1053 12 0,0800
4 60 0,0526 30 0,2000
entre la frecuencia de la clase j y el 5 40 0,0351 40 0,2667
número total de datos (n) 6 60 0,0526 25 0,1667
7 120 0,1053 14 0,0933
8 170 0,1491 9 0,0600
frj = fj / n 9 200 0,1754 3 0,0200
Total 1.140 1,0000 150 1,0000
Tabla 8
X f fr F Fr
Se denomina frecuencia acumulada 1 6 0,0400 6 0,0400
relativa (Fr) de la clase j al cociente 2 11 0,0733 17 0,1133
entre la frecuencia acumulada de la 3 12 0,0800 29 0,1933
4 30 0,2000 59 0,3933
clase j y el número total de datos (n) 5 40 0,2667 99 0,6600
6 25 0,1667 124 0,8267
7 14 0,0933 138 0,9200
Frj = Fj / n 8 9 0,0600 147 0,9800
9 3 0,0200 150 1,0000
Total 150 1,0000
Tabla 9
DISTRIBUCIÓN DE FRECUENCIAS
para datos cualitativos nominales
Ejemplo: sentencias judiciales por jurisdicción
Id Jurisdicciones f fr
1 Ordinaria Nacional 3.498 3.498 / 15.756 = 0,2220
2 Ordinaria Provincial 8.703 8.703 / 15.756 = 0,5523
3 Ordinaria Federal 2.488 2.488 / 15.756 = 0,1579
4 Ordinaria Militar 1.067 1.067 / 15.756 = 0,0678
15.756 1,0000
f
8.000 Gráfico de barras
7.000
6.000
5.000
4.000
3.000
2.000
1.000

Nacional Provincial Federal Militar Jurisdicciones


DISTRIBUCIÓN DE FRECUENCIAS
para datos cualitativos ordinales
Ejemplo: cantidad de alumnos f fr F Fr
matriculados por ciclo en el semestre I Ciclo 400 0,25 400 0,25
II Ciclo 390 0,24 790 0,49
III Ciclo 170 0,11 960 0,60
VI Ciclo 270 0,16 1.230 0,76
V Ciclo 210 0,13 1.440 0,89
VI Ciclo 170 0,11 1.610 1,00
1.610

Gráficos de barras
Gráfico de frecuencias absolutas F
450
f Gráfico de frecuencias
1800
400 1600 absolutas acumuladas
350 1400
300 1200
250 1000
200 800
150 600
100 400
50 200
0 0
I Ciclo II Ciclo III Ciclo IV Ciclo V Ciclo VI Ciclo I Ciclo II Ciclo III Ciclo IV Ciclo V Ciclo VI Ciclo
DISTRIBUCIÓN DE FRECUENCIAS
para datos cuantitativos discretos
Intervalo
Ejemplo: Los datos expresados Id
de clase
f F fr Fr
continuación, representan la cantidad de 1 16 3 3 0,15 0,15
camiones que ingresan diariamente a un 2 17 2 5 0,10 0,25
obrador. 3 18 3 8 0,15 0,40
4 19 2 10 0,10 0,50
20 18 17 20 20 16 21 21 19 20 5 20 5 15 0,25 0,75
16 19 22 20 21 17 18 16 18 21 6 21 4 19 0,20 0,95
7 22 1 20 0,05 1,00
20 1,00
Gráficos de bastones
Gráfico de frecuencias absolutas Gráfico de frecuencias absolutas
f F acumuladas
5 20
4 16
3 12
2 8

1 4

15 16 17 18 19 20 21 22 23 x 15 16 17 18 19 20 21 22 23 x
DISTRIBUCIÓN DE FRECUENCIAS
para datos cuantitativos continuos (Intervalos de clase)
El intervalo de clase corresponde al rango de valores en que se ha decidido
agrupar parcialmente los datos con el propósito de hacer un resumen de ellos.
La cantidad de datos que quedan comprendidos dentro de ese intervalo se
denomina frecuencia del intervalo (f)
La diferencia entre el extremo mayor (límite superior) y el extremo menor (límite
inferior) del intervalo se denomina amplitud ó ancho del intervalo (h)

Construcción de una distribución de frecuencias:


1) Si K es el número de intervalos de clase y n el tamaño de la muestra:
a) K ≈ 1 + 3,322 log n (Sturges)

b) K≈ n
c) Tamaño de muestra n Número de clases K
30 – 60 6–8
60 – 100 7 – 10
100 – 200 9 – 12
200 – 500 11 – 17
500 - 1500 16 – 25
2) Una vez calculado o escogido el valor K de intervalos de clase, se determina la
amplitud h que deben tener los intervalos de clase
El rango es la diferencia que existe entre el mayor y el menor valor registrado que
toma la variable en estudio
h (amplitud del intervalo)= rango / K = x(máx) − x(min) / K

3) El primer intervalo debe contener el menor de los datos, y el último intervalo el


mayor de los datos
*Criterio: se usaran intervalos cerrados a la izquierda y abiertos a la derecha: [ )

4) Se construye la tabla de distribución de frecuencias


Ejemplo:
Los datos representan la 105 221 183 186 121 181 180 143
resistencia a la tensión, en 97 154 153 174 120 168 167 141
libras por pulgada cuadrada 245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
(psi), de 80 muestras de una 207 180 190 193 194 133 156 123
nueva aleación de aluminio y 134 178 76 167 184 135 229 146
litio, que está siendo evaluada 218 157 101 171 165 172 158 169
como posible material para la 199 151 142 163 145 171 148 158
fabricación de elementos 160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
estructurales de aeronaves.
1) Determinamos el número K de intervalos
K = n ; 80 = 8,94 ⇒ K ≈ 9

2) Determinamos la amplitud de los intervalos h


h = rango / K = x(máx) − x(min) / K = (245 – 76) / 9 = 18,7 ≈ 20

3) Elegimos el valor 70 como límite inferior del primer intervalo de clase, y el valor
250 como límite superior del último intervalo de clase
4) Realizamos el conteo y construimos la columna de frecuencias absolutas
Intervalo de
Id Tabla (conteo de datos) f
clase (Psi)
1 70 ≤ x < 90  2
2 90 ≤ x < 110  3
3 110 ≤ x < 130   6
4 130 ≤ x < 150    14
5 150 ≤ x < 170      22
6 170 ≤ x < 190     17
7 190 ≤ x < 210   10
8 210 ≤ x < 230  4
9 230 ≤ x < 250  2
80
La marca de clase (Mc) es el punto medio del intervalo de clase. Así
para el primer intervalo será:
70 + 90 160
Mc 1 = = = 80
2 2
Finalmente tenemos la tabla de distribución de frecuencias:
HISTOGRAMA Y POLÍGONO DE FRECUENCIAS
para datos cuantitativos continuos
El histograma de frecuencias absolutas es una representación visual de los datos
en donde se evidencian fundamentalmente tres características:
1. Forma
2. Acumulación de datos
Histograma de frecuencias absolutas 3. Dispersión o variabilidad
f
Polígono de frecuencias absolutas
24
22
20
18
16
14
12
10
8
6
4
2

50 70 90 110 130 150 170 190 210 230 250 270 x


FRECUENCIAS ACUMULADAS
para datos cuantitativos continuos
Gráfico de frecuencias absolutas Polígono de frecuencias
acumuladas absolutas acumuladas (ojiva)

También podría gustarte