Está en la página 1de 10

ESTADÍSTICA

I. Definición: Es la ciencia que nos proporciona un conjunto de métodos, técnicas y procedimientos para:
 Recopilar.
 Organizar (clasificar, agrupar)
 Presentar y
 Analizar
Datos con el fin de describirlos o de realizar generalizaciones validas.
La palabra estadística se emplea en una gran variedad de formas, es decir es el sinónimo de DATO.

El trabajo estadístico o la investigación estadística es un proceso que pasa generalmente por las
siguientes etapas:
 Formulación del problema.
 Diseño del experimento.
 Recopilación de los datos.
 Clasificación, tabulación y descripción de resultados.
 Generalización o inferencia.

La Estadística consta de dos partes:

Estadística Descriptiva: Es el conjunto de métodos estadísticos que se relacionan con el resumen y


descripción de los datos, como tablas, gráficos y el análisis mediante algunos cálculos.

Estadística Inferencial: Es el conjunto de métodos con los que se hacen la generalización o la


inferencia sobre una población utilizando una muestra.
La inferencia puede contener conclusiones que puede no ser cierta en forma absoluta, por
lo que son necesarios establecerlos con una medida de confiabilidad que es la
Probabilidad.

II. POBLACION Y MUESTRA:


a. Población: Se denomina población a un conjunto de elementos que contiene una o mas
características observables de naturaleza cualitativa o cuantitativa que se puede medir.
A cada elemento de una población se le denomina Unidad Elemental o Unidad
Estadística.
Por Ejem.
 El conjunto formado por todos los estudiantes de la Escuela de EPD sede Tarma,
cada estudiante es una unidad estadística o unidad de análisis.
Por otro lado, la población; viene definida por la tarea o investigación estadística a
realizarse.
Parámetro: es una medida descriptiva que resume una característica de la población, tal
como la media o la varianza, calculada a partir de los datos observados de
toda la población.
Tipos de Población: por le numero de elementos que lo componen la población se
clasifica en finita o infinita.
 Población Finita: es cuando tiene un número indeterminado de elementos.
 Población Infinita: es cuando tiene un número determinado de elementos.

b. Muestra: Se denomina muestra a una parte de la población seleccionada de acuerdo a un plan o


regla, con el fin de obtener información acerca de la población el cual es objeto de
investigación.

III. VARIABLES ESTADISTICAS:


Definición: Se denomina variable estadística a una característica definida en la población por la tarea
o investigación estadística, que puede tomar dos o más valores (cualidades o números),
el cual es representado por el alfabeto.
Por Ejem.
 La población constituida por los estudiantes de la Escuela de FPES – Especialidad
Tecnología informática y Telecomunicaciones, sede Yhca, las variables estadísticas
definidas en esta población son:
X: sexo (Masculino - femenino)
Y: estado civil (soltero, casado, viudo, divorciado)
Z: número de hijos (0, 1, 2, ….)
Una variable que teóricamente puede tomar cualquier valor entre dos valores dados se
llama variable continua, si no es así se lama variable discreta.
Por Ejem.
 En una familia en numero de hijos puede tomar cualquier valor 0, 1, 2,... pero no
puede ser 0.5 ó 1.50; a este tipo de variable se le denomina variable discreta.
 La altura de un individuo puede ser 1.65 cm. ó 1.70 cm. dependiendo de la
exactitud de la medida; a este tipo de variable se le denomina variable continua.

Escala de Medición: Es un instrumento de medida, con el que se asigna valores (cualidades o


números) a las unidades estadísticas para una variable definida.
Las escalas de medición son las sgtes.
 Nominal.
 Ordinal
 De intervalos
 De razones

a. Escala Nominal: es cuando dos o más valores de una variable, solo permiten percibir las
diferencias o semejanzas de las unidades estadísticas que se midan.
A las escalas nominales no se les puede asignar valores cualitativos, con estos no se
pueden realizar operaciones aritméticas. Solo son validas las relaciones de = y . Por
Ejem.
 La variable “sexo” asigna dos valores masculino y femenino (las personas están en
una sola modalidad o en modalidades diferentes)
 La variable “estado civil”
 La variable “religión”
El método estadístico con datos obtenidos en escala nominal consiste en obtener el
número o porcentaje de casos en cada modalidad y obtener la moda (valor de mayor
frecuencia).

b. Escala Ordinal: es una escala nominal donde los valores de la variable se pueden
obtener en forma ascendente o descendente.
En una escala ordinal los valores o modalidades reflejan el orden de las unidades
estadísticas.
A las escalas ordinales no se les puede asignar valores numéricos, con estos no se pueden
realizar operaciones aritméticas. Solo son validas las relaciones de =,  y de orden  y .
Por Ejem.
 La variable “estatus socioeconómico”, con sus modalidades clase baja, media y alta
se mide, en escala ordinal
 La variable “orden de merito”
El método estadístico con datos obtenidos en escala ordinal consiste en obtener el número
o porcentaje de casos en cada modalidad y obtener la moda, la mediana, los percentiles y
el coeficiente de correlación por rangos.

c. Escala de Intervalos: es una escala ordinal con cuyos valores se pueden verificar
igualdad, diferencia, orden y elegir una unidad de escala y comprobar cuantas veces la
diferencia entre dos valores es igual a la diferencia entre otros dos valores de la escala (es
decir comparar intervalos).
Si x1, x2 y x3 son tres valores en la escala de intervalos, en la cual se puede verificar la
relación:
x3  x1
x3 –x1 = c(x2 – x1) ó c ; donde c = constante.
x2  x1
Por Ejem.
 Si la variable x es “puntaje” obtenido en un examen de 2 a 20, donde la unidad de
medida es un punto a partir de cero, entonces tenemos una escala de intervalos.

d. Escala de Razón o Cociente: es una escala de intervalo con cuyos valores además
podemos comprobar cuantas veces un valor de la escala es igual al otro.
Es decir, Si x1 y x2 son dos valores en la escala de la razón, se verifica la relación:
x2
x2  cx1 ó  c ; donde c = constante y x1  1
x1
La escala de la razón tiene un cero absoluto (ausencia total de características que se
observa). Con los números de esta escala son validas las relaciones de =,  y de orden  y
 y todas las operaciones matemáticas.
Los valores de esta escala se obtienen en general por mediciones de tipo conteo o de
medidas de longitud de peso, volumen, vida útil, etc.
Por Ejem.
 Si la variable x es la longitud (metros), de un objeto entonces los valores de esta
escala son de razón

IV. CLASIFICACIÓN DE LAS VARIABLES:


a. Variable Cualitativa: es la característica cuyos valores se expresan en escala nominal u ordinal.
Ejem.
 Lugar de procedencia de un conjunto de personas
 El color de autos producidos por una fabrica
 Sexo
 Profesión
 Estado civil

b. Variable Cuantitativa: es la característica cuyos valores se expresan en escala de intervalo o de


razón.
Ejem.
 El salario de los trabajadores en educación
 Temperatura
 Numero de hijos
Las variables cuantitativas se clasifican en discretas y continuas.

 Variable Discreta: es la variable que puede tomar solo ciertos valores en un


intervalo considerado y no admite ningún valor entre dos valores consecutivos fijos.
Por Ejem. Los hijos de una familia 0, 1, 2, …..
 Variable Continua: es la variable que puede tomar cualquier valor en el intervalo
considerado.
Por Ejem. Sueldo, tiempo, peso, volumen longitud, etc.

c. Variable Independiente: es independiente cuando sus valores influyen en otros variables.

d. Variable Dependiente: es cuando sus valores dependen de los valores que tiene una variable
independiente.

Las variables independientes y dependientes también se llaman explicativas y explicadas.

V. ORGANIZACIÓN DE DATOS:

1. Distribución de Frecuencias (Variable Cualitativa):


Después de recopilar los datos, es necesario resumirlos y presentarlos en forma tal, que
faciliten su comprensión, análisis y utilización, para ello se ordena en cuadros numéricos
para luego presentarlos en gráficos.

Los cuadros numéricos de una sola variable estadística se denomina distribución de


frecuencia, cuya construcción se refiere a muestras.

Frecuencia: es el número de veces que aparece durante el proceso de observación


y medición, cada uno de los datos considerados en una variable.

 La Frecuencia Absoluta (fi): es el número de datos observados en cada categoría o


modalidad, la suma de todas las frecuencias absolutas es igual al total de n datos observados.

fi
 La frecuencia Relativa (hi): se defina en cada categoría por hi  , la suma de todas las
n
frecuencias relativas es igual a uno.

 La Frecuencia Porcentaje (pi): se define en cada fila por pi = hi . 100%, el total de las
frecuencias porcentuales es igual a cien.

Distribución de frecuencias de variable cualitativa


Categorías de la Frecuencias Frecuencias Frecuencias
Variable X Absolutas fi Relativas hi Porcentaje pi
C1 f1 h1 p1
C2 f2 h2 p2
… … … …
CK fK hk Pk
Total n 1.00 100.00

2. Distribución de Frecuencias (Variable Cuantitativa Discreta):


Si se han recolectado n valores de alguna variable discreta X. el procedimiento más
simple de organizar estos datos, consiste en ordenar estos valores en forma ascendente.
Si todos los n datos son diferentes entre si, se obtendrá una distribución de frecuencias de
n valores de la variable X, donde cada uno de estos valores tienen frecuencia absoluta igual a
uno.
Si algunos valores se repiten y si al terminar el ordenamiento se obtiene k valores
distintos de X, es decir, x1, x2, ……xk con frecuencias absolutas respectivas f1, f2, ……fk.

Distribución de frecuencias de variable Discreta


Categorías de la Frecuencias Frecuencias Frecuencias
Variable X Absolutas fi Relativas hi Porcentaje pi
x1 f1 h1 p1
x2 f2 h2 p2
… … … …
xK fK hk Pk
Total n 1.00 100.00

Las fi, hi y pi en el caso de variable continua y discreta, poseen el mismo significado y


propiedades que la variable cualitativa.

3. Distribución de Frecuencias por Intervalo:


La distribución de frecuencias por intervalos p clase se usa cuando la variable estadística
es continua o cuando el numero de valores es muy grande, esta distribución se obtiene
dividiendo el rango de variación de los datos en k intervalos y determinando el numero de
datos que contiene cada intervalo.

Distribución de frecuencias por intervalos


Frecuencias
Intervalos
Conteo Frecuencias Frecuencias Frecuencias
Ii
Absolutas fi Relativas hi Porcentaje pi
I1 ///… f1 h1 p1
I2 ///… f2 h2 p2
… … … … …
IK ///… fK hk Pk
Total N 1.00 100.00

Para construir la distribución de frecuencias de intervalos debemos seguir los sgtes.


Pasos.

T1ro. Elegir no más de 20 intervalos ni menos de 5, ya que podrían complicar los cálculos así
como pocos intervalos podrían omitir características importantes, es recomendable
elegir intervalos de igual amplitud (A).
T2do. El numero de intervalos elegidos debe dar una distribución de frecuencias mono
modal, es decir las distribuciones van en aumento progresivo hasta una frecuencia
máxima y luego van disminuyendo progresivamente.

4. Distribución de Frecuencias Acumuladas:


Distribución d frecuencias (absolutas, relativas y porcentuales), se puede acumular en la
forma menor o igual que un valor determinado de la variable correspondiente a cada fila.
Si la variable discreta X tiene valores distintos x1, x2, … xk con frecuencias absolutas
respectivas f1, f2, … fk , entonces:
 Frecuencia Absoluta Acumulada (Fi): es la suma de las frecuencias absolutas de los
valores menores o iguales a xi, es decir:

i
Fi   f j , i  1, 2,...,k
j 1

 Frecuencia Relativa Acumulada: es la suma de las frecuencias relativa de los valores


menores o iguales dividida por la frecuencia total, es decir:

i Fi
Hi   h j ó Hi  ; i  1, 2, 3,...,k
j 1 n

 Frecuencia Porcentual Acumulada: es la suma de las frecuencias porcentual de los


valores menores o iguales dividida por la frecuencia total, es decir:

Pi  Hi .100% ; i  1, 2, 3,...,k

5. Construcción de la Distribución de Frecuencia:


Dados n valores de una variable cuantitativa X continúa, uno de los métodos para
construir la distribución de frecuencia es:
1ro. Determinar el rango (R) de variación de los datos que se define por

R = Xmax – Xmin

Donde: Xmax = valor máximo


Xmin =valor mínimo
2do. Determinar el numero de intervalos, k.
Un valor aproximado del número de intervalo k, nos proporciona la regla de Sturges,
donde
k = 1 + 3.3 log (n) ; n  10

Los valores decimales se redondean al entero inmediato superior.


Por Ejem. Si se tiene n = 50 datos sin decimales, entonces
k = 1 + 3.3 log (50)
k = 1+ 3.3 (1.6990) ; k = 6.6067
luego k podrá elegir cualquier valor 6, 7, 8, siguiendo las recomendaciones del T1ro.

3ro. Determinar la amplitud A del intervalo, dividiendo el rango entre el número de


intervalos, es decir.
R
A=
k
Si la división no es exacta en el numero decimal, se aproxima por exceso de manera
que se cubra el rango.
Si los datos son enteros A es entero, si tiene un decimal A tiene un decimal.
R
Por Ejem. = 5.3816, se elige A = 5.39 y no (5.38)
k
4to. Determinar los extremos de los intervalos de la siguiente manera.
I1 = Xmin, Xmin + A
I2 = Xmin +A, Xmin + 2A
I3 = Xmin +2A, Xmin + 3A

IK = Xmin + (k - 1)A, Xmin + kA

R
Observa que se cierra por la derecha en el ultimo intervalo, esto se debe a que la división
k
es exacta en el numero de decimales de los datos, entonces
Xmax, = Xmin + kA

Ejemplo 1.

Los ingresos mensuales de 45 taxistas de la ciudad de Cerro de Pasco son:

63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60

Construir una distribución de frecuencia de 8 intervalos.

Marca de Clase:
La de clase o marca de intervalo Ii = Li , Ui  , es el numero mi que se define como el
punto medio del intervalo, es decir.
Li Ui
mi 
2
La marca de clase es el número que representa a todos los datos contenidos en el intervalo.

V. REPRESENTACIÓN GRAFICA DE DISTRIBUCIONES:


1. Diagrama de Barras: es propia de una distribución de frecuencias de una variable
cuantitativa discreta, o de una variable cuantitativa.
Se coloca sobre el eje de las abscisas los distintos valores de la variable, que son la base de
cada barra, y su altura corresponde a la frecuencia absoluta o relativa, que se ubica en el eje
de las ordenadas.

2. Diagrama Circulares:
Por medio de sectores circulares, se utiliza principalmente cuando se pretende comparar cada
valor de la variable con el total.

3. El Histograma de Frecuencia:
Se utiliza para graficar las frecuencias absolutas o relativas de variables continuas.
Es un conjunto de regiones rectangulares cuyas bases coinciden con la longitud del intervalo
de clase (eje x), y las alturas correspondientes a las frecuencias absolutas o relativas (eje y).

4. Polígono de Frecuencia:
Es una grafica poligonal cerrada, que se obtiene uniendo con segmentos de recta, los puntos
que tienen proporcionalmente como abscisa a la marca de clase y como ordenada a la
frecuencia respectiva.
Se cierra en ambos extremos en las marcas de clase adyacentes de frecuencia cero.

5. Ojiva:
Esta representación es valida para graficar las frecuencias absolutas acumuladas de una
variable continua.
A cada límite superior le corresponde la frecuencia acumulada de la clase correspondiente,
iniciando con el límite inferior del primer intervalo.

EJERCICIOS
1. Ordenar los números deforma creciente, decreciente y determinar el rango.
6, 14, 84, 52, 54, 12, 45, 78, 41, 54, 10, 25, 23, 65, 29, 84, 30, 51, 68, 49.

2. Se considera la población formada por 50 personas y en esta, la variable cualitativa sexo. Si existe 30
varones y 20 mujeres, se puede escribir la siguiente tablado frecuencia.

3. En una entidad estatal existen 18 abogados, 32 ingenieros, 45 topógrafos, 20 obreros y 15 secretarias.


La distribución de los empleados de acuerdo a la variable “ocupación” elaborar la tabla de frecuencia
y graficar.

4. La puntuación final obtenida por 80 alumnos en el examen de admisión de la Escuela de EFPES, son
las sgtes:
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
En relación a esta tabla construir la tabla de frecuencia.
a) La puntuación mas alta
b) La puntuación mas baja
c) Las puntuaciones de los 2 primeros puestos
Las puntuaciones de los 2 últimos puestos

5. Sean las sgtes. cifras, los calificativos del curso de matemática en el que fueron evaluados 56
estudiantes, siendo la escala de evaluación de 0 a 100, construir la tabla de frecuencias y graficar.

73 81 44 69 30 38 75 66 76 84
72 82 58 89 73 59 87 63 43 59
64 74 63 63 48 52 77 68 47 53
63 72 52 55 75 43 67 61 87 39
62 75 69 53 79 95 50 38 70 84
82 95 59 75 36 65

6. Sean los puntajes de la evaluación de inteligencia emocional de 40 estudiantes, construir la tabla de


frecuencia acumulada y graficar.

93 108 112 90 108 99 110 102 124 96


105 115 108 104 104 103 120 110 108 107
107 93 109 125 106 110 124 110 130 97
115 130 95 136 122 92 102 98 140 103

7. El numero de periódicos que un canillita vendió durante los últimos 24 días es como sigue:

13 21 16 30 42 5 33 26 28 45
17 28 39 32 8 34 37 33 27 26
24 28 16 21
a) construir la tabla de frecuencia con 4 intervalos.
b) cual es el porcentaje de días donde el canillita vendió más de 20 periódicos.

8. Sean los siguientes los pesos obtenidos de 50 personas de peso alto, expresados en Kg. construir la
tabla de frecuencias acumuladas y graficar.
73 102 90 97 98 106 108 93 87 88
100 87 104 85 90 95 80 98 82 98
104 112 90 98 101 94 105 98 93 82
91 84 93 88 97 103 84 105 92 114
96 100 104 96 101 76 93 82 100 85

9. Se presentan las tallas de 40 estudiantes de una institución educativa, construir la tabla de frecuencias
acumuladas con 8 intervalos y graficar.

138 164 150 132 144 125 149 157 146 158
140 147 136 148 152 144 168 126 138 176
163 119 154 165 146 173 142 147 135 153
140 135 161 145 135 142 150 156 145 128

10. Se presentan los calificativos obtenidos en una evaluación de comprensión lectora y razonamiento
matemático de 42 estudiantes de una institución educativa, construir la tabla de frecuencias
acumuladas con 9 intervalos y graficar.

61 50 58 63 55 55 47 58 47 48
48 55 58 45 43 52 46 53 48 39
53 63 52 38 51 72 62 39 42 42
49 46 51 69 35 54 56 65 34 50
59 52

También podría gustarte