Estadística aplicada a la Universidad Nacional Mayor de San Educación Marcos

Facultad de Educación Mg. Jessica G. Zavaleta M.

Introducción
Estadística
 J. Neyman(1977: 58) «Estadistica

trata de problemas relativos a las caracteristicas operatorias de las reglas de comportamiento inductivo basado en experimentos aleatorios»  H. Crammer (1985:46) afirma que «el principal objeto de la teoría estadística consiste en la investigación de la posibilidad de obtener inferencias válidas a partir de datos estadisticos y en la construcción de metodos para

Estadística
 Es

un método científico por medio del cual podemos recolectar, organizar, presentar y analizar datos numéricos relativos a un conjunto de individuos u observaciones que nos permiten extraer conclusiones válidas y efectuar decisiones basadas en dichos análisis.

Historia de la Estadistica
 Se

pueden distinguir tres etapas:
hasta el siglo XV)

 Censos y empadronamientos (abarca

 De la descripción de poblaciones , a la

aritmética política ( desde el siglo XVI hasta el siglo XVIII)

 Teoría estadística y el cálculo de

probabilidades (desde el siglo XIX hasta la actualidad)

Conceptos básicos .

Población  Conjunto de elementos (personas. Toda población debe delimitarse temporal     . plantas. Para la investigación. objetos.) que contienen una o más características o atributos comunes observables. etc. organismos. acerca del cual deseamos obtener conclusiones o tomar decisiones. es el conjunto sobre el que recae la investigación y de cuyos elementos obtendremos datos de sus características o atributos.

.Ejemplos de población  Todos  los empleados del sector público . los docentes de la UGEL 05  Todos   Todos los estudiantes de una institución educativa.

  Un  . Son costosos y sus resultados son la base para investigaciones mas especificas.Censo  Implica la recolección de datos de toda la población bajo investigación. censo se realiza generalmente por política de estado.

Muestra  Subconjunto de la población seleccionada de acuerdo a una planificación previa.   La  . muestra debe ser representativa de la población y esto significa que debe ser de tamaño adecuado y que tenga las mismas propiedades de la población.

se le llama unidad de observación si los datos han sido recolectado mediante la observación y se le llama unidad experimental si los datos han sido recolectados a través de la   También .Unidad Estadística  Objeto elemental o elemento invisible sobre la base del cual se obtienen los datos.

 Es una magnitud o caracterización de algo. no cambian una vez obtenidos.Dato  Según el diccionario de la Lengua Española. Cuando se les procesa y presenta en un contexto apropiado pueden generar entendimiento. es un antecedente para llegar al conocimiento exacto de un hecho.  Son exactos. .

  . lectura o instrucción.Información  Es la reseña. representación o concepción derivada de la observación.

15 años de edad  Variable: «profesión» y los valores a . o atributo que posee la   Puede  tomar diferentes valores o expresados en varias categorias  Ejemplo:  Variable : «edades» de los alumnos de una institucion educativa y los valores de la variable serian: 13. 14.Variable  Caracteristica poblacion.

Escalas de medición de una variable .

Distribuye a la unidad de análisis en dos o más categorías. sin implicar algún orden entre ellas. Ejemplos:          Sexo Estado civil Deporte que práctica Religión Lugar de nacimiento.  .Escala Nominal  Son las variables que establecen la distinción de los elementos en diversas categorías.

 .   Ejemplos:  Grado de instrucción  Clases sociales  Grado de simpatía  Rango de agresividad.Escala Ordinal  Variables que implican orden entre ellas. están referidas a un orden o jerarquía. donde las categorías expresan una posición de orden.

La unidad de medida no necesariamente tiene que partir del valor cero. Presión arterial. . sino convencional. solo sirve como punto o valor de comparación. Rendimiento escolar. Ejemplos:          Coeficiente de inteligencia Temperatura Puntuación obtenida en una escuela.Escala Intervalar  Suponen orden y grado de distancia iguales entre las diversas categorías. pero no tienen un origen natural.

. distinción. ( la unidad de medida necesariamente tiene que partir del valor cero) Ejemplos:         Edad Peso Ingresos Número de hijos Accidentes de tránsito. el valor se expresa con un número real. Es de origen natural único.Escala de Razón   Comprenden a la vez a todos los casos anteriores. orden. distancia.

Clasificación de las variables .

cualidad o atributo. mide mediante escala nominal u ordinal  Se   Ejemplos:  Lugar de Nacimiento  Estado civil  Religión .Variable Cualitativa o Categórica o De atributos  Si  la variable expresa mediante una característica.

miden mediante escala intervalar o de razón ser de dos clases: discretas y continuas  Se   Pueden   Ejemplos:  Número de carpetas de un aula  Las estaturas de los estudiantes de una institución educativa. .Variables Cuantitativas o Numéricas  Es  cuando esta asociado a un valor numérico.

 Ejemplos  Número de alumnos por sección  Número de libros en la biblioteca de Educación  Número de registros por docente .Variables Cuantitativas Discretas  Sus  valores se expresan en números enteros.

625.78.62 m .5 kg. 1235. etc  Los haberes mensuales de los docentes S/.56 m.50 . 56. 1. S/. .Variables Cuantitativas Continuas  Sus  valores pueden expresarse mediante números reales  Ejemplos:  Los pesos de los niños: 48. etc. etc  Las tallas de los alumnos: 1.25 kg.

 En el siguiente enunciado: aplicó una encuesta a 70 alumnos para averiguar el número de hermanos que tiene cada uno».  «En una institución educativa se    Averiguar : Población. variable. dato .Practiquemos …. muestra. clase de variable..

Solución .

Clasificación de la Estadística .

Estadística Descriptiva .

Tablas y Gráficos de Frecuencia  Tabla de frecuencia o distribucion de frecuencia. gráficos es una representacion visual de la totalidad de datos. Condensan datos obtenidos.   Los . Presenta datos recolectados donde se puede observar las diferencias para los posibles valores de las variables o niveles o categorias.

Tablas de Frecuencia o Distribución  Son tablas de trabajo estadístico. Relativa . que se obtienen después de realizar la operación de tabulación. que presentan la distribución de un conjunto de elementos de acuerdo a las categorías de una variable.  Las tablas presentan diversos tipos de frecuencia (Absoluta simple. Absoluta acumulada. Relativa simple.  En ella se observa la frecuencia o repetición de cada uno de los valores de la variable.

24 0.5 32.00 Hi 0.5 42.16 0.Ejemplo  Cuadro N° 1 fi Fi 8 20 22 25 35 40 50 hi 0.70 0.20 0.80 1.00 8 12 2 3 10 5 10 50 Edades [10 – 15> [15 – 20> [20 – 25> [25 – 30> [30 – 35> [35 – 40> [40 – 45> 12.40 0.20 1.5 27.04 0 0.5 22.5 17.5  .44 0.10 0.5 37.16 0.50 0.

al número de veces que se repite dicho valor en el conjunto de datos.Frecuencia absoluta (fi).  .  Se llama frecuencia absoluta de un valor de variable.

Frecuencia absoluta acumulada (Fi).  .  Es la suma de las frecuencias relativas correspondientes a los datos menores e iguales al dato en referencia.

.Frecuencia Relativa (hi).

Frecuencia Relativa Acumulada (Hi). .

2.0.2.2.3.5.2.0.3.Practiquemos  El      3.4.3.1.1.1.3.2. número de hijos por familia de un grupo de docentes de inglés de la UGEL 02 es como sigue:   Elaborar  una tabla de frecuencias e interpretar las frecuencias empleando el  Graficar .2.1.2.

033 1.000 0.Distribución de número de hijos de los docentes de inglés de la UGEL 02.900 0.000 10% 17% 37% 27% 7% 3% Interpretación : La mayoría de docentes de inglés de la UGEL 02 .967 1.633 0.067 0.167 0.267 0. 37% tienen 02 hijos .267 0.367 0. Número de hijos Frecuencia (fi) Frecuencia Absoluta Acumulada (Fi) Frecuencia Relativa (hi) Frecuencia Relativa Acumulada (Hi) Frecuencia Porcentual (hi *100) 0 1 2 3 4 5 3 5 11 8 2 1 30 3 8 19 27 29 30 0.100 0.100 0.

1: Distribución de número de hijos de los docentes de inglés de la UGEL 02 .Gráfico 1.

Medidas de Resumen para datos de una variable cuantitativa .

    . a una serie de datos y además describe en forma resumida al conjunto de observaciones. es decir. etc. Los de uso más frecuente son la media. deciles. existen además los cuartíles. describen la posición que ocupa una distribución de frecuencias respecto a un solo valor de la variable. su propósito es de obtener valores que representen dicho punto central o centro de gravedad de los datos. la mediana y la moda.Medidas de Posición o Medidas de Tendencia Central  También se les conoce como estadígrafos de posición. Representan en un solo valor. percentiles.

.

se n u ti i : l za .Pa ra d a to s si a g ru p a r .

.

Propiedades de la Media Aritmética .

Ejemplo 1 .

Ejemplo 2 .

en dos partes de igual tamaño. previamente ordenadas o tabuladas.Mediana (Me)  Es el valor que divide al total de las observaciones.  . en donde cada una de las partes contiene el mismo número de elementos.

Mediana (Me) .

Mediana (Me) .

40 años.     2º Ubicamos el valor central: Me = 27  INTERPRETACIÓN  El 50% inferior de los profesores tiene edades iguales o menores que 27 y el otro 50% superior tiene edades iguales o mayores a 27 años. Halla la mediana e interpreta. 27. 40. 26. . 30. 30. 24. 25. 35.Ejemplo 1  Dado  las edades de 7 profesores 27. 25. 26.   Solución: 1º Ordenamos los datos en forma ascendente: 24. 35.

Ejemplo 2 .

 . en este caso se dice que la distribución es amodal.      También puede suceder que la distribución no tenga moda.Moda (Mo)  La moda es el valor que se repite con más frecuencia absoluta en un conjunto de datos de una variable.

Moda (Mo) – Características .

11. 24. 9. 15. 14. Mo = 9 ( es unimodal)   EJEMPLO 2  El conjunto de valores 12. es amodal. 15 tiene dos modas el 13 y el 15. 7. EJEMPLO 3  El conjunto de valores 5. es decir. 35 no tiene moda. 13. 9. 13. 31. 10. 2. 10. 8. 15. es decir. 14.  . 13. es bimodal. 11 tiene una moda igual a 9 ▪ Es decir. 13. 9.     14. 7. 5.Ejemplos  EJEMPLO 1  El conjunto de valores 2. 9. 15.

previamente ordenados o tabulados. deciles y percentiles son estadígrafos de posición que dividen al total de datos. Deciles .Cuartiles. Los valores se expresan en forma porcentual   Se . usan frecuentemente para describir el comportamiento de una población. en proporciones. Percentiles  Los cuartíles.

Cuartiles ( Qk )  Son estadígrafos que dividen al total de la información previamente ordenados (en forma ascendente o descendente) o tabulados en cuatro partes iguales.  .

 .Deciles ( Dk )  Son estadígrafos que dividen al total de la información previamente ordenados (en forma ascendente o descendente) o tabulados en diez partes iguales.

Percentiles ( Pk )  Son estadígrafos que dividen al total de la información previamente ordenados (en forma ascendente o descendente) o tabulados en cien partes iguales.  .

Percentiles ( Pk ) .

de comparar dos o más conjuntos de datos. Estas medidas de dispersión son números que miden el grado de separación de los datos con respecto a un valor central. que generalmente es la media .Medidas de Dispersión  Las medidas de dispersión con respecto al centro tienen una finalidad de ampliar la descripción de los datos.

Clasificación de las Medidas de Dispersión .

Rango o Amplitud (R) .

Es decir es una muestra homogénea.50. S/424 y S/ 423.50 – 423. contratados en un colegio particular son S/424. S/ 424.50 R=1  Interpretación  Los datos tienen un rango o amplitud igual a 1.50.Ejemplo 1  El ingreso mensual de 4 profesores de estadística. . R=X      Solución:  M áxim o –X m o ínim R = 424.

S/ 373. Es decir es una muestra dispersa.373  R = 102    m o ínim   Interpretación  Los datos tienen una amplitud igual a 102.  . contratados en un colegio estatal son S/424.Ejemplo 2  El ingreso mensual de 4 profesores de estadística. S/424 y S/ 475 Solución: R = X Máximo – X  R = 475 .

Varianza ( S2) .

Esto sucede sobretodo cuando la media aritmética está afectada por valores extremos.  La varianza se expresa en las mismas unidades de la variable analizada.Varianza ( S2)  Cuanto mayor sea la varianza de una variable mayor dispersión existirá y por tanto menor representatividad tendrá la media aritmética. pero elevadas al .

Características de la varianza .

Ejemplo 1 .

Ejemplo 1 .

Ejemplo 2 .

Desviación Estándar ( S ) .

Ejemplo 1 .

Rango intercuartílico ( IQR )
define como la diferencia que existe entre los cuartíles Q3 y Q1, por lo tanto es el intervalo que contiene el 50% central de los datos.  IQR = Q3 – Q1  Se usa como medida de dispersión cuando se ha empleado la mediana como medida de posición.
  Se

Ejemplo 1
 El

 MAÑANA 12.3 22.7 NOCHE 15.6 21.6     Calcula el rango intercuartílico

curso de estadística se dicta en 2 grupos, se desea determinar la dispersión del rendimiento en este curso a partir de la siguiente información: Q1 TURNO Q3

ambos turnos e interpreta.

para

Solución del ejemplo 1

Turno Mañana:
  

1º IQRM = Q3 – Q1 2º IQRM = 22.7 – 12.3 3º IQRM = 10.4

Turno Noche:
   

Interpretación

1º IQRN = Q3 – Q1 2º IQRN = 21.6 – 15.6 3º IQRN = 6  

 El grupo que tiene rendimiento más

homogéneo con respecto a la mediana es el turno de la noche por tener menor rango intercuartílico.

Coeficiente de variación

Características del coeficiente de variación .

Ejemplo 1  Las Alumno  1 12 16 12 11 10 14 10 10 Alumno 2  11 12 15 10 16 16 15 16    ¿Quién rinde en forma mas Obs calificaciones de la primera unidad del curso de Literatura Inglesa de dos alumnos es como sigue : 3 4 5 6 7 8 9 10 1 2 15 16 12 16 heterogénea? .

Solución .

Solución .

Interpretación del ejemplo 1  Se observa que el CV del alumno 2 es menor que el alumno 1. respecto a su media . por tanto es más homogeneo o menos disperso.

Medida de Forma  Permite tener una idea de la forma de la distribucion de una variable cuantitativa .