Está en la página 1de 20

COLEGIO SUPERIOR DE SEÑORITAS

Departamento de Matemáticas
Estadística

La Estadística es una ciencia, que en los últimos años, que ha tenido mucha importancia en la
sociedad; es la encargada de recolectar, agrupar, organizar, presentar y analizar e interpretar
datos particulares o específicos, sobre cierta situación observable.
Algunos la consideran como la disciplina puente entre modelos matemáticos y fenómenos
naturales.

Conceptos Generales de la Estadística


Algunas definiciones importantes.

Población:
Conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información
sobre el fenómeno que se estudia.
Por ejemplo:
a) si estudiamos el precio de la vivienda en una ciudad, la población será el total de las
viviendas de dicha ciudad.
b) Todos los microchip que fabrica una empresa.
c) Todos los ejemplares de una determinada tortuga.

Muestra:
Subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de
una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería
una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda
que es suficientemente representativo.

Variable o carácter:
Cada una de las características que pueden observarse en un individuo de la muestra.
Ejemplos:
a) en una muestra de una población de seres humanos podemos medir: la altura, la edad,
el peso, el sexo, número de hermanos…
b) en una muestra de una población de una especie de tortugas podemos medir: la
anchura del caparazón, la longitud del caparazón, la edad…

Tipos de variables:
1. Variables Cualitativas, categóricas (o alfanuméricas):
Pueden tomar valores no cuantificables numéricamente. Se denomina categoría a cada uno
de los valores que toma la variable.
Por ejemplo: nacionalidad, color de la piel, sexo.
Esta variable se sub-clasifica como:
Nominales:
Si no existe ningún orden entre las categorías de la variable.
Ejemplos: el grupo sanguíneo; el color de los ojos (azules, verdes, marrones, negros),… Hay
que distinguir las variables binarias o bidimensionales, aquéllas que sólo toman dos valores
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
posibles (sí/no, presencia/ausencia de cierto carácter), dentro de las nominales. Ejemplo: el
sexo, ser fumador, tener carné de conducir, ser daltónico.
Ordinales:
Cuando existe un cierto orden entre las categorías de la variable.
Ejemplo: el nivel de estudios (sin estudios, básicos, medios, superiores).

2. Cuantitativas (o numéricas):
Pueden tomar valores cuantificables numéricamente.
Esta variable se sub-clasifica como:
Discretas:
Si solamente toman valores aislados (generalmente enteros). Suelen corresponder a contajes.
Ejemplos: el número de hermanos, el número de cafés/día, el número de multas/año,…, nunca
podrá ser 3,45).
Continuas:
Potencialmente puede tomar cualquier valor numérico dentro de un intervalo o de una unión
de intervalos. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h, el
tiempo de reacción a un cierto medicamento, el peso de un individuo, la longitud del caparazón
de una tortuga.

Individuo:
Cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si
estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el
precio de la vivienda, cada vivienda es un individuo.

Existen dos tipos de Estadística: la descriptiva y la Inferencial.


La estadística descriptiva es una ciencia que utiliza una serie de procedimientos para
recolectar, agrupar, organizar, resumir y presentar, y analizar e interpretar una series de datos
(por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en
los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas
variables.

La Estadística Inferencial es parte de la ciencia que se encarga de inferir algo acerca de una
población basándose en los datos obtenidos a partir de la muestra. Los datos estadísticos son
cálculos aritméticos realizados sobre los valores obtenidos en una porción de la población,
seleccionada según criterios rigurosos.
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
Medidas de Posición
1.1 Moda:
En Estadística, la moda ( Mo ) es el valor con una mayor frecuencia en una distribución
de datos, o sea el dato que más se repite. Si encontramos dos modas diremos que es
una distribución bimodal, una distribución trimodal de los datos es en la que encontramos
tres modas. Pero si todas las variables tienen la misma frecuencia se puede afirmar que
no hay moda.
Ejemplos:
A) Para el siguiente grupo de datos, determine la moda.

23 34 46 23 78 45 23 45 34 23 43 23 56

Mo = __________

B) Para la siguiente tabla de distribución de frecuencias, determine la moda.

Mo = __________

1.2 Media aritmética:


La media aritmética o promedio resulta de sumar todos los datos cuantitativos y dividirlos
por la cantidad de datos (frecuencia absoluta).

x1 + x2 + x3 + .... + xn
X=
n
Donde; x1 + x2 + x3 + .... + xn corresponde a la suma de todos los datos, y n la cantidad de
datos totales.

La media ponderada es una medida de tendencia central, que es apropiada cuando en


un conjunto de datos cada uno de ellos tiene una importancia relativa respecto de los
demás datos. Se obtiene multiplicando cada uno de los datos por su ponderación para
luego sumarlos, obteniendo así una suma ponderada; después se divide esta entre la
suma de los pesos.
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
Ejemplos.
A) Considere la siguiente información

Se desea contratar un empleado más para la empresa, cuyo salario corresponderá a


la media aritmética de los salarios del mes de agosto de sus compañeros. El salario
del nuevo empleado, en miles de colones, es: ____________________

B) A continuación se presenta el total de hectáreas sembradas durante el período de


1999 al 2005 en la provincia de Limón; de banano y arroz.

En promedio (media aritmética) en ese período, ¿Cuántas hectáreas de arroz,


aproximadamente, se sembró más que de banano?

a) 3428,57 b) 4428,57 c) 6224,49 d) 6540,83


COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
C) Considere la siguiente distribución de frecuencias de las estaturas, en cm, de los
estudiantes de una sección de undécimo año:

1.3 Mediana:
a. Mediana para datos sin agrupar ( Me ): Si los datos no están agrupados primero se
deben ordenar de menor a mayor; Si el número de datos “ n ” es impar, la mediana es
el valor que ocupa la posición n + 1 ; Si el número de datos “ n ” es par, la mediana es
2
la media aritmética de los valores centrales.
Ejemplos.
A) Para los siguientes datos, determine la mediana.
48 53 58 46 48 53 55 48 53 53 55

Me = __________

B) Para los siguientes datos, determine la mediana.


28 13 18 16 18 33 25 28 13 23 15 14

Me = __________
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
b. Si los datos están agrupados: Si los datos están agrupados
Ejemplos.
A) Considere la tabla

Según los datos, determine la mediana.

Me = __________

1.4 Cuartiles:
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos que
están ordenados en cuatro partes iguales;Q1 , Q2 y Q3 determinan los valores
correspondientes al 25%, al 50 % y al 75% de la distribución de los datos. Q2 coincide
con la mediana ya que está a la mitad de los datos.
En algunas ocasiones se utilizan las fórmulas: Q1 = 1  n , Q2 = 2  n y Q3 = 3  n para
4 4 4
conocer la posición.
Ejemplos.
A) Considere los siguientes datos correspondientes a una muestra de las edades de
estudiantes de primaria: 7, 9, 10, 8, 12, 11, 6. Determine los cuartiles.

B) Considere los siguientes datos correspondientes a una muestra de las edades de


estudiantes de primaria: 7, 9, 10, 8, 12, 11, 6, 13. Determine los cuartiles.
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
C) En una veterinaria se escogieron 18 perritos para analizar su peso en kilogramos;
determine los cuartiles.

Peso en kilogramos de 18 perritos de varias razas

Peso en Frecuencia Frecuencia


kilogramos absoluta acumulada
2 1 1
3 1 2
4 1 3
5 2 5
7 1 6
8 1 7
10 1 8
12 2 10
14 1 11
15 1 12
16 3 15
20 1 16
22 2 18
Total 18

1.5 Valores extremos: Máximo y mínimo


El valor máximo corresponde el valor mayor de un conjunto de los datos, el valor mínimo,
corresponde al menor de los valores del conjunto de los datos.
Ejemplos.
A) Considere el siguiente contexto.

La masa (kg) mínima de los pacientes corresponde a

a) 44 b) 77 c) 82 d) 93
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
B) A continuación se muestran las masas en kilogramos de un grupo de doce personas:

Masa (Kg) 48 48 49 50 52 52 57 59 70 71 79 81

Según la información anterior, la diferencia, en kg, entre la persona de mayor masa y


la de menor masa corresponde a

a) 33 b) 48 c) 55 d) 81

Medidas de Variabilidad

2.1 Recorrido de los datos


El rango, también conocido como recorrido es la diferencia entre el dato máximo y el dato
mínimo de un conjunto de datos.
Ejemplos.
A) Para los siguientes datos, determine el recorrido.

48 53 58 46 48 53 55 48 53 53 55

2.2 Recorrido Intercuartílico


El rango intercuartílico IQR, es una estimación estadística de la dispersión de una
distribución de datos. Consiste en la diferencia entre el tercer cuartil y el primer cuartil.
Mediante esta medida se eliminan los valores extremadamente alejados.

IQR = Q3 − Q1

Ejemplos.
A) Considere el siguiente conjuntos de datos correspondientes a las edades de un grupo
de estudiantes: 12, 14, 16, 13, 14, 16, 15, 13, 14, 14, 16, 17, 12, 16, 16. Determine el
rango intercuartílico.
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
B) Considere los datos de la siguiente tabla que corresponden a medidas de posición de
las estaturas, en centímetros, de un determinado grupo:

Mínimo Cuartiles Máximo


Q1 Q2 Q3
160 165 172 180 188

De acuerdo con la información anterior, considere las siguientes proposiciones:

I. La mayor diferencia de las estaturas es de 28 cm.

II. El recorrido intercuartílico de las alturas es de 15 cm.

¿Cuál o cuáles de ellas son VERDADERAS?

a) Ambas b) Ninguna c) Solo la I d) Solo la II

C) Considere la siguiente información, la cual corresponde a una distribución de


calificaciones de dos secciones de 11° en Estudios Sociales

Sección Mínimo Cuartiles Máximo


Q1 Q2 Q3
11 - 1. 75 85 90 97 99
11 - 2. 68 70 86 90 98

De acuerdo con la información anterior, considere las siguientes proposiciones:

I. El recorrido intercuartílico de las calificaciones de los estudiantes de la sección


11 – 2 es 20.

II. El recorrido intercuartílico de las calificaciones de los estudiantes de la sección


11 – 1 es mayor que el de la sección 11 – 2.

¿Cuál o cuáles de ellas son VERDADERAS?

a) Ambas b) Ninguna c) Solo la I d) Solo la II


COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
2.3 Variancia o varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media
de una distribución estadística.

La varianza se representa por  2 y se define, para datos sin agrupar:

 ( x − x)
n

( x − x ) + ( x − x ) + ( x − x ) + .... + ( x − x )
2
2 2 2 2
i
2 =
1 2 3 n
ó = i =1
2

N N

Para datos agrupados, se utiliza:

 ( x − x)
n

( ) ( ) ( ) ( )
2
2 2 2
x1 − x  f1 + x2 − x  f 2 + x3 − x  f3 + .... + xn − x  f n
2
i  fi
 2
= ó =
2 i =1

N N

Ejemplos.
A) Calcular la varianza de las edades de una muestra de ocho niños.
9, 10, 8, 8, 9, 8, 9, 11

2.4 Desviación Estándar


La desviación estándar o desviación típica es la raíz cuadrada de la varianza. Es decir, la
raíz cuadrada de la media de los cuadraos de las puntuaciones de desviación.

La desviación estándar se representa por  y se define, para datos sin agrupar:

 ( x − x)
n

( ) ( ) ( ) ( )
2
2 2 2 2
x1 − x + x2 − x + x3 − x + .... + xn − x i
= ó = i =1

N N

Para datos agrupados, se utiliza:

( x − x)
n

( x − x) ( ) ( ) ( )
2
2 2 2
 f1 + x2 − x  f 2 + x3 − x  f 3 + .... + xn − x  f n
2
i  fi
=
1
ó = i =1

N N

Ejemplos.
A) Calcular la desviación estándar de las edades de una muestra de ocho niños.
9, 10, 8, 8, 9, 8, 9, 11
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
B) Determine la varianza y desviación estándar de las alturas de cinco mascotas que se
midieron y se obtuvieron las siguientes alturas; 60 cm, 47 cm, 17 cm, 43 cm, y 30 cm.

2.5 Diagramas de cajas


Los diagramas de cajas de bigotes son una presentación visual que describe varias
características importantes, al mismo tiempo, tales como la dispersión y simetría.
Consiste en representar los cuartiles y los valores mínimo y máximo de los datos o del
conjunto de datos, sobre un rectángulo, alineado horizontal o vertical.
Ejemplos.
A) Construya una caja de bigotes, para representar las edades de 20 personas que
asistieron a una fiesta. Las edades son: 36, 25, 37, 24, 39, 20, 36, 45, 31, 31, 39, 24,
29, 23, 41, 40, 33, 24, 34, 40.

B) Considere la siguiente información referida a la distribución de horas (h) dedicadas a


ver televisión, por semana, en los jóvenes de una comunidad urbana y los jóvenes de
una comunidad rural:
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
Considere las siguientes proposiciones:

I. El mínimo de horas que los jóvenes de la comunidad urbana dedican a ver


televisión es de 10 horas.

II. El recorrido de las horas que dedican los jóvenes de la comunidad rural, es
menor que el recorrido de las horas que dedican los jóvenes de la comunidad
urbana.

¿Cuál o cuáles de ellas son VERDADERAS?

a) Ambas b) Ninguna c) Solo la I d) Solo la II

Medidas de Variabilidad

3.1 Posición relativa: estandarización


La estandarización, relativiza un valor para poder realizar una comparación.
La posición relativa utiliza la fórmula: Dato − Media
Desviación
Ejemplos.
A) Considere el siguiente contexto

Considere las siguientes afirmaciones referidas a la información anterior.


I. Los tiempos de los cinco primeros atletas masculinos tienen menor variabilidad
relativa que los primeros cinco tiempos de las atletas femeninas.
II. La posición relativa del tiempo del atleta D masculino en llegar a la meta, es
superior que la posición relativa del tiempo de la atleta D femenina en llegar a
la meta en sus respectivas categorías.

¿Cuál o cuáles de ellas son VERDADERAS?


a) Ambas b) Ninguna c) Solo la I d) Solo la II
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
B) Considere la información y las proposiciones referidas a él

I. En el grupo de Horacio son más variables las masas que las del grupo de
Minor.

II. En el grupo de Javier son menos variables las masas que las del grupo de
Horacio.

¿Cuál o cuáles de ellas son VERDADERAS?

a) Ambas b) Ninguna c) Solo la I d) Solo la II

3.2 Coeficiente de variación


El coeficiente de variación es la relación entre la desviación estándar de una muestra y su
media.
El coeficiente de variación se expresa en porcentaje: C.V =  100
x
La mayor dispersión corresponderá al valor del coeficiente de variación mayor.
Ejemplos.
A) Los precios para un producto de limpieza A tienen promedio 140 y desviación
estándar de 28,28 y los precios para un producto B tienen promedio de 150 y
desviación estándar de 24. ¿cuál de las dos presentan mayor dispersión?
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
B) Considere la siguiente información.
Una docente analiza las estaturas de un grupo de estudiantes (considere que el grupo
es numeroso y con igual cantidad de hombres que de mujeres). Entre ellos, se
determina que Miguel mide 184 cm y la altura de Ana es de 174 cm. Asimismo, se
sabe que:
• La media aritmética (promedio) de las estaturas de los varones del grupo es de
175 cm y la desviación estándar es de 16 cm.
• La altura promedio de las mujeres del grupo es de 162 cm y la desviación
estándar es de 17 cm.

La diferencia entre los coeficientes de variación de las altura del grupo de mujeres y
del grupo de varones corresponde a

a) 1,06% b) 1,08% c) 1,35% d) 1,61%

Considere el siguiente texto para responder las siguientes dos preguntas, C y D.

La siguiente tabla muestra información relacionada con las calificaciones por


asignatura de los estudiantes de una escuela.
Asignatura Media aritmética Desviación estándar
Matemática 65 10
Español 80 5
Estudios Sociales 75 11
Ciencias 78 11

• José, un estudiante de esa escuela, obtuvo las siguientes calificaciones: 70 en


Matemática, 81 en Español, 80 en Estudios Sociales y 82 en Ciencias.

• Sofía, una estudiante de esa escuela, obtuvo las siguientes calificaciones: 95


en Matemática, 65 en Español, 75 en Estudios Sociales y 85 en Ciencias.

C) Considere las siguientes proposiciones

I. En matemáticas el coeficiente de variación aproxima a 15,38.

II. Las calificaciones de Estudios Sociales, de todos los estudiantes de la escuela


tienen menor variabilidad relativa que Ciencias

¿Cuál o cuáles de ellas son VERDADERAS?

a) Ambas b) Ninguna c) Solo la I d) Solo la II


COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
D) Con base en la información del contexto anterior considere las siguientes
proposiciones:

I. En Estudios sociales la posición relativa de Sofía es 75.

II. Al considerar las calificaciones de José en las cuatro asignaturas, el obtuvo


mejor posición relativa en Matemáticas.

¿Cuál o cuáles de ellas son VERDADERAS?

a) Ambas b) Ninguna c) Solo la I d) Solo la II


COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
Trabajo Cotidiano
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas
COLEGIO SUPERIOR DE SEÑORITAS
Departamento de Matemáticas

También podría gustarte