Está en la página 1de 56

MATEMÁTICAS 2

ESTADÍSTICA
-Conceptos Elementales

Ing.Rita Cabrera – Ing.Juan M.Alarcón


-2020-
ALGUNAS DEFINICIONES:

• La ESTADÍSTICA es la ciencia que proporciona técnicas y métodos para la


recolección, organización y análisis (interpretación) de datos
y a través del ANÁLISIS, tomar decisiones frente a situaciones de incertidumbre..

• También podemos decir que la ESTADÍSTICA, es el lenguaje universal de la ciencia…


DESCRIPTIVA
Como su nombre lo dice,
INFERENCIAL
describe un Comprende el conjunto de
conjunto de datos. Se ocupa de métodos que
las técnicas permiten extender los
para recopilar, organizar y resultados de la
presentar muestra hacia la población.
datos. En los estudios
descriptivos sólo se
pretende mostrar las
características
del fenómeno que se quiere
estudiar.
ALGUNAS DEFINICIONES BÁSICAS
POBLACIÓN:
Es el conjunto o totalidad de elementos cuyas propiedades serán analizadas.
La población se clasifica en:

• finita:
Tiene un número limitado de elementos.

• infinita:
Tiene un número ilimitado de elementos
Cuando es imposible estudiar la población por ser muy
grande o por razones de tiempo y costo o porque el estudio
lleva a la destrucción del material, se trabaja con una muestra.

MUESTRA: subconjunto o parte de la población.


El estudio de todos los elementos de la población recibe el nombre
de censo o enumeración completa.

El estudio de la población a través de la muestra recibe el nombre


de encuesta o muestreo.

Dejamos para que investiguen, con los medios que cuenten, los
diferentes tipos de muestreo que existen.
ALGUNOS EJEMPLOS DEL USO DE LA ESTADÍSTICA

La estadística tiene aplicación en los más diversos aspectos:

• Control de calidad, minimización de costos, combinación de productos e inventarios ,control de


fallas en la producción fabril..

• En el área de investigación de mercados, la estadística es de gran ayuda en el momento de


determinar el probable éxito de un producto innovador.

• En la actualidad, con una pandemia a nivel mundial, es imprescindible la estadística en el campo de la


investigación de nuevos medicamentos para combatirla y prevenirla, mediante vacunas..

• En la política ..¿Quién ganará las elecciones presidenciales?

• En el campo del urbanismo, es imprescindible un estudio estadístico, para estudiar la población..


DEFINICIONES

Una unidad es el elemento u objeto que observamos. Cuando el objeto es una persona, nos referimos
a la unidad como sujeto.

Una observación es la información o característica registrada para cada unidad.

Una característica que puede variar de una unidad a otra unidad es llamada variable.
Ejemplo: la edad de un estudiante que ingresa a la universidad, el color de su cabello, su estatura y su
peso, son tres variables..

Dato: Valor de una variable asociada a un elemento de una población o muestra. Este valor puede ser
un número, una palabra o un símbolo.

Un conjunto de observaciones de una o más variables es denominado conjunto de datos.

Experimento: actividad planeada cuyos datos resultados producen un conjunto de datos. Incluye las
actividades para “seleccionar” los elementos y obtener valores para
los datos.
Parámetro: Valor numérico que resume todos los datos de una población completa.
Para todo parámetro existe una estadística muestra correspondiente. La
ESTADÍSTICA describe a la muestra de la misma manera en el que el parámetro
describe a la población.
Ejemplo:
La edad promedio en el momento de ingresar a la Universidad durante los últimos
cinco años, y la “proporción de estudiantes que tenían más de 21 años cuando
ingresaron a la Universidad, son ejemplos de dos parámetros poblacionales diferentes.
Estadística: valor numérico que resume los datos de la muestra.
EJEMPLO: Un estudiante está interesado en estudiar el valor promedio ´de los automóviles que pertenecen al cuerpo docente de nuestra
facultad. Podemos identificar los términos que mencionamos:

1) POBLACIÓN: Todos los automóviles que pertenecen a todos los miembros del cuerpo docente de la facultad.

2) MUESTRA es cualquier subconjunto de esa población. Por ejemplo, los automóviles que pertenecen a los profesores del Ciclo
Básico de la carrera de Arquitectura.

3) DATO. El valor de un automóvil en particular, por ejemplo: el automóvil del Arq.Perez es $200000.

4) DATOS: conjunto de valores que corresponden a la muestra obtenida.

5) VARIABLE: valor en “pesos” de cada automóvil.

6) EXPERIMENTO: métodos aplicados para seccionar los automóviles que integren la muestra y determinar el valor de cada
automóvil de la muestra. se puede preguntar a cada miembro del ciclo básico, o de otra forma.

7) PARÁMETRO: valor promedio de todos los automóviles de la población

8) ESTADÍSTICA: Es la que encontrará el valor promedio de la muestra obtenida.


NOMINAL
CUALITATIVA
ORDINAL

VARIABLE
DISCRETA
CUANTITATIVA
CONTINUA
Variable Cualitativa: clasifica o escribe un elemento de una población. Ej. Color de cabello
(no tienen sentido en estas variables la “suma” o cálculo de “promedios”

Variable Cuantivativa o numérica: Cuantifica un elemento de una población. Ej.: Gasto en material de estudio
de alumnos de una asignatura..

Variable cualitativa ordinal: presenta una posición, o clasificación, ordenada. Ejemplo: grado de satisfacción
con un producto: poco, mediano, mucho…

Variable cuantitativa discreta: Es aquella que puede asumir un número contable de valores.
Puede asumir los valores correspondientes a puntos aislados a lo largo de un intervalo de recta.

Variable cuantitativa continua: Puede asumir una cantidad incontable de valores. Puede asumir cualquier
valor a lo largo de un intervalo de recta.
PRESENTACIÓN GRÁFICA DE DATOS

DIAGRAMAS CIRCULARES O DE PASTEL

¿Qué se debe tomar en cuenta para construir una gráfica de pastel? :


• Se debe identificar el todo así como sus partes.
• Cada elemento estudiado debe pertenecer solo a una categoría.
• Se deben representar las proporciones para cada categoría de la variable.

• La suma de las proporciones no deben exceder al 100%.


• Se debe utilizar para representar máximo 5 categorías.
• Si la suma de las categorías más grandes y más importantes suman menos del 100%, entonces las otras
categorías se deben de agrupar en una sola, la cual se debe identificar con el nombre de “otras”, “varios”, etc.
Por ejemplo, suponga que se desea representar con una gráfica de pastel los datos que se muestran en la
siguiente Tabla, que se refieren a las preferencias del buscador en Internet, que usan de un grupo de
estudiantes.
Observamos que al lado de cada categoría colocamos el número de alumnos que la eligen, ese número
representa la “frecuencia f” correspondiente.
A continuación, colocamos la columna de frecuencias relativas, indicadas como fr, que se obtiene
dividiendo el valor de la frecuencia de cada categoría por el total (suma de las frecuencias). o
proporciones por 100.

BUSCADOR Nro.de fr %
(Categoría) alumnos
Bing 5 5/65=0,0769 7,69
Msn 10 10/65=0,1538 15,38

Yahoo 15 15/65=0,2308 23,08


Google 25 25/65=0,3846 38,46
Netscape 10 10/65=0,1538 15,38
TOTAL Σf=65 Σfr=1,0000 Σ%=100
Y finalmente, para poder hacer el diagrama de pastel o circular, debemos asignarle un ángulo a cada categoría,
teniendo en cuenta que al círculo completo le corresponde un ángulo de 360°:

BUSCADOR(Categoría) Nro.de alumnos fr fr(%) GRADOS


Bing 5 5/65=0,0769 7,69 28°
Msn 10 10/65=0,1538 15,38 55°
Yahoo 15 15/65=0,2308 23,08 83°
Google 25 25/65=0,3846 38,46 138°
Netscape 10 10/65=0,1538 15,38 55°
TOTAL Σf=65 Σfr=1,0000 100% 360°
Recomendaciones:
• Evite usar gráficas de pastel
• Úselas únicamente para mostrar datos que representa una parte
importante del todo.
• Nunca use gráficas de pastel en tres dimensiones. Distorsionan y falsean la
información.
• Evite realizar comparaciones entre dos o más gráficas de pastel.
Este diagrama está basado en los resultados de la Elección del
Parlamento Europeo en el 2004 y en 1999. La tabla siguiente lista
el número de asientos asignados a cada partido. Los resultados
de 1999 han sido multiplicados por 116.933, para compensar los
otros años entre estos.
Asientos (1999) a
Grupo Asientos (2004)
escala
EUL 39 49
PES 200 210
EFA 42 56
EDD 15 19
ELDR 67 60
EPP 276 272
UEN 27 36
Otros 66 29
Un gráfico de barras que represente los resultados
anteriores de la elección del 2004 se vería así:
(Si todos los datos fuesen ordenados en orden
descendiente, este tipo de gráfico de barras sería llamado
un diagrama de Pareto.)
DIAGRAMA DE PARETTO

Un diagrama de Pareto es un tipo especial de gráfica de barras


donde los valores graficados están organizados de mayor a menor.
Utilice un diagrama de Pareto para identificar los defectos que se
producen con mayor frecuencia, las causas más comunes de los
defectos o las causas más frecuentes de quejas de los clientes.
Ejemplo:

Se elaboró un reporte del número de delitos por animadversión


ocurridos en 1993. Se observan aquí los 6746 crímenes clasificados, sus
porcentajes y sus porcentajes acumulados:
EJEMPLOS:
DISTRIBUCIONES DE FRECUENCIAS E HISTOGRAMAS
Los listados de grandes conjuntos de datos no presentan una imagen valiosa.
Algunas veces se desea condensar los datos en una forma más manejable. Esto
puede lograrse con ayuda de una DISTRIBUCIÓN DE FRECUENCIAS

DISTRIBUCIÓN DE FRECUENCIAS:
Listado, a menudo expresado en forma de diagrama, que asocia cada valor de una
variable con su frecuencia.

Ejemplo:
Dado el siguiente conjunto de datos:

4 3 2 2 3 2 4 4 1 2
2 3 2 0 2 2 1 3 3 1
Si x representa una variable, puede usarse una distribución de frecuencias para representar este conjunto
de datos enumerando los valores x con sus frecuencias:

Distribución de frecuencias no agrupadas

x f
0 1
1 3
2 8
3 5
4 3

La frecuencia es el número de veces que aparece el valor x en la muestra. La tabla anterior


corresponde a una distribución de frecuencias no agrupadas.
Cuando un gran conjunto de datos tiene muchos valores x distintos, en lugar de unos cuantos valores repetidos,
es posible agrupar los valores de un conjunto de clases y elaborar una distribución de frecuencias agrupadas.
EJEMPLO :

Tenemos una muestra de 50 calificaciones del examen final del curso de Matemáticas 1 del año anterior:

60 47 82 95 88 72 67 66 68 98
90 77 86 58 64 95 74 72 88 74
77 39 90 63 68 97 70 64 70 70
58 78 89 44 55 85 82 83 72 77
72 86 50 94 92 80 91 75 76 78

Los lineamientos básicos a seguir en la elaboración de una distribución de frecuencias agrupadas son:
1) Cada clase debe ser del mismo ancho.
2) Las clases deben estar dispuestas de modo que no se superpongan.
PROCEDIMIENTO:
1) Identifique las calificaciones máxima y mínima (Máx=98, Mín=39) y determine el rango.
Rango= Máx-Mín=98-39=59
2) Elija un número de clases (m=7) y un ancho de clase (c=10) de modo que el producto
(m.c=70), sea ligeramente mayor que el rango.
3) Elija un punto inicial, que debe ser algo menor que la calificación más baja, y así
vamos estableciendo los distintos intervalos de clase.
4) Se denomina “Marca de clase: x, al valor central de cada clase.
DIAGRAMA ESTÁNDAR PARA LA DISTRIBUCIÓN DE FRECUENCIAS
Número de clase Límites Marca de clase: x Frecuencia Frecuencia
f acumulada:
𝑓𝑎
1 35≤x<45 40 2 2
2 45≤x<55 50 2 4
3 55≤x<65 60 7 11
4 65≤x<75 70 13 24
5 75≤x<85 80 11 35
6 85≤x<95 90 11 46
7 95≤x≤105 100 4 50
HISTOGRAMA:
Realizaremos ahora una gráfica de barras que representa a una distribución de frecuencias de
una variable cuantitativa. Un Histograma está integrado por los siguientes componentes:
1) Un título que identifica la población o la muestra de interés.
2) Una escala vertical, que identifca las frecuencias que hay en las diversas clases.
3) 3) Una escala horizontal, que identifica la variable x. Los valores de los límites de clase o de
las marcas de clase deben identificarse a lo largo del eje x.

4) En el Ejemplo que acabamos de ver:


A veces es importante la frecuencia relativa de algún valor. La
frecuencia relativa es una medida proporcional de la frecuencia
de un evento. Se encuentra al dividir la frecuencia de clase entre
el número total de oservaciones.
La frecuencia relativa puede expresarse como una fracción
común, en forma decimal, o como un porcentaje. En el ejemplo
anterior, la frecuencia asociada con la tercera clase (55-65) es 7.
7
La frecuencia relativa, 𝑓𝑟 = = 0,14. En porcentaje, 14%.
50
Se puede representar también, mediante un histograma,
colocando en el eje vertical, la frecuencia relativa.Cuando
presentamos los datos en forma agrupada, se puede hablar de
“clase modal”, que representa la clase con mayor frecuencia.
ESTADÍSTICAS DESCRIPTIVAS NUMÉRICAS

Las medidas de tendencia central son valores numéricos que localizan, de alguna manera, el
centro de un conjunto de datos.
MEDIA (media aritmética)
La media aritmética se simboliza: 𝑥ҧ , y se encuentra sumando todos los
valores de la variable (simbolizada como 𝛴𝑥) y dividiendo por el número total de
elementos de la muestra (n).

𝛴𝑥
𝑥=
ҧ
𝑛

Ejemplo: Un conjunto de datos consta de cinco valores:


6,3,8,6,4
Encontrar la media.
𝛴𝑥 6+3+8+6+4 27
Solución: 𝑥=
ҧ = = = 5,4
𝑛 5 5
Representación física de la media:

CENTRO DE GRAVEDAD O
PUNTO DE EQUILIBRIO
MEDIANA
La mediana (del latín mediānus 'del medio'1) representa el valor de la variable de
posición central en un conjunto de datos ordenados. Se le denota Me.

Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales. Si la serie tiene un número impar de puntuaciones, el valor
central es la mediana.

Ejemplo: Encontrar la mediana de la muestra: 9,7,11, 10,12,8


Paso 1: Ordenamos a los números de menor a mayor (en forma creciente)
7, 8, 9, 10, 11, 12
𝑛+1
Paso 2: Calculamos lo que llamaremos “profundidad de la mediana”=ⅆ 𝑥 =
2
6+1
ⅆ 𝑥 = = 3.5
2
Paso 3: La mediana está a la mitad entre los datos tercero y cuarto. O sea que:

Me= (9+10)/2=9,5
Si nuestros datos están “agrupados”, el cálculo de la mediana se calcula con la siguiente fórmula:

Donde:
•Li: límite inferior del intervalo en el cual se encuentra la mediana.
•n: número de datos del estudio. Es la sumatoria de las frecuencias absolutas.
•Fi-1: frecuencia acumulada del intervalo anterior al que se encuentra la mediana.
•Ai: amplitud del intervalo en el que se encuentra la mediana.
•fi: frecuencia absoluta del intervalo en el que se encuentra la mediana.
MODA

Es el valor de “x” que ocurre más frecuentemente.

• Ejemplo: Dado el conjunto de datos ሼ3,3,5,6,8ሽ

La moda es 3, ya que es el valor de la variable con mayor


frecuencia.

• Otro ejemplo: 3,3,4,4,5

En este conjunto no hay moda, ya que no hay ningún elemento


que tenga mayor frecuencia que el resto de los elementos.

Decimos que la muestra no tiene moda.


Calcular la media, mediana y moda cuando trabajamos con datos agrupados en intervalos o tablas
de frecuencias con intervalos es muy sencillo,
y solo se necesitan algunas fórmulas.

Media
La media se calcula usando la siguiente fórmula:

Ejemplo: Calcular la media, moda y mediana de la siguiente distribución:


Agregamos a la tabla una columna, la de los productos de cada marca de
clase, por su frecuencia
MEDIANA
i) Encontramos primeramente el intervalo donde se encuentra la mediana, mediante
la fórmula:

ii) Observamos la tabla, y es de gran ayuda la frecuencia acumulada:

IMPORTANTE:
Observamos que n=𝛴𝑓

Obsevamos que los 11 casos se encuentran en el intervalo 3..


Aplicamos la fórmula para calcular la mediana:

Y ahora calcularemos la MODA:


Aplicamos
esta fórmula
que nos
permite
calcular la
moda para
datos
agrupados
Modo o moda es lo
mismo
MEDIDAS DE DISPERSIÓN

moda

moda

Moda =60
DESVIACIÓN CON RESPECTO A LA MEDIA

Se define como desviación con respecto a la media, al siguiente resultado : (𝑥 − 𝑥ҧ )

Ejemplo:

Considere la muestra 6,3,8,5,3. Calculamos la media, para luego calcular la desviación


de cada dato con respecto a ella:

𝛴𝑥 25
𝑥ҧ = = =5
𝑛 5

datos 𝑥 6 3 8 5 3
desviación 𝑥 − 𝑥ҧ 1 -2 3 0 -2

Observamos que 𝛴 𝑥 − 𝑥ҧ = 0
VARIANZA MUESTRAL

La varianza muestral, 𝜎 2 , es la media de las desviaciones al cuadrado, calculada usando


como divisor a (n-1)

෍ 𝑥 − 𝑥ҧ 2

𝜎2 =
𝑛−1

Donde n es al tamaño de la muestra, es decir el número de datos que hay en la


muestra dada.

Calculamos la varianza muestral de 6,3,8,5,3 :


DESVIACIÓN ESTÁNDAR MUESTRAL

La desviación estándar muestra, es la raíz cuadrada positiva de la varianza:

𝜎= 𝜎2
En el ejemplo anterior: 𝜎 = 4.5 = 2.1
Sin realizar la demostración, matemáticamente podemos calcular la varianza muestral, mediante la siguiente
fórmula:

2
2 𝛴𝑥
෌𝑥 − 𝑛
𝜎2 =
𝑛−1
EJEMPLO:
La unidad de medida para la desviación estándar es la misma que la unidad de mdida para los
datos. Por ejemplo, si los datos están en gramos, entonces la desviación estándar también está
en gramos.

Debemos tener en cuenta, que cuando trabajamos con datos agrupados, x es la marca de
clase.

EJEMPLO (pág.31)Aquí calcularemos, utilizando las marcas de clase ya calculadas:


𝛴𝑥𝑓 3780
𝑥ҧ = = = 75.6
𝛴𝑓 50

𝛴𝑥𝑓 2
2
෌𝑥 𝑓 − 𝑛 (Donde n=𝛴𝑓)
𝜎2 =
𝑛−1

𝒅𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝒆𝒔𝒕á𝒏𝒅𝒂𝒓 𝝈= 𝝈𝟐 = 𝟐𝟐𝟏. 𝟏 = 𝟏𝟒. 𝟗

Y ahora, a trabajar con la práctica!!!!.......


Bibliografía:
-ESTADÍSTICA DESCRIPTIVA Y PROBABILIDAD
Facultad de Ciencias Económicas y Estadística, UNR - Profesores: Javier Bussi, Fernanda Ménde
-matemovil.com
-PROBABILIDAD Y ESTADÍSTICA PARA INGENIERÍA Y CIENCIAS- Jay LO.Devore

También podría gustarte