Está en la página 1de 34

CORPORACIÓN UNIVERSIDAD DE LA

COSTA
DEPARTAMENTO DE CIENCIAS BASICAS

Estadística Descriptiva e Inferencial

Profesor: Kennedy Hurtado Ibarra


ESTADISTICA DESCRIPTIVA E

INFERENCIAL
• Introducción.
• Estadística descriptiva.
• Distribución de frecuencia.
• Medidas de tendencia Central y variabilidad.
• Estadística inferencial.
• Muestras aleatorias y distribuciones muéstrales
• Teoría de estimación.
• Prueba de hipótesis.
• Prueba de bondad de ajuste
• Tablas de contingencias.
• Métodos no paramétricos
En la vida diaria los diversos fenómenos de orden
económico, social, político, educacional, e incluso
biológico, nos induce a tener un registro ordenado y
continuo de los datos necesarios para un estudio de lo
que ha sucedido, sucede o puede suceder. Para ello se
requiere contar con un método, con un conjunto de
reglas o principios, que nos permita la observación, el
ordenamiento, la cuantificación y el análisis de dichos

fenómenos .
CONCEPTO DE ESTADISTICA.
ESTADISTICA: La Estadística se considera como la
técnica o método científico usado para recolectar,
organizar, resumir, presentar, analizar, interpretar,
generalizar y contrastar los resultados de las
observaciones de los fenómenos reales.

Estadística: no es más que una colección de datos


numéricos y categóricos ordenados y clasificados
según un determinado criterio.
DFINICIÓN DE ESTADISTICA DESCRIPTIVA
La Estadística se considera como la técnica o método científico usado
para recolectar, organizar, resumir, presentar, analizar e interpretar un
fenómeno en estudio.
DEFINICIÓN DE ESTADISTICA INFERENCIAL.
La estadística inferencial abarca aquellos métodos y conjuntos de
técnicas que se utilizan para obtener conclusiones sobre las leyes de
comportamiento de una población basándose en los datos de muestras
tomadas de esa población.
DEFINICIÓN DE ESTADISTICA MATEMATICA.
Estadística, es la ciencia que, utilizando como instrumento a las
matemáticas y al cálculo de probabilidades, estudia las leyes de
comportamiento de aquellos fenómenos que, no estando sometidos a las
leyes físicas y basándose en ellas predecir y realizar inferencias de los
resultados.
APLICACIÓN DE LA ESTADISTICA.
En general, el problema que enfrentan las empresas e industrias no es la
escasez de información, sino como utilizar la información disponible para
tomar las decisiones más adecuadas. Por esta razón, desde la perspectiva
de una toma de decisiones informada, cabe preguntarse por qué un
ingeniero, un administrador, un economista, etc, necesita saber estadística.
Para dar respuesta a esta inquietud podemos decir que estos deben
comprender la estadística, básicamente, por tres razones fundamentales:
1. Presentar y describir la información en forma adecuada.
2. Inferir conclusiones sobre poblaciones grandes basándose solamente en
la información obtenida de subconjuntos de ellas.
3. Utilizar modelos para obtener pronósticos confiables.
APLICACIÓN DE LA ESTADISTICA.
En general, el problema que enfrentan las empresas e industrias no es la
escasez de información, sino como utilizar la información disponible para
tomar las decisiones más adecuadas. Por esta razón, desde la perspectiva
de una toma de decisiones informada, cabe preguntarse por qué un
ingeniero, un administrador, un economista, etc, necesita saber estadística.
Para dar respuesta a esta inquietud podemos decir que estos deben
comprender la estadística, básicamente, por tres razones fundamentales:
1. Presentar y describir la información en forma adecuada.
2. Inferir conclusiones sobre poblaciones grandes basándose solamente en
la información obtenida de subconjuntos de ellas.
3. Utilizar modelos para obtener pronósticos confiables.
DEFINICION DE POBLACIÓN.

Una población es el conjunto total de objetos que son de interés para un


problema dado. Los objetos pueden ser personas, animales, productos
fabricados, etc. Cada uno de ellos recibe el nombre de elemento o individuo de
la población.
Ejemplo: población estudiantil de la Universidad del atlántico, los niños de una
ciudad, enfermos de un hospital, etc.

DEFINICIÓN DE MUESTRA.
Una muestra es un subconjunto de la población. Ejemplo: Si todos los
estudiantes de la Universidad del Atlántico es una población, los estudiantes
nacidos en determinado mes del año pueden constituir una muestra.
TIPOS DE DATOS:

Existen dos tipos de datos: Numéricos (cuantitativos) y Categóricos o


(cualitativos).

DATOS NUMERICOS (CUANTITATIVOS)


Los datos numéricos o cuantitativos producen respuestas numéricas como
el peso en kilogramos o el número de universidades que hay en la Costa
Atlántica.

Estos datos son de dos tipos:


Discretos: Números enteros
continuos: Números reales
DATOS CATEGORICOS O CUALITATIVOS.

Representan categorías o atributos (Ejemplo, si o no) que pueden


clasificarse como un criterio o cualidad.

ORGANIZACIÓN DE DATOS SEGÚN ESCALAS DE MEDIDAS.


Los datos también se pueden clasificar según la escala de medición o
el procedimiento que los genero. Cuatro tipos de escalas de medición
usados en estadística son:
Las escalas nominal.
Las escala Ordinal.
Las escalas de intervalo.
Las escalas de razón.
DEFINICION DE ESTADÍSTICOS Y PARÁMETROS.

Definición de estadístico: Son valores que se obtienen de una muestra, y se


consideran como estimadores de los parámetros.
Media aritmética muestral 𝑥 ̅
Desviación estándar muestral: S
Varianza muestral: S2
Proporción muestral: 𝑝 ̂ 

Definición de parámetros: Son valores que se obtienen de una población.


Media aritmética poblacional: µ
Desviación estándar poblacional: σ
Varianza poblacional: σ2
Proporción poblacional: P
TABLA DE FRECUENCIA NO AGRUPADA.

Son aquellas en donde cada dato tiene la frecuencia correspondiente. Los


datos que organizados en tablas de frecuencias no agrupadas se
denominan usualmente datos no agrupados.
Ejemplo: La tabla de frecuencias (no agrupada) para el conjunto de datos.
3, 5, 7, 6, 4, 3, 7, 6, 6, 7, 5, 7.
TABLAS DE FRECUENCIAS AGRUPADAS
Otra posibilidad de organizar datos es agruparlos en intervalos (llamados
intervalos de clase o, simplemente, clases).

Intervalos f fr fa xi
11.5 - 14.5 2 0.05 2 13
14.5 - 17.5 8 0.20 10 16
17.5 - 20.5 11 0.275 21 19
20.5 - 23.5 10 0.25 31 21
23.5 - 26.5 8 0.20 39 24
26.5 - 29.5 1 0.025 40 27
Definición de tablas bivariadas

Una tabla de frecuencias bivariadas es un arreglo de datos clasificados


en dos categorías con sus respectivas frecuencias. Las categorías
pueden ser números discretos, intervalos numéricos o valores
cualitativos como género, color de cabello o religión.

Ejemplo: Una encuesta sobre el deporte preferido tuvo los resultados en


hombres y mujeres que se muestran en la siguiente tabla bivariada.
ĞƉŽƌƚĞƐĨĂǀ ŽƌŝƚŽƐ
ĠŝƐďŽůĂƐƋƵĞƚďŽů&ƵƚďŽů
, Žŵ ďƌĞ ϭϵ ϭϱϮϰ ϱϴ
D ƵũĞƌ ϭϲ ϭϴϭϲ ϱϬ
dŽƚĂů ϯ ϱϯ ϯ ϰϬ ϭϬϴ
ORGANIZACIÓN DE DATOS MEDIANTES REPRESENTACIONES
GRAFICAS.
Hay gráficas de varios tipos, entre los cuales se encuentran los siguientes:
 El diagrama circular.
 El diagrama de barras.
 El diagrama de caja y bigote,
 El histograma.
 El polígono de frecuencia o de frecuencia relativas.
 La ojiva o polígono de frecuencia acumulado.
 Diagrama de tallo y hojas. 
Diagrama circular:
Estos diagramas se utilizan para hacer representaciones porcentuales y se
utilizan generalmente para datos categóricos.
Ejemplo:
Encuesta realizados a una muestra de estudiantes de la Universidad
de la costa, sobre su deporte favorito:

Deportes Frecuencias Frecuencias relativas


Futbol 12 0,3
Beisbol 9 0,4
Tenis 3 0,1

Basquetbol 6 0,2
.
Diagrama de barra:
Es una representación gráfica en la que cada una de las modalidades
del aspecto de interés se representa mediante una barra.

14
12 GRAFICA DE DEPORTES FAVORITOS
10
8
6
4
2
0
FU BEI T BASQUE...
Definición de Polígonos:
Estos gráficos se utilizan para representar series cronológicas y se
construye usando una tabla de frecuencias (absoluta o relativa)
agrupadas con marcas de clase. Si se usan frecuencias absolutas, se
denomina polígono de frecuencias y si se utilizan frecuencias relativas,
polígono de frecuencias relativas.
EJERCICIOS DE APLICACIÓN
1. Con la información del gráfico que aparece a continuación responda
las siguientes preguntas:
.

a) El número de establecimientos cuyas ventas diarias fluctuaron entre $15 y $30 (mill.) es
igual a: ___________
b) El % de número de establecimientos cuyas ventas diarias fue de por lo menos $20 (mill.)
es igual a: _______%
c) El número de establecimientos cuyas ventas diarias fueron superiores a $25 (mill.) es igual
a: __________
d) El % de establecimientos cuyas ventas diarias entre $10
Ejercicio 2.
En cierto país, una persona es considerada joven si su edad es menor o
igual a 30 años. El siguiente diagrama muestra la distribución de las
edades para ese país.
.

De acuerdo con el diagrama, ¿es correcto afirmar que la mayoría de la


población de ese país es joven?
a. Sí, porque las personas de 30 años pertenecen a la porción más
grande.
b. No, porque se desconoce la proporción de personas entre 31 y 35
años.
c. Sí, porque las personas jóvenes corresponden al 65% de la población.
d. No, porque todas las porciones del diagrama son menores al 50%.
Ejercicio 3.
Los psicólogos que trabajan en un Centro de Día para adultos de la tercera
edad de la Ciudad de Buenos Aires, observaron el estado civil de un grupo de
120 varones que se tratan por problemas depresivos. Sus registros se
presentan en la siguiente tabla.

¿Qué porcentaje se le asignaría a cada integrante de esta


variable. Explique?
 
Ejercicio 4

De acuerdo a la tabla, se puede afirmar que el porcentaje de familias que tiene un


solo hijo es de:
Números Familias
de hijos
0 30
1 25
2 100
3 19
4 26

a. 20.5%
b. 12.5 familias
c. 1 familias
d. 26 familias
e. 28.9% familias
MEDIDAS DE TENDENCIAS CENTRAL O DE CENTRALIZACION.
Al estudiar la información estadística mediante su representación gráfica,
se puso en evidencia un significativo comportamiento de los datos en
cuanto a la frecuencia con que se presentan los valores: algunos de estos
valores son más frecuentes que otros. Además, se observó´ una clara
tendencia de agrupación en el vecindario de los valores más frecuentes,
de aquí deriva el nombre de medidas de tendencia central.
 La media aritmética
 La mediana.
 La moda.
 La media geométrica.
 La media armónica
  La media aritmética
Definición: La media aritmética de cierto conjunto de números se
encuentra sumando los números y dividiendo después entre la cantidad
de datos. En otras palabras, si x1,...,xn son números, entonces, la media
aritmética de este conjunto de números esta´ dada por
=
En estadística se habla de media aritmética poblacional, y se simboliza
por µ, cuando el conjunto de datos corresponden a los de la población; y
de media aritmética muestral, y se simboliza por , cuando se tienen en
cuentan las muestras
Ejemplo:
Supongamos que tenemos la muestra siguiente de edades en año de
principiantes de una universidad: 18, 18, 18, 18, 19, 19, 19, 20, 20, 21.
Entonces, la media aritmética de estos datos es los datos de una muestra.
Media aritmética = (18+18+18+18+19+19+19+20+20+21) / 10 = 19

Media aritmética ponderada.


Generalmente, para calcular la media de un conjunto de datos, es más
cómodo utilizar la llamada media aritmética ponderada, la cual es un
caso especial de la media aritmética..
Mediana:
Para datos medidos en al menos una escala de intervalo, la mediana es el
puntaje medio ordenado.
Ejemplo:
El conjunto de números 3, 4, 4, 5, 6, 8, 8, 8 y 10 tiene mediana 6, puesto que
ya los datos están ordenados, el número de datos es 9 (impar) y, en este
caso, el 6 está ubicado en el centro (en el cuarto lugar).
Ejemplo:
El conjunto de números 5, 5, 7, 9, 11, 12, 15 y 18 tiene mediana = 9 +11 =
10

La moda

Definición: La moda, si se da, es el dato con mayor frecuencia.


Ejemplo: El conjunto 2, 2, 5, 7, 9, 9, 9, 11 tiene moda 9 porque este valor
es el dato con mayor frecuencia.
Cuartiles.
Definición: Los cuartiles son las medidas de posición relativa
correspondiente a un conjunto ordenado de datos divididos en cuatro partes
(iguales) y se define como sigue:
• Q1 = primer cuartil o 25-ésimo percentil.
• Q2 = segundo cuartil o 50-ésimo percentil o también mediana.
• Q3 = tercer cuartil o 75-ésimo percentil.

Ejemplo:
representan los salarios (en millones de pesos) de 12 empleados en una
empresa:
Como primer paso fundamental, debemos ordenar los datos de manera
ascendente.
2,210; 2,255; 2,350; 2,380; 2,380; 2,390; 2,420; 2,440; 2,450;
2,550; 2,630; 2,825.
Índice= n*Q/100

Q1 = el 25% de los empleados de la empresa gana $ 2.350000 o menos


y el 75% de estos empleados gana $2.350.000 o más que este valor.
Q3 = el 75% de los empleados de la empresa gana $ 2.450.000 o menos
y el 25% de estos empleados gana $2.450.000 o más que este valor
MEDIDAS DE VARIABILIDAD
Rango, desviación típica o estándar, varianza, desviación media y
coeficiente de variación.
VARIANZA
La varianza de un conjunto de n datos x1, x2, ………xn, se define:

 Ejemplo: calcular la varianza de los siguientes datos: 3, 5, 8 y 4.

La media aritmética = 5
S2 = = 4.66
 La desviación estándar desviación típica.

Definición: La desviación estándar de un conjunto de n datos x1, x2,


………xn, se define: 

S=

Coeficiente de variación
Se utiliza para comparar la variabilidad de dos o mas muestras.

Cv = s/
EJERCICIOS DE APLICACIÓN
Ejercicio 1.
De acuerdo a la información de la tabla se puede afirmar que:

Clases fj xi
20 - 30 6 25
30 - 40 7 35
40 - 50 4 45
50 - 60 8 55
60 - 70 5 65

La media aritmética, la varianza y la desviación típica respectivamente es:


a. 45; 103.33 y 10,17
b. 44.67; 196.56 y 14,02
c. 65; 100 y 10,0
d. 180; 203.33 y 14,26
Ejercicio 2
En una empresa manufacturera del atlántico Colombia el departamento
de producción está formado por 10 trabajadores, 4 mujeres y 6 hombres
la edad promedio de las mujeres es 30 años y la de los hombres es 40. La
edad promedio de los trabajadores del departamento de producción es:
a. 30 años
b. 35 años
c. 36 años
d. 40 años
Ejercicio 3
El salario medio es:
  Salarios Planilla
Operarios 1300 15
Administrativos 1400 3
Tecnicos 1800 2
Jefes de sección 2200 2
Directores 4000 1

a. 7140
b 3336,4
c. 1552,17
d. 3,3

También podría gustarte