Está en la página 1de 14

UNIDAD I: Introducción a la Estadística.

OBJETIVO TERMINAL: Aplicar los conceptos básicos de estadística en la


investigación científica.

Según, Compostela (2010) una de las aplicaciones más antiguas, de que se tiene
constancia, es de la Estadística parece que tuvieron lugar en Egipto hace unos 5000 años en
donde la utilizaban mediante sus censos. En algunos monumentos antiguos de los egipcios
se han encontrado documentos interesantes que muestran la sabia organización y
administración de este pueblo, en donde se llevaban la cuenta de los movimientos de la
población y creaban censos muy a menudo. Además fueron los romanos, que mejor
supieron emplear los recursos de la Estadística con su perfecta organización política,
jurídica y administrativa, que en tiempo de Antonino Pío (86-161) se llevaba un completo
registro de nacimientos y fallecimientos.
Por otra parte, Ruiz y Sánchez (s.f) señalan que, Godofredo Achenwall, profesor de la
Universidad de Gotinga, acuñó en 1760 la palabra estadística, se extrajo del término italiano
statista (estadista) que significa estado en el sentido político, se empleó entonces para
referirse a la recolección y descripción de tales datos del estado. También tenía en cuenta
que los datos de la nueva ciencia serían el aliado más eficaz del gobernante consciente. La
raíz remota de la palabra se halla, por otra parte, en el término latino status, que significa
estado o situación. Esta etimología aumenta el valor intrínseco de la palabra, por cuanto la
estadística revela el sentido cuantitativo de las más variadas situaciones.
La ESTADÍSTICA es un conjunto de conocimientos y métodos que consisten en recopilar,
clasificar, presentar, analizar e interpretar datos numéricos extraídos de hechos reales y
permite al investigador tomar decisiones en situaciones donde se encuentren, lógicamente
aceptables. La Estadística utiliza datos de la vida real a diferencia de la matemática que
trabaja con entes en su mayoría abstractos.
Se dedica a todo lo medible y en aquellos casos no muy posible de hacerlo, busca los
medios para lograrlo como el caso de los gustos, por medio de índices.
ETAPAS EN UNA INVESTIGACIÓN ESTADÍSTICA.
Planificación de la investigación.
Recolección de la Investigación.
Procesamiento y presentación de la Información.
Análisis.
Resultados (Conclusiones y recomendaciones).
DIVISIÓN DE LA ESTADÍSTICA.
 ESTADÍSTICA DESCRIPTIVA O DEDUCTIVA: Es la encargada de la organización y
presentación de los datos en cuadros, gráficos del cálculo de las medidas numéricas que
permite destacar los aspectos más importantes de los datos, es decir, describe las
características de un conjunto de datos. Por ejemplo, al determinar el promedio de las
edades de los estudiantes de una sección de Estadística o la edad más común, etc. En
estos casos el estudio queda limitado al conjunto
Elegido, los resultados y las conclusiones son exclusividad de ellos. Esta solo se ocupa de
describir y analizar un grupo dado sin sacar conclusiones sobre un grupo mayor.
 ESTADÍSTICA INFERENCIAL O INDUCTIVA: Se encarga de estudiar las
características y las leyes propias de un a población mediante una muestra seleccionada
de ella. Es utilizada cuando las conclusiones rebasan los límites del conjunto de datos
aportados y nos permite inferir dentro del límite siempre probable de los valores del
conjunto mayor. Por Ejemplo: si tenemos todas las secciones de Ingles del segundo
semestre de cierta carrera, se selecciona una muestra para calcular aproximadamente la
nota más común y luego inferir en cuanto a esa puntuación para todos los estudiantes de
ese nivelen la misma carrera. Estos métodos tienen su base de apoyo en la Teoría de
Probabilidad y en la Teoría de Muestreo.
Los métodos Deductivos e Inductivos no son herramientas que necesariamente se utilizan
por separado sino que pueden actuar conjuntamente. Lo usual en cualquier estudio
realizado por muestreo, en primer lugar se aplique los método descriptivos y luego
Inferencial.
CONCEPTOS BASICOS.
UNIVERSO: Conjunto finito o infinito de seres vivos, elementos o cosas sobre los cuales
están definidas las características que se desean analizar.
POBLACIÓN: Es un conjunto de elementos cuyas características tratamos de estudiar y
acerca del cual deseamos obtener información. Son finitas e Infinitas, según el número de
elementos que la componen.
MUESTRA: Es un subconjunto de la población que elegimos para observar y a partir del
cual tratamos de conocer las características de la población. En una población pueden
seleccionarse varias muestras.
VARIABLE: Es un símbolo tal como X Y Z que puede tomar un conjunto prefijado de
valores llamado dominio. Las características de una variable pueden ser Cuantitativas o
Cualitativas.
TIPOS DE VARIABLES CUANTITATIVA:
VARIABLE DISCRETA: Se obtiene a través de una operación de conteo, no admite
seccionamiento y es una cantidad exacta.
VARIABLEAS CONTINUAS: Es la variable que puede tomar cualquier valor entre dos
valores dados.
ESTADISTICOS: Son características numéricas de las muestras.
PARÁMETROS: son características numéricas de la población.

EJEMPLOS:
1. Para cada uno de los experimentos propuestos defina: variable, tipo de variable
universo, población y muestra si se puede.
a) En una institución educativa se quiere saber la ocupación de los egresados de la última
década. Para esto se convoca a una reunión de egresados y de los asistentes se encuestan
a 10 egresados de cada año.
Solución:
Universo: Todos los egresados de la institución educativa
Población: Todos los egresados de la última década.
Muestra: Los 100 estudiantes seleccionado, es decir, 10 de cada promoción
Variable: Ocupación de los egresados de la última década
Tipo de Variable: Cualitativa.

b) Los estudiantes del segundo y quinto semestre de la Especialidad Análisis de Sistema


del DCyT de la UCLA
Solución:
Universo: Todos los estudiantes del DCyT de la UCLA
Población: Estudiantes de la Especialidad Análisis de Sistema del DCyT de la
UCLA.
Muestra: Los estudiantes del segundo y quinto semestre del DCyT de la UCLA
Variable: Cantidad de estudiantes del segundo y quinto semestre del DCyT de la
UCLA
Tipo de Variable: Cuantitativa Discreta.

c) Al realizar un estudio entre los 900000 de jóvenes entre 15 y 19 años ( en el 2002) y al


realizar un estudio en 22500 jóvenes del área metropolitana se encontraron que un 92%
del total de ellos desean seguir estudiando en la Universidad
Solución:
Población: Los 900000 jóvenes entre 15 y 19 años
Muestra: 22500 Jóvenes del área metropolitana entre 15 y 19 años
Variable: Deseo de seguir estudiando en la Universidad
Además el 92% representa un parámetro

EJERCICIO:
En cada uno de los casos siguientes indíquese si se trata de datos continuos o de datos
discretos:
a) Cantidad de acciones que se venden diariamente en la bolsa de valores.
b) Temperatura registrada cada media hora en un observatorio.
c) Vida media de los cinescopios producidos por una empresa.
d ) Ingreso anual de los profesores universitarios.
e) Longitud de 100 pernos producidos en una fábrica
SOLUCIÓN
a) Discreta; b) continua; c) continua; d ) discreta; e) continua.
ESCALAS DE MEDICIÓN.
Los datos estadísticos por lo general provienen de la medida de una o más variables y se
define como el conjunto de valores que pueden tomar esas variables.
TIPOS DE ESCALAS
ESCALA NOMINAL: Representa el nivel más bajo de medida. Se utiliza cuando un
objeto se diferencia de otro solamente por la nominación que se conoce.
Ejemplo: la clasificación de individuos
_ Altos- Bajos.
_ Masculino- Femenino.
ESCALA ORDINAL: Estas escalas distinguen los diferentes valores de la variable,
ubicando los sujetos en orden desde el más alto hasta lo mas bajo.
Ejemplo: el nivel educativo de las personas.
ESCALA DE INTERVALOS: Aquí se puede indicar la cantidad en la que un objeto se
diferencia de otro.
Ejemplo: Prueba de conocimiento.
Esta escala posee todas las características de una escala nominal y una ordinal y además
está basado en intervalos iguales.
ESCALA de RAZON: Es la más completa de las escalas de medida y se caracteriza porque
los valores entre dos variables se puede decir si son iguales o no, cual es mayor y cuanto es
mayor una que otra, si un valor es el doble o la mitad, en general k veces otro valor.
Ejemplo: el peso de las personas.
ESCALA ABSOLUTA: Se caracteriza porque los valores que puede tomar la variable son
el resultado de un conteo y en consecuencia está constituido por todos los números enteros
positivos y el cero.
Ejemplo: el número de desempleados.

EJERCICIO:
Para cada uno de los experimentos propuestos determine la escala de medición.
a. El tiempo (seg.) requerido para ejecutar un programa de estadística.
b. Seleccionar los mejores platillos de acuerdo a su sabor y presentación
c. Las calificaciones de Excelente, Bueno y Malo
d. Tiempo Calendario(Gregoriano, Hebreo o Islámico)
e. Estatura en pulgadas
f. Delegación donde vives
Solución:
a. E. Intervalo b. E. Ordinal c. E. Ordinal d. E. Intervalo e. E. razón f. E.
Nominal
UNIDAD II: Distribución de Frecuencias y herramientas gráficas.
OBJETIVO TERMINAL: Aplicar las técnicas de organización y resumen de datos con la
finalidad de preparar y obtener información significativa.

DISTRIBUCIÓN DE FRECUENCIA.
En el caso de ordenación de datos cualitativos, la agrupación es muy sencilla y se realiza
de acuerdo a las modalidades que presenta la variable de estudio.
En este caso organizaremos datos en una tabla de distribución de frecuencia agrupándolas
en clases de igual amplitud, mediante un conteo para determinar el número de datos
correspondientes a las diferentes categorías de la variable.
Para organizar y agrupar datos del tipo cuantitativo, bien sea del tipo discreto o continuo se
utiliza un procedimiento muy similar, pero más laborioso a los datos cualitativos. Al
resumir grandes colecciones de datos, es útil distribuirlas en clases y categorías,
determinando el número de individuos que pertenecen a la clase es llamado "frecuencia de
clase". Aquí observamos una sola característica.
Tipos de Datos.
Datos no Agrupados: (cuando la cantidad de datos es menor o igual a 15)
- Se observa los valores de las características.
- Si la variable admite ordenación, se ordenan de menor a mayor.
- Observar los valores repetidos.
Datos Agrupados: (cuando la cantidad de datos es mayor a 15)
- Se observa los valores de las características.
- Si los valores de la característica es muy elevado se agrupan por categorías.
Elementos de una distribución de frecuencia.
_ f: frecuencia absoluta (cantidad de elementos que se repiten).
_ f/n: frecuencia relativa (Proporción de elementos)
_ F: frecuencia Acumulada(es lo que podemos ir acumulando)
_ F/n: frecuencia relativa acumulada (Proporción de lo que acumulamos)
INTERVALO DE CLASE: Lo podemos definir como el conjunto de datos que se
encuentran ubicados entre dos límites establecidos.
LIMITES: se define como los valores inferiores o superiores de cierta categoría.
_ Xi: Limite inferior
_ Xs: Limite superior.
Limites reales de la clase
Li = Xi -0.5: Límite inferior real.
Ls = Xs + 0.5: Límite superior real.

Punto medio de cada clase:

Amplitud o Rango: R = Xmax- Xmin


Intervalo de Clase: Ni = 1 + 3.32l log(n); se trabaja con la aproximación al entero
Amplitud del Intervalo:

EJEMPLO:
Los siguientes datos representan las estaturas de los estudiantes de Análisis de Sistema
cursantes de la asignatura Elementos Estadísticos

1,56 1,7 1,83 1,8 1,75 1,77 1,73 1,7 1,6 1,9
1,63 1,8 1,6 1,62 1,68 1,6 1,83 1,64 1,72 1,7
1,6 1,77 1,75 1,57 1,7 1,61 1,8 1,75 1,55

Solución:
Definamos la variable
X: Estatura de los estudiantes de Análisis de Sistema
Variable Cuantitativa Continua
n=29 > 15 trabajamos con datos Agrupados
Busquemos los elementos
N° de clases: Ni=5,85516135 ≈ 6
Rango de los datos: R= 1,9 - 1,55=0,35
Amplitud de las clases:

Comencemos a formar la tabla de frecuencia


Primero al valor mínimo le sumamos i, y esta será la primera clase, luego
comenzamos con ese valor y volvemos a sumar i, así hasta encontrar las seis clases.
[Xi-Xs) fi Fi hi Hi hi*100 Hi*100 Xmi
[1,55-1,61) 7 7 0,24 0,24 24 24 1,58
[1,61-1,67) 4 11 0,14 0,38 14 38 1,64
[1,67-1,73) 6 17 0,21 0,59 21 59 1,7
[1,73-1,79) 6 23 0,21 0,79 21 79 1,76
[1,79-1,85) 5 28 0,17 0,97 17 97 1,82
[1,85-1,91) 1 29 0,03 1 3 100 1,88
∑ 29 1 100
Con la tabla anterior responda:
a. ¿Que cantidad de estudiante mide entre 1,61 y 1,66?
Como podemos ver en la segunda clase cae eso intervalo por lo tanto hay 4 estudiantes
b. ¿Qué proporción de estudiantes tienen miden entre mas de 1,79?
Como podemos apreciar los mayores de 1,79 es a partir de la quinta clase es decir que la
proporción es 0,17+0,03=0,21
c. ¿Qué porcentaje de estudiantes tiene estatura menor a 1,73?
Como podemos apreciar los menores de 1,73 utilizando el porcentaje de la acumulada
ya esta la suma por lo tanto hay 59%

Ejercicios:
1. Se realiza un estudio en una ciudad sobre la capacidad hotelera y se obtienen los
siguientes resultados:

PLAZAS Nº DE
HOTELES
0-10 25
10-30 50
30-60 55
60-100 20

Con la tabla responda:


a) ¿Cuál es la proporción de hoteles que disponen de entre 11 y 60 plazas?
b) ¿Cuántos hoteles tienen treinta o menos plazas?
c) Calcule las marcas de clase de cada intervalo.
d) ¿Cual es la proporción de hoteles esta entre 10 y 60?
e) ¿Cual de las marcas tiene más porcentaje?

2. Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha


observado el número de empleados que hay en cada una de ellas para un estudio
posterior. Las observaciones obtenidas han sido:
12, 10, 9, 11, 15, 16, 9, 10, 10, 11, 12, 13, 14, 15, 11, 11, 12,
16, 17, 17, 16, 16, 15, 14, 12, 11, 11, 11, 12, 12, 12, 15, 13, 14,
16, 15, 18, 19, 18, 10, 11, 12, 12, 11, 13, 13, 15, 13, 11, 12.

a) Calcule la distribución de frecuencias de la variable obteniendo las frecuencias


absolutas, relativas y sus correspondientes acumuladas.

b) ¿Qué proporción de sucursales tiene más de 15 empleados?

d) ahora realice la tabla de frecuencia Agrupando en intervalos de amplitud 3 los


valores de la variable, calcule su distribución de frecuencias
3. Se dispone del beneficio anual obtenido el pasado año por 38 empresas madrileñas:

Beneficio (miles €) Nº
empresas
230-280 5
280-330 7
330-580 14
580-630 9
630-780 3
Se pide:

a) Calcular el beneficio medio de estas 38 empresas madrileñas.

b) ¿Cuál es el beneficio mayor de la mitad de las empresas más modestas?

c) Determinar el beneficio más frecuente.

d) El 25% de las empresas mas rentables ¿qué nivel de beneficios tienen?

4. Las calificaciones finales obtenidas por los 80 alumnos de un primer curso de


Estadística figuran en la tabla adjunta:
68 84 75 82 68 90 62 88 76 93 73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72 66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71 79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74 86 67 73 81 72 63 76 75 85 77
Se pide:
• Preparar una tabla de frecuencias.
• El número de estudiantes con calificaciones de 75 ó más.
• El porcentaje de las calificaciones mayores a 75
• La proporción de los de 60 y 80 puntos

5. El primer día de clases del semestre pasado se les preguntó a 50 estudiantes, acerca del
tiempo (en minutos) que tardan para ir de su casa a la universidad y las repuesta fueron:

20 35 25 15 5 20 25 30 20 20 30 15 15 20 20 25 25 20 20 10
20 25 45 20 5 25 40 25 25 20 30 25 35 20 30 15 30 25 20 10
10 5 10 15 25 40 25 10 20 15

• Ordenar los datos en una tabla de frecuencias agrupándolos en clases de igual amplitud.
REPRESENTACIONES GRÁFICAS
Constituye uno de los métodos más utilizados y posiblemente el más útil de los principales
métodos de representaciones de datos estadísticos, ya que transmite en forma inmediata una
idea general sobre los principales aspectos de los datos, pero no proporcionan detalles. Un
gráfico debe ser sencillo y de fácil interpretación.

Gráfico de puntos: se construye trazando primero una escala horizontal que abarca el
intervalo de los datos. Los valores numéricos de las observaciones se localizan en la escala
horizontal colocando un punto sobre el valor apropiado. Si se repiten valores de los datos,
los puntos se colocan encimados, formando una pila en la posición numérica
correspondiente.

EJEMPLO: Los siguientes datos representan las calificaciones del Examen Final de Bases
de Datos I. Construya un diagrama de puntos.
88 77 49 38 100 95 60 75 100 80
63 69 50 90 82 65 75 100 95 50
80 70 60 100 75 80 100 90 85 75

___________________________________________________________________
38 49 50 60 63 65 69 70 75 77 80 82 85 88 90 95 100

Diagrama de tallo y Hojas: divide las observaciones de los datos en dígitos primarios y
dígitos derivados. Por ejemplo, si las observaciones del conjunto de datos tuvieran a lo
sumo dos dígitos, entonces la columna de las decenas seria el digito primario y la columna
restante sería el digito derivado.

Dígito Dígito
Primario Derivado

EJEMPLO: un fabricante de pilas para linterna tomó una muestra de 24 piezas de la


producción de un día y las utilizó en forma continua hasta que comenzaron a fallar. El
resultado en días de funcionamiento fue:
8 9 10 10 11 12 12 13 13 14 14 15
17 17 20 20 23 25 28 33 38 48 50 61
Ilustre la duración de las pilas de linterna en un diagrama de tallo y hojas

Como tenemos números de dos dígitos el primero se convertirán en talla y el segundo


digito en las hojas es decir el diagrama viene dado por:

0 8, 9
1 0, 0, 1, 2, 2, 3, 3, 4, 4, 5, 7, 7
2 0, 0, 3, 5, 8
3 3, 8
4 8
5 0
6 1
Diagrama de barra: indican la frecuencia (o frecuencia relativa) que corresponde a cada
categoría siendo la altura de la barra (eje de las ordenadas Y) proporcional ala frecuencia
(o frecuencia relativa) de la categoría el cual se encuentra en el eje X.
Es utilizada cuando trabajamos con datos cualitativos o cuantitativos Discreto.

EJEMPLOS:
1. En una empresa se desea conocer el color de ojos de sus empleados, se observa a los 50
empleados y se obtienen los siguientes resultados:
El diagrama de barras asociado es:

Color ojos Empleados


Negros 14
Marrones 24
Verdes 4
Azules 8

2. Clasificadas 12 familias por su número de hijos se obtuvo:


Número de hijos 1 2 3 4
Frecuencias f 1 3 5 3
Si definimos la variable X: número de hijos por familia
Es una variable cuantitativa discreta
Gráficamente,

Se hace una descripción de los gráficos.

Diagrama de Pareto: es una gráfica de barras de frecuencia en la que las barras, se


presentan en orden de altura, comenzando con la más alta a la izquierda. (Diagrama de
Pareto es llamado en honor del economista italiano Vilfredo Pareto).

EJEMPLO:

Un problema de interés para la División de Economia Comercial (DEC) del Departamento


de Trabajo de Estados Unidos. Cada año, la DEC monitorea la empresas que fracasan y
clasifica cada fracaso en una de las seis siguientes categorías: (1) falta de experiencia en la
línea de producción, (2) falta de experiencia gerencial, (3) experiencia desequilibrada, (4)
incompetencia, (5) otras causas (como negligencia, fraude y desastres naturales) y (6)
causas desconocidas. Estas informaciones se basan en las opiniones de acreedores
informados y los informes de la DEC. En fechas recientes, la DEC determinó la causa de
1463 fracasos de empresas constructoras. Los fracasos se muestran en la siguiente tabla.

Causas subyacentes Frecuencia Frecuencia


relativa
Incompetencia 698 0.477
Experiencia desequilibrada 314 0.215
Falta de experiencia gerencial 236 0.161
Falta de experiencia de línea 111 0.076
Causa desconocida 83 0.057
Otras causas 21 0.014
TOTALES 1463 1.000

El método gráfico más popular y tradicional para describir datos cuantitativos es el


histograma.
Histograma: Es un diagrama de barra el cual se describe datos cuantitativos para datos
grandes.
Señala la frecuencia correspondiente a cada intervalo de clase por medio de rectángulos
cuya altura es la frecuencia del intervalo (f) y la base (ancho) es el espacio representado
por la amplitud del intervalo.
Este gráfico se construye colocando en el eje X los límites reales y en el eje Y la
frecuencia.

EJEMPLO: Los siguientes datos representan el peso de 65 personas adultas que acuden a
un examen físico en Ascardio y está representado mediante una tabla. Realice un
histograma con los pesos de los adultos
Pesos fi Fi
[50, 60) 8 8
[60, 70) 10 18
[70, 80) 16 34
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
65
Polígono de frecuencia:
Para el caso Discreto es un gráfico en donde se localizan los puntos en un sistema de
coordenadas y luego se conectan los puntos sucesivos con trazos rectos.
Para el caso continuo, es la unión de las marcas de las clases, con la frecuencia.

EJEMPLO: La siguiente información corresponde a una muestra de triglicéridos en


personas adultas menores de 30 años. (caso Discreto)

Del ejemplo anterior de los pesos de los adultos tenemos


Pesos fi Xmi
[50, 60) 8 55
[60, 70) 10 65
[70, 80) 16 75
[80, 90) 14 85
[90, 100) 10 95
[100, 110) 5 105
[110, 120) 2 115
65

Otro método gráfico para describir datos cuantitativos es el diagrama de tallo y hojas que
se utiliza ampliamente en el análisis exploratorio de datos cuando el conjunto de datos es
pequeño.

En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y


sobresaliente) obtenidas por un grupo de 50 alumnos.

Diagrama de cajas: Básicamente se utiliza para determinar visualmente, si existen


patrones de simetría (o asimetría) de un conjunto de datos de tipo cuantitativo.
Se representan los 3 cuartiles y los valores mínimo y máximo de los datos, sobre un
rectángulo alineados horizontalmente o verticalmente.

Xmin Q1 Q2 Q3 Xmax
Diagrama circular o de pastel: divide un círculo completo (un pastel) en tajadas, cada una
de las categorías. El ángulo central de cada rebanada es proporcional a la frecuencia
relativa de esa categoría. Para ello a cada proporción se multiplica por 360 que son los
grados del círculo.

Ejemplo: Se pidió a cada miembro de una muestra de 20 personas, dueños de


motocicletas, que dieran el nombre del fabricante de su máquina. Los datos son los
siguientes: Honda, Otra, Harley-Davidson, Yamaha, Yamaha, Harley-Davidson, Yamaha,
Yamaha, Harley-Davidson, Suzuki, Suzuki, Suzuki, Suzuki, Yamaha, Suzuki, Yamaha,
Yamaha, Kawasaki, Suzuki, Kawasaki. La tabla de distribución de frecuencias se presenta
a continuación.

Tipo de Número de
h h*360
Motocicleta personas
Harley-
3 0,15 54
Davinson
Honda 1 0,05 18
Kawasaki 2 0,1 36
Otra 1 0,05 18
Suzuki 6 0,3 108
Yamaha 7 0,35 126
Total 20 1 360

Se hace una interpretación de la gráfica.

A los ejercicios de Distribución de frecuencia realizar su respectivo diagrama

También podría gustarte