Está en la página 1de 13

ONC No.

1 Actividad 01
Asignatura: Estadística I.
Tema I: Estadística descriptiva.
Sumario: Introducción a la asignatura. Introducción a la estadística descriptiva. Tipos de datos u
observaciones. Distribución de frecuencias para datos discretos y continuos. Representación
gráfica.

Objetivos: Que los estudiantes sean capaces de:


o Clasificar los datos u observaciones en discretos y continuos, así como atendiendo a su
escala de medición (nominal, ordinal, de intervalo y de razón)
o Describir los pasos para construir distribuciones de frecuencia tanto para variables
discretas como continuas.
o Reconocer los diferentes gráficos asociados a las distribuciones de frecuencia.

Introducción:
Con esta asignatura comienza el estudio de la disciplina “Matemática aplicada a la toma de
decisiones” que la componen las asignaturas: Estadística Matemática I, Estadística Matemática II,
Investigación de Operaciones I, Investigación de Operaciones II y Simulación.
La toma de decisiones frecuentemente está asociada a situaciones y procesos de naturaleza
estocástica, a la selección de alternativas en condiciones de incertidumbre o a la búsqueda de
soluciones óptimas. La carrera tiene entre sus objetivos, elaborar sistemas informáticos para la
toma de decisiones y sistemas para soportar decisiones (DSS) en organizaciones productivas y
de servicio. Esta disciplina tiene como objeto, el estudio de modelos y métodos matemáticos que
permitan representar y resolver problemas relacionados con la toma de decisiones y el estudio de
procedimientos que permitan extraer conclusiones a partir de datos disponibles.
Esta disciplina, por una parte, ha estado muy ligada al desarrollo de las computadoras digitales,
pues para poder aplicar los métodos, generalmente iterativos, que caracterizan a la misma, es
necesario el uso de dicho equipamiento; y por otra , existe una relación estrecha entre las
asignaturas de la disciplina, con otras asignaturas del perfil informático. Entre los objetivos de la
disciplina se encuentran:
 Aplicar los fundamentos conceptuales y metodológicos de la Teoría de las Probabilidades,
los Procesos Estocásticos, la Estadística, la Investigación de Operaciones y la Simulación.
 Extraer conclusiones que permitan tomar decisiones acerca de determinado proceso o
situación, a partir del análisis y la síntesis de datos disponibles.
 Construir modelos matemáticos para representar problemas de toma de decisión.
 Aplicar los métodos matemáticos más importantes para resolver problemas lineales de
optimización, no lineales, decisiones secuenciales y de Simulación así como interpretar
sus resultados.
 Manejar eficientemente el software disponible para su aplicación a problemas prácticos de
la economía o los servicios.
 Elaborar (parcial o totalmente) software de Estadística e Investigación de Operaciones.
 Dominar técnicas que permitan extraer conclusiones para apoyar la toma de decisiones a
partir del análisis y síntesis de la información disponible.

Hacer una presentación de la asignatura.


La asignatura tiene 70 horas clases (20% 14 horas, 7 turnos), 12 conferencias, 15 clases prácticas,
6 laboratorios (Software SPSS, Minitab, Eviews, Mathematica) y 2 trabajos de control parcial
(escritos).

Vamos a tratar 4 temas:


Tema I: Estadística Descriptiva.
Tema II: Probabilidades.
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 2

Tema III: Muestreo y Estimación.


Tema IV: Pruebas de hipótesis.

Sistema de evaluación:
Evaluaciones frecuentes (preguntas escritas)
2 Pruebas parciales
La asignatura tiene examen final, el cual será teórico-práctico.

Bibliografía Básica:
Probabilidades y estadística para ingenieros, I. Miller.
Selección de tablas estadísticas.

Bibliografía complementaria
Probabilidades, Hernández, L. M y otros, Editorial Pueblo y Educación, 1980, 378 pags.
Estadística Matemática – I (primera parte), Francis, R y otros.
Estadística Matemática - I (segunda parte), Francis, R y otros.
Problemas resueltos y Propuestos de Estadística Matemática – I, Guyón, L,.
Tablas y Resúmenes de Estadística, Rodríguez, A y Hernández, L.M.
Estadística, Caridad Guerra.
Estadística Básica: Teoría y ejercicios, Bouza, Sistachs.
Estadística I, II. Cué y otros.
Materiales auxiliares de los profesores.

Desarrollo:
Para un estudiante que por primera vez se enfrenta a esta asignatura, asociará su nombre a
funciones que realizan determinadas personas en los centros de trabajo, pero esto es solo uno de
las funciones de la estadística.
La Estadística es una herramienta muy útil con la que cuenta el hombre en su empeño de conocer
y dominar las leyes que rigen la naturaleza y la sociedad. En la actualidad no hay área del saber
humano que pueda prescindir de la Estadística para la realización de los estudios e
investigaciones. Los investigadores pueden hallar en la Estadística los procedimientos adecuados
para la planeación de la obtención de la información, el análisis de ésta y la presentación e
interpretación de los resultados obtenidos, de los cuales podemos tomar decisiones oportunas.
La Estadística es la disciplina científica que tiene como objeto de estudio la recogida, clasificación,
análisis e interpretación de la información.
La Estadística se define como: Principios y métodos que se han desarrollado para analizar datos
numéricos a través de las probabilidades.

La estadística (con minúscula) se utiliza para denominar cualquier colección sistemática de datos,
por ejemplo: - cifra de producción de una empresa. - Pasajeros transportados durante un período. -
Enfermos recuperados con ciertos medicamentos

Las estadísticas son tan antiguas como las Sociedades humanas, pero la Estadística, como
ciencia comienza a surgir en el siglo XVI paralelo al desarrollo de las probabilidades. Sus métodos
se clasifican en:
- Métodos Descriptivos.
- Inferencia estadística.

Métodos Descriptivos: Describen el comportamiento de los datos estadísticos, se ocupan de: la


recolección, organización, tabulación, presentación y reducción de la información.
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 3

Inferencia: Estudia y concluye sobre un fenómeno basado en el análisis e investigación de una


parte del mismo. CONSTITUYE UNA PODEROSA HERRAMIENTA PARA LA INVESTIGACION
CIENTIFICA.

Primeramente veremos algunos conceptos básicos necesarios en la asignatura:

Población: El conjunto de fenómenos, observaciones o individuos que pueden ser objeto de


estudio.
Muestra: Es un subconjunto de la población, parte de la población que pudiese ser observada.
Característica: Es el signo o detalle que interesa observar en la población. Las características
puedes clasificarse en cualitativas (también llamados atributos y se refieren a cualidades, tales
como: color del pelo, de los ojos, estado civil, sexo, nivel de escolaridad, etc.) y en cuantitativas (se
refiere a cantidades tales como: estatura, peso ingreso, número de hijos, etc.)
En la Estadística es necesario de que la información susceptible a cualquier análisis estadístico se
exprese mediante valores numéricos. Estos valores a su vez constituyen la expresión de las
características que se consideran de interés observar en el estudio o investigación. Comúnmente
estas características se les conocen con el nombre de variables.

Variables: Cualquier fenómeno o concepto susceptible de ser expresado mediante valores


numéricos.

Ejemplos:
Sexo, estado de salud de un paciente, temperatura, talla, tiempo de dedicación a la actualización
del acontecer internacional y nacional, etc.
Existen cuatro tipos de variables o cuatro tipos de datos (numéricos) atendiendo a la escala de
medición.

La clasificación de variables atendiendo a la escala de medición es la siguiente:


Las variables categóricas son aquellas que mediante sus valores indican una cualidad. Por
ejemplo, el color de los ojos de las personas, la presencia o ausencia de una cualidad o atributo, la

Categórica o Nominal

Ordinal
Tipos de variables

De intervalo

De razón
raza de un tipo de animal, el estado civil de las personas.
Las variables ordinales son aquellas que son del tipo nominal pero además establecen un orden
entre las diferentes características que son objeto de medición. Por ejemplo, el nivel escolar de las
personas, los diferentes estados de salud de un paciente.
Las variables de intervalo son aquellas cuyos valores expresan no tan sólo un orden, sino que
además se conoce la distancia entre dos valores cualesquiera. Para este tipo de variable se tiene
una unidad de medida común y constante que asigna un número real. Con este tipo de variable la
proporción de dos intervalos cualesquiera es independiente de la unidad de medida y del punto
cero. En realidad para las variables de este tipo la unidad de medida y el cero son arbitrarios. Un
ejemplo clásico de este tipo de variable es la medición de la temperatura. La temperatura puede
medirse en una escala de grados centígrados y en una escala Fahrenheit. Como se conoce
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 4

Lo que permite la transformación de una escala en otra.

Por ejemplo, el congelamiento del agua ocurre a los cero grados centígrados en la escala de
centígrados y la ebullición a los 100 grados. En la escala Fahrenheit, el congelamiento ocurre a los
32 grados y la ebullición a los 212 grados. Por otro lado, la razón en la escala centígrados de las
temperaturas 30 – 10 respecto a 10 – 0 es 2. En el caso de la escala Fahrenheit estas
temperaturas son 86 – 50 a 50 – 32, lo cual produce nuevamente 2.
Las variables del tipo de razón son aquellas que además de ser del tipo de intervalo tienen un
punto cero real en su origen. Es decir, el cero representa la ausencia. Para este tipo de variable la
proporción de un valor a otro cualquiera es independiente de la unidad de medida. Un ejemplo es
cuando se mide el peso en una escala de onzas y en una escala de libras. Estas escalas tienen un
verdadero punto cero, lo cual indica la ausencia de peso. Además, si se mide el peso de dos
objetos en ambas escalas la razón o proporción de los dos objetos es la misma en ambas escalas.
Así, si el objeto 1 pesa 2 libras y el objeto 2 pesa 4 libras, en la escala de onzas da como resultado
32 y 64 onzas respectivamente. Evidentemente 2/4 = 32/64 = 0.5.
Otra posible clasificación de las variables puede realizarse atendiendo a la cantidad de valores
diferentes que pueden tomar.
VARIABLES DISCRETAS: Son valores, determinados, definidos y que generalmente representan
a observaciones susceptibles de conteo y son valores enteros.

VARIABLES CONTINUAS: Las que generalmente representan a observaciones susceptibles de


medición y por tanto pueden tomar cualquier valor en un cierto intervalo de los números reales.
Ejemplos de tipo continuo: El peso de una persona, la estatura de un niño de 10 años, el tiempo
que dedica un joven a informarse del acontecer nacional e internacional, etc.
Ejemplos de tipo discreto: Cantidad de personas de un núcleo familiar, notas de la Universidad,
número de hijos de un matrimonio, el número de personas que son afectados por una enfermedad,
etc.
A continuación se discutirán los procedimientos a los que se someten los datos estadísticos para
poder hacer una descripción de su comportamiento.
Un método para organizar y clasificar los datos estadísticos consiste en la formación de una
“distribución de frecuencia”, la construcción de la cual varía en dependencia de que la variable sea
discreta o continua.

Distribución de frecuencia para variables discretas.


Las tablas de frecuencia o distribución empírica de frecuencia contienen varias columnas con el
objetivo de mejorar la descripción de los datos.
1. Columna: Aparecen los diferentes valores que toma la variable observada (Valores
diferente).
2. Columna: Cantidad de veces que aparece repetido cada valor (Frecuencia absoluta).
3. Columna: Resultado de dividir cada frecuencia absoluta por n. (Frecuencia relativa).
4. Columna: Representa las frecuencia absolutas acumuladas, las cuales se obtienen
acumulando la 2. columna.
5. Columna: Representa las frecuencias relativas acumuladas, las cuales se obtienen
acumulando la 3. columna.

Ejemplo:
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 5

Supongamos que tenemos las notas del examen final de la asignatura Estadística Matemática I de
50 estudiantes de las carreras de Ingeniería Informática y queremos organizar la información a
través de tablas de frecuencia. A continuación aparecen los datos:

4 3 2 3 2 5 4 3 3 4
2 4 5 3 3 2 4 4 4 3
3 2 3 3 4 3 4 5 4 4
3 3 2 5 3 4 3 3 4 2
5 3 4 4 5 2 3 4 3 4

Valores Frecuencia Frecuencia Frecuencia Frecuencia


distintos absoluta relativa absoluta relativa
acumulada acumulada

2 8 0.16 8 0.16
3 19 0.38 27 0.54
4 17 0.34 44 0.88
5 6 0.12 50 1
50 1
Distribución porcentual

Propiedades de las frecuencias


1.
2.

3.

4.

5.
6.

Representación gráfica de la distribución de frecuencia para variables discretas.


Persigue el objetivo fundamental de dar una información de forma rápida, compacta y asequible,
siendo útil para resaltar los aspectos más destacados del fenómeno. Es un complemento de las
tablas de frecuencia.

Histogramas o Diagramas de frecuencias:


Se confeccionan mediante la representación de los valores observados de la variable en una
escala sobre el eje horizontal y las frecuencias de cada valor sobre el eje vertical. Los histogramas
pueden construirse utilizando frecuencias absolutas o relativas. También se les llama diagrama de
frecuencia absoluta y diagrama de frecuencia relativa.

Histograma de frecuencia (gráfico de barras)


Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 6

19
17

2 3 4 5

Diagrama de frecuencia

19
17

2 3 4 5

Gráficos de Pastel

Número de grados en el pastel:


Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 7

NOTA

Excelente
Mal
6.00 8.00

Bien
17.00
Regular

19.00

Otros tipos de gráficos:


Grafico de Pareto.
Diagrama de hojas y tallos.
Pictogramas.

Distribución de frecuencias para variables continuas


Consideremos el siguiente ejemplo donde se tiene el peso en libra de 50 alumnos de un aula de
secundaria, siendo los valores los siguientes:

71.5 80 70 81 91 99 85 92 99.5 91
71 82.2 101 95 75.5 120 115 93.5 92 94
96 86.5 100 89 95.2 102 90 98 100 102.5
87 88 93 89.5 83 103 94.1 90.7 96 105
96 98 108 99 100 109 99 100 99 110

La tabla de distribución de frecuencias se hará de forma similar al caso discreto pero con la
diferencia de que los datos se clasificarán en determinados intervalos.
El primer paso, antes de clasificar la información en intervalos será determinar los valores
extremos observados.

Las mediciones se encontrarán en el intervalo [70,120]. Se divide el intervalo en k subintervalos


denominados intervalos de clases o clases. Estos k intervalos pueden ser de diferentes tamaños,
pero se recomienda trabajar, siempre que sea posible, con intervalos de igual tamaño, lo cual
resulta más cómodo. El factor fundamental a tener en cuenta en la definición de los intervalos es
que cada uno de éstos se refleje una categoría del fenómeno de estudio.
En términos generales se puede plantear que el número de clases(al igual que la amplitud) se
prefija de acuerdo con nuestras conveniencias (investigador) y debe estar entre 5 y 15, ya que si
es muy pequeño se pierde información y si son muchas no se logra el propósito de resumir la
información.
En nuestro ejemplo trabajaremos con k=5. Como el recorrido de los datos es R=120-70=50 y
50:5=10. Cada una de las 5 clases será de tamaño 10, luego el intervalo [70,120] se particionará
en 5 subintervalos de la forma:
[70,80], (80,90], (90,100], (100,110], (110,120].
Está Claro que 90 pertenecerá a la 2. Clase. La delimitación de las fronteras de cada clase es muy
polémica, ya que existen varios criterios para seleccionarlas. Durante el curso se utilizará la forma
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 8

más sencilla, la cual consiste en considerar que los intervalos son abiertos por la izquierda y
cerrados por la derecha con excepción del primero que será un intervalo cerrado.
De forma general:
L: Longitud de la clase ó .
R: Recorrido.
K: Número de clases.
Se acostumbra a hallar el punto medio de cada clase, el cual recibe el nombre de marca de clase.
La marca de clase es la semisuma de los extremos de cada intervalo.
La tabla de frecuencia quedaría de esta forma:

Clases Marca de Frecuencia Frecuencia Frecuencia Frecuencia


clase absoluta relativa absoluta relativa
acumulada acumulada

[70,80] 75 5 0.10 5 0.10


(80,90] 85 10 0.20 15 0.30
(90,100] 95 25 0.50 40 0.80
(100,110] 105 8 0.16 48 0.96
(110,120] 115 2 0.04 50 1
50 1

Debe señalarse que no siempre resulta tan fácil subdividir el recorrido en los k intervalos
propuesto, por ejemplo, supóngase que las observaciones toman valores en el intervalo [51,84] y
que se desea trabajar con clases de tamaño 5. El recorrido es R= 84-51=33, luego ,
lo cual es imposible dado que K debe ser un número entero, dado que representa la cantidad de
clases. Para garantizar trabajar con K clases de tamaño 5 habrá por tanto que ampliar el recorrido.
La vía más aconsejable para ello será agregar 2 unidades al intervalo de forma tal que la amplitud
del mismo sea 35 que es divisible por 5, así se pudiera tener como nuevo intervalo [50,85] (fíjense
que es un intervalo ampliado que contiene el intervalo original). Luego 85-35=35, entonces Y los
intervalos , siendo los intervalos de clases los siguientes: [50,55], (55,60], (60,65],
(65,70], (70,75], (75,80], (80,85]. Las demás columnas de la tabla de frecuencia se realizan de la
misma forma.
A continuación presentamos los pasos que se deben seguir para construir los intervalos de clase
para variables continuas y otro ejemplo.

Método para la construcción de intervalos de clases:


1.- Para construir una tabla de frecuencias ante todo se tiene que decidir, en cuantos intervalos de
clases serán agrupados los datos y el tamaño de estos intervalos.
El tamaño y cantidad de los intervalos de clase dependerá de los fines y posibilidades del análisis
a realizar. Aunque el número de intervalos variará de un caso a otro, se puede establecer como
criterio práctico que debe ser entre 5 y 15 (5 y 20) intervalos de clase.

2.- Determinar el recorrido de las observaciones, o sea,


(R recorrido de las observaciones).
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 9

3.- Se divide el recorrido entre el número de intervalos obteniéndose el tamaño de los intervalos
(k número de clases de intervalos y h amplitud del intervalo), h se aproxima a un valor que
facilite el trabajo posterior.
Si se escoge el tamaño de los intervalos (h), se obtiene el número de intervalos mediante el
procedimiento (K se aproxima por exceso).

4.- Se definen los límites de cada intervalo. Para esto se resta del recorrido de la tabla el recorrido
de las observaciones. Esta diferencia resultante se divide en dos partes, una se le resta a y
otra se le suma a buscado siempre límites cómodos para trabajar con ellos. De esta forma
se obtendrá, respectivamente, el extremo inferior del primer intervalo y el extremo superior del
último intervalo. Sumándole al primer valor el tamaño del intervalo se obtiene el límite inferior del
siguiente intervalo y repitiendo esta operación se tienen los siguientes límites inferiores.
Los límites superiores se logran en forma similar, pero restando el tamaño del intervalo al valor del
extremo superior del último intervalo.

Un ejemplo donde se manifiesta el método antes empleado es el siguiente:

Ejemplo 2:
En la tabla siguiente están registrados los pesos en libras de 40 estudiantes: Construya un
histograma y un polígono de frecuencias con estos datos.

138 164 150 132 144 125 149 157


146 158 140 147 136 148 152 144
168 126 138 179 163 119 154 165
146 173 142 147 135 153 140 135
161 145 135 142 150 156 145 128

Solución:
El peso mayor es de 179 y el menor es de 119 libras se manera que el recorrido o rango de las
observaciones es:

si consideramos construir 7 clases de intervalos el número de intervalos de clase


se aproxima por exceso.
Se decide construir 7 intervalos de clase de tamaño o longitud igual a 9 libras.
El rango de la tabla de frecuencias es de , que da una diferencia entre el rango de las
observaciones y el rango de la tabla igual a .
Se puede ahora determinar, los límites de los intervalos de clase:
Se resta 1 : 119-1=118
Se suma 2 a : 179+2=181

De esta forma quedan los intervalos de clases siguientes:


[118,127], (127,136], (136,145], (145,154], (154,163], (163,172], (172,181].

En algunos libros de estadística los intervalos de clases se consideran cerrados a ambos lados
o viene dados de la siguiente forma (nos basaremos para ellos en el ejemplo anterior): 118-
127, 127-136, 136-145, 145-154, 154-163, 163-172, 172-181.Sin embargo, se puede dar el
caso en que alguna observación fuese igual a algún extremo del intervalo. No se sabría si
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 10

considerarla en el intervalo anterior o posterior. Sobre el tratamiento a seguir en esos casos


existen varios que son válidos siempre y cuando se garantice que:
1) No haya indecisión acerca de a cuál intervalo corresponde un valor.
2) Haya continuidad entre los intervalos.
En algunos casos se adopta el criterio de añadir un decimal a los extremos de cada intervalo.

Como hay una observación que coincide con uno de los extremos del intervalo de clase (145),
hay que tomar la decisión de añadir una cifra a los extremos calculados, obteniéndose así los
intervalos siguientes:
118,5-127,5
127,5-136,5
136,5-145,5
145,5-154,5
154,5-163,5
163,5-172,5
172,5-181,5
Con estos intervalos podemos construir la tabla de frecuencias de los pesos de los estudiantes
y con la tabla hallada, el histograma y el polígono de frecuencias.

Intervalo de Marca de Frecuencia Frecuencia Frecuencia Frecuencia


clase clase: absoluta: relativa: Absoluta relativa
acumulada acumulada:

118,5-127,5 123 3 0.075 3 0.075


127,5-136,5 132 6 0.15 9 0.225
136,5-145,5 141 10 0.25 19 0.475
145,5-154,5 150 11 0.275 30 0.750
154,5-163,5 159 5 0.125 35 0.875
163,5-172,5 168 3 0.075 38 0.950
172,5-181,5 177 2 0.05 40 1.000

Representación gráfica
Existen dos tipos de gráficos para representar la distribución de frecuencia de datos continuos: Los
histogramas de frecuencia y los polígonos de frecuencias.
Si se desea graficar las frecuencias acumuladas, se hará a través de un polígono de frecuencia
acumulada u Ojiva.

Histograma de frecuencia absoluta.


Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 11

25

10
8

5
2

70 80 90 100 110 120

Histograma de frecuencia relativa

0.5

0.2
0.16
0.10

0.04

70 80 90 100 110 120

Polígono de frecuencia relativa


Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 12

0.5

0.2
0.16
0.10

0.04

75 85 95 105 115

Histograma y polígono de frecuencia del ejemplo 2

Polígono de frecuencia acumulada (Ojiva)


Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 13

1
0.96

0.80

0.30

0.10
70 80 90 100 110 120

Conclusiones:
Hacer un resumen de los aspectos más importantes tratados.
Hacer preguntas de control.

Estudio Independiente:
Guía 1

Bibliografía
Probabilidades y Estadística para Ingenieros, I. Walpole.
Probabilidades y Estadística para Ingenieros, I. Miller.
Estadística I, Cué y otros.
Estadística, Caridad Guerra.

También podría gustarte