Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 Actividad 01
Asignatura: Estadística I.
Tema I: Estadística descriptiva.
Sumario: Introducción a la asignatura. Introducción a la estadística descriptiva. Tipos de datos u
observaciones. Distribución de frecuencias para datos discretos y continuos. Representación
gráfica.
Introducción:
Con esta asignatura comienza el estudio de la disciplina “Matemática aplicada a la toma de
decisiones” que la componen las asignaturas: Estadística Matemática I, Estadística Matemática II,
Investigación de Operaciones I, Investigación de Operaciones II y Simulación.
La toma de decisiones frecuentemente está asociada a situaciones y procesos de naturaleza
estocástica, a la selección de alternativas en condiciones de incertidumbre o a la búsqueda de
soluciones óptimas. La carrera tiene entre sus objetivos, elaborar sistemas informáticos para la
toma de decisiones y sistemas para soportar decisiones (DSS) en organizaciones productivas y
de servicio. Esta disciplina tiene como objeto, el estudio de modelos y métodos matemáticos que
permitan representar y resolver problemas relacionados con la toma de decisiones y el estudio de
procedimientos que permitan extraer conclusiones a partir de datos disponibles.
Esta disciplina, por una parte, ha estado muy ligada al desarrollo de las computadoras digitales,
pues para poder aplicar los métodos, generalmente iterativos, que caracterizan a la misma, es
necesario el uso de dicho equipamiento; y por otra , existe una relación estrecha entre las
asignaturas de la disciplina, con otras asignaturas del perfil informático. Entre los objetivos de la
disciplina se encuentran:
Aplicar los fundamentos conceptuales y metodológicos de la Teoría de las Probabilidades,
los Procesos Estocásticos, la Estadística, la Investigación de Operaciones y la Simulación.
Extraer conclusiones que permitan tomar decisiones acerca de determinado proceso o
situación, a partir del análisis y la síntesis de datos disponibles.
Construir modelos matemáticos para representar problemas de toma de decisión.
Aplicar los métodos matemáticos más importantes para resolver problemas lineales de
optimización, no lineales, decisiones secuenciales y de Simulación así como interpretar
sus resultados.
Manejar eficientemente el software disponible para su aplicación a problemas prácticos de
la economía o los servicios.
Elaborar (parcial o totalmente) software de Estadística e Investigación de Operaciones.
Dominar técnicas que permitan extraer conclusiones para apoyar la toma de decisiones a
partir del análisis y síntesis de la información disponible.
Sistema de evaluación:
Evaluaciones frecuentes (preguntas escritas)
2 Pruebas parciales
La asignatura tiene examen final, el cual será teórico-práctico.
Bibliografía Básica:
Probabilidades y estadística para ingenieros, I. Miller.
Selección de tablas estadísticas.
Bibliografía complementaria
Probabilidades, Hernández, L. M y otros, Editorial Pueblo y Educación, 1980, 378 pags.
Estadística Matemática – I (primera parte), Francis, R y otros.
Estadística Matemática - I (segunda parte), Francis, R y otros.
Problemas resueltos y Propuestos de Estadística Matemática – I, Guyón, L,.
Tablas y Resúmenes de Estadística, Rodríguez, A y Hernández, L.M.
Estadística, Caridad Guerra.
Estadística Básica: Teoría y ejercicios, Bouza, Sistachs.
Estadística I, II. Cué y otros.
Materiales auxiliares de los profesores.
Desarrollo:
Para un estudiante que por primera vez se enfrenta a esta asignatura, asociará su nombre a
funciones que realizan determinadas personas en los centros de trabajo, pero esto es solo uno de
las funciones de la estadística.
La Estadística es una herramienta muy útil con la que cuenta el hombre en su empeño de conocer
y dominar las leyes que rigen la naturaleza y la sociedad. En la actualidad no hay área del saber
humano que pueda prescindir de la Estadística para la realización de los estudios e
investigaciones. Los investigadores pueden hallar en la Estadística los procedimientos adecuados
para la planeación de la obtención de la información, el análisis de ésta y la presentación e
interpretación de los resultados obtenidos, de los cuales podemos tomar decisiones oportunas.
La Estadística es la disciplina científica que tiene como objeto de estudio la recogida, clasificación,
análisis e interpretación de la información.
La Estadística se define como: Principios y métodos que se han desarrollado para analizar datos
numéricos a través de las probabilidades.
La estadística (con minúscula) se utiliza para denominar cualquier colección sistemática de datos,
por ejemplo: - cifra de producción de una empresa. - Pasajeros transportados durante un período. -
Enfermos recuperados con ciertos medicamentos
Las estadísticas son tan antiguas como las Sociedades humanas, pero la Estadística, como
ciencia comienza a surgir en el siglo XVI paralelo al desarrollo de las probabilidades. Sus métodos
se clasifican en:
- Métodos Descriptivos.
- Inferencia estadística.
Ejemplos:
Sexo, estado de salud de un paciente, temperatura, talla, tiempo de dedicación a la actualización
del acontecer internacional y nacional, etc.
Existen cuatro tipos de variables o cuatro tipos de datos (numéricos) atendiendo a la escala de
medición.
Categórica o Nominal
Ordinal
Tipos de variables
De intervalo
De razón
raza de un tipo de animal, el estado civil de las personas.
Las variables ordinales son aquellas que son del tipo nominal pero además establecen un orden
entre las diferentes características que son objeto de medición. Por ejemplo, el nivel escolar de las
personas, los diferentes estados de salud de un paciente.
Las variables de intervalo son aquellas cuyos valores expresan no tan sólo un orden, sino que
además se conoce la distancia entre dos valores cualesquiera. Para este tipo de variable se tiene
una unidad de medida común y constante que asigna un número real. Con este tipo de variable la
proporción de dos intervalos cualesquiera es independiente de la unidad de medida y del punto
cero. En realidad para las variables de este tipo la unidad de medida y el cero son arbitrarios. Un
ejemplo clásico de este tipo de variable es la medición de la temperatura. La temperatura puede
medirse en una escala de grados centígrados y en una escala Fahrenheit. Como se conoce
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 4
Por ejemplo, el congelamiento del agua ocurre a los cero grados centígrados en la escala de
centígrados y la ebullición a los 100 grados. En la escala Fahrenheit, el congelamiento ocurre a los
32 grados y la ebullición a los 212 grados. Por otro lado, la razón en la escala centígrados de las
temperaturas 30 – 10 respecto a 10 – 0 es 2. En el caso de la escala Fahrenheit estas
temperaturas son 86 – 50 a 50 – 32, lo cual produce nuevamente 2.
Las variables del tipo de razón son aquellas que además de ser del tipo de intervalo tienen un
punto cero real en su origen. Es decir, el cero representa la ausencia. Para este tipo de variable la
proporción de un valor a otro cualquiera es independiente de la unidad de medida. Un ejemplo es
cuando se mide el peso en una escala de onzas y en una escala de libras. Estas escalas tienen un
verdadero punto cero, lo cual indica la ausencia de peso. Además, si se mide el peso de dos
objetos en ambas escalas la razón o proporción de los dos objetos es la misma en ambas escalas.
Así, si el objeto 1 pesa 2 libras y el objeto 2 pesa 4 libras, en la escala de onzas da como resultado
32 y 64 onzas respectivamente. Evidentemente 2/4 = 32/64 = 0.5.
Otra posible clasificación de las variables puede realizarse atendiendo a la cantidad de valores
diferentes que pueden tomar.
VARIABLES DISCRETAS: Son valores, determinados, definidos y que generalmente representan
a observaciones susceptibles de conteo y son valores enteros.
Ejemplo:
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 5
Supongamos que tenemos las notas del examen final de la asignatura Estadística Matemática I de
50 estudiantes de las carreras de Ingeniería Informática y queremos organizar la información a
través de tablas de frecuencia. A continuación aparecen los datos:
4 3 2 3 2 5 4 3 3 4
2 4 5 3 3 2 4 4 4 3
3 2 3 3 4 3 4 5 4 4
3 3 2 5 3 4 3 3 4 2
5 3 4 4 5 2 3 4 3 4
2 8 0.16 8 0.16
3 19 0.38 27 0.54
4 17 0.34 44 0.88
5 6 0.12 50 1
50 1
Distribución porcentual
3.
4.
5.
6.
19
17
2 3 4 5
Diagrama de frecuencia
19
17
2 3 4 5
Gráficos de Pastel
NOTA
Excelente
Mal
6.00 8.00
Bien
17.00
Regular
19.00
71.5 80 70 81 91 99 85 92 99.5 91
71 82.2 101 95 75.5 120 115 93.5 92 94
96 86.5 100 89 95.2 102 90 98 100 102.5
87 88 93 89.5 83 103 94.1 90.7 96 105
96 98 108 99 100 109 99 100 99 110
La tabla de distribución de frecuencias se hará de forma similar al caso discreto pero con la
diferencia de que los datos se clasificarán en determinados intervalos.
El primer paso, antes de clasificar la información en intervalos será determinar los valores
extremos observados.
más sencilla, la cual consiste en considerar que los intervalos son abiertos por la izquierda y
cerrados por la derecha con excepción del primero que será un intervalo cerrado.
De forma general:
L: Longitud de la clase ó .
R: Recorrido.
K: Número de clases.
Se acostumbra a hallar el punto medio de cada clase, el cual recibe el nombre de marca de clase.
La marca de clase es la semisuma de los extremos de cada intervalo.
La tabla de frecuencia quedaría de esta forma:
Debe señalarse que no siempre resulta tan fácil subdividir el recorrido en los k intervalos
propuesto, por ejemplo, supóngase que las observaciones toman valores en el intervalo [51,84] y
que se desea trabajar con clases de tamaño 5. El recorrido es R= 84-51=33, luego ,
lo cual es imposible dado que K debe ser un número entero, dado que representa la cantidad de
clases. Para garantizar trabajar con K clases de tamaño 5 habrá por tanto que ampliar el recorrido.
La vía más aconsejable para ello será agregar 2 unidades al intervalo de forma tal que la amplitud
del mismo sea 35 que es divisible por 5, así se pudiera tener como nuevo intervalo [50,85] (fíjense
que es un intervalo ampliado que contiene el intervalo original). Luego 85-35=35, entonces Y los
intervalos , siendo los intervalos de clases los siguientes: [50,55], (55,60], (60,65],
(65,70], (70,75], (75,80], (80,85]. Las demás columnas de la tabla de frecuencia se realizan de la
misma forma.
A continuación presentamos los pasos que se deben seguir para construir los intervalos de clase
para variables continuas y otro ejemplo.
3.- Se divide el recorrido entre el número de intervalos obteniéndose el tamaño de los intervalos
(k número de clases de intervalos y h amplitud del intervalo), h se aproxima a un valor que
facilite el trabajo posterior.
Si se escoge el tamaño de los intervalos (h), se obtiene el número de intervalos mediante el
procedimiento (K se aproxima por exceso).
4.- Se definen los límites de cada intervalo. Para esto se resta del recorrido de la tabla el recorrido
de las observaciones. Esta diferencia resultante se divide en dos partes, una se le resta a y
otra se le suma a buscado siempre límites cómodos para trabajar con ellos. De esta forma
se obtendrá, respectivamente, el extremo inferior del primer intervalo y el extremo superior del
último intervalo. Sumándole al primer valor el tamaño del intervalo se obtiene el límite inferior del
siguiente intervalo y repitiendo esta operación se tienen los siguientes límites inferiores.
Los límites superiores se logran en forma similar, pero restando el tamaño del intervalo al valor del
extremo superior del último intervalo.
Ejemplo 2:
En la tabla siguiente están registrados los pesos en libras de 40 estudiantes: Construya un
histograma y un polígono de frecuencias con estos datos.
Solución:
El peso mayor es de 179 y el menor es de 119 libras se manera que el recorrido o rango de las
observaciones es:
En algunos libros de estadística los intervalos de clases se consideran cerrados a ambos lados
o viene dados de la siguiente forma (nos basaremos para ellos en el ejemplo anterior): 118-
127, 127-136, 136-145, 145-154, 154-163, 163-172, 172-181.Sin embargo, se puede dar el
caso en que alguna observación fuese igual a algún extremo del intervalo. No se sabría si
Conferencia 1 Actvidad 01 Tema 1: Estadística Descriptiva 10
Como hay una observación que coincide con uno de los extremos del intervalo de clase (145),
hay que tomar la decisión de añadir una cifra a los extremos calculados, obteniéndose así los
intervalos siguientes:
118,5-127,5
127,5-136,5
136,5-145,5
145,5-154,5
154,5-163,5
163,5-172,5
172,5-181,5
Con estos intervalos podemos construir la tabla de frecuencias de los pesos de los estudiantes
y con la tabla hallada, el histograma y el polígono de frecuencias.
Representación gráfica
Existen dos tipos de gráficos para representar la distribución de frecuencia de datos continuos: Los
histogramas de frecuencia y los polígonos de frecuencias.
Si se desea graficar las frecuencias acumuladas, se hará a través de un polígono de frecuencia
acumulada u Ojiva.
25
10
8
5
2
0.5
0.2
0.16
0.10
0.04
0.5
0.2
0.16
0.10
0.04
75 85 95 105 115
1
0.96
0.80
0.30
0.10
70 80 90 100 110 120
Conclusiones:
Hacer un resumen de los aspectos más importantes tratados.
Hacer preguntas de control.
Estudio Independiente:
Guía 1
Bibliografía
Probabilidades y Estadística para Ingenieros, I. Walpole.
Probabilidades y Estadística para Ingenieros, I. Miller.
Estadística I, Cué y otros.
Estadística, Caridad Guerra.