Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicios Resueltos
Ejercicios Resueltos
Distribución normal.
Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma
de decisiones en áreas de negocios o instituciones gubernamentales.
ORDENANDO LA INFORMACION
Di s t r i bu c i ón de
f r ecu en c i a s
Tipos de frecuencias
Frecuencia absoluta
Frecuencia acumulada
considerado.
Ejemplo
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31,
31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la primera columna de la tabla colocamos la variable ordenada de menor
a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia
absoluta.
xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032
28 II 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.0516
31 8 24 0.258 0.774
34 I 1 31 0.032 1
31 1
discretas.
Di s t r i b u c i ó n d e f r ec u en c i a s a gr u pa da s
frecuencia correspondiente .
Límites de la clase
Amplitud de la clase
Marca de clase
algunos parámetros.
C o n s t r u c c i ó n d e u n a t a bl a de da t o s a gr u pa do s
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7,
34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,
queramos establecer.
5 = 10 intervalos.
ci fi Fi ni Ni
40 1
DEFINICIÓN
Las tablas de frecuencias sirven para ordenar y organizar los datos
estadísticos. Con ellas, una masa amorfa de datos pasa a ser una
colección ordenada y perfectamente inteligible.
- FRECUENCIAS (ABSOLUTAS)
Con los datos se construye la tabla de frecuencias:
En la primera columna, la variable xi, con todos sus posibles
valores. Si la variable es continua tomaremos como xi, la marca
de clase, es decir, el punto medio de cada intervalo.
En la segunda columna, la correspondiente frecuencia, fi: número
de veces que aparece cada valor.
FRECUENCIAS RELATIVAS
Cuando se desea comparar varias distribuciones similares con distinto
número de elementos, se debe recurrir a las frecuencias relativas. Estas
vienen dadas en : "tanto por uno" (fr) o en "tantos por ciento" (%).
Si N es el número de individuos:
fr =
% = 100.fr =
Ejemplo:
Actividades:
1.- Traslada la tabla de frecuencias del caso discreto a tu cuaderno,
observando como han sido calculadas cada una de las frecuencias.
Para ello:
Es una técnica estadística para representar un conjunto de datos. Cada valor numérico se
divide en dos partes. El o los dígitos principales forman el tallo y los dígitos secundarios
las hojas. Los tallos están colocados a lo largo del eje vertical, y las hojas de cada
observación a lo largo del eje horizontal.
Ejemplo
90 a 100 7
100 a 110 6
110 a 120 9
120 a 130 8
130 a 140 7
140 a 150 3
150 a 160 3
sumatoria de la frecuencia= 45
Una técnica que se usa para presentar información cuantitativa en forma condensada es
el diagrama de tallo y hoja. En el ejemplo anterior no se da la identidad de los valores
de la clase de 90 a 100. Para ilustrar la construcción de un diagrama de tallo y hojas
usando el número de comerciales comprados, supongamos que las 7 observaciones en la
clase de 90 a 100 sean 96, 94, 93, 94, 95, 96, 97. EL valor de tallo es el digito o dígitos
principales, en este caso el 9. Las hojas son los dígitos secundarios. EL tallo se coloca a
la izquierda de una línea vertical y los valores de las hojas a la derecha.
Por ultimo, ordenamos los valores dentro de cada tallo de menor a mayor. El segundo
renglón del diagrama de tallo y hojas aparecería como sigue:
9|3445667
Análisis descriptivo.
Otros gráficos.
Los tipos de gráficos mostrados hasta aquí son los más sencillos que
podemos manejar, pero ofrecen grandes posibilidades para la
representación de datos y pueden ser utilizados en múltiples
situaciones, incluso para representar los resultados obtenidos por
métodos de análisis más complicados. Podemos utilizar, por ejemplo,
dos diagramas de líneas superpuestos para visualizar los resultados
de un análisis de la varianza con dos factores (Figura 11). Un
diagrama de dispersión es el método adecuado para valorar el
resultado de un modelo de regresión logística (Figura 12). Existen
incluso algunos análisis concretos que están basados completamente
en la representación gráfica. En particular, la elaboración de curvas
ROC (Figura 13) y el cálculo del área bajo la curva constituyen el
método más apropiado para valorar la exactitud de una prueba
diagnóstica.
Edad Nº de pacientes
18 1
19 3
20 4
21 7
22 5
23 8
24 10
25 8
26 9
27 6
28 6
29 4
30 3
31 4
32 5
33 3
34 2
35 3
36 1
37 2
38 3
39 1
41 1
42 1
Figura 10. Diagrama de dispersión entre la talla y el peso de una muestra de individuos.
Figura 11. Dos diagramas de líneas superpuestos. Variación en el peso medio de una
muestra de recién nacidos según el control ginecológico del embarazo y el hábito de
fumar de la madre.
Figura 12. Diagrama de dispersión (regresión logística). Probabilidad de padecer cirrosis
hepática, según un modelo de regresión logística ajustando por el % de protrombina y el
presentar o no hepatomegalia.
Figura 13. Curva ROC para el porcentaje de protrombina en la predicción de cirrosis.
IMPACTO DE LA COMPUTADORA EN LA ENSEÑANZA DE LA
ESTADÍSTICA
Esta forma de presentación no hacía más que sustituir la antigua formulación del
problema por la que proporciona el output. El alumno adquiría destreza de donde
buscar los resultados que le interesan en ese universo de indicadores que figuran
en la salida.
En su momento, los profesores que aplicaban esta técnica creían que estaban
innovando en la forma de enseñar estadística. Y sí lo estaban haciendo porque
evitaban cálculos engorrosos (por ejemplo cuando se planteaba una regresión
múltiple o técnicas de clustering, entre otros). Pero fue un primer paso en un largo
camino. Ahora se está en condiciones de desarrollar un análisis en clase
conjuntamente con los alumnos, discutiendo los pasos a seguir, sin plantear uno
solo como el único o dar un conjunto de datos para que ellos desarrollen sus
propios trabajos.
Modelizar por computadora se critica porque se basa en "la fuerza bruta". Por
ejemplo, en el desarrollo de un estudio de la demanda de un producto, se puede
generar una gran cantidad de modelos ( utilizando todas las variables disponibles
en una tabla de datos ) para luego elegir el "mejor". Esto puede llevar a generar
modelos erróneos conceptualmente. Por esto mismo, los autores opinamos que no
es posible separar la estadística (y sus aplicaciones computacionales) del
conocimiento de la disciplina a la que se está aplicando. Las computadoras ayudan
a enriquecer el conocimiento de la disciplina, y no a llegar a "cosas sin explicación"
o evidentemente equivocadas.
Las áreas de análisis multivariado fueron las más beneficiadas por el uso de la
computadora. Las técnicas a utilizar no se ven limitadas a pesar de que el número
de variables sea considerable, ya que los problemas de cálculo se minimizan.
Tampoco los gráficos resultan un escollo. Algunos profesores, en ausencia de
impedimentos de cálculos, le piden al alumno que aplique tales o cuales métodos,
incentivando de esta forma la destreza en el uso del software (y el conocimiento de
muchas de sus variantes). Sin embargo, no hay una enseñanza orientada a la
resolución de problemas (porque no se ha planteado un problema) sino a la
aplicación de técnicas estadística sin un claro objetivo.
Cuando los cálculos llevaban mucho tiempo, se debía pensar si era necesario realizar
tal operación. Ahora que los cálculos no son obstáculo, muchas veces no se piensa
qué es lo que se está haciendo. El momento de reflexión se realiza después de la etapa
de cálculo y no antes. Ahora se dedica tiempo y esfuerzo en descartar análisis e
indicadores sin sentido.
Queremos dejar muy claro que en ningún momento se pretende adiestrar en el uso
de un software estadístico. Menos aún, en cuestiones informáticas. Queremos
enfatizar siempre que la computadora es un mero instrumento, comparable a una
calculadora..
Existe mucho software estadístico que sirve como apoyo del profesor para mostrar
en forma precisa y rápida las gráficas e indicadores estadísticos. Con estos
software los profesores pueden trabajar bien las gráficas y los indicadores, y
mostrar rápidamente lo que pasa al cambiar los datos. Generalmente resulta una
confusión si el profesor dispone de nada más que pizarrón y transparencias. Si la
computadora está presentando las gráficas, el profesor y los alumnos pueden
fijarse en el comportamiento de los mismos, en vez de calcular y graficar.
Las planillas electrónicas ( en sus utilización más sencilla ) han sido caracterizadas
como una combinación de un papel cuadriculado con una calculadora. Ellas nos
permiten enseñar los procedimientos de cálculo en forma rápida, pero destacando
una forma procedural ( vamos indicando el procedimiento de cómo hacerlo ). Por
ejemplo, ordenar los datos, ubicar el punto medio, determinar la mediana y copiar
un resultado en otra celda, entre otros. En cambio los paquetes estadísticos actúan
en forma no procedural, ( indicamos sólo lo qué queremos ).
1. La formulación de hipótesis
2. La recolección de datos
3. La comprobación de hipótesis
4. La comunicación de resultados e ideas
4. CONCLUSIONES
En realidad parece claro que ese futuro economista, ingeniero, sociólogo, médico
debe conocer conceptos estadísticos, precisamente aquellos que le posibiliten
abordar problemas de su trabajo. Es mucho más discutible que tenga que saber las
destrezas de cálculo asociadas a esos conceptos. Entre otras cosas, porque esas
destrezas ponen al descubierto su misma limitación.
Debemos ser conscientes, que podemos crear la figura del estudiante dependiente
de la computadora en la aplicación de métodos estadísticos. ¿Qué sucede cuando
un estudiante no tiene a mano la computadora para resolver problemas de otras
asignaturas que utilicen cuestiones estadísticas?. La respuesta que dan los
estudiantes es: "Que esas otras asignaturas cambien". Del mismo modo en que se
ha suscitado este problema, es posible que haya otros aspectos negativos
insospechados.
cuantitativas:
1 Comida Favorita.
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15,
polígono de frecuencias.
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3,
3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
diagrama de barras.
6. Las calificaciones de 50 alumnos en Matemáticas han sido
las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4,
0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5,
6, 7.
diagrama de barras .
fi 8 10 16 14 10 5 2
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7,
34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,
9. Sea una distribución estadística que viene dada por la siguiente tabla:
xi 61 64 67 70 73
fi 5 18 42 27 8
Calcular:
5, 4.
3, 5, 2, 6, 5, 9, 5, 2, 8, 6.
2, 3, 6, 8, 11.
fi
[38, 44) 7
[44, 50) 8
[50, 56) 15
[56, 62) 25
[62, 68) 18
[68, 74) 9
[74, 80) 6
acumuladas.
3, 5, 2, 7, 6, 4, 9.
3, 5, 2, 7, 6, 4, 9, 1.
Calcular:
fi 3 5 7 4 2
Hallar:
fi 3 5 7 8 2 6
Calcular:
La mediana y moda.
Cuartil 2º y 3º.
Media.