Documentos de Académico
Documentos de Profesional
Documentos de Cultura
R.M. 0039/2016
TÉCNICO SUPERIOR EN
PETROQUÍMICA
E-Mail: tecnologicosanalberto@gmail.com
GESTIÓN I-2022
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016
Índice
1. INTRODUCCION: ....................................................................................................................1
2. 2. FRECUENCIAS ....................................................................................................................1
2.1 Distribución de Frecuencias..........................................................................................1
2.2 Clasificación de datos. ..................................................................................................2
2.2.1 La frecuencia absoluta f (xi): ..................................................................................3
2.2.2 La frecuencia absoluta acumulada Fi: ...................................................................4
2.2.3 La frecuencia relativa hi:........................................................................................4
2.2.4 La frecuencia relativa acumulada Hi: ....................................................................4
3 PUNTUACIONES TRANSFORMADAS (distribución de frecuencias) ........................................9
3.1 Organización de datos agrupados ................................................................................9
3.1.1 Definiciones ...........................................................................................................9
3.2 Agrupamiento en intervalos de clase .........................................................................10
3.3 Cruces de variables .....................................................................................................16
4 Gráficos de una Distribución de Frecuencias.......................................................................18
4.1 Histograma: ................................................................................................................18
4.2 Polígono de Frecuencias: ............................................................................................18
4.3 Curvas de frecuencia: .................................................................................................18
4.4 Ojivas: .........................................................................................................................18
5. REFERENCIAS BIBLIOGRAFICAS: ..........................................................................................19
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016
1. INTRODUCCION:
Todo análisis estadístico se inicia con una primera fase descriptiva de los datos.
Ésta tiene por objeto sintetizar la información mediante la elaboración de tablas
de frecuencias, representaciones gráficas y el cálculo de medidas estadísticas
(o estadísticos). Estos procedimientos descriptivos dependen de la naturaleza
de la variable o atributo que se analiza y, en este sentido, el programa SPSS los
recoge en dos menús diferentes según se empleen, básicamente, para
sintetizar datos cualitativos o datos cuantitativos. Así mismo, el programa
diferencia entre los procedimientos descriptivos que hacen referencia al análisis
de una sola variable (análisis unidimensional) de los relativos a dos o más
variables conjuntamente (análisis bidimensional o multidimensional).
1. 2. FRECUENCIAS
2.1 Distribución de Frecuencias.
El manejo de la información requiere de la ordenación de datos de tal forma que
permita la obtención de una forma más fácil la obtención de conclusiones
acerca de la muestra. Una primera ordenación se realiza mediante el manejo de
tablas, en las que se ordenan los datos de acuerdo a ciertas características de
los datos. (Caballero , 1981)
En el caso de las variables continuas se debe de dividir los intervalos en los que
debe de distribuirse la información, en este caso existen varios criterio sobre los
que debemos de plantear la distribución. Uno de ellos, de los más comunes,
consiste en determinar la cantidad de parámetros.
Dentro de las frecuencias que aparecen en las tablas, las más comunes, son
frecuencia absoluta, la frecuencia absoluta acumulada y la frecuencia relativa.
𝑓𝑖 = ∑ 𝑛𝑖
𝑓𝑖
Frecuencia relativa acumulada = 𝐻𝑖 = ∑ ℎ𝑖 = ∑𝑛𝑖=1
𝑁
𝑛𝑖
𝑓𝑖 = ,
𝑁
Esta frecuencia relativa se puede expresar también en tantos por cientos del
tamaño de la muestra, para lo cual basta con multiplicar por 100
(%)𝑥𝑖 = 100𝑥𝑓𝑖.
Por ejemplo, si fi = 0.25, esto quiere decir que la variable xi se repite en el 25%
de la muestra.
𝑁𝑖 = 𝑁𝑖−1 + 𝑛𝑖 𝑦 𝑁1 = 𝑛1.
𝑁𝑘 = 𝑁.
𝑓𝑘 = 1
2113125123
4232142321
Ejemplo:
1,1,1,2,3,4,4,2,0,0,0,1,2,1,0,1,0,2,3,1,0,0,0,1,1,2,3,3,2,1,1,1,0,0,0,3,0,1,1,3
Con alguno de los extremos, para evitar así una ambigüedad en la clasificación
de este dato. Una forma de conseguir esto es asignar a los extremos de los
intervalos una cifra decimal más que las medidas de la muestra. Por ejemplo, si
la variable estadística toma valores enteros: 10, 11, 12,. . ., los intervalos se
podrían elegir: 9.5 − 11.5, 11.5 − 13.5,...
5. Calcular las marcas de clase de cada intervalo como el valor medio entre los
límites inferior y superior de cada intervalo de clase. Otra consideración a tomar
en cuenta a la hora de elegir los intervalos es intentar que las marcas de clase
coincidan con medidas de la muestra, disminuyéndose así la pérdida de
información debida al agrupamiento.
Una vez determinados los intervalos se debe hacer un recuento cuidadoso del
número de observaciones que caen dentro de cada intervalo, para construir así
la tabla de frecuencias.
En la tabla siguiente se listan los datos medidos por James Short en 1763 sobre
la paralaje del Sol en segundos de arco. La paralaje es el ángulo subtendido por
la Tierra vista desde el Sol. Se midió observando tránsitos de Venus desde
diferentes posiciones y permitió la primera medida de la distancia Tierra-Sol,
que es la unidad básica de la escala de distancias en el Sistema Solar (la
unidad astronómica).
En una pequeña empresa van a encargar una serie de batas de almacén para
sus empleados. Como les ofrecen las batas de varias medidas distintas en
cuanto al largo, y para que no haya mucha disparidad, deciden hacer un estudio
de las alturas de sus empleados. Obtienen las siguientes medidas en
centímetros:
183, 164, 159, 176, 173, 168, 155, 168, 162, 161, 172, 174, 178, 184, 160, 181,
165, 167, 163, 172, 178, 161, 158, 170, 179
No vamos a ser tan "crueles" de pedirte que hagas una tabla de frecuencias con
esos valores tal como están. Si pretendieras hacerla te encontrarías con que
hay muchos valores distintos, en concreto desde el menor valor (155) hasta el
mayor (184) hay 30 valores distintos, pero además muchos de ellos no
aparecen ninguna vez, por ejemplo el 156 o el 175. Por tanto, tendrías una tabla
muy grande con bastantes valores de frecuencia nula.
Cuando nos encontramos en un caso como este lo que se hace es agrupar los
datos en un intervalo semicerrado. De esa forma se cuentan las frecuencias
absolutas del intervalo. La forma de trabajar es la siguiente. Se cuentan cuántos
valores distintos hay entre el valor mayor y el menor (en nuestro caso ya hemos
visto que 30) y se dividen proporcionalmente en el número de intervalos que
queramos conseguir. Lo usual es que el número de intervalos no sea menor
que cinco ni mayor que diez
Lo primero es calcular la frecuencia absoluta. Para ello sólo hay que tener en
cuenta un detalle importante. Los intervalos son cerrados por la izquierda y
abiertos por la derecha, quiere decir que si tienes un valor que corresponde con
donde termina un intervalo y empieza el siguiente, ese valor debes contarlo en
el segundo intervalo y no en el primero. Esta es una norma que se sigue
usualmente, lo que debe quedarte claro es que no puedes contarla en ambos
intervalos o estarías duplicando los valores y te saldrían más valores de los que
has recogido.
Ejemplo:
Número de clases
= 6,64 → 7
Rango
𝑅 = 𝑥𝑛 − 𝑥1 = 72 − 53 = 19
Amplitud de clase
𝑅 19
𝐼= = = 2,71 ≈ 3
𝐾 7
Con respeto a la forma, prima la parte estética, es decir, la tabla debe ser de
fácil lectura. Sin embargo, los porcentajes si se calculan en el sentido de la
variable independiente, lo anterior, con el fin de poder identificar relación entre
Se obtiene una tabla 2×2 donde queda claro cuántos varones son o no obesos
y cuantas mujeres son o no obesas, según un sentido de lectura de la tabla.
Disponemos de cifras totales por columnas, por filas y el total global. Además,
puedo pedir al programa que muestre el gráfico asociado picando en la casilla
“mostrar gráficos de barras agrupadas”, con el siguiente resultado:
4.1 Histograma:
Está formado por rectángulos cuya base es la amplitud del intervalo y tiene la
característica que la superficie que corresponde a las barras es representativa
de la cantidad de casos o frecuencia de cada tramo de valores, puede
construirse con clases que tienen el mismo tamaño o diferente (intervalo
variable). La utilización de los intervalos de amplitud variable se recomienda
cuando en alguno de los intervalos, de amplitud constante, se presente la
frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea mucho
mayor que la de los demás, logrando así que las observaciones se hallen mejor
repartidas dentro del intervalo.
4.4 Ojivas:
Cuando se trata de relacionar observaciones en un mismo aspecto para dos
colectivos diferentes no es posible ejecutar comparaciones sobre la base de la
frecuencia, es necesario tener una base estándar, la frecuencia relativa. La
5. REFERENCIAS BIBLIOGRAFICAS:
• Caballero , Wilfredo. 1981. Introduccion a la estadistica . Costa Rica :
San Jose , 1981.