Está en la página 1de 21

INSTITUTO TECNOLÓGICO SAN ALBERTO

R.M. 0039/2016

TÉCNICO SUPERIOR EN
PETROQUÍMICA

MATERIA: Estadística y Probabilidad Aplicada


SIGLA: EPA-200
TEMA N° 2: Descripción de la Información Muestral
ELABORADO POR: Ing. Wilson Villanueva Rejas

Página Plataforma Virtual: http://moodle.itsacarapari.com/my/

E-Mail: tecnologicosanalberto@gmail.com

GESTIÓN I-2022
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

Índice
1. INTRODUCCION: ....................................................................................................................1
2. 2. FRECUENCIAS ....................................................................................................................1
2.1 Distribución de Frecuencias..........................................................................................1
2.2 Clasificación de datos. ..................................................................................................2
2.2.1 La frecuencia absoluta f (xi): ..................................................................................3
2.2.2 La frecuencia absoluta acumulada Fi: ...................................................................4
2.2.3 La frecuencia relativa hi:........................................................................................4
2.2.4 La frecuencia relativa acumulada Hi: ....................................................................4
3 PUNTUACIONES TRANSFORMADAS (distribución de frecuencias) ........................................9
3.1 Organización de datos agrupados ................................................................................9
3.1.1 Definiciones ...........................................................................................................9
3.2 Agrupamiento en intervalos de clase .........................................................................10
3.3 Cruces de variables .....................................................................................................16
4 Gráficos de una Distribución de Frecuencias.......................................................................18
4.1 Histograma: ................................................................................................................18
4.2 Polígono de Frecuencias: ............................................................................................18
4.3 Curvas de frecuencia: .................................................................................................18
4.4 Ojivas: .........................................................................................................................18
5. REFERENCIAS BIBLIOGRAFICAS: ..........................................................................................19
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

1. INTRODUCCION:
Todo análisis estadístico se inicia con una primera fase descriptiva de los datos.
Ésta tiene por objeto sintetizar la información mediante la elaboración de tablas
de frecuencias, representaciones gráficas y el cálculo de medidas estadísticas
(o estadísticos). Estos procedimientos descriptivos dependen de la naturaleza
de la variable o atributo que se analiza y, en este sentido, el programa SPSS los
recoge en dos menús diferentes según se empleen, básicamente, para
sintetizar datos cualitativos o datos cuantitativos. Así mismo, el programa
diferencia entre los procedimientos descriptivos que hacen referencia al análisis
de una sola variable (análisis unidimensional) de los relativos a dos o más
variables conjuntamente (análisis bidimensional o multidimensional).

1. 2. FRECUENCIAS
2.1 Distribución de Frecuencias.
El manejo de la información requiere de la ordenación de datos de tal forma que
permita la obtención de una forma más fácil la obtención de conclusiones
acerca de la muestra. Una primera ordenación se realiza mediante el manejo de
tablas, en las que se ordenan los datos de acuerdo a ciertas características de
los datos. (Caballero , 1981)

El manejo de datos discretos permite la manipulación de tablas, sobre todo


cuando el número de datos no es muy reducido. A continuación describiremos
la manipulación de datos mediante el manejo de datos discretos y continuos.

Las variables a ser manejadas en el estudio, en el caso de valores discretos, se


puede representar mediante una tabla en la que se representa los variables
mediante variables con nombre como (xi) y el número de veces en que un dato
se representara mediante frecuencias, frecuencias absolutas, frecuencias
relativas. (Carrasquilla )

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 1
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

La representación de esta tabla mediante frecuencias se le conoce como tabla


estadística cuya función es la determinar la frecuencia de cada clase las cuales
aparecen a un lado de cada clase. (Carasquilla )

La representación generalmente se da como sigue:

Frecuencias simples y relativas

Variable Frecuencia f(xi) Frecuencia relativa


(Xi)
(el número veces ni que se f(xi)/N= ni/N
repite Xi )

X1 f(X1 )= n1 f(X1 )/N= n1/N

X2 f(X2 )= n2 f(X2 )/N= n2/N

X3 f(X3 )= n3 f(X3 )/N= n3/N

Xn-1 f(Xn-1 ) = nn-1 f(Xn-1 )/N= nn-1/N

Xn f(Xn)= nn f(Xn)/N= nn/N

2.2 Clasificación de datos.


Se presenta una tabla que muestra las calificaciones obtenidas en un examen
de matemáticas, y a su lado se presenta el número de alumnos que obtuvieron
esas calificaciones.

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 2
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

Frecuencias simples y relativas

Frecuencia f(xi) =f i Frecuencia relativa h(xi)


Variable (Ci) frecuencia absoluta
(El número veces que se
C i= calificaciones (El número veces que se repite Xi )
obtenidas repite Xi )
h(xi) = f(xi)/n
10 1 1/20
9 3 3/20
8 2 2/20
7 3 3/20
6 4 4/20
5 2 2/20
4 1 1/20
3 2 2/20
2 1 1/20
1 1 1/20

En el caso de las variables continuas se debe de dividir los intervalos en los que
debe de distribuirse la información, en este caso existen varios criterio sobre los
que debemos de plantear la distribución. Uno de ellos, de los más comunes,
consiste en determinar la cantidad de parámetros.

Dentro de las frecuencias que aparecen en las tablas, las más comunes, son
frecuencia absoluta, la frecuencia absoluta acumulada y la frecuencia relativa.

2.2.1 La frecuencia absoluta f (xi):


Se determina como el número de veces que se repite un dato xi.

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 3
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

2.2.2 La frecuencia absoluta acumulada Fi:


Para un determinado valor se considera como la frecuencia de cada dato xi más
la suma de los valores anteriores a dicha suma.

𝑓𝑖 = ∑ 𝑛𝑖

Donde ni son el número de datos acumulados de las clases anteriores

2.2.3 La frecuencia relativa hi:


Es el cociente hi =fi/N, en algunas ocasiones se representa como ni/N, donde N
es el número total de datos, corresponde a la suma de todas la frecuencias
individuales de cada clase, y ni o fi los datos en cada clase. Las frecuencias
relativas representan el porciento de veces en que ocurre un dato. Como
veremos en teoría de probabilidades, el concepto de frecuencia relativa nos
conduce a un concepto de probabilidad. (Nuñez , 1977)

2.2.4 La frecuencia relativa acumulada Hi:


Es la suma de los valores acumulados de la frecuencia relativa

𝑓𝑖
Frecuencia relativa acumulada = 𝐻𝑖 = ∑ ℎ𝑖 = ∑𝑛𝑖=1
𝑁

La suma de las frecuencias relativas que se han acumulado, incluyendo la clase


sobre la que se está calculando la frecuencia relativa.

Tabla de frecuencias de una variable discreta

Supongamos que tenemos una muestra de tamaño N, donde la variable


estadística x toma los valores distintos x1, x2,. . ., xk. En primer lugar hay que
ordenar los diferentes valores que toma la variable estadística en orden
(normalmente creciente). La diferencia entre el valor mayor y menor que toma la
variable se conoce como recorrido, o rango.

En el caso de variables discretas, generalmente, un mismo valor de la variable


aparecerá repetido más de una vez (es decir k < N). De forma que el siguiente

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 4
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

paso es la construcción de una tabla en la que se indiquen los valores posibles


de la variable y su frecuencia de aparición. Esta es la tabla de frecuencias de
una variable discreta:

En la primera columna de esta tabla se escriben los distintos valores de la


variable, xi, ordenados de mayor a menor. Es posible hacer también una tabla
de frecuencias de una variable cualitativa. En ese caso, en la primera columna
se escribirán las diferentes cualidades o atributos que puede tomar la variable.
En las siguientes columnas se escriben para cada valor de la variable:

Frecuencia absoluta ni, Definida como el número de veces que aparece


repetido el valor en cuestión de la variable estadística en el conjunto de las
observaciones realizadas. Si N es el número de observaciones (o tamaño de la
muestra), las frecuencias absolutas cumplen las propiedades

La frecuencia absoluta, aunque nos dice el número de veces que se repite un


dato, no nos informa de la importancia de ´este. Para ello se realiza la siguiente
definición.

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 5
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

Frecuencia relativa fi, Cociente entre la frecuencia absoluta y el número de


observaciones realizadas N. Es decir

𝑛𝑖
𝑓𝑖 = ,
𝑁

Cumpliéndose las propiedades

Esta frecuencia relativa se puede expresar también en tantos por cientos del
tamaño de la muestra, para lo cual basta con multiplicar por 100

(%)𝑥𝑖 = 100𝑥𝑓𝑖.

Por ejemplo, si fi = 0.25, esto quiere decir que la variable xi se repite en el 25%
de la muestra.

Frecuencia absoluta acumulada Ni, Suma de las frecuencias absolutas de los


valores inferiores o igual a xi, o número de medidas por debajo, o igual, que xi.
Evidentemente la frecuencia absoluta acumulada de un valor se puede calcular
a partir de la correspondiente al anterior como

𝑁𝑖 = 𝑁𝑖−1 + 𝑛𝑖 𝑦 𝑁1 = 𝑛1.

Además la frecuencia absoluta acumulada del último valor será

𝑁𝑘 = 𝑁.

Frecuencia relativa acumulada Fi, Cociente entre la frecuencia absoluta


acumulada y el número de observaciones. Coincide además con la suma de las
frecuencias relativas de los valores inferiores o iguales a xi

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 6
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

Y la frecuencia relativa acumulada del último valor es 1

𝑓𝑘 = 1

Se puede expresar asimismo como un porcentaje (multiplicando por 100) y su


significado será el tanto por ciento de medidas con valores por debajo o igual
que xi.

Supongamos que el número de hijos de una muestra de 20 familias es el


siguiente:

2113125123

4232142321

El tamaño de la muestra es N = 20, el número de valores posibles k = 5, y el


recorrido es 5 − 1 = 4.

Ejemplo:

En una empresa petrolera se pregunta a 40 obreros por el número de


accidentes que tuvieron durante un mes de trabajo, el resultado es el siguiente:

1,1,1,2,3,4,4,2,0,0,0,1,2,1,0,1,0,2,3,1,0,0,0,1,1,2,3,3,2,1,1,1,0,0,0,3,0,1,1,3

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 7
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

Ahora contamos, ordenamos los datos y construimos la tabla estadística.

1. En la primera columna de la tabla colocaremos los distintos caracteres de la


modalidad objeto de estudio ordenados de menor a mayor (esto será posible en
los caracteres cuantitativos), en nuestro caso el número de Accidentes.

2. En la columna siguiente ponemos la frecuencia absoluta de cada carácter


(contamos el número de veces que aparece cada valor). La suma de las
frecuencias absolutas debe coincidir con el total de datos procesados.

3. La tercera columna estará formada por las frecuencias relativas, cada


frecuencia relativa se obtiene dividiendo la frecuencia absoluta correspondiente
por el total de datos. La suma de todas las frecuencias relativas debe ser 1.

4. En ocasiones se comprenden mejor los datos relativos dados en por ciento,


para ello creamos una nueva columna en la que multiplicaremos las frecuencias
relativas por 100, así tendremos el porcentaje de datos que se corresponden
con cada modalidad.

5. Finalmente crearemos dos columnas en las que reflejaremos las frecuencias


absolutas y relativas acumuladas.

En nuestro ejemplo la tabla queda como sigue:

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 8
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

3 PUNTUACIONES TRANSFORMADAS (distribución de


frecuencias)
3.1 Organización de datos agrupados
3.1.1 Definiciones
Clases o intervalos de clase: Grupo de valores que describen una
característica. Deben incluir todas las observaciones y ser excluyentes. Los
intervalos contienen los límites de clase que son los puntos extremos del
intervalo. Se denominan intervalos cerrados, cuando contienen ambos límites e
intervalos abiertos si incluyen solo un límite.

Limites Reales: Sirven para mantener la continuidad de las clases

Anchura o tamaño del intervalo: es la diferencia entre los límites reales de


una clase

Número de clases: es el número total de grupos en que se clasifica la


información, se recomienda que no sea menor que 5 ni mayor que 15

Marca de Clase: Es el punto medio del intervalo de clase, se recomienda


observar que los puntos medios coincidan con los datos observados para
minimizar el error.

Frecuencia: es el número de veces que aparece un valor

Frecuencia Acumulada: Indica cuantos casos hay por debajo o arriba de un


determinado valor o límite de clase.

Frecuencia Relativa: Indica la proporción que representa la frecuencia de cada


intervalo de clase en relación al total, es útil para comparar varias
distribuciones con parámetros de referencia uniformes.

Frecuencia Acumulada Relativa: Indica la proporción de datos que se


encuentra por arriba o debajo de cierto valor o límite de clase.

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 9
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

3.2 Agrupamiento en intervalos de clase


Cuando el número de valores distintos que toma la variable estadística es
demasiado grande o la variable es continua no es útil elaborar una tabla de
frecuencias como la vista anteriormente. En estos casos se realiza un
agrupamiento de los datos en intervalos y se hace un recuento del número de
observaciones que caen dentro de cada uno de ellos. Dichos intervalos se
denominan intervalos de clase, y al valor de la variable en el centro de cada
intervalo se le llama marca de clase. De esta forma se sustituye cada medida
por la marca de clase del intervalo a que corresponda. A la diferencia entre el
extremo superior e inferior de cada intervalo se le llama amplitud del intervalo.
Normalmente se trabajará con intervalos de amplitud constante. La tabla de
frecuencias resultante es similar a la vista anteriormente. En el caso de una
distribución en k intervalos ésta sería:

El realizar el estudio mediante el agrupamiento en intervalos de clase simplifica


el trabajo, pero también supone una pérdida de información, ya que no se tiene
en cuenta cómo se distribuyen los datos dentro de cada intervalo. Para que
dicha pérdida sea mínima es necesario elegir con cuidado los intervalos.
Aunque no existen ningunas reglas estrictas para la elección de los intervalos,
los pasos a seguir son:

1. Determinar el recorrido, o rango, de los datos. Esto es, la diferencia entre el


mayor y el menor de los valores que toma la variable.

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 10
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

2. Decidir el número k de intervalos de clase en que se van a agrupar los datos.


Dicho número se debe situar normalmente entre 5 y 20, dependiendo del caso.
En general el número será más grande cuantos más datos tenga la muestra.
Una regla que a veces se sigue es elegir k como el entero más próximo a √𝑁,
donde N es el número total de medidas.

3. Dividir el recorrido entre el número de intervalos para determinar la amplitud


(constante) de cada intervalo. Dicha amplitud no es necesario que sea
exactamente el resultado de esa división, sino que

Normalmente se puede redondear hacia un número algo mayor.

4. Determinar los extremos de los intervalos de clase. Evidentemente el


extremo superior de cada intervalo

Ha de coincidir con el extremo inferior del siguiente. Es importante que ninguna


observación coincida

Con alguno de los extremos, para evitar así una ambigüedad en la clasificación
de este dato. Una forma de conseguir esto es asignar a los extremos de los
intervalos una cifra decimal más que las medidas de la muestra. Por ejemplo, si
la variable estadística toma valores enteros: 10, 11, 12,. . ., los intervalos se
podrían elegir: 9.5 − 11.5, 11.5 − 13.5,...

5. Calcular las marcas de clase de cada intervalo como el valor medio entre los
límites inferior y superior de cada intervalo de clase. Otra consideración a tomar
en cuenta a la hora de elegir los intervalos es intentar que las marcas de clase
coincidan con medidas de la muestra, disminuyéndose así la pérdida de
información debida al agrupamiento.

Una vez determinados los intervalos se debe hacer un recuento cuidadoso del
número de observaciones que caen dentro de cada intervalo, para construir así
la tabla de frecuencias.

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 11
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

En la tabla siguiente se listan los datos medidos por James Short en 1763 sobre
la paralaje del Sol en segundos de arco. La paralaje es el ángulo subtendido por
la Tierra vista desde el Sol. Se midió observando tránsitos de Venus desde
diferentes posiciones y permitió la primera medida de la distancia Tierra-Sol,
que es la unidad básica de la escala de distancias en el Sistema Solar (la
unidad astronómica).

Datos (en segundos de arco):

1. Recorrido: máximo−mínimo= 10.80 − 7.47 = 3.33.

2. Número de intervalos: k = "21 = 4.53 # k = 5. Como se redondea por exceso,


la amplitud del intervalo multiplicada por el número de intervalos será mayor
que el recorrido y no tendremos problemas en los extremos.

3. Amplitud del intervalo: 3.33/5 = 0.666 # 0.7.

4. Extremos de los intervalos. Para evitar coincidencias se toma un decimal


más. El primer extremo se toma algo menor que el valor mínimo, pero
calculándolo de forma que el último extremo sea algo mayor que el valor
máximo.

Si tomamos a1 = 7.405 se verifica que es < 7.47 (mínimo), y el ´último extremo


será 7.405+5×0.7 = 10.905 que resulta ser > 10.80 (máximo). Ahora ya
podemos calcular los extremos para cada intervalo de clase y las marcas de
clase correspondientes.

5. Recuento y construcción de la tabla.

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 12
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

En una pequeña empresa van a encargar una serie de batas de almacén para
sus empleados. Como les ofrecen las batas de varias medidas distintas en
cuanto al largo, y para que no haya mucha disparidad, deciden hacer un estudio
de las alturas de sus empleados. Obtienen las siguientes medidas en
centímetros:

183, 164, 159, 176, 173, 168, 155, 168, 162, 161, 172, 174, 178, 184, 160, 181,
165, 167, 163, 172, 178, 161, 158, 170, 179

No vamos a ser tan "crueles" de pedirte que hagas una tabla de frecuencias con
esos valores tal como están. Si pretendieras hacerla te encontrarías con que
hay muchos valores distintos, en concreto desde el menor valor (155) hasta el
mayor (184) hay 30 valores distintos, pero además muchos de ellos no
aparecen ninguna vez, por ejemplo el 156 o el 175. Por tanto, tendrías una tabla
muy grande con bastantes valores de frecuencia nula.

Cuando nos encontramos en un caso como este lo que se hace es agrupar los
datos en un intervalo semicerrado. De esa forma se cuentan las frecuencias
absolutas del intervalo. La forma de trabajar es la siguiente. Se cuentan cuántos
valores distintos hay entre el valor mayor y el menor (en nuestro caso ya hemos
visto que 30) y se dividen proporcionalmente en el número de intervalos que
queramos conseguir. Lo usual es que el número de intervalos no sea menor
que cinco ni mayor que diez

Si en este caso quisiéramos tener cinco intervalos necesitaríamos que su


amplitud fuese de 6 centímetros cada uno. Entonces construiríamos la siguiente
tabla.

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 13
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

Lo primero es calcular la frecuencia absoluta. Para ello sólo hay que tener en
cuenta un detalle importante. Los intervalos son cerrados por la izquierda y
abiertos por la derecha, quiere decir que si tienes un valor que corresponde con
donde termina un intervalo y empieza el siguiente, ese valor debes contarlo en
el segundo intervalo y no en el primero. Esta es una norma que se sigue
usualmente, lo que debe quedarte claro es que no puedes contarla en ambos
intervalos o estarías duplicando los valores y te saldrían más valores de los que
has recogido.

Cuando la variable estadística es cuantitativa continua, los valores que toma se


agrupan en intervalos. Deben tomarse todos los intervalos de la misma amplitud
y de forma que recojan todos los valores posibles, desde el menor al mayor.
Cuando un dato es el que sirve de división para pasar de un intervalo al
siguiente, sólo se contabiliza en el segundo intervalo.

Se llama marca de clase de un intervalo al valor medio del intervalo. Se calcula


sumando los extremos y dividiendo entre dos. Se suele considerar que los
valores que están dentro del intervalo se distribuyen a un lado y otro de la
marca y equivale en total como si todos los valores del intervalo valiesen lo
mismo que la marca de clase. Por eso lo vamos a representar por x ya que va a
sustituir al valor de la variable en el caso de las discretas.

Ejemplo:

Suponga que un investigador desea determinar cómo varía el peso de un grupo


de estudiantes de primer semestre del Instituto Tecnológico San Alberto.
Selecciona una muestra de 50 estudiantes y registra sus pesos en kilogramos.
Los datos obtenidos fueron los siguientes:

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 14
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

Este diagrama facilita determinar la cantidad de veces que se repite un dato y


los valores de los datos con el fin de escribirlos de manera ordenada en la tabla.

Para construir la tabla de datos no agrupados se debe calcular primero lo


siguiente:

Número de clases

K= 1+3,322 log (n)

= 1+3,322 log (50)

= 6,64 → 7

Rango

𝑅 = 𝑥𝑛 − 𝑥1 = 72 − 53 = 19

Amplitud de clase

𝑅 19
𝐼= = = 2,71 ≈ 3
𝐾 7

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 15
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

Tabla de datos agrupados

3.3 Cruces de variables


El cruce de variables pretende identificar si existe relación entre dos o más de
ellas, además, de posibilitar el análisis de estas variables en una sola tabla, en
lugar de construir dos cuadros simples.

Estas tablas aplican fundamentalmente para variables categóricas o incluso


cuantitativa discreta si ésta no tiene muchas categorías de respuestas.

La selección de las variables en cuanto a que lugar va a ocupar en la tabla es


poco relevante, es decir, no influye en los resultados obtenidos. Lo contrario
sucede con la forma de calcular los porcentajes. Este último punto es
fundamental y llevaría a conclusiones no sólo diferentes sino erróneas en
algunos casos.

Con respeto a la forma, prima la parte estética, es decir, la tabla debe ser de
fácil lectura. Sin embargo, los porcentajes si se calculan en el sentido de la
variable independiente, lo anterior, con el fin de poder identificar relación entre

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 16
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

ellas, ya que si se calculan en otro sentido la interpretación varia


fundamentalmente.

Comparar el comportamiento de las variables de escala de acuerdo a las


categorías de la variable de cruce; es decir, identificar variaciones en los
promedios de las variables de escala entre las categorías de una variable.

Para el análisis de dos variables categóricas nos interesa estudiar cómo se


distribuyen los casos según las combinaciones de categorías de cada variable.

Construimos una tabla de contingencia mediante el procedimiento:

Analizar, Estadísticos descriptivos a tablas de contingencia.

Tabla de contingencia obesidad – sexo.

Se obtiene una tabla 2×2 donde queda claro cuántos varones son o no obesos
y cuantas mujeres son o no obesas, según un sentido de lectura de la tabla.
Disponemos de cifras totales por columnas, por filas y el total global. Además,
puedo pedir al programa que muestre el gráfico asociado picando en la casilla
“mostrar gráficos de barras agrupadas”, con el siguiente resultado:

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 17
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

4 Gráficos de una Distribución de Frecuencias


Los gráficos son útiles porque ponen en relieve y aclaran las tendencias que no
se captan fácilmente en la tabla, ayudan a estimar valores con una simple
ojeada y brinda una verificación gráfica de la veracidad de las soluciones.

4.1 Histograma:
Está formado por rectángulos cuya base es la amplitud del intervalo y tiene la
característica que la superficie que corresponde a las barras es representativa
de la cantidad de casos o frecuencia de cada tramo de valores, puede
construirse con clases que tienen el mismo tamaño o diferente (intervalo
variable). La utilización de los intervalos de amplitud variable se recomienda
cuando en alguno de los intervalos, de amplitud constante, se presente la
frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea mucho
mayor que la de los demás, logrando así que las observaciones se hallen mejor
repartidas dentro del intervalo.

4.2 Polígono de Frecuencias:


Se puede obtener uniendo cada punto medio (marca de clase) de los
rectángulos del histograma con líneas rectas, teniendo cuidado de agregar al
inicio y al final marcas de clase adicionales, con el objeto de asegurar la
igualdad del áreas.

4.3 Curvas de frecuencia:


No es más que la curva suavizada que se traza sobre el polígono y representa
la asimetría y la curtosis que tiene la distribución, permite visualizar un esquema
más claro del patrón de datos. Existen varios tipos de curva de frecuencia:
Curvas J, Simétricas o Asimétricas (sesgada a la derecha o a la izquierda),
Unimodales, Bimodales y Multimodales.

4.4 Ojivas:
Cuando se trata de relacionar observaciones en un mismo aspecto para dos
colectivos diferentes no es posible ejecutar comparaciones sobre la base de la
frecuencia, es necesario tener una base estándar, la frecuencia relativa. La

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 18
INSTITUTO TECNOLÓGICO SAN ALBERTO
R.M. 0039/2016

ojiva representa gráficamente la forma en que se acumulan los datos y permiten


ver cuantas observaciones se hallan por arriba o debajo de ciertos valores. Es
útil para obtener una medida de los cuartiles, deciles, percentiles.

5. REFERENCIAS BIBLIOGRAFICAS:
• Caballero , Wilfredo. 1981. Introduccion a la estadistica . Costa Rica :
San Jose , 1981.

• Carasquilla , Pedro. Manual para la elaboracion y Publicacion de


cuadros estadisticos. Panama : Direccion de estadistica y censos .

• Carrasquilla , Pedro E. Manual para la confeccion de graficos


estadisticos DEC-CGR. Republica de Panama : Direccion de
estadisticas y Censos .

• Nuñez , Benavente. 1977. Estadistica Basica para planificacion .


Mexico : Arturo Siglo XXI , 1977.

DISTRITO I. COMUNIDAD SAN ALBERTO, MUNICIPIO CARAPARÍ, TARIJA – BOLIVIA


TELÉFONOS: 70221980 – 72950258 19

También podría gustarte