Está en la página 1de 18

ESTADÍSTICA BÁSICA - 2019

DATO: Condición tripartita


1. Unidad de análisis
2. Variable
3. Valor o resultado de la variable

Matriz de datos
Forma de ordenar los datos que
permite trabajar con ellos
(Y que refleja la condición
tripartita del dato)

Tabla de frecuencias
Tabla de frecuencias

Se estudia la REGULARIDAD, la CANTIDAD DE VECES, la
FRECUENCIA que se repite una característica, una
categoría, un valor de la variable

Se parte de los datos recolectados y ordenados, y luego
se construye la Tabla de frecuencias

PREGUNTA 1 ¿dónde están ordenados estos datos?

Solo se verá ahora el Análisis de Variables nominales.
Después se verá el de Variables ordinales Se recuerda:
nominales y ordinales son variables NO MÉTRICAS
Veremos un ejemplo muy sencillo para introducir el tema.
Videos que hay en la Biblioteca FIC
Datos recolectados y ordenados. Datos provenientes de los registros de la
biblioteca. Están ordenados por Id en una matriz, de la que solo vamos a
considerar este fragmento y vamos a suponer que esto es todo. Se observa: la
UA (líneas) es “videos en la biblio FIC” y en total son 20, y las variables
(columnas) que se estudian son 3: Titulo, País e Idioma. PREGUNTA 2: ¿de qué
tipo es c/u de las variables?
● Id Título País Idiom
● ● Id Títu País
● Idioma
a lo
● Video ● Alelí ● UY ● Es ● Video ● … ● UY ● Es
1 11
● Video ● Whisk ● UY ● Es ● Video ● BR ● Pt
2 y 12
Video3 ● … ● AR ● Es ● Video ● UY ● Es
● Video ● AR ● Es 13
4 Video1 ● BR ● Pt
● Video ● 25 ● UY ● Es 4
● Video ● AR Es
5 watts ●

● Video ● AR ● Es 15
● Video ● FR Fr
6 ●
En la matriz de la diapo anterior se observa:
ü
se utilizaron códigos para las variables
ü
La cantidad de unidades analizadas (UA) son 20, este es la cantidad de
casos considerados o tamaño de la muestra n
ü
PREGUNTA 3: la variable Título de la película, por ej. 25 watts ¿podría estar
otra vez?
ü
Los valores, o mejor dicho: las categorías de la variable País son: UY, AR, IT,
BR, FR son 5
ü
PREGUNTA 4: ¿cuáles y cuántas son las categorías de la variable Idioma?
ü

ü
CON ESTOS DATOS SE CONSTRUYE LA TABLA DE FRECUENCIAS
Por ser 3 variables, se podrían hacer 3 tablas de frecuencias, pero, en realidad
estamos considerando solo 2 variables (de Titulo no están los datos)
Mostraré cómo se hace la Tabla de Frecuencia de la variable Idioma y
ustedes harán como práctica la otra Tabla
Tengan siempre a la vista la matriz, para seguir el razonamiento

Tabla de frecuencias, absolutas y relativas:


Tabla 1. Número y porcentaje del Idioma de los videos en la
Biblioteca FIC
● Categorías
● Frecuenci ● Frecuenci ● Porcentaj
de la
variable a a relativa e
absoluta
● Español ● 12 ● 0,60 ● 60%
● Italiano ● 3 ● 0,15 ● 15%
● Francés ● 2 ● 0,10 ● 10%
Portugués ● 3 ● 0,15 ● 15%
● Total ● 20 ● 1
¿cómo se construyó la Tabla de
frecuencias de la variable Idioma?

Se consideraron las categorías (Español, Italiano,


Francés y Portugués) de la variable y se contó cuántas
veces aparecía c/u en la matriz obteniendo así la
regularidad o frecuencia
A este conteo se le denomina Frecuencia absoluta… y
PREGUNTA 5 ¿cuánto tiene que sumar la frecuencia
absoluta? Siempre. Si no está mal construido el diseño
o la Tabla
La suma de las Frecuencias absolutas siempre tiene que
ser el tamaño de la muestra (en el ejemplo es 20) …
¿porqué?


Porque estoy estudiando 20 casos

Porqué si no suma 20… por ej. si al sumar diera 19 quiere decir
que hay un caso que no lo consideré, o si la suma fuera 21 es
que alguno lo tomé 2 veces
 en cualquiera de las dos situaciones están mal realizadas las
cuentas y por lo tanto mal construida la Tabla
 Se debe revisar y corregir los errores
Si revisadas las cuentas sigue habiendo
diferencias es que están mal definidas las
categorías de las variables, está mal construido
el diseño de investigación
Por lo tanto,
La suma de las Frecuencias absolutas siempre
tiene que ser la cantidad de casos considerados o
tamaño de la muestra n

Y esto tiene que ser siempre así… ¿porqué?


¿cuál es su sustento, en qué se basa?
SE BASA EN LOS CONCEPTOS DE
EXCLUSIÓN Y EXHAUSTIVIDAD
SUPUESTOS AL DEFINIR LAS CATEGORÍAS
O VALORES DE LAS VARIABLES
El supuesto de exclusión implica que cada uno de los
casos o UA va pertenecer a una y solo una de las
categorías. Cada caso se va a poder CLASIFICAR en
una sola categoría
En el ejemplo el Idioma de la película es español o
italiano o … (siempre “o” excluyente). No puede ser
en dos idiomas
Si nos interesara estudiar si las películas son
habladas en más de un idioma, deberíamos haber
definido en el diseño Idioma1 o principal, Idioma2,…
es decir haber definido distintas variables
El supuesto de exhaustividad implica que no va a haber
ningún caso que no esté considerado en alguna de las
categorías, es decir, cada uno de los casos va a
pertenecer a alguna categoría. Cada caso se va a
CLASIFICAR en alguna de las categorías consideradas.
No se puede tener algún caso no contemplado en las
categorías. En el ejemplo, en los 20 videos no hay
ninguno que pueda ser, por ejemplo, en japonés.
Si fuera así, significaría que al diseñar la variable, al
definir las categorías, no se cumplió con la
exhaustividad. No se consideraron todas las situaciones
posibles. El diseño está mal realizado.
Recapitulando:

La suma de las Frecuencias absolutas


siempre tiene que ser la cantidad de casos
considerados o tamaño de la muestra (en
el ejemplo es 20)

PREGUNTA 6: ¿porqué la suma de la frecuencia


absoluta es la cantidad de casos o tamaño de la
muestra?
Hacemos un corte ahora y les propongo
antes de seguir que realicen las
preguntas que fueron apareciendo en la
diapositivas de la presentación

También les propongo que realicen la


Tabla de Frecuencias para la otra
variable: País
PREGUNTAS

PREGUNTA 1 ¿dónde están ordenados estos datos? ir a diapo

PREGUNTA 2: ¿de qué tipo es c/u de las variables? diapo

PREGUNTA 3: la variable Título de la película, por ej. 25 watts
¿podría estar otra vez? diapo

PREGUNTA 4: ¿cuáles y cuántas son las categorías de la
variable Idioma? diapo
PREGUNTA 5: ¿cuánto tiene que sumar la frecuencia absoluta?
Siempre. diapo
PREGUNTA 6: ¿porqué la suma de la frecuencia absoluta es la
cantidad de casos o tamaño de la muestra? diapo


RESPUESTAS
PREGUNTA 1 en la matriz de datos

PREGUNTA 2Tipo de variable según su nivel de medición: las 2 son Nominales


PREGUNTA 3Sí, puede estar repetida, se tienen varias copias porque es una película

muy demandada. Pero c/u debe tener Id distinto: el Id es único, no repetible


PREGUNTA 4Categorías de la var Idioma: Es, It, Pt, Fr. Cantidad: en total son 4


PREGUNTA 5Suma de la Frecuencia absoluta: n = tamaño de la muestra. En el
ejemplo es 20

PREGUNTA 6la suma de la Frecuencia absoluta es siempre n tamaño de la muestra
porque las categorías de la variable cumplen con los principios o supuestos de
exclusión y exhaustividad

También podría gustarte