Está en la página 1de 11

CARRERA: DESARROLLADOR DE SOFTWARE

ESTADISTICA - AÑO 2022

Estadística: Es la parte de las matemáticas que se encarga del estudio de una determinada
característica de la población, recogiendo datos, organizándolos en tablas, representándolos
gráficamente y analizándolos para sacar conclusiones respecto de la población.
Según que el estudio se realice sobre toda la población o un grupo de ella se puede distinguir
dos tipos de estadística, estadística descriptiva e inferencial.
En el mundo natural y en las sociedades humanas existen fenómenos cuyo comportamiento
no puede establecerse mediante leyes fijas, sino que obedecen a la conjunción de múltiples
factores cuya interacción es a menudo incontrolable. En tales casos se recurre a análisis
estadísticos, que recogen datos sobre un número elevado de manifestaciones del fenómeno
y los relacionan y describen por medio de tablas, gráficos y valores numéricos representativos.
En el manejo de modelos estadísticos se utilizan tres conceptos fundamentales:
Población: definida como el conjunto de todos los elementos que verifican una cierta
característica considerada de interés para el estudio estadístico.
Individuo: cada uno de los elementos de una población. El número de individuos define el
tamaño de la población.
Muestra o subpoblación: entendida como cualquier subconjunto representativo de la
población considerada. Por su parte, los individuos de una población poseen una serie de
cualidades o propiedades que, genéricamente, se conocen por caracteres. Existen dos
clases de estas propiedades que pueden ser caracteres cualitativos o cuantitativos.

Datos
Una unidad de observación o unidad experimental es aquel sobre la cual se efectúan
mediciones o se intenta clasificar en categorías.
Las unidades de medición pueden ser personas o grupo de personas como familias,
viviendas, etc. También pueden ser objeto tales como células sanguíneas, plantas, animales
tornillos, etc. En el proceso de observación se registra, para cada unidad experimental alguna
característica y esta observación constituye un dato.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

El conjunto de datos obtenidos para cada unidad de observación constituirá la base para el
análisis estadístico.
Tipo de Variables

Una variable es cualquier característica que varía de una unidad experimental a otra en la
población o en la muestra. El conjunto de valores que constituyen un carácter estadístico se
denomina variable estadística. En términos estrictos, se denomina variable estadística a
todo carácter cuantitativo de un individuo, mientras que los caracteres cualitativos se suelen
llamar atributos
Las variables se clasifican en dos grandes grupos: Variables cualitativas o categóricas y
cuantitativas o numéricas.
Las personas pueden ser clasificadas de acuerdo al color de sus cabellos como rubios,
morochos o pelirrojos. Las plantas se clasifican en hierbas, arbustos, arboles, etc. Las rocas
pueden ser clasificadas en sedimentarias. Ígneas o metamórficas. En cada uno de estos
ejemplos, los miembros de la población en estudio (personas, plantas, rocas) son
clasificadas en categorías. Son ejemplos de variables categóricas.
Las variables categóricas son aquellas que están definidas por clases o categorías que las
componen. Las variables categóricas también reciben el nombre de variables cualitativas.
La clasificación más simple para este tipo de variable es aquella que tiene solo dos
categorías. La caracterización se debe a la ausencia o presencia de una cualidad dada. Por
ejemplo, una persona puede o no tener un empleo, una planta puede o no tener flores.
Las variables generadas por la presencia o ausencia de una categoría, se llaman dicotómicas
o binarias.
Si el objetivo de investigación es por ejemplo la relación entre sexo y tipo de ocupación
dichas variables son categóricas. Sexo: varón, mujer, obrero empleado, profesional,
comerciante, etc.
Otro tipo de variables son las variables numéricas. Como su nombre lo indica, se expresan
por un número.
Las variables numéricas pueden ser discretas o continuas. Las variables que surgen por
conteo o por asignación de ciertos códigos numéricos a las categorías de las variables

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

cualitativas se denominan variables discretas por ejemplo el número de hijos de una mujer
es siempre un valor entero: 0, 1,2,3 etc.
Algunos ejemplos de variables discretas serían: Cantidad de árboles frutales atacados por
un gusano por parcela, cantidad de vacas vacunadas por establecimiento rural, cantidad de
alumnos repitentes por colegio, cantidad de personas por vivienda.
Las variables que surgen de mediciones sobre cada unidad experimental (personas,
animales, parcelas etc) se denominan variables continuas. pueden tomar cualquier valor
dentro del conjunto de los números reales R o de un intervalo suyo. Ejemplos de variables
continuas son las medidas antropomórficas de los recién nacidos, la altura de los ciudadanos
de un determinado colectivo, la medición de temperaturas. Una variable continua puede
tomar infinitos valores en un rango dado
Escala de medición

Una medición consiste en establecer números o códigos a las observaciones mediante el


empleo de una escala apropiada.
Una escala se puede definir como un instrumento de medición. Las escalas de medición se
diferencian por propiedades de orden y distancia.
S.S Stevens (1946) desarrolló una clasificación para las escalas de medición en: nominal,
ordinal, de intervalo y de razón.
Escala Nominal
Es aquella en donde no se hace ningún supuesto respecto de las relaciones que existen
entre los valores de las variables. Cada valor se asigna a una categoría diferente, la que se
define mediante un nombre. La variable lugar de nacimiento se mide en escala nominal, las
ciudades se pueden ordenar de acuerdo a tamaño, habitantes etc, la variable lugar de
nacimiento no tiene un orden establecido. Otros ejemplos de variables nominales son el
sexo, la religión, el establecimiento escolar donde estudia.
Escala ordinal
Es aquella que surge al ordenar todas las categorías de las variables de acuerdo a algún
criterio.
Por ejemplo, es posible clasificar a las personas de acuerdo a su máximo nivel de estudios
alcanzados, primario, secundario, universitario, el nivel socio económico se puede clasificar

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

en bajo, medio, alto; los empleados se pueden clasificar en obreros, supervisores, gerentes
etc.
En estos casos lo que se sabe es que por ejemplo que universitario es superior a primario o
que el nivel socio económico alto es mayor que bajo.
No obstante, no sabemos con certeza cuanto mayor es. El orden es una propiedad
matemática aplicada este tipo de escala de medición y por lo tanto el uso de valores
numéricos no implica que todas las propiedades de los números puedan aquí ser
consideradas.
Escala de intervalo
Es aquella que tiene la propiedad de asignar una medición de distancia entre los valores de
la variable. Entonces cuando se afirma que un objeto es mayor que otro, se puede especificar
cuantas unidades de diferencia hay entre ambos o por cuantas unidades un objeto es mayor
que otro. Por ejemplo, con la medición de intervalo es posible decir no solo que Pedro gana
más que Julio, sino que también se puede afirmar cuantos pesos más gana con respecto a
Julio.
Otra característica de la escala de intervalo es que el punto origen o punto cero es un punto
de acuerdo o convencional. Además, la razón entre dos intervalos de distancia es
independiente de las unidades de medición.
En los ejemplos mencionados el punto cero o punto origen, es convencional. Un termómetro,
por ejemplo, mide la temperatura en grados que son del mismo tamaño en cualquier punto
de la escala, La diferencia entre 20° y 21° es la misma que entre 5° y 6°. Sin embargo, en
esa escala el punto origen o punto cero es en realidad un punto de acuerdo.
Cuando decimos que una montaña mide 1000 metros ello significa que se encuentra a 1000
metros por encima del nivel del mar o punto origen de esta escala.
Escala de razón
Es aquella que presenta todas las propiedades de orden y distancia de una escala de
intervalo agregando el punto cero u origen. Peso, estatura, y medidas de distancia que tienen
un cero natural y que son medibles con escalas racionales, son ejemplo de este tipo de
escala.
En una escala de razón al igual que en una escala de intervalo las unidades de medida son
equidistantes unas de otras con la única diferencia que, en las escalas de razón, existe un
cero correctamente definido. La existencia de un punto cero implica que se puede efectuar
comparaciones proporcionales. El tipo de escala de medición que se utiliza al medir una
variable condiciona el tratamiento estadístico que se hará de la misma.
La escala de razón satisface todas las propiedades de los números reales, cualquier
operación matemática apropiada para números reales puede ser aplicada a una escala de
este tipo.
Otras variables que se puede medir con escala de intervalo son altura, temperatura, tiempo,
riqueza, inteligencia.
Organización y resumen de datos
Cuando se tiene una gran cantidad de datos, el primer paso es ordenarlos en una tabla que
consta de dos o más columnas, la primera de ellas contiene la identificación de la unidad de
observación y la segunda el dato correspondiente a dicha unidad, La organización de los datos
dependerá si se está trabajando con datos simples o agrupados.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Tabla de frecuencias
La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que
se presentan numéricamente las características de la distribución de un conjunto de datos o
muestra. La frecuencia es el número de veces que se repite un dato o una observación.
Las tablas de frecuencias permiten ordenar variables cualitativas o cuantitativas.

Tipos de frecuencias
Frecuencias absolutas: son el número de veces que se repite un número en un conjunto de
datos.
Frecuencias absolutas acumuladas: es la suma de las frecuencias absolutas.
Frecuencia relativa: corresponde a las veces que se repite un número en un conjunto de
datos respecto al total, pero se expresa en porcentajes (%).
Frecuencia relativa acumulada: es la suma de las frecuencias relativas.
Construcción de Tablas de Frecuencias para datos no agrupados
Se preguntó a un grupo de 50 personas, la cantidad de habitantes (variable cuantitativa
discreta) en la vivienda de cada uno de ellos. Los datos obtenidos se muestran en la Tabla de
distribución de frecuencias

En la primera columna se ordenan de menor a mayor los diferentes valores que tiene la
variable en el conjunto de datos.
En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y las
frecuencias absolutas acumuladas.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Las columnas cuarta y quinta contienen las frecuencias relativas y las frecuencias
relativas acumuladas.
Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima), representando
la frecuencia relativa y la frecuencia relativa acumulada como tanto por cien. Estos
porcentajes se obtienen multiplicando las dos frecuencias por cien.
En las tablas estadísticas se cumplen algunas propiedades interesantes que sirven de
mecanismos de control de su exactitud:
 La suma de todas las frecuencias absolutas es igual al tamaño de la población de la
muestra.
 La suma de las frecuencias relativas es siempre igual a 1.
 La última frecuencia absoluta acumulada coincide con el número total de observaciones.
 La última frecuencia relativa acumulada es igual a la unidad.
Construcción de Tablas para datos agrupados

Se emplea cuando hay un número elevado de datos. Estos se agrupan en intervalos o clases
para facilitar su tabulación, análisis y representación gráfica a través de histogramas. Se
puede utilizar para variables cuantitativas o cualitativas ordinales.
Los pasos iniciales para formar una tabla de frecuencias con datos agrupados están
encaminados a determinar el número de intervalos y definirlos (siempre que no se conozcan
de antemano). Los pasos son:
a. Obtener el rango R de los datos. Es la diferencia entre el dato mayor y el menor del
conjunto de valores que toma la variable a tabular. Se llama también amplitud total.𝑅 =
𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛.
b. Fijar cuantos intervalos o clases se desea, se tiende a que el número de clases sea
impar entre 5 y 15. Hay dos maneras de hacerlo. Uno es a criterio del investigador y otro
mediante el método de Sturges, que emplea la fórmula siguiente 𝑛𝑖𝑛𝑡 = 1 + 3,322. 𝑙𝑜𝑔𝑁 donde
n int es el número de intervalos, el logaritmo decimal de N que representa el total de datos. El
resultado hallado se redondea al número entero más próximo.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

c. Determinar la amplitud del intervalo de clase. Se obtiene de dividir el rango R o amplitud


total por el número de clases o intervalos calculados anteriormente.
𝑹
𝑰=
𝒏𝒊𝒏𝒕
El valor obtenido en esta división no tiene porqué ser un número entero. En ese caso, se
redondearía al valor entero más próximo. Los dos redondeos, el que se haya podido hacer en
el número de intervalos 𝑛𝑖𝑛𝑡 y el de la amplitud del intervalo I modificarán el valor de la amplitud
total o rango, apareciendo un nuevo valor ajustado, con los valores definitivos, repartiendo la
diferencia entre R’ y R entre los dos extremos del rango:

𝑹́ = 𝑰. 𝒏𝒊𝒏𝒕

d. Formar los diferentes intervalos o clases, partiendo del valor mínimo del nuevo rango
R’. Cada intervalo tendrá unos extremos a y b separados por la amplitud de clase o intervalo
I. En variables continuas, normalmente los intervalos son cerrados por la izquierda y abiertos
por la derecha, [a , b) en el que b no pertenece a este intervalo si no que es el valor mínimo
del intervalo siguiente. En variables discretas ordinales o en variables continuas en los que el
procedimiento de medición no pueda apreciar más allá de un valor entero, los intervalos o
clases serán cerrados por los extremos [a, b].
e. Cada intervalo está representado por la llamada marca de clase. Es la media entre sus
𝐚 +𝐛
extremos.𝐜𝐢 = 𝐢 𝟐 𝐢 .Representará a los valores del intervalo o clase en los cálculos a partir de
la tabla.
f. A partir de la columna de clases, se formarán las columnas de las frecuencias.
Representación gráfica de datos estadísticos
En los análisis estadísticos, es frecuente utilizar representaciones visuales complementarias
de las tablas que resumen los datos de estudio. Con estas representaciones, adaptadas en
cada caso a la finalidad informativa que se persigue, se transmiten los resultados de los
análisis de forma rápida, directa y comprensible para un conjunto amplio de personas
Tipos de Representaciones gráficas.
Cuando se muestran los datos estadísticos a través de representaciones gráficas, se ha de
adaptar el contenido a la información visual que se pretende transmitir. Para ello, se barajan
múltiples formas de representación:
Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un sistema
de ejes cartesianos, cuando la variable es discreta o cualitativa.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Histogramas: formas especiales de diagramas de barras para distribuciones cuantitativas


continuas.

Polígonos de frecuencias: formados por líneas poligonales abiertas sobre un sistema de


ejes cartesianos.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Gráficos de sectores: circulares o de torta, dividen un círculo en porciones proporcionales


según el valor de las frecuencias relativas.

Pictogramas: o representaciones visuales figurativas. En realidad, son diagramas de barras


en los que las barras se sustituyen con dibujos alusivos a la variable.

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Cartogramas: expresiones gráficas a modo de mapa.


Pirámides de población: para clasificaciones de grupos de población por sexo y edad

Diagrama de barras e histogramas


Los diagramas de barras se usan para representar gráficamente series estadísticas de
valores en un sistema de ejes cartesianos, de manera que en las abscisas se indica el valor
de la variable estadística y en las ordenadas se señala su frecuencia absoluta.
Estos gráficos se usan en representación de caracteres cualitativos y cuantitativos discretos.
En variables cuantitativas continuas, se emplea una variante de los mismos llamada
histograma.
Polígonos de Frecuencias
Para construir polígonos de frecuencias, se trazan las frecuencias absolutas o relativas de los
valores de la variable en un sistema de ejes cartesianos y se unen los puntos resultantes
mediante trazos rectos. Con ello se obtiene una forma de línea poligonal abierta.
Los polígonos de frecuencias se utilizan preferentemente en la presentación de caracteres
cuantitativos, y tienen especial interés cuando se indican frecuencias acumulativas. Se usan
en la expresión de fenómenos que varían con el tiempo, como la densidad de población, el
precio o la temperatura.
Gráfico de sectores
En los diagramas de sectores, también llamados circulares o de tarta, se muestra el valor de
la frecuencia de la variable señalada como un sector circular dentro de un círculo completo.
Por ello, resultan útiles particularmente para mostrar comparaciones entre datos, sobre todo
en forma de frecuencias relativas de las variables expresadas en forma de porcentaje.
Pictogramas y Cartogramas
Para aligerar la presentación de datos estadísticos, con frecuencia se recurre a imágenes
pictóricas representativas del valor de las variables. Dos formas comunes de expresión gráfica
de los datos son:

Profesora: Lisa Graciela SALINAS


CARRERA: DESARROLLADOR DE SOFTWARE
ESTADISTICA - AÑO 2022

Los pictogramas, que muestran diagramas figurativos con figuras o motivos que aluden a la
distribución estadística analizada (Por ejemplo: una imagen antropomórfica para indicar
tamaños, alturas u otros).
Los cartogramas, basados en mapas geográficos que utilizan distintas tramas, colores o
intensidades para remarcar las diferencias entre los datos.
Pirámide de población
Otra forma corriente de presentación visual de datos estadísticos es la llamada pirámide de
población.
Las pirámides de población se utilizan en la expresión de informaciones demográficas,
económicas o sociales, y en ellas se clasifican comúnmente los datos de la población del
grupo de muestra considerado en diferentes escalas de edad y diferenciada por sexo.

Profesora: Lisa Graciela SALINAS

También podría gustarte