Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Prof. Bachiller:
Junio 2022
CONCEPTOS BASICOS CONCEPTUALES GENERALES DE ESTADISTICA
DESCRIPTIVA
1. Estadística – Concepto.
2. Población:
Grupo de individuos que presenta o podría presentar un rasgo característico
común que se desea investigar.
2.1.- Finita.
Es aquella cuya cantidad de elementos es posible de determinar. Ejemplo:
conjunto de librerías de la ciudad de Lima.
2.2.- Infinita.
Es aquella cuya cantidad de elementos es imposible de determinar. Ejemplo:
conjunto de lápices fabricados en un proceso continuo.
2.3.- Homogénea.
Conjunto total de individuos fenotípicamente iguales, pudiendo referirse a una
población homogénea y homocigótica (líneas puras); o bien, a una población
homogénea y heterocigótica (híbridos).
La noción de homogeneidad define a la igualdad mayor o menor de los valores de
una variable o de una combinación de características en un conjunto geográfico.
Los parámetros de dispersión estadística, en particular la varianza, miden su
inversa, la heterogeneidad.
2.4.- Heterogénea.
De composición no uniforme, que está formado por elementos desiguales, de
distinta naturaleza, diferentes entre sí.
2.5.- Subpoblación.
Un subconjunto de una población que comparte una o más propiedades
adicionales se denomina subpoblación. Por ejemplo, si la población es toda
egipcia, una subpoblación son todos hombres egipcios; si la población son todas
las farmacias del mundo, una subpoblación son todas las farmacias de Egipto. Por
el contrario, una muestra es un subconjunto de una población que no se elige para
compartir ninguna propiedad adicional.
Ahora que ya hemos hablado de las diferencias podemos profundizar en cada tipo
de dato usando ejemplos del mundo real.
Una escala de medición es el conjunto de los posibles valores que una cierta
variable puede tomar. Es un continuo de valores ordenados correlativamente, que
admite un punto inicial y otro final. El nivel en que una variable puede ser medida
determina las propiedades de medición de una variable, el tipo de operaciones
matemáticas que puede usarse apropiadamente con dicho nivel, las fórmulas y
procedimientos estadísticos que se utilizan para el análisis de datos y la prueba de
hipótesis teóricas.
Las escalas o niveles de medición se utilizan para medir variables o atributos. Por
lo general, se distinguen cuatro escalas o niveles de medición: nominal, ordinal,
intervalos y escalas de proporción, cociente o razón. Las dos primeras (nominal y
ordinal) se conocen como escalas categóricas, y las dos últimas (intervalo y razón)
como escalas numéricas. Las escalas categóricas se usan comúnmente para
variables cualitativas, mientras que las numéricas son adecuadas para la medición
de variables cuantitativas.
Escala nominal
Es la escala más elemental y la forma más rudimentaria de medir.
En una escala como estas se clasifica a las unidades de estudio (objetos
personas, etc.) en categorías, basándose en una o más características, atributos o
propiedades distintivas y observadas, dándole a cada categoría un nombre (de ahí
lo de «nominal»).
Escala ordinal
Una escala de medición ordinal se logra cuando las observaciones pueden
colocarse en un orden relativo con respecto a la característica que se evalúa, es
decir, las categorías de datos están clasificadas u ordenadas de acuerdo con la
característica especial que poseen. Aquí, las etiquetas o símbolos de las
categorías sí indican jerarquía.
Escala de intervalos
Las escalas de intervalo o cardinales son más refinadas puesto que además del
orden o jerarquía entre categorías, las etiquetas o números consecutivos
establecen intervalos iguales en la medición (las distancias entre categorías son
las mismas a lo largo de toda la escala).
5.1. Muestra.
Muestreo estratificado: En este caso, estamos ante una población que, si bien
es heterogénea, se puede separar en grupos homogéneos (sexo, edad, etc.). En
cada grupo se realiza una muestra aleatoria simple. Es muy utilizado en ciencias
sociales, como la psicología.
Muestreo consecutivo.
8. Parámetros y Estadígrafos.
Dependiendo del manual visitado o del autor, podríamos ver diferentes etapas con
diferentes nombres. En esencia, casi todos los documentos sobre el tema recogen
los mismos apartados, solo que unos engloban varias fases en una y otros
fragmentan más el proceso.
En el planteamiento del problema se sitúa el eje central sobre el que articular todo
lo demás. Esta fase responde a la siguiente pregunta: ¿Qué necesito estudiar y
por qué? En ocasiones, por increíble que parezca plantear el problema puede
hacernos llegar a la conclusión de que en realidad no necesitamos realizar un
estudio estadístico.
Recogida de datos
Una vez hemos planteado el problema debemos recoger los datos. Aquí es
importante la metodología. De tal modo que existen diferentes consideraciones.
Así pues, debemos establecer el tipo de muestreo, el tamaño de la muestra, el tipo
de recolección de datos (por ejemplo, a través de bases de datos o de encuestas
personalizadas), en persona, por internet o por teléfono, etc.
Por último, pero no por ello menos importante, tenemos la interpretación de los
datos. De nada sirve realizar todas las fases del proceso estadístico
correctamente si al final la interpretación es errónea. Esto es debido a que si la
interpretación es errónea, entonces las decisiones tendrá un efecto no deseado.
Por ejemplo, imaginemos que realizamos un estudio sobre la variabilidad de las
ventas de una empresa. Si una vez obtenemos los resultados resulta que hay
mucha dispersión, conviene reducirla y nosotros interpretamos que no, esto podría
afectar negativamente a la empresa.
Encuesta
Entrevista
Prueba
Una prueba es una forma o una tarea física o mental para la cual se ha
determinado un estándar normal, o para la cual se conoce las respuestas
correctas. El desempeño de un participante en una prueba es comparado contra
estos estándares y/o respuestas correctas. Las pruebas son usadas en la
investigación para determinar la aptitud, habilidad, conocimiento, estado de salud
física o mental del participante en comparación a la población en general. Las
pruebas pueden ser administradas en persona, por escrito o por un medio
electrónico. Un ejemplo de esto serían los estudiantes haciendo pruebas
estandarizadas de desempeño académico (como el SAT, MCAT o GRE).
Evaluaciones Fisiológicas
Observaciones
Revisión de Registros
Muestras Biológicas
Las muestras biológicas son substancias (sangre, orina, saliva) que son tomadas
de una persona y se utilizan para medir información fisiológica. Un ejemplo sería
hacer un examen de sangre para determinar el contenido de azúcar en un
paciente diabético.
11.Medidas Relativas:
11.1. Razón.
Ejemplos de razón:
Razón de masculinidad
11.2. Proporción.
11.3. Porcentaje.
y, operando:
El porcentaje se usa para comparar una fracción (que indica la relación entre dos
cantidades) con otra, expresándolas mediante porcentajes para usar 100 como
denominador común. Por ejemplo, si en un país hay 500 000 enfermos de gripe de
un total de 10 millones de personas, y en otro hay 150 000 enfermos de un total de
un millón de personas, resulta más claro expresar que en el primer país hay un
5 % de personas con gripe, y en el segundo hay un 15 %, resultando una
proporción mayor en el segundo país.
11.4. Tasa
Las tasas brutas son calculadas para toda la población. Las tasas específicas se
calculan para un subgrupo específico que está en riesgo de presentar el evento.
Puede haber tasas por edad, sexo, raza, ocupación y así sucesivamente. En la
práctica, es más preciso denominarla razón y no tasa.
Ejemplo: tasa general de fecundidad relaciona el número de nacimientos con el de
mujeres de 15 a 44 años de edad (edad fértil), dando una visión de cuantos niños
están naciendo por cada mil mujeres capaces de procrear
TABLAS ESTADÍSTICAS
Efectuando la clasificación de los datos, es necesario representarlos de manera
clara, sintética y significativa para su mejor y fácil entendimiento. La tabla juega el
papel fundamental pues es la base de la construcción del gráfico y del análisis
estadístico.
La tabla o cuadro estadístico consta de tres partes que reciben nombres que
anuncian la peculiaridad fundamental de su estructura que son: cabeza, cuerpo y
pie.
Cabeza o Encabezamiento
Es la parte superior de la tabla que contiene el título que expresa clara y
concisamente el contenido o significado de la información l periodo es el espacio
de tiempo para el cual validada la información: la unidad de medida siempre y
cuando sea común a toda la información.
Cuerpo
Este localizado en la parte central de la tabla y en él se encuentra la esencia
misma de la información, es decir, las categorías de las variables y sus
correspondientes frecuencias.
Pie
Lo forma la parte inferior de la tabla, que está destinado a las notas o aclaraciones
indicadas en el encabezamiento o en el cuerpo (cuando son necesarios): además
menciona la fuente u origen de la información.
Tablas tipo I:
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
1 16
2 20
3 9
4 5
Total 50
Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la Derecha
[ Li-1, Li)
[ 0,500) 16
[ 500, 1000) 6
[ 1000,1500) 3
[ 1500, 2000) 2
[ 2000, 2500) 1
[ 2500, 3000) 1
[ 3000, 3500) 0
[ 3500, 4000) 0
[ 4000, 4500) 0
[ 4500, 5000) 0
[ 5000,5500) 1
Los gráficos estadísticos son muy útiles para comparar distintas tablas de
frecuencia.
DIAGRAMA DE BARRAS.
HISTOGRAMA.
POLÍGONO DE FRECUENCIAS.
Para una variable continua, el polígono de frecuencias se obtiene uniendo por una
poligonal los puntos medios de la base superior de los polígonos del histograma.
DIAGRAMA DE SECTORES.
1. Título:
Son los datos relacionados en un gráfico. Si hay varias series de datos en la tabla,
cada una tendrá un color o estilo diferente. Los gráficos circulares sólo pueden
tener una serie de datos.
3. Eje Vertical:
En este ejemplo (un gráfico de columnas), el eje vertical mide la altura, o el valor
de las columnas, por lo que también se llama el eje de valores. Sin embargo, en
un gráfico de barras, el eje horizontal sería el eje de valores.
4. Eje horizontal:
En este ejemplo, el eje horizontal identifica las categorías en la tabla, por lo que
también se llama el eje de categorías. Sin embargo, en un gráfico de barras, el eje
vertical sería el eje de categorías.
5. Leyenda:
Identifica el color que representa a cada serie de datos. Para muchos gráficos es
crucial, pero para otros, puede que no sea necesario y se puede eliminar.
En este ejemplo, la leyenda permite al espectador identificar los tipos de libros que
hay en el gráfico.
Como las frecuencias son siempre positivas, el gráfico sólo requiere los
cuadrantes I y II del plano. Habitualmente el gráfico de barras aparece en el primer
cuadrante.
Según se utilicen frecuencias absolutas o frecuencias relativas, se obtendrá el
diagrama de barras absoluto o relativo.
- Polígono de frecuencias.
Sobre el eje de abscisas se llevan los valores de la variable y sobre el eje de las
ordenadas, los valores de las frecuencias acumuladas (absolutas o relativas). Se
levantan barras de altura igual a la frecuencia y por el extremo superior de cada
barra se trazan paralelas al eje de abscisas, hasta cortar a la barra siguiente. se
obtiene así una representación escalonada, cuya justificación se debe a que entre
cada dos valores consecutivos de la variable, las frecuencias acumuladas
permanecen invariables. A este gráfico se le conoce como diagrama de barras
acumulativo.
- Diagrama de rectángulos.
- Diagrama de sectores.
- Pictograma.
- Perfil ortogonal.
- Cartograma.
Promedio.
Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética
o promedio aritmético. Se representa por la letra griega µ cuando se trata
del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata
del promedio de la muestra.
Media Aritmética.
Media aritmética
La media aritmética es el valor alrededor del cual se encuentran los datos de una
lista.
La media aritmética o promedio simple (X) muestra el valor central de los datos
constituyendo ser la medida de ubicación que más se utiliza. En general, es
calculada sumando los valores de interés y dividiendo entre el número de valores
sumados.
La media ponderada es una medida muy útil cuando se quiere calcular un valor
medio y se quiere otorgar mayor importancia a alguno o algunos de los valores
que intervienen. A continuación, veremos algunos ejemplos donde se calcula la
media ponderada.
Mediana.
La mediana.
Solo tiene validez práctica cuando se le aplica a variables que estén medidas en
escala métrica u ordinal.
Siempre es única.
Puede ser hallada con un mínimo de cálculos siendo apropiada para muestras
pequeñas.
En la práctica se puede utilizar por ejemplo para determinar el valor central de las
notas de Matemática de los 30 alumnos de un grupo o el valor central de la
cantidad de pasajeros transportados por un ómnibus en los recorridos que hizo en
un día.
Moda – Propiedades.
La moda
En una muestra de tamaño N, la moda, si existe, es el dato o los datos, que tienen
mayor frecuencia absoluta.
De lo anterior se infiere que en una muestra para que haya moda, tiene que existir
por lo menos un dato que se repita una cantidad de veces mayor que la que
aparecen los demás. Por tanto, en una muestra la moda puede o no existir, y si
existe puede ser única o no. Se puede calcular para cualquier escala de medición
de la variable que se estudia.
En ocasiones una lista de datos puede tener más de una moda, cuando son varios
los datos que más se repiten (y se repiten la misma cantidad de veces).
Esta medida de tendencia central es también usualmente empleada para estudiar
situaciones de la vida práctica. Es muy útil cuando los datos son cualitativos, pues
no depende de cálculos con ellos.
Se señala que puede no existir y que no es una función algebraica de los valores
individuales de la serie, por lo que puede oscilar mucho de una muestra a otra.
Por ejemplo, la moda se utiliza para indicar el número más frecuente de veces que
un árbitro muestra tarjeta amarilla a un jugador en un partido de voleibol para
penalizar sus faltas, para indicar la nota más frecuente que un grupo de alumnos
obtuvo en la prueba de Matemática, para identificar el horario preferido por los
pobladores de una ciudad en una encuesta sobre el tránsito de una línea de
ómnibus.
Folks, Leroy. Ideas of Statistics. Nueva York: John Wiley & Sons, 1981.
https://economipedia.com/definiciones/estadistica.html#:~:text=La%20estad
%C3%ADstica%20es%20una%20disciplina,y%20predicciones%20sobre%20fen
%C3%B3menos%20observados.
https://matemovil.com/poblacion-y-muestra-ejemplos-y-ejercicios/#:~:text=Poblaci
%C3%B3n%20finita%3A%20es%20aquella%20cuya,fabricados%20en%20un
%20proceso%20continuo.
https://onebigpoint.com/que-se-entiende-por-una-poblaci%C3%B3n-homog
%C3%A9nea
https://es.wikipedia.org/wiki/Poblaci%C3%B3n_estad%C3%ADstica
http://descargas.pntic.mec.es/cedec/mat3_2/contenidos/M3_U10/
tipos_de_datos.html#:~:text=Las%20variables%20estad%C3%ADsticas
%20pueden%20ser,cuyo%20resulta
https://promocionmusical.es/marketing/datos-cuantitativos-cualitativos
https://sites.google.com/site/ticsdestadistica/introduccion-a-la-estadistica?tmpl=
%2Fsystem%2Fapp%2Ftemplates%2Fprint
%2F&showPrintDialog=1#:~:text=Formas%20de%20O
https://ccp.ucr.ac.cr/cursos/epidistancia/contenido/2_epidemiologia.htm
https://www.cibertlan.net/estadistica/notas/once.htm#:~:text=REPRESENTACI
%C3%93N%20TABULAR&text=Una%20tabla%20es%20acomodar%20los,se
%20aplicaron%20a%20los%20datos.
http://estadisticazis506.blogspot.com/2015/09/partes-de-una-tabla-estadistica.html
https://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt12.html
https://www.cuvsi.com/2015/04/representaciones-graficas-de-datos.html
https://www.monografias.com/trabajos109/moda-media-y-mediana/moda-media-y-
mediana