Está en la página 1de 32

Universidad Nacional Experimental

De los Llanos Occidentales


Ezequiel Zamora
UNELLEZ

CONCEPTOS BASICOS CONCEPTUALES GENERALES DE ESTADISTICA


DESCRIPTIVA

Prof. Bachiller:

Junio 2022
CONCEPTOS BASICOS CONCEPTUALES GENERALES DE ESTADISTICA
DESCRIPTIVA

1. Estadística – Concepto.

Es una disciplina científica que se ocupa de la obtención, orden y análisis de un


conjunto de datos con el fin de obtener explicaciones y predicciones sobre
fenómenos observados.

La estadística se refiere a un conjunto de métodos para manejar la obtención,


presentación y análisis de observaciones numéricas. Sus objetivos son describir el
conjunto de datos obtenidos y tomar decisiones o realizar generalizaciones acerca
de las características de todas las posibles observaciones bajo consideración.

2. Población:
Grupo de individuos que presenta o podría presentar un rasgo característico
común que se desea investigar.
2.1.- Finita.
Es aquella cuya cantidad de elementos es posible de determinar. Ejemplo:
conjunto de librerías de la ciudad de Lima.
2.2.- Infinita.
Es aquella cuya cantidad de elementos es imposible de determinar. Ejemplo:
conjunto de lápices fabricados en un proceso continuo.
2.3.- Homogénea.
Conjunto total de individuos fenotípicamente iguales, pudiendo referirse a una
población homogénea y homocigótica (líneas puras); o bien, a una población
homogénea y heterocigótica (híbridos).
La noción de homogeneidad define a la igualdad mayor o menor de los valores de
una variable o de una combinación de características en un conjunto geográfico.
Los parámetros de dispersión estadística, en particular la varianza, miden su
inversa, la heterogeneidad.

2.4.- Heterogénea.
De composición no uniforme, que está formado por elementos desiguales, de
distinta naturaleza, diferentes entre sí.

2.5.- Subpoblación.
Un subconjunto de una población que comparte una o más propiedades
adicionales se denomina subpoblación. Por ejemplo, si la población es toda
egipcia, una subpoblación son todos hombres egipcios; si la población son todas
las farmacias del mundo, una subpoblación son todas las farmacias de Egipto. Por
el contrario, una muestra es un subconjunto de una población que no se elige para
compartir ninguna propiedad adicional.

3.1.- Variables Cualitativas – Variables Cuantitativas.

Las variables estadísticas pueden ser de dos tipos:

Cualitativas: son aquellas en la que los resultados posibles no son valores


numéricos. Por ejemplo: color del pelo, tipo de ropa preferida, lugar de veraneo,
etc.
Cuantitativas: aquellas cuyo resultado es un número. A su vez, las hay de dos
tipos:
Cuantitativas discretas: cuando se toman valores aislados. Por ejemplo: número
de amigos de tu pandilla, número de veces que vas al cine al mes, número de
coches que tiene tu familia.
Cuantitativas continuas: cuando, entre dos valores cualesquiera, puede haber
valores intermedios. Es decir, se toman todos los valores de un determinado
intervalo. Por ejemplo: peso de las personas, nivel sobre el mar en que se
encuentra tu ciudad, medida del perímetro torácico.

3.2.- Datos Cualitativas – Datos Cuantitativas.

Los datos cuantitativos pueden ser contados, medidos o expresados utilizando


números.
Los datos cualitativos son descriptivos y conceptuales. Este tipo de datos puede
ser categorizados basándose en las características y rasgos.

Ahora que ya hemos hablado de las diferencias podemos profundizar en cada tipo
de dato usando ejemplos del mundo real.

Los datos cualitativos no son estadísticos, y típicamente son no-estructurados


o semi-estructurados. Estos datos no son necesariamente medidos utilizando
números específicos usados para desarrollar gráficas y tablas. En vez de eso, son
categorizados en base a las propiedades, atributos, etiquetas y otros
identificadores que se pudieran encontrar.

4. Niveles y Escalas de Medición – Tipos.

Una escala de medición es el conjunto de los posibles valores que una cierta
variable puede tomar. Es un continuo de valores ordenados correlativamente, que
admite un punto inicial y otro final. El nivel en que una variable puede ser medida
determina las propiedades de medición de una variable, el tipo de operaciones
matemáticas que puede usarse apropiadamente con dicho nivel, las fórmulas y
procedimientos estadísticos que se utilizan para el análisis de datos y la prueba de
hipótesis teóricas.

Las escalas o niveles de medición se utilizan para medir variables o atributos. Por
lo general, se distinguen cuatro escalas o niveles de medición: nominal, ordinal,
intervalos y escalas de proporción, cociente o razón. Las dos primeras (nominal y
ordinal) se conocen como escalas categóricas, y las dos últimas (intervalo y razón)
como escalas numéricas. Las escalas categóricas se usan comúnmente para
variables cualitativas, mientras que las numéricas son adecuadas para la medición
de variables cuantitativas.

Escala nominal
Es la escala más elemental y la forma más rudimentaria de medir.
En una escala como estas se clasifica a las unidades de estudio (objetos
personas, etc.) en categorías, basándose en una o más características, atributos o
propiedades distintivas y observadas, dándole a cada categoría un nombre (de ahí
lo de «nominal»).
Escala ordinal
Una escala de medición ordinal se logra cuando las observaciones pueden
colocarse en un orden relativo con respecto a la característica que se evalúa, es
decir, las categorías de datos están clasificadas u ordenadas de acuerdo con la
característica especial que poseen. Aquí, las etiquetas o símbolos de las
categorías sí indican jerarquía.

Escala de intervalos
Las escalas de intervalo o cardinales son más refinadas puesto que además del
orden o jerarquía entre categorías, las etiquetas o números consecutivos
establecen intervalos iguales en la medición (las distancias entre categorías son
las mismas a lo largo de toda la escala).

Escala de proporción o razón


Llamadas también escalas de cocientes. Estas escalas tienen las propiedades de
las ordinales y de intervalo (intervalos iguales entre categorías y aplicación de las
operaciones aritméticas básicas y sus derivaciones), pero, además, el cero es
real, es absoluto, no es arbitrario.

5. Formas de observar la población.

Formas de Observar la Población, Atendiendo a la fuente se clasifican en directa o


indirecta: Observación Directa. Cuando se trabaja directamente con los
elementos que se pretende investigar, y los resultados obtenidos se consideran
datos estadísticos originales. Y Observación Indirecta. Cuando se hace uso de
datos estadísticos ya conocidos en una investigación anterior, o de datos
observados por un tercero. Con el fin de deducir otros hechos o fenómenos.

5.1. Muestra.

Se llama muestra a una parte de la población a estudiar que sirve para


representarla. Una muestra debe ser definida en base de la población
determinada, y las conclusiones que se obtengan de dicha muestra solo podrán
referirse a la población en referencia. Subconjunto que seleccionamos de la
población.
 

5.2. Muestreo Aleatorio y Muestreo No Aleatorio.

El muestreo aleatorio es un proceso que permite obtener una muestra sobre una


población, basada en una determinada probabilidad de elección de los individuos
que la conforman.

Con el muestreo aleatorio, por tanto, lo que hacemos es plantear un método de


elección. Un método que tiene en cuenta diferentes probabilidades. Esto lo
diferencia de los métodos no aleatorios en que es la subjetividad del investigador
la que decide la selección de la muestra.

Muestreo No Aleatorio. se utiliza donde no es posible extraer un muestreo de


probabilidad aleatorio debido a consideraciones de tiempo o costo.

El muestreo no probabilístico es un método menos estricto, este método de


muestreo depende en gran medida de la experiencia de los investigadores. El
muestreo no probabilístico comúnmente se lleva a cabo mediante métodos de
observación, y se utiliza ampliamente en la investigación cualitativa.

6. Diseños Muestrales para el Muestreo Aleatorio – Tipos.

Tipos de muestreo aleatorio

Existen varios tipos de muestreo aleatorio en función de las características


poblacionales.

Veamos los más relevantes:

 Muestreo aleatorio simple: Es uno de los más utilizados. Consiste en asignar un


número aleatorio a la población y, luego, a partir de este, escoger la muestra. Es
muy útil en poblaciones con cierta homogeneidad. Por ejemplo, es muy utilizado
en geología.

 Muestreo estratificado: En este caso, estamos ante una población que, si bien
es heterogénea, se puede separar en grupos homogéneos (sexo, edad, etc.). En
cada grupo se realiza una muestra aleatoria simple. Es muy utilizado en ciencias
sociales, como la psicología.

 Muestreo por conglomerados: En este caso, el objetivo es crear una serie de


bloques o conglomerados. Estos son elegidos al azar de entre toda la población.
En este caso, existe una heterogeneidad dentro de ellos, así como una
homogeneidad fuera. Las investigaciones de mercado suelen usar este muestreo
aleatorio.

 Muestreo sistemático: En este caso, se divide el número de individuos de la


población entre los de la muestra que queremos obtener. Después, escogemos
uno al azar y vamos contando, utilizando ese valor. Los sujetos elegidos serán los
que correspondan a ese recuento. Este tipo reduce el problema
de autocorrelación.

7. Diseños Muestrales para el Muestreo No Aleatorio – Tipos.

Muestreo por conveniencia.

El muestreo por conveniencia es una técnica de muestreo no probabilística donde


las muestras de la población se seleccionan solo porque están convenientemente
disponibles para el investigador. Estas muestras se seleccionan solo porque son
fáciles de reclutar y porque el investigador no consideró seleccionar una muestra
que represente a toda la población.

Idealmente, en la investigación, es bueno analizar muestras que representen a la


población. Pero, en algunas investigaciones, la población es demasiado grande
para evaluar y considerar a toda la población.
Esta es una de las razones por las que los investigadores confían en el  muestreo
por conveniencia, que es la técnica de muestreo no probabilística más común,
debido a su velocidad, costo-efectividad y facilidad de disponibilidad de la muestra.

Un ejemplo de muestreo por conveniencia sería utilizar a estudiantes voluntarios


que sean conocidos del investigador. El investigador puede enviar la encuesta a
los estudiantes y ellos en este caso actuarían como muestra.

Muestreo consecutivo.

Esta técnica de muestreo no probabilística es muy similar al muestreo por


conveniencia (con una ligera variación). En el muestreo consecutivo el
investigador elige una sola persona o un grupo de muestra, realiza una
investigación durante un periodo de tiempo, analiza los resultados y luego pasa a
otra asignatura o grupo de sujetos si es necesario.

Esta técnica de muestreo le da al investigador la oportunidad de trabajar con


muchos temas y afinar su investigación mediante la recopilación de resultados que
tienen conocimientos vitales.

Muestreo por cuotas.

Hipotéticamente, supongamos que un investigador desea estudiar los


objetivos profesionales de los empleados de una organización. En esta
organización trabajan 500 empleados y estos son conocidos en conjunto como
“población”.

Para comprender mejor una población, el investigador solo necesitará una


muestra, no a toda la población. Además, el investigador está interesado en
estratos particulares dentro de la población. Es aquí donde el muestreo por
cuotas ayuda a dividir la población en estratos o grupos.

Para estudiar los objetivos de más de 500 empleados, técnicamente la muestra


seleccionada debe tener un número proporcional de hombres y mujeres. Lo que
significa que debe haber 250 hombres y 250 mujeres. Como esto es improbable,
los grupos o estratos se seleccionan mediante el muestreo por cuotas

Muestreo intencional o por juicio.

En esta técnica de muestreo no probabilístico, las muestras se seleccionan


basándose únicamente en el conocimiento y la credibilidad del investigador. En
otras palabras, los investigadores eligen solo a aquellos que estos creen que son
los adecuados (con respecto a los atributos y la representación de una población)
para participar en un estudio de investigación.

La desventaja del muestreo intencional es que los resultados pueden estar


influenciados por nociones percibidas del investigador. Por lo tanto, hay una gran
cantidad de ambigüedad involucrada en esta técnica de investigación. Por
ejemplo, este tipo de método de muestreo se puede utilizar en estudios piloto.

Conoce más del también llamado muestreo deliberado, crítico o por juicio.

  Muestreo de bola de nieve.


Este tipo de técnica de muestreo ayuda a los investigadores a encontrar muestras
cuando son difíciles de localizar. Los investigadores utilizan esta técnica cuando el
tamaño de la muestra es pequeño y no está disponible fácilmente.

Este sistema de muestreo bola de nieve funciona como el programa de referencia.


Una vez que los investigadores encuentran sujetos adecuados, se les pide a estos
ayudas para buscar a sujetos similares y así poder formar una muestra de buen
tamaño.
Por ejemplo, este tipo de muestreo se puede utilizar para realizar investigaciones
que involucran una enfermedad particular en pacientes o tal vez una enfermedad
rara también. Los investigadores pueden buscar ayuda de las personas enfermas
para que estos refieran a otros que sufran de la misma dolencia y con esto formar
una muestra subjetiva para llevar a cabo el estudio.

8. Parámetros y Estadígrafos.

El parámetro es una medida fija que describe la población objetivo. La estadística


es una variable y un número conocido que depende de la muestra de la población,
mientras que el parámetro es un valor numérico fijo y desconocido.

Un estadígrafo o llamado también estadístico es el resumen de los elementos de


una muestra, son las medidas descriptivas inherentes a una muestra, las cuales
pueden usarse como estimación del parámetro.

9. Pasos de la Investigación Estadística.

Dependiendo del manual visitado o del autor, podríamos ver diferentes etapas con
diferentes nombres. En esencia, casi todos los documentos sobre el tema recogen
los mismos apartados, solo que unos engloban varias fases en una y otros
fragmentan más el proceso.

En nuestro caso, consideramos que el proceso estadístico está formado por:

Planteamiento del problema

En el planteamiento del problema se sitúa el eje central sobre el que articular todo
lo demás. Esta fase responde a la siguiente pregunta: ¿Qué necesito estudiar y
por qué? En ocasiones, por increíble que parezca plantear el problema puede
hacernos llegar a la conclusión de que en realidad no necesitamos realizar un
estudio estadístico.

Recogida de datos
Una vez hemos planteado el problema debemos recoger los datos. Aquí es
importante la metodología. De tal modo que existen diferentes consideraciones.
Así pues, debemos establecer el tipo de muestreo, el tamaño de la muestra, el tipo
de recolección de datos (por ejemplo, a través de bases de datos o de encuestas
personalizadas), en persona, por internet o por teléfono, etc.

Análisis de los datos

Una vez planteado el problema, recolectados los datos y organizados podemos


analizarlos de forma eficaz. Dependiendo del planteamiento del problema, se
realizará un tipo de análisis u otro. Por ejemplo, si queremos saber si dos variables
son dependientes, podríamos utilizar un análisis de cointegración. Mientras que
si lo que queremos estudiar es la dispersión total de un activo financiero,
calcularemos el rango estadístico.

Interpretación de los datos

Por último, pero no por ello menos importante, tenemos la interpretación de los
datos. De nada sirve realizar todas las fases del proceso estadístico
correctamente si al final la interpretación es errónea. Esto es debido a que si la
interpretación es errónea, entonces las decisiones tendrá un efecto no deseado.
Por ejemplo, imaginemos que realizamos un estudio sobre la variabilidad de las
ventas de una empresa. Si una vez obtenemos los resultados resulta que hay
mucha dispersión, conviene reducirla y nosotros interpretamos que no, esto podría
afectar negativamente a la empresa.

Los cinco pasos quedan reflejados en el siguiente esquema:


10. Métodos de Recopilación de Datos en Estadística.

Hay muchas maneras de recolectar información en una investigación. El método


elegido por el investigador depende de la pregunta de investigación que se
formule. Algunos métodos de recolección de información incluyen encuestas,
entrevistas, pruebas, evaluaciones fisiológicas, observaciones, revisión de
registros existentes y muestras biológicas.

Encuesta

Una encuesta es una serie de preguntas dirigidas a los participantes en la


investigación. Las encuestas pueden ser administradas en persona, por correo,
teléfono o electrónicamente (como correo electrónico o en Internet). También
pueden administrarse a un individuo o a un grupo. Las encuestas son utilizadas
para tener información sobre muchas personas y pueden incluir opciónó múltiple o
preguntas abiertas (como información demográfica, salud, conocimiento,
opiniones, creencias, actitudes o habilidades).

Entrevista

Una entrevista es una interacción que involucra al investigador y a un(os)


participante(s) en que las preguntas se formulan en persona, por teléfono o incluso
de manera electrónica (correo electrónico o Internet). Durante una entrevista, se
hacen preguntas para obtener información detallada sobre el participante acerca
del tema de estudio. Las preguntas pueden ser similares a las formuladas en una
encuesta.

Prueba

Una prueba es una forma o una tarea física o mental para la cual se ha
determinado un estándar normal, o para la cual se conoce las respuestas
correctas. El desempeño de un participante en una prueba es comparado contra
estos estándares y/o respuestas correctas. Las pruebas son usadas en la
investigación para determinar la aptitud, habilidad, conocimiento, estado de salud
física o mental del participante en comparación a la población en general. Las
pruebas pueden ser administradas en persona, por escrito o por un medio
electrónico. Un ejemplo de esto serían los estudiantes haciendo pruebas
estandarizadas de desempeño académico (como el SAT, MCAT o GRE).

Evaluaciones Fisiológicas

Las evaluaciones fisiológicas son medidas en que las características físicas de un


participante son registradas, como la presión arterial, ritmo cardíaco o fortaleza
física. En una investigación relacionada con la salud, la evaluación fisiológica
puede utilizarse para determinar el estado de salud de un participante antes,
durante o después de ser parte en un estudio. Un ejemplo sería hacer que las
personas de la tercera edad se toquen los dedos de los pies para evaluar su
flexibilidad y alcance.

Observaciones

Las observaciones son registros tomados que no requieren participación. Estos


registros se hacen mientras los participantes están involucrados en conductas
rutinarias y se utilizan como un indicador de lo que los participantes hacen, en
lugar de apoyarse completamente en los relatos de participantes sobre su propia
conducta. Un ejemplo sería un investigador observando los planes educativos
usados en un aula por un maestro de escuela pública.

Revisión de Registros

La revisión de registros tiene lugar cuando un investigador examina y extrae


información de documentos que contienen datos sobre el participante. Los
registros revisados en una investigación pueden ser públicos o privados. Ejemplo
de ello es un investigador recolectando información acerca de un padecimiento a
partir de los historiales médicos de los pacientes.

Muestras Biológicas

Las muestras biológicas son substancias (sangre, orina, saliva) que son tomadas
de una persona y se utilizan para medir información fisiológica. Un ejemplo sería
hacer un examen de sangre para determinar el contenido de azúcar en un
paciente diabético.

Cualquier tipo de información recaudada para un estudio o de la forma en que esta


se recolecte, es extremadamente importante realizar la recaudación de
información con precisión (confiabilidad), exactitud (validez) y un mínimo de
errores. La integridad y utilidad de la investigación se verá mermada (disminuida)
si las mediciones del estudio no son correctas.

11.Medidas Relativas:

Las unidades relativas, a diferencia de las absolutas, no están completamente


definidas, ya que su valor siempre está referenciado respecto a otro valor. A
pesar de su aparente dificultad, son las más utilizadas en el diseño web por la
flexibilidad con la que se adaptan a los diferentes medios.

11.1. Razón.

Razón es el cociente de dos variables, los valores del numerador y del


denominador son independientes, ninguno está contenido en el otro.

Ejemplos de razón:

Razón de masculinidad

11.2. Proporción.

Proporción es el cociente de dos variables, el numerador está contenido en el


denominador.

Proporción de establecimientos que tienen insumos del total de establecimientos


visitados

11.3. Porcentaje.

El porcentaje es un símbolo matemático, que representa una cantidad dada como


una fracción en 100 partes iguales. También se le llama comúnmente tanto por
ciento donde por ciento significa «de cada cien unidades». Se usa para definir
relaciones entre dos cantidades, de forma que el tanto por ciento de una cantidad,
donde tanto es un número, se refiere a la parte proporcional a ese número de
unidades de cada cien de esa cantidad.
El porcentaje se denota utilizando el símbolo «%», que matemáticamente equivale
al factor 0,01 y que se debe escribir después del número al que se refiere, dejando
un espacio de separación.12 Por ejemplo, «treinta y dos por ciento» se representa
mediante 32 % y significa ‘treinta y dos de cada cien’. También puede ser
representado:

y, operando:

El 32 % de 2000, significa la parte proporcional a 32 unidades de cada 100 de


esas 2000, es decir:640 unidades en total.

El porcentaje se usa para comparar una fracción (que indica la relación entre dos
cantidades) con otra, expresándolas mediante porcentajes para usar 100 como
denominador común. Por ejemplo, si en un país hay 500 000 enfermos de gripe de
un total de 10 millones de personas, y en otro hay 150 000 enfermos de un total de
un millón de personas, resulta más claro expresar que en el primer país hay un
5 % de personas con gripe, y en el segundo hay un 15 %, resultando una
proporción mayor en el segundo país.

11.4. Tasa

Tasa es un tipo de proporción que toma en cuenta la variable tiempo. Es la


medida que expresa la dinámica de los eventos. Es la magnitud del cambio de la
variable que mide un evento por unidad de cambio de otra (el tiempo) en relación
con el tamaño de la población que se encuentra en riesgo de presentar el evento.

Las tasas brutas son calculadas para toda la población. Las tasas específicas se
calculan para un subgrupo específico que está en riesgo de presentar el evento.
Puede haber tasas por edad, sexo, raza, ocupación y así sucesivamente. En la
práctica, es más preciso denominarla razón y no tasa.
Ejemplo: tasa general de fecundidad relaciona el número de nacimientos con el de
mujeres de 15 a 44 años de edad (edad fértil), dando una visión de cuantos niños
están naciendo por cada mil mujeres capaces de procrear

12. Representación Tabular de los datos:

La representación tabular es una de las formas mediante las cuales se puede


representar una serie de datos para su interpretación y análisis. El objetivo es
generar una tabla que contenga la información de los datos obtenidos en la
muestra y poder determinar algunos valores de importancia para su
procesamiento posterior.

13. Tabulación- Concepto

La tabulación de datos es, en estadística, el conjunto de operaciones que


permiten presentarlos agrupados y, a su vez, en forma de gráficos o tablas. Por
tanto, es un proceso mediante el que agrupamos los datos y los mostramos
mediante gráficos o tablas para entenderlos mejor.

14. Partes de principales de una Tabla Estadística.

TABLAS ESTADÍSTICAS
Efectuando la clasificación de los datos, es necesario representarlos de manera
clara, sintética y significativa para su mejor y fácil entendimiento. La tabla juega el
papel fundamental pues es la base de la construcción del gráfico y del análisis
estadístico.
La tabla o cuadro estadístico consta de tres partes que reciben nombres que
anuncian la peculiaridad fundamental de su estructura que son: cabeza, cuerpo y
pie.
Cabeza o Encabezamiento
Es la parte superior de la tabla que contiene el título que expresa clara y
concisamente el contenido o significado de la información l periodo es el espacio
de tiempo para el cual validada la información: la unidad de medida siempre y
cuando sea común a toda la información.

Cuerpo
Este localizado en la parte central de la tabla y en él se encuentra la esencia
misma de la información, es decir, las categorías de las variables y sus
correspondientes frecuencias.

Pie
Lo forma la parte inferior de la tabla, que está destinado a las notas o aclaraciones
indicadas en el encabezamiento o en el cuerpo (cuando son necesarios): además
menciona la fuente u origen de la información.

15. Tipos de Tablas Estadísticas.

Las tablas estadísticas según el número de observaciones y según el recorrido de


la variable estadística, así tenemos los siguientes tipos de tablas estadísticas:
1. Tablas Tipo I
2. Tablas Tipo II
3. Tablas Tipo III

Tablas tipo I:

Cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por


ejemplo, si tenemos una muestra de las edades de 5 personas, por lo que no hay
que hacer nada especial simplemente anotarlas de manera ordenada en filas o
columnas.

Edad de los 5 miembros de una familia:

5, 8, 16, 38, 45.

Tablas tipo II:

Cuando el tamaño de la muestra es grande y el recorrido de la variable es


pequeño, por lo que hay valores de la variable que se repiten. Por ejemplo, si
preguntamos el número de personas activas que hay en 50 familias obtenemos la
siguiente tabla:

Personas Activas en 50 familias

2 1 2 2 1 2 4 2 1 1

2 3 2 1 1 1 3 4 2 2

2 2 1 2 1 1 1 3 2 2

3 2 3 1 2 4 2 1 4 1

1 3 4 3 2 2 2 1 3 3

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo


que precisaremos una tabla en la que resumamos estos datos quedando la
siguiente tabla:
Personas Activas Número de Familias

1 16

2 20

3 9

4 5

Total 50

Tablas tipo III:

Cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo


que será necesario agrupar en intervalos los valores de la variable. Por ejemplo, si
a un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan
encima, nos encontramos con los siguientes datos:

45 115 25 30 17 80 25 268 60 78 159 230 500 120 100


0 2 0 0 5 0 5 5 5 0 0 0

5 180 20 67 50 37 150 205 98 18 125 315 425 560 110


0 5 0 5 0 5 5 0

Evidentemente, la variable estadística tiene un recorrido muy grande, 4998


pesetas, por lo que sí queremos hacer una tabla con estos datos tendremos que
tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir
¿cuántos intervalos queremos? Normalmente se suele trabajar con no más de 10
o 12 intervalos.

Amplitud =4998/10 = 499,8 Por lo que tomaremos intervalos de amplitud 500

Debemos tener en cuenta las siguientes consideraciones:


Tomar pocos intervalos implica que la "pérdida de información" sea mayor.

Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la Derecha

[ Li-1, Li)

Procuraremos que en la decisión de intervalos los valores observados no


coincidan con los valores de los extremos del intervalo y si esto ocurre que no sea
en más de un 5% del total de observaciones.

Con estas recomendaciones tendremos la siguiente tabla:

[ Li-1 , Li ) Frecuencia

[ 0,500) 16

[ 500, 1000) 6

[ 1000,1500) 3

[ 1500, 2000) 2

[ 2000, 2500) 1

[ 2500, 3000) 1

[ 3000, 3500) 0

[ 3500, 4000) 0

[ 4000, 4500) 0

[ 4500, 5000) 0

[ 5000,5500) 1

16. Representación Gráfica de los datos.

Las tablas estadísticas representan toda la información de modo esquemático y


están preparadas para los cálculos posteriores. Los gráficos estadísticos nos
transmiten esa información de modo más expresivo, nos van a permitir, con un
sólo golpe de vista, entender de que se nos habla, observar sus características
más importantes, incluso sacar alguna conclusión sobre el comportamiento de la
muestra donde se está realizando el estudio.

Los gráficos estadísticos son muy útiles para comparar distintas tablas de
frecuencia.

Los gráficos estadísticos más usuales son:

DIAGRAMA DE BARRAS.

Se utiliza para la representación de variables cuantitativas discretas, cada valor de


la variable se representa por un punto sobre el eje OX y sobre él se dibuja una
barra de longitud igual o proporcional a su frecuencia absoluta. Si la frecuencia
absoluta que se utiliza es la acumulativa, el diagrama de barras que se obtiene es:
diagrama de barras acumulativo

HISTOGRAMA.

Se utiliza para la representación de variables cuantitativas continuas, cada


intervalo se representa sobre el eje OX , este será la base del rectángulo que se
dibuja sobre él con altura igual o proporcional a su frecuencia absoluta. Como los
intervalos son consecutivos, los rectángulos quedan adosados. Si se utilizarán
rectángulos de amplitud diferente, el área del rectángulo es la que tendría que ser
proporcional a la frecuencia absoluta correspondiente a ese intervalo. Histograma
acumulativo, si se utiliza la frecuencia absoluta acumulativa.

POLÍGONO DE FRECUENCIAS.

Se utilizan para variables estadísticas cuantitativas, discretas o continuas.


Para una variable discreta, el polígono de frecuencias se obtiene uniendo por una
poligonal, los extremos superiores de las barras.

Para una variable continua, el polígono de frecuencias se obtiene uniendo por una
poligonal los puntos medios de la base superior de los polígonos del histograma.

Las escalas utilizadas para representar los polígonos de frecuencias influyen


mucho por el impacto visual de los mismos.

DIAGRAMA DE SECTORES.

Se utiliza para todo tipo de variable estadística, cuantitativa o cualitativa.


Consiste en dibujar sectores sobre un círculo, siendo la amplitud de los sectores
proporcional a su frecuencia absoluta, cada sector se rellena con un color
diferente.

17. Partes principales de una gráfica estadística.

1. Título:

El título debe describir claramente lo que el gráfico ilustra.

2. Las series de datos:

Son los datos relacionados en un gráfico. Si hay varias series de datos en la tabla,
cada una tendrá un color o estilo diferente. Los gráficos circulares sólo pueden
tener una serie de datos.

3. Eje Vertical:

El eje vertical, también conocido como el eje Y, es la parte vertical de la gráfica.

En este ejemplo (un gráfico de columnas), el eje vertical mide la altura, o el valor
de las columnas, por lo que también se llama el eje de valores. Sin embargo, en
un gráfico de barras, el eje horizontal sería el eje de valores.
4. Eje horizontal:

El eje horizontal, también conocido como el eje X, es la parte horizontal de la


gráfica.

En este ejemplo, el eje horizontal identifica las categorías en la tabla, por lo que
también se llama el eje de categorías. Sin embargo, en un gráfico de barras, el eje
vertical sería el eje de categorías.

5. Leyenda:

Identifica el color que representa a cada serie de datos. Para muchos gráficos es
crucial, pero para otros, puede que no sea necesario y se puede eliminar.

En este ejemplo, la leyenda permite al espectador identificar los tipos de libros que
hay en el gráfico.

18. Gráficas Estadísticas para una Variable Cuantitativa – Tipos.

Gráficos de variable cuantitativa.


Los gráficos más utilizados son:
- Diagrama de barras.

Se dibujan un par de ejes cartesianos. En el eje de abscisas se toman los distintos


valores de la variable y en el de ordenadas las frecuencias. Cada valor de la
variable y su correspondiente frecuencia, constituye una pareja de números, a los
que corresponde en el plano un punto, habiendo tantos puntos como valores tome
la variable.

Para dar mayor visibilidad al gráfico se acostumbra a representar la ordenada de


cada punto mediante una línea gruesa o barra, de ahí su nombre.

Como las frecuencias son siempre positivas, el gráfico sólo requiere los
cuadrantes I y II del plano. Habitualmente el gráfico de barras aparece en el primer
cuadrante.
Según se utilicen frecuencias absolutas o frecuencias relativas, se obtendrá el
diagrama de barras absoluto o relativo.

Obtenemos un conjunto de barras verticales cuya suma de longitudes debe ser n


(tamaño de la muestra) o dependiendo de si las frecuencias representadas son
absolutas o relativas.

- Polígono de frecuencias.

Uniendo los extremos superiores de las barras en el diagrama de barras, se


obtiene una línea quebrada abierta que recibe el nombre de polígono de
frecuencias.

Si el polígono se ha construido sobre un diagrama en el que se han utilizado


frecuencias absolutas, lo llamaremos polígono de frecuencias absolutas. Si se
trabajó con frecuencias relativas obtendremos el polígono de frecuencias relativas.
- Diagrama de barras acumulativo.

La representación de las frecuencias acumuladas correspondiente a una variable


discreta, se efectúa de la siguiente manera:

Sobre el eje de abscisas se llevan los valores de la variable y sobre el eje de las
ordenadas, los valores de las frecuencias acumuladas (absolutas o relativas). Se
levantan barras de altura igual a la frecuencia y por el extremo superior de cada
barra se trazan paralelas al eje de abscisas, hasta cortar a la barra siguiente. se
obtiene así una representación escalonada, cuya justificación se debe a que entre
cada dos valores consecutivos de la variable, las frecuencias acumuladas
permanecen invariables. A este gráfico se le conoce como diagrama de barras
acumulativo.

19. Gráficas Estadísticas para Variables Cualitativas – Tipos.

Gráficos de variable cualitativa


Si el resultado de observación de un elemento de la muestra no es una medida,
sino una cualidad o atributo no medible, la variable de estudio es una variable
cualitativa.

Las representaciones gráficas más usuales para variables cualitativas son:

- Diagrama de rectángulos.

Es una representación cartesiana, en la que en el eje de abscisas figuran las


distintas modalidades o atributos y en el eje de ordenadas los valores de las
correspondientes frecuencias, levantando rectángulos de áreas proporcionales a
las frecuencias absolutas. Los rectángulos tendrán de base la unidad y de altura la
frecuencia absoluta de cada valor. Los rectángulos no tienen por qué ir solapados.

- Diagrama de sectores.

Es la representación en un círculo, mediante sectores circulares de las distintas


modalidades de un carácter. Para construirlo, las áreas de los sectores han de ser
proporcionales a las frecuencias de cada modalidad. Para ello hay que hacer
corresponder 360º a la suma de todas las frecuencias, efectuando luego la
correspondiente proporcionalidad.

- Pictograma.

Son una representación gráfica que utiliza un dibujo alusivo a la distribución


estudiada. La altura del dibujo ha de ser proporcional a la frecuencia.

- Perfil ortogonal.

Es una representación utilizada frecuentemente en Pedagogía y Psicología. Se


representan en abscisas las distintas modalidades y en ordenadas los valores de
esas modalidades.

- Cartograma.

Se usan, entre otros, en estudios geográficos y ecológicos. Es una representación


del carácter estudiado sobre mapas. Las distintas modalidades que adopta el
carácter se representan sobre el mapa con distintos colores o colores de distinta
intensidad, o con distintos punteados.
20.Medidas de Tendencia Central:

 Promedio.

Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética
o promedio aritmético. Se representa por la letra griega µ cuando se trata
del promedio del universo o población y por Ȳ (léase Y barra) cuando se trata
del promedio de la muestra.

 Media Aritmética.

Media aritmética

La media aritmética es el valor alrededor del cual se encuentran los datos de una
lista.

Se calcula sumando todos los datos y dividiendo el resultado por el número de


datos. Solo tiene validez práctica cuando se le aplica a variables que estén
medidas en escala métrica.

Se denota por el símbolo y la fórmula para calcularla es:

Esta expresión Xi representa a cada dato o valor de la variable, el signo S significa


la suma de todos los datos y n es la cantidad de datos.

 Media Aritmética Simple y Ponderada.

La media aritmética o promedio simple (X) muestra el valor central de los datos
constituyendo ser la medida de ubicación que más se utiliza. En general, es
calculada sumando los valores de interés y dividiendo entre el número de valores
sumados.

La media ponderada es una medida muy útil cuando se quiere calcular un valor
medio y se quiere otorgar mayor importancia a alguno o algunos de los valores
que intervienen. A continuación, veremos algunos ejemplos donde se calcula la
media ponderada.

 Mediana.

La mediana.

La mediana de una muestra de tamaño N, cuyos datos han sido ordenados


ascendente o descendentemente, es el valor (único) que ocupa el propio centro de
dichos datos.

Por tanto, si el elemento de la muestra cuyo valor es el de la mediana se excluye,


los datos primarios podrán redistribuirse en dos subgrupos, los cuales quedarán
integrados por cantidades iguales de datos.

Solo tiene validez práctica cuando se le aplica a variables que estén medidas en
escala métrica u ordinal.

Para calcular la mediana de una muestra de tamaño N, se deberán seguir los


siguientes pasos:

• Ordenar los datos de modo ascendente o descendente.

• Calcular la posición que ocupa la mediana: si N es impar, la mediana ocupa la


posición (N +1) / 2 de los datos; en cambio sí N es par, entonces la mediana se
encuentra entre los datos que ocupan las posiciones N/ 2 y (N /2) +1.
• Dentro de la muestra ordenada localizar el dato o los datos que ocupan la
posición o posiciones calculadas en el paso 3.

En el momento de realizar la interpretación de la mediana se deberá tener mucho


cuidado, ya que en ocasiones esta coincide con algunos de los datos primarios y
en otras no. Puede señalarse que:

La mediana siempre existe y puede ser determinada para cualquier grupo de


datos, sean ordinales o numéricos (no para datos nominales).

Siempre es única.

Puede ser hallada con un mínimo de cálculos siendo apropiada para muestras
pequeñas.

No es fácilmente afectada por valores extremos.

En la práctica se puede utilizar por ejemplo para determinar el valor central de las
notas de Matemática de los 30 alumnos de un grupo o el valor central de la
cantidad de pasajeros transportados por un ómnibus en los recorridos que hizo en
un día.

 Moda – Propiedades.

La moda

En una muestra de tamaño N, la moda, si existe, es el dato o los datos, que tienen
mayor frecuencia absoluta.

De lo anterior se infiere que en una muestra para que haya moda, tiene que existir
por lo menos un dato que se repita una cantidad de veces mayor que la que
aparecen los demás. Por tanto, en una muestra la moda puede o no existir, y si
existe puede ser única o no. Se puede calcular para cualquier escala de medición
de la variable que se estudia.

Para denotar la moda de una variable X, se usará la notación Mo.

En ocasiones una lista de datos puede tener más de una moda, cuando son varios
los datos que más se repiten (y se repiten la misma cantidad de veces).
Esta medida de tendencia central es también usualmente empleada para estudiar
situaciones de la vida práctica. Es muy útil cuando los datos son cualitativos, pues
no depende de cálculos con ellos.

Puede ser usada para cualquier tipo de datos, es fácil de determinar.

Se señala que puede no existir y que no es una función algebraica de los valores
individuales de la serie, por lo que puede oscilar mucho de una muestra a otra.

Por ejemplo, la moda se utiliza para indicar el número más frecuente de veces que
un árbitro muestra tarjeta amarilla a un jugador en un partido de voleibol para
penalizar sus faltas, para indicar la nota más frecuente que un grupo de alumnos
obtuvo en la prueba de Matemática, para identificar el horario preferido por los
pobladores de una ciudad en una encuesta sobre el tránsito de una línea de
ómnibus.

Bibliografía (Libros y direcciones web consultados)


Downie, Norville M. Métodos estadísticos aplicados. Nueva York: Harper & Row,
1986.

Folks, Leroy. Ideas of Statistics. Nueva York: John Wiley & Sons, 1981.

Runyon, Richard y Haber Audrey. Estadística para las ciencias sociales.


México: Addison-Wesley Iberoamericana, 1987.

Triola, Mario. Estadística. México: Pearson, Addison Wesley, 2004.

Cochran, Willian G. Técnicas de Muestreo. Editorial Continental S.A. México,


1972.
Fowler, Newton Enrique. El muestreo Estadístico Aplicado a la Auditoría. Editorial
Macchi. Buenos Aires, 1972.
III Simposio de Estadística. Muestreo. Universidad Nacional de Colombia, 1992
Kimmear, Thomas C; Taylor, James R. Investigación de Mercados. Editorial
McGraw Hill, Colombia, 1999

https://economipedia.com/definiciones/estadistica.html#:~:text=La%20estad
%C3%ADstica%20es%20una%20disciplina,y%20predicciones%20sobre%20fen
%C3%B3menos%20observados.

https://matemovil.com/poblacion-y-muestra-ejemplos-y-ejercicios/#:~:text=Poblaci
%C3%B3n%20finita%3A%20es%20aquella%20cuya,fabricados%20en%20un
%20proceso%20continuo.

https://onebigpoint.com/que-se-entiende-por-una-poblaci%C3%B3n-homog
%C3%A9nea

https://es.wikipedia.org/wiki/Poblaci%C3%B3n_estad%C3%ADstica

http://descargas.pntic.mec.es/cedec/mat3_2/contenidos/M3_U10/
tipos_de_datos.html#:~:text=Las%20variables%20estad%C3%ADsticas
%20pueden%20ser,cuyo%20resulta
https://promocionmusical.es/marketing/datos-cuantitativos-cualitativos
https://sites.google.com/site/ticsdestadistica/introduccion-a-la-estadistica?tmpl=
%2Fsystem%2Fapp%2Ftemplates%2Fprint
%2F&showPrintDialog=1#:~:text=Formas%20de%20O

https://ccp.ucr.ac.cr/cursos/epidistancia/contenido/2_epidemiologia.htm

https://www.cibertlan.net/estadistica/notas/once.htm#:~:text=REPRESENTACI
%C3%93N%20TABULAR&text=Una%20tabla%20es%20acomodar%20los,se
%20aplicaron%20a%20los%20datos.

http://estadisticazis506.blogspot.com/2015/09/partes-de-una-tabla-estadistica.html

https://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt12.html

https://www.cuvsi.com/2015/04/representaciones-graficas-de-datos.html

https://www.monografias.com/trabajos109/moda-media-y-mediana/moda-media-y-
mediana

También podría gustarte