Está en la página 1de 13

1.

- Definición:

Estadística:
La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido
recopilados a partir de otros datos numéricos.

Variable:
Son atributos, cualidades, características observables que poseen las personas, objetos, instituciones que expresan magnitudes que varían discretamente
o en forma continua. Ejemplo: son variables de las personas: la edad, sexo, talla, peso, contextura, color del cabello, color de ojos, grado de atención,
conocimientos previos, confesión religiosa, procedencia, clase social, etc.

Atributo:
Son variables que no se pueden cuantificar, o expresar por números.

Muestreo:
Es una herramienta de la investigación científica, cuya función básica es determinar que parte de una población debe examinarse, con la finalidad de
hacer inferencias sobre dicha población.

Muestra:
Es un subconjunto de casos o individuos de una población. En diversas aplicaciones interesa que una muestra sea, representativa y para ello debe
escogerse una técnica de muestra adecuada, que produzca una muestra aleatoria adecuada. También es un subconjunto de la población, y para ser
representativa, debe tener las mismas características de la población.

Población:
Es un conjunto de seres, individuos, objetos , elementos o eventos con determinadas características. A menudo se obtiene una muestra de dicha
población, es decir, un subconjunto representativo.

Censo:
Se denomina censo al recuento de individuos que conforman una población estadística, definida como un conjunto de elementos de referencia sobre el
que se realizan las observaciones.

2.- Tipos de Estadísticas.

 Estadística matemática

Es un formato de estadística en el que existe el trabajo formal de los datos mediante la teoría que más se ajuste a las necesidades del objeto de estudio.
Dichas teorías tienen que ver con el tema de la probabilidad y otras áreas de la matemática.

 Estadista inferencial o inductiva

Se trabaja a través del manejo de una serie de datos que se obtienen en una muestra predeterminada, con la finalidad específica de obtener una serie de
predicciones que permitan fundamentar las conclusiones a las que se ha llegado en el objeto de estudio.

 Estadística descriptiva o deductiva

Es un tipo de estadística que se emplea con la finalidad de poder analizar y describir una serie de conjuntos de tipo numérico, tales series numéricas
buscan representar diversos niveles de fenómenos para el mejor manejo de su análisis. En este tipo de estadística no es muy factible llegar a
conclusiones definitivas.

 Estadística aplicada

En este caso nos encontramos con dos tipos de estadística, una llamada descriptiva o deductiva y otra conocida como diferencial o inductiva.

Para poder delimitar la población que será objeto de estudio, se recurre a una serie de elementos que se consideran “estimadores”. Este tipo de recursos
de estudios son empleados en áreas del conocimiento como la medicina, historia, psicología y sociología.
3.- Tipos de Variables:

 Variables cualitativas

Se considera como variable cualitativa toda aquella variable que permiten la expresión e identificación de una característica concreta, pero que no
permiten cuantificarlas. Este tipo de variable únicamente nos informaría de la existencia o inexistencia de dicha característica o la presencia de
alternativas. Son meramente nominales, expresando igualdad y/o desigualdad. El sexo o la nacionalidad serían ejemplos de ello. Sin embargo, ello no
quiere decir que no puedan observarse o que no resulten elementos altamente relevantes en la investigación.

 Variables cuasi-cuantitativas

Se trata de aquellas variables con las que no es posible realizar operaciones matemáticas, pero que resultan más avanzadas que las meramente
cualitativas. Expresan una cualidad y a la vez permiten organizarla y establecer un orden o jerarquía, aunque no de manera exacta.
Un ejemplo de ello es el nivel de estudios, pudiendo determinar si alguien tiene más o menos de dicha cualidad.
Sin embargo, no existe una constancia en las diferencias entre una categoría y la que la precede y la que la sigue (una persona que tiene estudios
de posgrado no sabe más que una con licenciatura de la misma manera en la que una con estudios secundarios sabe más que otra que solo tiene la
primaria).

 Variables cuantitativas

Las variables cuantitativas son todas aquellas que, este vez sí, permiten la operativización de sus valores. Es posible asignar diferentes números a los
valores de la variable, pudiendo realizar diferentes procedimientos matemáticos con ellos de tal manera que se pueden establecer distintas relaciones
entre sus valores.
En este tipo de variables podemos encontrar dos grandes grupos de gran relevancia, las variables continuas y discretas.

 Variables independientes

Se entienden por variables independientes a aquellas variables que en el momento de la investigación se tienen en cuenta y que pueden o no ser
posibles de modificar por parte del experimentador. Es la variable de la cual se parte para observar los efectos que determina cualidad,
característica o situación puede tener sobre diferentes elementos. El sexo, la edad o el nivel de ansiedad base son ejemplos de variable independiente.

 Variables dependientes

La variable dependiente hace referencia al elemento que resulta modificado por la variación existente en la variable independiente. En la investigación, la
variable dependiente va a ser escogida y generada a partir de la independiente. Por ejemplo, si medimos el nivel de ansiedad según el sexo, sexo
será variable independiente cuya modificación va a generar alteraciones en la dependiente, en este caso la ansiedad.

 Variables moderadoras

Entendemos por variables moderadoras al conjunto de variables que alteran la relación existente entre variable dependiente e independiente.
Ejemplo de ello se da si relacionamos horas de estudio con resultados académicos, siendo variables moderadoras el estado emocional o la capacidad
intelectual.

 Variables extrañas

Esta etiqueta hace referencia a todas aquellas variables que no se han tenido en cuenta pero que tienen un efecto sobre los resultados obtenidos.
Así pues, son todo aquel conjunto de variables no controladas y tenidas en cuenta en la situación estudiuada, aunque es posible identificarlas tras ella o
incluso durante un experimento o contexto investigado. Se diferencian de las moderadoras en el hecho de que las extrañas no son tenidas en cuenta, no
siendo este el caso de las moderadoras.
Dicho de otro modo, las variables extrañas son aquellas que pueden llevarnos a conclusiones erróneas al interpretar los resultados de una investigación,
y el impacto de su presencia depende de la calidad del diseño de los estudios realizados para investigar algo.

 Variable nominal

Hablamos de variables nominales cuando los valores que dicha variable puede alcanzar únicamente permiten distinguir la existencia de una cualidad
concreta, sin permitir estos valores realizar una ordenación u operaciones matemáticas con ellos. Se trata de un tipo de variable cualitativa.

 Variable ordinal

Si bien no se puede operar con ellas, es posible establecer una ordenación entre los diferentes valores. Sin embargo, dicho orden no permite el
establecimiento de relaciones matemáticas entre sus valores. Se trata de variables fundamentalmente cualitativas. Ejemplos de ello son el estatus
socioeconómico o el nivel de estudios.

 Variable de intervalo

Además de las características anteriores, las variables en escala de intervalo permiten establecer relaciones numéricas entre las variables, si bien
generalmente dichas relaciones se ven limitadas a la proporcionalidad. No existe un cero absoluto o punto cero totalmente identificable, algo que no
permite realizar transformaciones directas de los valores en otros. Miden rangos, más que valores concretos, algo que complica su operatividad pero que
ayuda a cubrir una gran cantidad de valores.

 Variable de razón

Las variables de razón se miden en una escala tal que es posible su total operativización, pudiendo realizarse diversas transformaciones a los resultados
obtenidos y estableciendo relaciones numéricas complejas entre sí. Existe un punto de origen que supone la ausencia total de lo medido.

4.- Escalas de medición.

 Escala nominal
Cuando un dato identifica una etiqueta (o el nombre de un atributo) de un elemento, se considera que la escala de medición es una escala nominal. En
esta carecen de sentido el orden de las etiquetas, así como la comparación y las operaciones aritméticas. La única finalidad de este tipo de datos es
clasificar a las observaciones.
En esta variable se tienen dos etiquetas para clasificar a los visitantes. El orden carece de sentido, así como la comparación u operaciones aritméticas.

 Escala ordinal
Cuando los datos muestran las propiedades de los datos nominales, pero además tiene sentido el orden (o jerarquía) de estos, se utiliza una escala
ordinal.
En esta variable sigue sin tener sentido las operaciones aritméticas, pero ahora sí tiene sentido el orden. Si un post tiene valor 4 y otro tiene valor 2, el
primero se entiende que es mejor que es segundo.

 Escala de intervalo
En una escala de intervalo, los datos tienen las propiedades de los datos ordinales, pero a su vez la separación entre las variables tiene sentido. Este
tipo de datos siempre es numérico, y el valor cero no indica la ausencia de la propiedad.
En esta escala, los números mayores corresponden a temperaturas mayores. Es decir, el orden importa, pero a la vez la diferencia entre las temperaturas
importa.

 Escala de razón
En una escala de razón, los datos tienen todas las propiedades de los datos de intervalo, y la proporción entre ellos tiene sentido. Para esto se requiere
que el valor cero de la escala indique la ausencia de la propiedad a medir. Ejemplos de este tipo de variables son el peso de una persona al tiempo
utilizado para una tarea.
En esta variable, si una persona gana 100, y otra 10, la primera gana más que la segunda (comparación). También tiene sentido decir que la primera
gana 90 más que la segunda (diferencia), o que gana 10 veces más (proporción).

5.- Pasos de la investigación estadística:

1. Selección y determinación de la población o muestra y las características contenidas que se desean estudiar. En el caso de que se desee tomar
una muestra, es necesario determinar el tamaño de la misma y el tipo de muestreo a realizar (probabilístico o no probabilístico).

2. Obtención de los datos. Esta puede ser realizada mediante la observación directa de los elementos, la aplicación de encuestas y entrevistas, y la
realización de experimentos.

3. Clasificación, tabulación y organización de los datos. La clasificación incluye el tratamiento de los datos considerados anómalos que pueden en un
momento dado, falsear un análisis de los indicadores estadísticos. La tabulación implica el resumen de los datos en tablas y gráficos estadísticos.

4. Análisis descriptivo de los datos. El análisis se complementa con la obtención de indicadores estadísticos como las medidas: de tendencia central,
dispersión, posición y forma.

5. Análisis inferencial de los datos. Se aplican técnicas de tratamiento de datos que involucran elementos probabilísticos que permiten inferir
conclusiones de una muestra hacia la población (opcional).

6. Elaboración de conclusiones. Se construye el informe final.


6.- Tipos de muestreos:

 Muestreo probabilístico
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la
misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y
son, por tanto, los más recomendables.

 Muestreo aleatorio simple


El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro
de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea
necesario para completar el tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande.

 Muestreo aleatorio sistemático


Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae
uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k,
i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra:
k= N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo de muestreo está en los casos en que
se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros
son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres,
no podría haber una representación de los dos sexos.

 Muestreo aleatorio estratificado


Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la
muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se
puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo
es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En
ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población. (Tamaño geográfico, sexos,
edades,...). La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en cada estrato.
Afijación Óptima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se considera la proporción y la desviación típica. Tiene poca
aplicación ya que no se suele conocer la desviación.

 Muestreo aleatorio por conglomerados


Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades
muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que
forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto,
etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando
los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar
aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los
elementos pertenecientes a los conglomerados elegidos.

 Muestreo por cuotas


También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de
los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos
que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Gijón. Una vez determinada la
cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión.

 Muestreo intencional o de conveniencia


Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos
supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de
voto. También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus
propios alumnos).

 Bola de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

 Muestreo Discrecional
A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio.
7.- Estimador:

En estadística, un estimador es un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de la población. Por
ejemplo, si se desea conocer el precio medio de un artículo (el parámetro desconocido) se recogerán observaciones del precio de dicho artículo en
diversos establecimientos (la muestra) y la media aritmética de las observaciones puede utilizarse como estimador del precio medio.
Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que posea mejores propiedades que los
restantes, como insesgadez, eficiencia, convergencia y robustez (consistencia).
El valor de un estimador proporciona lo que se denomina en estadística una estimación puntual del valor del parámetro en estudio. En general, se suele
preferir realizar una estimación mediante un intervalo, esto es, obtener un intervalo [a,b] dentro del cual se espera esté el valor real del parámetro con
un cierto nivel de confianza. Utilizar un intervalo resulta más informativo, al proporcionar información sobre el posible error de estimación, asociado con
la amplitud de dicho intervalo. El nivel de confianza es la probabilidad de que a priori el verdadero valor del parámetro quede contenido en el intervalo.

8.- Parámetro:

En estadística, un parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística. El
cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población.
Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: crear un modelo de la realidad.4
El estudio de una gran cantidad de datos individuales de una población puede ser farragoso e inoperativo, por lo que se hace necesario realizar un
resumen que permita tener una idea global de la población, compararla con otras, comprobar su ajuste a un modelo ideal, realizar estimaciones sobre
datos desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas contribuyen de modo esencial los parámetros estadísticos.

9.- Partes de un gráfico y una tabla estadística:

Partes de un gráfico:

 Título adecuado:

El cual debe ser claro y conciso, que responda a las preguntas: Qué relaciona, cuándo y dónde se hicieron las observaciones.

 El cuerpo:

O gráfico en sí, cuya elección debe considerar el o los tipos variables a relacionar, el público a quien va dirigido y el diseño artístico del gráfico.

 Notas de pie de gráfico:

Donde se presentan aclaraciones respecto al gráfico, las escalas de los ejes, o se otorgan los créditos a las fuentes respectivas.

Partes de una tabla estadística:

 Cabeza o Encabezamiento:
Es la parte superior de la tabla que contiene el título que expresa clara y concisamente el contenido o significado de la información l periodo es el espacio
de tiempo para el cual validada la información: la unidad de medida siempre y cuando sea común a toda la información.

 Cuerpo:
Este localizado en la parte central de la tabla y en él se encuentra la esencia misma de la información, es decir, las categorías de las variables y sus
correspondientes frecuencias.

 Pie:
Lo forma la parte inferior de la tabla, que está destinado a las notas o aclaraciones indicadas en el encabezamiento o en el cuerpo (cuando son
necesarios): además menciona la fuente u origen de la información.
10.- Construcción de tablas e distribución de frecuencias de intervalos [cerrados-cerrados] e intervalos [cerrados-abiertos):

Para elaborar las tablas estadísticas, se debe seguir un procedimiento preciso, el cual consta de:

1. Censo:

Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población. Para Levin & Rubin
(1996) "Algunas veces es posible y práctico examinar a cada persona o elemento de la población que deseamos describir. A esto lo llamamos una
numeración completa o censo. Utilizamos el muestre cuando no es posible contar o medir todos los elementos de la población. Si es posible listar (o
enumerar) y observar cada elemento de la población, los censos se utilizan rara vez porque a menudo su compilación es bastante difícil, consume mucho
tiempo por lo que resulta demasiado costoso.

2. Encuesta:

Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseño de encuestas es exclusivo de
las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y simple es
preguntárselo directamente a ellas. (Cadenas, 1974). Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere averiguar. Se
efectúa a través de cuestionarios verbales o escritos que son aplicados a un gran número de personas".

3. Toma de datos:

Es la obtención de una colección de datos por medio de encuestas, preguntas, sondeos etc. Que no han sido ordenados numéricamente y que dicha
información se extrae al azar, es decir, de tal forma que cada miembro de la población tenga la misma oportunidad de ser elegida o seleccionada.

4. Ordenación de datos:

Es una colocación de los datos numéricos tomados en orden creciente a decreciente de magnitud. La diferencia entre el mayor y el menor de los números
se llama rango o recorrido de datos.

*No. De clases (Regla de Sturges): 1 + 3.332 log N

*Tamaño de clase = Rango / No. De clases

5. Cálculo de tamaño de clase:

Para calcular el tamaño de clase es necesario calcular primeramente el número de clases utilizando la regla de Sturges y despés se obtiene el tamaño de
clase dividiendo el rango entre el número de clases.

6. Límites de clase:

Representan el tamaño de cada clase. El límite inferior de la primer clase toma el valor del dato menor de la colección de datos, para obtener el límite
inferior de la clase siguiente, se suma al límite inferior de la case anterior el tamaño de clase.

7. Límites reales de clase:

Se obtienen sumando al LS de la clase el Lide la clase contigua superior y dividiendo entre dos.

8. Marca de clase:

Es el punto medio de la clase y se obtiene sumando los LI y LS de la clase y dividiendo entre 2. La marca de clase también se llama punto medio de la
clase.

Las distribuciones o tablas de frecuencias permiten resumir los datos en una tabla que recoge:

 Valores de la variable o modalidades del atributo,

 Frecuencia absoluta o número de veces que aparece cada valor o modalidad en la muestra,

 Porcentaje de veces que aparece cada valor de la variable o modalidad del atributo sobre el total de observaciones,

 Porcentaje válido calculado sobre el total de observaciones excluidos los valores missing,
 Porcentaje acumulado hasta cada uno de los valores de la variable ordenados de menor a mayor. Este porcentaje tiene interpretación sólo en los
casos en que la variable sea susceptible de medida por lo menos en una escala ordinal.

11.-Como se construye un polígono de frecuencia, un histograma y una ojiva:

Polígono de Frecuencia:

Un polígono de frecuencias se forma uniendo los extremos de las barras de un diagrama de barras mediante segmentos. También se puede realizar
trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos.

Histograma:

 Se construyen dos ejes.

 En el eje horizontal, o eje de abscisas, se representan los datos o modalidades obtenidos. En nuestro caso: 18, 19, 20, etc.

 En el eje vertical, eje de ordenadas, se representan con números las frecuencias de cada dato o modalidad.

 Sobre el eje horizontal se levantan barras o rectángulos de igual base hasta hasta la altura del valor numérico de la frecuencia de cada modalidad.
En nuestro caso: 18 hasta el 2, 19 hasta el 3, 20 hasta el 14, etc.

 Las barras se trazan una enseguida de la otra.

Ojiva:

 Trazar los ejes de las abscisas (x) y las ordenadas (y).

 En el eje de “x” ubicaremos los límites de clase, y en “y” se elevarán las frecuencias acumuladas menores.

 Marcar en el eje “x” los límites de clase, comenzando por el límite inferior de la posición 1, hasta el límite superior de la última posición.

 Trazar los ejes de “y” considerando las frecuencias absolutas agrupadas menores (pueden ser escalar)

 Realizar las elevaciones, considerando que la Ojiva es un vector, se recomienda ir marcando los puntos, con su respectiva etiqueta por cada dato,
se comienza con el límite inferior de la P1 y se eleva 0 de la Fi agregada en P0, el siguiente intervalo se eleva Fi de la P1 y así sucesivamente.

 Unir los nodos marcados del p

 Colocar título y rótulos de los ejes “y” y “x”

 Calcular la frecuencia relativa hi, su frecuencia relativa acumulada Hi, y la porcentualización de la frecuencia relativa acumulada Pi

 Colocar los porcentajes que le corresponde a cada Fi con respecto de su posición y la Pi

12.- Aplicación de la estadística:

Aunque comúnmente se asocie a estudios demográficos, económicos y sociológicos, gran parte de los logros de la estadística se derivan del interés de
los científicos por desarrollar modelos que expliquen el comportamiento de las propiedades de la materia y de los caracteres biológicos. La medicina, la
biología, la física y, en definitiva, casi todos los campos de las ciencias emplean instrumentos estadísticos de importancia fundamental para el desarrollo
de sus modelos de trabajo.

Campos de aplicación

La estadística es una ciencia de aplicación práctica casi universal en todos los campos científicos:

 En las ciencias naturales: se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física
cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos.

 En las ciencias sociales y económicas: es un pilar básico del desarrollo de la demografía y la sociología aplicada.

 En economía: suministra los valores que ayudan a descubrir interrelaciones entre múltiples parámetros macro y microeconómicos.

 En las ciencias médicas: permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los índices de mortalidad asociados a
procesos morbosos, el grado de eficacia de un medicamento, etcétera.
13.- Medidas de Tendencia Central. Definir cada una de ellas:

 Las medidas de tendencia central:

Son valores que se ubican al centro de un conjunto de datos ordenados según su magnitud. Generalmente se utilizan 4 de estos valores también
conocidos como estadígrafos, la media aritmética, la mediana, la moda y al rango medio.

 La media aritmética:

Es la medida de posición utilizada con más frecuencia. Si se tienen n valores de observaciones, la media aritmética es la suma de todos y cada uno de los
valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extremos, por lo que puede dar una imagen distorsionada
de la información de los datos.

 La Mediana:

Es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados, de esta manera la mitad de las observaciones es menor
que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones extremas.

 La Moda:

Es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores extremos, pero es más variables que la media y la
mediana.

 Rango Medio:

Es la media de las observaciones menor y mayor. Como intervienen solamente estas observaciones, si hay valores extremos, se distorsiona como
medida de posición, pero ofrece un valor adecuado, rápido y sencillo para resumir al conjunto de datos.

14.- Medidas de dispersión. Definir cada una de ellas:

 Medidas de dispersión:

Parámetros estadísticos que indican cómo se alejan los datos respecto de la media aritmética. Sirven como indicador de la variabilidad de los datos. Las
medidas de dispersión más utilizadas son el rango, la desviación estándar y la varianza.

 Rango:

Indica la dispersión entre los valores extremos de una variable. se calcula como la diferencia entre el mayor y el menor valor de la variable. Se denota
como R.

Para datos ordenados se calcula como:

R = x(n) - x(1) Dónde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.

 Desviación media:

Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto a la media.

Dónde:

xi: Valores de la variable. n: Número total de datos

 Desviación estándar:

La desviación estándar mide el grado de dispersión de los datos con respecto a la media, se denota como s para una muestra o como σ para la
población. Se define como la raíz cuadrada de la varianza según la expresión:

Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se divide entre n; también existe la fórmula de desviación típica donde
el denominador es n pero se prefiere n-1.

Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir existe menor dispersión, el incremento de los valores de la
desviación estándar indica una mayor variabilidad de los datos.
 Varianza:

Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto a la media. Corresponde a la media aritmética de los
cuadrados de las desviaciones respecto a la media. Su expresión matemática es:

Dónde Xi es el dato i-ésimo y es la media de los N datos.

 Coeficiente de Variación:

Permite determinar la razón existente entre la desviación estándar (s) y la media. Se denota como CV. El coeficiente de variación permite decidir con
mayor claridad sobre la dispersión de los datos.

También puede ser expresado en por ciento.

15.- Medidas de posición. Definir cada una de ellas:

 Medidas de Posición:

Si bien la mediana divide el conjunto de datos en dos partes iguales, existen otros parámetros estadísticos que dividen a la población en otras cuantías
distintas.

Los cálculos son similares a los de la mediana, variando la posición a buscar y el intervalo en el que se encuentra el cuantil.

 Cuartiles:

Dividen a la población de datos en cuatro partes iguales, correspondiendo cada uno de ellos al 25% de los datos. Tenemos por tanto tres cuartiles que
denotamos como Q1, Q2, Q3, y se les llama primer, segundo y tercer cuartil.

El segundo cuartil coincide con la mediana.

 Deciles:

Dividen la distribución de datos en 10 partes iguales, correspondiendo cada uno al 10% de los datos. Tendríamos, por tanto, nueve deciles que
denotamos por D1, D2, D3, ..., D9

El quinto decil coincide con la mediana.

Percentiles:

Tenemos 99 percentiles que dividirían a la población en 100 partes iguales, denotados por P1, P2, ..., P98, P99.

Los percentiles 25, 50 y 75 coinciden con los cuartiles.


16.- Asimetría de una distribución, definición y tipos:

 Asimetría de una distribución

Distribuciones simétricas o no asimétricas:

A medida que los datos se vuelven más simétricos, el valor de su asimetría se acerca a cero. La figura A muestra datos distribuidos normalmente, que por
definición exhiben relativamente poca asimetría. Al dibujar una línea por el medio de este histograma de datos normales, se puede ver fácilmente que un
lado es el reflejo del otro. Pero la falta de asimetría por sí sola no implica normalidad. La figura B muestra una distribución en la que ambos lados siguen
siendo un reflejo el uno del otro, a pesar de que la distribución de los datos dista mucho de ser normal.

Distribuciones asimétricas positivas o hacia la derecha:

Los datos con asimetría positiva o asimétrica hacia la derecha se llaman así porque la "cola" de la distribución apunta hacia la derecha y porque el valor
de asimetría es mayor que 0 (es decir, positivo). Los datos sobre salarios suelen ser asimétricos de esta manera: muchos empleados de una empresa
ganan relativamente poco, mientras que cada vez menos personas ganan salarios muy elevados.

Distribuciones asimétricas negativas o hacia la izquierda:

Los datos asimétricos hacia la izquierda o con asimetría negativa se llaman así porque la "cola" de la distribución apunta hacia la izquierda y porque
producen un valor de asimetría negativo. Los datos de tasas de fallas suelen ser asimétricos a la izquierda. Consideremos el caso de los focos: muy
pocos se quemarán inmediatamente, la gran mayoría dura un tiempo considerablemente largo.

 Definición:

Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmética). La asimetría presenta tres
estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como están distribuidos los datos respecto al eje de asimetría. Se dice que
la asimetría es positiva cuando la mayoría de los datos se encuentran por encima del valor de la media aritmética, la curva es Simétrica cuando se
distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetría negativa cuando la mayor cantidad
de datos se aglomeran en los valores menores que la media.

 Tipos:

Coeficiente de asimetría de Fisher

En teoría de la probabilidad y estadística, la medida de asimetría más utilizada parte del uso del tercer momento estándar. La razón de esto es que nos
interesa mantener el signo de las desviaciones con respecto a la media, para obtener si son mayores las que ocurren a la derecha de la media que las de
la izquierda. Sin embargo, no es buena idea tomar el momento estándar con respecto a la media de orden 1. Debido a que una simple suma de todas las
desviaciones siempre es cero.

Coeficiente de asimetría de Pearson:

Sólo se puede utilizar en distribuciones uniformes, unimodales y moderadamente asimétricas. Se basa en que en distribuciones simétricas la media de la
distribución es igual a la moda.

Donde es el momento ordinario de orden 1, que corresponde a la media aritmética de la variable

Si la distribución es simétrica, y . Si la distribución es asimétrica positiva la media se sitúa por encima de la moda y, por tanto
Coeficiente de asimetría de Bowley-Yule:

Está basado en la posición de los cuartiles y la mediana, y utiliza la siguiente expresión:

En una distribución simétrica el tercer cuartil estará a la misma distancia de la mediana que el primer cuartil. Por tanto

Si la distribución es positiva o a la derecha

17.- Curtosis definición y tipos:

 Definición:

Esta medida determina el grado de concentración que presentan los valores en la región central de la distribución. Por medio del Coeficiente de Curtosis,
podemos identificar si existe una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocúrtica) ó una baja concentración
(Platicúrtica).

 Tipos:

Leptocúrtica:

En la cual los valores están muy agrupados alrededor de la media, por lo que la distribución se presenta bastante apuntada y esbelta

Mesocúrtica:

Posee una concentración moderada de valores alrededor de la media

Platicúrtica:

Está distribución tiene una forma más ancha, pues los valores tienden a estar más dispersos

18.- Calculo de la madia, mediana, moda, varianza, desviación, percentiles, deciles, cuartiles para datos agrupados y no
agrupados

 Media:

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.

Símbolo de la media aritmética:

 Mediana:

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre.

 Moda:

Para calcular el valor modal de una serie de números sólo tienes que ordenar los valores y reconocer cuál es que el aparece con más frecuencia. En el
caso de que en una misma muestra existan dos o varias puntuaciones con la misma frecuencia, entonces la distribución es bimodal en caso de que sean
dos valores diferentes o multimodal en caso de que existan más de dos.
 Varianza:

Es una medida de dispersión, una medida de cómo los valores de los datos pueden diferir de su media. La varianza es la media aritmética de los
cuadrados de las diferencias de los valores individuales de la media. La elevación al cuadrado asegura que los valores positivos y negativos no se anulan
mutuamente.

 Desviación:

La primera es elevando al cuadrado las desviaciones, dividir entre el número total de observaciones y por último hacer la raíz cuadrada para deshacer el
elevado al cuadrado, tal que:

Alternativamente existiría otra forma de calcularla. Sería haciendo un promedio de la suma de los valores absolutos de las desviaciones. Es decir, aplicar
la siguiente fórmula:

 Percentiles:

Cuando estamos ante un conjunto de datos ordenado, podemos seguir la fórmula Px = Lr i+ ((kn/100 - Fa) / f) (Ac). Así, bastará con sumar el límite inferior
de la clase donde está el percentil a producto entre la amplitud de la clase y el cociente entre la resta de la posición menos la frecuencia acumulada
anterior y la frecuencia total.

 Deciles:

Los deciles se calculan como si fueran 10-cuantiles, de manera que, el primer decil separe el juego de datos entre el 10% de los valores inferiores, y el
resto de los datos, además, el noveno decil separe los datos entre el 90% de los valores inferiores y el 10% de los valores superiores.

 Cuartiles:

Comenzamos ordenando los datos de menor a mayor y luego buscamos el lugar que ocupa cada cuartil mediante la expresión

19.- Calculo de la Asimetría y Curtosis para datos agrupados:

 Asimetría:

El Coeficiente de asimetría, se representa mediante la ecuación matemática:

 Curtosis:

Para calcular el coeficiente de Curtosis se utiliza la ecuación:


Bibliografía

 Spiegel, M. R., & Stephens, L. (2009). Estadística Cuarta edición. En M. R.


Spiegel, & L. Stephens, Estadística. México: McGRAWHILL/INTERAMERICANA.

 Colectivo de autores. Estadística, probabilidad y precálculo, Manual esencia,


Editorial Santillana, Santiago de Chile, 2008 ISBN: 978-956-15-1390-7

 Bouza Herrera, Carlos N. y Sistachs Vega, Vivian: Estadística,


Teoría Básica y Ejercicios.Editorial Félix Varela, La Habana, 2004

 Batanero, Carmen. Didáctica de la Estadística. Granada:


Grupo de Investigación en Educación Estadística. Departamento de Didáctica de la Matemática.
Universidad de Granada, ISBN: 84-699-4295-6.

También podría gustarte