Está en la página 1de 5

variable estadística: La variable estadística es una característica cualidad de un o individuo que

está propensa a adquirir diferentes valores. Estos valores, a su vez, se caracterizan por poder
medirse. Por ejemplo, el color de pelo, las notas de un examen, el sexo o la estatura de una
persona, son variables estadísticas.

La variable estadística, de acuerdo con las características que la definen, puede ser cualitativa o
cuantitativa.

Población: Es el Conjunto Total de individuos, objetos o eventos que tienen las mismas
características y sobre el que estamos interesados en obtener conclusiones.

Muestra: Es una parte de la población, la cual se selecciona con e propósito de obtener


información. Debe ser "representativo".

Las variables cualitativas son aquellas características o cualidades que no pueden ser calculadas
con números, sino que son clasificadas con palabras. Este tipo de variable, a su vez, se divide en:
cualitativa nominal, cualitativa ordinal y cualitativa ordinaria.

Cualitativa nominal: aquellas variables que no siguen ningún orden en específico. Por ejemplo,
los colores, tales como el negro, naranja o amarillo.

Cualitativa ordinal: aquellas que siguen un orden o jerarquía. Por ejemplo, el nivel
socioeconómico alto, medio o bajo.

Cualitativa binaria: variables que permiten tan solo dos resultados. Por ejemplo, sí o no; hombre o
mujer.

Variable cuantitativa Las variables cuantitativas son aquellas características o cualidades que sí
pueden expresarse o medirse a través de números. Este tipo de variable, a su vez, se divide en:
cuantitativa discreta, cuantitativa continua.

Cuantitativa discreta: aquella variable que utiliza valores enteros y no finitos. Por ejemplo, la
cantidad de familiares que tiene una persona, tal como 2, 3, 4 o más.

Cuantitativa continua: aquella variable que utiliza valores finitos y objetivos, y suele caracterizarse
por utilizar valores decimales. Por ejemplo, el peso de una persona, tal como 64.3 kg, 72.3 kg, etc.

Cifras significativas (c.s) todos aquellos dígitos que pueden leerse directamente del aparato de
medición utilizado, tienen un significado real o aportan alguna información, son dígitos que se
conocen con seguridad (o existe cierta certeza).

PARTES DE UNA TABLA ESTADÍSTICA:

a. Título: Expresa en forma resumida la información que contiene y se coloca en la parte superior
de la tabla. Debe ser breve, concreto y completo. Un título completo debe contener lo siguiente:
La circunscripción espacial, es decir, debe indicar institución o área geográfica a la que pertenecen
los datos. Responde a la pregunta ¿A DÓNDE pertenece la información? El fenómeno que se está
tratando o la naturaleza de los datos. Responde a la pregunta ¿QUÉ contiene la tabla? El criterio
de clasificación de los datos. Responde a ¿CÓMO se presenta el contenido de la tabla?
El espacio temporal o período que abarca la información que se presenta a) ¿A QUÉ TIEMPO
pertenecen los datos de la tabla? A veces es necesario indicar debajo del título, indicar las
unidades de medida que se han utilizado para indicar la variable.

b. Encabezado: Está formado por la primera fila de la parte superior y nos indica las
características (variables) del fenómeno estudiado. También se le denomina título de las
columnas.

c. Columna Matriz: Es la primera columna de la izquierda y contiene también variables del


fenómeno en estudio. También se le denomina título de las filas.

d. Cuerpo: Es el contenido mismo de la información de la tabla, se presenta en celdas o casillas de


intersección, ordenadas por los títulos de las filas y columnas.

e. Fuente: Indica la fuente de recolección de los datos presentados en la tabla, se coloca siempre
en la parte inferior de la tabla.

La recolección de datos puede recurrir a distintas fuentes, como aquellas bibliográficas


(particularmente si la información es cualitativa) o bases de datos de libre disposición. Por
ejemplo, un periodista podría acceder a información sobre la distribución del presupuesto público
en el portal de transparencia de su gobierno.

Técnicas de recolección de datos: entre las principales tenemos: la entrevista, observación,


encuestas, focus group.

Entrevista Consiste en hacer una serie de preguntas a los individuos que forman parte del estudio.
Estas pueden ser preguntas abiertas y/o cerradas.

En el primer caso, lo que se busca es que el entrevistado se explaye sobre un tema específico, por
ejemplo, cómo se sintió durante su primera semana en su nuevo lugar de trabajo. En cambio, las
preguntas cerradas son aquellas donde se dan un número limitado de respuestas alternativas, por
ejemplo, cuando un servicio de atención al cliente pregunta a sus usuarios si su nivel de
satisfacción fue muy bajo, bajo, medio, alto o muy alto. Un punto importante para tomar en
cuenta es que la entrevista puede tener distintas modalidades, ya sea presencial, online o
telefónica.

Observación: el investigador asume el trabajo de espectador sobre el sujeto de estudio. Esto, con
el fin de recopilar sus características. Imaginemos, por ejemplo, el caso de una persona que está
haciendo un estudio sobre una especie de ave.

Encuestas: son una serie de preguntas que se realizan a un grupo de individuos. A diferencia de las
entrevistas, no requieren de una interacción amplia entre el entrevistador y el entrevistado.
Incluso, la encuesta puede ser vía correo electrónico o mediante un sistema informático. Al igual
que la entrevista, puede tener preguntas abiertas y cerradas.

Focus Group: consiste en una sesión grupal donde se recopila información sobre un determinado
tema, por ejemplo, un nuevo producto que pretende lanzar una empresa. Se trata de una técnica
muy utilizada en los estudios de mercado.
La Estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así
como para sacar conclusiones válidas y tomar decisiones razonables basadas con tal análisis. Pero
un uso inadecuado de dichos métodos puede producir conclusiones erróneas.

Error en una medida: diferencia entre el valor verdadero y el obtenido experimentalmente. Los
errores no siguen una ley determinada y su origen está en múltiples causas.

Sistematicos (sesgo): son aquellos que permanecen constantes a lo largo de todo el proceso de
medida y, por tanto, afectan a todas las mediciones de un modo definido y es el mismo para todas
ellas; se pueden subclasificar en errores instrumentales, personales o por la elección del método.
Persistirá, aunque se trabaje con toda la población. Se elimina si se sabe su causa.

Aleatorios (azar, inevitable): Se produce al trabajar con muestras. Desaparece al trabajar con toda
la población. Diferencia debida al azar entre la estimación obtenida en el estudio y el parámetro
que se pretende estudiar.

Accidentales: Los errores accidentales son aquellos que se producen en las variaciones que
pueden darse entre observaciones sucesivas realizadas por un mismo operador. Las causas de
estos errores son incontrolables para el observador.

Error absoluto: El error absoluto en una medida x de determinada magnitud es la diferencia entre
dicho valor y el valor verdadero de la medida.

Error relativo: el cociente entre el error absoluto y el valor verdadero; notándolo por ε su
expresión es: ε = ∆x /x0 ERROR Y RESULTADO Un resultado es más preciso cuanto menores son sus
errores aleatorios. Un resultado es más veraz si su error sistemático es mínimo.

MEDIA ARITMÉTICA

También llamada promedio o media, de un conjunto finito de números es el valor característico de


una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza
matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el
número de sumandos.

MEDIA ARITMÉTICA

También llamada promedio o media, de un conjunto finito de números es el valor característico de


una serie de datos cuantitativos, objeto de estudio que parte del principio de la esperanza
matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el
número de sumandos.

MEDIANA

La mediana de un conjunto de observaciones se define como el valor que queda en la parte


central de un grupo de observaciones arreglados en orden de magnitud.

Ventajas: No es sensible a los valores extremos

Desventajas: Se deben ordenar los datos para el cálculo, los valores extremos pueden ser
importantes.
LA MEDIANA PARA DATOS NO AGRUPADOS

La mediana de un conjunto de datos es el valor que se encuentra al medio de la distribución


ordenada (en forma ascendente descendente). Cuando se tiene mediana uno sabe que es la
misma cantidad de datos que se encuentra por encima de dicha mediana que por debajo.

LA MEDIANA PARA DATOS AGRUPADOS

Para calcular la mediana para datos agrupados considerando las frecuencias absolutas, en primer
lugar, se encuentra el intervalo donde se encuentra la mediana, este se encontrará en el primer
intervalo cuya frecuencia absoluta acumulada contiene a la mitad de la muestra.

MODA

La moda es el dato que más se repite (el de más alta frecuencia). Por ejemplo: ¿cuántas veces se
repite la letra "e" en la palabra "representatividad"? se repite 3 veces y te fijarás que es la que más
se repite, por lo tanto, se dice que la letra "e" es la moda de este conjunto de letras.

Ventajas: es útil cuando hay agrupaciones con diferentes valores, solo mide lo que puede ser
usado para datos que no son cuantitativos

Desventajas: puede no existir en algunos datos, puede estar demasiado lejos de la mitad de los
datos.

Media armónica: es igual al número de elementos de un grupo de cifras entre la suma de los
inversos de cada una de estas cifras.

Cuantilos

Los cuantilos son medidas de posición que dividen al conjunto ordenado de datos en una
determinada cantidad de partes iguales, de tal manera que superan a una cierta proporción de las
observaciones, pero son superados por la proporción complementaria,

Las principales de estas medidas son:

Cuartiles: Son tres valores que dividen al conjunto ordenado de datos en 4 partes iguales.
Percentiles: Son 99 valores que dividen al conjunto ordenado de datos en 100 partes iguales.

Deciles: Son nueve valores que dividen al conjunto ordenado de datos en 10 partes iguales.
Quintiles: Son cuatro valores que dividen al conjunto ordenado de datos en 5 partes iguales.

Las medidas de dispersión pueden ser clasificadas en dos grandes grupos:

Medidas de dispersión absolutas. Las medidas absolutas vienen expresadas en las mismas
medidas de la serie de datos. Las más conocidas son: el recorrido, la desviación cuartílica, la
desviación semicuartílica, la desviación media, la desviación estándar (también conocida como
desviación típica) y la varianza. Aunque estas dos últimas son las más empleadas.

Medidas de dispersión relativas. Las medidas de dispersión relativa son relaciones entre medidas
de dispersión absolutas y medidas de tendencia central multiplicadas 100, por lo tanto, vienen
expresadas como porcentaje. La medida de dispersión relativa de mayor importancia es el
coeficiente de variación.
Rango o amplitud total: el rango o amplitud total es la medida de dispersión más sencilla.
Simplemente es la diferencia entre los valores mayor y menor de un conjunto de datos.

VARIANZA: medida de variabilidad que consiste en la media aritmética del cuadrado de las
desviaciones de un conjunto de datos con respecto a su media.

La varianza se expresa como o² o s2 si se calcula para datos de una población o una muestra,
respectivamente.

La desviación estándar: se puede definir como la raíz cuadrada de la varianza, o sea, la raíz
cuadrada del promedio aritmético de los cuadrados de las desviaciones de las observaciones con
respecto a su media aritmética.

También podría gustarte