Documentos de Académico
Documentos de Profesional
Documentos de Cultura
DEFINICIONES:
Variable estadística: Es una característica observable que varía entre los diferentes individuos
de una población. Debe ser muy precisa para evitar ambigüedad. Se clasifican en:
- Cuantitativas: son aquellas que por su propia naturaleza admiten que sus variaciones
en los elementos poblacionales o muestrales sean susceptibles de cuantificación o
medición propiamente dicha. Las respuestas obtenidas son números. A su vez, estas se
clasifican en:
- Cuantitativas discretas: es aquella que dado un intervalo numérico sólo puede tomar
un número finito o infinito numerable de posibles valores, es decir, son números
enteros. Generalmente los datos discretos son originados por un proceso de conteo o
enumeración. Ej: número de días hasta el 80% de brotación del ajo, número de pulgones
por hoja, número de tomates con podredumbre apical.
- Cuantitativas continuas: es aquella que dado un intervalo numérico puede tomar
cualquier valor de los posibles valores, es decir, infinitos valores. Es decir, son números
dentro de un intervalo. Los datos continuos son originados por un proceso de medición.
Ej: tiempo de vida de un animal, altura, peso, longitud, etc.
La Estadística puede dividirse en dos grandes ramas, perfectamente diferenciadas por los
objetivos que persiguen y por los métodos que utilizan.
ESTADÍSTICA
DESCRIPTIVA INFERENCIAL
Cuando la población es muy
Se estudian todas las grande se toma una muestra
unidades de análisis de la y son las unidades de
población. Incluye la análisis de la muestra las
obtención, organización, que se estudian. Se obtienen
análisis y presentación de generalizaciones o se toman
una manera objetiva. Las desiciones en base a una
conclusiones no van más allá información parcial o
de la extensión que tienen incompleta que se analizan
los datos en sí, no se pueden en forma descriptiva. En este
hacer extensivas a otras tipo de estadísticas siempre
poblaciones. existe un porcentaje de
confiabilidad. También se
establece la teoría de la
probabilidad.
En ninguno de los dos casos interesa el comportamiento individual o los datos en particular sino
una comprensión general de la masa de datos, o patrón de comportamiento general de los
datos.
DESCRIPCIÓN GRÁFICA
Un diagrama elemental que resulta muy útil para visualizar global e individualmente un conjunto
pequeño de datos es el diagrama de puntos o puntigrama.
Este tipo de diagrama resulta útil cuando los datos a representar no son muy numerosos.
Ejemplo:
Un productor de tomate perita quiere conocer el rendimiento por planta de la variedad Zorzal.
De la hectárea que tiene con esta variedad selecciona 5 hileras distribuidas uniformemente en
la parcela. De cada hilera selecciona al azar 2 plantas y mide su rendimiento durante toda la
temporada. Al finalizar, los datos obtenidos son los siguientes: 2,3 – 4,9 – 3,4 – 3,2 – 5,1 – 4,7 –
4,3 – 4,6 – 5,3 – 4,8.
2 3 4 5 6 Kg/planta
TESTIGO 17,50 – 17,63 – 18,25 – 18,00 – 17,86 – 17,75 – 18,22 – 17,90 – 17,96 – 17,80
TRATADA 16,85 – 16,40 – 17,21 – 16,35 – 16,52 – 17,04 – 16,96 – 17,15 – 16,59 – 16,10
En el diagrama de puntos se ven los conjuntos de mediciones, donde los puntos verde oscuro
corresponden a las plantas tratadas y los puntos verde claro a las plantas testigo.
DESCRIPCIÓN NUMÉRICA
La descripción estadística de las muestras a través de los estadígrafos, unas medidas cuyo valor
se calcula a partir de los datos observados, conforma un método eficaz y preciso de informar
acerca de las principales características que presenta el conjunto de datos.
Media
Si una muestra está constituida por un conjunto de n observaciones representadas como x 1, x2,
…, xn-1, xn, su media que se simboliza con el símbolo x, se obtiene sumando todas la n
observaciones y dividiendo luego el total obtenido por la cantidad de sumandos que han
intervenido, es decir, por n. Simbólicamente se expresa como:
x = x1 + x2 + … + xn
n
Calcular la media para los ejemplos anteriores.
En el caso de la comparación de dos o más conjuntos de datos, obtendremos una media para
cada uno.
Mediana
Otra medida de posición bastante utilizada es la mediana, simbolizada como xd, cuyo nombre
hace referencia a la parte media, es decir que es exactamente la medida central.
Podríamos definirla así: La mediana es el valor de la variable que deja la mitad de los valores
poblacionales por debajo y la otra mitad por encima.
xd = x [(n + 1)/2]
xd = x(n/2) + x[(n/2)+1]
2
Cabe aclarar que, en el cálculo de la mediana, si la muestra tiene observaciones repetidas, se
las debe incluir.
Ejemplo:
Tomaremos los primeros 5 valores del ejemplo del productor de tomate, donde la producción
era en Kg/planta de 2,3 – 4,9 – 3,4 – 3,2 – 5,1, donde al ordenarlos quedan de la siguiente forma:
2,3 – 3,2 – 3,4 – 4,9 – 5,1.
Al ser un número impar de valores (5) la podemos calcular así: (n + 1)/2 = (5 + 1)/2 = 3, por lo
que la mediana para esta serie toma el valor de la variable ubicada en el 3° lugar, esto es 3,4
Kg/planta.
Para analizar el caso de un número de datos par, tomaremos los primeros 6 valores del ejemplo
de las plantas de vid tratadas con el fitosanitario. Estos valores son: 16,85 – 16,40 – 17,21 –
16,35 – 16,52 – 17,04.
Al ordenarlos quedaría así: 16,35 – 16,40 – 16,52 – 16,85 – 17,04 – 17,21
Al ser un número par de valores (6) la podemos calcular así: (n/2) = 6/2 = 3; (n/2)+1 = 3+1 = 4;
por lo que la mediana será el promedio entre el valor que ocupa la 3° posición y el valor que
ocupa la 4° posición, es decir: xd = (16,52 + 16,85)/2 = 16,685 Kg/planta.
La mediana presenta las siguientes ventajas: para el cálculo de su valor intervienen las n
observaciones, pero no es afectado por la magnitud que puedan tener los valores extremos de
la serie.
Ejemplo:
Datos: 1, 2, 3, 4, 6, 7, 8. Media: 4,4. Mediana: 4.
Ambas medidas dan una idea de la tendencia central de los datos.
Ahora cambiemos alguno de los valores extremos, quedando el último dato 2450 en lugar de 8.
Media: 353,28. Mediana: 4.
En este último caso, una serie con un valor muy extremo, la media no dice mucho sobre la
tendencia central de la mayoría de los datos, mientras que la mediana resulta más adecuada
para representarla.