Está en la página 1de 18

ESTADSTICA PARA CIENCIAS AMBIENTALES

ESTADSTICA DESCRIPTIVA
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

ESTADSTICA PARA CIENCIAS AMBIENTALES


ESTADSTICA
Para la mayora de personas involucradas en las Ciencias, nos parecer comn utilizar la
estadstica como herramienta ms que necesaria, pero en aquellas personas que
aparentemente no necesitan de la estadstica resulta difcil entenderla, aplicarla y buscan ayuda.
Para enmendar este desconocimiento pongo a vuestra consideracin esta propuesta de teora
de estadstica para mejorar esos conocimientos y fortalezcan sus intereses investigativos.

Definicin.- La estadstica es la ciencia que se encarga de recolectar, ordenar, presentar los


datos y convertirlos en informacin necesaria para la toma de decisiones.

Elementos de la Estadstica
Poblacin.- Parte constitutiva de la investigacin.

Parmetro.- Es la caracterstica de la poblacin, en otras palabras es lo que se va a estudiar de


la poblacin.

Muestra.- Es una parte representativa de la poblacin.

Estadstico.- Es la caracterstica de la muestra, es lo que se va a calcular en la investigacin y


generalizar los resultados en la poblacin.

Datos.- Son las respuestas a las preguntas sobre el tema que se desea investigar.

Informacin.- Es el anlisis de los datos, organizados y presentados en una investigacin.

Ejemplo: En una investigacin realizada en la Universidad Tcnica de Cotopaxi para conocer la


estatura de los estudiantes que ingresan a primer ciclo en la especialidad de Medio Ambiente
periodo febrero-agosto 2009.

Poblacin Estudiantes de la UTC


Parmetro Estatura de los estudiantes de la UTC
Muestra Estudiantes del primer ciclo, carrera de Medio Ambiente
Estadstico Promedio de la estatura
Dato Registro de la estatura
Informacin Porcentaje de altos, bajo, medianos; grfico de barras o
circular

Para una investigacin entonces se deben definir las preguntas, que en estadstica se las llaman
variables y responden a dos preguntas de dnde? y cmo obtengo los datos?

A la primera pregunta se la responde claro est que, en la poblacin, pero para armarla se debe
elegir a una muestra.

A la segunda pregunta se la relaciona con las tcnicas empricas de la estadstica es decir se


puede hacer una encuesta, entrevista, test, o una experimentacin.

3
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

TIPOS DE VARIABLES
Para nuestros intereses se definen tres tipos de variables, a saber:

Escala.- Son de tipo numrico y pueden ser exactos (discretos) o con decimales (continuos).

Ordinales.- Son opciones de respuesta que tienen orden jerrquico.

Nominales.- Son opciones de respuesta que no tienen prioridad.

Ejemplo:

ESCALA ORDINAL NOMINAL


Discreto Continuo Cmo considera Cul es su profesin?
Cuntos hermanos Cunto usted usted, la situacin a) Ingeniero
tiene usted? recibe al mes por su econmica actual de b) Arquitecto
trabajo? la provincia de c) Profesor
Cotopaxi? d) Bombero
a) Excelente e) Contadora
b) Bueno f) Zapatero
c) Regular g) Otro
d) Malo
e) No opina

La estadstica cumple hasta aqu la parte de recoleccin de datos.

PROBLEMAS

1. Clasificar los tipos de variables que correspondan: salario, nacionalidad, antigedad en el


trabajo, peso de un libro, tema de un libro, calificacin de una prueba, precio de un libro, motivo
por el que se adquiere un libro, lugar donde se encuentra ubicada una biblioteca, nmero de
fichas de observacin, criterio para los desastres naturales.

2. Clasificar las siguientes variables en discretas o continuas: nmero de pedidos de laboratorio


de agua, ventas en un CIBERCAF, crecimiento bacteriano, temperatura diaria en la estacin
meteorolgica, tiempo empleado en llegar a CAREN, nmero de botellas de plstico en el
reciclador, cantidad de memos por da en la carrera de Medio Ambiente, cantidad de portafolios
archivados.

3. Indicar si es una muestra o una poblacin en los siguientes casos: trabajamos con el 12% del
curso; preferencia por cierta lectura de Microbiologa preguntando a las personas que entran a
la Biblioteca entre las 10 y las 12 horas; la ocupacin de los estudiantes de la generacin 2007 a
travs de los datos de Secretara; ingreso de las personas que viven en salache bajo.

4. Clasificar los siguientes datos en variables o atributos, discretas y continuas, ordinales y


nominales.

a) Marca de cerveza.
b) Rapidez en km/h.
c) Peso en lb.

4
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

d) Signo del zodaco.


e) Nivel educativo (primario, secundario, superior, posgrado)
f) Aos de estudio completados.
g) Tipo de enseanza ( pblica, privada)
h) Nmero de empleados en CEDAL.
i) Clase social (baja, media, alta)

Aplicaciones informticas

Validar datos con excel


Abrimos un libro de excel, en nuestro caso corresponde a la versin Excel 2013. Nos ubicamos
en la celda (o rango de celdas)

Vamos al men datos, Validacin de datos

Nos saldr la ventana para programar nuestra validacin, en nuestro caso, las celdas aceptarn
valores numros de escala entre 16 y 65 aos. Notificaremos ERROR y lo que debe ingresar para
continuar.

5
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

Si en la celda validada digitamos 11, nos presenta el error.

Funciona para el rango acordado, ejemplo 47

Para opciones de respuesta, se valida los datos con LISTA, de dos maneras.

OPCIN UNO.- Lista desplegable.

6
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

Las opciones se las separa con punto y coma (segn la REGIN codificada en su computadora),
el mensaje de error, con el estilo de Advertencia, ser Elija una de las opciones

Se nos validar de acuerdo a la lista

OPCIN DOS.- Dando nombres a rangos previamente planificados: Ejemplo, en una hoja nueva
DESPLEGABLES se dar el NOMBRE AL RANGO, PREFERENCIA y las opciones sern: SIEMPRE,
FRECUENTEMENTE, NUNCA

7
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

El nombre se lo puso en la parte superior izquierda y luego enter, si deplegamos el cuadro de


nombre se grabar el mismo.

Ahora se programa la validacin y se lo har =PREFERENCIA

Al dar aceptar o enter la celda se validar.

8
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

Anlisis Estadstico con datos Cualitativos.

Para ello se necesita ordenar los datos y presentarlos, ya sea con la grfica de barras, circular,
lneas.

El proceso de ordenacin viene a ser especificar las opciones de respuesta y realizar el conteo
para determinar la frecuencia de contestacin en cada opcin de respuesta, podemos
determinar la frecuencia relativa y la frecuencia relativa porcentual.

Ejemplo, se determin, mediante una entrevista a 16 estudiantes sobre la preferencia de


transporte para ingreso a la Unidad Acadmica de CAREN, obtenindose el siguiente orden.

Seleccionamos los datos y sus opciones de respuesta, vamos al men INSERTAR y seleccionamos
una grfica, por ejemplo la de barras 3D.

Para grfico de pastel

En este caso debemos presentar los porcentajes (frecuencia relativa porcentual fr%), damos clic
derecho sobre la grfica y buscamos un formato.

9
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

Damos el formato final y terminamos, clic derecho sobre la grfica de pastel y elegir Formato de
etiquetas de datos, ubicamos el nombre de la categora.

ORDENAR DATOS
La estadstica, una vez obtenido los datos, se encarga de organizarlos, si son numricos en forma
ascendente, descendente, o en grupos.

Si el nmero de datos es relativamente pequeo (menor a 25), se los puede ordenar, ascendente
o descendentemente. Si el nmero de datos es considerable (mayor o igual a 25) se los ordena
en grupos.

DATOS NO AGRUPADOS

Simbologa estadstica

Va a ser de utilidad el conocer la nomenclatura que utiliza la estadstica

10
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

Sumatoria
Productoria
Xi Cada dato, los datos, todos los datos
N Nmero de datos de la poblacin
n Nmero de datos de la muestra
W Ponderacin o peso

Si combinamos stos elementos se podra leer estadsticamente

X i La suma de todos los datos

Sea una investigacin referente a la estatura de 7 estudiantes de la UTC en cm

167, 173, 160, 170, 167, 182, 154

Formamos una tabla de presentacin de los datos y los ordenamos en forma ascendente (del
menor al mayor)

Datos Xi
167 154
173 160
160 167
170 167
167 170
182 173
154 182
Para efectos de investigacin daremos una ponderacin a los datos (como investigadores,
daremos peso a los menores nmeros)

Datos Xi Wi
167 154 6
173 160 6
160 167 3
170 167 3
167 170 2
182 173 2
154 182 2

Colocaremos un casillero que registre la suma y la multiplicacin

Datos Xi Wi X i Wi
167 154 6 924
173 160 6 960
160 167 3 501
170 167 3 501
167 170 2 340
182 173 2 346
154 182 2 364
1173 24 3936

11
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

ESTADSTICOS
Con esto se puede determinar medidas que tienden al centro y medidas que registran el grado
de su dispersin, stas medidas son:

Tendencia central: Media aritmtica o promedio, mediana, moda, media geomtrica, media
ponderada.

Dispersin: Varianza, desviacin tpica o desviacin estndar.

Simbologa

Media aritmtica o
Promedio
x x testeada; MA de la poblacin
Media Ponderada xW ; MP
Media Geomtrica x G ; MG
Mediana x ; ME
Moda x ; MO
Varianza S 2 de la muestra; 2 poblacin
Desviacin tpica o
estndar
S de la muestra; de la poblacin

La media aritmtica se la halla

x
X i
x
1173
x 167.57
n 7

Media Ponderada

xW
XW i
xW
3936
xW 164
W 24

Media Geomtrica

xG n
X i xG 7 3.678 1015 xG 167.36

Mediana

En datos no agrupados, esta medida de tendencia central se ubica en la mitad de los datos
ordenados, se lo ubica dependiendo si el nmero de datos es par, es el promedio de los datos
que rodean el centro.

12
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

Xi
154
160
167
167
170
173
182

y si el nmero de datos es impar su ubicacin es (n+1)/2

Xi
154
160
167
167
170
173
182
185

La mediana corresponde al promedio de las dos medidas, en este caso ser (167+170)/2 = 168.5

Varianza

X x
2
485.71
s 2
i
s2 s 2 80.95
n 1 6

Desviacin Tpica

Es la raz cuadrada de la varianza

s s2 s 8.99

ESTADISTICA CON EXCEL


Podramos utilizar la hoja electrnica de Excel (versin excel 2010) para automatizar los clculos,
para ordenar los datos y hacer operaciones matemticas conocidas las ecuaciones para las
medidas de tendencia central y dispersin.

13
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

Digitamos los datos en una columna

Despus copiamos los datos en la columna contigua y lo ordenamos de menor a mayor

Para nuestro anlisis estadstico habamos considerado las ponderaciones a los datos

Ahora usaremos las frmulas para multiplicar, sumar, restar y elevar al cuadrado, como tambin
copiar las frmulas a otras celdas.

Debera quedar

14
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

Para la secuencia de la frmula =(C5-$E$15)^2, la condicin $E$15 significa que para cuando
copiemos la frmula a las otras celdas C5, ser secuencial a las celdas, C6, C7, C8,, C11;
mientras que la celda donde est la media aritmtica no ser secuencial, sino permanece fija.

Entonces para las restantes medidas, formaremos un cuadro de resumen

La automatizacin sera

Es importante notar la utilizacin de los parntesis en las frmulas

15
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

PROBLEMAS

1. En una encuesta efectuada en una determinada localidad, se obtuvo la siguiente informacin


con referencia al nmero de hijos.

No. de hijos No. de familias


2 5
3 20
4 10
5 8
6 4
8 2
12 1

a) Indicar cual es la variable y cual la frecuencia.


b) Calcular la frecuencia acumulada.
c) Determinar el nmero mediano de hijos
d) Calcular la moda y el promedio de hijos.

2. Con la finalidad de investigar el nmero de horas de trabajo en el invernadero, se tomaron


100 fichas y se orden en la tabla:

Nmero de horas en el Cantidad


invernadero de estudiantes
0 8
1 11
2 16
3 20
4 15
5 13
6 12
7 5

a) Calcular las frecuencias relativa y representarla graficamente


b) Calcular la frecuencia acumulada
c) Calcular todas las medidas de posicin y dispersin.
d) Interpretar los resultados

3. Ante la necesidad de conocer el nmero de trabajos de investigacin, a travs de consultas


en internet de los docentes de Medio Ambiente a sus estudiantes, se eligieron 20 semanas y se
observ el siguiente resultado en base a sptimo y octavo ciclo:

35, 20, 30, 25, 25, 25, 40, 20,50, 40, 30, 25, 20, 30, 30, 35, 45, 45, 40, 35

a) Indicar cual es la variable y cuales son las frecuencias.


b) Calcular la moda y mediana.

16
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

c) Se conoce que el promedio semanal en otras carreraas es 32, indicar como es en


Medio Ambiente.
d) El coeficiente de variacin de las otras unidades acadmicas es 0.30. Indicar si
coincide con el de nuestra realaidad e interpretar el resultado.

4. Se realiz una revisin a 50 proyectos para conocer la cantidad de estudiantes que trabajan
en ellos. Los resultados se resumen en la tabla:

Cantidad de Cantidad de
estudiantes Proyectos
6 5
8 8
10 20
15 11
16 5
18 1

calcular todas las medidas de posicin.


Indicar el porcentaje de Proyectos con menos de 10 estudiantes, con 15 o menos y con
ms de 10.
Representar graficamente las frecuencias acumuladas.

5. Durante la ltima semana de enero 2015, 2 empresas han vendido los reactivos que ocupan
los tres primeros puestos en la lista de ventas a los precios siguientes:

EMPRESA 1 EMPRESA 2
Nmero de Nmero de
Precio Precio
reactivos reactivos
1800 10 1500 25
2100 13 1900 18
2300 15 2000 25

a) Calcular el Rango de la distribucin del precio en cada una de las empresas. Existe
mucha o poca distincin entre los precios pagados por los clientes en la Empresa 1? Y
en la Empresa 2?
b) Que Empresa ha presentado en la ltima semana un cobro medio ms representativo.
c) Si durante una promocin ambas empresdas rebajan sus precios en $ 200, explique
como afectara este cambio al rango y a la representatividad del precio medio
correspondiente a las ventas de los tres xitos.

6. Teniendo en cuenta que de acuerdo al nmero de citas que se hacen de un autor se puede
conocer la importancia o utilidad de su produccin literaria, se tom una muestra de 20 artculos
relacionados al tema Metodologa de la Matemtica y se observ las veces que fue citado el
autor Tenorio M. en cada uno de los artculos:

1, 3, 5, 7, 1, 3, 8, 9, 6, 6, 5,1, 2, 2, 5, 2, 3, 3, 2, 2

17
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

a) Calcular la cantidad promedio de citas del autor Tenorio M. por artculo.


b) Calcular la cantidad de citas que se presenta ms frecuentemente en cada artculo.
c) Analizar si en cada artculo existe una cantidad similar de citas de ese autor,
mediante la medida que crea ms conveniente.

7. Se dispone de la informacin relativa a la cantidad de horas que permanecen en la biblioteca


personas en la MATRIZ

Horas Personas
1 300
2 500
3 1500
4 700
5 300
6 200

a) Calcular la cantidad de horas promedio que se permanece en la biblioteca, la moda, la


mediana y el coeficiente de variacin.
b) Que porcentaje permanece ms de cuatro horas en la biblioteca y cuantos menos de
cinco horas pero ms de dos.

8. En la biblioteca de CAREN existen libros sobre temas de Medio Ambiente se ubicaron 120
artculos sobre Deforestacin cuya distribucin, de acuerdo al nmero de pginas es la
siguiente:

Nmero de
Artculos
pginas
10 20
12 35
15 40
18 15
20 10

a) Calcular el promedio de pginas por artculo.


b) Calcular la mediana y moda.
c) Calcular el coeficiente de variacin.
d) Indicar cuntos artculos tienen ms de doce pginas y cuantos tienen ms de quince
pero menos de veinte
e) Si la hoja est escrita de ambos lados, (2 pginas por hoja), calcular el promedio de
hojas, la varianza y el coeficiente de variacin correspondiente.

9. Se dispone de sesenta artculos sobre el tema Anlisis de datos, los cuales presentan
caractersticas similares en relacin a la cantidad de palabras que cada uno posee. Si contamos
la cantidad de veces que se repite la palabra frecuencia, obtenemos la siguiente distribucin:

18
Dr. Carlos Mantilla Parra. M.Sc. ESTADSTICA PARA CIENCIAS AMBIENTALES

Xi N ( xi )
3 10
4 23
5 16
6 8
7 3

a) Calcular el promedio de repeticiones por artculo de la palabra frecuencia


b) Calcular el nmero ms comn de repeticiones
c) Coeficiente de variacin y coeficiente de simetra (con los datos dados)
d) Cuntos artculos tienen cuatro veces mencionada dicha palabra y cuntos artculos
la tienen menos de cinco veces.

10. Un profesor de Matemtica desea conocer el nivel de conocimientos de sus dos grupos de
estudiantes del paralelo A y paralelo B, para planificar sus clases de acuerdo con dicho nivel.
Para ello elige al azar 15 estudiantes de cada paralelo y les aplica una prueba elaborada para
este fin, obtenindose los resultados:

A B A B
4 8 5 2
3 9 6 2
7 1 7 10
5 2 7 7
6 8 3 8
4 8 4 2
5 4 5 1
4 3

a) En cul de los dos paralelos le ser ms fcil la planificacin de la Matemtica.


b) Cul es el nivel medio de cada paralelo.
c) Cul es la mediana de las puntuaciones del paralelo B.
d) Qu valor tiene la desviacin tpica de la distribucin del paralelo A.

19