Está en la página 1de 9

ANALISIS DE DATOS

I. OBJETIVO

- Identificar las leyes que responden a los fenómenos físicos mediante el


análisis de datos.
- Aprender la representación de datos usando papeles gráficos y hojas de
cálculo.
- Aprender el método de regresión lineal por mínimos cuadrados para el ajuste
de curvas, haciendo uso de la calculadora científica y la hoja de cálculo más
popular MS-EXCELL.

II. FUNDAMENTO TEORICO

El problema de la ciencia experimental no se reduce a medir ciertas magnitudes


con la máxima precisión posible, sino, fundamentalmente, buscar una ley
cuantitativa entre dos o más magnitudes que están variando de manera
correlacionada.
Supongamos que el fenómeno que se quiere estudiar dependa de dos
magnitudes 𝑥 e 𝑦. La ley que gobierna este fenómeno relaciona una magnitud
con la otra de tal manera que durante una serie de experimentos se determinan
los valores de una de ellas (variable dependiente, generalmente 𝑦) que
corresponden a los distintos valores de la otra (variable independiente,
generalmente 𝑥 ).
El trabajo de laboratorio tiene como fruto una serie de datos experimentales
representados, normalmente por un conjunto discreto de 𝑁 pares de datos
{𝑥𝑖, 𝑦𝑖}, siendo 𝑖 un índice natural que varía de 1 a 𝑁. La manipulación de datos
tiende normalmente a uno de estos dos objetivos:

1) Determinar una ley experimental, o


2) Comprobar una ley experimental previamente supuesta.

En cualquier caso, esa ley se expresa en forma de una función 𝑦 = 𝑓(𝑥) que
exprese de forma fidedigna la correlación entre 𝑥 e 𝑦.
Entonces, el problema radica en encontrar un método que sea capaz de
determinar la función que mejor describe a una serie de puntos experimentales,
además, tener un criterio para conocer lo parecido o diferentes que son estos
puntos respecto de la ley 𝑓(𝑥)propuesta.
Cuando se busca una fórmula de este tipo se dice que se está buscando una
regresión entre esas dos variables. Por tanto, hallar una regresión entre dos
variables se refiere siempre a hallar una fórmula o ecuación que represente la
relación aproximada entre esas dos variables.

NUBE DE PUNTOS

Para estudiar y medir la relación entre dos variables, el primer paso es recoger
los datos que muestren los correspondientes valores de las variables
consideradas. El segundo paso, es representar en un gráfico cartesiano (𝑥, 𝑦). A
este conjunto de puntos que así se obtiene se suele denominar diagrama de
dispersión o más sencillamente nube de puntos.
Con el diagrama de dispersión, es posible frecuentemente representar una curva
que se aproxime a los datos, tal curva se llama curva de aproximación. En la
mayor parte de parte de las nubes de puntos obtenidas a partir de casos reales
es difícil imaginarse cuál sería la mejor curva de aproximación, y generalmente,
hay que optar por una determinada que se suele denominar curva de ajuste.

MÉTODO DE REGRESIÓN POR MÍNIMOS CUADRADOS

Conocida en inglés como least-squares fit (ajuste por mínimos cuadrados). Es


una herramienta muy poderosa para determinar la función o curva que mejor
describe a una serie de puntos experimentales. El primer caso sencillo donde se
aplicó este método fue para una distribución unidimensional de datos {𝑥𝑖} que
consistió en determinar el valor medio, es decir, el número real 𝑥̅, que mejor
representa a la distribución 𝑥𝑖.

REGRESIÓN LINEAL

El segundo caso sencillo para aplicar el método de mínimos cuadrados


corresponde a una distribución de pares ordenados {𝑥𝑖 , 𝑦𝑖} que se pretende
ajustar a una línea recta. Analíticamente, optamos por buscar una recta de
ajuste que se adecue mejor a nuestra nube de puntos, cuya ecuación es

𝑦(𝑥) = 𝑎 + 𝑏𝑥 (1)

Esta recta de ajuste seleccionada es la llamada recta de regresión por


mínimos cuadrados que se obtiene seleccionando de entre todas las rectas de
ajuste posibles, aquélla que hace mínimo la suma de los cuadrados de las
distancias verticales (residuos) de los puntos a la recta, es decir:

𝑁 χ2(𝑎 ,𝑏) = [ 𝑦𝑖 −
(𝑎 + 𝑏𝑖)]2

desarrollando el cuadrado se obtiene:

𝜒2(𝑎 ,𝑏) = ∑ 𝑦𝑖2 + 𝑁𝑎2 + 𝑏2 ∑ 𝑥𝑖2 − 2𝑎 ∑ 𝑦𝑖 − 2𝑏 ∑ 𝑥𝑖 𝑦𝑖 + 2𝑎𝑏 ∑ 𝑥𝑖

Esta expresión depende de las variables 𝑎 , 𝑏 y de los parámetros 𝑁, ∑ 𝑥𝑖 , ∑ 𝑦𝑖 ,


∑ 𝑥𝑖𝑦𝑖 , ∑ 𝑥𝑖2 , ∑ 𝑦𝑖2. El conocimiento de estos parámetros que se calculan a partir
de la distribución {𝑥𝑖 , 𝑦𝑖} permite obtener todas las respuestas del problema. Para
obtener los cálculos más eficaces de 𝑎 y 𝑏 se resuelve el sistema de
ecuaciones:

𝜕𝜒2 𝜕𝜒2
=0 ∧ =0
𝜕𝑎 𝜕𝑏

Este sistema de ecuaciones es lineal y su solución es:

𝑎=∑
𝑖
𝑦 − 𝑏∙∑𝑥 (2)
𝑛
𝑏 𝑛∙𝑛∑∙∑𝑥 𝑥𝑦𝑖 −− ∑(∑𝑥𝑥∙𝑖∑)2𝑦 (3)

Una vez que se tienen los valores del intercepto 𝑎 y de la pendiente 𝑏 es


necesario expresar de forma cuantitativa y cualitativa la calidad de ajuste.
Por calidad se entiende, intuitivamente, lo que se separan los puntos
experimentales 𝑦𝑖 de la predicción de la recta 𝑦 = 𝑎 + 𝑏𝑥 .
Cuantitativamente, la calidad de ajuste viene expresada numéricamente por el
valor del residuo medio y del coeficiente de correlación. El coeficiente de
correlación se define como:

𝑟 𝑛∙∑ 𝑥 𝑦 − ∑𝑥 ∙∑𝑦
(4)

este coeficiente expresa la calidad del ajuste en forma relativa, es un número sin
unidades, y está ligado al chi-cuadrado 𝜒2

𝜒 (5)
𝑛

y al residuo medio 𝜎

𝛘𝟐
𝛔= √ 𝟐
(6)
(𝐧− )
de forma que:
(
7
𝜒2 = 0 si y solo si 𝑟=1 )
Por lo que, cuanto más cercano a 1 sea el valor de 𝑟, mejor será el ajuste. Es
posible demostrar que ´𝑟 nunca puede ser mayor que 1.
Cualitativamente, una buena forma de determinar la calidad de un ajuste es
observar la gráfica de los puntos experimentales y compararla con la recta
obtenida. El ajuste será bueno si la línea recta pasa por entre los puntos,
dejando la misma cantidad de puntos a un semiplano y a otro de los que define
la recta.

UTILIZACIÓN DE PAPELES GRÁFICOS

1. La serie de datos experimentales obtenidos en el laboratorio tienen que ser


graficadas en papel milimetrado.
2. Comparar la distribución de los puntos obtenidos con alguna de las funciones
conocidas. En el presente laboratorio nos proponemos realizar los ajustes a
funciones lineales (𝑦 = 𝑎 + 𝑏𝑥), potenciales ( 𝑦 = 𝑎 𝑥𝑏,𝑏  0 𝑦 1 ) y
exponenciales ( 𝑦 = 𝑎 𝑒𝑏𝑥).
3. Si la nube de puntos representados en la gráfica es de tendencia lineal se
procede a realizar el ajuste correspondiente usando el método de regresión
lineal por mínimos cuadrados.
4. Si la distribución de los puntos es no lineal, buscaremos linealizarla del
siguiente modo:
5. Graficar en papel logarítmico los 𝑛 pares de datos experimentales (sin
necesidad de tomar logaritmos a cada uno de ellos). Si se obtiene una
distribución lineal, entonces, con certeza estamos frente a una función
potencial. De no obtener una distribución lineal, entonces,
6. Graficar en papel semi-logarítmico los 𝑛 pares de datos experimentales. Si se
obtiene una distribución lineal, entonces, con certeza estamos frente a una
función de tipo exponencial.
Recomendaciones:

1. Las gráficas en el papel milimetrado deben ocupar la mayor área. Para esto,
se deben adecuar convenientemente las escalas de los ejes los que no
necesariamente serán iguales. Utilizar como factor de escala números que
permitan cálculos sencillos.
2. En los ejes de las gráficas solo se deben presentar algunos números
representativos que indiquen cómo varía la escala.
3. Las rectas o curvas que se grafiquen deben ser continuas y suaves y que
pasen por la mayor densidad de puntos.
4. Para determinar la pendiente en el caso que la gráfica sea una recta, se debe
construir un triángulo rectángulo a partir de dos puntos bien separados que
pertenezcan a la recta y cuyos catetos sean paralelos a los ejes coordenados.
De esta manera se minimizan los errores relativos de construcción y de
medición de los catetos y la pendiente se calcula como 𝑦/𝑥.
El análisis de datos mediante este método es tedioso y pueden provocar errores,
en la actualidad se pueden hacer uso de herramientas tales como:

EL ORDENADOR

Se pueden construir programas en C, Fortran, Pascal o Basic para hacer los


ajustes que se requieran. También se puede usar programas como el Gnupolt y
el Excel que permiten mostrar la gráfica y obtener la curva y la ecuación de
regresión con su respectivo coeficiente de correlación.
Como apéndice, al final del documento se muestra el procedimiento para el Excel
2010.

LA CALCULADORA CIENTÍFICA

Las calculadoras científicas actuales se pueden realizar además de la Regresión


Lineal los siguientes cálculos estadísticos (STAT).
El recuadro corresponde al Calculador Científico CASIO 𝑓𝑥 − 115𝐸𝑆; 𝑓𝑥 −
570𝐸𝑆; 𝑓𝑥 − 991𝐸𝑆.
Véase la sección S-43 del manual y el apéndice de este calculador.

EXTENSIÓN DEL MÉTODO DE REGRESIÓN LINEAL

El estudio de este método, relativamente sencillo, tiene doble interés: de un lado,


este tipo de dependencia es frecuente entre magnitudes físicas, de otro lado,
muchas otras dependencias más complicadas pueden reducirse a esta sencilla
mediante un cambio de variable adecuado.

Funci Cambio Form


ón a

inicial linea
l
2
𝑦 = 𝑎𝑥 𝑦=
𝑎𝑧
𝑦 𝑦=
𝑎𝑧
𝑦 = 𝑎𝑥𝑛 ln(𝑦) = 𝑌 ; ln(𝑎) = 𝑏 ; ln(𝑥) = 𝑋 𝑌=𝑏
+ 𝑛𝑋
𝑦=𝑎 ln(𝑦) = 𝑌 ; ln(𝑎) = 𝑏 𝑌=𝑏
exp + 𝑛𝑥
(𝑛𝑥)

III. EQUIPOS Y MATERIALES

Hoja de papel milimetrado


Hoja de papel logarítmico
Hoja de papel semi-logarítmico
Calculadora científica

IV. DATOS EXPERIMENTALES

Usaremos la siguiente tabla de datos experimentales para el propósito de


graficar y desarrollar la técnica de regresión.

Mediciones1 2 3 4 5 6 7 8 9 10
L (m) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
T (s) 1.55 2.20 2.69 3.11 3.48 3.81 4.11 4.40 4.66 4.92
V. ANÁLISIS DE DATOS EXPERIMENTALES

Gráficas y ajustes.

1. Usando papeles gráficos


1.1. Graficar 𝑇 = 𝑇(𝐿) en papel milimetrado.
1.2. Graficar 𝑇 = 𝑇(𝐿) en papel semilogarítmico.
1.3. Graficar 𝑇 = 𝑇(𝐿) en papel logarítmico.
1.4. A partir de las gráficas en 1.2 y 1.3 ¿Qué puede afirmar acerca de la
tendencia de la distribución de puntos de la gráfica en papel
milimetrado?
1.5. Una vez identificado el tipo de distribución, ¿qué cambio(s) de
variable(s) serán necesarios realizar para aplicar el método de regresión
lineal por mínimos cuadrados? Complete la tabla.

𝑥=𝐿 𝑦=𝑇
0.1 1.55
0.2 2.20
⋮ ⋮
1.6. Calcule la pendiente, el intercepto y el coeficiente de correlación de las
nuevas variables.
1.7. Por último, calcule las constantes que acompañan a sus variables
originales 𝑥 y 𝑦.

2. Usando la hoja de cálculo Excel.


2.1. Presente una gráfica en escala milimetrada,
logarítmica y semilogarítmico.
2.2. En su gráfica en escala logarítmica presente las líneas de tendencia
potencial exponencial, presente también la ecuación y el coeficiente de
correlación para cada una de ellas.

Observación: Vea el procedimiento en el apéndice 2.

3. Usando la calculadora científica.


3.1. Usted debe tener certeza acerca del tipo de función de distribución, a
partir del análisis de gráficos.
3.2. Escoja en su calculadora el tipo de cálculo estadístico apropiado. Siga
las instrucciones del manual de su calculadora.
3.3. Calcule los coeficientes de la función de distribución y el coeficiente de
correlación.

VI. CUESTIONARIO

1. Analizando los valores obtenidos para los coeficientes de correlación usando


regresión lineal, regresión potencial y regresión exponencial, diga ¿cuál de las
regresiones ajusta mejor la distribución de puntos? Confronte su respuesta
analizando las gráficas obtenidos con el Excel.
2. Teóricamente se conoce que el periodo de oscilación para un péndulo simple
es 𝑇 = 2𝜋√𝐿⁄𝑔, donde 𝑔 = 9.8 m/s2 es la aceleración de la
gravedad. Entonces, comparando esta ecuación con las ecuaciones
experimentales 𝑇 = 𝑇(𝐿) obtenida en (1.7), (2.2) y (3.3), encuentre el valor
experimental de la gravedad.
3. ¿A qué se denomina interpolación y extrapolación?
4. Calcule el valor de 𝑇 para 𝐿 = 45 cm y 110 cm.
5. Conociendo la ecuación teórica, realice el siguiente cambio e variable 𝑧 = .
¿Qué tipo de tipo de relación hay ahora entre 𝑇 y 𝑧? Grafique en papel
milimetrado esta nueva relación de variables y realice el ajuste
correspondiente. Presente la ecuación 𝑇 = 𝑇(𝐿) que se obtiene según este
método.

OBSERVACION: Hasta aquí se ha trabajado solamente con dos variables, el


procedimiento para encontrar la ecuación que las relaciona se llama regresión
simple. Cuando se trata de dos o más variables de llama regresión múltiple. El
siguiente problema es un caso de este último.

6. Un experimento consistió en investigar el tiempo para vaciar el recipiente por


un orificio en el fondo, encontrándose que el tiempo depende del tamaño del
orificio y de la cantidad de agua que contiene.

Los valores obtenidos durante el experimento son:


H (cm) 30 10 4 1
D (cm) ´t (seg) ´t ( seg) ´t ( seg) ´t (seg)
1.5 73.0 43.5 26.7 13.5
2 41.2 23.7 15.0 7.2
3 18.4 10.5 6.8 3.7
5 6.8 3.9 2.2 1.5

Haciendo uso de los papeles gráficos y del método regresión por mínimos
cuadrados, determinar:
a. La ecuación 𝑡 = 𝑓(𝐻).
b. La ecuación 𝑡 = 𝑓(𝐷).
c. La ecuación 𝑡 = 𝑓(𝐻, 𝐷).
d. El valor de 𝑡 cuando 𝐻 = 20 cm y 𝐷 = 4 ( interpolación)
e. El valor de 𝑡 cuando 𝐻 = 40 cm y 𝐷 = 6 (extrapolación)

7. Graficar usando la carta polar (a mano) y también usando el Excel en este


caso el ángulo  debe expresarse en radianes. Identifique cada gráfica.
a) 𝑟 = 4 𝑠𝑒𝑛 2 b) 𝑟 = 4/ (1 − 𝑐𝑜𝑠 ) c) 𝑟2 = 4
d) 𝑙𝑜𝑔 𝑟 = 𝑎 , donde 𝑎 es una constante.

VII. CONCLUSIONES Y RECOMENDACIONES.

VIII. BIBLIOGRAFÍA

Autor. Título. Editorial. Fecha de impresión. Lugar de Impresión. Número de


páginas consultadas. Indicaciones para usar el Excel

IX. APENDICE

4. Breve guía para graficar con Excel:


5. Breve guía para so de la calculadora.

PROCEDIMIENTO PARA USAR LA FUNCION REGRESIÓN (REG)


(Scientific Calculator CASIO fx-82TL S-V.P.A.M.)
MODE 3
1. Para ingresar a la función REG oprima

2. Usted puede elegir 6 tipos de regresiones:


1 Lin (Lineal) 1 Pwr (Potencial)
2 Log (Logarítmica) 2 Inv (Inversa)
3 Exp (Exponencial) 3 Quad (Cuadrática)
SHIFT Scl =
3. Para borrar datos de la memoria oprima

4. Para ingresar datos: Se ingresan uno a uno los pares de datos.

, DT
Por ejemplo, para (5,12) se pulsarán las teclas: 5 12

5. Para calcular los Coeficientes de Regresión A , B:, C y el coeficiente de


correlación
( r):
Función Lineal y = A + Bx
Función Potencial y = A exp (Bx)
Función Cuadrática y = A + Bx +
Cx2
SHIFT C =
A : C : SHIFT A =

SHIFT B = SHIFT r =
B : r :

6. Para hallar el valor de (y) cuando se conoce el valor de (x)


SHIFT
Por ejemplo, para x = 20 se pulsarán las teclas 20

Regresión lineal
Estimación Lineal
Manual de regresión lineal en Excel
Análisis de graficas
Análisis de regresión
Casio, Manual. Modelo𝑓𝑥 − 115𝐸𝑆; 𝑓𝑥 − 570𝐸𝑆; 𝑓𝑥 − 991𝐸𝑆,
Casio, Apéndice. Modelo 𝑓𝑥 − 115𝐸𝑆; 𝑓𝑥 − 570𝐸𝑆; 𝑓𝑥 − 991𝐸𝑆,
Gnuplot, http://www.gnuplot.info/download.html

También podría gustarte