Documentos de Académico
Documentos de Profesional
Documentos de Cultura
MOT Aplicado A Problemas Multifísicos - Francisco Ramirez
MOT Aplicado A Problemas Multifísicos - Francisco Ramirez
Contenido
Introduccin
MEMS Electro-Termo-Mecnicos (ETM) Mtodo de Optimizacin Topolgica Computacin paralela en GPU
INTRODUCCIN
MEMS Electro-Termo-Mecnicos (ETM) Mtodo de Optimizacin Topolgica
Micro-escala
Mecanismos Flexibles
MEMS
Monolitica
Flexible
Estructura
O. Sigmund, On the Design of Compliant Mechanisms Using Topology Optimization, 1997
Sin ensamble
Sin lubricacin
http://www.ritsumei.ac.jp/~sugiyama/English/image/research/MEMS%20shokai.JPG
Actuacin embebida
Actuacin trmica
Ventajas
Fuerza
SMA
Desplazamiento
Densidad de trabajo
Fabricacin
Expansin Trmica
Electro-magntico Electrosttico Piezo-elctrico
Actuadores Trmicos
Actuador trmico pasivo
Distribucin de voltajes
La actuacin trmica activa es verstil, controlable y robusta, donde el efecto Joule es el principio activo ms comn. ste transforma la corriente elctrica en calor debido a la resistencia del material al flujo de corriente, dicho calor causa tensiones trmicas y stas a su vez producen la deformacin en la estructura.
Distribucin de temperaturas
multi-material
Actuador
Desplazamiento nodal
6
Problema trmico
: conductividad trmica : temperatura : tasa de generacin de calor/unidad de volumen 0 : temperatura impuesta + = 0 : coeficiente de conveccin = 2 (0 ) : flujo de calor prescrito : fronteras restringidas = 0 trmicamente.
+ = 0 = = 0
Simplificaciones usadas
Se considera slo pequeos desplazamientos; se genera pequeas deformaciones (regin elstica) Las propiedades del material no varan con la temperatura, por ende, la modelacin mediante elementos finitos es lineal. Los cambios en la geometra del MEMS debido a las deformaciones son ignoradas, y por ello se considera una nica malla fija en el MOT. No se considera la transferencia de calor por conveccin y radiacin.
Problema mecnico
1
+ = 0 = ( ( 0 ) = =
= 2 + +
, , : esfuerzo, deformacin y tensor elstico, : tensor de expansin trmica, : desplazamientos, en la frontera, : fuerzas de volumen y : traccin. 7
Mtodo de Galerkin
Problema Elctrico
+ + =0 + + = 0
Problema Electro-Trmico
2 2 2 + + 2 2 2
2 2 2
Problema termo-mecnico =
1 11 0
=0
+ +
= {
=
Diseo ptimo de MEMS ETM - F. Ramrez
DOMINIO DE DISEO
Condiciones de frontera
Diseo conceptual
Converge? S
Diseo final
10
Problema de optimizacin
0 1
Tal que: = 0
+ = 0
0 =0
: domino de diseo : restriccin de volumen : variable de diseo (pseudodensidad)
Sigmund, O. On the Design of Compliant Mechanisms Using Topology Optimization. 1997. Sigmund, O. Design of multiphysics actuators using topology optimization. 2001
11
Computacin paralela
Computacin serial
Computacin paralela
12
Arquitectura CPU
http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html
Un GPU es un procesador altamente paralelo, multihilos, de muchos ncleos con alto poder computacional.
Diseo ptimo de MEMS ETM - F. Ramrez
13
Paralelismo SIMD
GPU
Tarea 2
Tarea 3
Tarea 5
CPU
Tarea 1
Tarea 4
Tarea 6
Tarea 7
14
RESULTADOS
Topologas 3D Benchmark: GPU vs CPU
15
Actuador 3D
Sin filtro
Con filtro
Mximo de iteraciones del MOT: 200 Radio de filtro: 0 (no filter) y 4 Efs alrededor Factores de penalizacin: Elctrico: = 2 Trmico: = 2 Mecnico: = 3
16
88
55
100 80 60
Ensamble de [K]
MEF Trmico
151
119
=
160 140 120 80 100
TIEMPO (SEG.)
41
11
8000 64000 512000
401,E+03
201,E+02
TIME (SEG.)
0 1,E+01 1,E+00 1,E-01
SPEEDUP
1,E+00
Max. Speedup = 34
SPEEDUP
# DE ELEMENTOS FINITOS
54 11
1000 8000 64000 512000
[ke] on CPU
[ke] on GPU
[K] assembly
TIME (SEG.)
Max. Speedup = 88
La funcin sparse_create a pesar de ser calculado en CPU, es muy eficiente en trminos de tiempo computacional requerido y en manejo de memoria para la formacin de la matriz [K].
60 1,E+03 40 1,E+02 20
0 1,E+01 1,E+00
FEM Mecnico
33 34
40
33
35 30 20 25 15 10 5
[ke] on CPU
[ke] on GPU
[K] assembly
10
1,E-03
1000 8000 64000 512000 # # DE ELEMENTOS FINITOS
La implementacin en GPU siempre estuvo con tiempos inferiores a la implementacin serial en CPU, lo cual es un gran resultado, pues los ahorros en tiempos de ejecucin son significativos y ms si se consideran problemas con muchos elementos finitos. Diseo ptimo de MEMS ETM - F. Ramrez
[ke] on CPU
[ke] on GPU
[K] assembly
GPU Speedup
17
SPEEDUP
Solver lineal
ICPCG en el MEF trmico
1,9 1,7 1,4 1,3 2,0 1,8
Tiempo (seg.)
10 1,3 1,0 1
1,5
Speedup
Tiempo (seg.)
1,0
DOFs solucionados
CPU serial
GPU
Tiempo (seg.)
2,0
1,5 1,0 0,5
DOFs solucionados La aceleracin promedio es cercana a 2, que es para los problemas de mayor tamao, lo cual es considerable, pues se reduce a la mitad el tiempo de ejecucin.
10
CPU serial
GPU
GPU Speedup
1
27783
DOFs solucionados
Naumov. Incomplete-LU and Cholesky Preconditioned Iterative Methods Using CUSPARSE and CUBLAS. 2012.
CPU serial
GPU
GPU Speedup
18
Speedup
2,5
Trabajos futuros
Considerar fenmenos de transferencia de calor como la conveccin y la radiacin en el diseo de MEMS ETM 3D mediante el MOT. Adems se puede considerar la no linealidad del material y geomtrica. Implementar filtros ms avanzados en el diseo de MEMS ETM 3D mediante el MOT. Estudiar el efecto de los factores que influyen en los resultados del MOT usando tcnicas estadsticas. Implementar un criterio de convergencia para el MOT efectivo que evite iteraciones innecesarias de ste. Optimizar el cdigo desarrollado en GPU para un uso ptimo de este coprocesador. Implementar programacin paralela en GPU en otros problemas de optimizacin topolgica. Usar otros tipos de procesadores para la implementacin en paralelo de los cdigos, tales como CPU multincleos, Intel Xeon Phi, FPGA, etc.
Diseo ptimo de MEMS ETM - F. Ramrez
19
Gracias!
20