CURSO TALLER

Familia
PROXIMO CURSO TALLER en MONTERREY 25 MAYO cupo LIMITADO INFORMES: http://vendeporinternet.weebly.com/

Sunday, November 22, 2009

La EstaDIOStica: NUMERATI


Shadow Monk
Originally uploaded by Hormiga
Esta como ya les platique es el último comentario de la serie EstaDIOStica; dicho sea de paso el término EstaDIOStica lo tome del libro Technotitlan Año Cero (Ciencia Ficción Mexicana, bastante bueno por cierto) escrito por nuestro buen amigo Luis García, pueden contactarlo a través de su blog “Desde Technotitlan” http://technotitlan.blogspot.com/.

En fin, nos toca en turno hablar de la Orden mas elusiva de la EstDIOStica y se define como seguidores del pensamiento DETERMINISTICO por definición es básicamente Anti-EstaDIOStica, es decir, antes de intentar resolver algo usando la Estadística, preferimos tratar de entender la dinámica de los procesos haciendo uso de sus funciones de transferencia y leyes físicas que las dominan.

Pensamos (Así es dije, pensamos, me considero practicante de esta orden) que al hacer uso de la estadística, tácitamente estamos aceptando nuestro desconocimiento del proceso; es decir subsidiamos nuestra ignorancia de nuestro proceso haciendo uso de técnicas estadísticas que NUNCA explican el porqué de las cosas y solo nos podrían dar indicios aproximados; en el mejor de los casos; del comportamiento de un sistema. La justificación de la Estadística es precisamente esa, que por muy poco esfuerzo (Mental) obtenemos resultados satisfactorios y esto es bueno en general (Lo mejor es enemigo de lo bueno), pero existen casos en que esto es insuficiente y ya lo comentaremos más adelante.

Los Deterministicos o Numerti no tenemos una organización jerárquica, más bien somos como los alquimistas de la EstaDIOStica, lobos solitarios y nos reunimos entre nosotros algunas veces para departir muy al estilo de los DRUIDAS, eso si, con unos buenos vinos tintos, queso y demás delicias (Esto sí es oficial)

Es difícil decir que tenemos un Santo Patrono, Pero podríamos hablar algunos de los NUMERATI del pasado que hicieron grandes aportaciones, entre ellos destacan Pierre Simón Laplace, mejor conocido por su Transformada e increíblemente poco conocido por haber desarrollado lo que hoy conocemos como Inferencia Bayesiana; Sir Isaac Newton autor ente otros libros “Philosophiae naturalis principia mathematica” y Padre del cálculo diferencial, John Nash, desarrollo la Teoría de Juegos y a últimas fechas Henri Poincaré, padre de la Teoría del Caos.

Los Numerati tratamos de encontrar la ecuación, que rige un sistema, es decir el modelo matemático, antes de pensar en usar la Estadística y déjenme poner un ejemplo para aclarar el punto.

Mañana dile a tus ingenieros que te digan cuánto tarda una canica en caer de una plataforma de 5 metros y de una plataforma de 100 metro, no dudo no tantito que alguno de ellos se subirá a un techo de 5 metros y diseñara un experimento con digamos 5 intentos y tomara las lecturas y luego encontrara una plataforma de 100 metros y volverá a lanzar una canica y tomar los 5 datos a continuación (Eso sí primero no te pregunta qué tipo de canica, cuánto debe pesar, cual es el color más adecuado, si existe en almacén, sino tiene que hablar con el proveedor de canicas etc.)

Muy probablemente después de una semana de preparativos y análisis usando Minitab llegaran a alguna conclusión parecida a la siguiente
Tiempo Promedio caída libre canica de 5 metros: 1.01 seg
Tiempo Promedio caída libre canica de 100 metros: 4.51 seg
Lo cual está bastante bien, el problema es que si queremos usar estos datos para inferir por ejemplo cuanto tardara en caer desde una plataforma de 30 metros nuestro ingeniero, en el mejor de los casos llegara a la conclusión o más bien MINITAB le dará la siguiente regresión T=30*0.0369+0.825 = 1.93 segundos, lo cual mis amigos es ligeramente incorrecto.

Veamos ahora usando La ecuación en general de caída libre

Y = Yo + Vo•t + (1/2)•a•t²

Y = H + 0•t +(1/2)•(-9.8)•t²

Y = H – 4.9•t²

Como en el suelo Y = 0:

0 = H - 4'9•t² , despejando

4'9•t² = H
t² = H/4'9

t = √(H/4'9)

o como fórmula algebraica, t = √(2h/g)

Usando entonces la formula que despejamos tendremos que el tiempo que tarda en caer una canica desde 30 metros es igual a 2.47 segundos lo que nos da un error de alrededor del 30%. (Variación estadística como dirían los SixSigmitos)

No solo eso vámonos mas allá; si quisiéramos extrapolar la regresión de nuestro experto en Minitab nos daría que para una altura de CERO usando la regresión el tiempo en caer seria T=0*0.0369+0.825 = 0.85 segundos, (Aterrador si consideramos que el mismo ingeniero es el que calcula presiones, temperaturas, voltajes y demás en nuestra planta).
Como ven no necesitábamos hacer diseño de experimentos si sabemos las ecuaciones que rigen el sistema; por favor no me mal interpreten la Estadística es sumamente útil en mucha aplicaciones y por cierto mis amigos Numerati se encuentran en general entre los mejores Estadísticos que conozco, lo que digo es que hay muchísimas más herramientas disponibles que en situaciones especificas dan mucho mejor resultado que la Estadística.

El ejemplo anterior se ve muy burdo y probablemente exagerado, pero cuantas veces hemos tenido problemas con un horno y hacemos diseños de experimentos para saber si el producto salió bien cuando en vez de esto pudimos haber usado las formulas de transferencia de calor; conducción, convección y radiación; o las veces que he visto que hicieron un diseño de experimentos para calculaban el tiempo necesario para calentar un tanque con agua; cuando calcularlo vía ecuaciones es sumamente fácil y directo.

Los NUMERATI contamos con un arsenal de herramientas más vasto que solo la estadística Frecuencista, de hecho el uso exhaustivo dl MINITAB o similares es un claro indicativo de un ingeniero con pocos recursos de solución de problemas.

Imaginemos que tenemos el problema de muy alta rotación y baja asistencia en nuestro personal, ¿qué podemos hacer a continuación?, que técnica podríamos utilizar; supongamos por un momento que ya agotamos los beneficios del diseño de experimentos y ahora ¿QUIEN PODRA DEFENDERNOS?; que les parece si le damos una oportunidad a otra herramienta y probamos digamos con Teoría de Juegos para que nos ayude y modelamos de la siguiente manera.

Operador Falta Operador Asiste
Empresa Sufre Falta -3 / -0.5 0 / 1
Empresa Goza Asiste 0.1 / -0.5 5 / 1

Vamos deshebrando esto un poquito,

Si el operador falta y la empresa se ve afectada (No saca la producción del día), esto le da -3 a Empresa y el castigo al operador por faltar se cuantifica -0.5

Si el operador asiste y la empresa se ve afectada, esto le da 0 a Empresa y el premio al operador será de 1.

Si el operador falta y la empresa gana algo, esto le da 0.1 a Empresa y el castigo al operador será de -.05.

Si el operador asiste y la empresa gana algo, esto le da 5 a Empresa y el castigo al operador será de 1.

Vemos que la estrategia dominante del Operador es efectivamente ASISTIR al trabajo y la estrategia dominante de la empresa es Gozar que el operador Asiste, lo interesante es que el EQUILIBRIO DE NASH se da justamente cuanto el Operador Asiste y la empresa le va bien porque el operador asista, entonces donde está el problema.
Siguiendo el análisis encontramos dos cosas.

Primero vemos que el Operador es insensible a que a la empresa le vaya bien, es decir, si el operador asiste, la empresa le paga si la producción sale o si la producción no sale, es decir a el operador no le importa, el recibe su pago por el día de trabajo.

Lo segundo que vemos es que el castigo por no venir es muy poco y el premio por si ir a trabajar es relativamente bajo.

Partiendo de estas conclusiones podríamos establecer 2 estrategias diferentes, una para cauda una de las conclusiones.
Primero establecer un premio al operador encadenado a la productividad, así si la meta se logra el operador recibe un premio y si no se logra el operador recibe un castigo.

LA segunda estrategia es lograr que el operador tenga muy claro en su mente que el ir a trabajar tiene un gran premio y el no ir representa una gran pérdida para él.

Se podrían establecer sistemas de premiación por puntualidad y en los años que he trabajado he encontrado los siguientes como los más efectivos (Puede que alguno no esté de acuerdo, pero de que funcionan, funcionan muy bien)

Cerveza (Promételes un cartón de cerveza por un mes de asistencia completa y veras lo que pasa)
Materiales de construcción
Útiles escolares (Especialmente en el periodo Julio-Octubre)
Carne Asada
Deportes.
Bonos de despensa

Una vez vi como una empresa tenía una rotación y ausentismo arriba del 5% y después de muchos intentos, programas y demás esta se habían rendido cuando a alguien se le ocurrió hacer un torneo de futbol media hora antes de la hora de entrada; como por arte de magia el ausentismo disminuyo a cerca del 1%.

Inclusive Existen paquetes computacionales para resolver este tipo de problemas, Gambit es uno de ellos.


Adam Smith Estaba Equivocado - The best bloopers are here

Me encanta Nash cuando dice “ If we all go for the blonde and block each other, not a single one of us is going to get her. So then we go for her friends, but they will all give us the cold shoulder because no on likes to be second choice. But what if none of us goes for the blonde? We won't get in each other's way and we won't insult the other girls. It's the only way to win. It's the only way we all get laid”; Las Matemáticas al servicio del Libido.

Pongamos ahora otro ejemplo:

Imagina que tenemos una línea de producción en la cual se tiene muy alta mezcla de productos y medio volumen y que cambiar de una familia a otra es muy tardado preparar las inyectoras de plástico (Este problema es real, y algunos lo quieren arreglar con Heiyunka,, el problema es que Heiyunka funciona para no más de 10 familias y para que esta técnica funcione el tiempo requerido en el cambio de modelo debe ser despreciable) (este problema es similar a establecer una ruta optima digamos para repartir papitas en las tienditas y supermercados). Y al final lo que deseamos hacer es optimizar la salida de producción; Que técnica podríamos usar en este caso.

Lo primero que debemos hacer es un MODELO de nuestra línea de producción y para eso hay varios paquetes computacionales, ARENA , Pro Model, Simulink, Ithink y mis favoritos a últimas fechas Netlogo, starlogo los cuales son más bien lenguajes de programación, por favor no piensen que es algo complicado, es inclusive más fácil de utilizar que MINITAB y no nos perdamos en que se requieren software de moda o muy costosos, el modelo original para probar el concepto lo desarrollamos en Excel, con Visual Basic (Hasta MINITAB se puede programar con MACROS, espero que no estén leyendo los SixSigmitos)
Ya creado el modelo lo siguiente es correr algoritmos de optimización, en ARENA se llama OptQuest, en Simulink se usa el paquete de Optimización de Matlab y en Excel se podría usar el SOLVER o apoyarse en algoritmo de optimización como el llamado Recosido Simulado (Annealing Simuated), (Genetic Algorithms; Algoritmos Genéticos también funciona muy bien) de la misma forma se puede trabajar con STARLOGO o NETLOGO.

Con estos sistemas se puede incrementar la producción en casi un 30% sin mover nada y podemos simular nuevos arreglos de maquinas (Layouts) en la computadora (Mock-up) sin tener que moverlas físicamente y probar muchas configuraciones diferentes antes de reacomodar el equipo.



Ya por ultimo quiero poner en la mesa un caso que mas y mas se está presentando en la industria y es el siguiente: Cada vez es mayor el uso de sistemas de almacenamiento de datos en la Industria, imagina la cantidad de registros y datos que tiene por ejemplo Walmart de las compras en sus tiendas, o la cantidad de movimientos monetarios que hace cualquier banco por mes, o en la industria, las bases de datos de los equipos de pruebas, los sensores e instrumentación de nuestros procesos o de plano la base de datos d los relojes checadores de hora de entrada y salida, toda esta información se puede utilizar para encontrar soluciones y optimizar patrones o salidas del proceso deseadas.

Tomemos un equipo de pruebas eléctricas que hace miles de mediciones al día y las almacena en la base de datos, será posible encontrar alguna técnica que nos ayude a encontrar la aguja en el pajar, (Ayúdanos Pancho Pantera) y la respuesta es MINERIA DE DATOS (De nuevo Minitab no es minería de datos, es un Excel con algunas funciones estadísticas), Podríamos usar técnicas como Arboles de decisión, Clustering, Redes Neuronales, Maquinas de vectores soportados etc. y con el uso de estas herramientas de Minería de datos podríamos darnos cuenta que cuando la resistencia 23 es baja (aun dentro de límites) y el capacitor 7 esta alto (De nuevo dentro de límites) la tarjeta electrónica tiene un 68.4% de probabilidad de fallar. GENIAL No lo creen), hay mucho software de Minería de datos en el mercado, algunos de ellos son inclusive gratuitos como Tanagra.



Esto es solo una muy somera muestra de la cantidad de herramientas que existen para analizar datos no solo paquetes de estadística frecuencista.

Ok, ya mostré algunas de las artes y herramientas de los Numerati y a continuación paso a dar los Pros y Contras que creo que existen.

Pros

El enfoque a conocer las ecuaciones deterministicas de los procesos le da a los Numerati una tremenda capacidad no solo para solucionar problemas existentes sino para mejorar inclusive radicalmente un proceso especifico, el conocimiento y dominio de herramientas como Simulación, Minería de Datos, Teoría de Juegos además de otras artes de las demás ordenes de la EstaDIOStica hacen de los NUMERATI altamente efectivos y muy rápidos en general para encontrar soluciones “fuera de la caja” a los problemas.

Contras

El contra es que son muy escasos y cuando digo escasos yo en los últimos 10 años no he conocido más de 5; generalmente ingenieros con maestrías en ciencias exactas y amantes de las matemáticas, no existe una escuela de Numerati, más bien el conocimiento se pasa de Maestro a Alumno como los Jedi y su padawan.

Conclusión

No quiero que me malinterpreten, no tengo nada en contra de Six Sigma, de hecho creo que es una excelente herramienta para disminuir variación, donde estoy en desacuerdo es en que ya sea Six Sigma, estadística frecuencista o cualquier otra metodología se autoproclame como la UNICA (Ungida?) metodología que realmente sirve, (De nuevo el parecido entre religiones y Ordenes de la EstaDIOStica se hace patente), me enfada el hecho en que se confunda el uso del Minitab o paquetes similares con conocimiento de Estadística, un Estadístico de a de veras es más probable que utilice un lenguaje llamado “R” el cual es eso, un lenguaje completito específicamente para jugar con la estadística y lo interesante es que es de uso general y es totalmente GRATUITO. Me llamaría mas la atencion si uno de mis ingenieros me pidiera el Matlab o como hace algunos meses uno de ellos me pidió el Ithink, software para simulaciones. (Una lagrima de felicidad corrió por mi mejilla).

Hay inclusive metodologías que no hemos mencionado como Reinforcement learning, Statistical Engineering con su QPDAC (Question, Plan, Data, Analysis y Conclusion), Metodo de elemento finito, Structural equation modeling, Cross entropy y muchas otras más que la verdad nos llevaría una eternidad comentarlas todas y no es el propósito de este blog, pero es bueno saber que existen y eventualmente de tener una necesidad especifica pues hacer uso de estas.

En cualquier caso, la EstaDIOStica está aquí para quedarse, creo que cada una de ellas encontrara su nicho especifico de aplicación, Six Sigma, reducción de costos; Cadenas de Marcov y Redes Bayesianas para Ingeniería de Mantenimiento, Minería de datos es aquellos empresas o equipos que generen grandes bases de datos; Teoría de juegos para negociaciones y resolución de conflictos y creo que la modelación de sistemas es la siguiente generación en ingeniería de manufactura mas allá de Kanbanes Justo a tiempo, sistema Toyota de manufactura, heiyunkas etc, y se verán cosas como Manufactura basada en agentes y Holonica, entre otras metodologías que revolucionaran las líneas y celdas de producción así como los sistemas de logística y materiales.

Espero haber generado algunas dudas, más que certidumbres y se animen a probar diferentes herramientas y metodologías y ya para terminar aquí les dejo un chiste Numerati si lo captas tenemos que tomarnos un café, Los Numerati debemos estar Unidos.

“Solo hay 10 tipos de personas en este mundo, los que conocen la numeración binaria y los que no”

Sunday, November 8, 2009

La EstaDIOStica: Cálculo Estocástico


God needs money
Originally uploaded by Tony Shi, NY-NJ

En el comentario pasado dije que hablar de los Bayesianos había sido el post mas difícil de escribir debido a diversas causas, especialmente a la complejidad y poca difusión de la Inferencia Bayesiana, pues déjenme decirles que la Orden de la EstaDIOStica de la que hoy vamos a tratar hace que los Bayesianos sean un juego de niños, no porque sea más compleja en sí misma, sino que en general su uso está muy fuera de nuestra esfera diaria y nunca la he visto usada en la industria. De hecho me vi muy tentado a no hablar de ella, pero tengo que hacerlo por una simple razón. La EstaDIOStica del Calculo Estocástico es la EstaDIOStica del DINERO.

Así es, el Cálculo Estocástico es la estadística que utilizan los Economistas (Matemáticas financieras) para jugar a mover el dinero en la Bolsa de valores, y no estamos hablando solo de precio de acciones, estamos hablando de Derivados, Futuros, Exóticos, Metales, Corrales (Hedges) etc. Y se utiliza para calcular y pronosticar el valor futuro de una acción y ponderar los riesgos inherentes y de esta forma calcular los retornos d dinero esperado con el fin de maximizar ganancias disminuyendo los riesgos de pérdida.

Pero como dijo Jack el destripador, vámonos por partes.
El santo patrono de esta Orden es Kiyoshi Itō.
Kiyoshi Ito, nace el 7 de septiembre de 1915 y fallece el 10 de noviembre del 2008, fue un matemático japonés cuyo trabajo se llama ahora el cálculo de Ito. El concepto básico de este cálculo es el integral de Ito, y el más básico de los resultados importantes es el lema de Ito. Facilita la comprensión matemática de sucesos aleatorios. Su teoría se aplica ampliamente, principalmente, en matemáticas financieras.

Para más información de Ito ver http://en.wikipedia.org/wiki/Kiyoshi_It%C5%8D

Voy a tratar de explicar con un ejemplo simple la Integral de Ito y veremos cuáles podrían ser algunas de las aplicaciones en la Industria.

La integral de Ito tiene la peculiaridad que propone que el resultado una parte es Determinística, o sea que puede explicarse mediante ecuaciones del sistema dinamico y una parte se explica por un ruido aleatorio. Imaginen un proceso en el cual nosotros sabemos la ecuación.

Y= f(x)

Lo que dice La integral de Ito es que la solución final debe ser algo más parecido a lo que sigue:

Y=f(x) + Ruido

Y de esta forma la Integral de Ito tiene dos partes y las llamaremos la parte Determinística a la parte donde están la función de x y la parte Estocástica (O probabilística) será la ecuación que cuantifique el ruido.

La integral de Ito podemos expresarse de la siguiente forma (No se me asusten, al rato la explicamos con naranjas).

[Ito-2] dP = m(t,P)dt+ s(t,P) df(t)

la primera parte de la ecuación m(t,P)dt es la como comentamos la parte Determinística y s(t,P) df(t) la parte Estocástica y específicamente a df(t) se le conoce como MOVIMIENTO BROWNIANO.

Imaginemos que compramos una acción de cierta compañía en el año 0 y nos costo $1.00 y creemos que nuestra acción va a subir de precio y que el precio va a subir digamos 1% anual, y entonces esperaríamos que el valor de nuestra acción en el tiempo se comportara de la siguiente forma:

Año 0: $1.00
Año 1: $1.01
Año 2: $1.0201
Año 3: $1.030301
Año 4: $1.040604
Año 5: $1.05101

Y como una grafica vale más que mil palabras



Como podemos ver el precio de nuestra acción tiene un crecimiento exponencial determinado.

LA parte Determinística de la Integral de Ito se soluciona muy fácilmente, como todos recordaran de la materia de Cálculo de kínder 1.

dM/dt=kM y Mo=M(0)  M(t)=M(0)exp(kt)

(Cuando fue la última vez que solucionaste una integral, derivada etc., esta de pensarse ingenieros)

Como ven calculando la parte Determinística nos pronostica el valor de nuestro acción dentro de algunos años, desgraciadamente nos damos cuenta que el valor que tiene nuestro acción es ligeramente diferente del que calculamos, digamos hace 10 años que es la fecha cuando lo compramos; entonces donde estuvo el fallo; pues que no hay fallo, lo que tenemos que hacer es ver la segunda parte de la Integral de Ito y encontraremos que hubo un poco de ruido y por eso el valor no coincide exactamente con el que nosotros habíamos calculado originalmente.

Nos dimos cuenta que hay algo de ruido en el sistema de la siguiente forma:




En las grafica con fondo amarillo vemos que el interés fue del 1.2%, la línea roja es el cálculo Determinístico y en verde tenemos que generamos un ruido mediante una computadora.

En la grafica con fondo celeste tenemos la misma curva Determinística y el ruido al ser aleatorio es ligeramente diferente, nomas que este es el de indicador real.




La grafica amarilla fue generada usando la Integral de Ito y la Grafica Azul es de hecho como se ha comportado S&P en los últimos 15 años.

Esta vez mi intención es presentar una forma de Estadistica que no utilizamos pero que podría tener utilidad práctica en nuestras actividades industriales. Personalmente creo que la Integral de Ito es una Genialidad; hemos platicado que un proceso tiene una componente Determinística y asumimos que dicho proceso también tiene una componente de ruido. En una regresión normal, lo que estamos tratando de obtener, por increíble que parezca, es la parte DETERMINÍSTICA y obviamos y esperamos que el ruido estocástico sea despreciable y de esta forma lo ignoramos, veamos algunos Pros y Contras y donde podríamos usarlo.

Pros:

Podríamos utilizar el Cálculo Estocástico en procesos donde una lectura depende en parte de la lectura anterior (Proceso Markoviano), por ejemplo en un tanque de formación donde el estado del electrolito depende el estado en el que estaba en el lote anterior (Porque este se desgasta) o calcular el desempeño de alguna proceso debido a degradación o desgaste; sistemas de moldeo; o sistemas productivos donde las variables de proceso cambien debido a crecimientos o reducciones; las tuberías se van llenado de incrustaciones y los flujos disminuyen; las torres de enfriamiento disminuyen su eficiencia debido al crecimiento de algas.

Este tipo de calculo obliga al ingeniero a tener un conocimiento profundo de su proceso ya que tiene que modelarlo y no trabajar con él como si fuera una caja negra y solo correlacionando entradas con salidas (DOE, Regresiones)

Contras:

Los contras son obvios, no hay ingenieros que sepan este tipo de estadística y no hay tampoco quien entrene ingenieros en este tipo de estadística. Y muy probablemente si alguno la estudiara y la aprendiera, este se dedicaría a trabajar en el negocio del dinero directamente donde seguramente ganaría mas y no en la industria maquiladora.

Conclusión:

El uso de Calculo Estocástico cambiaría radicalmente la forma de pensar de nuestros ingenieros de proceso, de hecho trabajarían realmente como ingenieros de proceso ya que requerirían aprender y modelar realmente su proceso y no como ahora que se la pasan usando Minitab y no tienen ni la más remota idea de que es lo que pasa en el piso, pero eso si saben hacer unas graficas preciosas.
Este comentario puede tener errores ya que debo ser honesto mi conocimiento acerca del Calculo Estocástico es muy poco, durante el último mes me dedique a estudiar el concepto y quede encantado con las posibilidades que se abren, así que decidí que este año le dedicare parte de mi tiempo de ocio a aprender esta área de las Matemáticas financieras.

Algunos links

http://www.matematicas.unam.mx/lars/pub/ede.pdf

http://148.206.47.226/test/sites/default/files/EDEst.pdf

http://www.stator-afm.com/ito-calculus.html