Sunday, November 22, 2009
La EstaDIOStica: NUMERATI
En fin, nos toca en turno hablar de la Orden mas elusiva de la EstDIOStica y se define como seguidores del pensamiento DETERMINISTICO por definición es básicamente Anti-EstaDIOStica, es decir, antes de intentar resolver algo usando la Estadística, preferimos tratar de entender la dinámica de los procesos haciendo uso de sus funciones de transferencia y leyes físicas que las dominan.
Pensamos (Así es dije, pensamos, me considero practicante de esta orden) que al hacer uso de la estadística, tácitamente estamos aceptando nuestro desconocimiento del proceso; es decir subsidiamos nuestra ignorancia de nuestro proceso haciendo uso de técnicas estadísticas que NUNCA explican el porqué de las cosas y solo nos podrían dar indicios aproximados; en el mejor de los casos; del comportamiento de un sistema. La justificación de la Estadística es precisamente esa, que por muy poco esfuerzo (Mental) obtenemos resultados satisfactorios y esto es bueno en general (Lo mejor es enemigo de lo bueno), pero existen casos en que esto es insuficiente y ya lo comentaremos más adelante.
Los Deterministicos o Numerti no tenemos una organización jerárquica, más bien somos como los alquimistas de la EstaDIOStica, lobos solitarios y nos reunimos entre nosotros algunas veces para departir muy al estilo de los DRUIDAS, eso si, con unos buenos vinos tintos, queso y demás delicias (Esto sí es oficial)
Es difícil decir que tenemos un Santo Patrono, Pero podríamos hablar algunos de los NUMERATI del pasado que hicieron grandes aportaciones, entre ellos destacan Pierre Simón Laplace, mejor conocido por su Transformada e increíblemente poco conocido por haber desarrollado lo que hoy conocemos como Inferencia Bayesiana; Sir Isaac Newton autor ente otros libros “Philosophiae naturalis principia mathematica” y Padre del cálculo diferencial, John Nash, desarrollo la Teoría de Juegos y a últimas fechas Henri Poincaré, padre de la Teoría del Caos.
Los Numerati tratamos de encontrar la ecuación, que rige un sistema, es decir el modelo matemático, antes de pensar en usar la Estadística y déjenme poner un ejemplo para aclarar el punto.
Mañana dile a tus ingenieros que te digan cuánto tarda una canica en caer de una plataforma de 5 metros y de una plataforma de 100 metro, no dudo no tantito que alguno de ellos se subirá a un techo de 5 metros y diseñara un experimento con digamos 5 intentos y tomara las lecturas y luego encontrara una plataforma de 100 metros y volverá a lanzar una canica y tomar los 5 datos a continuación (Eso sí primero no te pregunta qué tipo de canica, cuánto debe pesar, cual es el color más adecuado, si existe en almacén, sino tiene que hablar con el proveedor de canicas etc.)
Muy probablemente después de una semana de preparativos y análisis usando Minitab llegaran a alguna conclusión parecida a la siguiente
Tiempo Promedio caída libre canica de 5 metros: 1.01 seg
Tiempo Promedio caída libre canica de 100 metros: 4.51 seg
Lo cual está bastante bien, el problema es que si queremos usar estos datos para inferir por ejemplo cuanto tardara en caer desde una plataforma de 30 metros nuestro ingeniero, en el mejor de los casos llegara a la conclusión o más bien MINITAB le dará la siguiente regresión T=30*0.0369+0.825 = 1.93 segundos, lo cual mis amigos es ligeramente incorrecto.
Veamos ahora usando La ecuación en general de caída libre
Y = Yo + Vo•t + (1/2)•a•t²
Y = H + 0•t +(1/2)•(-9.8)•t²
Y = H – 4.9•t²
Como en el suelo Y = 0:
0 = H - 4'9•t² , despejando
4'9•t² = H
t² = H/4'9
t = √(H/4'9)
o como fórmula algebraica, t = √(2h/g)
Usando entonces la formula que despejamos tendremos que el tiempo que tarda en caer una canica desde 30 metros es igual a 2.47 segundos lo que nos da un error de alrededor del 30%. (Variación estadística como dirían los SixSigmitos)
No solo eso vámonos mas allá; si quisiéramos extrapolar la regresión de nuestro experto en Minitab nos daría que para una altura de CERO usando la regresión el tiempo en caer seria T=0*0.0369+0.825 = 0.85 segundos, (Aterrador si consideramos que el mismo ingeniero es el que calcula presiones, temperaturas, voltajes y demás en nuestra planta).
Como ven no necesitábamos hacer diseño de experimentos si sabemos las ecuaciones que rigen el sistema; por favor no me mal interpreten la Estadística es sumamente útil en mucha aplicaciones y por cierto mis amigos Numerati se encuentran en general entre los mejores Estadísticos que conozco, lo que digo es que hay muchísimas más herramientas disponibles que en situaciones especificas dan mucho mejor resultado que la Estadística.
El ejemplo anterior se ve muy burdo y probablemente exagerado, pero cuantas veces hemos tenido problemas con un horno y hacemos diseños de experimentos para saber si el producto salió bien cuando en vez de esto pudimos haber usado las formulas de transferencia de calor; conducción, convección y radiación; o las veces que he visto que hicieron un diseño de experimentos para calculaban el tiempo necesario para calentar un tanque con agua; cuando calcularlo vía ecuaciones es sumamente fácil y directo.
Los NUMERATI contamos con un arsenal de herramientas más vasto que solo la estadística Frecuencista, de hecho el uso exhaustivo dl MINITAB o similares es un claro indicativo de un ingeniero con pocos recursos de solución de problemas.
Imaginemos que tenemos el problema de muy alta rotación y baja asistencia en nuestro personal, ¿qué podemos hacer a continuación?, que técnica podríamos utilizar; supongamos por un momento que ya agotamos los beneficios del diseño de experimentos y ahora ¿QUIEN PODRA DEFENDERNOS?; que les parece si le damos una oportunidad a otra herramienta y probamos digamos con Teoría de Juegos para que nos ayude y modelamos de la siguiente manera.
Operador Falta Operador Asiste
Empresa Sufre Falta -3 / -0.5 0 / 1
Empresa Goza Asiste 0.1 / -0.5 5 / 1
Vamos deshebrando esto un poquito,
Si el operador falta y la empresa se ve afectada (No saca la producción del día), esto le da -3 a Empresa y el castigo al operador por faltar se cuantifica -0.5
Si el operador asiste y la empresa se ve afectada, esto le da 0 a Empresa y el premio al operador será de 1.
Si el operador falta y la empresa gana algo, esto le da 0.1 a Empresa y el castigo al operador será de -.05.
Si el operador asiste y la empresa gana algo, esto le da 5 a Empresa y el castigo al operador será de 1.
Vemos que la estrategia dominante del Operador es efectivamente ASISTIR al trabajo y la estrategia dominante de la empresa es Gozar que el operador Asiste, lo interesante es que el EQUILIBRIO DE NASH se da justamente cuanto el Operador Asiste y la empresa le va bien porque el operador asista, entonces donde está el problema.
Siguiendo el análisis encontramos dos cosas.
Primero vemos que el Operador es insensible a que a la empresa le vaya bien, es decir, si el operador asiste, la empresa le paga si la producción sale o si la producción no sale, es decir a el operador no le importa, el recibe su pago por el día de trabajo.
Lo segundo que vemos es que el castigo por no venir es muy poco y el premio por si ir a trabajar es relativamente bajo.
Partiendo de estas conclusiones podríamos establecer 2 estrategias diferentes, una para cauda una de las conclusiones.
Primero establecer un premio al operador encadenado a la productividad, así si la meta se logra el operador recibe un premio y si no se logra el operador recibe un castigo.
LA segunda estrategia es lograr que el operador tenga muy claro en su mente que el ir a trabajar tiene un gran premio y el no ir representa una gran pérdida para él.
Se podrían establecer sistemas de premiación por puntualidad y en los años que he trabajado he encontrado los siguientes como los más efectivos (Puede que alguno no esté de acuerdo, pero de que funcionan, funcionan muy bien)
Cerveza (Promételes un cartón de cerveza por un mes de asistencia completa y veras lo que pasa)
Materiales de construcción
Útiles escolares (Especialmente en el periodo Julio-Octubre)
Carne Asada
Deportes.
Bonos de despensa
Una vez vi como una empresa tenía una rotación y ausentismo arriba del 5% y después de muchos intentos, programas y demás esta se habían rendido cuando a alguien se le ocurrió hacer un torneo de futbol media hora antes de la hora de entrada; como por arte de magia el ausentismo disminuyo a cerca del 1%.
Inclusive Existen paquetes computacionales para resolver este tipo de problemas, Gambit es uno de ellos.
Sunday, November 8, 2009
La EstaDIOStica: Cálculo Estocástico
En el comentario pasado dije que hablar de los Bayesianos había sido el post mas difícil de escribir debido a diversas causas, especialmente a la complejidad y poca difusión de la Inferencia Bayesiana, pues déjenme decirles que la Orden de la EstaDIOStica de la que hoy vamos a tratar hace que los Bayesianos sean un juego de niños, no porque sea más compleja en sí misma, sino que en general su uso está muy fuera de nuestra esfera diaria y nunca la he visto usada en la industria. De hecho me vi muy tentado a no hablar de ella, pero tengo que hacerlo por una simple razón. La EstaDIOStica del Calculo Estocástico es la EstaDIOStica del DINERO.
Así es, el Cálculo Estocástico es la estadística que utilizan los Economistas (Matemáticas financieras) para jugar a mover el dinero en la Bolsa de valores, y no estamos hablando solo de precio de acciones, estamos hablando de Derivados, Futuros, Exóticos, Metales, Corrales (Hedges) etc. Y se utiliza para calcular y pronosticar el valor futuro de una acción y ponderar los riesgos inherentes y de esta forma calcular los retornos d dinero esperado con el fin de maximizar ganancias disminuyendo los riesgos de pérdida.
Pero como dijo Jack el destripador, vámonos por partes.
El santo patrono de esta Orden es Kiyoshi Itō.
Kiyoshi Ito, nace el 7 de septiembre de 1915 y fallece el 10 de noviembre del 2008, fue un matemático japonés cuyo trabajo se llama ahora el cálculo de Ito. El concepto básico de este cálculo es el integral de Ito, y el más básico de los resultados importantes es el lema de Ito. Facilita la comprensión matemática de sucesos aleatorios. Su teoría se aplica ampliamente, principalmente, en matemáticas financieras.
Para más información de Ito ver http://en.wikipedia.org/wiki/Kiyoshi_It%C5%8D
Voy a tratar de explicar con un ejemplo simple la Integral de Ito y veremos cuáles podrían ser algunas de las aplicaciones en la Industria.
La integral de Ito tiene la peculiaridad que propone que el resultado una parte es Determinística, o sea que puede explicarse mediante ecuaciones del sistema dinamico y una parte se explica por un ruido aleatorio. Imaginen un proceso en el cual nosotros sabemos la ecuación.
Y= f(x)
Lo que dice La integral de Ito es que la solución final debe ser algo más parecido a lo que sigue:
Y=f(x) + Ruido
Y de esta forma la Integral de Ito tiene dos partes y las llamaremos la parte Determinística a la parte donde están la función de x y la parte Estocástica (O probabilística) será la ecuación que cuantifique el ruido.
La integral de Ito podemos expresarse de la siguiente forma (No se me asusten, al rato la explicamos con naranjas).
[Ito-2] dP = m(t,P)dt+ s(t,P) df(t)
la primera parte de la ecuación m(t,P)dt es la como comentamos la parte Determinística y s(t,P) df(t) la parte Estocástica y específicamente a df(t) se le conoce como MOVIMIENTO BROWNIANO.
Imaginemos que compramos una acción de cierta compañía en el año 0 y nos costo $1.00 y creemos que nuestra acción va a subir de precio y que el precio va a subir digamos 1% anual, y entonces esperaríamos que el valor de nuestra acción en el tiempo se comportara de la siguiente forma:
Año 0: $1.00
Año 1: $1.01
Año 2: $1.0201
Año 3: $1.030301
Año 4: $1.040604
Año 5: $1.05101
Y como una grafica vale más que mil palabras
Como podemos ver el precio de nuestra acción tiene un crecimiento exponencial determinado.
LA parte Determinística de la Integral de Ito se soluciona muy fácilmente, como todos recordaran de la materia de Cálculo de kínder 1.
dM/dt=kM y Mo=M(0) M(t)=M(0)exp(kt)
(Cuando fue la última vez que solucionaste una integral, derivada etc., esta de pensarse ingenieros)
Como ven calculando la parte Determinística nos pronostica el valor de nuestro acción dentro de algunos años, desgraciadamente nos damos cuenta que el valor que tiene nuestro acción es ligeramente diferente del que calculamos, digamos hace 10 años que es la fecha cuando lo compramos; entonces donde estuvo el fallo; pues que no hay fallo, lo que tenemos que hacer es ver la segunda parte de la Integral de Ito y encontraremos que hubo un poco de ruido y por eso el valor no coincide exactamente con el que nosotros habíamos calculado originalmente.
Nos dimos cuenta que hay algo de ruido en el sistema de la siguiente forma:
En las grafica con fondo amarillo vemos que el interés fue del 1.2%, la línea roja es el cálculo Determinístico y en verde tenemos que generamos un ruido mediante una computadora.
En la grafica con fondo celeste tenemos la misma curva Determinística y el ruido al ser aleatorio es ligeramente diferente, nomas que este es el de indicador real.
La grafica amarilla fue generada usando la Integral de Ito y la Grafica Azul es de hecho como se ha comportado S&P en los últimos 15 años.
Esta vez mi intención es presentar una forma de Estadistica que no utilizamos pero que podría tener utilidad práctica en nuestras actividades industriales. Personalmente creo que la Integral de Ito es una Genialidad; hemos platicado que un proceso tiene una componente Determinística y asumimos que dicho proceso también tiene una componente de ruido. En una regresión normal, lo que estamos tratando de obtener, por increíble que parezca, es la parte DETERMINÍSTICA y obviamos y esperamos que el ruido estocástico sea despreciable y de esta forma lo ignoramos, veamos algunos Pros y Contras y donde podríamos usarlo.
Pros:
Podríamos utilizar el Cálculo Estocástico en procesos donde una lectura depende en parte de la lectura anterior (Proceso Markoviano), por ejemplo en un tanque de formación donde el estado del electrolito depende el estado en el que estaba en el lote anterior (Porque este se desgasta) o calcular el desempeño de alguna proceso debido a degradación o desgaste; sistemas de moldeo; o sistemas productivos donde las variables de proceso cambien debido a crecimientos o reducciones; las tuberías se van llenado de incrustaciones y los flujos disminuyen; las torres de enfriamiento disminuyen su eficiencia debido al crecimiento de algas.
Este tipo de calculo obliga al ingeniero a tener un conocimiento profundo de su proceso ya que tiene que modelarlo y no trabajar con él como si fuera una caja negra y solo correlacionando entradas con salidas (DOE, Regresiones)
Contras:
Los contras son obvios, no hay ingenieros que sepan este tipo de estadística y no hay tampoco quien entrene ingenieros en este tipo de estadística. Y muy probablemente si alguno la estudiara y la aprendiera, este se dedicaría a trabajar en el negocio del dinero directamente donde seguramente ganaría mas y no en la industria maquiladora.
Conclusión:
El uso de Calculo Estocástico cambiaría radicalmente la forma de pensar de nuestros ingenieros de proceso, de hecho trabajarían realmente como ingenieros de proceso ya que requerirían aprender y modelar realmente su proceso y no como ahora que se la pasan usando Minitab y no tienen ni la más remota idea de que es lo que pasa en el piso, pero eso si saben hacer unas graficas preciosas.
Este comentario puede tener errores ya que debo ser honesto mi conocimiento acerca del Calculo Estocástico es muy poco, durante el último mes me dedique a estudiar el concepto y quede encantado con las posibilidades que se abren, así que decidí que este año le dedicare parte de mi tiempo de ocio a aprender esta área de las Matemáticas financieras.
Algunos links
http://www.matematicas.unam.mx/lars/pub/ede.pdf