En fin, nos toca en turno hablar de la Orden mas elusiva de la EstDIOStica y se define como seguidores del pensamiento DETERMINISTICO por definición es básicamente Anti-EstaDIOStica, es decir, antes de intentar resolver algo usando la Estadística, preferimos tratar de entender la dinámica de los procesos haciendo uso de sus funciones de transferencia y leyes físicas que las dominan.
Pensamos (Así es dije, pensamos, me considero practicante de esta orden) que al hacer uso de la estadística, tácitamente estamos aceptando nuestro desconocimiento del proceso; es decir subsidiamos nuestra ignorancia de nuestro proceso haciendo uso de técnicas estadísticas que NUNCA explican el porqué de las cosas y solo nos podrían dar indicios aproximados; en el mejor de los casos; del comportamiento de un sistema. La justificación de la Estadística es precisamente esa, que por muy poco esfuerzo (Mental) obtenemos resultados satisfactorios y esto es bueno en general (Lo mejor es enemigo de lo bueno), pero existen casos en que esto es insuficiente y ya lo comentaremos más adelante.
Los Deterministicos o Numerti no tenemos una organización jerárquica, más bien somos como los alquimistas de la EstaDIOStica, lobos solitarios y nos reunimos entre nosotros algunas veces para departir muy al estilo de los DRUIDAS, eso si, con unos buenos vinos tintos, queso y demás delicias (Esto sí es oficial)
Es difícil decir que tenemos un Santo Patrono, Pero podríamos hablar algunos de los NUMERATI del pasado que hicieron grandes aportaciones, entre ellos destacan Pierre Simón Laplace, mejor conocido por su Transformada e increíblemente poco conocido por haber desarrollado lo que hoy conocemos como Inferencia Bayesiana; Sir Isaac Newton autor ente otros libros “Philosophiae naturalis principia mathematica” y Padre del cálculo diferencial, John Nash, desarrollo la Teoría de Juegos y a últimas fechas Henri Poincaré, padre de la Teoría del Caos.
Los Numerati tratamos de encontrar la ecuación, que rige un sistema, es decir el modelo matemático, antes de pensar en usar la Estadística y déjenme poner un ejemplo para aclarar el punto.
Mañana dile a tus ingenieros que te digan cuánto tarda una canica en caer de una plataforma de 5 metros y de una plataforma de 100 metro, no dudo no tantito que alguno de ellos se subirá a un techo de 5 metros y diseñara un experimento con digamos 5 intentos y tomara las lecturas y luego encontrara una plataforma de 100 metros y volverá a lanzar una canica y tomar los 5 datos a continuación (Eso sí primero no te pregunta qué tipo de canica, cuánto debe pesar, cual es el color más adecuado, si existe en almacén, sino tiene que hablar con el proveedor de canicas etc.)
Muy probablemente después de una semana de preparativos y análisis usando Minitab llegaran a alguna conclusión parecida a la siguiente
Tiempo Promedio caída libre canica de 5 metros: 1.01 seg
Tiempo Promedio caída libre canica de 100 metros: 4.51 seg
Lo cual está bastante bien, el problema es que si queremos usar estos datos para inferir por ejemplo cuanto tardara en caer desde una plataforma de 30 metros nuestro ingeniero, en el mejor de los casos llegara a la conclusión o más bien MINITAB le dará la siguiente regresión T=30*0.0369+0.825 = 1.93 segundos, lo cual mis amigos es ligeramente incorrecto.
Veamos ahora usando La ecuación en general de caída libre
Y = Yo + Vo•t + (1/2)•a•t²
Y = H + 0•t +(1/2)•(-9.8)•t²
Y = H – 4.9•t²
Como en el suelo Y = 0:
0 = H - 4'9•t² , despejando
4'9•t² = H
t² = H/4'9
t = √(H/4'9)
o como fórmula algebraica, t = √(2h/g)
Usando entonces la formula que despejamos tendremos que el tiempo que tarda en caer una canica desde 30 metros es igual a 2.47 segundos lo que nos da un error de alrededor del 30%. (Variación estadística como dirían los SixSigmitos)
No solo eso vámonos mas allá; si quisiéramos extrapolar la regresión de nuestro experto en Minitab nos daría que para una altura de CERO usando la regresión el tiempo en caer seria T=0*0.0369+0.825 = 0.85 segundos, (Aterrador si consideramos que el mismo ingeniero es el que calcula presiones, temperaturas, voltajes y demás en nuestra planta).
Como ven no necesitábamos hacer diseño de experimentos si sabemos las ecuaciones que rigen el sistema; por favor no me mal interpreten la Estadística es sumamente útil en mucha aplicaciones y por cierto mis amigos Numerati se encuentran en general entre los mejores Estadísticos que conozco, lo que digo es que hay muchísimas más herramientas disponibles que en situaciones especificas dan mucho mejor resultado que la Estadística.
El ejemplo anterior se ve muy burdo y probablemente exagerado, pero cuantas veces hemos tenido problemas con un horno y hacemos diseños de experimentos para saber si el producto salió bien cuando en vez de esto pudimos haber usado las formulas de transferencia de calor; conducción, convección y radiación; o las veces que he visto que hicieron un diseño de experimentos para calculaban el tiempo necesario para calentar un tanque con agua; cuando calcularlo vía ecuaciones es sumamente fácil y directo.
Los NUMERATI contamos con un arsenal de herramientas más vasto que solo la estadística Frecuencista, de hecho el uso exhaustivo dl MINITAB o similares es un claro indicativo de un ingeniero con pocos recursos de solución de problemas.
Imaginemos que tenemos el problema de muy alta rotación y baja asistencia en nuestro personal, ¿qué podemos hacer a continuación?, que técnica podríamos utilizar; supongamos por un momento que ya agotamos los beneficios del diseño de experimentos y ahora ¿QUIEN PODRA DEFENDERNOS?; que les parece si le damos una oportunidad a otra herramienta y probamos digamos con Teoría de Juegos para que nos ayude y modelamos de la siguiente manera.
Operador Falta Operador Asiste
Empresa Sufre Falta -3 / -0.5 0 / 1
Empresa Goza Asiste 0.1 / -0.5 5 / 1
Vamos deshebrando esto un poquito,
Si el operador falta y la empresa se ve afectada (No saca la producción del día), esto le da -3 a Empresa y el castigo al operador por faltar se cuantifica -0.5
Si el operador asiste y la empresa se ve afectada, esto le da 0 a Empresa y el premio al operador será de 1.
Si el operador falta y la empresa gana algo, esto le da 0.1 a Empresa y el castigo al operador será de -.05.
Si el operador asiste y la empresa gana algo, esto le da 5 a Empresa y el castigo al operador será de 1.
Vemos que la estrategia dominante del Operador es efectivamente ASISTIR al trabajo y la estrategia dominante de la empresa es Gozar que el operador Asiste, lo interesante es que el EQUILIBRIO DE NASH se da justamente cuanto el Operador Asiste y la empresa le va bien porque el operador asista, entonces donde está el problema.
Siguiendo el análisis encontramos dos cosas.
Primero vemos que el Operador es insensible a que a la empresa le vaya bien, es decir, si el operador asiste, la empresa le paga si la producción sale o si la producción no sale, es decir a el operador no le importa, el recibe su pago por el día de trabajo.
Lo segundo que vemos es que el castigo por no venir es muy poco y el premio por si ir a trabajar es relativamente bajo.
Partiendo de estas conclusiones podríamos establecer 2 estrategias diferentes, una para cauda una de las conclusiones.
Primero establecer un premio al operador encadenado a la productividad, así si la meta se logra el operador recibe un premio y si no se logra el operador recibe un castigo.
LA segunda estrategia es lograr que el operador tenga muy claro en su mente que el ir a trabajar tiene un gran premio y el no ir representa una gran pérdida para él.
Se podrían establecer sistemas de premiación por puntualidad y en los años que he trabajado he encontrado los siguientes como los más efectivos (Puede que alguno no esté de acuerdo, pero de que funcionan, funcionan muy bien)
Cerveza (Promételes un cartón de cerveza por un mes de asistencia completa y veras lo que pasa)
Materiales de construcción
Útiles escolares (Especialmente en el periodo Julio-Octubre)
Carne Asada
Deportes.
Bonos de despensa
Una vez vi como una empresa tenía una rotación y ausentismo arriba del 5% y después de muchos intentos, programas y demás esta se habían rendido cuando a alguien se le ocurrió hacer un torneo de futbol media hora antes de la hora de entrada; como por arte de magia el ausentismo disminuyo a cerca del 1%.
Inclusive Existen paquetes computacionales para resolver este tipo de problemas, Gambit es uno de ellos.
Adam Smith Estaba Equivocado - The best bloopers are here
Me encanta Nash cuando dice “ If we all go for the blonde and block each other, not a single one of us is going to get her. So then we go for her friends, but they will all give us the cold shoulder because no on likes to be second choice. But what if none of us goes for the blonde? We won't get in each other's way and we won't insult the other girls. It's the only way to win. It's the only way we all get laid”; Las Matemáticas al servicio del Libido.
Pongamos ahora otro ejemplo:
Imagina que tenemos una línea de producción en la cual se tiene muy alta mezcla de productos y medio volumen y que cambiar de una familia a otra es muy tardado preparar las inyectoras de plástico (Este problema es real, y algunos lo quieren arreglar con Heiyunka,, el problema es que Heiyunka funciona para no más de 10 familias y para que esta técnica funcione el tiempo requerido en el cambio de modelo debe ser despreciable) (este problema es similar a establecer una ruta optima digamos para repartir papitas en las tienditas y supermercados). Y al final lo que deseamos hacer es optimizar la salida de producción; Que técnica podríamos usar en este caso.
Lo primero que debemos hacer es un MODELO de nuestra línea de producción y para eso hay varios paquetes computacionales, ARENA , Pro Model, Simulink, Ithink y mis favoritos a últimas fechas Netlogo, starlogo los cuales son más bien lenguajes de programación, por favor no piensen que es algo complicado, es inclusive más fácil de utilizar que MINITAB y no nos perdamos en que se requieren software de moda o muy costosos, el modelo original para probar el concepto lo desarrollamos en Excel, con Visual Basic (Hasta MINITAB se puede programar con MACROS, espero que no estén leyendo los SixSigmitos)
Ya creado el modelo lo siguiente es correr algoritmos de optimización, en ARENA se llama OptQuest, en Simulink se usa el paquete de Optimización de Matlab y en Excel se podría usar el SOLVER o apoyarse en algoritmo de optimización como el llamado Recosido Simulado (Annealing Simuated), (Genetic Algorithms; Algoritmos Genéticos también funciona muy bien) de la misma forma se puede trabajar con STARLOGO o NETLOGO.
Con estos sistemas se puede incrementar la producción en casi un 30% sin mover nada y podemos simular nuevos arreglos de maquinas (Layouts) en la computadora (Mock-up) sin tener que moverlas físicamente y probar muchas configuraciones diferentes antes de reacomodar el equipo.
Ya por ultimo quiero poner en la mesa un caso que mas y mas se está presentando en la industria y es el siguiente: Cada vez es mayor el uso de sistemas de almacenamiento de datos en la Industria, imagina la cantidad de registros y datos que tiene por ejemplo Walmart de las compras en sus tiendas, o la cantidad de movimientos monetarios que hace cualquier banco por mes, o en la industria, las bases de datos de los equipos de pruebas, los sensores e instrumentación de nuestros procesos o de plano la base de datos d los relojes checadores de hora de entrada y salida, toda esta información se puede utilizar para encontrar soluciones y optimizar patrones o salidas del proceso deseadas.
Tomemos un equipo de pruebas eléctricas que hace miles de mediciones al día y las almacena en la base de datos, será posible encontrar alguna técnica que nos ayude a encontrar la aguja en el pajar, (Ayúdanos Pancho Pantera) y la respuesta es MINERIA DE DATOS (De nuevo Minitab no es minería de datos, es un Excel con algunas funciones estadísticas), Podríamos usar técnicas como Arboles de decisión, Clustering, Redes Neuronales, Maquinas de vectores soportados etc. y con el uso de estas herramientas de Minería de datos podríamos darnos cuenta que cuando la resistencia 23 es baja (aun dentro de límites) y el capacitor 7 esta alto (De nuevo dentro de límites) la tarjeta electrónica tiene un 68.4% de probabilidad de fallar. GENIAL No lo creen), hay mucho software de Minería de datos en el mercado, algunos de ellos son inclusive gratuitos como Tanagra.
Mineria de Datos
View more presentations from Rafael Zamora.
Esto es solo una muy somera muestra de la cantidad de herramientas que existen para analizar datos no solo paquetes de estadística frecuencista.
Ok, ya mostré algunas de las artes y herramientas de los Numerati y a continuación paso a dar los Pros y Contras que creo que existen.
Pros
El enfoque a conocer las ecuaciones deterministicas de los procesos le da a los Numerati una tremenda capacidad no solo para solucionar problemas existentes sino para mejorar inclusive radicalmente un proceso especifico, el conocimiento y dominio de herramientas como Simulación, Minería de Datos, Teoría de Juegos además de otras artes de las demás ordenes de la EstaDIOStica hacen de los NUMERATI altamente efectivos y muy rápidos en general para encontrar soluciones “fuera de la caja” a los problemas.
Contras
El contra es que son muy escasos y cuando digo escasos yo en los últimos 10 años no he conocido más de 5; generalmente ingenieros con maestrías en ciencias exactas y amantes de las matemáticas, no existe una escuela de Numerati, más bien el conocimiento se pasa de Maestro a Alumno como los Jedi y su padawan.
Conclusión
No quiero que me malinterpreten, no tengo nada en contra de Six Sigma, de hecho creo que es una excelente herramienta para disminuir variación, donde estoy en desacuerdo es en que ya sea Six Sigma, estadística frecuencista o cualquier otra metodología se autoproclame como la UNICA (Ungida?) metodología que realmente sirve, (De nuevo el parecido entre religiones y Ordenes de la EstaDIOStica se hace patente), me enfada el hecho en que se confunda el uso del Minitab o paquetes similares con conocimiento de Estadística, un Estadístico de a de veras es más probable que utilice un lenguaje llamado “R” el cual es eso, un lenguaje completito específicamente para jugar con la estadística y lo interesante es que es de uso general y es totalmente GRATUITO. Me llamaría mas la atencion si uno de mis ingenieros me pidiera el Matlab o como hace algunos meses uno de ellos me pidió el Ithink, software para simulaciones. (Una lagrima de felicidad corrió por mi mejilla).
Hay inclusive metodologías que no hemos mencionado como Reinforcement learning, Statistical Engineering con su QPDAC (Question, Plan, Data, Analysis y Conclusion), Metodo de elemento finito, Structural equation modeling, Cross entropy y muchas otras más que la verdad nos llevaría una eternidad comentarlas todas y no es el propósito de este blog, pero es bueno saber que existen y eventualmente de tener una necesidad especifica pues hacer uso de estas.
En cualquier caso, la EstaDIOStica está aquí para quedarse, creo que cada una de ellas encontrara su nicho especifico de aplicación, Six Sigma, reducción de costos; Cadenas de Marcov y Redes Bayesianas para Ingeniería de Mantenimiento, Minería de datos es aquellos empresas o equipos que generen grandes bases de datos; Teoría de juegos para negociaciones y resolución de conflictos y creo que la modelación de sistemas es la siguiente generación en ingeniería de manufactura mas allá de Kanbanes Justo a tiempo, sistema Toyota de manufactura, heiyunkas etc, y se verán cosas como Manufactura basada en agentes y Holonica, entre otras metodologías que revolucionaran las líneas y celdas de producción así como los sistemas de logística y materiales.
Espero haber generado algunas dudas, más que certidumbres y se animen a probar diferentes herramientas y metodologías y ya para terminar aquí les dejo un chiste Numerati si lo captas tenemos que tomarnos un café, Los Numerati debemos estar Unidos.
“Solo hay 10 tipos de personas en este mundo, los que conocen la numeración binaria y los que no”
4 comments:
Rodolfo,
Excelente Artículo… Excelente Serie… ¡Felicidades!
El ejemplo de la Caída Libre es increíblemente cierto, ocurre en todas partes y cada vez con mayor incidencia. Quiero compartir un ejemplo que me advirtió uno de mis maestros, al prevenirme contra el abuso de la Estadística, esto ocurrió allá por la Prehistoria (época hoy impensable, donde herramientas como Windows aún no existían) y desde entonces la tengo siempre presente para no ser débil ante la “magia de los números”.
Se desea establecer una correlación entre la Salida del Sol cada mañana y el Canto del Gallo, para lo cual, se documenta durante un período suficiente como para validar el tamaño de la muestra, aseverando la siguiente hipótesis:
“El Requerimiento para que el Sol salga todos los días es que el Gallo Cante”
No es tan sólo el Error por la “Variación Estadística” el ocurrente por desconocer los mecanismos que controlan la naturaleza… además, el planteamiento y aceptación de hipótesis tan aberrantes como el ejemplo de la interacción Gallo/Sol son parte de este vicio y van a la alza en todos los ámbitos (laboral, político, académico y demás); basta recordar que en todas las culturas se hacían sacrificios para preservar la presencia del Sol, en muchas de ellas hasta eran sacrificios humanos.
El abuso de la Estadística deviene en el planteamiento de hipótesis falsas aceptadas como válidas. Sobre cimientos falsos, las estructuras de pensamiento son débiles y terminan por derrumbarse… traducido el pensamiento anterior al castellano: se siguen observando los mismos errores y los métricos se mantienen “planos” (lo más común: empeoran).
Nuevamente, te comparto mis más cordiales felicitaciones.
Saludos.
que tal saludos rodolfo, excelente blog, yo me acabo de recibir de ingeniería me gustan los números las matemáticas y ahora que estoy trabajando se usan demasiadas herramientas estadísticas, yo creo que entre las ecuaciones y las estadísticas se puede complementar para dar una solución, hay que crear una sinergia de metodologías, saludos y donde puedo encontrar mas información acerca de los numerati?
Jose:
El termino NUMERATI lo saque de un libro que asi se llama The NUMERATI de Stephen Barker y es solo un nombre que yo le puse a un grupo de amigos que pensamos de la forma que expongo en el post.
Exito
Rodolfo
Virtual Memory sure is becoming cheaper these days. I wonder when we will eventually hit the ratio of 1 cent to 1 GB.
I await the day when I will finally be able to afford a 20 TB harddisk . But for now I will be happy with having a 32 gig Micro SD in my R4i.
(Posted by NewPost v2 for R4i Nintendo DS.)
Post a Comment