Y me decidí por el de Desarrollar un proyecto DMAIC para determinar con cierto grado de certidumbre y usando metodologías conocidas pronosticar el nombre más viable para ser Presidente de México en las próximas elecciones.
En esta ocasión no voy a desarrollar el DMAIC completo, eso ya lo hicimos en la serie en cuestión, por esta vez solo voy a desarrollar el uso de una herramienta sumamente poderosa que se usa muy poco y por eso vamos a apoyarnos en ella para este proyecto.
DENDROGRAMA
Un dendrograma es un tipo de representación gráfica o diagrama de datos en forma de árbol (Dendro=árbol) que organiza los datos en subcategorías que se van dividiendo en otros hasta llegar al nivel de detalle deseado (asemejándose a las ramas de un árbol que se van dividiendo en otras sucesivamente). Este tipo de representación permite apreciar claramente las relaciones de agrupación entre los datos e incluso entre grupos de ellos aunque no las relaciones de similaridad o cercanía entre categorías. Observando las sucesivas subdivisiones podemos hacernos una idea sobre los criterios de agrupación de los mismos, la distancia entre los datos según las relaciones establecidas, etc. También podríamos referirnos al dendrograma como la ilustración de las agrupaciones derivadas de la aplicación de un algoritmo de clustering jerárquico.
Otra herramienta que usaremos es
Mineria de Datos
La minería de datos (DM, Data Mining) consiste en la extracción no trivial de información que reside de manera implícita en los datos. Dicha información era previamente desconocida y podrá resultar útil para algún proceso. En otras palabras, la minería de datos prepara,sondea y explora los datos para sacar la información oculta en ellos.
Bajo el nombre de minería de datos se engloba todo un conjunto de técnicas encaminadas a la extracción de conocimiento procesable, implícito en las bases de datos. Está fuertemente ligado con la supervisión de procesos industriales ya que resulta muy útil para aprovechar los datos almacenados en las bases de datos.
Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción, clasificación y segmentación.
Usaremos o más bien mencionaremos Inferencia Bayesiana
La inferencia bayesiana es un tipo de inferencia estadística en la que las evidencias u observaciones se emplean para actualizar o inferir la probabilidad de que una hipótesis pueda ser cierta. El nombre «bayesiana» proviene de uso frecuente que se hace del teorema de Bayes durante el proceso de inferencia. El teorema de Bayes se ha derivado del trabajo realizado por el reverendo Thomas Bayes. Hoy en día, uno de los campos de aplicación es en la teoría de la decisión,1 visión artificial2 (simulación de la percepción en general)3 yreconocimiento de patrones por ordenador.
Empecemos con lo obvio, no todos los 120 millones de Mexicanos tienen oportunidad de contender por la Presidencia de la Republica (Aunque el articulo 82 asi lo diga, la verdad es que no existen los candidatos independientes tienes que ser soportado por un partido establecido).
Vamos a cerrar el universo a aquellos que tienes más oportunidad.
PAN
Josefina Vázquez y Santiago Creel
PRI
Enrique Peña Nieto y Manlio Fabio Beltrones
PRD
Marcelo Ebrard, López Obrador
Aunque sé que hay muchos más nombres en la contienda política; Como este ejercicio es meramente demostrativo; solo usare los más conocidos.
Vamos primero a establecer el Dendrograma o Diagrama de Árbol
Y para esto usaremos el software de uso libre: YED Editor Grafico
http://www.yworks.com/en/products_yed_about.html
El cual entre sus múltiples atributos es capaz de graficar DENDROGRAMAS.
Ahora vamos poniéndole números a la cosa ¿Y cómo le vamos a hacer?
Muy fácil usaremos la ya conocida y nunca bien ponderada “WISDOM OF CROWDS” Sabiduría de las masas y veremos que dice la red acerca de esto y para esto usaremos Minería de Datos
Estableceremos la búsqueda de la siguiente forma
1 Buscaremos el nombre del candidato en cuestión usando sus apehidos o nombre que usa en los medios.
2 Conjunción con la palabra PRESIDENTE
Nombre ^ “Presidente”
Y le preguntamos a NILOR o gran Conjunción de todo el conocimiento Informático (Ver mi cuento acerca de NILOR) usando el Gran Oráculo GOOGLE. (Si el rio suena es que agua lleva)
Pre Candidato | | Resultados Google |
Peña Nieto | Presidente | 2,130,000 |
Manlio Fabio Beltrones | Presidente | 404,000 |
Santiago Creel | Presidente | 286,000 |
Josefina Vazquez Mota | Presidente | 562,000 |
Marcelo Ebrard | Presidente | 2,200,000 |
Lopez Obrador | Presidente | 1,390,000 |
Ahora ya sale a la vista un Patrón y tenemos 2 candidatos con gran fortaleza
Peña Nieto con 2.1 millones
Marcelo Ebrard 2.2 millones
Ahora aunque no somos analistas políticos, si somo analistas de sistemas asi que podemos hacer algunas inferencias y de aquí que no pudiéramos apoyar de la Inferencia Bayesiana
Qué pasaría si un candidato apoyara a otro, no significa que puedan sumar sus puntos, significa que promediarían sus curvas de probabilidad.
Vemos que el PAN tiene pocas probabilidades de éxito, este no es un juicio a partir de su desempeño, es una inferencia a través de los números de nuestra Mineria de Datos.
Como asegurar la victoria este 2012, la respuesta de nuevo es simple pero no es fácil.
Para asegurar el triunfo dos de los tres partidos principales se tienen que iunir. EL que consiga esto tiene la contienda asegurada. Esto les dije tiene sentido pero no es fácil, el PAN y el PRD prefieren perder solos que ganar haciendo coalición. (De nuevo la maldición de porque no les ponen tapas a las cubetas de las langostas mexicanas).
"Las Langostas Mexicanas, en cubeta, no necesitarían colocarles tapa alguna, que podría quedarse descubierta, porque entre ellos – las lanagostas mexicanos-, se jalarían entre si y se ocuparían de que ninguno pudiera salir".
Pronosticando que no habrá grandes coaliciones, basados en que en el 2011 no lo lograron para las contiendas para gobernador y muy probablemente no lo lograran para la Presidencia.
La única que se ve con algo de viabilidad es Ebrard+Lopez Obrador y siendo Ebrard el de mayor Peso, un apoyo total de Lopez Obrador daría a Ebrard una potencia de muy buen nivel.
· Basado en los números.
· Basado en el efecto Langostas Mexicanas y Cubetas sin tapa (No habrá coaliciones de los partidos Mayores)
· Basado en que de 8 Contiendas para gobernador en México durante 2011 fueron: 1 para PAN, 1 para PRD y 6 para el PRI.
· Basado en la fortaleza de la maquinaria electoral del PRI, vs PAN vs PRD.
El próximo Presidente de México será:
Enrique Peña Nieto.
Ya dije, ni modo que me raje, ya lo dije, Alla por septiembre 2012 sabremos la verdad.
Ahora siguiendo un procedimiento similar el próximo Gobernador de NL será:
Mauricio Fernández
Y el próximo Alcalde de Monterrey es:
Ese se los dejo de tarea, a ver si aprendieron a usar los DENDOGRAMAS.
Saludos.
Como saben a ultimas fechas me he dedicado a instalar cercas electrificadas residenciales y las ultimas a empresas para cumplir con CTPAT, bueno les dejo un video de como funcionan estas cercas. (No se burlen duele hasta el alma, ya me paso)
www.cercaselectrificadas.weebly.com