{"id":259,"date":"2004-03-15T03:50:01","date_gmt":"2004-03-15T11:50:01","guid":{"rendered":"http:\/\/www.kirainet.com\/thomas-bayes\/"},"modified":"2004-03-15T03:50:01","modified_gmt":"2004-03-15T11:50:01","slug":"thomas-bayes","status":"publish","type":"post","link":"http:\/\/www.robotic-lab.com\/blog\/2004\/03\/15\/thomas-bayes\/","title":{"rendered":"Thomas Bayes"},"content":{"rendered":"<p>Leyendo un art&iacute;culo en <a href=\"http:\/\/www.minid.net\" title=\"Minid\">Minid<\/a> en el que comenta que Mozilla incorpora un Filtro Bayesiano para filtrar el spam he recordado la impresionante labor de Thomas Bayes. Un matem&aacute;tico ingl&eacute;s que vivi&oacute; desde 1702 hasta 1761, y desarrollo los fundamentos de la teor&iacute;a probabil&iacute;stica a la cual hoy en d&iacute;a se le siguen obteniendo nuevas utilizadades.<\/p>\n<p>Thomas Bayes present&oacute; un ensayo sobre la teor&iacute;a de la probabilidad y su famoso teorema a la Royal Society  que se public&oacute; en 1764. Tuvo un gran impacto en la &eacute;poca y de hecho Condorcet (Otro matem&aacute;tico) hizo descubrimientos parecidos sin conocer los textos de Bayes.<\/p>\n<p>Pero realmente cuando m&aacute;s utilidad pr&aacute;ctica se le est&aacute; encontrando es en nuestros d&iacute;as de la era de la informaci&oacute;n. Sus herramientas matem&aacute;ticas las usan los f&iacute;sicos con su mec&aacute;nica cu&aacute;ntica, los telecos con sus se&ntilde;ales, control de tr&aacute;fico en redes etc. Y los inform&aacute;ticos lo usamos cada d&iacute;a sin darnos cuenta, cuando usamos google est&aacute;n actuando Bayes, cuando usamos nuestra c&aacute;mara digital tambi&eacute;n actua Bayes, cuando usamos traductores autom&aacute;ticos, el diccionario de nuestro tel&eacute;fono m&oacute;vil, los filtros para el spam de nuestro lector de correo electr&oacute;nico. En tareas de investigaci&oacute;n se usa en visi&oacute;n artificial, sistemas expertos, reconocimiento de lenguaje natural etc.<\/p>\n<p>B&aacute;sicamente para hacer un filtro de spam lo que har&iacute;amos de forma directa ser&iacute;a mirar ciertas palabras que aparecen en los t&iacute;picos correos basura, apuntarlas, y luego mirar si en cierto mail aparece o no la palabra. Esta t&eacute;cnica es un poco arriesgada porque eliminar&iacute;a muchos mails que no fueran spam. Gracias a la probabilidad de Bayes, podemos utilizar probabilidades condicionadas, es decir podemos tener en cuenta tambi&eacute;n el contexto de una palabra. De esta forma un filtro hecho a lo &#8220;bestia&#8221; eliminar&iacute;a todos los mails que tengan la palabra &#8220;sexo&#8221;, esto podr&iacute;a cargarse algunos mails que no fueran de spam. Con un filtro Bayesiano tendr&iacute;amos en cuenta el contexto por lo que vemos las cadenas en general, por ejemplo &#8220;mucho sexo gratis&#8221;. Al ver esto el filtro bayesiano ve que la probabilidad de que un mail sea de spam conteniendo la palabra &#8220;gratis&#8221; condicionado a que est&eacute; la palabra &#8220;sexo&#8221; antes es muy alta y descartar&aacute; el e-mail.<\/p>\n<p>Otra ventaja de los filtros Bayesianos es que se pueden implementar como algoritmos incrementales. Esto quiere decir que va &#8220;aprendiendo&#8221; de nuestros gustos, va viendo que mails eliminamos como spam y cuales no para mejorar sus decisiones futuras.<\/p>\n<p>&iquest;No es incre&iacute;ble que Thomas Bayes se avanzara tanto a sus tiempos? &iquest;Que pensar&iacute;a Bayes si le dijeramos que sus descubrimientos se est&aacute;n utilizando para eliminar correo basura?<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Leyendo un art&#237;culo en Minid en el que comenta que Mozilla incorpora un Filtro Bayesiano para filtrar el spam he recordado la impresionante labor de Thomas Bayes. Un matem&#225;tico ingl&#233;s que vivi&#243; desde 1702 hasta 1761, y desarrollo los fundamentos de la teor&#237;a probabil&#237;stica a la cual hoy en d&#237;a se le siguen obteniendo nuevas [&#8230;]<\/p>\n","protected":false},"author":31,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_publicize_message":"","jetpack_publicize_feature_enabled":true,"jetpack_social_post_already_shared":false,"jetpack_social_options":{"image_generator_settings":{"template":"highway","default_image_id":0,"font":"","enabled":false},"version":2}},"categories":[1],"tags":[],"class_list":["post-259","post","type-post","status-publish","format-standard","hentry","category-otros"],"jetpack_publicize_connections":[],"jetpack_featured_media_url":"","jetpack_shortlink":"https:\/\/wp.me\/p1YYAx-4b","jetpack_sharing_enabled":true,"jetpack-related-posts":[],"_links":{"self":[{"href":"http:\/\/www.robotic-lab.com\/blog\/wp-json\/wp\/v2\/posts\/259","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/www.robotic-lab.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.robotic-lab.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.robotic-lab.com\/blog\/wp-json\/wp\/v2\/users\/31"}],"replies":[{"embeddable":true,"href":"http:\/\/www.robotic-lab.com\/blog\/wp-json\/wp\/v2\/comments?post=259"}],"version-history":[{"count":0,"href":"http:\/\/www.robotic-lab.com\/blog\/wp-json\/wp\/v2\/posts\/259\/revisions"}],"wp:attachment":[{"href":"http:\/\/www.robotic-lab.com\/blog\/wp-json\/wp\/v2\/media?parent=259"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.robotic-lab.com\/blog\/wp-json\/wp\/v2\/categories?post=259"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.robotic-lab.com\/blog\/wp-json\/wp\/v2\/tags?post=259"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}