El juego de la taza de té

La entrada anterior de Warhammer la retirado temporalmente; estoy metido a tope en la oposición y no voy a tener tiempo para desarrollar y escribir luego la solución (que más que difícil es que es tedioso). Asi que volvemos a los problemas cortos y curiosetes.

Muchas veces en la Historia de las matemáticas una determinada rama ha nacido a raíz de la solución de un problema. Un ejemplo claro es la teoría de grafos y el archiconocido problema de los siete puentes de Konnisberg, resuelto por Euler.

El contraste de hipótesis también tiene su propia leyenda de este tipo. Recordemos que por decirlo de alguna forma, un contraste de hipótesis consiste en cómo se puede probar una determinada suposición con un determinado grado de fiabilidad (de confianza que se dice en estadística). Normalmente se emplean datos estadísticos para realizar dicho contraste, pero no es obligatorio.

¿Y cual es la leyenda de la apaición del contraste de hipótesis? Nuestra historia comienza en una reunión de la alta sociedad inglesa en 1920. En las apasionantes conversaciones que allí se mantuvieron una mereció pasar a la historia de la humanidad. Una dama aseveró que podía diferenciar por el sabor si una taza de té se había preparado echando primero el té y luego la leche o viceversa. Ante la polémica (educada y elegante, seguro) que se desató, con químicos asegurando que la mezcla debía ser igual en ambos casos y los sabores no deberían ser por tanto diferentes, un matemático, Ronald Fisher propuso un método innovador para aclarar la cuestión; hacer el experimento.

No contaré más. Ese es el reto. ¿Qué experimento habría que diseñar para garantizar que la dama puede diferenciar los sabores (o no) con una fiabilidad (confianza) superior al 95%?

————————————————————————————————————————————————————

Solución:

Tenemos dos opciones, a la vista de los comentarios que se han enviado. ¡Echad un ojo a los comments y a ver con cual os quedáis!

Anuncios

12 Respuestas a “El juego de la taza de té

  1. Típico problema de p-valor y de hipótesis nula. Yo en los estudios de precisión diagnóstica suelo usar el 0.01, no el 0,05 como sugieres aquí, pero vamos, que es igual.

    No voy a contestar qué hacer si ver si alguien se anima. Pero ya hemos hablado de este mismo problema cuando empecé con el PFC, lo que pasa que con monedas y cara y cruz, te acuerdas? 😉

    Ayer me contó LP el problema y ya imaginé que se le olvidaba algo. Me lo enunció igual, pero en lugar del 95% me dijo que para estar totalmente seguro. Lógicamente me chirriaba.

    Así a ojo, con 5 tacitas vale no? 1 – 1/(2^5) < 0.95

  2. Hummmm…. me suenan pocas tazas…. y creo que simplificaría el experimento que hubiera un mismo número de tazas mezcladas de una forma y el mismo mezcladas de la otra. Ten en cuenta que tienes que elegir. Con seis tazas (3 mezcladas de una forma y 3 de otra) por ejemplo puedes elegir 3 tazas de entre 6 de 20 maneras diferentes: por tanto la probabilidad de acertar “a potra” es de 1/20. Es decir hay un 5% de posibilidades de acertar por pura suerte. Por tanto el experimento es fiable en el 95% de confianza que pedimos…pero justo. No superior. Está en el límite….

    Eso si, razonando asi consideraríamos el experimento de tal forma que la hipótesis de la dama se daría por buena siempre y cuando no errara ninguna taza. Porque acertar 2 tazas de 3 de un tipo en un conjunto de 6 tazas no es tan difícil (el 95% de confianza se vería sobresaltado).

    Asi que para no pillarme los dedos, me iría a 4 tazas de cada tipo, 8 tazas en total. Te aproximas al 99% e confianza que decías de esta manera (aunque no lo alcanzas)
    yo lo veo así. No sé si te he convencido….

    • No me has convencido. Explico mi método por el que sólo son necesarias 5 tazas.
      1.- Da a la vieja UNA taza, si acierta como se hizo podrás decir que si lo hubiera hecho de forma aleatoria habría acertado el 50% de las veces.
      2.- Da a la vieja una segunda taza. Si vuelve a acertar ya comenzaría a ser sospechoso ya que al hacerlo de forma aleatoria se acertaría 25% de las veces.
      3.- … Repetir procedimiento hasta la taza quinta. Ahí podrías decir que si lo hubiera hecho de forma aleatoria habría acertado las 5 tazas en un 3.125% de las veces, lo cual es menor que un 5%.

      Te convencí yo a ti? Tu método tb lo veo válido, pero utilizas más tazas.
      Muy parecido a esto es como está implementado en MatLab el algoritmo de ANOVA de una vía para cálculos de p-valor en distribuciones normales y homocedásticas.

  3. Perdón por mi memoria. Yo que soy muy simple y sin más explicaciones leslokianas, me quedo con la elegante (como siempre) solución de ER. Porque la veo mejor, nada más…si entendiera la formulita de Leslok quizá y sólo quizá cambiaría de opinión.

  4. He encontrado un magnífico enlace que explica mucho mejor lo que digo.
    Además lo completa. Por ejemplo, se me había pasado decir (lo dí por supuesto, pero no está de más decirlo) que las tazas que se da a la señora están preparadas con un 0.5 de probabilidad de una forma o de otra. En el enlace lo describe tirando una moneda al aire.

  5. No te creas; en mi caso la vieja (no dije que fuera vieja, pero… XD) debe acertar 3 tazas (de 6) 0 4 (de ocho). Asi que incluso podría acabar más rápido que con tu experimento, en el que debe acertar 5 tazas.

    Creo que ahi está la clave; el mío requiere más tazas, pero puede acabar antes, con acertar en 3 de 6 le vale (o fallar 3 de 6). En el tuyo debe acertar 5 o fallar 1…

    …. que ahora que lo pienso también puede acabar antes, con fallar la primera. Hum…. interesante.

    tendré que pensarlo detenidamente…. a ver si hay más cera que la parece que arde.

  6. he encontrado una explicación, que mañana leeré detenidamente, porque ahora mismo, se me caen los ojos delante de cualquier cosa matemática (entre las clases y el estudio….pfffff, cansao)
    Este post se basa en un trabajo del propio Fisher, que fue el que desarrolló el problema y propuso la solución. Aunque él postula 8 tazas porque con 6 tazas tienes el 5% de posibilidad de acierto por azar. El se va a 8 tazas, con dos cohones.

    Busca tazas en el pdf y vas a ello: http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CCMQFjAA&url=http%3A%2F%2Fjagcruz.webs.ull.es%2FArticulos%2FConfe_JaemXII_05.pdf&ei=08w7UMP-GcSyhAeBsoHwCA&usg=AFQjCNFSbCw2R_OKBxpITG7swpxIsWdCYQ

    Por cierto, en tu modelo de experimento; ¿Cual es el nº de tazas que tomaría la vieja como máximo? es decir, pasando la prueba “in extremis”. Porque podría fallar por azar. No me hagas mucho caso porque ya te digo que estoy cansadete, pero es que algo me rechina (y no sé qué es) en tu razonamiento…..

  7. Me estaba releyendo el enunciado y no veo que el número de tazas tenga que ser mínimo, por tanto daría igual un método u otro.

    Por otro lado, mi método necesita preparar 5 tazas, mínimo y máximo. El que tú comentas al menos se deben preparar 6 aunque sólo pruebe 3.

    Por último, bajo mi punto de vista, la vieja (es vieja y punto xD ) no debería fallar ninguna taza ya que ella asegura que SIEMPRE lo diferencia. Otra cosa es que como no podemos nunca estar seguros al 100% de esa afirmación aunque acierte 1000 tazas seguidas pues le pongamos un umbral de significación del 0.05. Por eso es por lo que digo que mi experimento vale con máximo 5 tazas, si falla una A LA HOGUERA!

    Ejemplo: aunque matemáticamente sea válido ya que el umbral de significación sería muy inferior al 0.005, considero que no valdría fallar la primera y luego acertar las siguientes 1000. En el momento que falle una, a los leones.

  8. Iba a ventilar el debate metiendolo en Matlab que de el me fío más que del Papa, pero la mierda de 7.0 que tengo en casa no lo tiene implementado grrrrr

    “Creo que ahi está la clave; el mío requiere más tazas, pero puede acabar antes” si no cuentas lo que tardas en preparar las tazas que seguro que es más que en darlas un sorbo… xD (Si te pones tiquismiquis sabes que a eso no me ganas jeje).

    Insisto, de lo que estoy convencido es de que ambos métodos valen. El reto sólo dice “¿Qué experimento habría que diseñar para garantizar que la VIEJA puede diferenciar los sabores (o no) con una fiabilidad (confianza) superior al 95%?” así que no le veo debate…

  9. hombre, si no permites fallo ninguno a la vieja, pues tu pides un intervalo de confianza del 100% jodido!!!! XD
    pero si, empiezo a suponer que da lo mismo.
    habrá que pensar otro retillo.

  10. Rehaciendo tu método me rindo, no encuentro fallo alguno. Jodía vieja…
    Porque:
    1) fallar 1 taza: FAAAA probabilidad: 0.15625 (5 casos de 32)
    2) fallar 2 tazas: FFAAA probabilidad: 0.3125 (10 casos de 32)
    3) fallar 3 tazas: FFFAA probabilidad 0.3125 (10 casos de 32)
    4) fallar 4 tazas: FFFFA: probabilidad 0.15625 (5 casos de 32)
    5) fallar todas las tazas: FFFFF: probabilidad: 0.03125 (1 caso de 32)
    6) la vieja acierta todas: AAAAA: probabilidad: 0.03125 (1 caso de 32)

    sólo la vale acertar todas: sale una probabilidad de 0.03125–>[confianza de 0.96875 (96%>95%)]
    asi que si, debo darte la razón. T método vale. El mío permite a la vieja fallar alguna; es, en ese aspecto, más humano….
    en el momento que falle algo, se jodió

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s