Multi-armed bandit

El problema de la màquina escurabutxaques es pot esquematitzar de la manera següent: * S'és davant dues màquines escurabutxaques * L'una, , està en funcionament. Retorna per tant 1 euro per fitxa amb una probabilitat coneguda. * L'altra, , està espatllada, i retorna per tant 1 euro per fitxa amb una probabilitat desconeguda. * Es disposa de fitxes. Què fer per maximitzar raonablement el guany ?

Multi-armed bandit

El problema de la màquina escurabutxaques es pot esquematitzar de la manera següent: * S'és davant dues màquines escurabutxaques * L'una, , està en funcionament. Retorna per tant 1 euro per fitxa amb una probabilitat coneguda. * L'altra, , està espatllada, i retorna per tant 1 euro per fitxa amb una probabilitat desconeguda. * Es disposa de fitxes. Què fer per maximitzar raonablement el guany ?