Вы наверно хотите что-то с нейро сетями делать?
Нет.
Итак, описываю суть эксперимента.
Представьте, что вам дали на выбор два коридора. В одном из них вас ждут разного рода неприятности, а в другом наоборот. Иными словами вы получаете поощрение за выбор правильного коридора и наказание за неправильный.
Теперь немного усложним задачу, пусть сперва в левом коридоре вас ждет поощрение с вероятностью 0.8 (и наказание с вероятностью 0.2), а в правом коридоре вас все наоборот.
Вы начинаете выбирать и с каждым выбором понимаете все больше что нужно выбирать левый коридор, но в один прекрасный момент я меняю вероятности местами.
Вы начинаете переприспосабливаться... изучение этого процесса - и есть задача эксперимента.