Тоже думал об этом тока комнату хотел делать не закрытую, а с выходом.
1. Кстати как буква должна была узнать, что в комнате нет выхода?
2. И в чем собственно ИИ буква мечится по комнате и что куда она девает накопленные знания?
3. По какому алгоритму движется буква?
Моя идея в следующем объект ищет выход из одной и той же комнаты, но по разным алгоритмам и записывает в файл алгоритм с кратчайшем временем, затем возвращается на исходную и делают попытку выйти уже по другому алгоритму и т. д. до нахождения кратчайшего по времени.
Затем помещаем объект в другую комнату (объект уже обучен, он хранит в памяти 3 алгритма с наименьшим временем прохождения) в итоге получается система с самообучением.
Но у меня как всегда есть сомнения:
Выбор алгоритма, что бы объект двигался ему нужна задать направление движения, допустим он уперся в стену, как он выбирает куда двигаться влево, вправо, назад (не назад глупо), хотя можно выбирать влево или вправо по Random (случайно, но в алгоритм записывать влево 70 раза, вправо 30 раз), по идее мы придем к тому что будет получен алгоритм (вправо 100 раз влево 0 или наоборот). Но получение этого алгоритма и будет механизмом самообучения. Для тех кто не знает оптимальный выход из лабиринта это следовать вдоль одной стены до самого выхода, за исключением случая когда лабиринт это падушка лежащая в центре комнаты, т. е. объект будет двигаться вокруг нее, но это частный случай.
П. С. мое самое длинное сообщение за год.