Вероятно гугл тоже может определить количество предметов каждого класса, судя по описанию
просто лень разбираться.И координаты вероятно как-то можно будет вытащить. По крайней мере, координаты распознанного текста он точно выдает.
Если бы не выдавал, то можно было просканировать изображение с камеры транспортера с мусором, рамкой, соответствующей размеру банки. 5 банок в нее никак не поместится, а что на изображении банка, гугл точно определит.
Но суть не в этом, а в том, что скоро такие онлайн сервисы будут расти, как грибы. А нам, робостроителям, это только на руку.