sly2m | Пробуждается потихоньку

Наверняка вы знаете про такую фичу от Гугла, но вдруг нет, все равно расскажу.

Уже несколько лет у Гугла появилась возможность поиска по картинкам. То есть ты подсовываешь ему картинку, и он ищет в сети похожие изображения. Не ахти какая новость, первым (и во многом до сих пор лучшим) на этом поприще стал сервис TinEye, а сегодня поиск по картинкам есть во всех популярных поисковиках, и у Yandex, и у Bing и у остальных. Но с некоторых пор Гугл предлагает чуть больше, чем просто поиск похожих изображений, он еще и пытается осознать, что изображено на фото.

Можете попробовать сами. Чтобы не морочиться с копированием адреса картинки в поисковую строку, можно поступить проще. Если вы пользуетесь браузером Google Chrome, эта функциональность уже встроена. Достаточно кликнуть на любую картинку правой кнопкой мыши и выбрать в контекстном меню "Search Google for image" ("Найти картинку (Google)" в русской версии).

Untitled1

Для других браузеров придется ставить сторонние плагины, например Search By Image (by Google) для Mozilla Firefox и так далее.

Если начать кликать на первые попавшиеся картинки, можно увидеть, что гугл пытается распознать, что на них изображено.

Capture4a

Не удивляйтесь такому странному сочетанию, просто первым попавшимся постом с картинками оказался сегодняшний из топа от Варламова.

Может показаться, что Гугл просто сопоставляет искомую картинку с похожими, и читает у найденных сопутствующее текстовое описание. Например он не только говорит, что изображено на фото, но и первой же строкой дает ссылку на статью об объекте в википедии, откуда эта картинка, собственно и взята.

Capture3a

Но не все так просто. Гугл действительно думает, если можно так сказать, над содержимым изображения, в этом достаточно легко убедиться, если подсунуть ему уникальные фото, которых больше нет нигде в Интернете, например снимки из вашего домашнего архива с отпускными фотографиями или фото с закрытых ресурсов. Правда в этом случае он чаще всего сбивается на свой родной английский.

Capture5a

На картинке женщина

Capture6

На картинке прием пищи

Capture7

На картинке красотка

Capture8

На картинке борода

Я думаю Гугл комбинирует подходы. Сначала ищет совпадения в уже имеющейся базе, ведь если они есть, чего процессор морочить, а если не находит, пытается распознать изображение.

Конечно, распознавалка пока не ахти. Довольно часто Гугл ошибается или вовсю капитанит, например:

Capture10a

На картинке блондинка

Capture9

На картинке фотография, no shit, Sherlock!

Но все равно. Распознавание образов (а ведь он действительно в буквальном смысле - распознает образы) это необходимый, и чуть ли не один из самых главных признаков интеллекта (любого биологического интеллекта, не обязательно человеческого), и тут Гугл уже существенно выше по уровню развития чем амеба или там гусеница, приближаясь интеллектом к собаке или ребенку 2-3 лет.

Да, пока не густо. Но ведь взросление-то не останавливается, развитие идет, процесс обучения не просто продолжается, а набирает обороты. Представляете, что будет, когда пройдет 10 лет, когда Гугл достигнет интеллекта подростка, взрослого человека, гения, ...

Естественно, распознавание образов само по себе далеко не полноценный Искусственный Интеллект. Но ведь работа идет по всем фронтам. Знаете такой сервис, Google Translate (Гугло-переводчик)? Если не ошибаюсь, его открыли для широкой публики в районе 2010 года, 6 лет назад. Тогда это был просто смех, а не переводчик. Он полную пургу гнал, был даже такой способ развлечения, подыскивать забавные косяки перевода гугла.

Capture11

Между тем сегодня я уже пользуюсь гуглопереводчиком как основным средством перевода слов. Естественно, переводить полные тексты им пока еще не очень. Есть даже такой неологизм "гуглом переводили", означающий корявый до невозможности бессвязный набор слов, вроде головки пальца ноги и им подобных. Но вот перевод отдельных слов я ищу в основном гуглом. Он тут же дает и значения и варианты и примеры использования. Причем, последний год делаю это голосом, гугл распознает мой английский на слух в 95%, и чем дальше тем лучше, хотя тоже, помните, было такое чудо как "Змей Горыныч" или "Magic Gooddy"? А сейчас Гугл на слух распознает мой английский лучше, чем китайские коллеги по работе.

И вот Гугл, наконец, подключил к переводу нейросети. Говорят, будет шпарить лучше носителя, целыми фразами и предложениями. Хотя пока в открытом сервисе доступны только переводы на английском, французском, немецком, испанском, португальском, китайском, японском, корейском и турецком. Посмотрим, конечно, но лиха беда начало, особенно если продолжение будет подкреплено самообучением и продолжит набирать скорость.

Flat | Top-Level Comments Only

Не хило вы скакнули от амёбы к собаке и трёхлетке. Это художественное преувеличение или правда так высоко оцениваете то, что сейчас алгоритм умеет делать?

Это мое личное оценочное ощущение. Возможно не верное.

А на какой уровень вы бы оценили возможность отличить мужчину от женщины по фото?

Домашние рыбки узнают хозяина.
А им до собаки как бы не дальше, чем от амёбы.

При чем здесь узнают хозяина. Я говорил про визуальное различие мужчины и женщины. Не думаю, что рыба на такое способна.

Рыбу-женщину от рыбы-мужчины любой рыб запросто отличит. И женщину своего вида от женщины похожего.
А вот гугль - вряд ли.

Отвечает читатель Виктор Олегович П:

В запертой комнате сидит человек, не знающий китайского языка. В окошко ему дают записки с вопросами на китайском. Для него это просто бумажки с нарисованными закорючками, смысла которых он не понимает. Но у него в комнате полно разных книг с правилами, в которых подробно описано, как и в какой последовательности отвечать одними закорючками на другие. И он, действуя по этим правилам, выдает в другое окошко ответы на китайском, которые создают у всех стоящих снаружи полную уверенность в том, что он знает китайский язык. Хотя сам он совершенно не понимает, о чем ему задают вопросы и в чем смысл его ответов.

Перевожу на нормальный язык: ни на какой вообще (такое мое личное оценочное субъективное мнение).

Да, это известная философская дилемма - китайская комната. (https://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%82%D0%B0%D0%B9%D1%81%D0%BA%D0%B0%D1%8F_%D0%BA%D0%BE%D0%BC%D0%BD%D0%B0%D1%82%D0%B0)

В любом случае такая комната пройдет тест Тьюринга, от чего - проблема так и остается философской, а в реальной жизни - это будет настоящий ИИ, то есть ты можешь с ним общаться как с живым человеком и не различать.

А обладает ли он сознанием на самом деле или не обладает - тебе-то какая разница?

Мне кажется, это не совсем корректный вопрос. Таки алгоритмы ещё не умеют определять образы, а сравнивают пиксели. Так можно сказать, о-о, алгоритмы умеют читать (обрабатывать текст, поддерживать текстовую беседу на сносном уровне) - они почти взрослый человек. Но это же не так, фразы выбираются очень простым механизмом с очень маленьким количеством нейронов, грубо говоря, мозгов меньше, чем у муравья.

По распознаванию образов сейчас активная работа ведётся, вот (https://youtu.be/6MKs_E46wSc), например, один из исследователей темы, Алексей Эфрос, объясняет как сейчас распознавание работает, и, по-моему, это нисколько не близко к собаке. (полная презентация (https://youtu.be/Dhp1trwtI2k), с другого выступления, тоже увлекательная)

Кроме того, что мы считаем "приближаясь интеллектом к"? Что алгоритм может сделать что-то одно, что может сравниваемый? Но тогда компютеры давно нас обогнали по шахматам тем же.

Edited 2016-11-21 10:01 (UTC)

Пробуждается потихоньку

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject