sly2m | Пробуждается потихоньку

Entry tags:

Пробуждается потихоньку

Наверняка вы знаете про такую фичу от Гугла, но вдруг нет, все равно расскажу.

Уже несколько лет у Гугла появилась возможность поиска по картинкам. То есть ты подсовываешь ему картинку, и он ищет в сети похожие изображения. Не ахти какая новость, первым (и во многом до сих пор лучшим) на этом поприще стал сервис TinEye, а сегодня поиск по картинкам есть во всех популярных поисковиках, и у Yandex, и у Bing и у остальных. Но с некоторых пор Гугл предлагает чуть больше, чем просто поиск похожих изображений, он еще и пытается осознать, что изображено на фото.

Можете попробовать сами. Чтобы не морочиться с копированием адреса картинки в поисковую строку, можно поступить проще. Если вы пользуетесь браузером Google Chrome, эта функциональность уже встроена. Достаточно кликнуть на любую картинку правой кнопкой мыши и выбрать в контекстном меню "Search Google for image" ("Найти картинку (Google)" в русской версии).

Untitled1

Для других браузеров придется ставить сторонние плагины, например Search By Image (by Google) для Mozilla Firefox и так далее.

Если начать кликать на первые попавшиеся картинки, можно увидеть, что гугл пытается распознать, что на них изображено.

Capture4a

Не удивляйтесь такому странному сочетанию, просто первым попавшимся постом с картинками оказался сегодняшний из топа от Варламова.

Может показаться, что Гугл просто сопоставляет искомую картинку с похожими, и читает у найденных сопутствующее текстовое описание. Например он не только говорит, что изображено на фото, но и первой же строкой дает ссылку на статью об объекте в википедии, откуда эта картинка, собственно и взята.

Capture3a

Но не все так просто. Гугл действительно думает, если можно так сказать, над содержимым изображения, в этом достаточно легко убедиться, если подсунуть ему уникальные фото, которых больше нет нигде в Интернете, например снимки из вашего домашнего архива с отпускными фотографиями или фото с закрытых ресурсов. Правда в этом случае он чаще всего сбивается на свой родной английский.

Capture5a

На картинке женщина

Capture6

На картинке прием пищи

Capture7

На картинке красотка

Capture8

На картинке борода

Я думаю Гугл комбинирует подходы. Сначала ищет совпадения в уже имеющейся базе, ведь если они есть, чего процессор морочить, а если не находит, пытается распознать изображение.

Конечно, распознавалка пока не ахти. Довольно часто Гугл ошибается или вовсю капитанит, например:

Capture10a

На картинке блондинка

Capture9

На картинке фотография, no shit, Sherlock!

Но все равно. Распознавание образов (а ведь он действительно в буквальном смысле - распознает образы) это необходимый, и чуть ли не один из самых главных признаков интеллекта (любого биологического интеллекта, не обязательно человеческого), и тут Гугл уже существенно выше по уровню развития чем амеба или там гусеница, приближаясь интеллектом к собаке или ребенку 2-3 лет.

Да, пока не густо. Но ведь взросление-то не останавливается, развитие идет, процесс обучения не просто продолжается, а набирает обороты. Представляете, что будет, когда пройдет 10 лет, когда Гугл достигнет интеллекта подростка, взрослого человека, гения, ...

Естественно, распознавание образов само по себе далеко не полноценный Искусственный Интеллект. Но ведь работа идет по всем фронтам. Знаете такой сервис, Google Translate (Гугло-переводчик)? Если не ошибаюсь, его открыли для широкой публики в районе 2010 года, 6 лет назад. Тогда это был просто смех, а не переводчик. Он полную пургу гнал, был даже такой способ развлечения, подыскивать забавные косяки перевода гугла.

Capture11

Между тем сегодня я уже пользуюсь гуглопереводчиком как основным средством перевода слов. Естественно, переводить полные тексты им пока еще не очень. Есть даже такой неологизм "гуглом переводили", означающий корявый до невозможности бессвязный набор слов, вроде головки пальца ноги и им подобных. Но вот перевод отдельных слов я ищу в основном гуглом. Он тут же дает и значения и варианты и примеры использования. Причем, последний год делаю это голосом, гугл распознает мой английский на слух в 95%, и чем дальше тем лучше, хотя тоже, помните, было такое чудо как "Змей Горыныч" или "Magic Gooddy"? А сейчас Гугл на слух распознает мой английский лучше, чем китайские коллеги по работе.

И вот Гугл, наконец, подключил к переводу нейросети. Говорят, будет шпарить лучше носителя, целыми фразами и предложениями. Хотя пока в открытом сервисе доступны только переводы на английском, французском, немецком, испанском, португальском, китайском, японском, корейском и турецком. Посмотрим, конечно, но лиха беда начало, особенно если продолжение будет подкреплено самообучением и продолжит набирать скорость.

Flat | Top-Level Comments Only

Яндекс давно это делает. Разве что не сообщает об очевидном, вроде "female", не строит из нас идиотов.

Об "очевидном"? Представь себе, какие мощности и уровни абстракции нужны машине, чтобы распознать в любой (в любой!) картинке женщину. Не слабее мозга ребенка, скажем мозг червяка с подобным не справится.

Ну, и конечно, под словом "Гугл" я не имею ввиду конкретную программу конкретной фирмы Google, как минимум, чтобы не заморачиваться с копирайтами. У них пока просто лучше всех получается, но может быть первый полноценный ИИ проснется в недрах какой-то другой компании. Но все-таки я скорее на Google поставлю.

Эээ...
С одной стороны, да, самообучаемые алгоритмы совершили серьёзный рывок.
С другой стороны, там несколько проще, чем вы себе представили. Любой предмет, лицо, или задница, или дом имеют свой набор характеристик на изображении. Эти характеристики группируют (многомерная кластеризация). И по характеристикам дома с лицами пересекаются очень редко. А база картинок с подписями для хорошей кластеризации у поисковиков есть...

А как он ищет по картинке из личного архива? Значит, надо этот архив в сеть загрузить?

Ну, вы выкладываете свои фото в ЖЖ например? Это по идее уникальные фотографии, нигде в Интернете таких быть не может. Или можно вручную загрузить любое фото Гуглу на поиск, ссылку я привел в самом первом абзаце. И конечно же, если у вас смартфон Андроид, и вы не убирали галочку с "Синхронизировать хранилище фотографий в облако", то по умолчанию, все фото, что вы делаете на этот смартфон заливаются в облачное хранилище гугла.

Да, уже разобралась, спасибо)

Должен заметить, что в крайние 2-3года просто по экспоненте пошел расти бум систем технического зрения (суть то же распознавание образов) - в промышленной робототехнике.

У гугла фишка в том, что он не просто распознает, что действительно уже почти похоже на признак интеллекта, но и тут же может сопоставить с самой обширной в мире базой уже распознанных образов. Это две составляющие мозговой деятельности, сам процесс распознания, и соотношение распознанного с хранимым в памяти, чтобы не просто по реперным точкам понять, что перед тобой "женщина", но и что это конкретно твоя любимая жена.

Гугл, кстати, и это уже умеет делать потихоньку, только пока в открытый доступ сервис не открывает.

вот по этому фото из моего семейного архива https://goo.gl/photos/KDV7e5yKChNjicpW6 определил, что скорее всего это динозавр! Правда, на глазах умнеет.
Спасибо, что обратили внимание.

"Для других браузеров придется ставить сторонние плагины,"

Нет, на десктопе достаточно выйти на гугл-имадж, в строку поиска вставить ссылку на картинку и нажать не на поиск, а на изображение фотоаппарата прямо в той же строке.

Да, это понятно, что можно. Но все равно это приходится несколько действий совершать, что-то там открывать, искать адрес, куда-то что-то копировать.

А тут нажал правую кнопку на вашу аватарку, и тут же получил ответ.

Да, впечатляет.

Мой способ только для десктопа - мобильные версии требуют адд-она.

Да, знаю я эту фичу. И переводчиком гугла давно уже пользуюсь — он, конечно, иногда такоооое делает, но в целом, например, с японцами на английском вполне дает возможность пообщаться :)

Правда, надежд на то, что скоро он пробудится и все такое, я бы не делал. У всех этих штук нет самоосознания. И по моим личным интуитивным ощущениям и даже представлениям — и не будет. Другой вопрос, надо ли оно ему вообще (про китайскую комнату же слышал?), но, тем не менее: интеллект — это всего лишь интеллект. Пусть и в стопицот раз более мощный, чем наш (как мы его представляем нашим интеллектом согласно нашим представлениям о том, что такое жизнь, сознание и тот самый интеллект) — но это только интеллект. Как оно на самом деле будет — ну, увидим. Кто-то и с Siri общается, рассказывает ей о жизни и даже флиртовать пытается, и ему норм.

ЗЫ Ну, и пост самзнаешьгде, где надо нарисовать для нейросети кота за двадцать секунд, ты, наверное, тоже уже видел :) Все побежали развлекаться, а хитрый искуственный интеллект сказал "Ага! Бесплатно и массово будут меня учить распознаванию? Ооооок!".

Edited 2016-11-17 01:41 (UTC)

Какие, нафиг, коты за 20 секунд. Я уже приводил данный пример в каком-то комментарии, снова его заюзаю.

В одном 2016м году было произведено и продано 1.5 миллиардов смартфонов на системе Андроид. В придачу к уже существующим не уверен скольки миллиардам.
Это как минимум 1.5 миллиарда камер, смотрящих в мир. Причем, не знаю, как другие смартфоны, мой еще умеет измерять температуру окружающего воздуха, его влажность, давление, напряжение и направление магнитного поля и еще несколько характеристик, включая GPS-позицию этих данных. Ну, и аудио-микрофон, который записывает все входящие в него звуки, пытаясь вычленить в них комбинацию "ОК, Гугл."

И все это записывается и расшифровывается в реальном времени, покуда ты намеренно не зайдешь в настройки и все это не отменишь. Да и то, не факт, что при отмене настроек, оно перестает работать.

И это только сбор данных. Про обучение, т.е. ответы интеллектуального пользователя на вопросы, приходящие из интернета я умолчу, об этом в следующем комментарии.

А ты мне про какой-то там сайт, на который зашли 20 000 человек нарисовать котиков...

Что ж, хороший сценарий, ничего не скажешь.

А на сайте, кстати, ребята пытаются поиздеваться над нейросетью и рисуют ей ... Вот скоро появится сериал, где люди прикалываются над нейросетью в детстве, а она вырастает и мстит им всем — например, эти же картинки всем в очки дополненной реальности вставляет. А потом появляется нейросетепсихотерапевт (тоже искусственный, конечно), и они вместе разбирают, что она не виновата, это гады-люди над ней в детстве издевались, а так она хорошая и добрая.

Ы. Прикольный сценарий.

красотку распознал по комбинации губ, не иначе)

Не хило вы скакнули от амёбы к собаке и трёхлетке. Это художественное преувеличение или правда так высоко оцениваете то, что сейчас алгоритм умеет делать?

Это мое личное оценочное ощущение. Возможно не верное.

А на какой уровень вы бы оценили возможность отличить мужчину от женщины по фото?

Домашние рыбки узнают хозяина.
А им до собаки как бы не дальше, чем от амёбы.

При чем здесь узнают хозяина. Я говорил про визуальное различие мужчины и женщины. Не думаю, что рыба на такое способна.

Рыбу-женщину от рыбы-мужчины любой рыб запросто отличит. И женщину своего вида от женщины похожего.
А вот гугль - вряд ли.

Отвечает читатель Виктор Олегович П:

В запертой комнате сидит человек, не знающий китайского языка. В окошко ему дают записки с вопросами на китайском. Для него это просто бумажки с нарисованными закорючками, смысла которых он не понимает. Но у него в комнате полно разных книг с правилами, в которых подробно описано, как и в какой последовательности отвечать одними закорючками на другие. И он, действуя по этим правилам, выдает в другое окошко ответы на китайском, которые создают у всех стоящих снаружи полную уверенность в том, что он знает китайский язык. Хотя сам он совершенно не понимает, о чем ему задают вопросы и в чем смысл его ответов.

Перевожу на нормальный язык: ни на какой вообще (такое мое личное оценочное субъективное мнение).

Да, это известная философская дилемма - китайская комната. (https://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%82%D0%B0%D0%B9%D1%81%D0%BA%D0%B0%D1%8F_%D0%BA%D0%BE%D0%BC%D0%BD%D0%B0%D1%82%D0%B0)

В любом случае такая комната пройдет тест Тьюринга, от чего - проблема так и остается философской, а в реальной жизни - это будет настоящий ИИ, то есть ты можешь с ним общаться как с живым человеком и не различать.

А обладает ли он сознанием на самом деле или не обладает - тебе-то какая разница?

Мне кажется, это не совсем корректный вопрос. Таки алгоритмы ещё не умеют определять образы, а сравнивают пиксели. Так можно сказать, о-о, алгоритмы умеют читать (обрабатывать текст, поддерживать текстовую беседу на сносном уровне) - они почти взрослый человек. Но это же не так, фразы выбираются очень простым механизмом с очень маленьким количеством нейронов, грубо говоря, мозгов меньше, чем у муравья.

По распознаванию образов сейчас активная работа ведётся, вот (https://youtu.be/6MKs_E46wSc), например, один из исследователей темы, Алексей Эфрос, объясняет как сейчас распознавание работает, и, по-моему, это нисколько не близко к собаке. (полная презентация (https://youtu.be/Dhp1trwtI2k), с другого выступления, тоже увлекательная)

Кроме того, что мы считаем "приближаясь интеллектом к"? Что алгоритм может сделать что-то одно, что может сравниваемый? Но тогда компютеры давно нас обогнали по шахматам тем же.

Edited 2016-11-21 10:01 (UTC)

> Есть даже такой неологизм "гуглом переводили"

Впервые слышу о таком. Зато с выражением "промтом переводили" - сталкивался. И вот это был реальный треш и угар :)

Дада, гениталии на гусеничном ходу...

Promt 1998, о да, он спас мне французский)

Впечатляет и очень. Мой товарищ в 2001-ом брал курс по распознованию картинок, их курсовой проект был написать алгоритм распознования буквы А написанной от руки, прописью черным цветом на белом фоне. Так чтобы процент распознования был уж не помню как высок неважно насколько ужастен подчерк. И это было какихт-о 15 лет назад. И видеть насколько технологии не шагнули, а скакнули вперед, это впечатляет.

насчет гугло переводчика, думаю, ты погорячился. пока что лучше мультитрана по точности перевода нет ничего. гугл часто вадет какую-то хрень вместо перевода.

Я не профессиональный переводчик и не зарабатываю переводами. Говорю чисто как среднестатистический обыватель, живущий в англоязычной стране. Когда мне нужно что-то перевести с русского на английский или наоборот (или вообще с любого языка на любой язык) я заметил, что последний год первым делом иду в гугл транслейт. И в 99% уже дальше никуда не иду.

Такое вот жизненное наблюдение, ни к чему не обязывающее. Просто подметил.

Меня впечатлил https://quickdraw.withgoogle.com/ тем, что нейросеть научилась судя по всему на достаточно малой выборке, а результат поражающий воображение

о, а вот и котики!

только она еще не научилась. Мы вот ее учим каждый раз, когда соглашаемся поиграть в эту игру с ней :)

"На картинке фотография"

Все верно, черно-белая фотография, именно по признаку цвета.

Но никаких искусственных интеллектов не существует. Гугль просто передает всю информацию в Индию, где работники за еду ищут похожие картинки, переводят между языками и распознают речь

Flat | Top-Level Comments Only

Пробуждается потихоньку

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject

no subject