sly2m: (default)
sly2m ([personal profile] sly2m) wrote2016-11-16 03:18 pm

Пробуждается потихоньку

Наверняка вы знаете про такую фичу от Гугла, но вдруг нет, все равно расскажу.

Уже несколько лет у Гугла появилась возможность поиска по картинкам. То есть ты подсовываешь ему картинку, и он ищет в сети похожие изображения. Не ахти какая новость, первым (и во многом до сих пор лучшим) на этом поприще стал сервис TinEye, а сегодня поиск по картинкам есть во всех популярных поисковиках, и у Yandex, и у Bing и у остальных. Но с некоторых пор Гугл предлагает чуть больше, чем просто поиск похожих изображений, он еще и пытается осознать, что изображено на фото.

Можете попробовать сами. Чтобы не морочиться с копированием адреса картинки в поисковую строку, можно поступить проще. Если вы пользуетесь браузером Google Chrome, эта функциональность уже встроена. Достаточно кликнуть на любую картинку правой кнопкой мыши и выбрать в контекстном меню "Search Google for image" ("Найти картинку (Google)" в русской версии).

Untitled1

Для других браузеров придется ставить сторонние плагины, например Search By Image (by Google) для Mozilla Firefox и так далее.

Если начать кликать на первые попавшиеся картинки, можно увидеть, что гугл пытается распознать, что на них изображено.

Capture4a

Capture1

Capture2

Capture3

Не удивляйтесь такому странному сочетанию, просто первым попавшимся постом с картинками оказался сегодняшний из топа от Варламова.

Может показаться, что Гугл просто сопоставляет искомую картинку с похожими, и читает у найденных сопутствующее текстовое описание. Например он не только говорит, что изображено на фото, но и первой же строкой дает ссылку на статью об объекте в википедии, откуда эта картинка, собственно и взята.

Capture3a

Capture2a

Capture2b

Но не все так просто. Гугл действительно думает, если можно так сказать, над содержимым изображения, в этом достаточно легко убедиться, если подсунуть ему уникальные фото, которых больше нет нигде в Интернете, например снимки из вашего домашнего архива с отпускными фотографиями или фото с закрытых ресурсов. Правда в этом случае он чаще всего сбивается на свой родной английский.

Capture5a
На картинке женщина

Capture6
На картинке прием пищи

Capture7
На картинке красотка

Capture8
На картинке борода

Я думаю Гугл комбинирует подходы. Сначала ищет совпадения в уже имеющейся базе, ведь если они есть, чего процессор морочить, а если не находит, пытается распознать изображение.

Конечно, распознавалка пока не ахти. Довольно часто Гугл ошибается или вовсю капитанит, например:

Capture10a
На картинке блондинка

Capture9
На картинке фотография, no shit, Sherlock!

Но все равно. Распознавание образов (а ведь он действительно в буквальном смысле - распознает образы) это необходимый, и чуть ли не один из самых главных признаков интеллекта (любого биологического интеллекта, не обязательно человеческого), и тут Гугл уже существенно выше по уровню развития чем амеба или там гусеница, приближаясь интеллектом к собаке или ребенку 2-3 лет.

Да, пока не густо. Но ведь взросление-то не останавливается, развитие идет, процесс обучения не просто продолжается, а набирает обороты. Представляете, что будет, когда пройдет 10 лет, когда Гугл достигнет интеллекта подростка, взрослого человека, гения, ...

Естественно, распознавание образов само по себе далеко не полноценный Искусственный Интеллект. Но ведь работа идет по всем фронтам. Знаете такой сервис, Google Translate (Гугло-переводчик)? Если не ошибаюсь, его открыли для широкой публики в районе 2010 года, 6 лет назад. Тогда это был просто смех, а не переводчик. Он полную пургу гнал, был даже такой способ развлечения, подыскивать забавные косяки перевода гугла.

Capture11

Между тем сегодня я уже пользуюсь гуглопереводчиком как основным средством перевода слов. Естественно, переводить полные тексты им пока еще не очень. Есть даже такой неологизм "гуглом переводили", означающий корявый до невозможности бессвязный набор слов, вроде головки пальца ноги и им подобных. Но вот перевод отдельных слов я ищу в основном гуглом. Он тут же дает и значения и варианты и примеры использования. Причем, последний год делаю это голосом, гугл распознает мой английский на слух в 95%, и чем дальше тем лучше, хотя тоже, помните, было такое чудо как "Змей Горыныч" или "Magic Gooddy"? А сейчас Гугл на слух распознает мой английский лучше, чем китайские коллеги по работе.

И вот Гугл, наконец, подключил к переводу нейросети. Говорят, будет шпарить лучше носителя, целыми фразами и предложениями. Хотя пока в открытом сервисе доступны только переводы на английском, французском, немецком, испанском, португальском, китайском, японском, корейском и турецком. Посмотрим, конечно, но лиха беда начало, особенно если продолжение будет подкреплено самообучением и продолжит набирать скорость.

[identity profile] flat-area.livejournal.com 2016-11-16 08:29 pm (UTC)(link)
Яндекс давно это делает. Разве что не сообщает об очевидном, вроде "female", не строит из нас идиотов.

[identity profile] sly2m.livejournal.com 2016-11-16 09:37 pm (UTC)(link)
Об "очевидном"? Представь себе, какие мощности и уровни абстракции нужны машине, чтобы распознать в любой (в любой!) картинке женщину. Не слабее мозга ребенка, скажем мозг червяка с подобным не справится.

Ну, и конечно, под словом "Гугл" я не имею ввиду конкретную программу конкретной фирмы Google, как минимум, чтобы не заморачиваться с копирайтами. У них пока просто лучше всех получается, но может быть первый полноценный ИИ проснется в недрах какой-то другой компании. Но все-таки я скорее на Google поставлю.

[identity profile] flat-area.livejournal.com 2016-11-17 06:35 am (UTC)(link)
Эээ...
С одной стороны, да, самообучаемые алгоритмы совершили серьёзный рывок.
С другой стороны, там несколько проще, чем вы себе представили. Любой предмет, лицо, или задница, или дом имеют свой набор характеристик на изображении. Эти характеристики группируют (многомерная кластеризация). И по характеристикам дома с лицами пересекаются очень редко. А база картинок с подписями для хорошей кластеризации у поисковиков есть...

[identity profile] asstra2011.livejournal.com 2016-11-16 08:37 pm (UTC)(link)
А как он ищет по картинке из личного архива? Значит, надо этот архив в сеть загрузить?

[identity profile] sly2m.livejournal.com 2016-11-16 09:39 pm (UTC)(link)
Ну, вы выкладываете свои фото в ЖЖ например? Это по идее уникальные фотографии, нигде в Интернете таких быть не может. Или можно вручную загрузить любое фото Гуглу на поиск, ссылку я привел в самом первом абзаце. И конечно же, если у вас смартфон Андроид, и вы не убирали галочку с "Синхронизировать хранилище фотографий в облако", то по умолчанию, все фото, что вы делаете на этот смартфон заливаются в облачное хранилище гугла.

[identity profile] asstra2011.livejournal.com 2016-11-17 02:51 am (UTC)(link)
Да, уже разобралась, спасибо)

[identity profile] fixik-papus.livejournal.com 2016-11-16 09:05 pm (UTC)(link)
Должен заметить, что в крайние 2-3года просто по экспоненте пошел расти бум систем технического зрения (суть то же распознавание образов) - в промышленной робототехнике.

[identity profile] sly2m.livejournal.com 2016-11-16 09:42 pm (UTC)(link)
У гугла фишка в том, что он не просто распознает, что действительно уже почти похоже на признак интеллекта, но и тут же может сопоставить с самой обширной в мире базой уже распознанных образов. Это две составляющие мозговой деятельности, сам процесс распознания, и соотношение распознанного с хранимым в памяти, чтобы не просто по реперным точкам понять, что перед тобой "женщина", но и что это конкретно твоя любимая жена.

Гугл, кстати, и это уже умеет делать потихоньку, только пока в открытый доступ сервис не открывает.

[identity profile] ncuxuamp-pro.livejournal.com 2016-11-16 09:40 pm (UTC)(link)
вот по этому фото из моего семейного архива https://goo.gl/photos/KDV7e5yKChNjicpW6 определил, что скорее всего это динозавр! Правда, на глазах умнеет.
Спасибо, что обратили внимание.

[identity profile] mithrilian.livejournal.com 2016-11-16 09:53 pm (UTC)(link)
"Для других браузеров придется ставить сторонние плагины,"

Нет, на десктопе достаточно выйти на гугл-имадж, в строку поиска вставить ссылку на картинку и нажать не на поиск, а на изображение фотоаппарата прямо в той же строке.

[identity profile] sly2m.livejournal.com 2016-11-16 09:58 pm (UTC)(link)
Да, это понятно, что можно. Но все равно это приходится несколько действий совершать, что-то там открывать, искать адрес, куда-то что-то копировать.

А тут нажал правую кнопку на вашу аватарку, и тут же получил ответ.

Image

[identity profile] mithrilian.livejournal.com 2016-11-16 10:01 pm (UTC)(link)
Да, впечатляет.

Мой способ только для десктопа - мобильные версии требуют адд-она.

[identity profile] vplusplus.livejournal.com 2016-11-17 01:40 am (UTC)(link)
Да, знаю я эту фичу. И переводчиком гугла давно уже пользуюсь — он, конечно, иногда такоооое делает, но в целом, например, с японцами на английском вполне дает возможность пообщаться :)

Правда, надежд на то, что скоро он пробудится и все такое, я бы не делал. У всех этих штук нет самоосознания. И по моим личным интуитивным ощущениям и даже представлениям — и не будет. Другой вопрос, надо ли оно ему вообще (про китайскую комнату же слышал?), но, тем не менее: интеллект — это всего лишь интеллект. Пусть и в стопицот раз более мощный, чем наш (как мы его представляем нашим интеллектом согласно нашим представлениям о том, что такое жизнь, сознание и тот самый интеллект) — но это только интеллект. Как оно на самом деле будет — ну, увидим. Кто-то и с Siri общается, рассказывает ей о жизни и даже флиртовать пытается, и ему норм.

ЗЫ Ну, и пост самзнаешьгде, где надо нарисовать для нейросети кота за двадцать секунд, ты, наверное, тоже уже видел :) Все побежали развлекаться, а хитрый искуственный интеллект сказал "Ага! Бесплатно и массово будут меня учить распознаванию? Ооооок!".
Edited 2016-11-17 01:41 (UTC)

[identity profile] sly2m.livejournal.com 2016-11-17 02:54 am (UTC)(link)
Какие, нафиг, коты за 20 секунд. Я уже приводил данный пример в каком-то комментарии, снова его заюзаю.

В одном 2016м году было произведено и продано 1.5 миллиардов смартфонов на системе Андроид. В придачу к уже существующим не уверен скольки миллиардам.
Это как минимум 1.5 миллиарда камер, смотрящих в мир. Причем, не знаю, как другие смартфоны, мой еще умеет измерять температуру окружающего воздуха, его влажность, давление, напряжение и направление магнитного поля и еще несколько характеристик, включая GPS-позицию этих данных. Ну, и аудио-микрофон, который записывает все входящие в него звуки, пытаясь вычленить в них комбинацию "ОК, Гугл."

И все это записывается и расшифровывается в реальном времени, покуда ты намеренно не зайдешь в настройки и все это не отменишь. Да и то, не факт, что при отмене настроек, оно перестает работать.

И это только сбор данных. Про обучение, т.е. ответы интеллектуального пользователя на вопросы, приходящие из интернета я умолчу, об этом в следующем комментарии.

А ты мне про какой-то там сайт, на который зашли 20 000 человек нарисовать котиков...

[identity profile] vplusplus.livejournal.com 2016-11-17 03:45 am (UTC)(link)
Что ж, хороший сценарий, ничего не скажешь.

[identity profile] vplusplus.livejournal.com 2016-11-17 02:32 pm (UTC)(link)
А на сайте, кстати, ребята пытаются поиздеваться над нейросетью и рисуют ей ... Вот скоро появится сериал, где люди прикалываются над нейросетью в детстве, а она вырастает и мстит им всем — например, эти же картинки всем в очки дополненной реальности вставляет. А потом появляется нейросетепсихотерапевт (тоже искусственный, конечно), и они вместе разбирают, что она не виновата, это гады-люди над ней в детстве издевались, а так она хорошая и добрая.

[identity profile] sly2m.livejournal.com 2016-11-17 09:12 pm (UTC)(link)
Ы. Прикольный сценарий.

[identity profile] prekrasnople4a.livejournal.com 2016-11-17 03:00 am (UTC)(link)
красотку распознал по комбинации губ, не иначе)

[identity profile] snowdrop.livejournal.com 2016-11-17 07:38 am (UTC)(link)
Не хило вы скакнули от амёбы к собаке и трёхлетке. Это художественное преувеличение или правда так высоко оцениваете то, что сейчас алгоритм умеет делать?

[identity profile] sly2m.livejournal.com 2016-11-17 09:11 pm (UTC)(link)
Это мое личное оценочное ощущение. Возможно не верное.

А на какой уровень вы бы оценили возможность отличить мужчину от женщины по фото?

[identity profile] rusec.livejournal.com 2016-11-17 10:48 pm (UTC)(link)
Домашние рыбки узнают хозяина.
А им до собаки как бы не дальше, чем от амёбы.

[identity profile] sly2m.livejournal.com 2016-11-18 02:19 am (UTC)(link)
При чем здесь узнают хозяина. Я говорил про визуальное различие мужчины и женщины. Не думаю, что рыба на такое способна.

[identity profile] rusec.livejournal.com 2016-11-18 02:22 am (UTC)(link)
Рыбу-женщину от рыбы-мужчины любой рыб запросто отличит. И женщину своего вида от женщины похожего.
А вот гугль - вряд ли.

[identity profile] vplusplus.livejournal.com 2016-11-18 12:16 am (UTC)(link)
Отвечает читатель Виктор Олегович П:

В запертой комнате сидит человек, не знающий китайского языка. В окошко ему дают записки с вопросами на китайском. Для него это просто бумажки с нарисованными закорючками, смысла которых он не понимает. Но у него в комнате полно разных книг с правилами, в которых подробно описано, как и в какой последовательности отвечать одними закорючками на другие. И он, действуя по этим правилам, выдает в другое окошко ответы на китайском, которые создают у всех стоящих снаружи полную уверенность в том, что он знает китайский язык. Хотя сам он совершенно не понимает, о чем ему задают вопросы и в чем смысл его ответов.


Перевожу на нормальный язык: ни на какой вообще (такое мое личное оценочное субъективное мнение).

[identity profile] sly2m.livejournal.com 2016-11-18 02:22 am (UTC)(link)
Да, это известная философская дилемма - китайская комната. (https://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%82%D0%B0%D0%B9%D1%81%D0%BA%D0%B0%D1%8F_%D0%BA%D0%BE%D0%BC%D0%BD%D0%B0%D1%82%D0%B0)

В любом случае такая комната пройдет тест Тьюринга, от чего - проблема так и остается философской, а в реальной жизни - это будет настоящий ИИ, то есть ты можешь с ним общаться как с живым человеком и не различать.

А обладает ли он сознанием на самом деле или не обладает - тебе-то какая разница?

[identity profile] snowdrop.livejournal.com 2016-11-21 09:57 am (UTC)(link)
Мне кажется, это не совсем корректный вопрос. Таки алгоритмы ещё не умеют определять образы, а сравнивают пиксели. Так можно сказать, о-о, алгоритмы умеют читать (обрабатывать текст, поддерживать текстовую беседу на сносном уровне) - они почти взрослый человек. Но это же не так, фразы выбираются очень простым механизмом с очень маленьким количеством нейронов, грубо говоря, мозгов меньше, чем у муравья.

По распознаванию образов сейчас активная работа ведётся, вот (https://youtu.be/6MKs_E46wSc), например, один из исследователей темы, Алексей Эфрос, объясняет как сейчас распознавание работает, и, по-моему, это нисколько не близко к собаке. (полная презентация (https://youtu.be/Dhp1trwtI2k), с другого выступления, тоже увлекательная)

Кроме того, что мы считаем "приближаясь интеллектом к"? Что алгоритм может сделать что-то одно, что может сравниваемый? Но тогда компютеры давно нас обогнали по шахматам тем же.
Edited 2016-11-21 10:01 (UTC)

[identity profile] diente-de-lion.livejournal.com 2016-11-17 07:55 am (UTC)(link)
> Есть даже такой неологизм "гуглом переводили"

Впервые слышу о таком. Зато с выражением "промтом переводили" - сталкивался. И вот это был реальный треш и угар :)

[identity profile] frank-fqc.livejournal.com 2016-11-17 08:43 am (UTC)(link)
Дада, гениталии на гусеничном ходу...

[identity profile] siron-nsk.livejournal.com 2016-11-17 10:17 am (UTC)(link)
Promt 1998, о да, он спас мне французский)

[identity profile] gaoh.livejournal.com 2016-11-17 02:00 pm (UTC)(link)
Впечатляет и очень. Мой товарищ в 2001-ом брал курс по распознованию картинок, их курсовой проект был написать алгоритм распознования буквы А написанной от руки, прописью черным цветом на белом фоне. Так чтобы процент распознования был уж не помню как высок неважно насколько ужастен подчерк. И это было какихт-о 15 лет назад. И видеть насколько технологии не шагнули, а скакнули вперед, это впечатляет.

[identity profile] arteshok.livejournal.com 2016-11-17 02:42 pm (UTC)(link)
насчет гугло переводчика, думаю, ты погорячился. пока что лучше мультитрана по точности перевода нет ничего. гугл часто вадет какую-то хрень вместо перевода.

[identity profile] sly2m.livejournal.com 2016-11-17 09:15 pm (UTC)(link)
Я не профессиональный переводчик и не зарабатываю переводами. Говорю чисто как среднестатистический обыватель, живущий в англоязычной стране. Когда мне нужно что-то перевести с русского на английский или наоборот (или вообще с любого языка на любой язык) я заметил, что последний год первым делом иду в гугл транслейт. И в 99% уже дальше никуда не иду.

Такое вот жизненное наблюдение, ни к чему не обязывающее. Просто подметил.

[identity profile] atamur.livejournal.com 2016-11-17 09:52 pm (UTC)(link)
Меня впечатлил https://quickdraw.withgoogle.com/ тем, что нейросеть научилась судя по всему на достаточно малой выборке, а результат поражающий воображение

[identity profile] vplusplus.livejournal.com 2016-11-18 12:20 am (UTC)(link)
о, а вот и котики!

только она еще не научилась. Мы вот ее учим каждый раз, когда соглашаемся поиграть в эту игру с ней :)

[identity profile] redis.livejournal.com 2016-11-18 03:12 pm (UTC)(link)
"На картинке фотография"

Все верно, черно-белая фотография, именно по признаку цвета.

Но никаких искусственных интеллектов не существует. Гугль просто передает всю информацию в Индию, где работники за еду ищут похожие картинки, переводят между языками и распознают речь