sly2m: (Default)
sly2m ([personal profile] sly2m) wrote2012-01-16 11:06 am

Мне опять скучно, бес...

Предложите тему, которая вам интересна.


UPD: Спасибо друзья. Уже чуть менее скучно.

[identity profile] sly2m.livejournal.com 2012-01-16 04:45 pm (UTC)(link)
Да, но интересна именно автоматическая реализация данной задачи!

[identity profile] dibutil.livejournal.com 2012-01-16 04:53 pm (UTC)(link)
Неинтересна такая задача. Практически каждый случай будет частным. Даже выделить автоматом один инструмент не имея его сэмплов практически невозможно, а сэмплами - исключительно трудно (фактически каждый квант надо будет фильтровать для спектров всех нот конкретного инструмента и потом как-то выбирать, что попало). Я встречал несколько реализаций и все они были лажовые.

[identity profile] sly2m.livejournal.com 2012-01-16 05:13 pm (UTC)(link)
А на мой взгляд - как раз очень интересна. Да, сейчас все на любительском и очень фиговом уровне. Но именно поэтому данная тема и интересна. Возможно ли (хотя бы теоретически) решение этой задачи.
И если да - в какую сторону двигаться, чтобы лет через 10-20 достичь ее решения.

[identity profile] dibutil.livejournal.com 2012-01-16 05:28 pm (UTC)(link)
Цена вопроса? ;) Shazam уже что-то умеет и Youtube на раз определяет копирайтный контент даже если исполнял его я на своем компе (задрали, кстати). Думаю они научатся нотировать прослушку быстрее, чем Гугл научился переводить с одного языка на другой.

[identity profile] sly2m.livejournal.com 2012-01-16 05:43 pm (UTC)(link)
Ха, нотировать-то они научатся. Но все еще в пределах "человеческого прекрасного".

Как сейчас гугл хреново и механически читает текст, так и переводит он чересчур механически, для примера можно погонять текст, переводя его туда-сюда, и на выходе получится полная каша, это известный прикол.

То же и с нотами. Записывать их и по ним воспроизводить автомат научится (если уже не умеет) в течении ближайших пяти лет. Но "частота дискретизации" при этом весьма велика. Т.е. любой человек, даже не специалист, легко обнаружит механическую подделку. Не умеет покуда компьютер воспроизводить все эти неуловимые сбои ритма, оттенки и экспрессию, все то, чем так ценна для нас человеческая музыка.

А сумеет он это (чисто по теории ЦАП-АЦП) когда частота дискретизации этих параметров будет как минимум вдвое (а лучше в десять раз) выше, чем порог человеческого распознавания всех этих оттенков.

Что тоже все алгоритмизируемо в принципе, но необходимы слишком большие вычислительные мощности.
Может быть гуглу, как всепланетной системе это будет по силам? К тому и идем, кстати.