Неинтересна такая задача. Практически каждый случай будет частным. Даже выделить автоматом один инструмент не имея его сэмплов практически невозможно, а сэмплами - исключительно трудно (фактически каждый квант надо будет фильтровать для спектров всех нот конкретного инструмента и потом как-то выбирать, что попало). Я встречал несколько реализаций и все они были лажовые.
А на мой взгляд - как раз очень интересна. Да, сейчас все на любительском и очень фиговом уровне. Но именно поэтому данная тема и интересна. Возможно ли (хотя бы теоретически) решение этой задачи. И если да - в какую сторону двигаться, чтобы лет через 10-20 достичь ее решения.
Цена вопроса? ;) Shazam уже что-то умеет и Youtube на раз определяет копирайтный контент даже если исполнял его я на своем компе (задрали, кстати). Думаю они научатся нотировать прослушку быстрее, чем Гугл научился переводить с одного языка на другой.
Ха, нотировать-то они научатся. Но все еще в пределах "человеческого прекрасного".
Как сейчас гугл хреново и механически читает текст, так и переводит он чересчур механически, для примера можно погонять текст, переводя его туда-сюда, и на выходе получится полная каша, это известный прикол.
То же и с нотами. Записывать их и по ним воспроизводить автомат научится (если уже не умеет) в течении ближайших пяти лет. Но "частота дискретизации" при этом весьма велика. Т.е. любой человек, даже не специалист, легко обнаружит механическую подделку. Не умеет покуда компьютер воспроизводить все эти неуловимые сбои ритма, оттенки и экспрессию, все то, чем так ценна для нас человеческая музыка.
А сумеет он это (чисто по теории ЦАП-АЦП) когда частота дискретизации этих параметров будет как минимум вдвое (а лучше в десять раз) выше, чем порог человеческого распознавания всех этих оттенков.
Что тоже все алгоритмизируемо в принципе, но необходимы слишком большие вычислительные мощности. Может быть гуглу, как всепланетной системе это будет по силам? К тому и идем, кстати.
no subject
no subject
no subject
И если да - в какую сторону двигаться, чтобы лет через 10-20 достичь ее решения.
no subject
no subject
Как сейчас гугл хреново и механически читает текст, так и переводит он чересчур механически, для примера можно погонять текст, переводя его туда-сюда, и на выходе получится полная каша, это известный прикол.
То же и с нотами. Записывать их и по ним воспроизводить автомат научится (если уже не умеет) в течении ближайших пяти лет. Но "частота дискретизации" при этом весьма велика. Т.е. любой человек, даже не специалист, легко обнаружит механическую подделку. Не умеет покуда компьютер воспроизводить все эти неуловимые сбои ритма, оттенки и экспрессию, все то, чем так ценна для нас человеческая музыка.
А сумеет он это (чисто по теории ЦАП-АЦП) когда частота дискретизации этих параметров будет как минимум вдвое (а лучше в десять раз) выше, чем порог человеческого распознавания всех этих оттенков.
Что тоже все алгоритмизируемо в принципе, но необходимы слишком большие вычислительные мощности.
Может быть гуглу, как всепланетной системе это будет по силам? К тому и идем, кстати.