Войти
ФлеймФорумОбщее

Математический тред (3 стр)

Страницы: 1 2 3
#30
0:16, 15 авг. 2016

Я ничего не понял, но, чтобы не казаться дураком, скажу, что Ren - неосилятор.


#31
0:54, 15 авг. 2016

thevlad
> На русском языке с этим обычно очень плохо

С английским нормально, но со временем не так всё однозначно. Т.е. тратить время готов, но его маловато. Надеюсь, что удастся быстро въехать в тему. Огромное спасибо за ссылку.

Я прям как будто в 2000 год попал, не ожидал такой отзывчивости в интернете, спасибо!

#32
11:42, 15 авг. 2016

vater
воткнул в пейпер на искосок, в общем смотри на что стоит обратить внимание(постараюсь на пальцах):

преобразование Фурье - на входе получаем сигнал в пространственной области, на выходе получаем в частотной, то из каких частот сигнал состоит. каждая частота - комплексное число(амплитуда + фаза). Обычно берут амплитуду и получают PSD(power spectral density).

считают STFT сигнала - в чем смысл, если ты считаешь фурье преобразование всего сигнала, то ты теряешь его локализацию в пространстве, то есть ты можешь сказать что у тебя есть определенная частота, но не можешь сказать где она у тебя в сигнале в пространстве. Соответственно, как делают, берут относительно короткое скользящее окно по сигналу, и внутри него считают FFT, тогда ты имеешь некоторый компромис между локализацией в пространстве и частоте (об этом можно подробнее почитать в книжке там это есть).

Kaiserr window - в чем смысл, преобразование фурье предполагает периодический сигнал, если значения в начале и конце не совпадают, то мы имеем разрыв, которе может "звенеть" на широкий диапазон частот, соответственно значительно ухудшая качество преобразования. решение: наложить окно на сигнал(transform window (per element mul) signal) , которое по краям уводит сигнал в 0, делая его периодичным.

Корреляция - берем два сигнала, чем они больше похоже друг на друга, тем больше корреляция, тем менее похожи тем корреляция меньше

Кросс-корреляция - корреляция посчитанная с различными смещениями(лагами) между сигналами (ну тоесть смещаем один из сигналов, считаем корреляцию, и так по некоторому диапазону значений)

log-скейлинг - можешь поискать в контексте speech recognition, там обычно достаточно подробно описанно почему, связано с устройством голосового тракта

Идея статьи, смотри на Figure 2, верхняя картинка, левая часть vs правая. На правой части видно, что паттерны спектра после STFT(берется амплитуда) для голоса, понемногу непрерывно плавают "curvy", смысл соответственно как-то выделить и квантифицировать, то что видно на картинке. То что внутри STFT окошка и используется для вычислений - берется амплитуда, затем log скейлинг, затем, бинаризация, то есть мы с каким-то шагом дисркетизировали вертикальную ось на картинке. Дальше береться два STFT окошка с расстоянием между ними 3(offset=3), и в дипазоне вертикальных смещений от -l_max до l_max, считается корреляция, пусть максимум(в диапазоне изменений -l_max до l_max) корреляции это r_xcorr а r это корреляция при lag =0,  тогда correlation gain это r_xcorr - r(figure 2, два нижних графика, r_xcorr и r, и самы нижний correlation gain).

Теперь самое интересное это раздел 2.3 статьи. Тут я не очень понял, что они подразумевают под each pair, но судя по всему, берут окно размером 50 по всем STFT окнам, для каждой пары окон (окно в i, окно в i + offset, offset=3) считают correlation gain (xc -c) и соответсвенно для каждой decision point получаются 48 мерный вектор "контекста". Затем подготавливают данные и обучают на них классификатор.

Соответственно, вопрос который бы меня насторожил, есть ли у тебя размеченные данные, чтобы его(классификатор) обучить, и если нет, насколько будет хуже результат, если что-то в ручную придумать на основе временного ряда correlation gain...

#33
12:31, 15 авг. 2016

задачка по терверу:
в одном кармане лежит 2 монеты достоинством 5 рублей и 4 монеты достоинством 2 рубля, из этого кармана переложили произвольно 3 монеты в другой карман. какова вероятность, что пятирублевки окажутся в разных карманах?

#34
16:36, 15 авг. 2016

cranky

0.6 ?

#35
16:48, 15 авг. 2016

thevlad
О, круто!

STFT значит это то, о чём я долго думал как о само собой разумеющемся. Не весь же сигнал исследовать. Т.е. вот такая банальная казалось бы вещь, но почему-то нигде пока не встречал какого либо акцентирования на этом моменте. Kaiserr window в принципе отвечает на другой вопрос, который может мучать - будут ли проблемы после обрезания. Про логарифмический масштаб, я понял из статьи, удобен тем, что частоты гармоник (обертонов голоса) в пределах него меняются линейно, кратно основному тону. Грубо говоря (1 + n) * H, где H - основная частота.

На счёт всего остального, пока не до конца понятно, особенно по поводу окна поверх других окон (я правильно понял?), поэтому думаю стоит дальше почитать книгу, пока не далеко продвинулся.

На счёт данных. Есть 3 часа речи с радио. Голоса как женские так и мужские. Не понял, что именно там нужно пометить?

#36
17:15, 15 авг. 2016

dave
не знаю, как раз собирался выяснить это тут, желательно показать всю цепочку рассуждений.

#37
17:15, 15 авг. 2016

vater
>На счёт всего остального, пока не до конца понятно, особенно по поводу окна поверх других окон (я правильно понял?), поэтому думаю стоит дальше почитать книгу, пока не далеко продвинулся.
этим можешь не заморачиваться, сделай для начала то что основано на STFT окнах

> Есть 3 часа речи с радио. Голоса как женские так и мужские. Не понял, что
> именно там нужно пометить?
ну я бы тебе советовал начать без классификатора, у них вроде и без него что-то получалось.
разметка простая, для каждой точки данных ты должен знать к какому классу она относится(голос, не голос). а дальше supervised learning

#38
19:59, 15 авг. 2016

cranky, dave
> задачка по терверу:
> в одном кармане лежит 2 монеты достоинством 5 рублей и 4 монеты достоинством 2 рубля,
> из этого кармана переложили произвольно 3 монеты в другой карман.
> какова вероятность, что пятирублевки окажутся в разных карманах?
у меня вероятность тоже 3/5, но я не силен в теорвере :)

+ Решение в лоб

З.Ы. По-любому есть решение по-хитрее :)

#39
21:42, 16 авг. 2016

Zegalur
спасибо

#40
22:35, 16 авг. 2016

vater
Изображение
это — не определение. это, скорее, как приблизительный способ представить себе дельта-функцию на пальцах

Изображение

вот это — определение. дельта-функция — это вовсе не функция, а обобщённая функция(хотя из названия это не совсем очевидно), поэтому в явном виде её записать невозможно, она применяется только под интегралом.

>будут ли их несобственные интегралы в общем виде равны?
Изображение
конечно, нет. вообще определить значение функции в точке бесконечностью — некорректно. под формально некорректной записью \(f(x_0)=\infty\) обычно подразумевают \(\lim_{x \to x_0} f(x)=\infty\), то есть понимают поведение функции в окрестности точки, а не значение в ней самой.

> Мечтаю о том, чтобы все математические теории были однажды записаны в нормальном "человеческом" виде, а не для роботов, которым нужна строгость изложения. Кому сдалась эта строгость, мне интересно?
первокурский матан прекрасно изложен практически в любом вузовском учебнике. просто чтобы понять, зачем в нём нужно то и сё, этим нужно пользоваться для чего-то прикладого. например, теория пределов, включая обобщённые функции, очень активно применяется в вычматах для построения разностных схем, в которых решение разрывно между расчётными ячейками (конечно-объёмные методы). вообще в матане золотое правило: если тебе в каком-то классическом разделе что-то кажется неведомой ерундой, это всего лишь обозначает, что ты это не понимаешь и/или не умеешь применять.

#41
21:38, 3 сен. 2016

Вероятность события при нескольких бросках:

ВероятностьИтого = 1-(1-ВероятностьСобытия)^КоличествоПопыток
#42
21:45, 3 сен. 2016

хорош флейм замусоривать!

Страницы: 1 2 3
ФлеймФорумОбщее

Тема в архиве.