Aroch
> убитая батарея.
Внезапно и это легко проверяется, софт телефона говорит что с батарее все "good"
Mephistopheles
> Внезапно и это легко проверяется, софт телефона говорит что с батарее все
> "good"
если ты считаешь что 3ч в таком режиме это всё good, то ок.
Aroch
> если ты считаешь что 3ч в таком режиме это всё good, то ок.
считать я могу что угодно, но чудес не бывает. Да для телефона 3 часа кодирования видео с включенным экраном это норма.
Тебе сильно повезло получить телефон который может это делать в течении > 20 часов. Кстати модель не подскажешь? Уж очень захотелось телефон который так может.
Mephistopheles
> считать я могу что угодно, но чудес не бывает. Да для телефона 3 часа
> кодирования видео с включенным экраном это норма.
тебе сильно не повезло получить телефон который может это делать в течении всего 3 часов. Кстати модель не подскажешь? Уж очень захотелось обходить телефоны которые только так могут.
Aroch
ааа ты на ютубе такое видел ясно... Ну тут действительно разговаривать больше не о чем.
Mephistopheles
> ааа ты на ютубе такое видел ясно... Ну тут действительно разговаривать больше
> не о чем.
какой же ты лолка /_-
Alexey_M
Яркий пример проблемы XY.
Так никто не делает потому что когда человек начал кричать или услышал звук выстрела то уже поздно что либо делать.
Точно так же как для станков никто не делает датчиков крика намотанного на вал слесаря а делают автоматику безопасности - нажимные полы и датчики проникновения к опасной установке которые тут же стопорят ее поднимают тревогу и фотают незадачливого рукожопа во всех ракурсах для донесения начальству.
Так и для жилища - делают систему видеонаблюдения с датчиками проникновения, делают автоматически срабатывающие рольставни на окна, скажем, и громкую сирену с одновременным вызовов ГБР. То есть решается задача - затруднить проникновение злоумышленника в охраняемый объект за то время пока едет ГБР.
P.S. А задачу предотвращений трагедий типа колумбайна необходимо решать в первую очередь работающими не "на отвали" психиатором и наркологом в рамках уже существующей системы диспансеризации.
Aroch
> отличить боевичок с пыщ-пыщ от реальных пыщ-пыщ ты сможешь даже не разу не
> слышав реальный пыщ-пыщ
А реальный пыщпыщ от просмотра какого "разрушительного ранчо" где внезапно записан реальный пыщ-пыщ? МММ???
Asdpoi
> А реальный пыщпыщ от просмотра какого "разрушительного ранчо" где внезапно
> записан реальный пыщ-пыщ? МММ???
предлагаю тебе самостоятельно подумать почему такой сценарий не сработает.
Блин, я все таки выскажусь. Во-первых соглашусь с товарищем выше - постоянно снимать звук с микрофона это энергоёмкий процесс, учитывая что 99.99% будет работать в никуда - держим в уме что мы просто так ломаем батарею.
Дальше - это Big Data и Нейросети. То есть нужна огромная коллекция звуков проанализированных программно и сведенных к единой системе сигналов, это нужно что бы отличать хлопок тапком по таракану от звука выстрела какого-либо оружия. Эту базу в любом случае придется неоднократно редактировать, поэтому держим в уме несколько тысяч в ручную перебранных звуков.
Теперь что касается нейросетей - по большому счету тут если у вас не завалялся карманный Эйнштейн на зарплате в 600 У.Е., то вы берете готовую библиотеку, и нанимаете крутого специалиста который допишет к этой конкретной нейросети работу со звуком под вашу базу звуков.
Теперь - нейросети это всегда медленно, поэтому если вы хотите получить ответ на выстрел не через 12 минут обработки телефоном уже мертвого хозяина, то вам нужен очень мощный сервер. Идеально подойдет майнерская ферма миллионов так за 100 размером с половину твоей квартиры.
Теперь нам нужен толковый человек который соберет все части приложения в одну работающую систему, которая отсылает данные на твой сервер. При этом мы держим в уме что сигнал транслируется непрерывно. В наших интересах отправлять сигнал только при существенном отклонении от фонового шума. Слава богу здесь нейросети не нужны- достаточно реагировать на изменение громкости свыше определенного уровня - и после этого начинать трансляцию на сервер для опознания - все таки жертва таракан или владелец?
В теории такое можно написать, вплоть до идентификации модели оружия по звуку выстрела. Звуки при помощи нейросетей легко раскладывать на слои, таким образом выделяя из звуков подсистемы от разных источников.
Но да, тут правильно сказали, цена такого проекта, если делать все по взрослому, то это под 200 миллионов рублей от эскиза до релиза. Проще говоря это вариант под грант или проект под финансирование со стороны, но вы вряд ли сможете объяснить мешкам с деньгами почему им надо вбухивать 200 лямов в проект который умеет опознавать выстрелы из оружия, а больше в общем ничего не умеет. А как только станет понятно (а это будет понятно всем) что потенциально эта штука просто шпионское ПО, которое нахаляву сканирует звуковой канал устройства нон-стопом непойми куда отсылая эти данные, клиентов просто не останется.
Просто пытаюсь объяснить и донести простую идею - если это делать хорошо, то это очень очень дорогая разработка, но при этом она не обладает никаким коммерческим легальным потенциалом, и вероятно вы так и не найдете свою аудиторию, потому что 300 параноиков это не аудитория.
PeeKay
Спасибо за подробное разьяснение почему это так дорого. Но пока не совсем понятно почему на распознавание объектов уже есть библиотеки, а для шумов нет. Для объектов это тоже видимо в начале было дорого. Но это было нужно. Поэтому их сделали. А теперь они есть в доступе. А шум видимо пока никому не нужен?
Alexey_M
> Но пока не совсем понятно почему на распознавание объектов уже есть
> библиотеки, а для шумов нет
Потому что распознавание визуальных образов это крайне востребованная дисциплина над которой работают тысячи людей с момента появления цифровой фотографии. Потому что распознавание визуальной информации это один из ключей к робототехники, автопилотам, сигнализациям, и прочим системам безопасности. Вы ведь капчу проходили с лодками и автобусами - это тоже обучает нейросети. Причем манипуляции с данными там многомерные - картинку сжимают, блюрят, крутят, оставляют без цвета, накладывают друг на друга, в общем колбасятся так что мало не покажется - и ради того что бы опознать один единственный автобус - требуется целый пул фотографий. И работает это не сказать что сильно быстро.
Еще один момент - к фотографиям легко крепятся уникальные тэги, поскольку визуальные объекты легко идентифицировать, распознать в них что-то. Аудиосигналы же не поддаются такой унификации, и программно разбросать по ним тэги для работы нейросети не получится.
Просто представьте что у вас, например, база в 10 тысяч звуков оружия из тиров, из фильмов, из студий звукозаписи, синтетические звуки и так далее. Как вы себе представляете работу специалиста который должен промаркировать все звуки в базе? Он же с ума сойдет! Представьте сидеть и полный рабочий день в течении пары месяцев перебирать одинаковые звуки выстрелов и присваивать им мета-тэги? Это безумие!
Ну и потом я плохо представляю себе коммерческий проект в составе которого есть распознавание выстрелов и при этом это не шпионское ПО
Тема в архиве.