Войти
ФлеймФорумОбщее

Разработка системы подлинного искусственного интеллекта [True Artificial Intelligence System] (74 стр)

Advanced: Тема повышенной сложности или важная.

Страницы: 169 70 71 72 73 74
#1095
13:48, 10 окт. 2016

некоторые навыки люди однажды приобретя в случае неиспользования забывают,
но в случае надобности могут восстановить/вспомнить как и что.

таких навыков много и они разные, часто (почти всегда) одно зависит от другого,
например учёба в ВУЗе зависит от школьных навыков,

если есть пробелы по школьной программе то далее будут спотыкания и в ВУЗе, но при наличии желания
эту цепочку навыков можно успешно прокачать/подтянуть

те наверное имеет смысл какие-то цепочки после создания хранить в БД
и использовать/обучать от случая к случаю либо же сами алгоритмы нужно делать гибкими
и в случае ненужности/невостребованности чего либо сеть должна уметь ходить другими более быстрыми путями.


#1096
19:39, 10 окт. 2016

THE_MASTER
Какие-то пределы уточнения конечно должны быть.
Вопрос тут у меня... ты говоришь звуки опознаёт и синтезирует без проблем.. Так вот, он у тебя может разбивать звучание на базис _звука_ и _тембра_?
Система должна выделять разные классы обобщений. Обобщение языковое, акцентное, тембральное. При этом звуки разных тембров и разных акцентов должны сами по себе собе схлапываться в одну "точку смысла".

Обучение у тебя должно идти параллельными потоками. Звуком и текстом.

Мне кажется, что у тебя такое "пересыщение" происходит именно из-за неспособности твоей структуры создавать разбиение "по базису". Оно, как мне кажется, не умеет создавать "развёртку", и фактически вынуждена хранить здоровое поле "каждый с каждым", вместо выделения двух множеств, которые можно произвольно пересекать. Или трёх множеств. Или десяти (если надо). Т.е. ты в концепцию не закладывал расширение "мерности" до произвольного количества. У тебя ведь она одномерна, и умеет только склеивать близкие вещи?

#1097
22:41, 10 окт. 2016

Вот этим чудовищам не хватает искуственного интеллекта. Они походу пользуют наборы анимаций, снятых с живых существ и отработанные на конкретной модели. Asimo кстати двигается лучше всех человекообразных, но пропорции и углы поворота у него очень убогие. В итоге - нет там искуственного интеллекта, железо больше работает. А вот эта вот вертушка на месте головы у моделей Бостона, (так похожая на какой-то сигнал мусоровозок) скорее всего самая весёлая видеокамера в мире. А может и нет, они ведь с пульта управляются.

+ Показать

#1098
22:51, 10 окт. 2016

captain NOVA
> Они походу пользуют наборы анимаций, снятых с человека и отработанные на конкретной модели.
у тебя проф. деформация - во всём видишь мокап.

Нет. Там самый сок и интеллект какраз в том что моторика считается динамически адаптируя прогнозируемое движение к суровой реальности.

> Asimo кстати двигается лучше всех
Есть видео как он шарахается по заснеженному лесу для сравнения?

#1099
23:12, 10 окт. 2016

Синька
> Там самый сок и интеллект какраз в том что моторика считается динамически
> адаптируя прогнозируемое движение к суровой реальности.
Чот медленно и дёрганно. 6 координат прогнозировать ведь очень трудно. Я про translate и rotate. Первая кремниевая микросхема выпущена в 1951 году если что.
Синька
> Есть видео как он шарахается по заснеженному лесу для сравнения?
Разработчики сказали - через год. Стяжку в лес залить не успели)
Я про внешнее восприятие. Никто ведь не рассказал как оно у них всё работает, а то мы быстро бы выяснили все косяки разработки.

#1100
9:57, 11 окт. 2016

Dexus
> Какие-то пределы уточнения конечно должны быть.
Там должен быть сброс внимания. То есть, допустим, ты разглядываешь вдалеке какой - то плохо различимый объект или же пытаешься различить какое - то слово в зашумлённой звукозаписи очень плохого качества, и вот ты изучаешь ... изучаешь входные данные и понимаешь, что ты не можешь всё таки определиться, что это за объект, тогда ты просто напросто бросаешь эту дурацкую затею, сбрасываешь только что накопленные цепочки информации и начинаешь следить за чем - то другим.

Dexus
> Вопрос тут у меня... ты говоришь звуки опознаёт и синтезирует без проблем..
Я столкнулся с рядом проблем производительности, даже на звуке, сейчас решаю эти проблемы и уверен, что переделка механизмов самоорганизации поможет решить эти проблемы. По сути, то, что я тебе говорил про распознавание и синтез - работает в тестовом режиме, с ограниченным набором звуков. Если анализировать весь спектр звучания и самовыстраивать из - этого модель, получается кошмар с объёмами информации, это всё работает, но это далеко не real time и мне кажется, что я что - то упустил, сейчас как раз над этим работаю.

Dexus
> Так вот, он у тебя может разбивать звучание на базис _звука_ и _тембра_?
Честно? Я не знаю, что это такое, гуглить лень.

Dexus
> Система должна выделять разные классы обобщений. Обобщение языковое, акцентное,
> тембральное. При этом звуки разных тембров и разных акцентов должны сами по
> себе собе схлапываться в одну "точку смысла".
Вот с этим как раз всё в порядке, через какое - то определённое кол-во прослушанной информации, система начинает схлопывать звуки, произнесённые разными дикторами, в одну сущность. При синтезе, ты просто желаешь обратную развёртку по дереву и звучиш как надо.

Dexus
> Обучение у тебя должно идти параллельными потоками. Звуком и текстом.
Там как бы не совсем текстом из букв, а набором звуков, которых больше чем букв...

Dexus
> . У тебя ведь она одномерна, и умеет только склеивать близкие вещи?
Трёхмерна, но в плане звука хватает и 2D.

Dexus
> вынуждена хранить здоровое поле "каждый с каждым"
По поводу всех со всеми... Это вообще тема для отдельного разговора, но в общем - то человек хранит информацию именно так, точнее не совсем. Сейчас поясню. Представь себе в реальном мире какое - то большое здание, может завод какой - то. Так вот, подошёл ты первый раз в жизни к этому заводу и запомнил как он выглядит. Ок, ушёл от завода куда - то по своим делам, но потом вдруг оказался рядом с этого завода, но только с другой стороны и тут ты смотришь....какие - то трубы не знакомые, какой - то забор другой и тд, в общем ты не можешь понять, что это тот же завод, которые ты видел ранее, но когда ты в него зайдёшь, то тебе на проходной скажут, что это тот же завод и ты сразу этот новый вид сзади проассоциируешь с этим заводом, причём будешь долго ходить по заводу и прикидывать, где ты был в первый раз и где оказался во второй, что бы это пространственно относительно друг друга спозиционировать... В общем, если ты подойдёшь к этому заводу ещё где - то в ранее не знакомом месте, ты тоже будешь "чесать репу", что же это такое... А вот если ты побываешь со всех сторон, то есть ты хорошо изучишь этот объект, то ты легко сможешь сказать, стоя у главного входа, что поскольку ты стоишь здесь, сзади этого завода будет - то то, сбоку - то и тд. Если ты будешь стоять сбоку, то ты так же скажешь, что и где находиться, относительно текущего положения. Теоретический, если ты идеально изучил объект, у тебя есть связи всех со всеми, но практический, редко бывает необходимо строить относительные цепочки от каждой точки объекта до всех других для мгновенного узнавания объекта, да и очень энергозатратно это...

В общем, по поводу обобщения...  Как я и говорил раньше, тут главная проблема в избавление от лишних данных, то есть если ты получаешь из двух каких - то простых элементов - более сложный, тебе нужно создать для этого сложного элемента какой - то простой ключ, хеш, который бы его уникально идентифицировал, при этом, тебе не надо было бы хранить информацию о составляющих этого сложного элемента. То есть, допустим, ты объединяешь две матрицы размером 100х100 и в итоге получаешь один простенький ключ, допустим 32-х битный и с ним уже дальше работаешь, то есть в дальнейших манипуляциях тебе уже не надо оперировать большими матрицами, ты оперируешь чисто ключом. Но как же с ним оперировать, спросишь ты, ведь если это нечто типа хеша, то он не несёт в себе никакой информации и ты даже не сможешь сравнить эти два ключа на степень похожести объектов. И вот тут то начинается самое интересное, как раз здесь и вступает в действие та самая пресловутая пространственная организация миниколонок, только в моей модели эта самоорганизация происходит на всех уровнях и не обязательно, что рисунок одного уровня, соответствовал следующему, то есть по вертикале тут тоже разный рисунок, то есть общая картина трёхмерна. Как же их организовывать? Очень просто - при объединение двух простых концептов в сложный, именно в этот момент, ты можешь сравнивать сложные концепты, которые ты строишь, потому, что ты их тут и строишь и собственно в этому механизме построения ты делаешь так, что бы похожие элементы пространственно выстраивались рядом с друг другом и в таком случае, при оперирование хешами на более высоких уровнях, тебе абсолютно не важно, что означает этот ключи и из чего он состоит, важно, что ты легко можешь найти похожие и не похожие объекты по пространственной близости в 3D поле пространственной самоорганизации...

Кстати, по поводу хэшей, Редозубов то - же в последнем видео что - то говорил, где - то посередине ролика https://www.youtube.com/watch?v=7c6YUJ0JuqI
Но у него там бинарный ключ, по которому можно проверить составляющие части бинарными операциями (ну у него там идёт конъюнкция и дизюнкция), я когда - то тоже так думал, что мол это круто и приходил к таким же мыслям года два назад, но потом понял, что ключ может быть очень большим (что бы не было повторов) и для этого потребуется огромное число, которое с практической точки зрения просто будет нецелесообразно использовать ввиду производительности и объёмов памяти, т.к. зачастую ключ будет весить больше, чем данные, которые он "хранит", да и обрабатывать такие ключи очень трудозатратно. Если бы ключ был максимум 64 бита, тогда да, на 64-х битном процессоре за раз бы ты делал бы бинарные операции, а когда у тебя ключ в 100 000 бит...
Вообще, Редозубов говорит какие - то правильные вещи, но в больше степени, какую - то хрень... Мне "понравился" его пример и последнего видео с поиском трансформации вертикальной линии на изображение, где он говорил, что линия может смещаться на 20 по горизонтали и на 20 по вертикале ))) То есть у него зрительное поле 20 на 20 пикселей... faceplam...  Если взять его 1000х1000, если учесть помимо сдвига кучу других трансформаций.... В общем он мне в скапей тоже самое говорил, что он простой брутафорсер ))) Ничего там хитрого у него нет.  В общем он далёк от практики, а это очень плохо, голая теория никому не нужна.

Ладно, я ушёл по делам, наверное опечаток море, я не проверял - времени нет )))

#1101
11:43, 11 окт. 2016

THE_MASTER
> Как я и говорил раньше, тут главная проблема в избавление от лишних данных,
Штука в том, что избавление от лишних данных  должно быть ПОСЛЕ разложения по базису. То есть с той же речью - тембральные окраски мужского голоса для смысла не имеют значения вообще, они из памяти "удаляются", но зато фиксируется само обобщение "мужской голос". И ты когда обратно разворачиваешь, синтезируешь, соответственно должен все эти сопутствующие характеристики тоже передавать, а не просто генерить абстрактный средний голос.
Эти характеристики как раз и позволяют выделять голос конкретного человека из кучи одновременно звучащих. Без этого создания доп.базисов и разложения на базисы всё будет очень уныло и достаточно бессмысленно.

> при оперирование хешами на более высоких уровнях, тебе абсолютно не важно, что означает этот ключи и из чего он состоит, важно, что ты легко можешь найти похожие и не похожие объекты по пространственной близости в 3D поле пространственной самоорганизации...
Как бы да, но и "раз-хеширование" как процесс в нервной системе тоже присутствует. Т.е. процесс обратного возбуждения нижних уровней из верхних.

> То есть у него зрительное поле 20 на 20 пикселей... faceplam...
Да а что такого-то? Вон в оптическом протезировании Argus II синтезируется и передаётся картинка 24х24 пикселей. И этому уже несказанно радуются. Те же насекомые тоже имеют не миллионы пикселей как человек. Эти твои 1000х1000 - совершенно избыточная тема.

#1102
6:10, 27 окт. 2016

Вот интересно как мозг быстро вспоминает среди гигантского обьема сохраненной информации именно ту которая нужна.
Допустим если посмотреть часовое видео. И через месяца 3 включить его в случайном месте. Не сначала. Достаточно будет секунд 5-20 посмотреть чтоб узнать видео. И узнать что его уже смотрел.
Значит мозг помнит все содержимое видео. И узнает его очень быстро. Откуда в мозге так много памяти и как с такой большой скоростью находятся нужные данные.

#1103
15:31, 27 окт. 2016

amd.fx6100
> Достаточно будет секунд 5-20
amd.fx6100
> Значит мозг помнит все содержимое видео.
У тебя неверные выводы. Значит мозг помнит каждые 5 секунд видео, ваш КО (на самом деле хранится сильно сжатая параметрическая модель)

Прошло более 10 месяцев
#1104
12:00, 1 сен. 2017

Dexus, слушай, по поводу системы слуха мозга, у тебя нет случаем инфы, вот те рецепторы, которые находятся в улитке, они воспринимают только положительное увеличение давления, то есть beat+ (в музыкальном смысле) или же так же реагируют на обратную реакцию, то есть когда волна разряжается, ну как бы "уходит"?

Я вот о чём:

+ Показать

А вот о каком бите я говорю:

+ Показать

То есть когда звуковая волна накатывает, ну как бы на рисунке это пики сверху, то есть это сжатие, то есть максимальное давление, то есть максимальный бара удар по рецепторам в кортиевом органе, вот тогда, наверное рецепторы срабатывают (они возможно срабатывают и по ходу нарастания давления), а вот когда волна разряжается, то есть на графике катится вниз и достигает минимальной (по Y) точки и потом меняет направление наверх, в этот момент рецепторы тоже шлют импульсы?

1. Звуковые рецепторы в кортиевом органе срабатывают только на нарастание давления или же так же и на разряжение?
2. Они срабатывают только по "пикам", то есть по гребням, то есть по экстремумам или же плавно, походу нарастания/ разряжения, увеличивая/уменьшая силу посылаемого импульса?

#1105
12:45, 1 сен. 2017

-=MASTER=-
1. Каждый аксон передаёт свой тон.
2. Спайки передают фазовую информацию (т.н. Phase lock)
3. Амплитуда кодируется не столько бурстами, сколько количеством _смежных_ возбужденных волокон. Там нетривиально.

Никаких импульсов в "плато" по идее нет. Но вообще шум какой-то всегда есть. Присутствует групповой анализ. В том числе октава воспринимается как схожая из-за совпадения "пиков" не соседних тонов. Вообще понятие благозвучия идёт из фазового анализа.

http://acousticslab.org/psychoacoustics/PMFiles/Module03b.htm

#1106
0:26, 2 сен. 2017

Мы мыслим и вспоминаем опираясь на воображение. Как-то повели нас с классом на экскурсию в город. Мы с приятелем увидели здание с угла, причем в одной стене было окон 40 в доль и в другой столько же. И мы начали спорить потому что моё и его воображение дорисовало невидимую часть здания по разному. Я предположил что это Г-образное здание, а одноклассник что это здание в форме колодца с внутренним двором. Но оба мы решили, что оно сплошным монолитом точно быть не может, потому что не будет окон для освещения гипотетических квартир в самом его центре. ИИ должен иметь воображение, чтобы реконструировать и восстанавливать информацию. Такой суперархиватор.

#1107
0:40, 2 сен. 2017

раб вакуумной лампы
> Мы мыслим и вспоминаем опираясь на воображение.
Вообще-то мы и реальность воспринимаем как воображаемую, моделируемую сцену. Главное отличие от тех же осознанных снов - что присутствует обратная связь с сенсорными зонами. То есть воображаемая картина бессознательно уточняется и корректируется, исходя из "внешних намёков", идущих из таламуса (от всех органов чувств).
У людей с ослабленными зрительными каналами (речь не про диоптрии) постоянно происходит _дрифт_, вызывающий галлюцинации.

Кто ещё не видел - обязательно к просмотру:

Страницы: 169 70 71 72 73 74
ФлеймФорумОбщее

Тема в архиве.