Войти
ФлеймФорумОбщее

Зарплата и крутизна (29 стр)

Advanced: Тема повышенной сложности или важная.

Страницы: 128 29 30 31 32 Следующая »
#420
22:18, 24 окт. 2016

DanielSky
> А как ты решил определять плохой кластер на лету, я не понял - сходимость ты
> заранее не знаешь.

Не на лету, конечно. Предположил что два кластера тебя устроят, посчитал центры. Посчитал ошибку на итогах кластеризации -  ошибка больше заданной, выбираешь тот кластер где расхождение больше и делишь его на два и тд


#421
22:32, 24 окт. 2016

innuendo
> А какие будут идеи про саму метрику ?
В датамайнинге нет понятий вроде "мощности метода". Сравнивать их можно только исходя из субъективных критериев.

innuendo
> Посчитал ошибку на итогах кластеризации - ошибка больше заданной
В кластерном анализе нет ошибки как таковой, какую оценку ты имеешь ввиду? Те же дисперсии потребуют дополнительных вычислений.

#422
22:39, 24 окт. 2016


DanielSky
> В кластерном анализе нет ошибки как таковой

Да, суть разбить множество на кластеры. Разбили, получили центры кластеров. Что дальше делаем с этими центрами ?
Допустим, они (эти центры) нужны нам для какой-то аппроксиммации-экстраполяции. Берём, считаем и сравниваем с реальными данными - вот так и находится ошибка

#423
22:47, 24 окт. 2016

9К720
я все равно не понимаю что мешает тебе озвучить выручку которую ты хочешь
помойму гибче же так )

9К720
> снимая офис в полуподвальном помещении бывшей промзоны.
мы ищем людей только на удаленку, я не уверен каким образом офис тут будет что то решать, хз
если решает офис там красивое лого и USB флешки то нам явно не по пути )
наверное поток людей был бы больше если бы мы делали так
не уверен правда что больше людей нам бы подошло

ты сейчас говоришь с таким намеком, что ты очень крутой спец и тебе все равно чем заниматься,
но тут ты упрешся в наш стек, и абсолютно не важно чем ты там занимался
и он либо тебе пойдет либо не пойдет, и нам именно это важно понять
если при изучении нашего стека у тебя не возникнет вопросов, то ты скорее всего в него не вникал и нам не интересен
но с другой стороны я считаю что нашего стека достаточно для того что бы понять что мы компания не одна из тысячи

#424
22:50, 24 окт. 2016

и да по стеку )
я могу его сюда выложить он просто лежит на github
по нему есть статьи на хабре и тд и тп
правда боюсь что набежит куча умников которые его правильно оценят )
так что велком в личку

#425
22:54, 24 окт. 2016

innuendo
Ну все так и делают, прикидывают число и начальные центры по иерархическому, прогоняют пару вариантом во k-средних, потом, например, применяют анову и смотрят значимость и мощность. На методическом уровне тут особо не оптимизируешь, хотя производительность в таких задачах обычно и не важна. Что ты экстраполировать-то собрался?

#426
22:56, 24 окт. 2016

cNoNim
> но с другой стороны я считаю что нашего стека достаточно для того что бы понять что мы компания не одна из тысячи
  Уникальный стек не говорит ни о чём. Если это конечно не хаскель. Мне например интересно почему вы не выбрали Java. Выбрали бы её, глядишь и кандидатов было бы больше.

#427
23:01, 24 окт. 2016

DanielSky
> Ну все так и делают, прикидывают число

На основании чего прикидывается это число ? Почему взял 3 кластера сразу, а не 33 ?

> На методическом уровне тут особо не оптимизируешь, хотя производительность в
> таких задачах обычно и не важна. Что ты экстраполировать-то собрался?

Да не производительность кластеризации как таковой.

Получил ты результат кластеризации, дальше что ты делаешь с этими результами ?

#428
23:18, 24 окт. 2016

innuendo
> На основании чего прикидывается это число
В иерархическом анализе, каждому разбиению соответствует F-значение. Его изменение почти всегда нелинейно, и нужно просто взять его как бы точку перегиба. Если не ясно, нагугли график критерия каменистой осыпи (для методов сокращения размерности, но он универсален). Я исхожу из того, что тебе нужно зашить решение в код, т.к. общепринятные средства визуализации там другие.

innuendo
> Получил ты результат кластеризации, дальше что ты делаешь с этими результами
Как что, кластеризация и есть цель этого анализа. Интерпретация результатов вряд ли требует объяснения программисту. Ты конечно можешь ее использовать дальше, для поиска латентных факторов, например. Но ты зачем вообще его применял-то?!
Вопрос не корректен аки: "ну вот применил ты прогнозную модель, получил результат, и че?"

#429
23:23, 24 окт. 2016

cNoNim
> я все равно не понимаю что мешает тебе озвучить выручку которую ты хочешь
> помойму гибче же так )
Я же говорю,  лично мне 1-2 раза в неделю пишет очередная эйчар и зовет на интервью.  Думаю, что у тех людей что тебе нужны, ситуация такая же. И все они(эйчары) не хотят называть вилку, предлагают приехать на собеседование или хотя бы назвать мою.
Лично я не понимаю, почему я должен называть свою вилку эйчару, это ведь он ко мне пришел.

PS Европейcкие рекрутеры кстати всегда почти вилку говорят сразу. Штатовские и Российские очень редко.

cNoNim
> наверное поток людей был бы больше если бы мы делали так
> не уверен правда что больше людей нам бы подошло
Тебе надо сделать так, чтобы когда человек видел письмо от "синоним и ко" первой его мыслью было "а, это те чуваки, я слышал они крутые штуки делают и зарплата хорошая" а не бляопятьочередныерогаикопыталоховищуткакжевызадолбали. Сделать это можно по разному. Можно сделать стенд на профильной конференции и рассказать в спонсорской части о себе. Можно вести крутой технический блог. Желательно очень хардкорный.

> ты сейчас говоришь с таким намеком, что ты очень крутой спец и тебе все равно
> чем заниматься,
При чем тут я вообще. Я весьма средний специалист, до крутых мне ой как далеко. Был бы я крутым спецом меня бы по имени знали все и сплетничали бы о смене работы (ой, что делается, вы слышали, Леша Шипилев то ушел из Оракла!!11)

> но тут ты упрешся в наш стек, и абсолютно не важно чем ты там занимался
Что у вас там за стек такой? Ни разу не видел чтобы прям упереться в стек, если это не какое-нибудь говно вроде хаскеля который взяла кучка бандерлогов патамуштакрута. Хороший программист максимум через месяц на новом стеке начнет выдавать полезный выхлоп.
Если прямо такая серьезная проблема, что в стек упирается много людей - ну значит стек говно по определению и это фейл техдира и архитектора. Надо их уволить нахер, выкинуть стек и начать писать заново пока не поздно. Стек выбирается под задачу, а не наоборот.

#430
23:50, 24 окт. 2016

DanielSky
> В иерархическом анализе, каждому разбиению соответствует F-значение.

Я здесь про иерархический анализ не говорил, ты можешь рассказать как прикидывается число кластеров ?

> Как что, кластеризация и есть цель этого анализа. Интерпретация результатов
> вряд ли требует объяснения программисту.

Я же не спрашиваю, что является результатом кластеризации ? Получил ты кластеры и всё? Ну если на этом проблема (задача) решилась, то вопросов не имею.

#431
0:25, 25 окт. 2016

innuendo
> Я здесь про иерархический анализ не говорил
Вообще-то, говорил, я сказал, ты спросил:
DanielSky
> прикидывают число и начальные центры по иерархическому
innuendo
> На основании чего прикидывается это число ?
Ну либо метод, который я в начале предложил (перебор со сравнением дисперсий). Если ты надеешься что в оригинальном k-средних есть таки секретный способ определить оптимальное число кластеров - то его нет.

innuendo
> Получил ты кластеры и всё? Ну если на этом проблема (задача) решилась, то вопросов не имею.
Да как угодно. Хорошая привычка оценивать значимость и мощность, но в датамайнинге их нет вообще, так что можно оценить только косвенно, применив потом стат. методы.
Я думал ты по делу спрашиваешь, мог бы и не отвлекать.

#432
0:34, 25 окт. 2016

9К720
> Хороший программист максимум через месяц на новом стеке начнет выдавать
> полезный выхлоп.
> Если прямо такая серьезная проблема, что в стек упирается много людей - ну
> значит стек говно по определению и это фейл техдира и архитектора. Надо их
> уволить нахер, выкинуть стек и начать писать заново пока не поздно. Стек
> выбирается под задачу, а не наоборот.
да не это то какраз адекватные сроки и мы так же считаем )
и вроде бы с этим то как раз не возникает проблем,
но очень много народу зациклено на стеке M$ и шаг в лево в право от него и пипец приплыли
но на самом деле это больше характеризует тех людей наверное

Zefick
> Мне например интересно почему вы не выбрали Java. Выбрали бы её, глядишь и
> кандидатов было бы больше.
дак принципиально и нам нет разницы, сейчас это просто выбрали потому что выбрали стек начинался писаться лет с пять назад если не больше меня тут тогда еще не было )

вот в общем стек )
https://github.com/aumcode/nfx
я не против послушать критику, только не уверен что будет куча времени отвечать на нее

#433
0:42, 25 окт. 2016

DanielSky
> Если ты надеешься что в оригинальном k-средних есть таки секретный способ
> определить оптимальное число кластеров - то его нет.

Нет, ни в коем случае не надеюсь. Собственно, это и следует из моих слов с самого начала про проблему определения числа кластеров

> innuendo
> > Я здесь про иерархический анализ не говорил
> Вообще-то, говорил, я сказал, ты спросил:
> DanielSky
> > прикидывают число и начальные центры по иерархическому

Ok, давай так. Забыли про иерархическую хрень. Самый простой к-средних. Как ты выбираешь число кластеров?

> Да как угодно. Хорошая привычка оценивать значимость и мощность, но в
> датамайнинге их нет вообще, так что можно оценить только косвенно, применив
> потом стат. методы.

Как угодно можно определять в курсовой работе, а если задача имеет практическое значение, то как угодно приводит к какому угодно результату.

> Я думал ты по делу спрашиваешь, мог бы и не напрягать.

Для каких задач использовал кластерный анализ ?


Спасибо. Я и не напрягаюсь :)

#434
1:16, 25 окт. 2016

cNoNim
> вот в общем стек )
> https://github.com/aumcode/nfx
> я не против послушать критику, только не уверен что будет куча времени отвечать
> на нее
Я не могу оценить хорошо это или плохо, это немножко в стороне от моей специализации сам понимаешь.
Но это неважно. У меня в голове анекдот крутится про телеграмму -  "Михалыч зпт еб твою мать вскл подробности письмом тчк".\

Олег, ответь на вопрос - какого хрена вас до сих пор тут нет - http://dotnext-moscow.ru/, ваша тема вписалась бы сюда отлично.
Сделали бы доклад на тему "Не Майкрософтом единым", подготовил бы презентацию про этот унистек, рассказал бы в чем плюсы, в чем минусы. Да, это очень тяжело найти такого человека. Требуется офигенный спец (иначе его заклюют вопросами на сцене, народец там сидит продвинутый обычно и фуфло им впарить не выйдет) который к тому же умеет интересно вести доклад. Такие вещи редко совмещаются. Но рассказав об этом - поверь, о тебе бы узнало достаточно много людей. Там около 1000 человек. Потом они разъедутся назад и будут обсуждать в курилках с неприехавшими коллегами про "в той конторе пишут на унистеке на удаленке, это кроссплатформенный фреймворк под моно". Заплатили бы чуть денежек, поставили бы стенд в зале, рассказали бы про удаленку, про то как вы пилите на кроссплатформенном стеке, что у вас интересная прикладная область, что у вас хорошие зарплаты . За день мимо тебя бы прошло несколько сотен более чем подходящих тебе по квалификации людей, из которых несколько десятков бы заинтересовалось. Уж несколько человек отобрал бы.

Надо уметь себя продавать, блин.

Страницы: 128 29 30 31 32 Следующая »
ФлеймФорумОбщее

Тема в архиве.