Собирать игры с GameDev.ru непростая задача, есть трудности, с которыми не справится просто так ни человек, ни машина. Неполные описания, старые темы, в которых авторы удалились, битые ссылки, хитрые системные требования для запуска...
Автоматический сборщик это прикольно, но если поверх ещё человек обработает, то было бы ещё лучше.
soflot
> но если поверх ещё человек обработает, то было бы ещё лучше.
Людей не завезли))
soflot
> Автоматический сборщик это прикольно, но если поверх ещё человек обработает, то
> было бы ещё лучше.
Не, весь цимус проекта в том, чтобы сделать полностью автоматический процесс.
Silen#ID
> Кстати, твой автоматический парсер ужасно... некрасиво... парсит описание темы:
> какая-то текстовая пелена из слов, тогда как в исходной теме всё по полочкам.
> Или картинки -- часть мусорная, а части вообще нету. Значит, вручную это не
> исправить...
Да, там полностью вырезана html разметка. Видимо, нужно её вернуть.
Обновил билд. Добавил:
- условный рейтинг (основывается на количестве сообщений в теме игры)
- поиск по играм/пользователям/тегам
- страничку пользователей
- страничку тегов
А, игры в браузере есть на JS?
KPG
> А, игры в браузере есть на JS?
Некоторые из списка:
SBA(браузерная онлайн сессионка)
Glor.io
Sworm.io - онлайн игра про червячков
Каэртон - браузерная онлайновая коллекционная карточная игра
Прыгуны (браузерная игра)
Круто. А как он ссылки на скачивание ищет. Если допустим игра лежит на яндекс диске, он поймёт?
Попрыгал по темам, похоже с этим проблема, даже где ссылки прямые, например в "Маленькое и скромное РПГ", не находит
Хорёк
> Попрыгал по темам, похоже с этим проблема, даже где ссылки прямые, например в
> "Маленькое и скромное РПГ", не находит
Спасибо за репорт! Пересобрал билд.
Теперь должны отлавливаться прямые ссылки на экзешники и архивы, ссылки на ГД Файлы, Яндекс Диск и Гугл Драйв.
В играх, где несколько билдов, как, например, в твоей, будет указываться первая попавшаяся ссылка. Парсить все ссылки и раскладывать их по платформам и версиям достаточно сложно.
aliskda
> Яндекс Диск и Гугл Драйв.
>
С ссылками на эти сервисы могут быть проблемы т.к. ссылки на них имеют тенденцию превращаться в неактуальные архивы с недоступностью содержимого.
KPG
> С ссылками на эти сервисы могут быть проблемы т.к. ссылки на них имеют
> тенденцию превращаться в неактуальные архивы с недоступностью содержимого.
Была идея перекачать всё это в собственное облако - чтобы ссылки не протухали, по потом прикинул по объёму - на диске никакого места не хватит.
aliskda
> Была идея перекачать всё это в собственное облако - чтобы ссылки не протухали,
> по потом прикинул по объёму - на диске никакого места не хватит.
Можно перекачать в Веб архив, но тоже не гарантия, что не потерут по чьей то блажи.
(там, кстати, есть и Torrent механизм для скачивания размещённого файла, а это даёт ешё какую то "гарантию" сохранности размещённых данных)
KPG
> Можно перекачать в Веб архив, но тоже не гарантия, что не потерут по чьей то
> блажи.
> (там, кстати, есть и Torrent механизм для скачивания размещённого файла, а это
> даёт ешё какую то "гарантию" сохранности размещённых данных)
Наверное, проще напрямую торрент-раздачу сделать - без участия Веб архива.
Добавил страничку с конкурсами, попытался слинковать конкурсы и игры-участники. Далеко не всегда это получается (например, в «Храме Хаоса» начисто отсутствует описание), но для последнего конкурса удалось наскрести 20 участников:
Дщбавить к играм минипиктограммы, если это возможно,
KPG
> Дщбавить к играм минипиктограммы, если это возможно,
А откуда их брать? И что они дают?
Тема в архиве.