Парни и непарни. Вкатился в айти буквально 3 дня назад,

да и то чисто потому, что знакомый готов был заплатить за плевый скрипт.
Потому вопрос может вообще плевый, а я просто гуглить не умею (хотя пытался)

Соответственно, я пишу мультипоточный парсер книжек и возникла у меня проблемка: а чё делать с нумерацией глав (полноценно проблему раскрываю ниже)? Т.е. если скачивать последовательно (что я уже реализовал), то получается пиздец долго (ибо этому ебанату нужно скачивать более 1к глав в среднем). А вот мультипоточно все получается достаточно быстро, но нумерация идёт по пизде.

На данный момент у меня алгоритм определения номера главы следующий:

String НазвГлав = название главы

String НомерГлавы = ""

Int счётчикЦифр = 0

For буква в НазвГлав:

If буква является цифрой:

счётчикЦифр+=1

НомерГлавы+= буква

If буква = ПослЗнак.НазвГлав:

Break

Иначе:

If счётчикЦифр>0:

Break

Вопрос у меня следующий: как решить проблему нумерации, если название главы будет следующее:
Хуй 1234.1
Хуй 1234.2

Или
Хуй 1234 часть 1
Хуй 1234 часть 2

При этом не имея проблем с главами типо (знак разделения номера главы и названия произвольный и может не быть):

Хуй 1234 - я пососал 2 раза

На данный момент решил данную проблему, закинув главы с полетевшей нумерацией для ручной нумерации, но этот способ, мягко говоря, пахнет хуем

#it #programming #russian #software

08.08.2022

12 ответов

50 просмотров

Andy Cox

reduce

08.08.2022

Tomislav Đorđević Автор вопроса

Шо?

08.08.2022

Vlad

Tomislav Đorđević
Шо?

😁

08.08.2022

Tomislav Đorđević Автор вопроса

Довольно смежная тема. Только не мангу, а восточные книжки. Название не помню

08.08.2022

Denis Ladutsko

немного не понятно а как ты делаешь переходы между страницами сайта для скачивания? может быть тебе не надо париться за главы и прочее, а просто склеивать все в нужной последовательности по страницам? ну к примеру, на стр 50 начинается глава 4 и она будет длиться 40 страниц, а дальше будет 4.1 и еще 20 страниц, а потом глава 5. почему их нельзя просто постранично объединить в порядке именно страниц и получить таким образом все в нужной нумерации не заморачиваясь с самими главами?

08.08.2022

Владислав

Если известен набор шаблонов названий глав, то можно сделать набор регулярных выражений и по ним определять всё что нужно.

08.08.2022

Tomislav Đorđević Автор вопроса

Denis Ladutsko
немного не понятно а как ты делаешь переходы между...

Каждая глава на новой ссылке

08.08.2022

Tomislav Đorđević Автор вопроса

Владислав
Если известен набор шаблонов названий глав, то мож...

Имеет смысл. Жалко только там шаблоны рандомные(

08.08.2022

Denis Ladutsko

Tomislav Đorđević
Каждая глава на новой ссылке

ну так если ты знаешь это разбиение то и собирай в нужном порядке. если в несколько потоков собираешь, то можешь заранее сделать коллекцию с нужным порядком, потом прочитать все и в этом же порядке пересохранить

08.08.2022

Tomislav Đorđević Автор вопроса

Denis Ladutsko
ну так если ты знаешь это разбиение то и собирай в...

А как я пойму, что скаченная глава это именно оно? Хотя, я могу сделать словарь, где ключом будет выступать ссылка. Но оперативка не ебанеться, если я в словарь запихну пару десятков миллионов символов?

08.08.2022

Denis Ladutsko

Tomislav Đorđević
А как я пойму, что скаченная глава это именно оно?...

всегда можно сохранить в файл/базу/пр ))), но словарь да, похоже на то что надо

08.08.2022

Tomislav Đorđević Автор вопроса

Denis Ladutsko
всегда можно сохранить в файл/базу/пр ))), но слов...

Вот именно в этот момент у меня и проблема. На данный момент у меня все сохраняется в каждый файл на главу и называется он: номер главы.txt, благодаря чему я могу пройтись со знанием всех номеров и склеить их в один

08.08.2022

Похожие вопросы

Чат экстремального погроммирования / Серый MLGamer

Зачем в Java и C# нужен оператор new, если там все объекты ссылочные?

#it #programming #russian #software

30.09.2021

94 ответов

Чат экстремального погроммирования / Derk Last

Если за тебя будут решать дз, то как ты сдашь ЕГЭ по информатике?

#it #programming #russian #software

06.07.2022

54 ответов

Чат экстремального погроммирования / Яша Лава

товарищи, вопрос от тупого питониста, что легче в обучении C или C# ?

#it #programming #russian #software

01.10.2022

45 ответов

Чат экстремального погроммирования / 🫀Ovцa00X 💰

Здравствуйте, я учусь в 9 классе увлекаюсь программированием, и мне надо решить куда поступать. В принципе я понимаю что это должно быть связано с программированием, но я вооб...

#it #programming #russian #software

08.04.2022

49 ответов

Чат экстремального погроммирования / Nikita

Ребята, кто смотрел стартовый курс SimpleCode по С# «от новичка к профессионалу», что скажете?

#it #programming #russian #software

30.05.2022

48 ответов

Чат экстремального погроммирования / КТО Я 🤔

Стоит ли учить Rust ?

#it #programming #russian #software

27.03.2022

50 ответов

Чат экстремального погроммирования / Artem Dontsov

Привет cummunity, тут Коля записал видосик про Front-end. Я конечно не хочу спойлерить тебе его содержимое. Но если честно, оно вызвало в моей комнате небольшой пожар. Рекоме...

#it #programming #russian #software

21.06.2022

33 ответов

Чат экстремального погроммирования / Олег Мунани

Всм джанго это шутка и он не используется в серьёзных проектах?

#it #programming #russian #software

21.05.2022

40 ответов

Чат экстремального погроммирования / Sayan Orazgaly

Всем доброго вечера. Мне 19 лет. Через неделю получу диплом колледжа по айти специальности. У меня есть выбор, поступить в университет (а там после колледжа 3 года учат оказыв...

#it #programming #russian #software

02.06.2022

36 ответов

Чат экстремального погроммирования / Emelia Conroy

#How_to_заботать How to заботать алгоритмы? (((Первая Научная))) Уже делали подобный гайд, но там как-то вышло совсем для гоев, да и участников становится все больше и больш...

#it #programming #russian #software

27.08.2022

1 ответов

Смотреть еще

214 похожих чатов

Парни и непарни. Вкатился в айти буквально 3 дня назад,

12 ответов

Похожие вопросы