Добрый день. В тесте попалось задание в котором нужно написать

Question

Добрый день. В тесте попалось задание в котором нужно написать

скрипт который запрашивает название файла у пользователя, затем выводит все буквы используемые в тексте файла в порядке убывания их количества. Например
А-132
Б-100
В-46
И тд
С заданием я справился, но мне интересно, есть ли более короткие, дешёвые и простые способы сортировки?

#backend #programming #python #russian

0

30.04.2022

35 ответов

21 просмотр

Алиби Навечер Автор вопроса

ZeN
а зачем тут регулярка...

Решил обойтись без словарей, подумал так интереснее и вышло даже быстрее

0

30.04.2022

ZeN

Алиби Навечер
Решил обойтись без словарей, подумал так интересне...

а словари тут зачем

0

30.04.2022

Алиби Навечер Автор вопроса

ZeN
а словари тут зачем

А как тогда ты бы написал?

0

30.04.2022

Саша Воронов

Алиби Навечер
Решил обойтись без словарей, подумал так интересне...

скинь текстом, посмотрим, насколько быстрее

0

30.04.2022

ZeN

Алиби Навечер
А как тогда ты бы написал?

получил бы весь текст файла, прошелся по каждой букве алфавита, через string.count() посмотрел сколько раз она повторяется и вывел

0

30.04.2022

Roman Voronov

Как вариант я бы попробовал через NumPy array и посмотрел бы, что быстрее - регулярка или массив.

0

30.04.2022

Алиби Навечер Автор вопроса

Саша Воронов
скинь текстом, посмотрим, насколько быстрее

import re abc_list=[] count_abc_list=[] file_name = input('введите название файла >>>') try: file = open(file_name, 'r', encoding='utf-8') abc_text = re.sub('[^\w]', '', file.read().lower()) abc_text = re.sub('[_0-9]', '', abc_text) while len(abc_text)>0: abc_len = len(re.findall(abc_text[0], abc_text)) count_abc_list.append(abc_len) count_abc_list.sort(reverse=True) abc_list.insert(count_abc_list.index(abc_len), abc_text[0]) abc_text = re.sub(abc_text[0], '', abc_text) for count in range(0, len(abc_list)): print(abc_list[count], count_abc_list[count]) except: print('файл не найден')

0

30.04.2022

Roman Voronov

ZeN
получил бы весь текст файла, прошелся по каждой бу...

В отличие от регулярок и NumPy этот вариант не оптимизирован на уровне CPython, скорее всего будет менее производительно.

0

30.04.2022

Алиби Навечер Автор вопроса

ZeN
получил бы весь текст файла, прошелся по каждой бу...

А отсортировал бы как?

0

30.04.2022

Roman Voronov

Алиби Навечер
А отсортировал бы как?

Ну, сортировка там уже шаг тривиальный. Сочетание sort с конкретным типом данных, в которые стата складывается.

0

30.04.2022

Max

Если ты уже упростил себе работу с помощью регулярных выражений, то почему бы не использовать collections.Counter?

0

30.04.2022

Алиби Навечер Автор вопроса

Max
Если ты уже упростил себе работу с помощью регуляр...

Не слышал о таком, пойду прогуглю

0

30.04.2022

Саша Воронов

Алиби Навечер
import re abc_list=[] count_abc_list=[] file_name...

In [9]: %timeit test_re() 7.68 s ± 122 ms per loop (mean ± std. dev. of 7 runs, 1 loop each) In [10]: %timeit mine() 4.22 s ± 26.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

0

30.04.2022

Алиби Навечер Автор вопроса

Саша Воронов
In [9]: %timeit test_re() 7.68 s ± 122 ms per loop...

Скинь код

0

30.04.2022

Roman Voronov

Саша Воронов
In [9]: %timeit test_re() 7.68 s ± 122 ms per loop...

Прикольно. Какая версия Python, какой принцип алгоритма?

0

30.04.2022

Саша Воронов

Алиби Навечер
Скинь код

In [6]: def mine(): ...: import collections ...: counter = collections.defaultdict(int) ...: ...: file_name = input('введите название файла >>>') ...: ...: with open(file_name) as f: ...: for line in f: ...: for ch in filter(str.isalpha, line): ...: counter[ch] += 1 ...: print(counter) ...: In [7]: input = lambda _: 'lorem.txt' In [8]: print = lambda _: None

0

30.04.2022

Саша Воронов

Roman Voronov
Прикольно. Какая версия Python, какой принцип алго...

Python 3.9.12 (main, Apr 5 2022, 15:59:20) Type 'copyright', 'credits' or 'license' for more information IPython 8.2.0 -- An enhanced Interactive Python. Type '?' for help.

0

30.04.2022

Roman Voronov

Саша Воронов
In [9]: %timeit test_re() 7.68 s ± 122 ms per loop...

Кто тоже хочет поэкспериментировать - можем генерировать текстовый файл так: # pip install faker from faker import Faker fake = faker.Faker() text = fake.text(10000) with open("fake.txt", "x") as file: file.write(text)

0

30.04.2022

🥥 Coco 🥥

есть вариант эффективной сортировки когда количество символов в массиве ограничено небольшим количеством символов заводишь массив длиною в максимальное количество символов (например если это символы английского алфавита то заводишь массив длиною в 26 (ну или 52 если так же разрешены upper case символы)) а далее в один проход по массиву символов составляешь массив частот встречаемости а далее надо отсортировать массив этих частот по убыванию и вывести все его значения

0

30.04.2022

Саша Воронов

Roman Voronov
Кто тоже хочет поэкспериментировать - можем генери...

python -c “from lorem_text import lorem; print(lorem.words(int(1e7)))” > lorem.txt

0

30.04.2022

Олег Мунани

Саша Воронов
python -c “from lorem_text import lorem; print(lor...

Сколько ты этому учился?

0

30.04.2022