Skip to content

margoloko/bs4_parser_pep

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Проект парсинга PEP

Этот проект является парсером документации Python, реализованным на Python.

Установка зависимостей

Перед запуском проекта необходимо установить зависимости из файла requirements.txt. Для этого выполните команду:

pip install -r requirements.txt

Использование

Проект содержит несколько режимов работы, каждый из которых можно выбрать, передав соответствующий аргумент при запуске скрипта.

Параметры командной строки

Скрипт принимает следующие аргументы командной строки:

-m, --mode: режим работы скрипта (обязательный параметр). Возможные значения: whats-new, latest-versions, download, pep.

Режимы работы:

whats-new

При запуске в режиме whats-new скрипт выводит список нововведений, появившихся в последних версиях Python. Список включает ссылку на статью, заголовок и автора статьи.

Пример запуска:

python main.py whats-new

download

При запуске в режиме download скрипт загружает архив с последней версией Python для A4-бумаги и сохраняет его в папке downloads в корневой директории проекта.

Пример запуска:

python main.py download

pep

При запуске в режиме pep скрипт выводит статистику по PEP (Python Enhancement Proposal), такую как количество PEP в разных статусах.

Пример запуска:

python main.py pep

Используемые библиотеки:

  • logging — для ведения логов.
  • re — для работы с регулярными выражениями.
  • requests_cache — для кэширования запросов.
  • urllib.parse — для работы с URL.
  • bs4 — для работы с HTML.
  • tqdm — для вывода прогресса при обходе списка.

Author:

Balakhonova Marina

Releases

No releases published

Packages

No packages published

Languages