Skip to content

TheCrueltySage/incubator_test_repo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 

Repository files navigation

Тестовое задание для инкубатора ETL/ML для инженеров больших данных. Исполнитель: Бакланов Евгений Александрович Контактные данные: Телефон - +7-952-880-00-63 Электронная почта - miltenfiremage@gmail.com Зависимости: - Python 3+ - Развёрнутый Apache Spark - GeoIP2-python - matplotlib Инструкция по запуску: 1) Удостоверьтесь, что в рабочей директории находится файл с тестовыми данными в формате sflow, наименованный sflow-0118.csv 2) Удостоверьтесь, что в рабочей директории либо в директории /usr/share/GeoIP на мастере находится файл базы данных GeoLite2-Country.mmdb. Без него сможет быть выполнена только первая часть тестового задания. 3) Запустите скрипт через spark-submit packetcrunch.py 4) После окончания работы скрипта в рабочей директории появится: - Текстовый файл result_ip.csv в формате JSON с ответом на первое задание. - Текстовый файл result_country.csv в формате JSON с ответом на второе задание. - Файл изображения country_traffic.png с ответом на третье задание.

About

Тестовое задание для инкубатора ETL/ML компании Bitworks

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages