Привет! Рады будем найти с тобой точки соприкосновения для работы.

Для этого нам было бы важно узнать твои сильные стороны, чтобы понять как их можно применить у нас. Для этого мы подготовили тестовое задание.

Задание рассчитано примерно на 2 вечера. Но в зависимости от опыта и перфекционизма, всё может затянуться. Поэтому по дефолту ожидается, что задание решается за неделю.

Мы не против уточнений, и если что-то непонятно, всегда можно задать вопрос Тане @tanyasmirom в ТГ.

Таня передаст вопрос нам и поделится. А может быть у нее сразу уже будет ответ.

Теперь к самому заданию:

Задание состоит из 2х частей:

  1. Решение ML задачи
  2. Сервис для inference

🔥🔥🔥

Данные тут

🔥🔥🔥

1 ML задача

Тебе даны данные HTTP запросов.

Глобальная задача — найти или разделить вредоносные от хороших. Как мы знаем, вредоносных классов может быть несколько.

Важнее отделить «мух от котлет».

Попробуй сделать EDA, понять, а точно ли данные не избыточны и всё, что ты вообще можешь сказать?!