14-15 августа на базе летней школ МТС.ТЕТА был проведён хакатон Нашей командой был выбран следующий кейс от центра Big Data
Построить модель машинного обучения, которая будет разделять хосты на технические (различные API: Яндекс метрика, реклама и т.д) и нетехнические (возвращают html странички).
Для решения задачи предоставляется подвыборка хостов без разметки. Разметку необходимо собрать разметку самим.
Для получения разметки была использована библиотека python Requests. В качестве модели предсказания была использована линейная регрессия.
Был получен опыт программирования в сжатые сроки, пройден полный цикл разработки модели от сбора разметки данных до питчей перед как бизнес- так и техническими экспертами