Авторизация
Для совершения этого действия необходимо
авторизоваться в проекте
Спасибо
На «ты» с Big Data?
Докажи, что ты лучший, и получи
приз 500 000 руб. от «Билайн»!

Прими участие в конкурсе
машинного обучения
на определение возрастной группы.
Решить
На «ты» с Big Data?
Докажи, что ты лучший, и получи
приз 500 000 руб.
от «Билайн»!

Прими участие в конкурсе
машинного обучения
на определение
возрастной группы.
Задание
Мы постоянно работаем над улучшением тарифных планов
и предлагаем своим клиентам новые услуги. Каждое предложение
должно быть адресовано определенной возрастной группе. В этом
задании вам предстоит попытаться определить возраст
абонента по имеющимся данным.
Что имеем

Анонимизированные данные об абонентах: регион, тарифный план, тип тарифного плана, информация об объёмах потребления различных услуг оператора и другие.

В файле train.csv содержится информация для построения модели.
Формат строк: признаки (x0, ..., x61) и целевая переменная — y​.

Файл test.csv содержит тестовое множество. Формат строк: ID, признаки
(x0, ..., x61)

Скачать данные
Что делать

Построить модель на основе данных из выборки train.csv, разметить выборку test.csv и предоставить файл, содержащий строки, такие как: ID из файла test.csv, предсказанная возрастная группа. Файл sol.csv содержит формат, в котором нужно загружать решение. Решения принимаются с 11 сентября по 27 октября 2015 г.

Пример: ID,y
0,2
1,2
2,0
3,5
...
Как будет проводиться оценка

В качестве метрики качества модели будет использоваться Точность (Accuracy) на тестовой выборке.
Ваш предварительный рейтинг будет построен по 30% выборки. Обращаем внимание, что финальный рейтинг участников будет построен по оставшимся 70% выборки, на основании последнего загруженного файла.

По любым вопросам касательно проведения конкурса обращайтесь по адресу special@tmtm.ru.

Ответы
00831
Участник
Победитель конкурса
Место Ник Попадания Попытки Дата
1 Александр Куменко 76.39% 52 27.10.2015




Финальный рейтинг
Место Ник Попадания Попытки Дата
2 Сергей Кузнецов 76.33% 721 27.10.2015
3 gooron 76.28% 24 27.10.2015
4 Вне Конкурса 76.27% 3 07.10.2015
5 AntonTnnov 76.27% 210 27.10.2015
6 Владимир Ларин 76.26% 276 23.10.2015
7 Сергей 76.22% 166 26.10.2015
8 HECTEP 76.22% 27 25.10.2015
9 Илья Езепов 76.19% 65 27.10.2015
10 II245 76.16% 330 27.10.2015
11 Stanislav Sopov 76.15% 100 27.10.2015
12 123 76.13% 102 25.10.2015
13 Dmitry Petrov 76.13% 20 27.10.2015
14 Denis Semenenko 76.11% 84 27.10.2015
15 Антон Петров 76.11% 24 26.10.2015
16 Pavel Blinov 76.1% 70 25.10.2015
17 Pasha Podolsky 76.09% 45 03.10.2015
18 Денис Пирштук 76.08% 11 22.09.2015
19 Alexey Matveev 76.08% 274 27.10.2015
20 Igor Lifar 76.08% 82 26.10.2015
21 Костя Мягких 76.08% 56 26.10.2015
22 Nepigor 76.08% 135 27.10.2015
23 evkonev 76.06% 56 27.10.2015
24 gNglobus 76.06% 177 27.10.2015
25 Big Data Boss 76.06% 71 27.10.2015

Скачать полный рейтинг
Сергей Марин
Руководитель службы разработки продуктов Big Data ПАО «ВымпелКом»
Мы решили сделать максимально практический курс по анализу данных, направленный на подготовку специалистов в области Data Mining, готовых не просто решать задачи на Kaggle, а приносить с помощью Data Mining нашей или своим компаниям прибыль. bigdata.beeline.digital
Это самое главное — уметь ставить цель и доводить её до результата.

Читать пост полностью.
Что мы предлагаем:
  • Работу в стратегически важном для компании направлении — поэтому быстро и без бюрократии.
  • Работу в команде практиков, регулярно тусующихся
    в топе Kaggle.
  • Перспективу — после работы у нас можно будет смело претендовать на любую вакансию сферы в стране и за ее пределами.
  • Возможность использовать современные инструменты анализа и обработки данных и греться около мощного кластера.
  • Крутые задачи, которые затрагивают 55 миллионов человек (каждого третьего в стране).
  • Добровольное медицинское страхование (включая стоматологию).
  • Страхование на время зарубежных поездок.
  • Корпоративную мобильную связь, корпоративный интернет.
  • Уютный офис недалеко от станций метро Новослободская и Маяковская, посмотреть на который вы можете на фото ниже :)
Кого мы ищем
«Data Scientist / Аналитик (Big Data)»
Чем вы будете заниматься:
  • Применением современных методов машинного обучения (machine learning) и анализа больших данных для извлечения наибольшей ценности из огромного массива данных оператора.
  • Классификацией и кластеризацией абонентской базы, построением предсказательных и скоринговых моделей, а также предобработкой, визуализацией данных и презентацией результатов заказчикам.
  • Работой на большом кластере Hadoop с использованием Hive, Pig, Python, Spark, R, SPSS.
  • Решение внутренних задач для оператора, таких как борьба с оттоком, профилирование абонентов, борьба с фродом и многих других.
Что мы хотим от вас:
  • Образование в статистике, эконометрике или статистической социологии;
  • Большой опыт и свободное владение методами машинного обучения и/или анализа больших данных;
  • Владение инструментами подготовки и анализа данных: Hive, Python, R, Spark, SQL, знание основных библиотек машинного обучения для Python, R или Spark;
  • Опыт участия в соревнованиях Kaggle очень желателен;
  • Умение презентовать полученные результаты;
  • Опыт в телекоме приветствуется, но не обязателен.
Вернуться к заданию