5 сфер, которым поможет наука о данных

Данные разрастаются с бешеной скоростью, и те компании, которые серьезно к ним относятся, выигрывают.
Наука о данных и специалисты по данным все еще остаются для нас загадкой.

Мы рассмотрели пять бизнес-сфер, которым поможет наука о данных, и выяснили, как специалисты по данным помогают компаниям стать успешными.

Электронная коммерция

Компания Rent the Runway – онлайн-ритейлер, который позволяет клиентам брать в аренду дизайнерские платья и аксессуары. Наука о данных сыграла важную роль в становлении компании.

«Один из главных страхов женщин перед тем, как взять платье в аренду – будет ли оно сидеть», — говорит Вийджей Сабремениам (Vijay Subramaniam), главный аналитик компании в своем недавнем интервью ZDNet.
«У нас есть рецензии пользователей и фотографии», — говорит он. «Оценивая, люди загружают фотографии, так что у нас есть все данные об их конституции – благодаря им Вы можете ввести свои параметры и найти женщин, которые похожи на Вас, и посмотреть, как на них сидит наряд».

«Женщины подробно разбирают, что удалось, а что нет, что было тесным, а что – свободным. Просто потрясающе, каким количеством данных они готовы поделиться. Они хотят распространять свои знания».
«Моя работа заключается в том, чтобы собрать все эти данные, разобраться в низ и использовать их, чтобы рекомендовать, что взять в аренду».

Сабремениам помог разработать и персонализировать бренд с помощью науки о данных. Складывая вместе информацию о размерах одежды, Rent the Runway может предлагать товары с умом, а также подбирать одежду, которая отлично подходит клиенту.

Бренды

Наверняка Вы видели желтые ботинки Timberland. Возможно, у Вас даже они есть. Но что произошло с компанией помимо этих классических грубых сапог?

Если Вы думаете, что она находится вне поля зрения, то будете правы. С 2006 до 2012 года компании пришлось тяжело, и она потеряла значительную долю рынка в Америке. Тем не менее, в прошлом году продажи Timberland выросли на 15%.

Как Timberland удалось повернуть ситуацию в свою пользу? Компания сфокусировалась на потребителе. В ходе двухгодичного исследования Timberland собрал данные о покупках 18 000 людей в восьми странах.

Проанализировав данные, Timberland нашел проблемы, которые надо было решить, и, самое главное, открыл своего идеального покупателя: городского жителя, заинтересованного отдыхом на природе.

Контент

Buzzfeed – источник данных. Никакие другие публикации не достигают такого быстрого распространения, как этот ресурс.

Невероятный охват, как, например, в той истории со спорной расцветкой платья, создается благодаря команде специалистов по данным Buzzfeed.

Когда Buzzfeed сообщает, что это – «19 самых непонятных моментов Full House», это чистая правда.
Каждый список Buzzfeed тщательно анализируется на предмет вовлечения. Если вовлечение слишком низкое, то эта информация удаляется.

Каждый компонент также стратегически выставлен на странице. Порядок имеет значение.
Не так давно в Buzzfeed решили совмещать характеристики пользователей с контентом, который они потребляют.

Например, исследователи обнаружили, что люди, любящие Дженнифер Лоуренс, также любят пингвинов.
Другая важная оптимизация – найти, как лучше всего продвигать контент.

Анализируя данные в режиме реального времени, Buzzfeed редактирует и ре-редактирует, какие публикации размещать на первом плане сайта. Сервер также может предсказать 10 самых распространяемых постов в любой выбранный день.

Ритейл

Ритейлеры больше всего выиграют от использования науки о данных.

По данным Независимого отчета об адаптации ритейл-технологий Lightspeed, 54% респондентов предоставляют клиентам инструменты ввода данных, которые помогают им проще совершать покупки. Это привело к наибольшему росту доходов в 2014 году.

26% планируют добавить аналитику данных к концу 2016 года, чтобы принимать более оправданные решения о закупках. 35% говорят, что планируют использовать аналитику данных для персонализированного маркетинга к концу 2015. Среди них 18% предсказывают, что использование данных для персонализации станет основным источником повышения доходов.

Сервисы «до востребования»

Когда Uber не занят предоставлением информации для оживленных споров, компания привлекает внимание своим успехом и расширением в режиме нон-стоп. Во многом это связано с тем, как компания использует данные.

Все развитие Uber основано на науке о данных и алгоритмах. Ваш водитель ближе всего к Вам, Ваш личный рейтинг и рейтинг Вашего водителя влияет на то, подхватят ли Вас, а в час пик цены увеличиваются.

«Волновое» ценообразование – революция в бизнесе такси. Алгоритмы следят за траффиком и временем путешествия в режиме реального времени, что влияет на цену. Uber продолжает быть успешной компанией из-за удобства услуг, основанных на данных. Но есть малые шаги, которые может предпринять любая компания.

Понятия «наука о данных» и «специалист по данным» все еще довольно новы. Чтобы достичь успеха в науке о данных, прежде всего нужно понимать, чем занимаются специалисты по данным. Нанимать на работу специалиста по данным или использовать сервисы данных – эти задачи покажутся не таким уж сложными, если лучше понимать эту область.

Навыки в науке о данных

Обычно специалисты по данным используют разные инструменты на разных этапах.
Например, они могут использовать язык структурированных данных, Pandas и Numpy – для очистки и переработки данных, пакеты изучения машин R или Python, например, Caret или Scikit-Learn, чтобы строить модели изучения машин, и наконец D3.js или Tableau для презентации результатов.

Более того, когда становится слишком много данных, такие крупные инструменты, как экосистемы Hadoop и Spark также широко используются.

Раньше ученные по данным объединялись, чтобы создать и модифицировать Hive, язык программирования для создания проектов на Hadoop. Им также нужны инструменты, с помощью которых можно было бы визуально представлять их открытия – а именно программы первичной визуализации данных.

Источник