Организационная структура подразделения Data Science (Data Science, часть 4)
Организационная структура подразделения DataScience (DataScience, часть 4)
«Те, кто следует гаданиям на хрустальном шаре, обречен есть его осколки.» Эльгар Фидлер.
Итак, в прошлых статьях мы в существенном объеме осветили тему Науки о данных и преимущества использования предсказательных и аналитических машин в бизнесе. Сегодня вкратце рассмотрим структуру подразделения DataScience (далее DS).
1.Основные роли в команде DS a. Аналитик данных (data analytic) b. «Ученый» по данным (data scientist) c. Разработчик систем бигдата (data engineer) d. Директор по данным/цифровой директор (Chief Data/Digital officer – CDO)
2. Задачи и компетенции аналитика данных a. Бизнес-анализ предметной области b. Сбор и очистка (cleaning) первичных данных c. Личное взаимодействие с бизнес-заказчиками d. Определение измеримых/расчетных (Tangible) потребностей e. Формировать «пользовательские истории» (user story) f. Представлять «ведомые данными» перспективы развития g. Навыки эффективных коммуникаций h. Владение предметной областью i. Высокий уровень бизнес-анализа
3. Задачи и компетенции «ученого» по данным a. Взаимодействие с аналитиками данных, менеджерами продуктов, инженерами и программистами b. Владение методами машинного обучения и визуализации c. Оценка качества данных d. Согласование и построение визуализированных отчетов (дашбордов и пр.) e. Помогать программистам освоить статистический анализ f. «Больше программист, чем статистик и больше статистик, чем программист» (Пример: Excel -> Matlab -> C++) g. Нестандартное мышление для выявления неявных взаимосвязей h.Способность выявлять тренды и шаблоны i. Владение Excel, Python/R, MATLAB/Octave, SQL, NoSQL
4. Задачи CDO: a. Организовать, поддерживать и развивать систему и процессы выявления, сбора, обработки данных и их преобразования в информацию и корпоративные знания (knowledge): b. Организовать, поддерживать и развивать процессы выработки решений (wisdom) на основе анализа данных c. Создание и поддержка единой архитектуры данных во всех корпоративных системых c. Организовать взаимодействие со стейкхолдерами d. Учитывать нормативные требования, в частности, по персональным данным (ФЗ149, ФЗ152, GDPR) e. Определять баланс при выборе методов и инструментов f. Объединять подразделения, людей, технологии, инструменты и навыки для выявления и создания ценности для компании g. Поддерживать баланс между идеальной стратегией и практикой