[БЕЗ_ЗВУКА] Всем привет. С вами Данил Лесоводский. В прошлом блоке мы говорили о составе команды ML проектов. В этом видео мы подробнее поговорим о задачах и требованиях к аналитику данных, инженеру данных, менеджеру ML проектов. Задачи инженера данных. Во-первых, инженер данных проектирует архитектуру: он определяет, какое железо, софт и потоки данных требуются для выполнения проекта. Он выбирает и запускает железо: диски, вычислительные мощности и память. Он выбирает и устанавливает базы данных и софт. Он создает процессы обработки данных: данные нужно загружать, проверять, очищать, преобразовывать. В общем, готовить к работе аналитика. Также он должен запускать код, написанный аналитиком данных. И он должен коммуницировать с аналитиком данных и другими членами команды. Каковы выдвигаются требования к инженеру по данным? В идеале он должен знать и иметь навыки всего вышеперечисленного. Кроме этого, он умеет формулировать задачу и находить решение самостоятельно. Он умеет формулировать вопросы для того, чтобы правильно спроектировать архитектуру. Он имеет базовые знания в машинном обучении. Он умеет работать под давлением. У него развиты такие «мягкие» навыки, как эмпатия и коммуникации. И он умеет простыми словами объяснять сложные технологии. Бэкграунд инженера данных ─ это может быть и ETL-инженер, DevOps или программист. Каковы задачи аналитика данных? Аналитик данных вместе с менеджером проекта и заказчиком ставят цели проекта. Проектирует и проводит эксперименты. Осуществляет статистический анализ данных. Ищет закономерности. Результаты работы визуализируются в виде презентаций, графиков и демо-приложений. Также он рассказывает о результатах команде. Он должен уметь создавать Roadmap по улучшению модели и автоматизировать регулярно повторяющиеся операции по анализу. И в целом по компании аналитик данных способствует культуре принятия решений на основе данных. Каковы же требования к аналитику данных? Это человек, который получил образование в области статистики, математики, физики и IT. Он прошел профильный курс или получил образование по машинному обучению. Он знает SQL. Он знает Python, который стал уже практически стандартом в этой области. Он обладает мягкими навыками. Он легко манипулирует массивами данных. Он понимает, как устроено железо и софт, на котором всё крутится. В идеале, он владеет технологиями больших данных, к примеру, Hadoop. Теперь рассмотрим менеджера ML проекта. Что же он делает, каковы его задачи? Он создает команду. Он ставит цели. Приоритезирует задачи. Взаимодействует с заказчиком и другими командами. И отчитывается по результатам. Каковы требования к менеджеру? Это человек, который должен знать машинное обучение, софт и железо. Он должен знать роли в проекте. Он должен понимать, что достижимо, а что ─ нет. Он имеет сильные коммуникативные навыки. Это помогающий тип, эмоционально устойчивый, вежливый и в то же время настойчивый. Бэкграунд менеджера проекта. Обычно это либо аналитик данных, который растет до менеджера, либо инженер данных, который вырастает до менеджера, либо это менеджер IT проекта, который прошел обучение по машинному обучению. Итак, сегодня мы поговорили о задачах и требованиях к аналитику данных, инженеру данных и менеджеру проекта по машинному обучению. В следующем блоке мы поговорим о том, где искать членов команды. Спасибо. [ЗВУК]