Как подойти к решению проблемы машинного обучения?

Шаг-1: сформулируйте проблему

В качестве первого шага вам необходимо сформулировать проблему, определив
определить тип, который зависит от вашей бизнес
проблема.

Тип может быть любым, например, бинарная классификация,
одномерная регрессия, многоклассовая классификация по одной метке
классификация, многоклассовая классификация с несколькими метками,
Многомерная регрессия, кластеризация (без наблюдения),
другие (перевод, синтаксический анализ, определение границ и т.д.).

Шаг-2: Получение данных

  • Следующий шаг — получить данные и сохранить их в правильном
    формат в соответствии с постановкой задачи.

  • Проанализируйте ваши данные, чтобы проверить, достаточно ли у вас данных
    данных или нет, а также проверить качество данных.

  • Качество данных в значительной степени определяет, сможете ли вы решить проблему.
    сможете ли вы решить проблему вообще или нет.

Шаг-3: Предварительная обработка данных

  • После получения данных следующим шагом будет их анализ и
    извлечение информации для принятия бизнес-решений.

  • Также следует применить основные операции по предварительной обработке данных, чтобы
    привести данные в пригодный для использования формат.

  • Выберите подходящую библиотеку.

Шаг-4: Метрика оценки

  • Самым важным шагом является определение того, как оценить
    наши результаты.

  • Мы должны выбрать правильную метрику оценки
    в соответствии с проблемой, которую мы собираемся решить.

  • Например, если у нас есть несбалансированный набор данных, то
    мы обычно выбираем метрику ROC-AUC.

Шаг 5: Разделить данные

  • В любой задаче машинного обучения мы разделяем данные
    на несколько наборов, таких как обучающий, проверочный и тестовый.

  • Стратифицированное разбиение в основном используется для классификации
    и K-Fold для задач регрессии.

  • Самое важное, что следует отметить, это то, что любые
    какие бы операции вы ни применяли к обучающему множеству, они должны
    должны быть применены к проверочному и тестовому множествам.

Шаг 6: Применить алгоритм ML

  • И наконец, мы применим ML-модели к данным. Мы
    не можем сказать, какие модели работают лучше всего, это просто пробы и
    испытание.

  • Применяя несколько алгоритмов, выполните гиперпараметрическую
    настройка гиперпараметров, оценка результатов и выбор лучшей
    модель, которая дает удовлетворительные результаты.

  • Проведите сравнительный анализ вашего решения на основе выбранной вами
    метрики оценки.

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *