Разница между линейной регрессией и логистической регрессией

Оглавление:

Anonim

В главное отличие между линейной регрессией и логистической регрессией заключается в том, что линейная регрессия используется для прогнозирования непрерывного значения, в то время как логистическая регрессия используется для прогнозирования дискретного значения.

Системы машинного обучения могут предсказывать будущие результаты на основе обучения прошлым входам. Существует два основных типа машинного обучения: обучение с учителем и обучение без учителя. Регрессия и классификация относятся к обучению с учителем, а кластеризация - к обучению без учителя. Алгоритмы контролируемого обучения используют помеченные данные для обучения набора данных. Линейная регрессия и логистическая регрессия - это два типа алгоритмов обучения с учителем. Линейная регрессия используется, когда зависимая переменная является непрерывной, а модель линейной. Логистическая регрессия используется, когда зависимая переменная дискретна, а модель нелинейна.

Линейная регрессия, логистическая регрессия, машинное обучение

Что такое линейная регрессия

Линейная регрессия находит взаимосвязь между независимыми и зависимыми переменными. Оба они смежные. Независимая переменная - это переменная, которая не изменяется другими переменными. Обозначается x. Также может быть несколько независимых переменных, таких как x1, x2, x3 и т. Д. Зависимая переменная изменяется в соответствии с независимой переменной и обозначается y.

Когда есть одна независимая переменная, уравнение регрессии выглядит следующим образом.

у = b0 + b1x

Например, предположим, что x представляет собой количество осадков, а y представляет урожайность.

Рисунок 1: Линейная регрессия

Набор данных будет выглядеть, как показано выше. Затем выбирается линия, охватывающая большинство точек данных. Эта линия представляет прогнозируемые значения.

Рисунок 2: Расстояние между фактическими точками данных и прогнозируемыми значениями

Затем определяется расстояние от каждой точки данных до линии, как показано на приведенном выше графике. Это расстояние между фактическим значением и прогнозируемым значением. Это расстояние также известно как погрешность или невязки. Линия наилучшего соответствия должна иметь наименьшую сумму квадратов ошибок. Когда задано новое значение количества осадков (x), можно найти соответствующую урожайность (y) с помощью этой линии.

В реальном мире может быть несколько независимых переменных (x1, x2, x3…). Это называется множественной линейной регрессией. Уравнение множественной линейной регрессии выглядит следующим образом.

Что такое логистическая регрессия

Логистическая регрессия может использоваться для классификации двух классов. Он также известен как бинарная классификация. Проверка того, является ли электронное письмо спамом или нет, прогнозирование того, купит ли клиент продукт или нет, прогнозирование того, возможно ли получить продвижение по службе или нет, - это еще несколько примеров логистической регрессии.

Рисунок 3: Логистическая регрессия

Предположим, что количество часов, которые студент учился в день, является независимой переменной. В зависимости от этого рассчитывается вероятность сдачи экзамена. Значение 0,5 считается пороговым. Когда указано новое количество часов, можно найти соответствующую вероятность сдачи экзамена с помощью этого графика. Если вероятность больше 0,5, она считается 1 или пройденной. Если вероятность ниже 0,5, то считается, что она равна 0 или не пройдена.

Применение уравнения линейной регрессии к сигмовидной функции даст уравнение логистической регрессии.

Сигмовидная функция

Еще один важный момент, который следует отметить, заключается в том, что логистическая регрессия применима только для классификации 2 классов. Он не используется для мультиклассовой классификации.

Разница между линейной регрессией и логистической регрессией

Определение

Линейная регрессия - это линейный подход, который моделирует взаимосвязь между зависимой переменной и одной или несколькими независимыми переменными. Напротив, логистическая регрессия - это статистическая модель, которая предсказывает вероятность результата, который может иметь только два значения.

использование

В то время как линейная регрессия используется для решения задач регрессии, логистическая регрессия используется для решения задач классификации (двоичная классификация).

Методология

Линейная регрессия оценивает зависимую переменную при изменении независимой переменной. Логистическая регрессия вычисляет вероятность возникновения события. Это одно из важных различий между линейной регрессией и логистической регрессией.

Выходное значение

Кроме того, при линейной регрессии выходное значение является непрерывным. В логистической регрессии выходное значение дискретно.

Модель

Хотя линейная регрессия использует прямую линию, логистическая регрессия использует S-образную кривую или сигмовидную функцию. Это еще одно важное различие между линейной регрессией и логистической регрессией.

Примеры

Прогнозирование ВВП страны, прогнозирование цены продукта, прогнозирование цены продажи дома, прогнозирование баллов - вот некоторые примеры линейной регрессии. Прогнозирование того, является ли электронное письмо спамом, прогнозирование того, является ли транзакция по кредитной карте мошенничеством, прогнозирование того, возьмет ли клиент ссуду или нет, - вот некоторые примеры логистической регрессии.

Заключение

Разница между линейной регрессией и логистической регрессией заключается в том, что линейная регрессия используется для прогнозирования непрерывного значения, а логистическая регрессия используется для прогнозирования дискретного значения. Короче говоря, линейная регрессия используется для регрессии, а логистическая регрессия - для классификации.

Ссылка:

1. Линейный регрессионный анализ | Линейная регрессия в Python | Алгоритмы машинного обучения | Simplilearn, 26 марта 2018 г., доступно здесь 2. Логистическая регрессия | Логистическая регрессия в Python | Алгоритмы машинного обучения | Simplilearn, 22 марта 2018 г., доступно здесь.

Изображение предоставлено:

1. «Линейная регрессия» Sewaqu - собственная работа, общественное достояние) через Commons Wikimedia2. «Остатки для подгонки линейной регрессии» Томас Хаслвантер - собственная работа (CC BY-SA 3.0) через Commons Wikimedia3. «Логистическая кривая» Автор Qef (обсуждение) - Создано с нуля с помощью gnuplot (общественное достояние) через Commons Wikimedia

Разница между линейной регрессией и логистической регрессией