رگرسیون لجستیک یک مدل یادگیری ماشین برای دسته‌بندی (Classification) است، نه برای پیش‌بینی مقدار عددی.

به طور خاص، معمولاً برای دسته‌بندی دوتایی (Binary Classification) استفاده می‌شود. یعنی فقط دو جواب داریم:
مثلاً:

  • ایمیل اسپم است یا نه؟

  • بیمار مریض است یا سالم؟

  • مشتری خرید می‌کند یا نه؟

چرا اسمش “رگرسیون” لجستیکه، نه “کلاس‌بندی” لجستیک؟

چون مدل، اول یک مقدار عددی (مثل رگرسیون) تولید می‌کند، ولی بعد آن را با یک تابع خاص به یک احتمال بین ۰ و ۱ تبدیل می‌کند تا بگوید «چقدر احتمال دارد که جواب ۱ (مثبت) باشد؟»

مرحله به مرحله چطور کار می‌کند؟

1. ورودی‌ها (Features)

فرض کن یک نفر می‌خواد وام بگیره. ما این ویژگی‌ها رو داریم:

  • درآمد ماهانه

  • سن

  • میزان بدهی

ما می‌خوایم پیش‌بینی کنیم: «آیا وام را پرداخت خواهد کرد یا نه؟» → جواب ۰ یا ۱

2. وزن‌دهی به ویژگی‌ها

مدل Logistic Regression به هر ویژگی یک وزن (w) می‌دهد و آن‌ها را با هم ترکیب می‌کند

4. تصمیم نهایی (Thresholding)

ما معمولاً یک آستانه (مثلاً ۰.۵) در نظر می‌گیریم:

  • اگر خروجی سیگموید > ۰.۵ → پیش‌بینی می‌کنیم کلاس ۱

  • اگر خروجی ≤ ۰.۵ → پیش‌بینی می‌کنیم کلاس

مدل چطور یاد می‌گیرد؟

در طول آموزش، مدل سعی می‌کنه وزن‌ها و بایاس رو طوری تنظیم کنه که پیش‌بینی‌هاش با داده‌های واقعی بیشترین تطابق رو داشته باشه.
برای این کار از یک روش به نام گرادیان نزولی (Gradient Descent) استفاده می‌کنیم.

نتیجه گیری:

  • Logistic Regression مدلی ساده، سریع و قابل تفسیر است.

  • اگر داده‌های دوتایی داری، گزینه خوبی برای شروع است.

  • اگرچه اسمش «رگرسیون» است، اما برای دسته‌بندی به کار می‌رود.