رگرسیون لجستیک یک مدل یادگیری ماشین برای دستهبندی (Classification) است، نه برای پیشبینی مقدار عددی.
به طور خاص، معمولاً برای دستهبندی دوتایی (Binary Classification) استفاده میشود. یعنی فقط دو جواب داریم:
مثلاً:
ایمیل اسپم است یا نه؟
بیمار مریض است یا سالم؟
مشتری خرید میکند یا نه؟
چرا اسمش “رگرسیون” لجستیکه، نه “کلاسبندی” لجستیک؟
چون مدل، اول یک مقدار عددی (مثل رگرسیون) تولید میکند، ولی بعد آن را با یک تابع خاص به یک احتمال بین ۰ و ۱ تبدیل میکند تا بگوید «چقدر احتمال دارد که جواب ۱ (مثبت) باشد؟»
مرحله به مرحله چطور کار میکند؟
1. ورودیها (Features)
فرض کن یک نفر میخواد وام بگیره. ما این ویژگیها رو داریم:
درآمد ماهانه
سن
میزان بدهی
ما میخوایم پیشبینی کنیم: «آیا وام را پرداخت خواهد کرد یا نه؟» → جواب ۰ یا ۱
2. وزندهی به ویژگیها
مدل Logistic Regression به هر ویژگی یک وزن (w) میدهد و آنها را با هم ترکیب میکند
4. تصمیم نهایی (Thresholding)
ما معمولاً یک آستانه (مثلاً ۰.۵) در نظر میگیریم:
اگر خروجی سیگموید > ۰.۵ → پیشبینی میکنیم کلاس ۱
اگر خروجی ≤ ۰.۵ → پیشبینی میکنیم کلاس
مدل چطور یاد میگیرد؟
در طول آموزش، مدل سعی میکنه وزنها و بایاس رو طوری تنظیم کنه که پیشبینیهاش با دادههای واقعی بیشترین تطابق رو داشته باشه.
برای این کار از یک روش به نام گرادیان نزولی (Gradient Descent) استفاده میکنیم.
نتیجه گیری:
Logistic Regression مدلی ساده، سریع و قابل تفسیر است.
اگر دادههای دوتایی داری، گزینه خوبی برای شروع است.
اگرچه اسمش «رگرسیون» است، اما برای دستهبندی به کار میرود.

