درک یک دیتاست با Pandas Profiling
در دنیای تحلیل داده، یکی از مهمترین مراحل اولیه، درک سریع و دقیق از ساختار، کیفیت و ویژگیهای یک دیتاست است. معمولاً این مرحله با روشهایی مانند خلاصهسازی دادهها، رسم…
ادامه خواندندر دنیای تحلیل داده، یکی از مهمترین مراحل اولیه، درک سریع و دقیق از ساختار، کیفیت و ویژگیهای یک دیتاست است. معمولاً این مرحله با روشهایی مانند خلاصهسازی دادهها، رسم…
ادامه خواندنتحلیل دو متغیره (Bivariate Analysis) به بررسی همزمان دو متغیر برای یافتن روابط آماری یا وابستگی بین آنها میپردازد. برخلاف تحلیل تکمتغیره که فقط به یک ستون نگاه میکند، در…
ادامه خواندنتحلیل تک متغیره (Univariate Analysis) یکی از پایهایترین و مهمترین مراحل در فرآیند تحلیل دادهها (EDA: Exploratory Data Analysis) است. هدف این نوع تحلیل، بررسی یک متغیر بهصورت مستقل است؛…
ادامه خواندندر بسیاری از مسائل یادگیری ماشین، دادهها شامل ویژگیهای دستهای (Categorical Features) هستند؛ یعنی دادههایی که مقدارشان از یک مجموعه گسسته (مانند رنگ، کشور، جنسیت و…) گرفته شده است. اما…
ادامه خواندندر این بخش، مفهوم گرایش به مرکز (Central Tendency) و اهمیت آن در درک و خلاصهسازی دادهها را بررسی خواهیم کرد. همچنین سه شاخص اصلی گرایش به مرکز یعنی نما…
ادامه خواندندر دنیای یادگیری ماشین و هوش مصنوعی، مفاهیم زیادی وجود دارد که در ابتدا ممکن است پیچیده به نظر برسند. اما اگر با مثالهای ساده و ملموس توضیح داده شوند،…
ادامه خواندنرگرسیون لجستیک یک مدل یادگیری ماشین برای دستهبندی (Classification) است، نه برای پیشبینی مقدار عددی. به طور خاص، معمولاً برای دستهبندی دوتایی (Binary Classification) استفاده میشود. یعنی فقط دو جواب…
ادامه خواندنتصور کن… تو یک محلهای زندگی میکنی و تازه یه نفر به اون محله اومده. حالا میخوای حدس بزنی اون شخص جدید به کدوم دسته از مردم محله تعلق داره…
ادامه خواندنیعنی میخوای رابطهی بین دو یا چند تا چیز (ویژگیها) رو پیدا کنی تا بتونی یه چیز دیگه (هدف) رو پیشبینی کنی. مثلاً:اگه قد و وزن آدمها رو داشته باشی،…
ادامه خواندن