حفاظت شده: قسمت بیستم -سناریو هشتم -تحلیل همبستگی (Correlation analysis) در پانداس

هیچ چکیده‌ای موجود نیست زیرا‌این یک نوشته حفاظت شده است.

قسمت نوزدهم – استفاده از Pivot و Unpivotدر پانداس

در پانداس، pivot و unpivot دو روش برای تبدیل ساختار داده‌ها هستند که به ترتیب با استفاده از توابع pivot و melt اجرا می‌شوند. در ادامه توضیحات و مثال‌هایی برای این دو ارائه می‌دهم.

حفاظت شده: قسمت هجدهم – سناریو هفتم – تحلیل متن فارسی برای استفاده در word cloud

هیچ چکیده‌ای موجود نیست زیرا‌این یک نوشته حفاظت شده است.

قسمت هفدهم – کار با متن در پانداس

در کتابخانه پانداس، کار با رشته‌ها یکی از قابلیت‌های مفید برای تجزیه و تحلیل داده‌ها است. در زیر، چند مثال کاربردی از کار با رشته‌ها در پانداس آورده شده است:

حفاظت شده: قسمت شانزدهم – سناریو ششم – خواندن فایل های اکسل با ساختاریکسان

هیچ چکیده‌ای موجود نیست زیرا‌این یک نوشته حفاظت شده است.

قسمت پانزدهم – تعریف تابع در پانداس

تعریف تابع با استفاده از def در پانداس مزایای متعددی دارد که در پروژه‌های پردازش داده‌ها به خصوص برای کارهای تکراری و پیچیده، کار را بسیار ساده‌تر و مؤثرتر می‌کند.

قسمت چهاردهم- استفاده از صدکها Percentiles در پانداس

تابع percentiles به طور کلی ابزاری برای تقسیم داده‌ها به بخش‌های مساوی در بازه ۰ تا ۱۰۰٪ است. در تحلیل داده‌ها، صدک‌ها (Percentiles) به شما این امکان را می‌دهند که داده‌ها را به نسبت‌های خاصی تقسیم کنید. هر صدک نشان‌دهنده نقطه‌ای از داده‌هاست که درصد خاصی از مقادیر زیر آن نقطه قرار می‌گیرند. به عنوان مثال، صدک ۲۵ درصد نشان می‌دهد که ۲۵ درصد داده‌ها کمتر از این مقدار و ۷۵ درصد بالاتر از آن قرار دارند.

قسمت سیزدهم – گروه بندی داده Group Byدر پانداس

در کتابخانه پایتون پانداس، از تابع groupby برای گروه‌بندی داده‌ها بر اساس یک یا چند ستون استفاده می‌شود. groupby می‌تواند برای محاسبه مقادیر آماری مانند میانگین، مجموع، تعداد، و … روی هر گروه به کار رود.

قسمت دوازدهم- سناریو سوم- شناسایی داده های پرت outlier از طریق Z-Score

در پانداس، روش z-score یکی دیگر از روش‌های رایج برای شناسایی داده‌های پرت است که شباهت زیادی به روش انحراف معیار دارد، اما تفاوت اصلی آن در استفاده از نرمال‌سازی مقادیر به کمک مقیاس استاندارد دارد. در روش z-score، هر مقدار داده با استفاده از میانگین و انحراف معیار استانداردسازی می‌شود و z-score یا نمره استاندارد برای هر مقدار محاسبه می‌شود.

قسمت یازدهم- سناریو دوم- شناسایی داده های پرت outlier از طریق انحراف معیار

برای شناسایی داده‌های پرت می‌توانیم از روش انحراف معیار استفاده کنیم. این روش بر اساس میانگین و انحراف معیار مجموعه داده عمل می‌کند. مقادیری که بیش از یک محدوده معین (مثلاً ۳ برابر انحراف معیار) از میانگین فاصله دارند، به عنوان داده پرت شناسایی می‌شوند.