حفاظت شده: قسمت بیستم -سناریو هشتم -تحلیل همبستگی (Correlation analysis) در پانداس
هیچ چکیدهای موجود نیست زیرااین یک نوشته حفاظت شده است.
هیچ چکیدهای موجود نیست زیرااین یک نوشته حفاظت شده است.
در پانداس، pivot و unpivot دو روش برای تبدیل ساختار دادهها هستند که به ترتیب با استفاده از توابع pivot و melt اجرا میشوند. در ادامه توضیحات و مثالهایی برای این دو ارائه میدهم.
هیچ چکیدهای موجود نیست زیرااین یک نوشته حفاظت شده است.
در کتابخانه پانداس، کار با رشتهها یکی از قابلیتهای مفید برای تجزیه و تحلیل دادهها است. در زیر، چند مثال کاربردی از کار با رشتهها در پانداس آورده شده است:
هیچ چکیدهای موجود نیست زیرااین یک نوشته حفاظت شده است.
تعریف تابع با استفاده از def در پانداس مزایای متعددی دارد که در پروژههای پردازش دادهها به خصوص برای کارهای تکراری و پیچیده، کار را بسیار سادهتر و مؤثرتر میکند.
تابع percentiles به طور کلی ابزاری برای تقسیم دادهها به بخشهای مساوی در بازه ۰ تا ۱۰۰٪ است. در تحلیل دادهها، صدکها (Percentiles) به شما این امکان را میدهند که دادهها را به نسبتهای خاصی تقسیم کنید. هر صدک نشاندهنده نقطهای از دادههاست که درصد خاصی از مقادیر زیر آن نقطه قرار میگیرند. به عنوان مثال، صدک ۲۵ درصد نشان میدهد که ۲۵ درصد دادهها کمتر از این مقدار و ۷۵ درصد بالاتر از آن قرار دارند.
در کتابخانه پایتون پانداس، از تابع groupby برای گروهبندی دادهها بر اساس یک یا چند ستون استفاده میشود. groupby میتواند برای محاسبه مقادیر آماری مانند میانگین، مجموع، تعداد، و … روی هر گروه به کار رود.
در پانداس، روش z-score یکی دیگر از روشهای رایج برای شناسایی دادههای پرت است که شباهت زیادی به روش انحراف معیار دارد، اما تفاوت اصلی آن در استفاده از نرمالسازی مقادیر به کمک مقیاس استاندارد دارد. در روش z-score، هر مقدار داده با استفاده از میانگین و انحراف معیار استانداردسازی میشود و z-score یا نمره استاندارد برای هر مقدار محاسبه میشود.
برای شناسایی دادههای پرت میتوانیم از روش انحراف معیار استفاده کنیم. این روش بر اساس میانگین و انحراف معیار مجموعه داده عمل میکند. مقادیری که بیش از یک محدوده معین (مثلاً ۳ برابر انحراف معیار) از میانگین فاصله دارند، به عنوان داده پرت شناسایی میشوند.
شرکت فن آوران پیروز رایمند (رایپیتک) با ترکیبی از متخصص و مجربین در رشته های مهندسی سیستم، آمار ، مهندسی نرم افزار، مالی و… به ارائه خدمات در حوزه هوش تجاری در زمینه های گوناگون از جمله مشاوره و ارائه راه حل های نرم افزاری ، سامانه های سفارشی هوش تجاری ، طراحی داشبورد های مدیریتی ، طراحی انباره داده ، تحلیل بیزینس و تهیه سندهای استاندارد شناسنامه شاخص ، ارزیابی عملکرد، داده کاوی ، پیاده سازی پروژه های علم داده و… به شرکتها و سازمانها می کند.