قسمت چهاردهم- استفاده از صدکها Percentiles در پانداس
تابع percentiles به طور کلی ابزاری برای تقسیم دادهها به بخشهای مساوی در بازه ۰ تا ۱۰۰٪ است. در تحلیل دادهها، صدکها (Percentiles) به شما این امکان را میدهند که دادهها را به نسبتهای خاصی تقسیم کنید. هر صدک نشاندهنده نقطهای از دادههاست که درصد خاصی از مقادیر زیر آن نقطه قرار میگیرند. به عنوان مثال، صدک ۲۵ درصد نشان میدهد که ۲۵ درصد دادهها کمتر از این مقدار و ۷۵ درصد بالاتر از آن قرار دارند.
مثال کاربردی از صدکها در تحلیل دادههای فروش
فرض کنید که شما اطلاعات فروش محصولات یک فروشگاه را دارید و میخواهید بدانید که کدام محصولات پرفروش و کدام محصولات کمفروش هستند. میتوانید از صدکها برای دستهبندی محصولات بر اساس فروش استفاده کنید.
کد نمونه:
import pandas as pd # ایجاد یک دیتافریم نمونه با اطلاعات فروش محصولات data = { 'product': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'sales': [1200, 2500, 3000, 5500, 7000, 10000, 11000, 15000, 18000, 25000] } df = pd.DataFrame(data) # محاسبه صدکهای ۲۵٪، ۵۰٪ و ۷۵٪ برای شناسایی سطوح مختلف فروش percentiles = df['sales'].quantile([0.25, 0.5, 0.75]) print("Percentiles (25%, 50%, 75%):") print(percentiles) # شناسایی محصولات بر اساس صدکها: # محصولات با فروش کمتر از صدک ۲۵٪، محصولات کمفروش هستند low_sales_products = df[df['sales'] <= percentiles[0.25]] print("\nLow Sales Products (Bottom 25%):") print(low_sales_products) # محصولات با فروش بین صدک ۲۵٪ و ۷۵٪، محصولات با فروش متوسط هستند mid_sales_products = df[(df['sales'] > percentiles[0.25]) & (df['sales'] <= percentiles[0.75])] print("\nMid Sales Products (25% - 75%):") print(mid_sales_products) # محصولات با فروش بالاتر از صدک ۷۵٪، محصولات پرفروش هستند top_sales_products = df[df['sales'] > percentiles[0.75]] print("\nTop Sales Products (Top 25%):") print(top_sales_products) Percentiles (25%, 50%, 75%): ۰.۲۵ ۳۶۲۵.۰ ۰.۵۰ ۸۵۰۰.۰ ۰.۷۵ ۱۴۰۰۰.۰ Name: sales, dtype: float64 Low Sales Products (Bottom 25%): product sales ۰ A 1200 ۱ B 2500 ۲ C 3000 Mid Sales Products (25% - 75%): product sales ۳ D 5500 ۴ E 7000 ۵ F 10000 ۶ G 11000 Top Sales Products (Top 25%): product sales ۷ H 15000 ۸ I 18000 ۹ J 25000
توضیحات:
صدک ۲۵٪: نشاندهنده محصولاتی است که فروش آنها در ۲۵ درصد پایین قرار دارد. این محصولات میتوانند نیازمند بررسی بیشتری برای بهبود باشند.
صدک ۵۰٪ (میانه): این صدک نشاندهنده مقدار میانه داده است و به شما کمک میکند محصولات با فروش متوسط را شناسایی کنید.
صدک ۷۵٪: نشاندهنده محصولاتی است که فروش آنها در ۲۵ درصد بالای دادهها قرار دارد و میتوان آنها را به عنوان محصولات پرفروش دستهبندی کرد.
این تحلیل به مدیران کمک میکند تا محصولات کمفروش را شناسایی کرده و تصمیمهای لازم برای بهبود آنها بگیرند یا روی محصولات پرفروش تمرکز بیشتری داشته باشند.
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.