قسمت چهاردهم- استفاده از صدکها Percentiles در پانداس

تابع percentiles به طور کلی ابزاری برای تقسیم داده‌ها به بخش‌های مساوی در بازه ۰ تا ۱۰۰٪ است. در تحلیل داده‌ها، صدک‌ها (Percentiles) به شما این امکان را می‌دهند که داده‌ها را به نسبت‌های خاصی تقسیم کنید. هر صدک نشان‌دهنده نقطه‌ای از داده‌هاست که درصد خاصی از مقادیر زیر آن نقطه قرار می‌گیرند. به عنوان مثال، صدک ۲۵ درصد نشان می‌دهد که ۲۵ درصد داده‌ها کمتر از این مقدار و ۷۵ درصد بالاتر از آن قرار دارند.

مثال کاربردی از صدک‌ها در تحلیل داده‌های فروش

فرض کنید که شما اطلاعات فروش محصولات یک فروشگاه را دارید و می‌خواهید بدانید که کدام محصولات پرفروش و کدام محصولات کم‌فروش هستند. می‌توانید از صدک‌ها برای دسته‌بندی محصولات بر اساس فروش استفاده کنید.

کد نمونه:

import pandas as pd

# ایجاد یک دیتافریم نمونه با اطلاعات فروش محصولات
data = {
    'product': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
    'sales': [1200, 2500, 3000, 5500, 7000, 10000, 11000, 15000, 18000, 25000]
}
df = pd.DataFrame(data)

# محاسبه صدک‌های ۲۵٪، ۵۰٪ و ۷۵٪ برای شناسایی سطوح مختلف فروش
percentiles = df['sales'].quantile([0.25, 0.5, 0.75])
print("Percentiles (25%, 50%, 75%):")
print(percentiles)

# شناسایی محصولات بر اساس صدک‌ها:
# محصولات با فروش کمتر از صدک ۲۵٪، محصولات کم‌فروش هستند
low_sales_products = df[df['sales'] <= percentiles[0.25]]
print("\nLow Sales Products (Bottom 25%):")
print(low_sales_products)

# محصولات با فروش بین صدک ۲۵٪ و ۷۵٪، محصولات با فروش متوسط هستند
mid_sales_products = df[(df['sales'] > percentiles[0.25]) & (df['sales'] <= percentiles[0.75])]
print("\nMid Sales Products (25% - 75%):")
print(mid_sales_products)

# محصولات با فروش بالاتر از صدک ۷۵٪، محصولات پرفروش هستند
top_sales_products = df[df['sales'] > percentiles[0.75]]
print("\nTop Sales Products (Top 25%):")
print(top_sales_products)

Percentiles (25%, 50%, 75%):
۰.۲۵     ۳۶۲۵.۰
۰.۵۰     ۸۵۰۰.۰
۰.۷۵    ۱۴۰۰۰.۰
Name: sales, dtype: float64

Low Sales Products (Bottom 25%):
  product  sales
۰       A   1200
۱       B   2500
۲       C   3000

Mid Sales Products (25% - 75%):
  product  sales
۳       D   5500
۴       E   7000
۵       F  10000
۶       G  11000

Top Sales Products (Top 25%):
  product  sales
۷       H  15000
۸       I  18000
۹       J  25000

توضیحات:

صدک ۲۵٪: نشان‌دهنده محصولاتی است که فروش آنها در ۲۵ درصد پایین قرار دارد. این محصولات می‌توانند نیازمند بررسی بیشتری برای بهبود باشند.

صدک ۵۰٪ (میانه): این صدک نشان‌دهنده مقدار میانه داده است و به شما کمک می‌کند محصولات با فروش متوسط را شناسایی کنید.

صدک ۷۵٪: نشان‌دهنده محصولاتی است که فروش آنها در ۲۵ درصد بالای داده‌ها قرار دارد و می‌توان آنها را به عنوان محصولات پرفروش دسته‌بندی کرد.

این تحلیل به مدیران کمک می‌کند تا محصولات کم‌فروش را شناسایی کرده و تصمیم‌های لازم برای بهبود آنها بگیرند یا روی محصولات پرفروش تمرکز بیشتری داشته باشند.

 

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگوها شرکت کنید؟
در گفتگو ها شرکت کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *