نمودار هگزبین Hexbin Plot

در این دوره از زمان ، داده هایی با حجم زیاد تقریباً در هر صنعت موجود می باشد. نیاز به تجزیه و تحلیل حجم زیادی از داده ها را می توان به روش های مختلف حل کرد. اما روش تجسم تعداد بسیار زیادی از نقاط داده می تواند یک کار خسته کننده باشد. موردی را نظر بگیرید که برای تجسم روندها و الگوها لازم است پنجاه هزار نقطه داده ترسیم کنید. چالش های اصلی در این مورد این  است که به راحتی برای چشم انسان قابل تشخیص نیست که بسیاری از نقاط را در یک نمودار تشخیص دهید.  شاید اولین نموداری که استفاده خواهید کرد نمودار پراکندگی (Scatter Chart) باشد ، به طور کلی اولین نمودار انتخابی هنگام ترسیم تعداد بسیار زیادی از نقاط داده است و از محدودیت های ذکر شده در بالا رنج می برد.

نمودار hexbin برای نشان دادن رابطه ۲ متغیر عددی هنگامی که نقاط داده زیادی وجود دارد مفید است. نمودارهای Hexbin لیستی از مقادیر X و Y را در اختیار شما قرار می دهند (و یک لیست اختیاری از مقادیر Z) و آنچه را که تا حدودی شبیه به نمودار پراکندگی  ( Scatter Chart) است برمی گرداند ، شکل نمایشی  نمودار به شش ضلعی تقسیم شده است (مانند لانه زنبور) و همه داده ها در این شش ضلعی ها (hexagonal regions) بر اساس طیف رنگی (color gradient) که نشانگر تراکم می باشد قرار می گیرند

در تصویر پایین مقایسه دو نمودار پراکندگی (Scatter Chart) را با نمودار هگزبین مشاهده می کنید. در نمودار هگزبین  تکنیک شش ضلعی شدن صفحه در نقاطی که پررنگ هست بیانگر این است که تعداد داده های بیشتری در آن نقطه قرار دارد (به طو نمونه ۱۰ نفر حقوق X تومان را دریافت می کنند) قاعدتا نمودار هگزبین اطلاعات بشتری را نسبت به نمودار پراکندگی در اختیار ما قرار می دهد.

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگوها شرکت کنید؟
در گفتگو ها شرکت کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *