بررسی و نحوه ایجاد مدل دادهای مناسب در Power BI
لینک ابزارهای مورد نیاز:
لینک ابزار : نسخه پاور بی آی دسکتاپ اکتبر ۲۰۲۰
لینک دیتابیس استفاده شده: دیتابیس AdventureWorksDW
مشکل
یکی از مشکلات اساسی و همچنین کند شدن نمایش گزارشات و سنگینی حجم فایل پروژه های Power BI و عدم پیاده سازی راحت فرمولهای پاور بی آی مربوط به عدم طراحی دیتا مدل مناسب در این محیط می باشد.
بهترین روش طراحی مدل داده ای در پاور بی آی مدل ستاره ای (Star Schema) می باشد، در این سند به شما آموزش می دهم که چگونه می توان مدلهای سیستم های عملیاتی (OLTP) را به این مدل مناسب تغییر داد.
در ابتدا یکسری مفاهیم اولیه را بررسی می کنم.
راه حل
آشنایی با مفاهیم مورد نیاز
- بعد Dimension
بُعد توضیحی / مرجعی درباره مقادیر قابل اندازه گیری (measurable) هستند ، در صورتی که بتوان منابع داده ای را در این دسته بندی قرار داد ، جدول مورد نظر بُعد می باشد.
-
- چه کسی (who): مشتری ، کارمند
- چه چیزی (what): محصول
- زمان (when): تاریخ
- کجا (where): شعبه، منطقه
- قلم آماری Measure
به هریک از ویژگی های قابل اندازه گیری قلم آماری می گویند . (تعداد ، مبلغ و…)
- حقایق Fact
یک واقعیت ( Fact) بخشی از داده های شما هستند که نشان دهنده یک رخداد یا یک تراکنش / معامله خاص است ، مانند فروش محصول در منطقه و زمان خاص به افراد.
در واقع اطلاعاتی که در Fact وجود دارد شامل فیلد های خارجی (Foreign Key) به ابعاد و همچنین ستون های قابل اندازه گیری می باشد.
- دل دادهای Star Schema
در این مدل داده ای سعی بر این است یک جداول Fact به همراه چندین بعد در اطراف آن پیاده سازی شود به صورتی که ابعاد به بعد های دیگر تجزیه نشوند.
در ادامه تصویری از مدل داده ای به صورت ستاره ای را مشاهده میکنید.
در مدل دادهای از نوع Star، ابعاد به صورت غیر نرمال De-Normalization پیاده سازی میشوند.
- مزیت طراحی به صورت Star Schema چیست؟
- در این روش رابطه (Relation) کمتری ایجاد می شود پس نوشتن کویری ساده تر و سریعتر است.
اما چگونه می توان به این شکل مدل داده ای رسید ؟ در دیتابیس AdvantureWorkDW جدول محصول (DimProduct ) با جدول زیر گروه محصول (DimProductSubCategory) و همجنین این جدول با جدول گروه محصول (DimCategory) در ارتباط است .
در واقع مدل داده ای ما به طور کاملتر این شکلی می باشد . (یا به عبارتی دانه برفی Snow Flake)
در مدل داده ای از نوع دانه برفی Snow Flake جداول به صورت نرمال شده Normalization وارد سیستم می شوند.
- پیاده سازی ساختار بالا به صورت Star Schema در پاور بی آی
برای پیاده سازی ابتدا به محیط Power Query رجوع میکنیم از منوی Home گزینه Transform Data را انتخاب میکنیم.
در مرحله بعد دو جدول DimSubCategory و DimProductCategory را به جدول DimProduct ، الحاق (Merge) میکنیم، در هر مرحله فیلدهای مورد نیاز را استخراج میکنیم.
در پنجره باز شده فیلد ProductSubCategoryKey از جدول DimProduct و جدول DimProductSubCategory را انتخاب میکنیم، نکتهای که هست باید نوع ارتباط (Join Kind) را از نوع Left Outer انتخاب کنیم چون همهی محصولات زیر گروه ندارند.
وقتی که در این پنجره دکمه OK را کلیک می کنیم . فیلد جدید به جدول DimProduct اضافه می گردد.که از این پنجره می توان فیلدهای مورد نیاز را استخراج کرد.
در ادامه یک ارتباط دیگر با جدول DimCategory برقرار می کنیم و فیلد های مورد نیاز را استخراج می کنیم.
این عمل باعث شد فیلدهای مورد نیاز جداول DimProductCategory و DimProductSubCategory به صورت مجتمع داخل جدول DimProduct اضافه گردد، پس دیگر احتیاجی به این دو جدول نیست. آیا می توان این دو جدول را حذف کرد ؟ خیر، به خاطر اینکه جدول محصول با این دو جدول ارتباط (Join) دارد.
در حال حاضر با به روز رسانی داده (Refresh) هم جداول گروه محصول و زیر گروه محصول به روز رسانی می شوند و هم فیلدهایشان در جدول محصول وجود دارد . برای برطرف کردن مشکل بر روی جدول DimProductCategory و DimProductSubCtageory راست کلیک کرده و گزینه Enable Load را غیر فعال می کنیم.
با غیر فعال کردن گزینه Enable Load جداول به مدل داده ای بارگذاری نمیشوند و فضای Ram را اشغال نیز نمیکنند، نکتهای که هست دادهها داخل آن با هر بار رفرش به روز رسانی میشوند.
در نهایت به مدل داده ای Star Schema رسیدیم.
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.