قسمت بیست و یکم – استفاده از تابع Cut در پانداس

تابع cut در پانداس برای دسته‌بندی (باین کردن) مقادیر عددی به گروه‌های مجزا استفاده می‌شود. این تابع به شما اجازه می‌دهد که یک متغیر پیوسته را به دسته‌های گسسته تقسیم کنید.

دسترسی به اعضا- قسمت بیستم -سناریو هشتم -تحلیل همبستگی (Correlation analysis) در پانداس

تحلیل همبستگی در پانداس به ما کمک می‌کند که رابطه و میزان همبستگی میان دو یا چند متغیر عددی را ارزیابی کنیم. همبستگی در واقع نشان می‌دهد که تغییرات یک متغیر تا چه حد به تغییرات متغیر دیگر مرتبط است. این تحلیل معمولاً با استفاده از ضریب همبستگی پیرسون انجام می‌شود که مقداری بین -۱ و +۱ را نشان می‌دهد.مثالی که می خواهیم پیاده سازی کنیم بررسی همبستگی بین هزینه تبلیغات و فروش می باشد

قسمت نوزدهم – استفاده از Pivot و Unpivotدر پانداس

در پانداس، pivot و unpivot دو روش برای تبدیل ساختار داده‌ها هستند که به ترتیب با استفاده از توابع pivot و melt اجرا می‌شوند. در ادامه توضیحات و مثال‌هایی برای این دو ارائه می‌دهم.

دسترسی به اعضا- قسمت هجدهم – سناریو هفتم – تحلیل متن فارسی برای استفاده در word cloud

برای تحلیل متن با استفاده از پانداس، تبدیل رشته‌ها به کلمات، گروه‌بندی کلمات و شمارش کل کلمات، می‌توانیم مراحل زیر را دنبال کنیم. در این مثال، ما از پانداس برای پردازش داده‌ها استفاده خواهیم کرد و سپس کلمات را گروه‌بندی کرده و تعداد آن‌ها را شمارش خواهیم کرد.

قسمت هفدهم – کار با متن در پانداس

در کتابخانه پانداس، کار با رشته‌ها یکی از قابلیت‌های مفید برای تجزیه و تحلیل داده‌ها است. در زیر، چند مثال کاربردی از کار با رشته‌ها در پانداس آورده شده است:

دسترسی به اعضا- قسمت شانزدهم – سناریو ششم – خواندن فایل های اکسل با ساختاریکسان

برای خواندن فایل‌های اکسل با ساختار یکسان که داخل یک پوشه قرار دارند و سپس ادغام (append) آن‌ها در یک DataFrame نهایی، می‌توانیم از کتابخانه‌های glob و os به همراه pandas استفاده کنیم. glob برای یافتن فایل‌ها در مسیر مورد نظر و os برای مدیریت مسیرها و فایل‌ها به کار می‌رود.

قسمت پانزدهم – تعریف تابع در پانداس

تعریف تابع با استفاده از def در پانداس مزایای متعددی دارد که در پروژه‌های پردازش داده‌ها به خصوص برای کارهای تکراری و پیچیده، کار را بسیار ساده‌تر و مؤثرتر می‌کند.

قسمت چهاردهم- استفاده از صدکها Percentiles در پانداس

تابع percentiles به طور کلی ابزاری برای تقسیم داده‌ها به بخش‌های مساوی در بازه ۰ تا ۱۰۰٪ است. در تحلیل داده‌ها، صدک‌ها (Percentiles) به شما این امکان را می‌دهند که داده‌ها را به نسبت‌های خاصی تقسیم کنید. هر صدک نشان‌دهنده نقطه‌ای از داده‌هاست که درصد خاصی از مقادیر زیر آن نقطه قرار می‌گیرند. به عنوان مثال، صدک ۲۵ درصد نشان می‌دهد که ۲۵ درصد داده‌ها کمتر از این مقدار و ۷۵ درصد بالاتر از آن قرار دارند.

قسمت سیزدهم – گروه بندی داده Group Byدر پانداس

در کتابخانه پایتون پانداس، از تابع groupby برای گروه‌بندی داده‌ها بر اساس یک یا چند ستون استفاده می‌شود. groupby می‌تواند برای محاسبه مقادیر آماری مانند میانگین، مجموع، تعداد، و … روی هر گروه به کار رود.

قسمت دوازدهم- سناریو سوم- شناسایی داده های پرت outlier از طریق Z-Score

در پانداس، روش z-score یکی دیگر از روش‌های رایج برای شناسایی داده‌های پرت است که شباهت زیادی به روش انحراف معیار دارد، اما تفاوت اصلی آن در استفاده از نرمال‌سازی مقادیر به کمک مقیاس استاندارد دارد. در روش z-score، هر مقدار داده با استفاده از میانگین و انحراف معیار استانداردسازی می‌شود و z-score یا نمره استاندارد برای هر مقدار محاسبه می‌شود.

قسمت یازدهم- سناریو دوم- شناسایی داده های پرت outlier از طریق انحراف معیار

برای شناسایی داده‌های پرت می‌توانیم از روش انحراف معیار استفاده کنیم. این روش بر اساس میانگین و انحراف معیار مجموعه داده عمل می‌کند. مقادیری که بیش از یک محدوده معین (مثلاً ۳ برابر انحراف معیار) از میانگین فاصله دارند، به عنوان داده پرت شناسایی می‌شوند.

قسمت دهم – سناریو اول – شناسایی داده های پرت outlier از طریق چارک ها

در پانداس، می‌توانیم داده‌های پرت (یا همان داده‌های خارج از محدوده معمول) را شناسایی کنیم. این داده‌ها معمولاً به صورت مقادیر خیلی بزرگ یا خیلی کوچک در مجموعه داده ظاهر می‌شوند و می‌توانند تحلیل‌های آماری را تحت تأثیر قرار دهند. روش‌های مختلفی برای شناسایی داده‌های پرت وجود دارد که یکی از رایج‌ترین آنها استفاده از آماره‌های چارکی (IQR) است.

قسمت نهم – استفاده از lambda در پانداس

در پانداس، lambda به عنوان توابع ناشناس برای انجام عملیات ساده و سریع روی داده‌ها بسیار مفید است. این توابع معمولاً در ترکیب با متدهای apply, applymap, و map استفاده می‌شوند. در ادامه، مثال‌های متنوعی از استفاده‌های lambda در پانداس آورده شده است.

قسمت هشتم – استفاده از تابع apply و applymap

متد apply در پانداس یک ابزار قدرتمند برای اعمال توابع سفارشی روی داده‌ها است. این متد می‌تواند روی سطرها یا ستون‌های یک DataFrame یا Series اعمال شود و برای انجام عملیات‌های پیچیده و انعطاف‌پذیر بسیار مفید است. در ادامه چند مثال از استفاده‌های مختلف apply در پانداس آورده شده است.

قسمت هفتم- پاکسازی داده با Pandas – تصمیم گیری برای مقادیر خالی

در زندگی روزمره ما، مواجهه با مجموعه داده های ناشناخته می تواند یک کار دلهره آور باشد. چه برای تجزیه و تحلیل کسب و کار، یک پروژه تحقیقاتی، یا فقط تلاش برای درک اعداد، شروع از صفر می تواند چالش برانگیز باشد.
تجزیه و تحلیل موثر داده ها با داده های تمیز و به خوبی آماده شده شروع می شود. Pandas، یک کتابخانه قدرتمند پایتون، طیف وسیعی از ابزارها را برای پاکسازی و تبدیل داده های شما فراهم می کند.

قسمت ششم – مقدمه – پاکسازی داده با Pandas

قبل از اینکه به ماجراجویی داده خود با پانداها بپردازیم، اجازه دهید لحظه ای را به توضیح اصطلاح “پاکسازی داده ها” اختصاص دهیم. به آن به عنوان سم زدایی دیجیتال برای مجموعه داده خود فکر کنید، جایی که ما آن را مرتب می کنیم، و دقت را بیش از هر چیز در اولویت قرار می دهیم.

قسمت پنجم – واکشی تخصصی داده از اکسل با پانداس

در این سری آموزش می خواهیم به صورت تخصصی داده ها را از فایل اکسل استخراج کنیمدر این آموزش می خواهیم به سوالات زیر پاسخ دهیم :
چگونه از طریق پانداس یک شیت از فایل اکسل را فراخوانی کنیم؟
چگونه بعضی از ستون های فایل اکسل را واکشی کنیم؟
و موارد دیگر….

قسمت چهارم – واکشی داده از منابع مختلف در پانداس

در این آموزش شیوه های مختلف واکشی اطلاعات را آموزش خواهید دید  به طور مثال چگونه داده را داخل پایتون از طریق Series یا Data frame و در ادامه چگونه از فایل CSV ، Excel ، بانک اطلاعاتی و… واکشی کنید.

قسمت سوم – نصب پایتون و اضافه کردن کتابخانه Pandas

در این مقاله آموزشی یاد می گیرد که چگونه پایتون را نصب کنید و کتابخانه پانداس را به آن اضافه کنید.همچنین دستورات Python را در محیط IDLE وارد کنید .

قسمت دوم- مقدمه‌ای بر کتابخانه پانداس (Pandas) در پایتون

 پانداس (Pandas) یکی از کتابخانه‌های قدرتمند و محبوب در زبان برنامه‌نویسی پایتون است که به منظور تحلیل و دستکاری داده‌ها مورد استفاده قرار می‌گیرد. این کتابخانه برای کار با داده‌های ساختاریافته مانند جداول و داده‌های سری‌های زمانی طراحی شده و قابلیت‌های متنوعی را برای پردازش داده‌ها ارائه می‌دهد. پانداس یکی از ابزارهای اصلی در علم داده و تحلیل داده‌ها است و توسط تحلیل‌گران، دانشمندان داده و مهندسان به کار گرفته می‌شود.

قسمت اول – مقدمه ای بر پایتون

Python یکی از محبوب‌ترین و پرکاربردترین زبان‌های برنامه‌نویسی در دنیاست که به‌ویژه برای تحلیل داده و هوش مصنوعی بسیار مناسب است. این زبان به دلیل سادگی، خوانایی، و داشتن جامعهٔ کاربری بزرگ، به سرعت مورد استقبال قرار گرفت و در بسیاری از حوزه‌ها از جمله توسعهٔ وب، محاسبات علمی، یادگیری ماشین، و تحلیل داده استفاده می‌شود.