قسمت بیست و یکم – استفاده از تابع Cut در پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزتابع cut در پانداس برای دستهبندی (باین کردن) مقادیر عددی به گروههای مجزا استفاده میشود. این تابع به شما اجازه میدهد که یک متغیر پیوسته را به دستههای گسسته تقسیم کنید.
دسترسی به اعضا- قسمت بیستم -سناریو هشتم -تحلیل همبستگی (Correlation analysis) در پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزتحلیل همبستگی در پانداس به ما کمک میکند که رابطه و میزان همبستگی میان دو یا چند متغیر عددی را ارزیابی کنیم. همبستگی در واقع نشان میدهد که تغییرات یک متغیر تا چه حد به تغییرات متغیر دیگر مرتبط است. این تحلیل معمولاً با استفاده از ضریب همبستگی پیرسون انجام میشود که مقداری بین -۱ و +۱ را نشان میدهد.مثالی که می خواهیم پیاده سازی کنیم بررسی همبستگی بین هزینه تبلیغات و فروش می باشد
قسمت نوزدهم – استفاده از Pivot و Unpivotدر پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر پانداس، pivot و unpivot دو روش برای تبدیل ساختار دادهها هستند که به ترتیب با استفاده از توابع pivot و melt اجرا میشوند. در ادامه توضیحات و مثالهایی برای این دو ارائه میدهم.
دسترسی به اعضا- قسمت هجدهم – سناریو هفتم – تحلیل متن فارسی برای استفاده در word cloud
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزبرای تحلیل متن با استفاده از پانداس، تبدیل رشتهها به کلمات، گروهبندی کلمات و شمارش کل کلمات، میتوانیم مراحل زیر را دنبال کنیم. در این مثال، ما از پانداس برای پردازش دادهها استفاده خواهیم کرد و سپس کلمات را گروهبندی کرده و تعداد آنها را شمارش خواهیم کرد.
قسمت هفدهم – کار با متن در پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر کتابخانه پانداس، کار با رشتهها یکی از قابلیتهای مفید برای تجزیه و تحلیل دادهها است. در زیر، چند مثال کاربردی از کار با رشتهها در پانداس آورده شده است:
دسترسی به اعضا- قسمت شانزدهم – سناریو ششم – خواندن فایل های اکسل با ساختاریکسان
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزبرای خواندن فایلهای اکسل با ساختار یکسان که داخل یک پوشه قرار دارند و سپس ادغام (append) آنها در یک DataFrame نهایی، میتوانیم از کتابخانههای glob و os به همراه pandas استفاده کنیم. glob برای یافتن فایلها در مسیر مورد نظر و os برای مدیریت مسیرها و فایلها به کار میرود.
قسمت پانزدهم – تعریف تابع در پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزتعریف تابع با استفاده از def در پانداس مزایای متعددی دارد که در پروژههای پردازش دادهها به خصوص برای کارهای تکراری و پیچیده، کار را بسیار سادهتر و مؤثرتر میکند.
قسمت چهاردهم- استفاده از صدکها Percentiles در پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزتابع percentiles به طور کلی ابزاری برای تقسیم دادهها به بخشهای مساوی در بازه ۰ تا ۱۰۰٪ است. در تحلیل دادهها، صدکها (Percentiles) به شما این امکان را میدهند که دادهها را به نسبتهای خاصی تقسیم کنید. هر صدک نشاندهنده نقطهای از دادههاست که درصد خاصی از مقادیر زیر آن نقطه قرار میگیرند. به عنوان مثال، صدک ۲۵ درصد نشان میدهد که ۲۵ درصد دادهها کمتر از این مقدار و ۷۵ درصد بالاتر از آن قرار دارند.
قسمت سیزدهم – گروه بندی داده Group Byدر پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر کتابخانه پایتون پانداس، از تابع groupby برای گروهبندی دادهها بر اساس یک یا چند ستون استفاده میشود. groupby میتواند برای محاسبه مقادیر آماری مانند میانگین، مجموع، تعداد، و … روی هر گروه به کار رود.
قسمت دوازدهم- سناریو سوم- شناسایی داده های پرت outlier از طریق Z-Score
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر پانداس، روش z-score یکی دیگر از روشهای رایج برای شناسایی دادههای پرت است که شباهت زیادی به روش انحراف معیار دارد، اما تفاوت اصلی آن در استفاده از نرمالسازی مقادیر به کمک مقیاس استاندارد دارد. در روش z-score، هر مقدار داده با استفاده از میانگین و انحراف معیار استانداردسازی میشود و z-score یا نمره استاندارد برای هر مقدار محاسبه میشود.
قسمت یازدهم- سناریو دوم- شناسایی داده های پرت outlier از طریق انحراف معیار
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزبرای شناسایی دادههای پرت میتوانیم از روش انحراف معیار استفاده کنیم. این روش بر اساس میانگین و انحراف معیار مجموعه داده عمل میکند. مقادیری که بیش از یک محدوده معین (مثلاً ۳ برابر انحراف معیار) از میانگین فاصله دارند، به عنوان داده پرت شناسایی میشوند.
قسمت دهم – سناریو اول – شناسایی داده های پرت outlier از طریق چارک ها
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر پانداس، میتوانیم دادههای پرت (یا همان دادههای خارج از محدوده معمول) را شناسایی کنیم. این دادهها معمولاً به صورت مقادیر خیلی بزرگ یا خیلی کوچک در مجموعه داده ظاهر میشوند و میتوانند تحلیلهای آماری را تحت تأثیر قرار دهند. روشهای مختلفی برای شناسایی دادههای پرت وجود دارد که یکی از رایجترین آنها استفاده از آمارههای چارکی (IQR) است.
قسمت نهم – استفاده از lambda در پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر پانداس، lambda به عنوان توابع ناشناس برای انجام عملیات ساده و سریع روی دادهها بسیار مفید است. این توابع معمولاً در ترکیب با متدهای apply, applymap, و map استفاده میشوند. در ادامه، مثالهای متنوعی از استفادههای lambda در پانداس آورده شده است.
قسمت هشتم – استفاده از تابع apply و applymap
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزمتد apply در پانداس یک ابزار قدرتمند برای اعمال توابع سفارشی روی دادهها است. این متد میتواند روی سطرها یا ستونهای یک DataFrame یا Series اعمال شود و برای انجام عملیاتهای پیچیده و انعطافپذیر بسیار مفید است. در ادامه چند مثال از استفادههای مختلف apply در پانداس آورده شده است.
قسمت هفتم- پاکسازی داده با Pandas – تصمیم گیری برای مقادیر خالی
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر زندگی روزمره ما، مواجهه با مجموعه داده های ناشناخته می تواند یک کار دلهره آور باشد. چه برای تجزیه و تحلیل کسب و کار، یک پروژه تحقیقاتی، یا فقط تلاش برای درک اعداد، شروع از صفر می تواند چالش برانگیز باشد.
تجزیه و تحلیل موثر داده ها با داده های تمیز و به خوبی آماده شده شروع می شود. Pandas، یک کتابخانه قدرتمند پایتون، طیف وسیعی از ابزارها را برای پاکسازی و تبدیل داده های شما فراهم می کند.
قسمت ششم – مقدمه – پاکسازی داده با Pandas
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزقبل از اینکه به ماجراجویی داده خود با پانداها بپردازیم، اجازه دهید لحظه ای را به توضیح اصطلاح “پاکسازی داده ها” اختصاص دهیم. به آن به عنوان سم زدایی دیجیتال برای مجموعه داده خود فکر کنید، جایی که ما آن را مرتب می کنیم، و دقت را بیش از هر چیز در اولویت قرار می دهیم.
قسمت پنجم – واکشی تخصصی داده از اکسل با پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر این سری آموزش می خواهیم به صورت تخصصی داده ها را از فایل اکسل استخراج کنیمدر این آموزش می خواهیم به سوالات زیر پاسخ دهیم :
چگونه از طریق پانداس یک شیت از فایل اکسل را فراخوانی کنیم؟
چگونه بعضی از ستون های فایل اکسل را واکشی کنیم؟
و موارد دیگر….
قسمت چهارم – واکشی داده از منابع مختلف در پانداس
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر این آموزش شیوه های مختلف واکشی اطلاعات را آموزش خواهید دید به طور مثال چگونه داده را داخل پایتون از طریق Series یا Data frame و در ادامه چگونه از فایل CSV ، Excel ، بانک اطلاعاتی و… واکشی کنید.
قسمت سوم – نصب پایتون و اضافه کردن کتابخانه Pandas
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزدر این مقاله آموزشی یاد می گیرد که چگونه پایتون را نصب کنید و کتابخانه پانداس را به آن اضافه کنید.همچنین دستورات Python را در محیط IDLE وارد کنید .
قسمت دوم- مقدمهای بر کتابخانه پانداس (Pandas) در پایتون
/۰ دیدگاه /در Pandas, پایتون /توسط بابک پیروزپانداس (Pandas) یکی از کتابخانههای قدرتمند و محبوب در زبان برنامهنویسی پایتون است که به منظور تحلیل و دستکاری دادهها مورد استفاده قرار میگیرد. این کتابخانه برای کار با دادههای ساختاریافته مانند جداول و دادههای سریهای زمانی طراحی شده و قابلیتهای متنوعی را برای پردازش دادهها ارائه میدهد. پانداس یکی از ابزارهای اصلی در علم داده و تحلیل دادهها است و توسط تحلیلگران، دانشمندان داده و مهندسان به کار گرفته میشود.
قسمت اول – مقدمه ای بر پایتون
/۰ دیدگاه /در Pandas /توسط بابک پیروزPython یکی از محبوبترین و پرکاربردترین زبانهای برنامهنویسی در دنیاست که بهویژه برای تحلیل داده و هوش مصنوعی بسیار مناسب است. این زبان به دلیل سادگی، خوانایی، و داشتن جامعهٔ کاربری بزرگ، به سرعت مورد استقبال قرار گرفت و در بسیاری از حوزهها از جمله توسعهٔ وب، محاسبات علمی، یادگیری ماشین، و تحلیل داده استفاده میشود.