دوره آموزشی گردآوری داده ها با زبان آر
2 ساعت 52 دقیقهمتوسط2025-03-10
مدرسین

Mike Chapple
Teaching Professor at the University of Notre Dame
جزئیات دوره
قالب مرتب یک روش استاندارد برای سازماندهی مقادیر داده در یک مجموعه داده فراهم می کند. با بهره گیری از اصول منظم داده ها، آمار شناسان ، تحلیل گران و دانشمندان داده می توانند زمان کمتری را برای تمیز کردن داده ها و زمان بیشتری را برای حل جنبه های جذاب تر تجزیه و تحلیل داده ها صرف کنند. در این دوره، با اصول مرتب داده ها آشنا شوید، نحوه ایجاد و دستکاری tibbles داده را کشف کنید، و نحوه استفاده از tibbles را در وارد کردن، تبدیل و تمیز کردن اطلاعات خود بیابید. مربی Mike Chapple از R و بسته های مرتب و متنوع برای آموزش مفهوم درگیری داده ها - وظایف تمیز کردن داده ها و تبدیل داده ها که بخش قابل توجهی از وقت تحلیلگران را مصرف می کند، استفاده می کند. وی با سه مورد موردی عملی همراه است که اصول و روشهای مربوط به درگیری داده ها را در این دوره تقویت می کند.
مهارت ها
RStudioRStatisticsData EngineeringData AnalysisProgramming LanguagesData ScienceBusiness Analysis and StrategyBusiness Software and ToolsOpen SourceSoftware DevelopmentDeep Dive (X:Y)
سرفصل ها
0. مقدمه
- 01 - آماده شدن برای جدال داده ها
- 02 - آنچه باید بدانید
- 03 - فایلهای تمرینی
1. دادههای مرتب
- 04 - دادههای مرتب چیست
- 05 - متغیرها، مشاهدات و مقادیر
- 06 - مشکلات رایج داده ها
- 07 - استفاده از tidyverse
2. کار با تیبلز
- 08 - ساخت و چاپ تیبل
- 09 - زیرمجموعه تیبل ها
- 10 - فیلتر کردن تیبل ها
3. وارد کردن دادهها به R
- 11 - فایلهای CSV چیست؟
- 12 - وارد کردن فایلهای CSV به R
- 13 - فایلهای TSV چیست؟
- 14 - وارد کردن فایلهای TSV به R
- 15 - وارد کردن فایلهای محدود شده به R
- 16 - وارد کردن فایلهای با عرض ثابت به R
- 17 - وارد کردن فایلهای اکسل به R
- 18 - خواندن دادهها از پایگاههای داده و وب
4. تبدیل داده ها
- 19 - مجموعه داده گسترده در مقابل طولانی
- 20 - طولانی کردن مجموعه دادههای گسترده با pivot long()
- 21 - ایجاد مجموعه دادههای طولانی با استفاده از pivot wider()
- 22 - تبدیل انواع داده در R
- 23 - کار با تاریخ و زمان در R
5. پاکسازی داده ها
- 24 - تشخیص نقاط پرت
- 25 - مقادیر مفقود و خاص در R
- 26 - جدا کردن ستونها با جدا ()
- 27 - ترکیب ستونها با unite()
- 28 - دستکاری رشتهها در R با stringr
6. مطالعه موردی جدال دادهها - مصرف زغال سنگ
- 29 - درک مجموعه داده زغال سنگ
- 30 - خواندن در مجموعه داده زغال سنگ
- 31 - تبدیل مجموعه داده زغال سنگ از پهن به بلند
- 32 - بخش بندی مجموعه داده زغال سنگ
- 33 - تجسم مجموعه داده زغال سنگ
7. مطالعه موردی جدال دادهها - کیفیت آب
- 34 - درک مجموعه دادههای کیفیت آب
- 35 - خواندن در مجموعه داده کیفیت آب
- 36 - فیلتر کردن مجموعه داده کیفیت آب
- 37 - انواع دادههای کیفیت آب
- 38 - تصحیح خطاهای ورود اطلاعات
- 39 - شناسایی و حذف نقاط پرت
- 40 - تبدیل دما از فارنهایت به سلسیوس
- 41 - گسترش مجموعه داده کیفیت آب
8. مطالعه موردی جدال دادهها - ناتوانی تامین اجتماعی
- 42 - درک مجموعه دادههای معلولیت تامین اجتماعی
- 43 - Import مجموعه دادههای معلولیت تامین اجتماعی
- 44 - طولانی کردن مجموعه دادههای معلولیت تامین اجتماعی
- 45 - قالببندی تاریخها در مجموعه دادههای معلولیت تامین اجتماعی
- 46 - سالهای مالی در مجموعه دادههای معلولیت تامین اجتماعی
- 47 - گسترش مجموعه دادههای معلولیت تامین اجتماعی
- 48 - تجسم مجموعه دادههای معلولیت تامین اجتماعی
نتیجه گیری
- 49 - مراحل بعدی
دوره های مرتبط
- دوره آموزشی تصویرسازی دادهها در R با استفاده از ggplot2
- دوره آموزشی پاک کردن داده های بد در R
- دوره آموزشی راهنمای کامل زبان برنامه نویسی R: بحث، تجسم، و مدل سازی داده ها
- دوره آموزشی کامل کردن اولین پروژه خود با زبان R
- دوره آموزشی R برای علم داده: درس های Lunchbreak
- دوره آموزشی آمادگی گواهینامه متخصص تجزیه و تحلیل خبره (CAP)
- دوره آموزشی یادگیری ماشین با کاهش داده در Excel، R و Power BI
- دوره آموزشی تمرین های کدنویسی: علم داده های R