دوره آموزشی پاک کردن داده های بد در R
2 ساعت 4 دقیقهمبتدی2025-03-10
مدرسین

Mike Chapple
Teaching Professor at the University of Notre Dame
جزئیات دوره
یکپارچگی داده ها نقطه کانونی جدید انقلاب علم داده است. اکنون که همه با نقش داده ها در زندگی و تجارت مردم آشنا هستند، این سوال غیرمنصفانه نیست که بپرسیم: "آیا می توانید ثابت کنید که داده های خود دقیق هستند؟" در این دوره آموزشی، میتوانید یاد بگیرید که چگونه بسیاری از مسائل مربوط به یکپارچگی دادهها را که دانشمندان داده مدرن با آن مواجه هستند، با استفاده از R و the tidyverse شناسایی و به آنها رسیدگی کنید. نحوه مدیریت مقادیر از دست رفته و داده های تکراری را کشف کنید. نحوه تبدیل داده ها بین واحدهای مختلف و مقابله با متن های با فرمت ضعیف را بیاموزید. به علاوه، یاد بگیرید که چگونه نقاط پرت را شناسایی کنید، به مشکلات ساختاری رسیدگی کنید، و پرچمهای قرمز را که نشاندهنده مشکلات بالقوه کیفیت داده است، شناسایی کنید.
اهداف یادگیری
داده های از دست رفته
سطرها و مقادیر تکراری
تبدیل داده ها
قالب بندی داده ها
کار با داده های مرتب
مرتب کردن مجموعه داده ها
برخورد با داده های مشکوک
اهداف یادگیری
داده های از دست رفته
سطرها و مقادیر تکراری
تبدیل داده ها
قالب بندی داده ها
کار با داده های مرتب
مرتب کردن مجموعه داده ها
برخورد با داده های مشکوک
مهارت ها
RStudioRStatisticsData EngineeringData AnalysisProgramming LanguagesData ScienceBusiness Analysis and StrategyBusiness Software and ToolsOpen SourceSoftware DevelopmentOne-Off
سرفصل ها
0. مقدمه
- 01 - دادهها نامرتب هستند
- 02 - آنچه باید بدانید
1. دادههای از دست رفته
- 03 - انواع دادههای از دست رفته
- 04 - مقادیر از دست رفته
- 05 - ردیفهای از دست رفته
- 06 - تجمعات و مقادیر گمشده
2. دادههای تکراری
- 07 - سطرها و مقادیر تکراری
- 08 - تجمیع در مجموعه داده ها
3. قالببندی داده ها
- 09 - تبدیل تاریخ
- 10 - تبدیل واحد
- 11 - اعداد به صورت متن ذخیره میشوند
- 12 - متن به صورت نامناسب به عدد تبدیل شده است
- 13 - املای متناقض
4. موارد پرت
- 14 - غربالگری برای موارد پرت
- 15 - رسیدگی به موارد پرت
- 16 - موارد استفاده پرت
- 17 - پرت در زیر گروه ها
- 18 - تشخیص مقادیر غیر منطقی
5. دادههای مرتب
- 19 - دادههای مرتب چیست
- 20 - متغیرها، مشاهدات و مقادیر
- 21 - مشکلات رایج داده ها
- 22 - مجموعه دادههای گسترده در مقابل طولانی
- 23 - طولانی کردن مجموعه دادههای گسترده
- 24 - ساخت مجموعه دادههای طولانی گسترده
6. پرچم قرمز
- 25 - ارزشهای مشکوک
- 26 - مضرب مشکوک
7. ویرایش داده ها
- 27 - شناسایی دادههای حساس
- 28 - ویرایش دادههای حساس در R
نتیجه گیری
- 29 - بعدش چی
دوره های مرتبط
- دوره آموزشی تصویرسازی دادهها در R با استفاده از ggplot2
- دوره آموزشی گردآوری داده ها با زبان آر
- دوره آموزشی راهنمای کامل زبان برنامه نویسی R: بحث، تجسم، و مدل سازی داده ها
- دوره آموزشی کامل کردن اولین پروژه خود با زبان R
- دوره آموزشی R برای علم داده: درس های Lunchbreak
- دوره آموزشی آمادگی گواهینامه متخصص تجزیه و تحلیل خبره (CAP)
- دوره آموزشی یادگیری ماشین با کاهش داده در Excel، R و Power BI
- دوره آموزشی تمرین های کدنویسی: علم داده های R