دوره آموزشی پاکسازی داده ها در یادگیری جامع پایتون
1 ساعت 6 دقیقهمتوسط2022-11-09
مدرسین

Miki Tebeka
CEO at 353Solutions
جزئیات دوره
اگر به دنبال راههای کارآمدتری برای آمادهسازی دادههای خود برای تجزیه و تحلیل هستید، زمان آن رسیده است که مجموعه مهارتهای خود را ارتقا دهید و رویکرد خود را برای پاکسازی دادهها ارزیابی مجدد کنید. در این دوره، مربی Miki Tebeka برخی از مهم ترین ویژگی های پاکسازی و جمع آوری داده های تولیدی را با مثال های کدنویسی عملی با استفاده از پایتون برای آزمایش مهارت های شما به شما نشان می دهد. در مورد ارزش سازمانی داده های تمیز با کیفیت بالا بیاموزید، توانایی خود را برای تشخیص خطاهای رایج و رفع سریع آنها در حین حرکت توسعه دهید. در طول مسیر، Miki استراتژیهای تمیز کردنی را ارائه میکند که میتواند به بهینهسازی گردش کار شما کمک کند، از جمله نکاتی برای تجزیه و تحلیل علّی و ابزارهای آسان برای جلوگیری از خطا.
مهارت ها
Data EngineeringPythonData AnalysisProgramming LanguagesData ScienceBusiness Analysis and StrategyBusiness Software and ToolsOpen SourceSoftware DevelopmentDeep Dive (X:Y)
سرفصل ها
0. مقدمه
- 01 - چرا داده های پاک مهم هستند
- 02 - آنچه باید بدانید
- 03 - استفاده از GitHub Codespaces با این دوره
1. داده های بد
- 04 - انواع خطاها
- 05 - مقادیر از دست رفته
- 06 - ارزش های بد
- 07 - موارد تکراری
2. علل خطاها
- 08 - خطاهای انسانی
- 09 - خطاهای ماشین
- 10 - خطاهای طراحی
- 11 - چالش - طراحی UI
- 12 - راه حل - طراحی UI
3. تشخیص خطاها
- 13 - طرحواره ها
- 14 - اعتبار سنجی
- 15 - یافتن داده های از دست رفته
- 16 - دانش دامنه
- 17 - زیر گروه ها
- 18 - چالش - داده های بد را پیدا کنید
- 19 - راه حل - داده های بد را پیدا کنید
4. جلوگیری از خطاها
- 20 - فرمت های سریال سازی
- 21 - امضای دیجیتال
- 22 - خطوط لوله داده و اتوماسیون
- 23 - معاملات
- 24 - سازماندهی داده ها و داده های مرتب
- 25 - معیارهای کیفیت فرآیند و داده ها
- 26 - چالش - ETL
- 27 - راه حل - ETL
5. رفع خطاها
- 28 - تغییر نام فیلدها
- 29 - انواع رفع
- 30 - پیوستن و تقسیم داده ها
- 31 - حذف داده های بد
- 32 - پر کردن مقادیر از دست رفته
- 33 - تغییر شکل داده ها
- 34 - چالش - درآمد کارگاهی
- 35 - راه حل - درآمد کارگاهی
نتیجه
- 36 - مراحل بعدی
دوره های مرتبط
- دوره آموزشی کلانداده در عصر هوش مصنوعی
- دوره آموزشی راهنمای کامل مهندسی تحلیل دادهها
- دوره آموزشی مهندسی تحلیل پیشرفته: تمرینهای دنیای واقعی
- دوره آموزشی راهنمای کامل Google BigQuery برای مهندسان داده و یادگیری ماشین
- دوره آموزشی یادگیری اصولی PySpark: معرفی ساخت خطوط پردازش داده
- دوره آموزشی پاکسازی دادهها برای علم داده مؤثر: واردکردن دادهها، تشخیص ناهنجاری، پرکردن مقادیر گمشده و مهندسی ویژگیها
- دوره آموزشی یادگیری جامع اسکالا برای علوم داده
- دوره آموزشی SPSS: آمادهسازی، مصورسازی و مدلسازی دادهها