دوره آموزشی زبان برنامه نویسی R در علم داده: داده های متنوع
1 ساعت 28 دقیقهمتوسط2018-12-04
مدرسین

Mark Niemann-Ross
Technologist experienced in hardware, software, and science fiction
جزئیات دوره
در یک دنیای کامل، هر مجموعه داده به عنوان متن XML با زمینه برای هر قطعه اطلاعات ذخیره می شود. اعداد هرگز به عنوان رشته ذخیره نمی شوند. مقادیر اعشاری هرگز به عنوان نماد علمی ذخیره نمی شوند. رشته ها هرگز بیشتر از 500 کاراکتر نخواهند بود. اما بدیهی است که ما در دنیای کاملی از داده ها زندگی نمی کنیم. و داده های بزرگ فقط این موضوع را بزرگتر می کند. این مشکل تنوع است. داده ها در قالب های مختلف می رسند. دانشمندان داده زمان زیادی را صرف این مشکل میکنند و از نیروی مغزی استفاده میکنند که بهتر است برای کارهای تحلیلی ارزشمند صرف شود. در این دوره، Mark Niemann-Ross مسئله تنوع داده ها را معرفی می کند و نحوه استفاده از قابلیت های منحصر به فرد R را برای حل آنها نشان می دهد. با نحوه وارد کردن طیف گسترده ای از داده ها، از Excel گرفته تا فایل های ODS آشنا شوید.
اهداف یادگیری
سه نوع داده بزرگ را نام ببرید.
سه نکته مورد استفاده برای تعیین بسته R مناسب برای اکسل را فهرست کنید.
بهترین بسته مورد استفاده برای وارد کردن کل کتاب های کار اکسل را تعیین کنید.
نحوه وارد کردن فایل های متنی استاندارد با استفاده از پایه R و tidyverse را توضیح دهید.
هدف بسته زبان خارجی را برای R تعریف کنید.
هنگام کار بر روی فایل های SAS در بسته زبان خارجی محدودیت ها را بشناسید.
مشکلات مربوط به استخراج داده ها از PDF در R را شناسایی کنید.
اهداف یادگیری
سه نوع داده بزرگ را نام ببرید.
سه نکته مورد استفاده برای تعیین بسته R مناسب برای اکسل را فهرست کنید.
بهترین بسته مورد استفاده برای وارد کردن کل کتاب های کار اکسل را تعیین کنید.
نحوه وارد کردن فایل های متنی استاندارد با استفاده از پایه R و tidyverse را توضیح دهید.
هدف بسته زبان خارجی را برای R تعریف کنید.
هنگام کار بر روی فایل های SAS در بسته زبان خارجی محدودیت ها را بشناسید.
مشکلات مربوط به استخراج داده ها از PDF در R را شناسایی کنید.
مهارت ها
RStudioRStatisticsProgramming LanguagesData ScienceOpen SourceSoftware DevelopmentDeep Dive (X:Y)
سرفصل ها
0. مقدمه
- 01 - پرش از روی مانع با تنوع بالا
- 02 - دیدگاه ها در مورد داده های با تنوع بالا
1. از R با اکسل استفاده کنید
- 03 - مقایسه بسته های اکسل
- 04 - یک کتاب کار از اکسل بخوانید
- 05 - یک کتاب کار در اکسل بنویسید
- 06 - محدوده ها را از اکسل بخوانید
- 07 - محدوده ها را در اکسل بنویسید
- 08 - سطرها و ستون ها را از اکسل بخوانید
- 09 - سطرها و ستون ها را در اکسل بنویسید
- 10 - سلول های جداگانه را از اکسل بخوانید
- 11 - سلول های جداگانه را در اکسل بنویسید
2. وارد کردن فایل های متنی
- 12 - فایل های متنی در R
- 13 - فایل های CSV در R
- 14 - فایل های جدا شده با تب در R
- 15 - فایل های با عرض ثابت در R
3. درک بسته خارجی
- 16 - پکیج خارجی R چیست
- 17 - فرم را بخوانید و به DBF بنویسید
- 18 - از SPSS بخوانید و بنویسید
- 19 - از Stata بخوانید و بنویسید
- 20 - از SAS بخوانید و بنویسید
4. از R با فرمت های داده محبوب استفاده کنید
- 21 - XML در R
- 22 - JSON در R
- 23 - فایل های ODS در R
- 24 - فایل های HTML در R
- 25 - استخراج داده ها از PDF در R
- 26 - Google Docs با R
- 27 - کار با تصاویر در R
نتیجه
- 28 - مراحل بعدی
دوره های مرتبط
- دوره آموزشی تصویرسازی دادهها در R با استفاده از ggplot2
- دوره آموزشی گردآوری داده ها با زبان آر
- دوره آموزشی پاک کردن داده های بد در R
- دوره آموزشی راهنمای کامل زبان برنامه نویسی R: بحث، تجسم، و مدل سازی داده ها
- دوره آموزشی کامل کردن اولین پروژه خود با زبان R
- دوره آموزشی R برای علم داده: درس های Lunchbreak
- دوره آموزشی آمادگی گواهینامه متخصص تجزیه و تحلیل خبره (CAP)
- دوره آموزشی یادگیری ماشین با کاهش داده در Excel، R و Power BI