دوره آموزشی برنامه نویسی R در علم داده: داده های با حجم بالا
1 ساعت 25 دقیقهمتوسط2018-10-26
مدرسین

Mark Niemann-Ross
Technologist experienced in hardware, software, and science fiction
جزئیات دوره
داده ها تمام فضای موجود را پر می کنند، و اکنون که ذخیره سازی ارزان است، حجم داده ها منفجر شده است. با این حال، همه آن اطلاعات بدون تحلیل و زمینه بی فایده است. زبان برنامه نویسی R به گونه ای طراحی شده است که تجزیه و تحلیل و تجسم حجم عظیمی از داده ها را آسان تر می کند. برای مثال، R توانایی ضرب یک بلوک از متغیرها را در دیگری فراهم میکند - فرضی که مزایای ذاتی را نسبت به زبانهای دیگر فراهم میکند. این دوره نشان میدهد که چرا R برای حجم بالای داده ایدهآل است، راههای کارآمدتر برای استفاده از زبان را معرفی میکند و نحوه اجتناب از مشکلات و استفاده از فرصتهای کلان داده را توضیح میدهد. بیاموزید که چگونه تشخیص دهید که آیا حافظه و قدرت پردازش کافی دارید، تصویرسازیهایی از دادههای بزرگ تولید کنید، کد R خود را بهینه کنید و از تکنیکهای پیشرفته مانند پردازش موازی برای سرعت بخشیدن به محاسبات خود استفاده کنید. به علاوه، نحوه ادغام R را با راه حل های کلان داده مانند پایگاه های داده SQL و Apache Spark بیابید.
اهداف یادگیری
دسترسی به حافظه و قدرت پردازش
تجسم داده های با حجم بالا
پروفایل و بهینه سازی کد R
کامپایل توابع R
پردازش موازی با R
استفاده از R با سایر راه حل های کلان داده
اهداف یادگیری
دسترسی به حافظه و قدرت پردازش
تجسم داده های با حجم بالا
پروفایل و بهینه سازی کد R
کامپایل توابع R
پردازش موازی با R
استفاده از R با سایر راه حل های کلان داده
مهارت ها
RStudioRStatisticsData EngineeringData AnalysisProgramming LanguagesData ScienceBusiness Analysis and StrategyBusiness Software and ToolsOpen SourceSoftware DevelopmentDeep Dive (X:Y)
سرفصل ها
0. مقدمه
- 01 - جدال داده های با حجم بالا با R
- 02 - مجموعه داده های نمونه
1. مشکلات و فرصت ها با داده های با حجم بالا
- 03 - چشم انداز داده های با حجم بالا
- 04 - داده های بزرگ و حافظه در دسترس
- 05 - کد - یافتن حافظه موجود
- 06 - چرخه های کلان داده و CPU
- 07 - کد - سرعت کامپیوتر شما چقدر است
2. تجسم داده های با حجم بالا
- 08 - داده ها و تصاویر با حجم بالا
- 09 - کد - نمودارها برای داده های با حجم بالا
- 10 - کد - rug() و jitter()
- 11 - کد - اعمال آمار در پلات
- 12 - کد - نمودارهای زیر نمونه برای داده های با حجم بالا
- 13 - کد - Trellising داده ها در نمودارهای متعدد
3. کار در زبان برنامه نویسی R
- 14 - ابزار برنامه نویسی R برای داده های با حجم بالا
- 15 - نمونه برداری پایین
- 16 - کد R پروفایل برای یافتن ناکارآمدی ها
- 17 - کد - پروفایل کد R برای یافتن ناکارآمدی ها
- 18 - از مشکل کپی روی اصلاح با R اجتناب کنید
- 19 - کد - از کپی روی اصلاح با data.table خودداری کنید
- 20 - بهینه سازی در مقابل خوانایی
4. تکنیک های پیشرفته با حجم بالا
- 21 - توابع R را کامپایل کنید
- 22 - پردازش موازی با R
- 23 - کد - توابع R موازی
- 24 - بسته های bigmemory، LaF و ff
5. از R با راه حل های بزرگ داده خارجی استفاده کنید
- 25 - داده های با حجم بالا را در پایگاه داده ذخیره کنید
- 26 - کد - R با پایگاه داده
- 27 - رایانش ابری با R
- 28 - Sparklyr با R
- 29 - کد - R با Sparklyr
نتیجه
- 30 - خلاصه داده های با حجم بالا با R
دوره های مرتبط
- دوره آموزشی تصویرسازی دادهها در R با استفاده از ggplot2
- دوره آموزشی گردآوری داده ها با زبان آر
- دوره آموزشی پاک کردن داده های بد در R
- دوره آموزشی راهنمای کامل زبان برنامه نویسی R: بحث، تجسم، و مدل سازی داده ها
- دوره آموزشی کامل کردن اولین پروژه خود با زبان R
- دوره آموزشی R برای علم داده: درس های Lunchbreak
- دوره آموزشی آمادگی گواهینامه متخصص تجزیه و تحلیل خبره (CAP)
- دوره آموزشی یادگیری ماشین با کاهش داده در Excel، R و Power BI