دوره آموزشی تجزیه و تحلیل داده های بزرگ با Hive
1 ساعت 53 دقیقهمتوسط2017-01-20
مدرسین

Ben Sullins
Data Geek, Tech Consultant
جزئیات دوره
کسب و کارها با اتخاذ تصمیمات آگاهانه که نیازهای مشتریان و کاربران آنها را هدف قرار می دهند، رونق می گیرند. برای اتخاذ چنین تصمیمات راهبردی، آنها بر داده ها تکیه می کنند. Hive یک ابزار انتخابی برای بسیاری از دانشمندان داده است زیرا به آنها اجازه می دهد تا با SQL، یک نحو آشنا کار کنند، تا از Hadoop اطلاعاتی را بدست آورند، که منعکس کننده اطلاعاتی است که مشاغل به دنبال برنامه ریزی موثر هستند.
این دوره نحوه استفاده از Hive برای پردازش داده ها را نشان می دهد. مربی بن سالینز با نشان دادن نحوه ساختار و بهینه سازی داده های خود شروع می کند. در مرحله بعد، او توضیح می دهد که چگونه Hue، رابط کاربری Hadoop، هنگام تجزیه و تحلیل داده ها از HiveQL استفاده کند. با استفاده از گزینه تازه پیکربندی شده، سپس نحوه بارگذاری داده ها، ایجاد جداول تجمیعی برای دسترسی سریع به پرس و جو و اجرای تجزیه و تحلیل پیشرفته را نشان می دهد. او همچنین شما را از طریق مدیریت جداول و استفاده از توابع راهنمایی می کند. این دوره برای کمک به شما در یافتن روش های جدید برای کار با مجموعه داده ها طراحی شده است تا بتوانید به س questionsالات سخت علم داده که سر راه شما می آید پاسخ دهید.
اهداف یادگیری
تعریف ساختار داده در Hive
انتخاب داده ها
پیوستن به جداول
دستکاری داده ها
فیلتر کردن نتایج
تجمیع داده ها
استفاده از توابع تجمعی داخلی
تسلط بر توابع تولید جدول
با استفاده از CUBE و ROLLUP
استفاده از بندها: WHERE and HAVING
با استفاده از LIKE، JOIN و SEMI JOIN
استفاده از توابع: رشته، ریاضی، تاریخ و شرطی
این دوره نحوه استفاده از Hive برای پردازش داده ها را نشان می دهد. مربی بن سالینز با نشان دادن نحوه ساختار و بهینه سازی داده های خود شروع می کند. در مرحله بعد، او توضیح می دهد که چگونه Hue، رابط کاربری Hadoop، هنگام تجزیه و تحلیل داده ها از HiveQL استفاده کند. با استفاده از گزینه تازه پیکربندی شده، سپس نحوه بارگذاری داده ها، ایجاد جداول تجمیعی برای دسترسی سریع به پرس و جو و اجرای تجزیه و تحلیل پیشرفته را نشان می دهد. او همچنین شما را از طریق مدیریت جداول و استفاده از توابع راهنمایی می کند. این دوره برای کمک به شما در یافتن روش های جدید برای کار با مجموعه داده ها طراحی شده است تا بتوانید به س questionsالات سخت علم داده که سر راه شما می آید پاسخ دهید.
اهداف یادگیری
تعریف ساختار داده در Hive
انتخاب داده ها
پیوستن به جداول
دستکاری داده ها
فیلتر کردن نتایج
تجمیع داده ها
استفاده از توابع تجمعی داخلی
تسلط بر توابع تولید جدول
با استفاده از CUBE و ROLLUP
استفاده از بندها: WHERE and HAVING
با استفاده از LIKE، JOIN و SEMI JOIN
استفاده از توابع: رشته، ریاضی، تاریخ و شرطی
مهارت ها
HiveData EngineeringProjectData Science
سرفصل ها
0. مقدمه
- 01 - خوش آمدید
- 02 - آنچه باید قبل از تماشای این دوره بدانید
- 03 - استفاده از فایلهای تمرین
1. مفاهیم کندو و راه اندازی
- 04 - چرا از Hive استفاده کنید
- 05 - کندو چگونه کار میکند
- 06 - راهاندازی محیط آزمایشی ما
2. کار با دادهها در Hive
- 07 - درک ساختار جدول در Hive
- 08 - ایجاد جداول در Hive
- 09 - مدیریت فایلهای CSV در Hive
- 10 - جداول پارتیشن بندی
3. بازیابی دادهها از Hive
- 11 - عبارت SELECT ساده
- 12 - بازیابی دادهها از ساختارهای پیچیده
4. جمعآوری داده ها
- 13 - تجمعات ساده
- 14 - تجمیعهای پیشرفته با مجموعههای گروه بندی
- 15 - استفاده از CUBE و ROLLUP
5. فیلتر کردن نتایج
- 16 - فیلتر ساده با عبارت WHERE
- 17 - فیلتر کردن مصالح با بند HAVING
- 18 - یافتن مقادیر مشابه با LIKE
6. پیوستن به جداول
- 19 - ترکیب جداول با JOIN
- 20 - زمان استفاده از SEMI JOIN
- 21 - پیوستن چند جدول به یکدیگر
7. دستکاری داده ها
- 22 - انواع توابع دستکاری داده ها
- 23 - توابع رشته
- 24 - توابع ریاضی
- 25 - توابع تاریخ
- 26 - توابع شرطی
نتیجه
- 27 - مراحل بعدی