دوره آموزشی Hadoop برای نکات، ترفندها و تکنیک های علم داده
1 ساعت 12 دقیقهمتوسط2017-07-18
مدرسین

Ben Sullins
Data Geek, Tech Consultant
جزئیات دوره
Hadoop - پلت فرم فوق العاده محبوب داده های بزرگ - مجموعه وسیعی از قابلیت ها را ارائه می دهد که به دانشمندان داده کمک می کند تا بینش خود را ارائه دهند. در این دوره، بن سالینز با به اشتراک گذاشتن یک سری نکات و ترفندها برای انجام کارهای علم داده در این پلتفرم قدرتمند، به شما کمک می کند تا با Hadoop سرعت بگیرید. او کار خود را با نحوه کار با داده های Hadoop در HDFS آغاز می کند و سپس با استفاده از Hive - موتور Hadoop SQL - که در آن کارهای علم داده بسیار اتفاق می افتد، کاوش می کند. برای تکمیل دوره، بن تکنیک هایی را برای اجرای سریع پرس و جوها در موتور Hive پوشش می دهد.
اهداف یادگیری
توضیح دهید که کدام دستورات برای ایجاد تغییرات در HDFS استفاده می شود.
دستوراتی را که برای بارگذاری داده ها از خط فرمان به HDFS استفاده می شود، شناسایی کنید.
تشخیص دو عملکردی که HDFS هنگام حرکت فایل ها توسط کاربر انجام می دهد.
نحوه حذف مجدد فایل ها در HDFS را خلاصه کنید.
نحوه انتخاب و پیاده سازی پارتیشن ها را به یاد بیاورید.
نحوه صاف کردن نوع داده Struct در HiveQL را توضیح دهید.
اهداف یادگیری
توضیح دهید که کدام دستورات برای ایجاد تغییرات در HDFS استفاده می شود.
دستوراتی را که برای بارگذاری داده ها از خط فرمان به HDFS استفاده می شود، شناسایی کنید.
تشخیص دو عملکردی که HDFS هنگام حرکت فایل ها توسط کاربر انجام می دهد.
نحوه حذف مجدد فایل ها در HDFS را خلاصه کنید.
نحوه انتخاب و پیاده سازی پارتیشن ها را به یاد بیاورید.
نحوه صاف کردن نوع داده Struct در HiveQL را توضیح دهید.
مهارت ها
HadoopApacheTips, Tricks, & TechniquesData EngineeringData Science
سرفصل ها
0. مقدمه
- 01 - خوش آمدید
- 02 - آنچه باید بدانید
- 03 - فایلهای تمرینی
- 04 - راهاندازی محیط
1. کار با فایل ها
- 05 - سازماندهی فایلها در HDFS
- 06 - فایلها را به HDFS آپلود کنید
- 07 - انتقال فایلها در HDFS
- 08 - فایلها را در HDFS حذف کنید
2. اتصال به Hadoop
- 09 - Hive را از طریق Beeline کاوش کنید
- 10 - از پایتون به Hive دسترسی پیدا کنید
- 11 - در Hive مجموعه ایجاد کنید
- 12 - پارتیشنها را در Hive انتخاب کنید
3. ساختارهای داده پیچیده در Hive
- 13 - دادههای نقشه در Hive
- 14 - آرایهها در Hive
- 15 - سازه در کندو
- 16 - میزهای مسطح برای ایمپالا ایجاد کنید
- 17 - کوئریهای ایمپالا را تجزیه کنید
نتیجه
- 18 - مراحل بعدی