دوره آموزشی مقدمه ای بر Spark SQL و DataFrames
1 ساعت 53 دقیقهمتوسط2019-05-30
مدرسین

Dan Sullivan
Enterprise Architect, Big Data Expert
جزئیات دوره
DataFrames، یک ساختار داده پرکاربرد در Apache Spark را کاوش کنید. DataFrames به توسعه دهندگان Spark اجازه می دهد تا عملیات داده های رایج مانند فیلتر کردن و تجمیع و همچنین تجزیه و تحلیل داده های پیشرفته را روی مجموعه های بزرگ داده های توزیع شده انجام دهند. با اضافه شدن Spark SQL، توسعه دهندگان به زبان جستجوی محبوب تر و قدرتمندتر از DataFrames API داخلی دسترسی دارند. در این دوره، مدرس دن سالیوان نحوه انجام عملیات اساسی - بارگیری، فیلتر کردن، و جمع آوری داده ها در DataFrames - با API و SQL و همچنین تکنیک های پیشرفته تری را که به راحتی در SQL انجام می شود را نشان می دهد. در این بخش از دوره، Dan نحوه اتصال داده ها، حذف موارد تکراری و مقابله با مقادیر null یا NA را توضیح می دهد. دروس با سه مثال عمیق از استفاده از DataFrames برای علم داده به پایان می رسد: تجزیه و تحلیل داده های اکتشافی، تجزیه و تحلیل سری های زمانی، و یادگیری ماشین.
اهداف یادگیری
نصب Spark و PySpark
راه اندازی یک نوت بوک Jupyter
بارگذاری داده ها در DataFrames
فیلتر کردن، جمع آوری و ذخیره داده ها
پرس و جو و اصلاح DataFrames با SQL
تجزیه و تحلیل داده های اکتشافی
یادگیری اصولی ماشینی
اهداف یادگیری
نصب Spark و PySpark
راه اندازی یک نوت بوک Jupyter
بارگذاری داده ها در DataFrames
فیلتر کردن، جمع آوری و ذخیره داده ها
پرس و جو و اصلاح DataFrames با SQL
تجزیه و تحلیل داده های اکتشافی
یادگیری اصولی ماشینی
مهارت ها
Apache SparkApacheSQLDatabase AdministrationIntroduction toData EngineeringDatabase DevelopmentDatabase ManagementData AnalysisProgramming LanguagesData ScienceBusiness Analysis and StrategyBusiness Software and ToolsOpen SourceSoftware Development
سرفصل ها
0. مقدمه
- 01 - Apache Spark SQL و تجزیه و تحلیل داده ها
- 02 - آنچه باید بدانید
1. مقدمه ای بر Spark DataFrames
- 03 - مقدمه ای بر DataFrames
- 04 - SQL برای DataFrames
2. نصب Spark
- 05 - Spark را نصب کنید
- 06 - PySpark را نصب کنید
- 07 - استفاده از نوت بوک های Jupyter با PySpark
3. شروع به کار با Spark DataFrames
- 08 - یک دفترچه یادداشت Jupyter راه اندازی کنید
- 09 - بارگذاری داده ها در DataFrames - فایل های CSV
- 10 - بارگذاری داده ها در DataFrames - فایل های JSON
- 11 - عملیات Basic DataFrame
- 12 - فیلتر کردن داده ها با DataFrame API
- 13 - داده ها را با DataFrame API جمع کنید
- 14 - نمونه داده ها از DataFrames
- 15 - داده ها را از DataFrames ذخیره کنید
4. SQL برای DataFrames
- 16 - Querying DataFrames با SQL
- 17 - فیلتر کردن DataFrame با SQL
- 18 - جمع آوری داده ها با SQL
- 19 - اتصال DataFrame با SQL
- 20 - حذف موارد تکراری در DataFrames
- 21 - کار با مقادیر NA در DataFrames
5. تجزیه و تحلیل داده ها با اسپارک
- 22 - تجزیه و تحلیل داده های اکتشافی با DataFrames
- 23 - تجزیه و تحلیل داده های اکتشافی با Spark SQL
- 24 - تجزیه و تحلیل سری های زمانی با DataFrames
- 25 - یادگیری ماشینی اولیه با DataFrames، قسمت 1
- 26 - یادگیری ماشینی اولیه با DataFrames، قسمت 2
نتیجه
- 27 - مراحل بعدی
دوره های مرتبط
- دوره آموزشی یادگیری جامع اسکالا برای علوم داده
- دوره آموزشی DataOps با Apache Iceberg با استفاده از Spark، Nessie و Dremio
- دوره آموزشی Cloud Hadoop: پیمایش آپاچی اسپارک
- دوره آموزشی یادگیری جامع Azure Spark Databricks
- دوره آموزشی تحلیل دادههای کلان با Hadoop و Apache Spark
- دوره آموزشی پلتفرمهای داده: از Spark تا Snowflake
- دوره آموزشی آمادگی گواهینامه Databricks Certified Data Engineer Associate: بخش دوم ELT با Spark SQL و Python
- دورهی آموزشی مقدماتی آپاچی اسپارک: مهندسی دادههای بزرگ