تخفیف ویژه همین الان — دوره‌های تخفیف‌دار را ببینید.
روز
:
ساعت
:
دقیقه
:
ثانیه
تخفیف‌های ویژه
دوره آموزشی مقدمه ای بر Spark SQL و DataFrames

دوره آموزشی مقدمه ای بر Spark SQL و DataFrames

1 ساعت 53 دقیقهمتوسط2019-05-30

مدرسین

Dan Sullivan

Dan Sullivan

Enterprise Architect, Big Data Expert

جزئیات دوره

DataFrames، یک ساختار داده پرکاربرد در Apache Spark را کاوش کنید. DataFrames به توسعه دهندگان Spark اجازه می دهد تا عملیات داده های رایج مانند فیلتر کردن و تجمیع و همچنین تجزیه و تحلیل داده های پیشرفته را روی مجموعه های بزرگ داده های توزیع شده انجام دهند. با اضافه شدن Spark SQL، توسعه دهندگان به زبان جستجوی محبوب تر و قدرتمندتر از DataFrames API داخلی دسترسی دارند. در این دوره، مدرس دن سالیوان نحوه انجام عملیات اساسی - بارگیری، فیلتر کردن، و جمع آوری داده ها در DataFrames - با API و SQL و همچنین تکنیک های پیشرفته تری را که به راحتی در SQL انجام می شود را نشان می دهد. در این بخش از دوره، Dan نحوه اتصال داده ها، حذف موارد تکراری و مقابله با مقادیر null یا NA را توضیح می دهد. دروس با سه مثال عمیق از استفاده از DataFrames برای علم داده به پایان می رسد: تجزیه و تحلیل داده های اکتشافی، تجزیه و تحلیل سری های زمانی، و یادگیری ماشین.

اهداف یادگیری
نصب Spark و PySpark
راه اندازی یک نوت بوک Jupyter
بارگذاری داده ها در DataFrames
فیلتر کردن، جمع آوری و ذخیره داده ها
پرس و جو و اصلاح DataFrames با SQL
تجزیه و تحلیل داده های اکتشافی
یادگیری اصولی ماشینی

مهارت ها

Apache SparkApacheSQLDatabase AdministrationIntroduction toData EngineeringDatabase DevelopmentDatabase ManagementData AnalysisProgramming LanguagesData ScienceBusiness Analysis and StrategyBusiness Software and ToolsOpen SourceSoftware Development

سرفصل ها

0. مقدمه

  • 01 - Apache Spark SQL و تجزیه و تحلیل داده ها
  • 02 - آنچه باید بدانید

1. مقدمه ای بر Spark DataFrames

  • 03 - مقدمه ای بر DataFrames
  • 04 - SQL برای DataFrames

2. نصب Spark

  • 05 - Spark را نصب کنید
  • 06 - PySpark را نصب کنید
  • 07 - استفاده از نوت بوک های Jupyter با PySpark

3. شروع به کار با Spark DataFrames

  • 08 - یک دفترچه یادداشت Jupyter راه اندازی کنید
  • 09 - بارگذاری داده ها در DataFrames - فایل های CSV
  • 10 - بارگذاری داده ها در DataFrames - فایل های JSON
  • 11 - عملیات Basic DataFrame
  • 12 - فیلتر کردن داده ها با DataFrame API
  • 13 - داده ها را با DataFrame API جمع کنید
  • 14 - نمونه داده ها از DataFrames
  • 15 - داده ها را از DataFrames ذخیره کنید

4. SQL برای DataFrames

  • 16 - Querying DataFrames با SQL
  • 17 - فیلتر کردن DataFrame با SQL
  • 18 - جمع آوری داده ها با SQL
  • 19 - اتصال DataFrame با SQL
  • 20 - حذف موارد تکراری در DataFrames
  • 21 - کار با مقادیر NA در DataFrames

5. تجزیه و تحلیل داده ها با اسپارک

  • 22 - تجزیه و تحلیل داده های اکتشافی با DataFrames
  • 23 - تجزیه و تحلیل داده های اکتشافی با Spark SQL
  • 24 - تجزیه و تحلیل سری های زمانی با DataFrames
  • 25 - یادگیری ماشینی اولیه با DataFrames، قسمت 1
  • 26 - یادگیری ماشینی اولیه با DataFrames، قسمت 2

نتیجه

  • 27 - مراحل بعدی

دوره های مرتبط

مسیرهای مرتبط

درباره ما

لینداکده یک بستر یادگیری پیشرو است که به افراد کمک می کند تا کسب و کار ، نرم افزار ، فناوری و مهارت‌های خلاقانه را برای دستیابی به اهداف شخصی و حرفه ای بیاموزد.

شماره تلفنکانال آپاراتپشتیبانی تلگرامکانال تلگرامپیج اینستاگرام

کلیه‌ی حقوق این سایت متعلق به لینداکده می باشد

قوانین و شرایط|حریم خصوصی

نماد الکترونیک enamad در صورت اتصال با آی‌پی داخل کشور، نمایش داده خواهد شد.
logo-samandehi - لوگو ساماندهی
zarinpal
zibal