دوره آموزشی سریعتر pandas
1 ساعت 25 دقیقهپیشرفته2020-11-18
مدرسین

Miki Tebeka
CEO at 353Solutions
جزئیات دوره
دانشمندان داده اغلب pandas را ترجیح میدهند، زیرا به آنها امکان میدهد با مقادیر بیشتری از دادهها به طور موثر کار کنند - کیفیتی مفید با بزرگتر و بزرگتر شدن مجموعه داده ها. در این دوره، مربی Miki Tebeka به شما نشان میدهد که چگونه سرعت و کارایی کد pandas خود را بهبود ببخشید. ابتدا، او توضیح میدهد که چرا عملکرد مهم است و چگونه میتوانید آن را با نمایههای پایتون اندازه بگیرید. سپس، دوره به شما میآموزد که چگونه با استفاده از بردار برای دستکاری دادهها استفاده کنید. این دوره همچنین برخی از اشتباهات رایج و چگونگی رفع آنها را مرور میکند.
پایتون و pandas توابع داخلی با عملکرد بالا دارند و او نحوه استفاده از آنها را پوشش میدهد. Pandas میتواند از حافظه زیادی استفاده کند، بنابراین او نکات خوبی در مورد نحوه ذخیرهسازی حافظه ارائه میدهد. این دوره نحوه سریالسازی دادهها با SQL و HDF5 را نشان میدهد. سپس در مورد چگونگی سرعت بخشیدن به کد شما با Numba و Cython صحبت میکند. فریمهای داده جایگزین نیز میتوانند سرعت کد شما را افزایش دهند، و از طریق برخی گزینهها گام برمی دارد. به علاوه، در چند منبع اضافی کاوش کنید که میتوانید بررسی کنید.
پایتون و pandas توابع داخلی با عملکرد بالا دارند و او نحوه استفاده از آنها را پوشش میدهد. Pandas میتواند از حافظه زیادی استفاده کند، بنابراین او نکات خوبی در مورد نحوه ذخیرهسازی حافظه ارائه میدهد. این دوره نحوه سریالسازی دادهها با SQL و HDF5 را نشان میدهد. سپس در مورد چگونگی سرعت بخشیدن به کد شما با Numba و Cython صحبت میکند. فریمهای داده جایگزین نیز میتوانند سرعت کد شما را افزایش دهند، و از طریق برخی گزینهها گام برمی دارد. به علاوه، در چند منبع اضافی کاوش کنید که میتوانید بررسی کنید.
مهارت ها
pandasPythonData AnalysisData ScienceBusiness Analysis and StrategyBusiness Software and ToolsOpen SourceOne-Off
سرفصل ها
0. مقدمه
- 01 - پانداها و عملکرد
- 02 - آنچه باید بدانید
- 03 - کار با فایلها در GitHub
1. بررسی اجمالی
- 04 - چرا عملکرد مهم است
- 05 - تعیین اهداف
- 06 - اندازهگیری عملکرد
- 07 - پروفایل
- 08 - چالش - گلوگاه را شناسایی کنید
- 09 - راه حل - گلوگاه را شناسایی کنید
2. برداری
- 10 - برداری چیست
- 11 - پروفایل سازی بولی
- 12 - درک Ufuncs
- 13 - چالش - انتخاب و دستکاری داده ها
- 14 - راه حل - انتخاب و دستکاری داده ها
3. اشتباهات رایج
- 15 - محدودیتهای الحاق
- 16 - محدودیتهای شی dtype
- 17 - محدودیتهای تکرار ردیف
- 18 - درک تابع isin
- 19 - زمان تجزیه یک بار
- 20 - چالش - یک DataFrame را کوئری کنید
- 21 - راه حل - یک DataFrame را کوئری کنید
4. عملکرد پانداها
- 22 - استفاده از توابع داخلی
- 23 - درک eval و query
- 24 - درک تابع join
- 25 - چالش - بپیوندید و کوئری کنید
- 26 - راه حل - بپیوندید و کوئری کنید
5. صرفهجویی در حافظه
- 27 - چرا حافظه مهم است
- 28 - اندازهگیری حافظه
- 29 - بارگذاری بخشهایی از داده ها
- 30 - دادههای طبقه بندی شده
- 31 - چالش - کاهش حافظه
- 32 - راه حل - کاهش حافظه
6. سریال سازی سریع
- 33 - فرمتهای مختلف و چرا CSV نیست
- 34 - بهینهسازی با SQL
- 35 - بهینهسازی با HDF5
- 36 - چالش - مدت زمان دوچرخه سواری
- 37 - راه حل - مدت زمان دوچرخه سواری
7. Numba و Cython
- 38 - Numba چیست
- 39 - استفاده از Numba
- 40 - Cython چیست
- 41 - نوشتن کد Cython
- 42 - کامپایل Cython
- 43 - جادوی سیتون
- 44 - چالش - افزایش سرعت Cython
- 45 - راه حل - افزایش سرعت Cython
8. DataFrames جایگزین
- 46 - مروری بر DataFrameهای جایگزین
- 47 - استفاده از Dask
- 48 - استفاده از Vaex
- 49 - چالش - Vaex در مقابل پانداها
- 50 - راه حل - Vaex در مقابل پانداها
نتیجه
- 51 - مراحل بعدی
دوره های مرتبط
- دوره آموزشی مبانی هوش مصنوعی: شبکه های عصبی
- دوره آموزشی راهنمای کامل مهندسی تحلیل دادهها
- دوره آموزشی پیشرفته Pandas
- دوره آموزشی پایتون پیشرفته: بهترین ابزارها برای علم داده و مهندسی
- دوره آموزشی یادگیری عمیق و هوش مصنوعی مولد: آمادهسازی دادهها، تحلیل و تجسم با پایتون
- دوره آموزشی تحلیل دادهها با پایتون و پانداس
- دوره آموزشی از pandas به Polars
- دوره آموزشی یادگیری جامع pandas