دوره آموزشی Web Scraping با پایتون

دوره آموزشی Web Scraping با پایتون

⏱️ 1 ساعت 24 دقیقه📈 متوسط📅 2020-12-15

مدرسین

Ryan Mitchell

Ryan Mitchell

Senior Software Engineer at GLG

جزئیات دوره

مربی Ryan Mitchell روش web scraping را با استفاده از زبان برنامه نویسی پایتون آموزش می‌دهد. او به شما کمک می‌کند بفهمید که یک انسان در حال مرور وب با یک web scraper متفاوت است. وی ابزارهای توسعه دهنده Chrome و نحوه استفاده از آنها برای بررسی تماس‌های شبکه را معرفی می‌کند. او به شما نحوه نصب Scrapy با pip و نحوه نوشتن چند کد `Hello، World` برای scrape یک صفحه وب ساده را به شما نشان می‌دهد. وی نحوه استفاده از Scrapy LinkExtractor را برای یافتن پیوندهای داخلی در یک صفحه وب ارائه می‌دهد، سپس نحوه پیکربندی Scrapy و ItemPipeline را برای نوشتن داده‌ها در قالب‌های مختلف فایل نشان می‌دهد. او بهترین روش‌ها را برای سازماندهی پروژه‌های شما، نوشتن تجزیه کننده‌های قابل استفاده مجدد و اثبات آینده spiders‌ها به شما معرفی می‌کند. وی نحوه کارکرد API‌ها و نحوه استفاده از آنها برای بازیابی مستقیم داده‌ها را توضیح می‌دهد. او headers‌ها و کوکی‌ها را جستجو می‌کند، سپس به اتوماسیون مرورگر و نحوه ادغام Selenium با Scrapy می‌پردازد. در پایان، او ایده‌هایی برای ادامه تحصیل در علوم کامپیوتر و تفکر خلاقانه در مورد اتوماسیون ارائه می‌دهد.

مهارت ها

PythonProgramming LanguagesOpen SourceSoftware DevelopmentOne-Off

سرفصل ها

0. مقدمه

  • 01-چگونه یاد بگیریم که نگران نباشیم و ربات را دوست داشته باشیم
  • 02-آنچه باید بدانید

1. اسکرپینگ پایه وب

  • 03- وب اسکرپینگ چیست
  • 04-چگونه اینترنت کار می کند - خلاصه ای کوتاه
  • 05-سلام دنیا با اسکرپی
  • 06-چالش - خراش دادن تمام داده ها در یک صفحه
  • 07-راه حل - خراش دادن تمام داده ها در یک صفحه

2. یادگیری خزیدن

  • 08- خزیدن در یک وب سایت
  • 09-ضبط داده ها
  • 10-فایل تنظیمات Scrapy
  • 11- ساختار اسکراپرهای خود را برای توسعه پذیری_قابلیت استفاده مجدد
  • 12-چالش - خراش دادن سایت های خبری
  • 13-راه حل - خراش دادن سایت های خبری

3. تکنیک های پیشرفته

  • 14-ارائه فرم
  • 15- یافتن و استفاده از API های مخفی
  • 16-نقشه های سایت و robots.txt
  • 17-چالش - استفاده از نقشه سایت CNN
  • 18-راه حل - با استفاده از نقشه سایت CNN

4. بازیگری انسان

  • 19-ورود به سیستم
  • 20- اتوماسیون مرورگر با سلنیوم
  • 21- تعامل با یک صفحه

نتیجه

  • 22- مراحل بعدی

مشاهده دوره کامل

رفتن به دوره