دوره آموزشی هوش مصنوعی مولد: کار با مدل های زبان بزرگ

دوره آموزشی هوش مصنوعی مولد: کار با مدل های زبان بزرگ

⏱️ 1 ساعت 22 دقیقه📈 پیشرفته📅 2025-03-17

مدرسین

Jonathan Fernandes

Jonathan Fernandes

Consultant focusing on data science, AI, and big data

جزئیات دوره

ترانسفورماتورها به سرعت به معماری مورد استفاده برای پردازش زبان طبیعی (NLP) تبدیل شده اند. در نتیجه، دانستن نحوه استفاده از آنها اکنون یک مهارت حیاتی در جعبه ابزار هوش مصنوعی شما است. در این دوره، مربی جاناتان فرناندز شما را در بسیاری از مدل‌های کلیدی زبان توسعه یافته از زمان GPT-3 راهنمایی می‌کند. او یک نمای کلی از GLaM، Megatron-Turing NLG، Gopher، Chinchilla، PalM، OPT و BLOOM ارائه می‌کند و برخی از مهم‌ترین بینش‌ها را از هر مدل ارائه می‌کند.
یک نمای کلی در سطح بالا از مدل های زبان بزرگ، مکان و نحوه استفاده از آنها در تولید، و چرایی اهمیت آنها برای NLP دریافت کنید. علاوه بر این، اصول یادگیری انتقال و آموزش ترانسفورماتور را برای بهینه سازی مدل های هوش مصنوعی خود در حین حرکت کشف کنید. در پایان این دوره، از آنچه که از زمان انتشار OpenAI برای اولین بار GPT-3 و همچنین مشارکت های کلیدی هر یک از این مدل های زبان بزرگ رخ داده است، مطلع خواهید شد.

مهارت ها

Natural Language Processing (NLP)AdvancedGenerative AIArtificial Intelligence (AI)

سرفصل ها

0. مقدمه

  • 01 - یادگیری در مورد مدل‌های زبان بزرگ

1. ترانسفورماتورها در NLP

  • 02 - مدل‌های زبان بزرگ چیست
  • 03 - ترانسفورماتور در حال تولید
  • 04 - ترانسفورماتورها - تاریخچه

2. آموزش ترانسفورماتورها و معماری آنها

  • 05 - آموزش انتقال
  • 06 - ترانسفورماتور - نمای کلی معماری
  • 07 - توجه به خود
  • 08 - توجه چند سر و شبکه فید فوروارد

3. مدل‌های زبان بزرگ

  • 09 - GPT-3
  • 10 - موارد استفاده GPT-3
  • 11 - چالش‌ها و کاستی‌های GPT-3
  • 12 - GLaM
  • 13 - مدل NLG Megatron-Turing
  • 14 - گوفر
  • 15 - قوانین مقیاس بندی
  • 16 - چینچیلا
  • 17 - نیمکت بزرگ
  • 18 - کف دست
  • 19 - OPT و BLOOM
  • 20 - مدل‌های GitHub
  • 21 - دسترسی به مدل‌های زبان بزرگ با استفاده از یک API
  • 22 - زمان استنباط در مقابل قبل از آموزش

نتیجه گیری

  • 23 - با ترانسفورمرز جلوتر بروید

مشاهده دوره کامل

رفتن به دوره