دوره آموزشی ریاضیات بنیادین برای هوش مصنوعی مولدی: درک مدل‌های زبان بزرگ (LLM) و ترنسفورماتورها از طریق کاربردهای عملی

جزئیات دوره

رازهای پشت مدل‌هایی که برنامه‌های پیشرفته‌ هوش مصنوعی امروز را قدرت می‌بخشند، کشف کنید. در این دوره، مربی آکسل سیروتا شما را فراتر از صرف استفاده از مدل‌های زبان بزرگ (LLMs) مانند BERT یا GPT می‌برد و مبانی ریاضی هوش مصنوعی تولیدی را توضیح می‌دهد. چالش تحلیل احساسات با استفاده از شبکه‌های عصبی بازگشتی ساده (RNNs) را بررسی کنید و به تدریج رویکرد خود را پیشرفته‌تر کنید، همانطور که درک عمیقی از مکانیزم‌های توجه، ترنسفورمرها و مدل‌ها پیدا می‌کنید. از طریق توضیحات بصری و تمرینات عملی کدنویسی، آکسل توضیح می‌دهد که چرا مکانیزم‌های توجه باعث انقلاب در پردازش زبان طبیعی شدند و چگونه ترنسفورمرها با حذف نیاز به RNNs، این حوزه را متحول کردند. در طول دوره، نکاتی برای تنظیم مدل‌های پیش‌آموزش داده‌شده، اعمال تکنیک‌های پیشرفته مانند Adaptation کم‌رتبه (LoRA)، و استفاده از مهارت‌های جدید به دست آمده برای ساخت مدل‌های هوشمندتر و کارآمدتر و نوآوری در دنیای سریع‌التحول هوش مصنوعی خواهید یافت.

اهداف یادگیری:
✅ درک شهودی LLMها و ترنسفورمرها: درک شهودی از نحوه و دلایل عملکرد LLMها و ترنسفورمرها
✅ تحلیل تکامل مکانیزم‌های توجه: یادگیری چگونگی تکامل مکانیزم‌های توجه برای حل مشکلات اصلی مدل‌های مبتنی بر RNN
✅ مدل تحلیل احساسات: توسعه یک مدل تحلیل احساسات با استفاده از TensorFlow، Keras و DistilBERT از Hugging Face
✅ تقویت مدل‌ها با بینش ریاضی: بهبود مدل‌ها به طور تدریجی با استفاده از بینش‌های ریاضی در کد، از Word Embeddings تا مکانیزم‌های توجه و لایه‌های ترنسفورمر
✅ استفاده از تجسم‌ها: استفاده از تجسم‌ها برای درک چگونگی کارکرد مکانیزم‌های توجه و بهینه‌سازی در مدل‌ها

سرفصل ها

0. مقدمه

01 - مقدمه ای بر ریاضیات پایه برای هوش مصنوعی مولد
02 - بیشترین بهره را از این دوره ببرید
03 - بررسی نسخه

1. مقدمه ای بر ریاضی برای GenAI و مبانی توجه

04 - چرا LLM و توجه مهم است
05 - RNN‌ها و مشکل تنگنای زمینه
06 - دمو - ساخت یک مدل RNN ساده برای تحلیل احساسات
07 - مقدمه ای بر توجه - راه حل بهداناو
08 - نسخه ی نمایشی - توجه به یک مدل RNN
09 - راه حل - توجه بهداناو را اجرا کنید

2. ترانسفورماتورها - حذف RNN‌ها برای مدل‌های کارآمدتر

10 - از RNN تا ترانسفورماتور
11 - درک خود توجهی در ترانسفورماتورها
12 - توجه چند سر و رمزگذاری موقعیتی
13 - ساخت مدل ترانسفورماتور برای تحلیل احساسات
14 - راه حل - انکودر ترانسفورماتور دو لایه بسازید

3. شیرجه عمیق به LLM و مدل Fine-Tuning

15 - سه نوع LLM
16 - مدل‌های ویژه فقط رسیور
17 - توضیح مدل‌های فقط رمزگذار مانند BERT
18 - تنظیم دقیق DistilBERT برای تجزیه‌و‌تحلیل احساسات
19 - ماسک‌های توجه در ترانسفورماتورها
20 - راه حل - کنایه و موضع آب‌و‌هوا را در TweetEval تشخیص دهید

نتیجه گیری

21 - خلاصه دوره و مراحل بعدی

دوره آموزشی ریاضیات بنیادین برای هوش مصنوعی مولدی: درک مدل‌های زبان بزرگ (LLM) و ترنسفورماتورها از طریق کاربردهای عملی

مدرسین

Axel Sirota