دوره آموزشی ریاضیات بنیادین برای هوش مصنوعی مولدی: درک مدلهای زبان بزرگ (LLM) و ترنسفورماتورها از طریق کاربردهای عملی
2 ساعت 59 دقیقهمتوسط2025-02-03
مدرسین

Axel Sirota
جزئیات دوره
رازهای پشت مدلهایی که برنامههای پیشرفته هوش مصنوعی امروز را قدرت میبخشند، کشف کنید. در این دوره، مربی آکسل سیروتا شما را فراتر از صرف استفاده از مدلهای زبان بزرگ (LLMs) مانند BERT یا GPT میبرد و مبانی ریاضی هوش مصنوعی تولیدی را توضیح میدهد. چالش تحلیل احساسات با استفاده از شبکههای عصبی بازگشتی ساده (RNNs) را بررسی کنید و به تدریج رویکرد خود را پیشرفتهتر کنید، همانطور که درک عمیقی از مکانیزمهای توجه، ترنسفورمرها و مدلها پیدا میکنید. از طریق توضیحات بصری و تمرینات عملی کدنویسی، آکسل توضیح میدهد که چرا مکانیزمهای توجه باعث انقلاب در پردازش زبان طبیعی شدند و چگونه ترنسفورمرها با حذف نیاز به RNNs، این حوزه را متحول کردند. در طول دوره، نکاتی برای تنظیم مدلهای پیشآموزش دادهشده، اعمال تکنیکهای پیشرفته مانند Adaptation کمرتبه (LoRA)، و استفاده از مهارتهای جدید به دست آمده برای ساخت مدلهای هوشمندتر و کارآمدتر و نوآوری در دنیای سریعالتحول هوش مصنوعی خواهید یافت.
اهداف یادگیری:
✅ درک شهودی LLMها و ترنسفورمرها: درک شهودی از نحوه و دلایل عملکرد LLMها و ترنسفورمرها
✅ تحلیل تکامل مکانیزمهای توجه: یادگیری چگونگی تکامل مکانیزمهای توجه برای حل مشکلات اصلی مدلهای مبتنی بر RNN
✅ مدل تحلیل احساسات: توسعه یک مدل تحلیل احساسات با استفاده از TensorFlow، Keras و DistilBERT از Hugging Face
✅ تقویت مدلها با بینش ریاضی: بهبود مدلها به طور تدریجی با استفاده از بینشهای ریاضی در کد، از Word Embeddings تا مکانیزمهای توجه و لایههای ترنسفورمر
✅ استفاده از تجسمها: استفاده از تجسمها برای درک چگونگی کارکرد مکانیزمهای توجه و بهینهسازی در مدلها
اهداف یادگیری:
✅ درک شهودی LLMها و ترنسفورمرها: درک شهودی از نحوه و دلایل عملکرد LLMها و ترنسفورمرها
✅ تحلیل تکامل مکانیزمهای توجه: یادگیری چگونگی تکامل مکانیزمهای توجه برای حل مشکلات اصلی مدلهای مبتنی بر RNN
✅ مدل تحلیل احساسات: توسعه یک مدل تحلیل احساسات با استفاده از TensorFlow، Keras و DistilBERT از Hugging Face
✅ تقویت مدلها با بینش ریاضی: بهبود مدلها به طور تدریجی با استفاده از بینشهای ریاضی در کد، از Word Embeddings تا مکانیزمهای توجه و لایههای ترنسفورمر
✅ استفاده از تجسمها: استفاده از تجسمها برای درک چگونگی کارکرد مکانیزمهای توجه و بهینهسازی در مدلها
مهارت ها
Natural Language Processing (NLP)Generative AIData AnalysisArtificial Intelligence (AI)Data ScienceBusiness Analysis and StrategyBusiness Software and ToolsOne-Off
سرفصل ها
0. مقدمه
- 01 - مقدمه ای بر ریاضیات پایه برای هوش مصنوعی مولد
- 02 - بیشترین بهره را از این دوره ببرید
- 03 - بررسی نسخه
1. مقدمه ای بر ریاضی برای GenAI و مبانی توجه
- 04 - چرا LLM و توجه مهم است
- 05 - RNNها و مشکل تنگنای زمینه
- 06 - دمو - ساخت یک مدل RNN ساده برای تحلیل احساسات
- 07 - مقدمه ای بر توجه - راه حل بهداناو
- 08 - نسخه ی نمایشی - توجه به یک مدل RNN
- 09 - راه حل - توجه بهداناو را اجرا کنید
2. ترانسفورماتورها - حذف RNNها برای مدلهای کارآمدتر
- 10 - از RNN تا ترانسفورماتور
- 11 - درک خود توجهی در ترانسفورماتورها
- 12 - توجه چند سر و رمزگذاری موقعیتی
- 13 - ساخت مدل ترانسفورماتور برای تحلیل احساسات
- 14 - راه حل - انکودر ترانسفورماتور دو لایه بسازید
3. شیرجه عمیق به LLM و مدل Fine-Tuning
- 15 - سه نوع LLM
- 16 - مدلهای ویژه فقط رسیور
- 17 - توضیح مدلهای فقط رمزگذار مانند BERT
- 18 - تنظیم دقیق DistilBERT برای تجزیهوتحلیل احساسات
- 19 - ماسکهای توجه در ترانسفورماتورها
- 20 - راه حل - کنایه و موضع آبوهوا را در TweetEval تشخیص دهید
نتیجه گیری
- 21 - خلاصه دوره و مراحل بعدی
دوره های مرتبط
- دوره آموزشی RAG، اپهای هوش مصنوعی و عوامل هوش مصنوعی برای امنیت سایبری و شبکهها
- دوره آموزشی ساخت چتباتهای سفارشی با n8n
- دوره آموزشی هوش مصنوعی عملی: ساخت اولین چتبات مکالمهای خودت
- دوره آموزشی ساخت برنامههای ارزیابی LLM با LangChain
- دوره آموزشی یادگیری اصولی GraphRAG
- دوره آموزشی راهنمای کامل ارزیابی مدلهای زبان بزرگ (LLMها)
- دوره آموزشی هوش مصنوعی عملی: ساخت چتبات هوش مصنوعی با GPT-4o و Next.js
- دوره آموزشی هوش مصنوعی عملی: ساخت GPT اختصاصی خودتان