دوره آموزشی آمادهسازی داده، مهندسی ویژگی و افزایش داده برای مدلهای هوش مصنوعی
1 ساعت 40 دقیقهمتوسط2025-06-10
مدرسین

Dan Sullivan
Enterprise Architect, Big Data Expert
جزئیات دوره
اگه دنبال اینی که بدونی چطوری واقعاً یه سیستم هوش مصنوعی قوی و قابل اجرا در محیط واقعی بسازی، این دورهی پیشرفته بهت کمک میکنه. استاد «دن سالیوان» که متخصص فضای ابری گوگل و نویسنده معتبر در حوزه دادهست، تو این دوره به عمق مهندسی داده برای هوش مصنوعی میره.
یاد میگیری چطوری دادهها رو آمادهسازی کنی، چه ساختارمند باشن (مثل جدولهای دیتابیس) چه بدون ساختار (مثل متن یا ویدیو). چیزایی مثل بررسی کیفیت داده، تبدیلشون به بردار، استفاده از کدگذاریهای مختلف و همه فرآیندهایی که لازمن تا یه سیستم هوش مصنوعی واقعاً خوب و دقیق کار کنه.
از اون مهمتر، یاد میگیری چطوری با تکنیکهایی مثل استخراج دانش، گرافهای دانش، دستهبندی مفهومی (taxonomy) و حتی دادهسازی مصنوعی، به هوش مصنوعیات "فهم" و "استدلال" اضافه کنی.
در بخش دیگهای از دوره هم بهت نشون میده چطوری کیفیت دادهها و مدلهات رو مانیتور کنی، از فریمورکهای اعتبارسنجی خودکار استفاده کنی و با متادیتاها کار کنی. خلاصه، همه چی برای اینکه یه سیستم هوش مصنوعی واقعی و قابل اتکا بسازی.
🎯 اهداف یادگیری:
آمادگی دادههای ساختاریافته و غیرساختاریافته برای استفاده در مدلهای مولد (Generative AI).
آشنایی با تکنیکهای تقویتی داده مثل:
RAG (تولید تقویتشده با بازیابی)
دادهسازی مصنوعی
تغییر متن (Text Perturbation)
غنیسازی با دانش
تبدیل دادههای متنی، تصویری یا ویدیویی به بردارهای عددی برای جستجوی معنایی (Semantic Search).
ارزیابی کیفیت دادهها و پیادهسازی ابزارهایی برای بررسی دقت و عملکرد مدلها در محیط واقعی.
یاد میگیری چطوری دادهها رو آمادهسازی کنی، چه ساختارمند باشن (مثل جدولهای دیتابیس) چه بدون ساختار (مثل متن یا ویدیو). چیزایی مثل بررسی کیفیت داده، تبدیلشون به بردار، استفاده از کدگذاریهای مختلف و همه فرآیندهایی که لازمن تا یه سیستم هوش مصنوعی واقعاً خوب و دقیق کار کنه.
از اون مهمتر، یاد میگیری چطوری با تکنیکهایی مثل استخراج دانش، گرافهای دانش، دستهبندی مفهومی (taxonomy) و حتی دادهسازی مصنوعی، به هوش مصنوعیات "فهم" و "استدلال" اضافه کنی.
در بخش دیگهای از دوره هم بهت نشون میده چطوری کیفیت دادهها و مدلهات رو مانیتور کنی، از فریمورکهای اعتبارسنجی خودکار استفاده کنی و با متادیتاها کار کنی. خلاصه، همه چی برای اینکه یه سیستم هوش مصنوعی واقعی و قابل اتکا بسازی.
🎯 اهداف یادگیری:
آمادگی دادههای ساختاریافته و غیرساختاریافته برای استفاده در مدلهای مولد (Generative AI).
آشنایی با تکنیکهای تقویتی داده مثل:
RAG (تولید تقویتشده با بازیابی)
دادهسازی مصنوعی
تغییر متن (Text Perturbation)
غنیسازی با دانش
تبدیل دادههای متنی، تصویری یا ویدیویی به بردارهای عددی برای جستجوی معنایی (Semantic Search).
ارزیابی کیفیت دادهها و پیادهسازی ابزارهایی برای بررسی دقت و عملکرد مدلها در محیط واقعی.
مهارت ها
Natural Language Processing (NLP)Business IntelligenceArtificial Intelligence FoundationsData AnalysisArtificial Intelligence (AI)Data ScienceBusiness Analysis and StrategyBusiness Software and ToolsOne-Off
سرفصل ها
۰. مقدمه
- 01 - به این دوره خوش آمدید
- 02 - آنچه باید بدانید
۱. آمادهسازی دادهها برای هوش مصنوعی پیشبینیکننده
- 03 - کاوش دادهها و ارزیابی اولیه کیفیت
- 04 - تشخیص و مدیریت دادههای از دست رفته
- 05 - تشخیص و مدیریت دادههای پرت
- 06 - چالش - ارزیابی کیفیت دادههای یک مجموعه داده
- 07 - راه حل - ارزیابی کیفیت دادههای یک مجموعه داده
- 08 - مهندسی ویژگی - مقیاسبندی و نرمالسازی دادهها
- 09 - مهندسی ویژگی - کدگذاریهای دستهبندیشده
- 10 - چالش - اعمال مهندسی ویژگی به یک مجموعه داده
- 11 - راه حل - اعمال مهندسی ویژگی به یک مجموعه داده
۲. آمادهسازی دادهها برای هوش مصنوعی مولد
- 12 - دادههای ساختاریافته در مقابل دادههای بدون ساختار
- 13 - نمایش برداری دادههای بدون ساختار
- 14 - ابزارهایی برای تولید نمایشهای برداری
- 15 - شباهت بین نمایشهای برداری
- 16 - چالش - انتخاب ابزار تولید بردار
- 17 - راه حل - انتخاب ابزار تولید بردار
۳. ارزیابی کیفیت دادهها
- 18- عناصر کیفیت دادهها - ثبات، دقت و کامل بودن
- 19- تکنیکهای آماری برای ارزیابی کیفیت دادهها
- 20- چالش - کیفیت دادهها
- 21- راهکار - کیفیت دادهها
۴. افزایش داده برای هوش مصنوعی مولد
- 22- مروری بر افزایش داده
- 23 - آشفتگی متن و انتقال سبک
- 24 - تولید افزودهشده با بازیابی (RAG)
- 25- مقدمهای بر LangChain برای RAG
- 26- چالش - درک اجزای RAG
- 27- راه حل - درک اجزای RAG
۵. افزایش دانش برای هوش مصنوعی مولد
- 28- مروری بر افزایش دانش
- 29 - ابزارها و تکنیکهای تنظیم دقیق و تقطیر دانش
- 30- هستیشناسیها، طبقهبندیها و ابزارها و تکنیکهای نمودار دانش
- 31- چالش - افزایش دانش
- 32 - راهکار - افزایش دانش
۶. شیوههای توسعه برای برنامههای کاربردی هوش مصنوعی
- 33 - تعیین منابع داده مورد استفاده
- 34 - اعمال بررسیهای کیفیت دادهها
- 35- ساخت ماکت
- 36 - ارزیابی مدل
- 37- چالش - شیوههای توسعه
- 38- راهکار - شیوههای توسعه
نتیجهگیری
- 39 - مراحل بعدی
دوره های مرتبط
- دوره آموزشی RAG، اپهای هوش مصنوعی و عوامل هوش مصنوعی برای امنیت سایبری و شبکهها
- دوره آموزشی ساخت چتباتهای سفارشی با n8n
- دوره آموزشی هوش مصنوعی عملی: ساخت اولین چتبات مکالمهای خودت
- دوره آموزشی ساخت برنامههای ارزیابی LLM با LangChain
- دوره آموزشی یادگیری اصولی GraphRAG
- دوره آموزشی راهنمای کامل ارزیابی مدلهای زبان بزرگ (LLMها)
- دوره آموزشی هوش مصنوعی عملی: ساخت چتبات هوش مصنوعی با GPT-4o و Next.js
- دوره آموزشی هوش مصنوعی عملی: ساخت GPT اختصاصی خودتان