دوره آموزشی آماده‌سازی داده، مهندسی ویژگی و افزایش داده برای مدل‌های هوش مصنوعی

جزئیات دوره

اگه دنبال اینی که بدونی چطوری واقعاً یه سیستم هوش مصنوعی قوی و قابل اجرا در محیط واقعی بسازی، این دوره‌ی پیشرفته بهت کمک می‌کنه. استاد «دن سالیوان» که متخصص فضای ابری گوگل و نویسنده معتبر در حوزه داده‌ست، تو این دوره به عمق مهندسی داده برای هوش مصنوعی می‌ره.

یاد می‌گیری چطوری داده‌ها رو آماده‌سازی کنی، چه ساختارمند باشن (مثل جدول‌های دیتابیس) چه بدون ساختار (مثل متن یا ویدیو). چیزایی مثل بررسی کیفیت داده، تبدیلشون به بردار، استفاده از کدگذاری‌های مختلف و همه فرآیندهایی که لازمن تا یه سیستم هوش مصنوعی واقعاً خوب و دقیق کار کنه.

از اون مهم‌تر، یاد می‌گیری چطوری با تکنیک‌هایی مثل استخراج دانش، گراف‌های دانش، دسته‌بندی مفهومی (taxonomy) و حتی داده‌سازی مصنوعی، به هوش مصنوعی‌ات "فهم" و "استدلال" اضافه کنی.

در بخش دیگه‌ای از دوره هم بهت نشون می‌ده چطوری کیفیت داده‌ها و مدل‌هات رو مانیتور کنی، از فریم‌ورک‌های اعتبارسنجی خودکار استفاده کنی و با متادیتاها کار کنی. خلاصه، همه چی برای اینکه یه سیستم هوش مصنوعی واقعی و قابل اتکا بسازی.

🎯 اهداف یادگیری:
آمادگی داده‌های ساختاریافته و غیرساختاریافته برای استفاده در مدل‌های مولد (Generative AI).
آشنایی با تکنیک‌های تقویتی داده مثل:
RAG (تولید تقویت‌شده با بازیابی)
داده‌سازی مصنوعی
تغییر متن (Text Perturbation)
غنی‌سازی با دانش
تبدیل داده‌های متنی، تصویری یا ویدیویی به بردارهای عددی برای جستجوی معنایی (Semantic Search).
ارزیابی کیفیت داده‌ها و پیاده‌سازی ابزارهایی برای بررسی دقت و عملکرد مدل‌ها در محیط واقعی.

سرفصل ها

۰. مقدمه

01 - به این دوره خوش آمدید
02 - آنچه باید بدانید

۱. آماده‌سازی داده‌ها برای هوش مصنوعی پیش‌بینی‌کننده

03 - کاوش داده‌ها و ارزیابی اولیه کیفیت
04 - تشخیص و مدیریت داده‌های از دست رفته
05 - تشخیص و مدیریت داده‌های پرت
06 - چالش - ارزیابی کیفیت داده‌های یک مجموعه داده
07 - راه حل - ارزیابی کیفیت داده‌های یک مجموعه داده
08 - مهندسی ویژگی - مقیاس‌بندی و نرمال‌سازی داده‌ها
09 - مهندسی ویژگی - کدگذاری‌های دسته‌بندی‌شده
10 - چالش - اعمال مهندسی ویژگی به یک مجموعه داده
11 - راه حل - اعمال مهندسی ویژگی به یک مجموعه داده

۲. آماده‌سازی داده‌ها برای هوش مصنوعی مولد

12 - داده‌های ساختاریافته در مقابل داده‌های بدون ساختار
13 - نمایش برداری داده‌های بدون ساختار
14 - ابزارهایی برای تولید نمایش‌های برداری
15 - شباهت بین نمایش‌های برداری
16 - چالش - انتخاب ابزار تولید بردار
17 - راه حل - انتخاب ابزار تولید بردار

۳. ارزیابی کیفیت داده‌ها

18- عناصر کیفیت داده‌ها - ثبات، دقت و کامل بودن
19- تکنیک‌های آماری برای ارزیابی کیفیت داده‌ها
20- چالش - کیفیت داده‌ها
21- راهکار - کیفیت داده‌ها

۴. افزایش داده برای هوش مصنوعی مولد

22- مروری بر افزایش داده
23 - آشفتگی متن و انتقال سبک
24 - تولید افزوده‌شده با بازیابی (RAG)
25- مقدمه‌ای بر LangChain برای RAG
26- چالش - درک اجزای RAG
27- راه حل - درک اجزای RAG

۵. افزایش دانش برای هوش مصنوعی مولد

28- مروری بر افزایش دانش
29 - ابزارها و تکنیک‌های تنظیم دقیق و تقطیر دانش
30- هستی‌شناسی‌ها، طبقه‌بندی‌ها و ابزارها و تکنیک‌های نمودار دانش
31- چالش - افزایش دانش
32 - راهکار - افزایش دانش

۶. شیوه‌های توسعه برای برنامه‌های کاربردی هوش مصنوعی

33 - تعیین منابع داده مورد استفاده
34 - اعمال بررسی‌های کیفیت داده‌ها
35- ساخت ماکت
36 - ارزیابی مدل
37- چالش - شیوه‌های توسعه
38- راهکار - شیوه‌های توسعه

نتیجه‌گیری

39 - مراحل بعدی

دوره آموزشی آماده‌سازی داده، مهندسی ویژگی و افزایش داده برای مدل‌های هوش مصنوعی

مدرسین

Dan Sullivan