دوره آموزشی OpenAI Realtime API: ساخت عاملهای صوتی با Realtime API و Agents SDK
16 دقیقهعمومی2025-12-18
مدرسین

Morten Rand-Hendriksen
Senior Staff Instructor, Speaker, Web Designer, and Software Developer
جزئیات دوره
تو این دوره یاد میگیری چطور عاملهای هوش مصنوعی با قابلیت تبدیل صدا و متن به صدا و حتی تصویر به صدا بسازی، همه با استفاده از Realtime API و Agents SDK از OpenAI. این دوره بهت نشون میده چطور برنامههای Realtime Voice Agent بسازی و قابلیتهای پیشرفتهای مثل گاردریلها، فراخوانی توابع، سرورهای MCP و ورودی تصویر زنده از دوربین دستگاه رو فعال کنی.
علاوه بر این، یاد میگیری چطور اپلیکیشنهای فرانتاند رو با استفاده از سرور احراز هویت سفارشی و توکنهای موقت (Ephemeral Tokens) ایمن کنی. این دوره بهت ابزار و تجربه عملی میده تا اپلیکیشنهای هوشمند صوتی و تصویری بسازی که تعاملی، ایمن و کاربردی هستن.
در طول دوره، با مفاهیم جلسات WebRTC، مدیریت رویدادهای سرور، افزودن متن زنده برای ورودی و خروجی AI و دسترسیپذیری بهتر هم آشنا میشی. همچنین میتونی گزینه چت متنی، توابع سفارشی و زیرعاملهای اختصاصی بسازی تا عامل AI انعطافپذیرتر و حرفهایتر بشه.
اهداف یادگیری
راهاندازی سرور احراز هویت برای تأیید اپلیکیشنها با توکنهای موقت
ساخت اپلیکیشنهای صوتی realtime با استفاده از OpenAI Agents SDK
درک عملکرد رویدادهای سرور و مدیریت جلسات WebRTC
افزودن متن زنده برای ورودی کاربر و خروجی AI برای دسترسی بهتر
اضافه کردن گزینه چت متنی
پیکربندی گاردریلها برای جلوگیری از خروجی کلمات و عبارات مشخص
توسعه توابع سفارشی و استفاده از اونها به عنوان ابزار برای عامل
ساخت زیرعاملهای سفارشی
علاوه بر این، یاد میگیری چطور اپلیکیشنهای فرانتاند رو با استفاده از سرور احراز هویت سفارشی و توکنهای موقت (Ephemeral Tokens) ایمن کنی. این دوره بهت ابزار و تجربه عملی میده تا اپلیکیشنهای هوشمند صوتی و تصویری بسازی که تعاملی، ایمن و کاربردی هستن.
در طول دوره، با مفاهیم جلسات WebRTC، مدیریت رویدادهای سرور، افزودن متن زنده برای ورودی و خروجی AI و دسترسیپذیری بهتر هم آشنا میشی. همچنین میتونی گزینه چت متنی، توابع سفارشی و زیرعاملهای اختصاصی بسازی تا عامل AI انعطافپذیرتر و حرفهایتر بشه.
اهداف یادگیری
راهاندازی سرور احراز هویت برای تأیید اپلیکیشنها با توکنهای موقت
ساخت اپلیکیشنهای صوتی realtime با استفاده از OpenAI Agents SDK
درک عملکرد رویدادهای سرور و مدیریت جلسات WebRTC
افزودن متن زنده برای ورودی کاربر و خروجی AI برای دسترسی بهتر
اضافه کردن گزینه چت متنی
پیکربندی گاردریلها برای جلوگیری از خروجی کلمات و عبارات مشخص
توسعه توابع سفارشی و استفاده از اونها به عنوان ابزار برای عامل
ساخت زیرعاملهای سفارشی
سرفصل ها
مقدمه
- ساخت برنامههای عامل صوتی بلادرنگ با امکانات کامل
- نحوه استفاده از این دوره و فایلهای تمرینی
API بلادرنگ و SDK مربوط به Agents - اصول اولیه
- توسعه برنامههای API بلادرنگ با Agents SDK
- احراز هویت با توکنهای زودگذر
- عمیق شدن با رویدادهای بلادرنگ
افزودن ویژگیهای پیشرفته
- ملاحظات رابط کاربری برای چتباتهای هوش مصنوعی
نتیجهگیری
- مراحل بعدی
دوره های مرتبط
- دوره آموزشی هوش مصنوعی عملی: استفاده از API لحظهای OpenAI برای مکالمات صوتی
- دوره آموزشی OpenAI API: ساخت اپلیکیشن های صوتی با Realtime API
- دوره آموزشی OpenAI API: ساخت برنامههای صوتی فرانتاند با استفاده از Realtime API و WebRTC
- دوره آموزشی OpenAI API: رابط برنامهنویسی همزمان روی سرور
- دوره آموزشی هوش مصنوعی عملی: ساخت چتبات هوش مصنوعی با GPT-4o و Next.js
- دوره آموزشی ایجاد GPT با Actions
- دوره آموزشی جستجوی ChatGPT: محاوره ای، تحقیق در زمان واقعی
- دوره آموزشی AI Show: راه حل های Azure OpenAI با آواتار TTS