دانلود ها ی دارای تگ: "reinforcement learning"

2 مورد برای عبارت مورد نظر پیدا شد.

دانلود Udemy Reinforcement Learning with Pytorch - آموزش یادگیری تقویتی با پای تورچ

  • بازدید: 3,735
دانلود Udemy Reinforcement Learning with Pytorch - آموزش یادگیری تقویتی با پای تورچ
این دوره آموزش یادگیری تقویتی و الگوریتم های هوش مصنوعی با استفاده از پایتون، Pytorch و OpenAI Gym است. هوش مصنوعی به صورت پویا در حال گسترش کاربرد هایش در زندگیمان است. در این دوره مباحث متنوعی با تمرکز بر جزئیات مهم و عملی آموزش داده میشود. ما از اطلاعات مقدماتی شروع خواهیم کرد و ادراکمان را گسترش خواهیم داد. این دوره مباحث متنوعی همچون مقدمه ای بر یادگیری تقویتی، Markov Decision Process، محیط های جبر گرایانه و تصادفی، معادله Bellman، شبکه های عصبی، یادگیری عمیق تقویتی، DQN و بهبود آن، یادگیری از محتوای ویدئویی و باز تولید تعدادی از راه حل های مشهور یادگیری تقویتی را پوشش میدهد.
در دوره آموزشی Udemy Reinforcement Learning with Pytorch با آموزش یادگیری تقویتی با پای تورچ اشنا خواهید شد.

دانلود Packt Hands-on Reinforcement Learning with PyTorch - آموزش یادگیری تقویتی با پای تورچ

  • بازدید: 4,924
دانلود Packt Hands-on Reinforcement Learning with PyTorch - آموزش یادگیری تقویتی با پای تورچ
یادگیری تقویتی یکی از گرایش‌های یادگیری ماشینی است که از روانشناسی رفتارگرایی الهام می‌گیرد. این روش بر رفتارهایی تمرکز دارد که ماشین باید برای بیشینه کردن پاداشش انجام دهد. این مسئله، با توجه به گستردگی‌اش، در زمینه‌های گوناگونی بررسی می‌شود. مانند: نظریه بازی‌ها، نظریه کنترل، تحقیق در عملیات، نظریه اطلاعات، سامانه چندعامله، هوش ازدحامی، آمار، الگوریتم ژنتیک، بهینه‌سازی بر مبنای شبیه‌سازی. در مبحث تحقیق در عملیات و در ادبیات کنترل، حوزه‌ای که در آن روش یادگیری تقویتی مطالعه می‌شود برنامه‌نویسی تخمینی پویای (approximate dynamic programming) خوانده می‌شود. این مسئله در تئوری کنترل بهینه نیز مطالعه شده‌است. البته دغدغه اصلی بیشتر مطالعات در این زمینه، اثبات وجود پاسخ بهینه و یافتن ویژگی‌های آن است و به دنبال جزئیات یادگیری یا تخمین نیست. یادگیری تقویتی در اقتصاد و نظریه بازیها بیشتر به بررسی تعادل‌های ایجاد شده تحت عقلانیت محدود می‌پردازد. در یادگیری ماشینی با توجه به این که بسیاری از الگوریتم‌های یادگیری تقویتی از تکنیک‌های برنامه‌نویسی پویا استفاده می‌کنند معمولاً مسئله تحت عنوان یک فرایند تصمیم‌گیری مارکف مدل می‌شود. تفاوت اصلی بین روش‌های سنتی و الگوریتم‌های یادگیری تقویتی این است که در یادگیری تقویتی نیازی به داشتن اطلاعات راجع به فرایند تصمیم‌گیری ندارد و این که این روش روی فرایندهای مارکف بسیار بزرگی کار می‌کند که روش‌های سنتی در آنجا ناکارآمدند.
در دوره آموزشی Packt Hands-on Reinforcement Learning with PyTorch با آموزش یادگیری تقویتی با پای تورچ اشنا خواهید شد.