دانلود ها ی دارای تگ: "بیگ دیتا"
2 مورد برای عبارت مورد نظر پیدا شد.
2 مورد برای عبارت مورد نظر پیدا شد.
دوره حاضر با هدف توانمندسازی مهندسان داده در مدیریت و انتقال دادهها بین سیستمهای رابطهای سنتی و پلتفرمهای ابری مدرن طراحی شده است. در بخش نخست، این آموزش بر توانمندیهای MS SQL Server تمرکز میکند؛ سیستمی که به عنوان یکی از پرکاربردترین بانکهای اطلاعاتی رابطهای در جهان شناخته میشود. شرکتکنندگان در این بخش میآموزند که چگونه از محیط قدرتمند این نرمافزار برای ذخیرهسازی دادهها، اجرای پرسوجوهای پیچیده، بهینهسازی جداول و انجام تحلیلهای سطح سازمانی استفاده کنند. همچنین، کار با زبان T-SQL برای نوشتن کوئریهای پیشرفته و مدیریت ساختارهای رابطهای جهت آمادهسازی دادهها برای بارهای کاری ETL (استخراج، تبدیل و بارگذاری) به طور کامل تشریح میشود.
در بخش دوم، تمرکز اصلی بر روی پلتفرم Databricks معتبر است که بر پایه Apache Spark بنا شده است. این پلتفرم به عنوان یک محیط یکپارچه برای مهندسی داده و تحلیلهای کلانداده شناخته میشود و ابزارهای لازم برای پردازش دادهها در مقیاس بسیار بزرگ را فراهم میکند. در این دوره، دانشجویان با نحوه ایجاد جریانهای کاری ETL کارآمد، بهرهگیری از ذخیرهسازهای Delta Lake و اعمال حاکمیت داده در سطح سازمانی از طریق Unity Catalog آشنا میشوند.
مدرس در طول این مسیر آموزشی، تمامی دانش فنی لازم برای تسلط بر مهندسی داده با استفاده از ترکیب MS SQL و Apache Spark را به صورت گامبهگام ارائه میدهد. آموزشها با استفاده از دیاگرامهای مفهومی، مثالهای عملی و پروژههای واقعیِ توسعه خط لوله (Pipeline) داده همراه است تا اطمینان حاصل شود که یادگیرندگان میتوانند دادهها را به شکلی بهینه تغییر شکل داده و برای سیستمهای تحلیلی آماده سازند. این دوره شکاف بین پایگاه دادههای سنتی و پردازش ابری را پر کرده و مهارتهای لازم برای کار در محیطهای دادهمحور امروزی را به ارمغان میآورد.
در دوره آموزشی MS SQL to Databricks Spark ETL Training for Data Engineers با فرآیندهای پیشرفته مهندسی داده و طراحی خط لولههای ETL آشنا خواهید شد.
در این دوره، دانشپذیران با دموهای گام به گام و هدایتشده، اعتماد به نفس خود را برای یادگیری مهارتهای بنیادی افزایش میدهند. به جای حفظ کردن فرمولهای ریاضی پیچیده یا یادگیری یک زبان برنامهنویسی جدید، تکنیکهای یادگیری ماشین به صورت مفهومی تشریح میشوند تا فراگیران دقیقا درک کنند که این تکنیکها چگونه و چرا کار میکنند. با دنبال کردن مثالهای ساده و بصری و تعامل با مدلهای کاربرپسند مبتنی بر اکسل، شرکتکنندگان میتوانند موضوعاتی مانند رگرسیون خطی و لجستیک، درختهای تصمیم، کا-نزدیکترین همسایهها (KNN)، نایو بیز، خوشهبندی سلسلهمراتبی و تحلیل احساسات را بدون نیاز به نوشتن حتی یک خط کد یاد بگیرند. در بخش ۱ این دوره، شرکتکنندگان با گردش کار یادگیری ماشین و تکنیکهای رایج برای پاکسازی و آمادهسازی دادههای خام جهت تحلیل آشنا میشوند. همچنین، با استفاده از جداول فراوانی، هیستوگرامها و نمودارهای توزیع، تحلیل تکمتغیره را بررسی خواهند کرد و سپس به ابزارهای تحلیل چندمتغیره مانند نقشههای حرارتی، نمودارهای ویولن و جعبهای، نمودارهای پراکندگی و همبستگی خواهند پرداخت.
در دوره آموزشی Machine Learning & Data Science: The Complete Visual Guide با مفاهیم و تکنیکهای یادگیری ماشین و علم داده آشنا خواهید شد.