دانلود ها ی دارای تگ: "کلان داده"
18 مورد برای عبارت مورد نظر پیدا شد.
18 مورد برای عبارت مورد نظر پیدا شد.
این دوره آموزشی جامع، شرکتکنندگان را از مبانی زبان برنامهنویسی پایتون آغاز کرده و به تدریج آنها را با مفاهیم پیشرفتهتر مانند برنامهنویسی شیءگرا آشنا میسازد. در ادامه، دوره به آموزش کتابخانههای حیاتی NumPy و Pandas میپردازد که ابزارهای قدرتمندی برای دستکاری، پردازش و تحلیل کارآمد دادهها در پایتون هستند. شرکتکنندگان یاد خواهند گرفت که چگونه با مجموعههای داده بزرگ کار کنند، دادههای از دست رفته را مدیریت نمایند و محاسبات پیچیده را انجام دهند. علاوه بر این، دوره به معرفی کتابخانه Polars میپردازد و مزایای آن را در مقایسه با Pandas، به ویژه در زمینه سرعت و عملکرد در کار با دادههای حجیم، مورد بررسی قرار میدهد. بخش مهم دیگری از این دوره به آموزش تکنیکهای مصورسازی داده با استفاده از کتابخانههای Seaborn و Matplotlib اختصاص دارد. شرکتکنندگان مهارتهای لازم برای ایجاد انواع نمودارها و تصاویر بصری جذاب و گویا را کسب خواهند کرد تا بتوانند داستانهای نهفته در دادهها را به طور موثرتری 전달 کنند. همچنین، آشنایی با Git و اصول کنترل نسخه به شرکتکنندگان کمک میکند تا به طور موثرتری تغییرات کد خود را مدیریت کرده و در پروژههای تیمی همکاری نمایند. در نهایت، دوره با آموزش نحوه ساخت داشبوردهای تعاملی با استفاده از Streamlit و Matplotlib به اوج خود میرسد. شرکتکنندگان یک پروژه عملی و کاربردی را با استفاده از دادههای واقعی ایجاد کرده و نحوه استقرار آن را برای نمایش به کارفرمایان یا مشتریان بالقوه فرا خواهند گرفت. در طول این دوره، تمرینها و تکالیف عملی متعددی برای تثبیت یادگیری و کسب تجربه عملی در اختیار شرکتکنندگان قرار میگیرد.
در دوره آموزشی Python Data Analyst Bootcamp: Process, Analyze & Visualize با ابزارها و تکنیکهای مورد نیاز برای تحلیل و مصورسازی دادهها با استفاده از پایتون آشنا خواهید شد.
با این دوره آموزشی، متخصص انبار داده شوید: در زمینههای ETL، SQL و مدلسازی داده با پروژههای واقعی سازمانی و راهنمایی متخصصان، مهارت کسب کنید! این دوره که به طور خاص برای مهندسان داده مشتاق، تحلیلگران داده، افرادی که قصد تغییر شغل دارند و متخصصانی که به دنبال مهارتهای پیشرفته هستند طراحی شده است، به شما کمک میکند تا به نتایج شغلی واقعی دست یابید؛ نتایجی مانند به دست آوردن مشاغل پردرآمد، انتقال شغلی روان و آمادگی برای مصاحبههای شغلی. این دوره آموزشی جامع، افراد را برای تبدیل شدن به متخصصان انبار داده آماده میکند و مهارتهای کلیدی در زمینههای ETL، SQL و مدلسازی داده را از طریق پروژههای عملی سازمانی و راهنماییهای تخصصی ارائه میدهد.
در دوره آموزشی Building a Modern Data Warehouse - Data Engineering Bootcamp با مفاهیم و ابزارهای مرتبط با انبار داده آشنا خواهید شد.
در دنیای امروزی که بر پایه داده بنا شده است، سازمانها حجم بسیار زیادی از دادهها را جمعآوری و ذخیره میکنند. Data Lake ها به عنوان یک جزء حیاتی در این اکوسیستم داده ظهور کردهاند. دوره Data Lake Fundamentals برای این طراحی شده است که شما را با دانش و مهارتهای ضروری برای حرکت در دنیای Data Lake ها مجهز کند. چه یک متخصص داده با تجربه باشید، چه یک دانشمند داده مشتاق، یا یک رهبر کسبوکار که میخواهد از داده برای تصمیمگیریهای استراتژیک استفاده کند، این دوره برای پاسخگویی به نیازهای شما تنظیم شده است. در این دوره، شرکتکنندگان با مفاهیم بنیادی Data Lake ها آشنا میشوند و تفاوت آنها را با راهکارهای سنتی ذخیرهسازی داده درک خواهند کرد. آنها یاد خواهند گرفت که چگونه دادهها را با استفاده از روشهای مختلف، از جمله پردازش دستهای (batch processing) و جریان داده بیدرنگ (real-time streaming)، به یک Data Lake وارد کنند (ingest). همچنین، دنیای فرمتهای داده و راهکارهای ذخیرهسازی، از جمله فرمتهای فایل محبوب و سیستمهای ذخیرهسازی مورد بررسی قرار خواهد گرفت. بخش مهم دیگری از دوره به آمادهسازی، پاکسازی و تبدیل دادهها (data transformation) در یک Data Lake برای انجام تحلیلهای معنادار اختصاص دارد. شرکتکنندگان هنر پرس و جو (querying) و تحلیل دادههای ذخیره شده در Data Lake ها را با استفاده از SQL، Apache Hive و سایر ابزارها فرا خواهند گرفت. در نهایت، جنبههای حیاتی حکمرانی داده (data governance)، امنیت (security) و انطباق (compliance) در محیطهای Data Lake مورد بحث و بررسی قرار خواهد گرفت تا شرکتکنندگان بتوانند Data Lake های ایمن و قابل اعتمادی را مدیریت کنند.
در دوره آموزشی Data Lake Fundamentals با مفاهیم کلیدی و نحوه کار با Data Lake ها آشنا خواهید شد.
این دوره آموزشی به شما یاد می دهد که چگونه با استفاده از جدیدترین ابزار های هوش مصنوعی بدون نیاز به کد نویسی، وبسایت ها را اسکرپ کنید. در این دوره شما با نحوه استفاده از ابزار های هوش مصنوعی مانند ChatGPT، API explorers و مرورگرهای headless آشنا می شوید. همچنین شما یاد می گیرید که چگونه از تکنیک های پیشرفته هوش مصنوعی برای عبور از CAPTCHA و شناسایی API های پنهان استفاده کنید. این دوره برای افرادی که می خواهند داده های وبسایت ها را به صورت خودکار جمع آوری کنند مناسب است.
در دوره آموزشی Become a 10x Web Scraping with AI/Scrape Any Website No-Code با نحوه اسکرپ کردن داده ها از وبسایت ها با استفاده از ابزار های هوش مصنوعی آشنا می شوید.
علم داده در مقیاسی گسترده و جهانی در حال گسترش و توسعه است. در همه جای جامعه، حرکتی برای پیادهسازی و استفاده از روشها و الگوریتمهای علم داده برای توسعه و بهینهسازی تمام جنبههای زندگی، کسبوکارها، جوامع، دولتها و کشورها وجود دارد. این دوره مجموعهای مفید از روشها و الگوریتمهای پیشرفته علم داده به همراه Pandas و Python را به شما آموزش میدهد. این دوره دارای محتوای انحصاری است که موارد جدیدی را در مورد روشها و الگوریتمها به شما آموزش میدهد.
در دوره آموزشی Advanced Data Science Methods and Algorithms با روش ها و الگوریتم های پیشرفته علم داده آشنا خواهید شد.
دوره بروزرسانی شد.
هادوپ یک نرم افزار کد باز (Open source) است که برای تقسیم بندی و توزیع فایل های متمرکز به کار می رود. هادوپ تحت لیسانس آپاچی (Apache) ارائه می شود و توسط جاوا برنامه نویسی شده است. امّا هادوپ چگونه به وجود آمد؟ شرکت گوگل در پی افزایش حجم تبادل اطلاعات، به دنبال راه حلّی برای افزایش سرعت و راندمان سرورهای خود بود که سیستم توزیع (Distribution) منحصر به فردی برای خود ابداع کرد به نام GFS که مخفف Google File System بود. در پی این موفقیت، انجمن توزیع Apache به فکر گسترش این تکنولوژی در سطح وسیع تری افتاد و سیستم هادوپ به وجود آمد. هادوپ یک فریم ورک یا مجموعه ای از نرم افزارها و کتابخانه هایی است که ساز و کار پردازش حجم عظیمی از داده های توزیع شده را فراهم می کند. در واقع Hadoop را می توان به یک سیستم عامل تشبیه کرد که طراحی شده تا بتواند حجم زیادی از داده ها را بر روی ماشین های مختلف پردازش و مدیریت کند. Apache Spark، یک چارچوب محاسباتی برای داده های عظیم است. Spark از MapReduce به عنوان موتور اجرای خود، استفاده نمی کند اما بخوبی با هادوپ یکپارچه است. در واقع Spark میتواند در Yarn اجرا شود و با فرمت دادهای هادوپ و HDFS کار کند. Spark بیشتر بخاطر توانایی نگهداشتن مجموعه داده های بین کارها، در حافظه، شناخته می شود. این قابلیت Spark سبب می شود تا سریعتر از جریان کاری MapReduce معادل که مجموعه داده های همیشه از دیسک بار می شوند، عمل کند.
در دوره آموزشی A Big Data Hadoop and Spark project for absolute beginners با آموزش مقدماتی بیگ دیتا هادوپ و اسپارک اشنا خواهید شد.
Apache Spark ، یک چارچوب محاسباتی برای داده های عظیم است. Spark از MapReduce به عنوان موتور اجرای خود، استفاده نمی کند اما بخوبی با هادوپ یکپارچه است. در واقع Spark میتواند در Yarn اجرا شود و با فرمت دادهای هادوپ و HDFS کار کند. Spark بیشتر بخاطر توانایی نگهداشتن مجموعه داده های بین کارها، در حافظه، شناخته می شود. این قابلیت Spark سبب می شود تا سریعتر از جریان کاری MapReduce معادل که مجموعه داده های همیشه از دیسک بار می شوند، عمل کند. دو نوع کاربردی که از مدل پردازشی Spark بهره می برند، الگوریتم های تکرار شونده (که یک تابع بر روی مجموعه دادهای بهصورت تکراری تا حصول شرط خروج، اعمال میگردد، و تحلیل تعاملی(که یک کاربر مجموعه ای از پرس و جوهای اکتشافی تک کاره را بر روی مجموعه ای داده ها، اعمال می کنند) است. همچنین اسپارک APIهایی در زبانهای Java، Scala و Python، ارایه می کند. پروژه Apache Spark شامل ماژول های یادگیری ماشین(MLlib)، پردازش گراف (GraphX)، پردازش جریانی( (Spark Streaming)، و SQL (Spark SQL است.
در دوره آموزشی Big Data Analysis with Apache Spark PySpark: Hands on Python با آموزش آنالیز داده های حجیم با پای اسپارک اشنا خواهید شد.