دانلود ها ی دارای تگ: "تحلیل داده."
87 مورد برای عبارت مورد نظر پیدا شد.
87 مورد برای عبارت مورد نظر پیدا شد.
در دنیای امروز، تحلیل داده، یادگیری ماشین و پردازش اطلاعات حجیم، نیازمند ابزارهای قدرتمند و یکپارچه است. بسیاری از برنامهنویسان و پژوهشگران برای نصب و مدیریت پکیجهای مورد نیاز خود در پایتون با چالشهایی مواجه میشوند. در همین راستا، نرمافزار Anaconda به عنوان یک توزیع قدرتمند پایتون و R، ابزارهای لازم برای علوم داده، یادگیری ماشین و پردازش دادههای حجیم را در اختیار کاربران قرار میدهد.
Anaconda یک توزیع متنباز از زبانهای برنامهنویسی Python و R است که با تمرکز بر علوم داده، یادگیری ماشین و تحلیل آماری توسعه یافته است. این پلتفرم شامل مدیریت پکیجها، محیطهای مجازی و مجموعهای از کتابخانههای پرکاربرد برای پردازش داده است. با استفاده از Anaconda، کاربران میتوانند بدون دردسر، پکیجهای مورد نیاز خود را مدیریت و اجرا کنند.
دوره بروزرسانی شد.
هادوپ یک نرم افزار کد باز (Open source) است که برای تقسیم بندی و توزیع فایل های متمرکز به کار می رود. هادوپ تحت لیسانس آپاچی (Apache) ارائه می شود و توسط جاوا برنامه نویسی شده است. امّا هادوپ چگونه به وجود آمد؟ شرکت گوگل در پی افزایش حجم تبادل اطلاعات، به دنبال راه حلّی برای افزایش سرعت و راندمان سرورهای خود بود که سیستم توزیع (Distribution) منحصر به فردی برای خود ابداع کرد به نام GFS که مخفف Google File System بود. در پی این موفقیت، انجمن توزیع Apache به فکر گسترش این تکنولوژی در سطح وسیع تری افتاد و سیستم هادوپ به وجود آمد. هادوپ یک فریم ورک یا مجموعه ای از نرم افزارها و کتابخانه هایی است که ساز و کار پردازش حجم عظیمی از داده های توزیع شده را فراهم می کند. در واقع Hadoop را می توان به یک سیستم عامل تشبیه کرد که طراحی شده تا بتواند حجم زیادی از داده ها را بر روی ماشین های مختلف پردازش و مدیریت کند. Apache Spark، یک چارچوب محاسباتی برای داده های عظیم است. Spark از MapReduce به عنوان موتور اجرای خود، استفاده نمی کند اما بخوبی با هادوپ یکپارچه است. در واقع Spark میتواند در Yarn اجرا شود و با فرمت دادهای هادوپ و HDFS کار کند. Spark بیشتر بخاطر توانایی نگهداشتن مجموعه داده های بین کارها، در حافظه، شناخته می شود. این قابلیت Spark سبب می شود تا سریعتر از جریان کاری MapReduce معادل که مجموعه داده های همیشه از دیسک بار می شوند، عمل کند.
در دوره آموزشی A Big Data Hadoop and Spark project for absolute beginners با آموزش مقدماتی بیگ دیتا هادوپ و اسپارک اشنا خواهید شد.
دوره بروزرسانی شد.
علم داده (Data Science)، دانشی میانرشتهای پیرامون استخراج دانش و آگاهی از مجموعهای داده و اطلاعات است. علم داده از ترکیب مباحث مختلفی به وجود آمده و بر مبانی و روشهای موجود در حوزههای مختلف علمی بنا شدهاست. تعدادی از این حوزهها عبارتند از: ریاضیات، آمار، مهندسی داده، بازشناخت الگو و... هدف این علم، استخراج مفهوم از داده و تولید محصولات دادهمحور است. کتابخانهی Pandas ساختار دادهی جدید و ابزارهایی را برای تجزیه و تحلیل کاربردی و عملی بر روی دادهها در زمینههایی چون اقتصاد، آمار، علوم اجتماعی و مهندسی فراهم نموده است. Pandas به راحتی میتواند با دادههای ناقص، کثیف و بدون برچسب کار کند (دادهها و جداولی که هم اکنون نیز در سازمانهای مختلف وجود دارد)؛ و همچنین شامل متدهایی برای تغییر شکل، ادغام و یا برش مجموعه دادهی ما است.
در دوره آموزشی Master Data Analysis with Python - Essential Pandas Commands با آموزش آنالیز داده ها با پایتون و دستورات پانداس اشنا خواهید شد.
دوره بروزرسانی شد.
R، یک زبان برنامهنویسی و محیط نرمافزاری برای محاسبات آماری و علم دادهها است، که بر اساس زبانهای اس و اسکیم پیادهسازی شده است. این نرمافزار متن باز، تحت اجازهنامه عمومی همگانی گنو عرضه شده و به رایگان قابل دسترس است. زبان اس بجز R، توسط شرکت Insightful، در نرمافزار تجاری اسپلاس نیز پیادهسازی شده است. اگرچه دستورات اسپلاس و R بسیار شبیه است لیکن این دو نرمافزار دارای هستههای متمایزی میباشند. R، حاوی محدودهٔ گستردهای از تکنیکهای آماری (از جمله: مدلسازی خطی و غیرخطی، آزمونهای کلاسیک آماری، تحلیل سریهای زمانی، ردهبندی، خوشهبندی و غیره) و قابلیتهای گرافیکی است. در محیط R، کدهای سی، سی++ و فورترن قابلیت اتصال و فراخوانی هنگام اجرای برنامه را دارند و کاربران خبره میتوانند توسط کدهای سی، مستقیماً اشیا R را تغییر دهند. گرچه R اغلب به منظور انجام محاسبات آماری به کار میرود، این نرمافزار قابل به کارگیری در محاسبات ماتریسی است و در این زمینه، همپای نرمافزارهایی چون اُکتاو و نسخهٔ تجاری آن متلب (MATLAB) است. R، همچنین نرمافزار قدرتمندی برای ایجاد اشکال گرافیکی و نمودارهاست.
در دوره آموزشی R Programming for Statistics and Data Science با آموزش زبان برنامه نویسی آر برای آمار و علوم داده اشنا خواهید شد.
علم داده (Data Science)، دانشی میانرشتهای پیرامون استخراج دانش و آگاهی از مجموعهای داده و اطلاعات است. علم داده از ترکیب مباحث مختلفی به وجود آمده و بر مبانی و روشهای موجود در حوزههای مختلف علمی بنا شدهاست. تعدادی از این حوزهها عبارتند از: ریاضیات، آمار، مهندسی داده، بازشناخت الگو و... هدف این علم، استخراج مفهوم از داده و تولید محصولات دادهمحور است.
آقایان توماس دونپورت و دی جی پاتیل در سال ۲۰۱۲ در مقاله «علم داده: جذابترین شغل قرن بیست و یکم» متخصصین علم داده را این طور تعریف میکنند: کسانی که میدانند چگونه میتوان از انبوه اطلاعات بدون ساختار پاسخ سوالهای کسبوکار را پیدا کرد. استنتون در سال ۲۰۱۳ علم داده را این طور تعریف میکند: علم داده رشته در حال ظهوری است که به جمعآوری، آمادهسازی، تحلیل، بصریسازی، مدیریت و نگهداشت اطلاعات در حجم بالا میپردازد. دریسکول در سال ۲۰۱۴ علم داده را این طور تعریف میکند: علم داده مهندسی عمران دادههاست. متخصص علم داده دانشی کاربردی از دادهها و ابزارها دارد به علاوه درک تئوریکی دارد که مشخص میکند چه چیزی از نظر علمی ممکن است. به شاغلین در حوزهٔ علم داده، متخصص علم داده (data scientist) میگویند.
در دوره آموزشی Python Data Science basics with Numpy, Pandas and Matplotlib با آموزش مقدماتی علوم داده با پایتون، نام پای، پانداس و مت پلات لایب اشنا خواهید شد.