دادههای موجود در وب یکی از مهمترین منابع به منظور انجام تحلیلهای داده (Data Analysis) و دادهکاوی (Data Mining) هستند. چنین تحلیلهایی با اهداف گوناگون انجام میشوند که از جمله آنها میتوان به عقیدهکاوی و تحلیل احساسات اشاره کرد. مساله شایان توجه در این تحلیلها گردآوری دادههای موجود در وب است که با عنوان «وب اسکرپینگ» (Web Scraping) شناخته شده و امکان انجام آن با بهرهگیری از ابزارها و زبانهای برنامهنویسی گوناگون وجود دارد. از جمله زبانهای برنامهنویسی قابل استفاده برای وب اسکرپینگ، زبان قدرتمند پایتون است که با استفاده از کتابخانه Beautiful Soup این کار را انجام میدهد.
در دوره آموزشی Pluralsight Extracting Data from HTML with BeautifulSoup با آموزش استخراج داده ها از اچ تی ام ال با بیوتیفول سوپ اشنا خواهید شد.