چند پروژه برای مبتدیان علم داده

چند پروژه برای مبتدیان علم داده آیا به دنبال پروژه هایی مبتدیان علم داده هستید؟ اگر اینطوره این مقاله شامل فهرستی از 10 پروژه است که مناسب افراد مبتدی هستش. این پروژه ها می تونند به شما کمک کنند تا مهارت های علم داده خودتون رو تقویت کنید و در عین حال رزومه خودتون رو […]

شمارش تعداد در یک بردار منطقی در R

روش برای شمارش تعداد در یک بردار منطقی در R   از تکنیک های زیر می توان برای تعیین تعداد واقعی (TRUE) در یک بردار منطقی (Logical Vector) در R استفاده کرد: روش 1: استفاده از sum() روش 2: استفاده از summary() مثال‌های زیر هر تکنیک را در عمل نشان می‌دهند. مثال 1: شمارش تعداد  […]

محاسبه میانگین در R

تابع ave برای محاسبه میانگین در R   در این آموزش از تابع ave برای محاسبه میانگین ها در R استفاده می شود. این مقاله شامل دو نمونه از تابع ave در حال استفاده است.   تولید نمونه ای از داده های   اولین قدم ساختن داده هایی است که می توانیم در این آموزش […]

plotly

plotly

چه زمانی از plotly استفاده کنیم؟ کتابخانه plotly تعدادی ویژگی دارد که استفاده از آن را هیجان انگیز و سرگرم کننده می کند. موقعیت‌های متعددی وجود دارد که در آن‌ها می‌توان از ggplot یا plotly استفاده کرد، اما به دلایل زیر ممکن است plotly می تواند بهترین انتخاب باشد. نمودارهایی که به صورت الکترونیکی یا […]

جایگزینی اولین مقدار غیر مفقود در R

اولین مقدار غیر مفقود در R را جایگزین کنید برای بازیابی اولین مقدار غیر مفقود (non-missing value) از بسته dplyr در R، با استفاده از تابع coalesce() استفاده کنید. دو برنامه معمولی برای این تابع وجود دارد: مثال 1: برای جایگزینی مقادیر مفقود شده (missing value) در یک بردار، از coalesce() استفاده کنید. در یک […]

انتساب داده های گمشده (Imputation of missing data) در R

انتساب داده های گمشده (Imputation of missing data) در R تقریباً هر مجموعه‌ ای از داده حاوی تعدادی داده های (Missing data) گمشده یا مفقود هستند که می‌تواند باعث مشکلات عمده‌ای مانند تخمین‌های نادرست یا کاهش کارایی به دلیل مجموعه داده‌های کوچک‌تر شود. برای کاهش این مشکلات، می‌توان از تکنیک جانهی یا انتساب‌ (Imputation) برای […]

فرضیات XGBoost

فرضیات XGBoost تقویت گرادیان شدید (Extreme Gradient Boosting) که اغلب با نام XGBoost شناخته می‌شود، یک تکنیک یادگیری تحت نظارت است که به خانواده الگوریتم‌های یادگیری ماشینی معروف به درخت‌های تصمیم تقویت‌شده با گرادیان (GBDT) تعلق دارد. قبل از اینکه به فرضیات XGBoost بپردازیم ابتدا یک نمای کلی از الگوریتم را ارائه خواهیم داد. تقویت […]

برای یادگیری پایتون چه کتابایی بخونیم

بهترین کتاب برای یادگیری پایتون برای مبتدیان در این مقاله به کتاب های مهم برای یادگیری پایتون برای مبتدی ها می پردازیم. دوره سقوط پایتون (Python Crash Course) در بخش اول کتاب، ایده های اساسی مانند فرهنگ لغت، فهرست ها، حلقه ها و کلاس ها را مطالعه خواهید کرد. علاوه بر این، نحوه ساخت کد […]

چگونه نتایج حاشیه خطا را تفسیر کنیم؟

چگونه نتایج حاشیه خطا را تفسیر کنیم؟ در آمار از حاشیه خطا (Margin of Error) برای تعیین میزان دقیق بودن نسبت جمعیت یا برآورد میانگین جمعیت استفاده می شود. هنگام ساخت فواصل اطمینان برای پارامترهای جمعیت، معمولاً از حاشیه خطا استفاده می کنیم. نحوه تفسیر نتایج حاشیه خطا مثال‌های زیر نحوه محاسبه و درک حاشیه‌های […]

نحوه ترکیب چندین نمودار در R

نحوه ترکیب چندین نمودار در R، اخیراً در برنامه Patchwork Thomas Lin Pedersen قرار گرفته است، و استفاده از این بسته برای ادغام تعداد زیادی نمودار ggplot2 در یک نمودار بسیار ساده است. ما اصول استفاده از این بسته و برخی از ویژگی های اصلی آن را در این مقاله آموزش می دهیم. ابتدا برخی […]