چند پروژه برای مبتدیان علم داده

چند پروژه برای مبتدیان علم داده آیا به دنبال پروژه هایی مبتدیان علم داده هستید؟ اگر اینطوره این مقاله شامل فهرستی از 10 پروژه است که مناسب افراد مبتدی هستش. این پروژه ها می تونند به شما کمک کنند تا مهارت های علم داده خودتون رو تقویت کنید و در عین حال رزومه خودتون رو […]
شمارش تعداد در یک بردار منطقی در R

روش برای شمارش تعداد در یک بردار منطقی در R از تکنیک های زیر می توان برای تعیین تعداد واقعی (TRUE) در یک بردار منطقی (Logical Vector) در R استفاده کرد: روش 1: استفاده از sum() روش 2: استفاده از summary() مثالهای زیر هر تکنیک را در عمل نشان میدهند. مثال 1: شمارش تعداد […]
محاسبه میانگین در R

تابع ave برای محاسبه میانگین در R در این آموزش از تابع ave برای محاسبه میانگین ها در R استفاده می شود. این مقاله شامل دو نمونه از تابع ave در حال استفاده است. تولید نمونه ای از داده های اولین قدم ساختن داده هایی است که می توانیم در این آموزش […]
plotly

چه زمانی از plotly استفاده کنیم؟ کتابخانه plotly تعدادی ویژگی دارد که استفاده از آن را هیجان انگیز و سرگرم کننده می کند. موقعیتهای متعددی وجود دارد که در آنها میتوان از ggplot یا plotly استفاده کرد، اما به دلایل زیر ممکن است plotly می تواند بهترین انتخاب باشد. نمودارهایی که به صورت الکترونیکی یا […]
جایگزینی اولین مقدار غیر مفقود در R

اولین مقدار غیر مفقود در R را جایگزین کنید برای بازیابی اولین مقدار غیر مفقود (non-missing value) از بسته dplyr در R، با استفاده از تابع coalesce() استفاده کنید. دو برنامه معمولی برای این تابع وجود دارد: مثال 1: برای جایگزینی مقادیر مفقود شده (missing value) در یک بردار، از coalesce() استفاده کنید. در یک […]
انتساب داده های گمشده (Imputation of missing data) در R

انتساب داده های گمشده (Imputation of missing data) در R تقریباً هر مجموعه ای از داده حاوی تعدادی داده های (Missing data) گمشده یا مفقود هستند که میتواند باعث مشکلات عمدهای مانند تخمینهای نادرست یا کاهش کارایی به دلیل مجموعه دادههای کوچکتر شود. برای کاهش این مشکلات، میتوان از تکنیک جانهی یا انتساب (Imputation) برای […]
فرضیات XGBoost

فرضیات XGBoost تقویت گرادیان شدید (Extreme Gradient Boosting) که اغلب با نام XGBoost شناخته میشود، یک تکنیک یادگیری تحت نظارت است که به خانواده الگوریتمهای یادگیری ماشینی معروف به درختهای تصمیم تقویتشده با گرادیان (GBDT) تعلق دارد. قبل از اینکه به فرضیات XGBoost بپردازیم ابتدا یک نمای کلی از الگوریتم را ارائه خواهیم داد. تقویت […]
برای یادگیری پایتون چه کتابایی بخونیم

بهترین کتاب برای یادگیری پایتون برای مبتدیان در این مقاله به کتاب های مهم برای یادگیری پایتون برای مبتدی ها می پردازیم. دوره سقوط پایتون (Python Crash Course) در بخش اول کتاب، ایده های اساسی مانند فرهنگ لغت، فهرست ها، حلقه ها و کلاس ها را مطالعه خواهید کرد. علاوه بر این، نحوه ساخت کد […]
چگونه نتایج حاشیه خطا را تفسیر کنیم؟

چگونه نتایج حاشیه خطا را تفسیر کنیم؟ در آمار از حاشیه خطا (Margin of Error) برای تعیین میزان دقیق بودن نسبت جمعیت یا برآورد میانگین جمعیت استفاده می شود. هنگام ساخت فواصل اطمینان برای پارامترهای جمعیت، معمولاً از حاشیه خطا استفاده می کنیم. نحوه تفسیر نتایج حاشیه خطا مثالهای زیر نحوه محاسبه و درک حاشیههای […]
نحوه ترکیب چندین نمودار در R

نحوه ترکیب چندین نمودار در R، اخیراً در برنامه Patchwork Thomas Lin Pedersen قرار گرفته است، و استفاده از این بسته برای ادغام تعداد زیادی نمودار ggplot2 در یک نمودار بسیار ساده است. ما اصول استفاده از این بسته و برخی از ویژگی های اصلی آن را در این مقاله آموزش می دهیم. ابتدا برخی […]