تفسیر ضریب کاپا

ضریب کاپا (kappa coefficient)  برای تعیین قابلیت اطمینان یا توافق و یا پایایی بین ارزیابان (inter-rater reliability) استفاده می شود. در بیشتر کاربردها، بزرگی کاپا اغلب مهمتر از اهمیت آماری کاپا است. بر اساس مقدار کاپا کوهن (Cohen’s Kappa value)، طبقه بندی های زیر برای تفسیر “قدرت توافق” توسط Altman و Landis JR در سال […]

تحلیل مؤلفه‌های اصلی (PCA)

تحلیل مؤلفه‌های اصلی (PCA) تحلیل مؤلفه‌های اصلی (Principal Component Analysis (PCA)) یک تکنیک آماری است که می‌توانیم تعداد ویژگی‌های موجود در داده‌های خود را از تعداد زیاد به تعداد کم کاهش دهیم. با این حال، این روش دارای مزایا و معایبی است. مزایا و معایب روش PCA را در این مقاله آموزش خواهیم داد. مزایا   […]

تفاوت بین یادگیری ماشین، علم داده، هوش مصنوعی، یادگیری عمیق و آمار

تفاوت بین یادگیری ماشین، علم داده، هوش مصنوعی، یادگیری عمیق و آمار در این مقاله، من نقش‌های مختلف دانشمند داده و چگونگی مقایسه و همپوشانی علم داده با زمینه‌های مرتبط مانند یادگیری ماشینی (machine learning)، یادگیری عمیق (deep learning)، هوش مصنوعی (artificial intelligence)، آمار (statistics)، اینترنت اشیا (Internet of things (IoT))، تحقیقات عملیاتی (operations research) […]

تجزیه و تحلیل آماری: تعریف، مثال

  تحلیل آماری علم جمع آوری داده ها و کشف الگوها و روندها است. پس از جمع‌آوری داده‌ها، می‌توانید آن‌ها را تجزیه و تحلیل کنید:   خلاصه کردن داده ها به عنوان مثال، نمودار دایره ای بسازید.   یافتن معیارهای کلیدی موقعیت مکانی به عنوان مثال، میانگین به شما می گوید که عدد متوسط در […]

روایی نتیجه گیری آماری (SCV) چیست؟

روایی نتیجه گیری آماری (Statistical Conclusion Validity (SCV)) نشان می دهد که یک تحقیق یا نتیجه گیری تجربی چقدر منطقی است. به عنوان مثال، فرض کنید شما تحقیقاتی انجام داده اید تا بفهمید که “آیا دو سال پیش دبستانی موثرتر از یک سال پیش دبستانی است؟”. بر اساس داده‌ها، نتیجه می‌گیرید که رابطه مثبتی بین […]

نحوه تعیین خودکار تعداد خوشه ها توسط قانون آرنج

تعیین تعداد خوشه‌ها هنگام انجام خوشه‌بندی بدون نظارت یک مشکل پیچیده است. بسیاری از مجموعه‌های داده، خوشه‌های جدا از هم را نشان نمی‌دهند. وقتی از دو فرد خواسته می‌شود که تعداد خوشه‌ها را با نگاه کردن به نمودار بگویند، احتمالاً دو پاسخ متفاوت را دریافت خواهید کرد. گاهی اوقات خوشه ها با یکدیگر همپوشانی دارند […]

دسته بندی دانشمندان داده

دانشمندان داده بسته به مهارت هایی که دارند  با وظایف مختلفی در صنعت مشغول به کار می شوند.  در زیر به دسته بندی و انواع مهارت های دانشمندان داده می پردازیم: کسانی که در آمار قوی هستند. آنها گاهی اوقات تئوری های آماری جدیدی را برای کلان داده ها ایجاد می کنند که حتی آماردانان […]

هوش مصنوعی (AI) چیست؟ 3 چیز که باید بدانید

هوش مصنوعی (AI) چیست؟ 3 چیز که باید بدانید هوش مصنوعی (artificial intelligence) یا AI، شبیه سازی هوشمند رفتار انسان است. این شبیه سازی یک رایانه و یا سیستمی است که برای درک محیط خود، رفتارهای آن و اقدام به یک عکس العمل طراحی شده است. اتومبیل‌های خودران (تمام اتوماتیک) را در نظر بگیرید: سیستم‌های […]

انتخاب مدل در یادگیری ماشینی

انتخاب مدل در یادگیری ماشینی ما اغلب به توسعه مدل هایی با استفاده از مجموعه ای از متغیرهای پیش بینی کننده (predictor variables) و یک متغیر پاسخ (response variable) در زمینه یادگیری ماشینی علاقه مند هستیم. هدف ما ایجاد مدلی است که بتواند به طور موثر مقدار متغیر پاسخ را با استفاده از متغیرهای پیش […]