چند پروژه برای مبتدیان علم داده
آیا به دنبال پروژه هایی مبتدیان علم داده هستید؟ اگر اینطوره این مقاله شامل فهرستی از 10 پروژه است که مناسب افراد مبتدی هستش.
این پروژه ها می تونند به شما کمک کنند تا مهارت های علم داده خودتون رو تقویت کنید و در عین حال رزومه خودتون رو نیز ارتقا بدید.
پروژه ها برای مبتدیان علم داده
بیایید به 10 پروژه برای مبتدیان علم داده نگاه کنیم.
(1) سیستم توصیه
اگر در یادگیری ماشینی تازه کار هستید، یک سیستم توصیه مکان خوبی برای شروع است. شما باید سیستمی ایجاد کنید که مواردی را بر اساس خریدهای قبلی کاربر توصیه کند. چیزی شبیه به آمازون یا نتفلیکس. برای مثال می توانید یک سیستم توصیه موسیقی یا فیلم ایجاد کنید. می توانید مجموعه داده های سیستم توصیه گر را در پورتال UCSD بیابید. این پورتال شامل چندین مجموعه داده گسترده است که در پروژه های تحقیقاتی آزمایشگاهی UCSD استفاده شده است. این دروازه دارای مجموعه دادههای متنوعی برای سیستمهای توصیهگر است.
(2) تشخیص خواب آلودگی راننده
تصادفات جاده ای یک نگرانی بزرگ است و یکی از دلایل اصلی آن خواب آلودگی رانندگان است. با این حال، ممکن است با اجرای یک سیستم تشخیص خواب آلودگی راننده از این مشکل جلوگیری کنید. سیستم تشخیص خستگی راننده با تجزیه و تحلیل مداوم چشمان راننده و هشدار دادن به او با آلارم، خواب آلودگی راننده را تشخیص می دهد. یک وب کم برای این پروژه برای نظارت بر چشمان راننده مورد نیاز است. با استفاده از Python، OpenCV و Keras ، زمانی که راننده احساس خستگی کند، هشدار داده می شود.
(3) تجزیه و تحلیل احساسات
تحلیل احساسات در پردازش زبان طبیعی برای تفسیر احساسات و دسته بندی آنها به عنوان مثبت، منفی یا خنثی استفاده می شود. تجزیه و تحلیل احساسات در زمینه های مختلفی از جمله تجارت استفاده می شود. کسب و کارها از تجزیه و تحلیل احساسات استفاده می کنند تا در مورد افکار مشتریان خود بیاموزند و خدمات خود را با استفاده از بازخورد مشتری افزایش دهند.
(4) تشخیص اخبار جعلی
اخبار جعلی به طور گسترده در سراسر جهان منتشر می شود. بنابراین، چگونه می توانیم بین اخبار واقعی و دروغ تفاوت قائل شویم؟ برای ارائه راه حل از پایتون استفاده می شود. در این تکلیف باید از زبان برنامه نویسی پایتون برای ایجاد مدلی استفاده کنید که بتواند درست یا نادرست بودن خبر را تشخیص دهد. برای تکمیل این پروژه، از TfidfVetorizer استفاده کنید و از PassiveAggressiveClassifier برای تقسیم اخبار به دستههای «واقعی» و «جعلی» استفاده کنید.
(5) یک ربات چت بسازید
هنگامی که با محصولی مشکل دارید، باید با خدمات مشتری تماس بگیرید. بنابراین، اگر با سوال خود پیامی ارسال کنید، در عرض چند ثانیه پاسخ دریافت خواهید کرد. بنابراین، این یک ربات پشتیبانی مشتری است که زبان شما را پردازش می کند و سپس به درخواست شما پاسخ می دهد.
(6) پیش بینی قیمت سهام
یکی دیگر از آزمایشهای یادگیری ماشینی عالی برای مبتدیان این آزمایش است. شرکت ها و صنایع مختلف به دنبال نرم افزاری هستند که بتواند عملکرد آنها را ردیابی و ارزیابی کند و همچنین قیمت سهام آتی را پیش بینی کند. شما می توانید به عنوان یک تازه کار، یک پروژه یادگیری ماشینی ایجاد کنید که قیمت سهام را برای چند ماه آینده پیش بینی می کند.برای این کار باید نحوه استفاده از شبکه عصبی LSTM برای پیشبینی ارزش سهام و نحوه استفاده از Plotly dash برای ایجاد داشبورد تحقیقات سهام را بدانید.
(7) پیش بینی آتش سوزی جنگل
آتش سوزی جنگل ها یک اتفاق معمول در جامعه امروزی است. محیط زیست ما در اثر آتش سوزی جنگل ها آسیب می بیند. آتش سوزی جنگل ها نیز تهدیدی جدی برای حیات وحش است. با استفاده از خوشه بندی k-means، می توانید یک سیستم پیش بینی آتش سوزی جنگل ایجاد کنید. نقاط اصلی آتش سوزی و شدت آنها توسط سیستم پیش بینی آتش سوزی جنگل شناسایی می شود. برای بهبود دقت مدل خود، ممکن است از داده های هواشناسی برای تعیین شایع ترین فصل های آتش سوزی و شرایط آب و هوایی مختلف استفاده کنید.
(8) پروژه شناسایی جعل کارت اعتباری
در این پروژه از برنامه نویسی R و الگوریتم هایی مانند Decision Trees، Logistic Regression، Artificial Neural Networks و Gradient Boosting classifiers برای شناسایی کارت های اعتباری استفاده خواهید کرد. از مجموعه داده تراکنش های کارت برای تمایز بین تراکنش های جعلی و قانونی کارت اعتباری استفاده خواهید کرد. همچنین از تکنیکهای مختلف یادگیری ماشین و منحنیهای عملکرد برای ارزیابی دقت استفاده خواهید کرد.
(9) تشخیص خط جاده
یکی دیگر از گزینه های پروژه جالب برای مبتدیان علم داده این است. این پروژه از خطوطی استفاده میکند که در جادهها برای آموزش تشخیص خطوط به رانندگان انسانی ارائه میشود. کتابخانه OpenCV برای پیاده سازی ایده های بینایی کامپیوتر در این پروژه استفاده می شود. نشانگرهای سفید در دو طرف خط باید شناسایی شوند تا خط را تشخیص دهیم. برای این کار از پوشش قاب استفاده می شود.
(10) تشخیص رنگ با پایتون
این یک پروژه سطح ورودی است که در آن باید یک برنامه تعاملی ایجاد کنید. این برنامه رنگ انتخابی را در هر عکسی تشخیص می دهد. بر اساس مقادیر متنوع رنگ RGB، 16 میلیون رنگ وجود دارد، اما ما فقط تعداد انگشت شماری را می شناسیم. برای انجام این پروژه، به مجموعه دادهای برچسبگذاری شده از تمام رنگهایی که میشناسیم نیاز دارید، و سپس باید بفهمید که کدام رنگ بیشتر به مقدار رنگ انتخابی شباهت دارد. برای تکمیل این پروژه باید با کتابخانه های OpenCV و Pandas Python برای Computer Vision آشنا باشید.
مطالب زیر را هم از دست ندهید
چگونه نتایج حاشیه خطا را تفسیر کنیم؟
نحوه تعیین خودکار تعداد خوشه ها توسط قانون آرنج
هوش مصنوعی (AI) چیست؟ 3 چیز که باید بدانید
تجزیه و تحلیل آماری: تعریف، مثال
روایی نتیجه گیری آماری (SCV) چیست؟
تحلیل سئوال روش تحقیق آزمون دکتری
چگونه نتایج حاشیه خطا را تفسیر کنیم؟
تفاوت بین یادگیری ماشین، علم داده، هوش مصنوعی، یادگیری عمیق و آمار
4 پاسخ