جمعه , ۱۵ آذر ۱۳۹۸
صفحه اصلی » داده کاوی » ۱۰ کتاب رو میزی برای هر تحلیلگر داده
علم داده

۱۰ کتاب رو میزی برای هر تحلیلگر داده

در دنیایی زندگی می کنیم که از داده اشباع شده است. در حال حاضر ۲٫۷ زتابایت داده در جهان دیجیتال اطراف ما در حال پرواز بوده و منتظر تحلیل و اکتشاف بوسیله ما است.

کسب قابلیت درک، ارزش گذاری و تجزیه و تحلیل داده ها به نفع خودمان و سازمانمان، موجب حصول بینش های ارزشمند بسیار زیادی در حوزه کسب کار شده و به شکوفایی آن کمک می کند.

رشته علم داده، شاخه ای پویا و همیشه در حال تحول و رو به گسترش است که تقریباً برای هر کسب و کاری، کاربردهای قابل تصوری دارد. با دستیابی به درک عمیق در مورد علم داده و بسیاری از شاخه های آن در کسب و کار، قادر خواهیم بود به مزایای رقابتی مهم و قابل تاملی برسیم که ما را در موقعیتهای مختلف تجاری کمک کند.

در این گفتار، با توجه به علاقه مندی بسیاری که جدیدا برای یادگیری علم داده بوجود آمده است، ۱۳ کتاب مهم و خوب در این حوزه را معرفی می کنم.

چرا لازم است در مورد علم داده مطالعه کنیم؟

قبل از اینکه به شما بگویم که چرا هر یک از کتابها چه مزایایی دارند و چه اطلاعاتی به شما می دهند، مهم است که زمینه هایی را در مورد این زمینه علمی مهیج و مدرن به شما ارائه دهم.

در سال ۲۰۱۸، کمتر از ۰٫۵٪ از کل داده های موجود مورد تجزیه و تحلیل، استفاده و درک قرار گرفته اند. به عبارت دیگر، جریان های عظیمی از داده ها هنوز مورد بررسی قرار نگرفته اند، داده هایی که در صورت تحلیل درست و هدفمند سطح بینشی پیشگامانه برای هر کسب و کار و دانشی ایجاد می شود. برای دانشمندان علم داده، پتانسیل هایی وجود دارد که با باز کردن قفل این اقیانوس به ظاهر نامحدود، آزاد خواهد شد.

علم داده که به عنوان “علم داده محور” نیز شناخته می شود، طیف فوق العاده گسترده ای را پوشش می دهد. این زمینه بین رشته ای، از روش ها، فرآیندها و سیستم های علمی تشکیل شده است که به افراد کمک می کند تا دانش یا بینش موجود در داده ها را در مجموعه ای از اشکال، ساختارها یا بدون ساختار، مشابه داده کاوی استخراج کنند.

با درک کلیه عناصر اصلی علم داده و استفاده از روشهای آن در جنبه های مختلف کسب و کار، چه داخلی و چه خارجی، طیف گسترده ای از نتایج بلند مدت را به دست خواهید آورد، و اطمینان حاصل خواهید کرد که همچنان مرتبط و رقابتی عمل کنید.

اگر می خواهید درک عملی از علم داده بدست آورید یا مهارت های موجود خود را به قله های جدید و هیجان انگیز برسانید، کتبهای زیر بهترین کتاب های مربوط به علم داده است که باید خوانده شوند.

حالا بدون هرگونه تبلیغات بیشتر، به معرفی کتابها می پردازم.

Artificial Intelligence in Practice

کتاب هوش مصنوعی در عمل ( با نام اصلی Artificial Intelligence in Practice: How 50 Successful Companies Used AI and Machine Learning to Solve Problems) یک کتاب عملیاتی و کاربردی در حوزه علم داده است که به دلیل علاقه شخصی به آن در صدر فهرست آوردم.

من میخواهم از نویسنده کتاب برنارد مار (Bernard Marr) با عنوان برنارد افسانه ای نام ببرم. برای من که این کتاب را بیشتر از ۱۰ بار خوانده ام، هر بار خواندنش و استفاده عملی از آن در مشاوره هایی که به سازمانها در تحلیل داده هایشان می دهم، باز نکات جدیدی به همراه دارد.

این کتاب برای کسانی که به دنبال یک وسیله عملی برای درک چگونگی استفاده از هوش مصنوعی در تقویت علم داده و استفاده از این دانش برای بهبود استراتژی های تجزیه و تحلیل داده های خود هستند، کتابی فوق العاده است.

براساس ۵۰ نمونه اطلاعات واقعی کسب و کار و مطالعات موردی که در این کتاب آورده شده است، این کتاب به طرز شگفت انگیزی مهیج، فوق العاده سرگرم کننده، روشنگر، جذاب و نتیجه گرا است.

Machine Learning Yearning

پرفسور اندرو ان جی (Andrew Ng)، به سبب درس بسیار عالی یادگیری ماشین در سایت coursera.org – که من هم مفتخر به شاگردی ایشان هستم- در تمام دنیا چهره ای شناخته شده است. استادم در دانشگاه کارولینسکا، قبل از اینکه حضوری برای اولین بار ملاقتشان کنم از من خواست اولا این درس یادگیری ماشین را با پروفسور اندرو ان جی بگذرانم و ثانیا زبان برنامه نویسی Perl را یاد بگیرم.

پروفسور اندرو ان جی پیش نویس کتاب فوق را در ۵۸ زیر فصل به رایگان منتشر نموده است. کتاب ایشان را می توانید از لینک زیر مستقیما دانلود کنید.

دانلود کتاب یادگیری ماشین پروفسور اندرو ان جی

Python for Data Analysis: Data Wrangling With Pandas, NumPy and IPython

این کتاب برای افرادی نوشته شده است که با زبان برنامه نویسی پایتون به خوبی آشنا هستند و می خواهند از این توانایی در گسترش دانش داده خود استفاده کنند. پایتون به عنوان یکی از زبانهای برنامه نویسی سطح بالا، بسیار معتبر و پر کاربرد جهان، به ویژه در عصر مدرن، یک ابزار قدرتمند و همه کاره است.

این کتاب فوق العاده که نوشته وس مک کنی (Wes Mc Kinney) آماردان و دانشمند داده آمریکایی است، خواننده را به عمق قلمروهای زبان پایتون و پتانسیل عظیم آن برای دستکاری، پردازش، آماده سازی داده ها و تجزیه و تحلیل داده ها می برد.

اگر به دنبال استفاده از پایتون به عنوان ابزاری مؤثر برای حل مجموعه گسترده ای از مسائل تجزیه و تحلیل داده ها هستید که باعث افزایش هوش و بهره وری در کسب و کار شما می شود، این کتاب دارای یک سری نکات برجسته و راهکارهای بسیار خوب برای این منظور است. یک کتاب پیشرفته علم داده برای هر کسی که با پایتون کشتی می گیرد.

دانلود کتاب Python for Data Analysis

Advanced R

این کتاب برای کسانی که تا حدودی با زبان برنامه نویسی داده محور R آشنایی دارند و می خواهند دانششان را در حوزه کار با داده ها و برنامه نویسی در R توسعه دهند، عالی است.

نویسنده کتاب Hadley Wickham چندین کتاب دیگر درباره زبان R چاپ کرده است و این کتاب به نظر من یکی از شاهکارها برای R است.

برای کسانی که در سفر شگفت انگیز علم داده و داده کاوی روی R کار می کنند، می توانم رک بگویم، این کتاب فوق العاده است. کتاب علاوه بر اینکه یک دید کلی به خواننده اش می دهد، به راحتی و قدم به قدم قابل پیگیری و تمرین است.

یکی از ویژگیهای خیلی جالب کتاب که باعث شد به خواندنش ترغیب شوم و چندین بار از ابتدا تا خط آخر بخوانمش، تمرین هایی است که در آخر هر فصل گذاشته شده است، که در آموزش و فهم تکنیکها بسیار مفیدند.

دانلود کتاب Advance R

The Signal And The Noise: Why So Many Predictions Fail – But Some Don’t

این کتاب یکی از بهترین کتابها برای مدیران عامل، مدیران ارشد بخش دیجیتال، مدیران ارشد اطلاعات و یا صاحبین مشاغلی است که به دنبال افزایش جدی مهارتهای تحلیلی خود، چه از نظر عملی و چه از لحاظ نظری هستند.

این کتاب که تالیف آماردان آمریکایی Nate Silver است، جزو کتابهای پرفروش نیویورک تایمز بوده و یکی از کتابهای سطح بالا در استفاده از قدرت آنالیز داده های بزرگ محسوب می شود. این کتاب به خواننده این بینش و تا حدی توانایی را می دهد تا بتواند پیش بینی های ارزشمند را به روشی آگاهانه و قدرتمند در حوزه کسب و کارش انجام دهد.

نویسنده کتاب، نیت سیلور به خاطر پیش بینی درست نتایج انتخابات ریاست جمهوری ۲۰۱۲ بسیار مشهور است. بر اساس همین تجربیات نویسنده، این کتاب به نوعی از هنر و دانش اصلی ساخت پیش بینی ها بر اساس داده ها پرده بر می دارد. مطالعات موردی متنوع در دنیای واقعی، نمونه های جالبی هستند که مکرر در این کتاب مورد بررسی قرار گرفته اند.

Automate This: How Algorithms Came To Rule Our World 

این کتاب، کتابی عالی برای آندسته از علاقه مندان به فناوری دیجیتال است که به دنبال پر کردن شکاف بین تجزیه و تحلیل داده های بزرگ، الگوریتم های پیچیده و نحوه شکل گیری این عناصر در زندگی آینده ما هستند. اگر سرتان درد می کند برای بررسی الگوریتمها و مکانیسم عملکردشان، این کتاب انتخاب درستی است.

اگرچه، علم داده عمدتاً در مورد پیش بینی هاست، با اینحال، بخش مهمی از این رشته در حال گسترش به سمت الگوریتم های پیچیده گرایش دارد.

در این کتاب علم داده، نویسنده و برنامه نویس پرکار کریستوفر اشتاینر توضیح می دهد که چگونه الگوریتم ها به طور فزاینده ای برای به دست آوردن دنباله های سطح بالایی که روزگاری فقط توسط انسان حل می شدند، در حوزه هایی مثل تشخیص پزشکی و تحلیل سیاست خارجی مورد استفاده قرار می گیرند.

Storytelling With Data: A Data Visualization Guide for Business Professionals

“داستان گویی با داده ها” کتابی فوق العاده برای کسانی است که می خواهند نمایش و تجسم داده ها به کمک نمودارهای مناسب را در سطح حرفه ای و برای محیط های کسب و کار بیاموزند و نمونه های عالی از آن را ببینند و تجربه کنند.

من خودم شخصا در اوایل کارم به عنوان یک پژوهشگر علم داده، همیشه در موقع تنظیم گزارشات نهایی دچار مشکل می شدم.

گزارشات باید ضمن دقت بالا ، ساده و قابل فهم باشند و مدیران را راضی کند.

این کتاب، کتابی روشمند و البته سرگرم کننده است که بینش هایی با ریشه های عمیق در شاخه ای از علم داده ها ارائه می دهد که غالباً از آنها غافل هستیم: هنر قصه گویی از طریق داده ها و شاخص های سرچشمه آنها.

جمله اول سایت مربوط به این کتاب با این جمله متن خود را شروع کرده است:

همینطور ساده داده ها را نمایش ندهید، با آن یک داستان بگویید.

داستان پردازی یک مهارت ذاتی نیست، به خصوص وقتی به تجسم داده ها می پردازیم و ابزارهایی که در اختیار ماست این کار را از این که هست آسانتر نمی کنند، باید مجهز به مهارت داستان گویی باشیم تا قدرت داده ها و تحلیل هایمان را نشان دهیم. این کتاب چگونگی فراتر رفتن از ابزارهای معمولی برای رسیدن به ریشه اطلاعات و نحوه استفاده از داده ها برای ایجاد داستانی جذاب، آموزنده و قانع کننده را نشان می دهد.

جمله ای از این کتاب همیشه مثل یک زنگ خطر در ذهن من فعال است:

درهم و برهمی دشمن شماست.

پیشنهاد میکنم این کتاب را هم در سبد کتابهایی که باید با دقت مطالعه و به کار ببندید، قرار دهید.

دانلود کتاب داستان گویی با داده ها

“Inflection Point: How the Convergence of Cloud, Mobility, Apps, and Data Will Shape the Future of Business”

کتاب ” نقطه عطف” (Inflection Point) یک کتاب عالی برای داده کاوها، مدیران بخش داده و دانشمندان داده است که تمایل دارند در عصر مدرن از داده ها، اطلاعات مناسب و درست استخراج کنند. واقعا، باید بگویم برای یک فرد علاقه مند به علم داده، کتابی بهتر از این پیدا نمی شود!

هرچقدر که کتابهای مربوط به علم داده به جلو می روند، شاید این یکی از آینده نگرانه ترین کتاب های موجود در این حوزه است.

Inflection Point که توسط اسکات استاوسکی، مدیر بخش داده های شرکت هاولت پاکارد (
Hewlett Packard ) ، مورد تائید و تأکید قرار گرفته است، بر چگونگی تغییرات سریع در محاسبات ابری، داده های بزرگ، دستگاه های تلفن همراه و اپلیکیشن ها و نحوه رقابت کارها را نشان می دهد. این مشاهدات ذهن، پیش بینی های حیرت انگیز و پیش گیری های ارزشمند، خواندن این کتاب علوم اطلاعات برای هر کسی که سعی دارد از طریق ابارهای داده ها کشف کند و در دنیای امروز – و فردا – پیشرفت کند، امری ضروری است. به نظر من همه کتابهای علوم داده ای که در آینده قرار است چاپ شوند، باید از این کتاب ایده بگیرند.

“Hadoop, the Definitive Guide: Storage and Analysis at an Internet Level”

این کتاب یکی از بهترین کتابها برای یک جنگجوی حوزه علم داده با چشمهای کاملا باز است که با یک عطش خاص و غیرقابل توصیف برای ایجاد سیستم های مقیاس پذیر از داده ها تلاش می کند. بدون شک این کتاب یکی از جالب ترین کتاب های علم داده در لیست من است.

در یکی از بهترین کتابهای علوم داده در رابطه با زبان پردازش، تام وایت خوانندگان خود را به یک سفر مبتنی بر داده ها برده و به آنها در درک اهمیت و چگونگی استفاده از Hadoop کمک می کند و نشان می دهد که اگر Hadoop خردمندانه مورد استفاده قرار گیرد، می توان بسیاری از کارهای باورنکردنی را با آن انجام داد.

این موارد باورنکردنی شامل توانایی ساخت و مدیریت سیستم های مقیاس پذیر با Hadoop و اجرای موفقیت آمیز آن است.

“Doing Data Science: Straight Talk from the Frontline”

کتابی عالی برای دانشمندان داده ای است که به دنبال معرفی جامع، قابل درک و ملموس در این زمینه هستند.
یکی از بهترین کتابهای موجود در مورد علم داده، کتاب “Doing Data Science: Straight Talk” است که یک معرفی واضح ، مختصر و جذاب در این زمینه را ارائه می دهد.

این کتاب بر اساس درسی در دانشگاه کلمبیا با عنوان مقدمه ای بر علم داده، نوشته شده است. خود این ویژگی باعث شده است تا این کتاب، کتابی عالی در مورد مقدمات علم داده و کلان داده باشد.

این کتاب اگرچه مقدمه ای بر داده های کلان و علم داده است، با اینحال، ضمن ارائه راهنمایی های مناسب و درکی واضح و عملی از حوزه علم داده، در دستیابی به دانش در مورد داده ها و اجرا بسیار کمک کننده است و به طور روز افزون تخصص شما را افزایش می دهد.

به نظر من این کتاب، کتابی است که اول از همه باید خوانده شود.

این کتاب با همکاری مشترک، کتی اونیل و نیچر ریاضی دان و دانشمند داده ریچل شوت نوشته شده و من فکر می کنم یکی از بهترین کتابها برای شروع علم داده است.

درباره‌ افشین صفایی

این مطلب را نیز بخوانید

الگا توکارچوک برنده جایزه نوبل ادبیات سال 2018

الگا توکارچوک (برنده جایزه نوبل ادبیات)

الگا توکارچوک به عنوان برنده جایزه ادبیات نوبل در سال ۲۰۱۸ ، در سال ۲۰۱۹ …

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *