آموزش پایتون برای Data Science

2 دقیقه مطالعه

در اینجا فرض من اینه که شما از سیستم‌عامل‌ لینوکس ترجیحا Debian و یا Ubuntu استفاده می کنین ولی برای کسی که بخواد با ویندوز کار کنه یکم سرچ با گوگل می تونه مفید باشه.

پایتون برای Data Science

یکی از ویژگی‌های خوب پایتون اینه که برای خیلی از زمینه‌های تحقیقاتی براش یه عالمه کتابخونه پیدا می‌شه. تو اینجا یه سری کتابخونه برای کارهای مربوط به Data Science (و همین‌طور مباحثی اختصاصی‌تر مانند محاسبات عددی، آمار و احتمال) هستن رو می خواهیم با هم بررسی کنیم و تعدادی از فانکشنالیتی های مربوط به اون‌ها رو هم با تعدادی مثال ببینیم.

برای شروع کار اول باید ابزاری که باهاش می‌خواهیم شروع به یادگیری بکنیم رو انتخاب کنیم. در حالت کلی ابزار و محیط‌های دولوپمنت زیادی برای پایتون وجود داره که چند تا از مهمترین اونا عبارت‌اند از

  • IntelliJ IDEA
  • Pycharm
  • Spyder
  • Jupyter.

در مورد دوتای اول می تونم بگم که اونا محیط‌های دولوپمنت خیلی کاملی برای پایتون هستن و توی کارایی که می‌خواهیم نرم‌ازار بنویسیم توصیه اولیه به استفاده از اون‌هاست ولی این دو تا ابزار برای مواقعی که می‌خواهیم یه سری داده رو به صورت ماتریس و بردار در برناممون داشته باشیم چندان مناسب نیستن. چون در اغلب مواردی که یه نفر می‌خواد با داده به صورت تحلیلی کار کنه و یه سری از روش‌های جبری و آماری رو روی ماتریس‌هایی که از داده‌های خونده‌شده ران کنه توی محیط‌هایی مثل پایچارم ممکنه دچار مشکلات زیادی بشه. در واقع ران کردن بعضی از متد‌ها روی ماتریس‌هایی با ابعاد بالا ممکنه خیلی هزینه‌ی زمانی و حافظه‌ای زیادی بخواد و مطلوب باشه که فقط ما یه بار بخشی از کد رو که مربوط به این متده هستش رو ران کنیم و نتیجهشو تا وقتی که بخواهیم توی محیط کارمون با داشته باشیم. یه راه اینکار اینه که محیط ما به صورت سلول‌هایی حافظه‌دار باشه که ما تصمیم میگیریم کدوم سلول ران بشه و مدیریت حافظه‌ی مصرفی هم تا حد زیادی دست خودمون باشه.

یه ابزار که خیلی خوب می تونه یه محیط سلولی به ما بده که بتونیم کدمون رو روش اجرا کنیم یه کتابخونه‌ی پایتونه به نام Jupyter (البته این ابزار غیر از پایتون حدود ۵۰ تا زبون برنامه‌نویسی معروف دیگرم پشتیبانی می‌کنه) هست که نسبتا خیلی ساده میشه‌ از اون به عنوان یه محیط تحلیلی و آماری استفاده کرد.

نصب

برای نصب ژوپیتر می‌تونین از هرکدوم از دستورات زیر استفاده کنین:

توی ترمینال Debian و با استفاده از pip

sudo pip install jupyter

و یا

sudo pip3 install jupyter

استفاده

برای شروع کار ابتدا یک پوشه با نام دلخواه خود ایجاد کنید مثلا

cd /home/$USER/Desktop
mkdir -p jupyter_ds
cd jupyter_ds

بعد از تغییر دادن دیرکتوری و رفتن به پوشه‌ی مورد نظر (در اینجا jupyter_ds) با دستور زیر می تونین کار با ژوپیتر رو برای اولین‌ بار شروع کنین.

jupyter notebook password

که نتیجش درخواست سیستم برای درج یک کلمه‌ی عبور خواهد بود برای محیط ژوپیتر خودتون. تنظیم رمز عبور

در نسخه‌‌ی جدید ژوپیتر رمزگذاری برای ژوپیتر اجباری شده و برای همین در اولین اجرا شما باید از دستور بالا استفاده کنین ولی بعد از تنظیم کلمه‌ی عبور فقط کافیه از

jupyter notebook 

استفاده کنین.

بعد از درج رمز عبور دیگه تقریبا همه چیز برای کار کردن با ژوپیتر آمادس. بعد از شروع به کار کردن، ژوپیتر در اینجا قابل دسترسی خواهد بود. شروع

بعد از رفتن درسترسی به آدرس انتشار ژوپیتر شما می‌تونین اولین داشبورد (بهش نوت بوک هم میگن) رو بسازین و شروع کنین به نوشتن کد پایتون، تصاویر آورده‌شده در زیر هم یه سری مثالن برای شروع کار با ژوپیتر: ایجاد یک داشبورد نام‌گذاری داشبورد نوشتن کد پایتون در یک داشبورد ژوپیتر

نظر خود را بنویسید

ایمیل شما منتشر نخواهد شد. فیلد های الزامی *

در حال بارگذاری...