

دوره علــم داده با پایتون
این دوره به صورت حضوری در کارخانه نوآوری مشهد برگزار می شود.
تا کنون ده دوره برگزار شده است.
سرفصل های دوره:
علم داده چیست؟
|
– تعریف علم و داده و در نهایت تعریف علم داده – مسیرهای رسیدن به علم داده – معرفی مفاهیم هوش مصنوعی و نقش
آن در علم داده – کاربردهای تخصص علم داده -آموزش کار با نوت بوک ژوپیتر(Jupiter
Notebook) -بارگزاری فایل ها و نصب Package ها وکتابخانه های پایتون |
روش شناسی علم داده
|
– درک مدل کسب و کار و تعریف مسئله – شناسایی متغیر وابسته و متغیر مستقل، شاخص های کلیدی(KPIs) کسب و کار و
الزامات جمع آوری داده -طرح فرضیه و مدلسازی، ارزیابی مدل و ارائه نتایج در غالب
نمودارها و داده داستان(Data
Story Telling)، آزمون فرضیه صفر |
مبانی پایتون برای علم داده و هوش مصنوعی
|
– معرفی زبان برنامه نویسی پایتون -عبارات و متغیرها – عملگرهای رشته – نوع های داده – ساختار داده در پایتون -لیست، تاپل، دیکشنری، مجموعه، -اصول برنامه نویسی پایتون -شرط ها ،حلقه ها ،توابع ،شی و کلاس،کار با داده در پایتون – خواندن و نوشتن فایل – بارگزاری داده با کتابخانه های مهم علم داده در پایتون(NumPy, pandas, sklearn, SciPy,…) |
تحلیل داده با پایتون
|
– فهم داده، بسته های پایتون برای علم داده، ورود و صدور داده در پایتون،
تفکیک داده، مواجهه با داده از دست رفته – شکل دهی داده ، نرمال کردن داده، تبدیل داده های طبقه بندی به
داده های کمی، تحلیل توصیفی داده، همبستگی، P_value، تحلیل واریانس – طراحی مدلهای دسته بندی، رگرسیون، مصورسازی، ارزیابی
مدل و مدلسازی – ارزیابی کارایی مدل(accuracy, recall, precision, f-measure, error metrics) -تحلیل بیش برازش و کم برازش(overfitting, underfitting) |
مصورسازی داده با پایتون |
-آموزش مصورسازی داده ها و رسم نمودار های تحلیلی با اسستفاده از کتابخانه
های: Matplotlib, seaborn,folium ،Area Plots ،Histograms ،Bar
Charts، Pie Charts ،Box Plots، Scatter Plots،Word Clouds |
یادگیری ماشین با پایتون
|
-آموزش یادگیری با نظارت ، بدون نظارت و نیمه نظارت شده (supervised, unsupervised, semi-supervised learning) -آموزش الگوریتم های: K-Nearest Neighbours ،Evaluation Metrics
in Classification، Introduction to Decision Trees ،Building Decision
Trees ،Intro to Logistic Regression ،Logistic regression
vs Linear regression ، Logistic Regression Training ،Support Vector
Machine ،Intro to Clustering ،Intro to k-Means ،More on k-Means، Intro to
Hierarchical Clustering ،More on Hierarchical Clustering ،DBSCAN ،Content-based
Recommender ،Systems ،Collaborative Filtering, silhouette analysis |
پردازش تصویر مقدماتی |
– معرفی کتابخانه OpenCV، آشنائی با نوع داده تصویر، معرفی فضاهای رنگ -عملیات روی تصاویر ،آشنائی با انواع اعمال فیلترها بر تصاویر، هیستوگرام
تصاویر، استخراج خطوط و مرزها ،ایجاد کانتورها -کار با وب کم و گرفتن تصویر از
دوربین مداربسته و پردازش ویدئو ،دسته بندی تصاویر اعداد دست نوشته ، دسته بندی
تصاویر علائم راهنمائی -تطبیق الگو -تبدیلات مورفولوژیک |
مباحث آزاد جهت معرفی و
آشنایی بیشتر |
Streamlit : ایجاد
داشبورد تحت وب Fastapi : ایجاد API Github: کنترل نسخه
و نگهداری کد Kaggle : شبکه
اجتماعی جامعه علم داده و هوش مصنوعی Tableau : مصورسازی و
داده داستان سرایی Powerbi : مصورسازی |
تصاویر یازدهمین دوره علم داده با پایتون





تصاویر دهمین دوره علم داده با پایتون




