مشروع علم البيانات بلغة بايثون


Training Description
تم تصميم مشاريع علوم البيانات مع Python لتمنحك إرشادات عملية حول تحليل البيانات المعياري في الصناعة وأدوات التعلم الآلي في Python ، بمساعدة بيانات واقعية. ستساعدك الدورة على فهم كيف يمكنك استخدام الباندا و Matplotlib لفحص مجموعة بيانات بشكل نقدي مع ملخص للإحصاءات والرسوم البيانية ، واستخراج الرؤي التي تسعى إلى اشتقاقها. ستستمر في البناء على معرفتك بينما تتعلم كيفية إعداد البيانات وإطعامها لخوارزميات التعلم الآلي ، مثل الانحدار اللوجستي المنتظم والغابة العشوائية ، باستخدام حزمة التعلم المعرفية. ستكتشف كيفية ضبط الخوارزميات لتقديم أفضل التوقعات للبيانات الجديدة وغير المرئية. عندما تتعمق في الفصول اللاحقة ، ستتمكن من فهم عمل وإخراج هذه الخوارزميات والحصول على نظرة ثاقبة ليس فقط في القدرات التنبؤية للنماذج ولكن أيضًا أسبابها في عمل هذه التنبؤات.
Training Course index
Lesson 1
Data Exploration and Cleaning
• Python and the Anaconda Package Management System
• Different Types of Data Science Problems
• Loading the Case Study Data with Jupyter and pandas
• Data Quality Assurance and Exploration
• Exploring the Financial History Features in the Dataset
• Activity 1: Exploring Remaining Financial Features in the Dataset
Lesson 2
Introduction to Scikit-Learn and Model Evaluation
• Introduction
• Model Performance Metrics for Binary Classification
• Activity 2: Performing Logistic Regression with a New Feature and Creating a Precision-Recall Curve
Lesson 3
Details of Logistic Regression and Feature Exploration
• Introduction
• Examining the Relationships between Features and the Response
• Univariate Feature Selection: What It Does and Doesn't Do
• Building Cloud-Native Applications
• Activity 3: Fitting a Logistic Regression Model and Directly Using the Coefficients
Lesson 4
The Bias-Variance Trade-off
• Introduction
• Estimating the Coefficients and Intercepts of Logistic Regression
• Cross Validation: Choosing the Regularization Parameter and Other Hyperparameters
• Activity 4: Cross-Validation and Feature Engineering with the Case Study Data
Lesson 5
Decision Trees and Random Forests
• Introduction
• Decision trees
• Random Forests: Ensembles of Decision Trees
• Activity 5: Cross-Validation Grid Search with Random Forest
Lesson 6
Imputation of Missing Data, Financial Analysis, and Delivery to Client
• Introduction
• Review of Modeling Results
• Dealing with Missing Data: Imputation Strategies
• Activity 6: Deriving Financial Insights
• Final Thoughts on Delivering the Predictive Model to the Client
Training course outcomes
استكشاف البيانات وتنظيفها
مقاييس الأداء النموذجية للتصنيف الثنائي
بناء تطبيقات السحابة الأصلية
تقدير معاملات وتقاطعات الانحدار اللوجستي
أشجار القرار والغابات العشوائية
إدخال البيانات المفقودة والتحليل المالي والتسليم للعميل
Training Pre-requirements
المؤهلات: المعرفة الالمام بالبرمجة بلغة البايثون الالمام بتحليل البيانات والاحصاء
مستوى الخبرة خبرة لا تقل عن سنة في مجال البيانات والبرمجة والاحصاء القدرات
اللغة الانجليزية
بالنسبة للأجهزة والأدوات البرمجيات: ستحتاج أيضًا إلى تثبيت البرامج التالية مسبقًا: نظام التشغيل: Windows 7 SP1 64 بت أو Windows 8.1 64 بت أو Windows 10 64 بت أو Ubuntu Linux أو أحدث إصدار من OS X المتصفح: Google Chrome / Mozilla Firefox أحدث إصدار Notepad ++ / Sublime Text as IDE (اختياري ، حيث يمكنك ممارسة كل شيء باستخدام Jupyter notecourse على متصفحك) تم تثبيت Python 3.4+ (آخرها Python 3.7) (من https://python.org) مكتبات Python حسب الحاجة (J
Related Professional Certificates |
|
---|---|
Trainer Name |
|
Trainer Experiences |
|