مشروع علم البيانات بلغة بايثون

مشروع علم البيانات بلغة بايثون
32
رقم التدريب 1614
مقدم من: MICROSOFT
هدف التدريب

 تم تصميم مشاريع علوم البيانات مع Python لتمنحك إرشادات عملية حول تحليل البيانات المعياري في الصناعة وأدوات التعلم الآلي في Python ، بمساعدة بيانات واقعية. ستساعدك الدورة على فهم كيف يمكنك استخدام الباندا و Matplotlib لفحص مجموعة بيانات بشكل نقدي مع ملخص للإحصاءات والرسوم البيانية ، واستخراج الرؤي التي تسعى إلى اشتقاقها. ستستمر في البناء على معرفتك بينما تتعلم كيفية إعداد البيانات وإطعامها لخوارزميات التعلم الآلي ، مثل الانحدار اللوجستي المنتظم والغابة العشوائية ، باستخدام حزمة التعلم المعرفية. ستكتشف كيفية ضبط الخوارزميات لتقديم أفضل التوقعات للبيانات الجديدة وغير المرئية. عندما تتعمق في الفصول اللاحقة ، ستتمكن من فهم عمل وإخراج هذه الخوارزميات والحصول على نظرة ثاقبة ليس فقط في القدرات التنبؤية للنماذج ولكن أيضًا أسبابها في عمل هذه التنبؤات.


فهرس موضوعات التدريب


Lesson 1

Data Exploration and Cleaning
• Python and the Anaconda Package Management System
• Different Types of Data Science Problems
• Loading the Case Study Data with Jupyter and pandas
• Data Quality Assurance and Exploration
• Exploring the Financial History Features in the Dataset
• Activity 1: Exploring Remaining Financial Features in the Dataset
Lesson 2

Introduction to Scikit-Learn and Model Evaluation
• Introduction
• Model Performance Metrics for Binary Classification
• Activity 2: Performing Logistic Regression with a New Feature and Creating a Precision-Recall Curve
Lesson 3

Details of Logistic Regression and Feature Exploration
• Introduction
• Examining the Relationships between Features and the Response
• Univariate Feature Selection: What It Does and Doesn't Do
• Building Cloud-Native Applications
• Activity 3: Fitting a Logistic Regression Model and Directly Using the Coefficients
Lesson 4

The Bias-Variance Trade-off
• Introduction
• Estimating the Coefficients and Intercepts of Logistic Regression
• Cross Validation: Choosing the Regularization Parameter and Other Hyperparameters
• Activity 4: Cross-Validation and Feature Engineering with the Case Study Data
Lesson 5

Decision Trees and Random Forests
• Introduction
• Decision trees
• Random Forests: Ensembles of Decision Trees
• Activity 5: Cross-Validation Grid Search with Random Forest
Lesson 6

Imputation of Missing Data, Financial Analysis, and Delivery to Client
• Introduction
• Review of Modeling Results
• Dealing with Missing Data: Imputation Strategies
• Activity 6: Deriving Financial Insights
• Final Thoughts on Delivering the Predictive Model to the Client

مخرجات التعلم

استكشاف البيانات وتنظيفها​

مقاييس الأداء النموذجية للتصنيف الثنائي​

بناء تطبيقات السحابة الأصلية​

تقدير معاملات وتقاطعات الانحدار اللوجستي​

أشجار القرار والغابات العشوائية​

إدخال البيانات المفقودة والتحليل المالي والتسليم للعميل

المتطلبات السابقة للتدريب

المؤهلات: المعرفة الالمام بالبرمجة بلغة البايثون الالمام بتحليل البيانات والاحصاء

مستوى الخبرة خبرة لا تقل عن سنة في مجال البيانات والبرمجة والاحصاء القدرات

اللغة الانجليزية

بالنسبة للأجهزة والأدوات البرمجيات: ستحتاج أيضًا إلى تثبيت البرامج التالية مسبقًا: نظام التشغيل: Windows 7 SP1 64 بت أو Windows 8.1 64 بت أو Windows 10 64 بت أو Ubuntu Linux أو أحدث إصدار من OS X المتصفح: Google Chrome / Mozilla Firefox أحدث إصدار Notepad ++ / Sublime Text as IDE (اختياري ، حيث يمكنك ممارسة كل شيء باستخدام Jupyter notecourse على متصفحك) تم تثبيت Python 3.4+ (آخرها Python 3.7) (من https://python.org) مكتبات Python حسب الحاجة (J

الشهادات الإحترافية المتعلقة
    لا توجد شهادات احترافية مرتبطة بالدورة التدريبية.
اسم مقدم الدورة
  • MOHAMED ABDULLA MOSTAFA ​
خبرات المدرب
  •  

    Experienced    Researcher,    Lecturer, Programmer,   and Mentor with   a demonstrated history of working in the higher education industry. Skilled in Programming, Algorithms, Systems Analysis &Design,   Desktop   Apps, Databases,  Data  Analysis, and Data Science​

    Education:​

    Master of Science in Information Systems​

    Training and Certification:​

    IBM –Coursera  - Databases and SQL for Data Science - Python for Data Science and AI - Data Science Methodology - Open Source tools for Data Science​

    Previous work Experience:​

    Vice Rectorate for Planning and Development King Saud University, Riyadh​

    Data Analyst​

    Facilitated Business Intelligence (BI) procedures by keeping a library of templates and reusable documents that could be used as guides and KPIs.​

    developed new resources to improve business operations​

    Development & Quality Deanship King Saud University, Riyadh​

    System Analyst​

    Produced communication strategies to meet KPIs.​

    Implemented RFP of quality system requirements​

    Dawliasoft Cairo, Egypt –Sana’a, Yemen​

    Software Developer​

    Developed CRM & POS systems for medical companies.​

    Worked on "Sculpture" project as a code generation tool.​

    Publications​

    - Android Sensor Programming by Example (In Press) - Packt Publishing - (Translation License) - Translated Book from English to Arabic​

    - Towards Personality Classification through Arabic Handwriting Analysis - Springer, Cham(doi.org/10.1007/978-3-030-30809-4_51)​

    SybilTrap: A Graph-based Semi-Supervised Learning-based Sybil Defense Scheme - Wiley Online Library​

    Technical Skills:​

    NET Back-end Developer - .NET Desktop Developer - Mobile Android Developer - SQL for Relational Databases - Modeling Dimensional Datawarehouse​

    Business Intelligence Developer (IBM Cognos –Power BI(​

    Programming Languages​

    C++, Experienced - C#.NET, Expert - JAVA, Expert - Python, Expert - CLIPS, Skillful 

     

  • مجال التدريب
  • المسار الوظيفي
    • علم البيانات
  • نوع الدورة
    دورة مهارية
  • طريقة توصيل الدورة
    تفاعلية مباشرة
  • موعد البرنامج تبدأ 10-01-2021 إلى 13-01-2021 لمدة 24 ساعات
انتهت فترة التقديم