Data Science Fundamentals Module

Data Science Interview Common Topics 1. Data Preprocessing: Handling missing values, outliers, and data normalization. 2. Machine Learning: Supervised and unsupervised learning, model evaluation, and selection. 3. Data Visualization: Communicating insights effectively using plots and charts. 4. Statistical Analysis: Hypothesis testing, confidence intervals, and regression analysis. 5. Domain Knowledge: Understanding the specific industry or problem domain. Types of Questions 1. Technical Questi

Uploaded by

havanoproduction

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

70 views6 pages

Data Science Fundamentals Module

Uploaded by

havanoproduction

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Feb 2024 - June 2024 Module Description

HTENG418/HCSCI439

Fundamentals of Data Science and

Big Data
Harry Mafukidze
(MEng Electronic Engineering)
Forewood
Data science is an interdisciplinary field encompassing scientific methods, processes, and
systems to extract knowledge or insights from data in various forms, either structured
or unstructured. It draws principles from mathematics, statistics, information science,
computer science, machine learning, visualization, data mining, and predictive analytics.
However, it is fundamentally grounded in mathematics. This module explains and applies
the fundamentals of data science crucial for learners who are interested in practicing data
science. It is an example driven subject providing complete Python examples to comple-
ment and clarify data science concepts, and enrich the learning experience.
The module is a necessary precursor to applying and implementing machine learning al-
gorithms, because it introduces the learner to foundational principles of the science of
data. In-depth knowledge of Python programming isn’t required, although basic princi-
ples of any high-level programming language is required.

Learning Outcomes
Ș Apply quantitative modeling and data analysis techniques to solve real world business
problems
Ș Demonstrate proficiency with statistical analysis of data
Ș Develop core competencies in programming, statistics, data analytics and machine
learning
Ș Develop the ability to build and assess data-based models
Ș Effectively present results using data visualization techniques
What do data scientists do?
Regardless of whether data science is just a part of statistics, and regardless of the domain to which
we’re applying data science, the goal is the same: to turn data into actionable value. The professional
society defines the related field of analytics as “the scientific process of transforming data into insight
for making better decisions.”

Turning data into actionable value usually involves answering questions using data. Here’s a typical
workflow for how that plays out in practice.

1. Obtain data that you hope will help answer the question.
2. Explore the data to understand it.
3. Clean and prepare the data for analysis.
4. Perform analysis, model building, testing, etc. (The analysis is the step most people think of
as data science, but it’s just one step! Notice how much more there is that surrounds it.)
5. Draw conclusions from your work.
6. Report those conclusions to the relevant stakeholders.

Our module focuses on all the steps except for the analysis. It is assumed that you have some basic
statistical analysis in one of the modules, and we will leverage that. (Later in our course we will review
simple linear regression and hypothesis testing.) If you have taken other relevant modules in statis-
tics, mathematical modeling, etc., and want to bring that knowledge in to use in this module, great,
but it’s not a requirement.
Syllabus
1. Introduction: 4. Mathematical Foundattions
- Big Data Overview, - Simple Linear Regression
- Importance of data science, - Multiple Linear Regression
- Big data analytics in industry verticals. - Logistic Regression
2. Data Analytics Lifecycle and methodology: 5. Visualization Techniues
- Business Understanding, - Data Visualization
- Data Understanding, - Histograms
- Data Preparation, - Scatter Plots
- Modelling and Evaluation. 6. Unsupervised Learning
3. Data exploration and pre-processing, Data - K-Means clustering
Analytics: - Density based clustering
- Theory and Methods, 7. Supervised Learning
- Unstructured Data Analytics, - CNN
- Data Visualization Techniques, - ANN
- Creating final deliverables - RNN
Assessment
• Assignments 15%
• Tests 25%
• Exam 60%

References
• Marz N, Warren J, Big Data: Principles and best practices of scalable realtime data
systems.
• Mayer-Schönberger V, Cukier K Big data: A revolution that will transform how we live,
work, and think.
• Zikopoulos P, Eaton C, Understanding big data: Analytics for enterprise class hadoop
and streaming data

JNTU Hyderabad Data Science Syllabus
No ratings yet
JNTU Hyderabad Data Science Syllabus
117 pages
Data Science and Big Data Analytics Course
No ratings yet
Data Science and Big Data Analytics Course
119 pages
Data Science Foundations Course Overview
No ratings yet
Data Science Foundations Course Overview
216 pages
Data Science & Analytics Course Overview
No ratings yet
Data Science & Analytics Course Overview
142 pages
Comprehensive Data Science Course
No ratings yet
Comprehensive Data Science Course
3 pages
Data Science Fundamentals Overview
No ratings yet
Data Science Fundamentals Overview
15 pages
OCS353 Data Science Fundamentals Syllabus
100% (4)
OCS353 Data Science Fundamentals Syllabus
121 pages
Data Science Module Overview for BSIT
No ratings yet
Data Science Module Overview for BSIT
48 pages
Foundations of Data Science Overview
No ratings yet
Foundations of Data Science Overview
64 pages
Data Science Essentials: A Comprehensive Guide
No ratings yet
Data Science Essentials: A Comprehensive Guide
27 pages
Introduction to Data Science Essentials
No ratings yet
Introduction to Data Science Essentials
12 pages
Intro to Big Data Tools and Techniques
No ratings yet
Intro to Big Data Tools and Techniques
3 pages
Introduction to Data Science Course
100% (2)
Introduction to Data Science Course
52 pages
Introduction to Data Science Course
No ratings yet
Introduction to Data Science Course
52 pages
Data Science Final Exam Overview
No ratings yet
Data Science Final Exam Overview
3 pages
Data Science Fundamentals Syllabus
No ratings yet
Data Science Fundamentals Syllabus
84 pages
Fundamentals of Data Science Module
No ratings yet
Fundamentals of Data Science Module
65 pages
Data Science for Engineers Course Overview
No ratings yet
Data Science for Engineers Course Overview
15 pages
Intro to Data Science Course Overview
No ratings yet
Intro to Data Science Course Overview
2 pages
Data Science Handbook for Beginners
No ratings yet
Data Science Handbook for Beginners
10 pages
Data Science Fundamentals Overview
No ratings yet
Data Science Fundamentals Overview
8 pages
Overview of Data Science Techniques
No ratings yet
Overview of Data Science Techniques
8 pages
Data Science: Concepts and Workflow Guide
No ratings yet
Data Science: Concepts and Workflow Guide
4 pages
Introduction to Data Science Course
No ratings yet
Introduction to Data Science Course
25 pages
Big Data Analytics in Data Science
No ratings yet
Big Data Analytics in Data Science
18 pages
Introduction to Data Science with R
No ratings yet
Introduction to Data Science with R
52 pages
Introduction to Data Science Basics
No ratings yet
Introduction to Data Science Basics
24 pages
Data Science Fundamentals with Python
No ratings yet
Data Science Fundamentals with Python
143 pages
Introduction to Data Science Concepts
No ratings yet
Introduction to Data Science Concepts
9 pages
Foundations of Data Science Course Outline
No ratings yet
Foundations of Data Science Course Outline
64 pages
Data Science Fundamentals Overview
No ratings yet
Data Science Fundamentals Overview
20 pages
Introduction to Data Science Course
No ratings yet
Introduction to Data Science Course
76 pages
Free Data Science Training in Hyderabad
No ratings yet
Free Data Science Training in Hyderabad
16 pages
Introduction to Data Science Course
No ratings yet
Introduction to Data Science Course
5 pages
Data Science - 20260103 - 154622 - 0000
No ratings yet
Data Science - 20260103 - 154622 - 0000
12 pages
FDS ENCT 202 Syllabus Overview
No ratings yet
FDS ENCT 202 Syllabus Overview
4 pages
Data Science & Analytics - Complete Course
No ratings yet
Data Science & Analytics - Complete Course
12 pages
Best Data Science Course in Hyderabad
No ratings yet
Best Data Science Course in Hyderabad
16 pages
Data Science Notes Unit 1
No ratings yet
Data Science Notes Unit 1
32 pages
Introduction to Data Science Basics
No ratings yet
Introduction to Data Science Basics
12 pages
Introduction to Data Science Basics
No ratings yet
Introduction to Data Science Basics
356 pages
Introduction to Data Science Basics
No ratings yet
Introduction to Data Science Basics
70 pages
DS01
No ratings yet
DS01
35 pages
Data Science Internship Overview 2021
67% (3)
Data Science Internship Overview 2021
23 pages
Understanding Data Science Basics
No ratings yet
Understanding Data Science Basics
85 pages
Data Science Fundamentals Overview
No ratings yet
Data Science Fundamentals Overview
17 pages
Introduction to Data Science Course
No ratings yet
Introduction to Data Science Course
15 pages
Understanding Data Science Essentials
No ratings yet
Understanding Data Science Essentials
2 pages
Data Science Course Overview and Goals
No ratings yet
Data Science Course Overview and Goals
5 pages
Introduction to Data Science Basics
No ratings yet
Introduction to Data Science Basics
44 pages
Data Science Workshop Overview
No ratings yet
Data Science Workshop Overview
3 pages
Data Science Overview and Career Paths
No ratings yet
Data Science Overview and Career Paths
33 pages
Fundamentals of Data Science Overview
80% (5)
Fundamentals of Data Science Overview
62 pages
Understanding Data Science Essentials
No ratings yet
Understanding Data Science Essentials
9 pages
INTRODUCTION TO DATA SCIENCE AND DATA (1)
No ratings yet
INTRODUCTION TO DATA SCIENCE AND DATA (1)
18 pages
Introduction to Data Science Concepts
No ratings yet
Introduction to Data Science Concepts
6 pages
Data Science Course Overview in Pitampura
No ratings yet
Data Science Course Overview in Pitampura
19 pages
Project Management Exam Answers 2023
No ratings yet
Project Management Exam Answers 2023
14 pages
Antenna Engineering Overview and Types
No ratings yet
Antenna Engineering Overview and Types
48 pages
Satellite Communications Q&A Guide
No ratings yet
Satellite Communications Q&A Guide
21 pages
Next Generation Telecom Network Strategies
No ratings yet
Next Generation Telecom Network Strategies
15 pages
Overview of Satellite Communication
No ratings yet
Overview of Satellite Communication
20 pages
IoT-Based Power Fault Monitoring System
No ratings yet
IoT-Based Power Fault Monitoring System
3 pages
ITU's Role in Global Telecommunications
No ratings yet
ITU's Role in Global Telecommunications
13 pages
Observability Tools for RAG Systems
No ratings yet
Observability Tools for RAG Systems
7 pages
Understanding OLAP: Types and Operations
No ratings yet
Understanding OLAP: Types and Operations
8 pages
ICT in Dutch Hospitals: A Student Inquiry
No ratings yet
ICT in Dutch Hospitals: A Student Inquiry
2 pages
Beyond NoSQL: File Systems & Databases
No ratings yet
Beyond NoSQL: File Systems & Databases
17 pages
EMR Implementation in Philippine Healthcare
No ratings yet
EMR Implementation in Philippine Healthcare
4 pages
Transforming EER to Relational Model
No ratings yet
Transforming EER to Relational Model
50 pages
Database Management Systems Overview
No ratings yet
Database Management Systems Overview
6 pages
File System vs. DBMS: Pros and Cons
No ratings yet
File System vs. DBMS: Pros and Cons
5 pages
CCS370 UI/UX Design Question Bank
No ratings yet
CCS370 UI/UX Design Question Bank
11 pages
Building Information Systems
100% (1)
Building Information Systems
46 pages
Azure Databricks Comprehensive Guide
No ratings yet
Azure Databricks Comprehensive Guide
27 pages
Approaches to MIS Development Explained
100% (4)
Approaches to MIS Development Explained
2 pages
Automating ID Card Generation with UiPath
No ratings yet
Automating ID Card Generation with UiPath
9 pages
Online Football Field Booking SRS
No ratings yet
Online Football Field Booking SRS
6 pages
Types of Database Languages Explained
No ratings yet
Types of Database Languages Explained
2 pages
AI Tools for Effortless Blog Writing
No ratings yet
AI Tools for Effortless Blog Writing
2 pages
Movie Recommendation System Using ML
No ratings yet
Movie Recommendation System Using ML
12 pages
Al Rajhi Bank Transfer Receipt
No ratings yet
Al Rajhi Bank Transfer Receipt
6 pages
IJWOS0202202502
No ratings yet
IJWOS0202202502
7 pages
Understanding Library Skills for Students
No ratings yet
Understanding Library Skills for Students
10 pages
Practical SQL Guide for Engineers
No ratings yet
Practical SQL Guide for Engineers
76 pages
Database Management Systems Course Overview
No ratings yet
Database Management Systems Course Overview
6 pages
Quickbooks Pro 2010 Manual: Ckytlynwux
No ratings yet
Quickbooks Pro 2010 Manual: Ckytlynwux
3 pages
Vettius Valens: Public Domain Access
No ratings yet
Vettius Valens: Public Domain Access
461 pages
Keyword Extraction from MRI Reports
No ratings yet
Keyword Extraction from MRI Reports
14 pages
SAP BW/4HANA Data Acquisition Guide
No ratings yet
SAP BW/4HANA Data Acquisition Guide
53 pages
Detecting Online Terrorism with AI Tools
No ratings yet
Detecting Online Terrorism with AI Tools
8 pages
MySQL Query Optimization Techniques
No ratings yet
MySQL Query Optimization Techniques
8 pages
West Bengal Commercial Tax Help Desk
No ratings yet
West Bengal Commercial Tax Help Desk
1 page
Final MC - 0088
No ratings yet
Final MC - 0088
8 pages

Data Science Fundamentals Module

Uploaded by

Data Science Fundamentals Module

Uploaded by

Feb 2024 - June 2024 Module Description

Fundamentals of Data Science and

You might also like