0% found this document useful (0 votes)

50 views15 pages

Supervised Learning: LDA and QDA Methods

This document provides an overview of supervised learning methods for classification, including linear discriminant analysis (LDA) and quadratic discriminant analysis (QDA). It discusses conditional probability, Fisher's discriminant analysis, and how LDA finds the linear combination of features that best separates two or more classes. The document also covers evaluating model performance using cross-validation and confusion matrices, and provides an example of applying these methods to digit recognition.

Uploaded by

Ola James

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

50 views15 pages

Supervised Learning: LDA and QDA Methods

Uploaded by

Ola James

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Supervised Learning: Linear Methods (1/2)

Applied Multivariate Statistics – Spring 2012

Overview

 Review: Conditional Probability

 LDA / QDA: Theory
 Fisher’s Discriminant Analysis
 LDA: Example
 Quality control: Testset and Crossvalidation
 Case study: Text recognition

1
Conditional Probability
Sample space

T: Med. Test positive T (Marginal) Probability:

P(T), P(C)
C: Patient has cancer C

New sample space: New sample space:

People with cancer Conditional Probability: People with pos. test
P(T|C), P(C|T) P(C|T)
P(T|C)
large Bayes Theorem: small

P (T jC)P (C)
posterior P (CjT ) = P (T ) prior
Class conditional probability 2
One approach to supervised learning

P (C)P (XjC)
P (CjX) = P (X) » P (C)P (XjC)

Prior / prevalence:
Find some estimate Assume:
Fraction of samples
XjC » N(¹c; §c)
in that class

Bayes rule:
Choose class where P(C|X) is maximal
(rule is “optimal” if all types of error are equally costly)

Special case: Two classes (0/1)

- choose c=1 if P(C=1|X) > 0.5 or
- choose c=1 if posterior odds P(C=1|X)/P(C=0|X) > 1

In Practice: Estimate 𝑃 𝐶 , 𝜇𝐶 , Σ𝐶
3
¡ 1 ¢
QDA: Doing the math… p 1 T ¡1
exp ¡ 2 (x ¡ ¹c ) §C (x ¡ ¹c )
(2¼)d j§C j

 𝑃 𝐶 𝑋 ~ 𝑃 𝐶 𝑃(𝑋|𝐶)
 Use the fact: max 𝑃 𝐶 𝑋 max(log 𝑃 𝐶 𝑋 )
 𝛿𝑐 𝑥 = log 𝑃 𝐶 𝑋 = log 𝑃 𝐶 + log 𝑃 𝑋 𝐶 =
1 1 𝑇 −1
= log 𝑃 𝐶 − log Σ𝐶 − 𝑥 − 𝜇𝐶 Σ𝐶 𝑥 − 𝜇𝐶 + 𝑐
2 2

Prior Additional Sq. Mahalanobis distance

term

 Choose class where 𝛿𝑐 𝑥 is maximal

 Special case: Two classes
Decision boundary: Values of x where 𝛿0 𝑥 = 𝛿1 (𝑥) is quadratic in x

 Quadratic Discriminant Analysis (QDA)

4
Simplification

 Assume same covariance matrix in all classes, i.e.

𝑋|𝐶 ~ 𝑁(𝜇𝑐 , Σ) Fix for all classes
1 1
 𝛿𝑐 𝑥 = log 𝑃 𝐶 − log Σ − 𝑥 − 𝜇𝐶 𝑇 Σ−1 𝑥 − 𝜇𝐶 + 𝑐 =
2 2
Prior 1 Sq. Mahalanobis distance
= log 𝑃 𝐶 − 𝑥 − 𝜇𝐶 𝑇 Σ−1 𝑥 − 𝜇𝐶 + 𝑑=
2
1
(= log 𝑃 𝐶 + 𝑥 𝑇 Σ−1 𝜇𝐶 − 𝜇𝐶𝑇 Σ −1 𝜇𝐶 )
2

Decision boundary is linear in x

 Linear Discriminant Analysis (LDA)

1
Classify to which class (assume equal prior)?
• Physical distance in space is equal
0
• Classify to class 0, since Mahal. Dist. is smaller

5
LDA vs. QDA
+ Only few parameters to - Many parameters to estimate;
estimate; accurate estimates less accurate
- Inflexible + More flexible
(quadratic decision boundary)
(linear decision boundary)

6
Fisher’s Discriminant Analysis: Idea
Find direction(s) in which groups are separated best

1. Principal Component • Class Y, predictors 𝑋 = 𝑋1 , … , 𝑋𝑑

𝑈 = 𝑤𝑇𝑋
1. Linear Discriminant • Find w so that groups are separated
= along U best
1. Canonical Variable • Measure of separation: Rayleigh coefficient
𝐷(𝑈)
𝐽 𝑤 =
𝑉𝑎𝑟(𝑈) 2
where 𝐷 𝑈 = 𝐸 𝑈 𝑌 = 0 − 𝐸 𝑈 𝑌 = 1
• 𝐸 𝑋 𝑌 = 𝑗 = 𝜇𝑗 , 𝑉𝑎𝑟 𝑋 𝑌 = 𝑗 = Σ
𝐸 𝑈 𝑌 = 𝑗 = 𝑤 𝑇 𝜇𝑗 , 𝑉 𝑈 = 𝑤 𝑇 Σw
• Concept extendable to many groups

D(U) D(U)
𝐽 𝑤 large 𝐽 𝑤 small

Var(U) Var(U)
7
LDA and Linear Discriminants

 - Direction with largest J(w): 1. Linear Discriminant (LD 1)

- orthogonal to LD1, again largest J(w): LD 2
- etc.
 At most: min(Nmb. dimensions, Nmb. Groups -1) LD’s
e.g.: 3 groups in 10 dimensions – need 2 LD’s
 Computed using Eigenvalue Decomposition or Singular
Value Decomposition
Proportion of trace: Captured % of variance between group
means for each LD
 R: Function «lda» in package MASS does LDA and
computes linear discriminants (also «qda» available)

8
Example: Classification of Iris flowers

Iris setosa

Iris versicolor

Classify according to sepal/petal length/width

Iris virginica

9
Quality of classification

 Use training data also as test data: Overfitting

Too optimistic for error on new data
 Separate test data

Test

Training

 Cross validation (CV; e.g. “leave-one-out cross validation):

Every row is the test case once, the rest in the training data

10
Measures for prediction error

 Confusion matrix (e.g. 100 samples)

Truth = 0 Truth = 1 Truth = 2

Estimate = 0 23 7 6
Estimate = 1 3 27 4
Estimate = 2 3 1 26

 Error rate:
1 – sum(diagonal entries) / (number of samples) =
= 1 – 76/100 = 0.24
 We expect that our classifier predicts 24% of new
observations incorrectly (this is just a rough estimate)

11
Example: Digit recognition

 7129 hand-written digits

Sample of digits
 Each (centered) digit
was put in a 16*16 grid
 Measure grey value in
each part of the grid,
i.e. 256 grey values

Example with 8*8 grid 12

Concepts to know

 Idea of LDA / QDA

 Meaning of Linear Discriminants
 Cross Validation
 Confusion matrix, error rate

13
R functions to know

 lda

Discriminant Rules in Classification
No ratings yet
Discriminant Rules in Classification
48 pages
LDA and QDA: Classification Tutorial
No ratings yet
LDA and QDA: Classification Tutorial
16 pages
Understanding Linear Discriminant Analysis
No ratings yet
Understanding Linear Discriminant Analysis
23 pages
Key Points and Equations for LDA and Logistic Regression
No ratings yet
Key Points and Equations for LDA and Logistic Regression
13 pages
Linear Discriminant Analysis Overview
No ratings yet
Linear Discriminant Analysis Overview
28 pages
Understanding Linear Discriminant Analysis
No ratings yet
Understanding Linear Discriminant Analysis
23 pages
Key Concepts in Linear Classification
No ratings yet
Key Concepts in Linear Classification
9 pages
Overview of Linear Classifiers
No ratings yet
Overview of Linear Classifiers
48 pages
Machine Learning Unit 4: SVM & LDA
No ratings yet
Machine Learning Unit 4: SVM & LDA
29 pages
Linear Classification Methods Overview
No ratings yet
Linear Classification Methods Overview
14 pages
Applied Data Science: ML Classification Techniques
No ratings yet
Applied Data Science: ML Classification Techniques
70 pages
Understanding Linear Discriminant Analysis
No ratings yet
Understanding Linear Discriminant Analysis
75 pages
LDA and QDA in Multivariate Analysis
No ratings yet
LDA and QDA in Multivariate Analysis
19 pages
Reference Material - LDA
No ratings yet
Reference Material - LDA
24 pages
Supervised Regression in Machine Learning
No ratings yet
Supervised Regression in Machine Learning
74 pages
Fisher Linear Discriminant Analysis Explained
No ratings yet
Fisher Linear Discriminant Analysis Explained
6 pages
LDA vs PCA: Key Differences Explained
No ratings yet
LDA vs PCA: Key Differences Explained
28 pages
Linear Classification Algorithms in Python
No ratings yet
Linear Classification Algorithms in Python
76 pages
Gaussian Discriminant Analysis Explained
No ratings yet
Gaussian Discriminant Analysis Explained
6 pages
Understanding Linear Discriminant Analysis
No ratings yet
Understanding Linear Discriminant Analysis
9 pages
LDA for Pattern Recognition Analysis
No ratings yet
LDA for Pattern Recognition Analysis
33 pages
Discriminant Functions in Machine Learning
No ratings yet
Discriminant Functions in Machine Learning
33 pages
Overview of Linear Classifiers Techniques
No ratings yet
Overview of Linear Classifiers Techniques
46 pages
Fisher's 1936 Linear Discriminant Analysis
No ratings yet
Fisher's 1936 Linear Discriminant Analysis
13 pages
Understanding Linear Classification Techniques
No ratings yet
Understanding Linear Classification Techniques
25 pages
Understanding Linear Discriminant Analysis
No ratings yet
Understanding Linear Discriminant Analysis
6 pages
Week 7 Notes
No ratings yet
Week 7 Notes
24 pages
Anisotropic Gaussians and GDA Explained
No ratings yet
Anisotropic Gaussians and GDA Explained
52 pages
LDA vs QDA: Key Differences Explained
No ratings yet
LDA vs QDA: Key Differences Explained
18 pages
Chapter 11 KNN Naive Bayes and LDA
No ratings yet
Chapter 11 KNN Naive Bayes and LDA
15 pages
LDA Decision Boundaries Explained
No ratings yet
LDA Decision Boundaries Explained
55 pages
LDA and 1-NN Classifier Analysis
No ratings yet
LDA and 1-NN Classifier Analysis
11 pages
LDA in Machine Learning Lab Guide
No ratings yet
LDA in Machine Learning Lab Guide
4 pages
LDA Tutorial: Dimensionality Reduction
No ratings yet
LDA Tutorial: Dimensionality Reduction
47 pages
LDA Tutorial for Dimensionality Reduction
No ratings yet
LDA Tutorial for Dimensionality Reduction
47 pages
Fisher's LDA: Class Separation Analysis
No ratings yet
Fisher's LDA: Class Separation Analysis
47 pages
Understanding Linear Discriminant Analysis
No ratings yet
Understanding Linear Discriminant Analysis
24 pages
Overview of Discriminant Analysis
No ratings yet
Overview of Discriminant Analysis
45 pages
Multivariate Discriminant Analysis Quiz
No ratings yet
Multivariate Discriminant Analysis Quiz
8 pages
Discriminant Analysis in Multivariate Research
No ratings yet
Discriminant Analysis in Multivariate Research
59 pages
Linear Models for Classification in ML
No ratings yet
Linear Models for Classification in ML
72 pages
Reference Material - LDA
No ratings yet
Reference Material - LDA
24 pages
Understanding Linear Discriminant Functions
No ratings yet
Understanding Linear Discriminant Functions
2 pages
Linear Classification Methods Explained
No ratings yet
Linear Classification Methods Explained
50 pages
Financial Classification Models Overview
No ratings yet
Financial Classification Models Overview
95 pages
Discriminant Analysis: LDA and QDA
No ratings yet
Discriminant Analysis: LDA and QDA
38 pages
Reviewed - IJAMSS - Equivalence of Fisher Discriminant Analysis and Least Square
No ratings yet
Reviewed - IJAMSS - Equivalence of Fisher Discriminant Analysis and Least Square
11 pages
Overview of Pattern Recognition Techniques
0% (1)
Overview of Pattern Recognition Techniques
37 pages
Multiclass LDA in Data Visualization
No ratings yet
Multiclass LDA in Data Visualization
48 pages
Understanding Multiple Linear Regression
No ratings yet
Understanding Multiple Linear Regression
8 pages
Discriminant Functions and Class Probabilities
50% (2)
Discriminant Functions and Class Probabilities
3 pages
LDA and QDA in Machine Learning
No ratings yet
LDA and QDA in Machine Learning
11 pages
Gaussian Models and Discriminant Analysis
No ratings yet
Gaussian Models and Discriminant Analysis
42 pages
Understanding Linear Discriminant Analysis
No ratings yet
Understanding Linear Discriminant Analysis
24 pages
Linear Discriminant Analysis Overview
No ratings yet
Linear Discriminant Analysis Overview
65 pages
Linear Discriminant Functions Overview
No ratings yet
Linear Discriminant Functions Overview
14 pages
Total International Master's Scholarship
No ratings yet
Total International Master's Scholarship
1 page
First Law of Thermodynamics Explained
No ratings yet
First Law of Thermodynamics Explained
1 page
Trainee Engineer Job Opening at Nestlé
No ratings yet
Trainee Engineer Job Opening at Nestlé
4 pages
SPSS Classification Techniques Guide
No ratings yet
SPSS Classification Techniques Guide
16 pages
African Academic Mobility Scholarships
No ratings yet
African Academic Mobility Scholarships
2 pages
Sensor Technology and Limit Switches
No ratings yet
Sensor Technology and Limit Switches
58 pages
k-NN Imputation for Likert Data Evaluation
No ratings yet
k-NN Imputation for Likert Data Evaluation
23 pages
Longman New General Mathematics JSS3 PDF
50% (2)
Longman New General Mathematics JSS3 PDF
1 page
Essential Chemistry Lab Apparatus Guide
No ratings yet
Essential Chemistry Lab Apparatus Guide
6 pages
k-NN Imputation for Likert Data Evaluation
No ratings yet
k-NN Imputation for Likert Data Evaluation
23 pages
Factors Influencing LAUSD Graduation Rates
No ratings yet
Factors Influencing LAUSD Graduation Rates
32 pages
Underreaming in Wagga Wagga Dams
No ratings yet
Underreaming in Wagga Wagga Dams
20 pages
Feasibility Study Checklist Guide
No ratings yet
Feasibility Study Checklist Guide
5 pages
NASA's Global Exploration Strategy Insights
No ratings yet
NASA's Global Exploration Strategy Insights
2 pages
Senior High School Practical Research Course
No ratings yet
Senior High School Practical Research Course
6 pages
Control Charts in Quality Management
No ratings yet
Control Charts in Quality Management
66 pages
SAS Code To Select The Best Multiple Linear Regression Model For Multivariate Data Using Information Criteria
No ratings yet
SAS Code To Select The Best Multiple Linear Regression Model For Multivariate Data Using Information Criteria
6 pages
Synthetic Data in Machine Learning
No ratings yet
Synthetic Data in Machine Learning
10 pages
Nursing Research: Significance & Purposes
No ratings yet
Nursing Research: Significance & Purposes
5 pages
RCP Test
No ratings yet
RCP Test
4 pages
Thematic Apperception Test, The Children's Appee in Clinical Use, The - Bellak, Leopold, 1916
100% (1)
Thematic Apperception Test, The Children's Appee in Clinical Use, The - Bellak, Leopold, 1916
432 pages
U-Pb Zircon Ages of Athapuscow Aulacogen
No ratings yet
U-Pb Zircon Ages of Athapuscow Aulacogen
10 pages
Aircraft Bleed Air Fault Detection Using LSTM
No ratings yet
Aircraft Bleed Air Fault Detection Using LSTM
10 pages
The Impact of Corporate Governance Mechanisms On Firm Value
No ratings yet
The Impact of Corporate Governance Mechanisms On Firm Value
8 pages
Benefits of Bacteria in Concrete Repair
No ratings yet
Benefits of Bacteria in Concrete Repair
27 pages
Children’s Reading Culture in Digital Age
No ratings yet
Children’s Reading Culture in Digital Age
12 pages
Export Market Deter Mse
No ratings yet
Export Market Deter Mse
132 pages
Use Value of Woody Caatinga Plants
No ratings yet
Use Value of Woody Caatinga Plants
17 pages
Career Planning for Elementary Students
No ratings yet
Career Planning for Elementary Students
32 pages
5G Technique for Effective Problem Solving
No ratings yet
5G Technique for Effective Problem Solving
9 pages
Understanding Relative Error in TV Ratings
No ratings yet
Understanding Relative Error in TV Ratings
14 pages
Analyzing Consumer Buying Behavior
No ratings yet
Analyzing Consumer Buying Behavior
45 pages
Objectives of Engineering Research
No ratings yet
Objectives of Engineering Research
8 pages
Understanding Psychological Measurement
No ratings yet
Understanding Psychological Measurement
15 pages
ECOD: Parameter-Free Outlier Detection
No ratings yet
ECOD: Parameter-Free Outlier Detection
14 pages
Software Project Estimation Techniques
No ratings yet
Software Project Estimation Techniques
11 pages
Understanding Polygenic Scores and Bias
No ratings yet
Understanding Polygenic Scores and Bias
20 pages
Synthesizing Information in Filipino Culture
No ratings yet
Synthesizing Information in Filipino Culture
5 pages
School Students' Physical Activity Physical Activity and Its Contributing Factors in
No ratings yet
School Students' Physical Activity Physical Activity and Its Contributing Factors in
8 pages
CBC Implementation and Junior Secondary Transition
No ratings yet
CBC Implementation and Junior Secondary Transition
6 pages
Gamification Elements for Learning
No ratings yet
Gamification Elements for Learning
8 pages