0% found this document useful (0 votes)

359 views24 pages

Understanding Bayesian Statistics Basics

This document outlines a presentation on Bayesian statistics and its application to analyzing mosquito feeding data. It begins with an example dataset on mosquito feeding from clustered chickens. It then discusses key Bayesian concepts like Bayes' theorem, prior and posterior distributions, and Markov chain Monte Carlo (MCMC) methods. The document explains how MCMC allows sampling from posterior distributions even when only the proportional relationship is known. It also introduces WinBUGS software for Bayesian analysis and MCMC. The document concludes by comparing Bayesian and maximum likelihood estimates for the example data and noting some issues like computational intensity and dependence on model convergence.

Uploaded by

Hany Badran

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

359 views24 pages

Understanding Bayesian Statistics Basics

Uploaded by

Hany Badran

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions

Bayesian Statistics
A Users Perspective
Ivo M. Foppa
Novel Statistics for Entomologists 12/12/2010
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Outline
A motivating example
Bayesian statistics
Bayes theorem
Frequentist vs. Bayesian statistics
Appeal of Bayesian statistics
Why and how it works
MCMC
WinBUGS
Example (continuation)
Implementation
Results/comparison
Summary/conclusions
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Host clustering and percapita mosquito feeding
Release Culex quinquefasciatus (Say); two host locations
(high and low aggregation)
Do percapita rates differ by aggregation?
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
data
Left Right Total
1

) 9 (9) 10 (11)
1 (1) 8 (13) 9 (14)
7 (12) 1 (5) 8 (17)
8 (54) 1 (10) 9 (64)
1 (1) 9 (29) 10 (30)
9 (6) 1 (2) 10 (8)
9 (29) 1 (15) 10 (44)
1 (9) 9 (21) 10 (30)
Number of chickens
Number of blood fed mosquitoes
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Goal: to estimate the biting rate ratio (single vs. group); null
hypothesis: H
0
: = 1
A reasonable model for the data might be
x
i
Binomial(p
i
, n
i
)
logit(p
i
) =
i
+ s
i

1
+
3

k=1
a
ki

k
+
i

i
= exp

i
+
3

k=1
a
ki

x
i
(N
i
1)
n
i
x
i
,
x
i
, n
i
, N
i
: numbers of blood fed mosquitoes retrieved from the single chicken, the total number retrieved,
and the numbers of chickens used, respectively

i
= logit(
1
m
i
), with m
i
representing the total number of chickens used
s
i
is the side of the bunker with the single chicken
a
ki
for k (1, 2, 3) are dummy variables that are one if m
i
8, 9, 10

1
and
k
are model coefcients

i
N(0, ) is an overdispersion parameter
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Why not use the conventional approach?
Model is not implemented in SAS, Stata, R etc.
Numbers are small for asymptotic methods
Even if model chosen without random error, standard error
for may not be straightforward
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Bayes theorem
A and B are two discrete events
Classical expression:
P(A|B) =
P(B|A) P(A)
P(B)
(1)
Event A: Collected insect is of species a
Event B: Collected insect is from location b
P(A|B): Probability that an insect collected in location b is
species a
P(B|A): Probability that an insect of species a has been
collected in location b
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
A more relevant formulation:
Goal: to characterize the parameter (mean, variance,
etc.) given the data x.
General case:
f

(|x) =
L(x|) f

()

L(x|) f

() d
= C L(x|) f

()
L(x|) f

()
f

(|x): Posterior distribution of

(): Prior distribution of

L(x|): Likelihood of x given
C: Normalization constant (marginal density of x)
We will come back to this . . .
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Frequentist vs. Bayesian statistics
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Frequentist vs. Bayesian statistician
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Frequentist vs. Bayesian statistics
Why this cultural divide?
Estimation process is tainted by prior knowledge . . .
Why shouldnt we use prior knowledge???
[. . . ] deep philosophical differences between Bayesian and
frequentist inference (Spiegelhalter 2009)
Despite popular belief use of BS must not be a
philosophical choice
Bayesian methods offer valid and highly exible tools for
parameter estimation and inference.
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
The earlier result implies that the distribution of the
parameter(s) of interest, , is proportional to the likelihood
of the data and the prior distribution of the parameter:
f

(|x) L(x|) f

()
Markov chain Monte Carlo (=MCMC) methods allow us to
simulate draws from f

(|x), and thus estimate all desirable

properties of based on the proportional quantity on the
righthand side!
The price: Have to specify prior distribution (but it can be
uninformative)
The benet: Enormous analytic exibility
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
MCMC
Markov chain Monte Carlo methods allow us to sample
from f

(|x) even though we only know L(x|) f

()
A Markov process is a random variable X
t
whose transition
probability to X
t+1
(going from one state to a particular
other) only depends the current state and not on the history
A Markov chain is a sequence of random variables
(X
0
, . . . , X
n
) that was generated by a Markov process
The matrix P that denes the transitions probabilities from j
to k is called the transmission matrix
Under certain conditions, the Markov chain may reach a
stationary distribution,

, such that

P =

Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
MCMC
Monte Carlo methods simulate draws from probability
distributions using pseudo random number generators.
MCMC allows us to draw values from f

(|x) even though

only a proportional distribution is known.
All desirable properties of f

(|x) can be determined at

desired accuracy.
Only condition is that model converges.
As we draw directly from f

(|x) results are exact rather

than asymptotic!
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
MCMC and Bayesian statistics
MCMC methods draw samples (based on pseudorandom
numbers) (Monte Carlo part) from a target distribution
(posterior distribution of parameter given data) which is the
stationary distribution of a Markov chain
These methods are required, because the posterior is
typically not fully known (only up to proportionality
constant)
The Bayesian connection: the prior, which is necessary for
the deriving posterior from likelihood
Bayesian statistics therefore somewhat misleading
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
WinBUGS
The platform most commonly used for Bayesian inference
is WinBUGS (Imperial College and Medical Research
Council, UK)
BUGS=Bayesian inference Using Gibbs Sampling
The Gibbs sampler (Geman and Geman 1884) is a
particularly powerful MCMC algorithm
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Using WinBUGS for analysis
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Using WinBUGS for analysis
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
MLE vs Bayesian
Parameter MLE Bayesian

1
0.557 (0.014,1.101) 0.530 (-0.047,1.060)

3
0.931 (0.182,1.679) 0.947 (0.187,1.706)

1
-0.898 (-1.680,-0.115) -0.922 (-1.721,-0.141)
Point estimate (95% condence interval)
Posterior mean (95% credible interval)
difference in point estimates is due to small numbers!
Overdispersed
Parameter Post. mean (95% CI)

1
0.575 (-0.483,1.684)

3
0.867 (-0.594,2.224)

1
-1.011 (-2.497,0.243)
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Selected issues
MCMC methods are simulation based and thus
computationally intensive
Estimating a model may take a long time; problematic for
model selection
All inference is based on posterior distribution f

(|x);
instead of condence intervals we have credible
intervals with (supercially) same interpretation.
Validity of inference depends on model convergence (often
visually determined)
Estimates (posterior means etc) are slightly different after
each run
Analysis using WinBUGS interface is painful; but can call
from R or other programs
Need to think about model specically
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Summary
For an average user, the Bayesian framework via MCMC
methods is attractive because of its analytic exibility
MCMC is Bayesian because prior distributions have to be
specied
Typically, these priors are uninformative
Resulting posterior means/medians are typically virtually
identical from frequentist estimates
Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions
Thank you!
Resource Page
Bayesian Statistics: A User's Perspective (Symposium Novel Statistics for Entomologists
12/12/2010)
Ivo M. Foppa
The presentation (pdf format) is attached.
A general introduction to Bayesian statistics can be found in Spiegelhalter and Rice
(2009), Scholarpedia, 4(8):5230: [Link]
WinBUGS can be downloaded free of charge at:
o [Link]
o The site contains detailed instructions how to install and use the software.
o The following paper describes the theory behind WinBUGS: Lunn, D. J ., A.
Thomas, N. Best, and D. Spiegelhalter. 2000. WinBUGS-a Bayesian modelling
framework: concepts, structure, and extensibility. Statistics and Computing 10:
325-337.
o The software itself has many worked examples integrated.
I like to run WinBUGS from R. R is a free powerful statistical software that can be
obtained from [Link]
I am happy to help you setting up R (and provide you with R code) so you can run
WinBUGS from R (Warning: I am not an expert!)

Bayesian Data Analysis with R & WinBUGS
100% (1)
Bayesian Data Analysis with R & WinBUGS
143 pages
Introduction to MCMC and Bayesian Stats
No ratings yet
Introduction to MCMC and Bayesian Stats
69 pages
Statistical Learning with Sparsity
No ratings yet
Statistical Learning with Sparsity
367 pages
Computational Statistics in Bioinformatics
No ratings yet
Computational Statistics in Bioinformatics
5 pages
General Linear Model in Engineering Research
No ratings yet
General Linear Model in Engineering Research
50 pages
Introduction to One-Way ANOVA
No ratings yet
Introduction to One-Way ANOVA
30 pages
Distributional Regression Rage Against The Mean
No ratings yet
Distributional Regression Rage Against The Mean
25 pages
R Examples in Financial Statistics
No ratings yet
R Examples in Financial Statistics
60 pages
Competing Risks in Survival Analysis
No ratings yet
Competing Risks in Survival Analysis
29 pages
Basic Probability and Random Variables
No ratings yet
Basic Probability and Random Variables
5 pages
The Advantages of Least Squares Monte Carlo
0% (1)
The Advantages of Least Squares Monte Carlo
9 pages
Overview of MIT 18.655 Topics
No ratings yet
Overview of MIT 18.655 Topics
9 pages
Bayesian Analysis of CEP Distribution
No ratings yet
Bayesian Analysis of CEP Distribution
23 pages
Bayesian Black-Litterman Model Reformulation
No ratings yet
Bayesian Black-Litterman Model Reformulation
48 pages
Advanced Statistics Qualifying Exam Problems
50% (2)
Advanced Statistics Qualifying Exam Problems
11 pages
Mode of Binomial Distribution Explained
No ratings yet
Mode of Binomial Distribution Explained
16 pages
Bayesian Statistics Primer PDF
No ratings yet
Bayesian Statistics Primer PDF
23 pages
Time Series Analysis Techniques
No ratings yet
Time Series Analysis Techniques
181 pages
Bayesian Methods in Statistics
No ratings yet
Bayesian Methods in Statistics
28 pages
Method of Moments in Estimation
100% (1)
Method of Moments in Estimation
4 pages
STA 212: Mathematical Statistics Exam
No ratings yet
STA 212: Mathematical Statistics Exam
4 pages
Gaussian Noise Detection and Estimation
No ratings yet
Gaussian Noise Detection and Estimation
55 pages
835618
No ratings yet
835618
298 pages
Black-Litterman Model Analysis
100% (1)
Black-Litterman Model Analysis
115 pages
Math F424 2191
100% (1)
Math F424 2191
3 pages
Billingsley's Legacy in Probability Theory
No ratings yet
Billingsley's Legacy in Probability Theory
11 pages
Projection Methods in Functional Equations
No ratings yet
Projection Methods in Functional Equations
31 pages
Sta 411 PDF
No ratings yet
Sta 411 PDF
7 pages
Overview of Pearson Distributions
No ratings yet
Overview of Pearson Distributions
11 pages
Black-Litterman Model for Asset Allocation
No ratings yet
Black-Litterman Model for Asset Allocation
21 pages
Understanding Conditional Independence
No ratings yet
Understanding Conditional Independence
71 pages
Random Variables: Definitions and Examples
100% (1)
Random Variables: Definitions and Examples
19 pages
Semiparametric Regression
No ratings yet
Semiparametric Regression
22 pages
Axiomatic Probability in Engineering
No ratings yet
Axiomatic Probability in Engineering
6 pages
Solving Least Squares Problems
100% (1)
Solving Least Squares Problems
63 pages
Exponential Distribution Overview
No ratings yet
Exponential Distribution Overview
19 pages
Importance of Statistics in Management
No ratings yet
Importance of Statistics in Management
63 pages
Understanding Singular Value Decomposition
No ratings yet
Understanding Singular Value Decomposition
6 pages
Discretizing State Space Models
No ratings yet
Discretizing State Space Models
19 pages
Binomial Models for Option Pricing
No ratings yet
Binomial Models for Option Pricing
111 pages
Markov Chains: Definitions and Examples
No ratings yet
Markov Chains: Definitions and Examples
59 pages
Maximum Likelihood Estimation Explained
No ratings yet
Maximum Likelihood Estimation Explained
8 pages
Robust Regression Techniques Explained
No ratings yet
Robust Regression Techniques Explained
52 pages
Renewal Process in Stochastic Theory
No ratings yet
Renewal Process in Stochastic Theory
29 pages
Bootstrap Powerpoint
100% (1)
Bootstrap Powerpoint
20 pages
Probability and Statistics Overview
No ratings yet
Probability and Statistics Overview
202 pages
R Manual To Agresti's Categorical Data Analysis
100% (1)
R Manual To Agresti's Categorical Data Analysis
280 pages
Lognormal Random Walks in Investments
No ratings yet
Lognormal Random Walks in Investments
32 pages
R Software for Statistical Computing
No ratings yet
R Software for Statistical Computing
128 pages
MASE: A Standard for Forecast Accuracy
No ratings yet
MASE: A Standard for Forecast Accuracy
10 pages
Age-Period-Cohort Analysis: New Models, Methods, and Empirical Applications
No ratings yet
Age-Period-Cohort Analysis: New Models, Methods, and Empirical Applications
339 pages
Introduction to Bayesian Methods
No ratings yet
Introduction to Bayesian Methods
44 pages
Introduction To Bayesian Statistics: 24 February 2016 A Semester's Worth of Material in Just A Few Dozen Slides
No ratings yet
Introduction To Bayesian Statistics: 24 February 2016 A Semester's Worth of Material in Just A Few Dozen Slides
40 pages
Stat 535: Statistical Computing Overview
No ratings yet
Stat 535: Statistical Computing Overview
23 pages
Introduction to Bayesian Statistics
No ratings yet
Introduction to Bayesian Statistics
19 pages
Stat 535: Bayesian Methods Overview
No ratings yet
Stat 535: Bayesian Methods Overview
23 pages
Bayesian Analysis Overview by Shahbaba
No ratings yet
Bayesian Analysis Overview by Shahbaba
49 pages
Introduction to Bayesian Inference
No ratings yet
Introduction to Bayesian Inference
36 pages
Functions of a File Explained
No ratings yet
Functions of a File Explained
8 pages
Deep Knowledge Tracing and Engagement With MOOCs
No ratings yet
Deep Knowledge Tracing and Engagement With MOOCs
3 pages
Four Types of Reliability Explained
No ratings yet
Four Types of Reliability Explained
57 pages
Science Fair Project Guidelines 2023-2024
No ratings yet
Science Fair Project Guidelines 2023-2024
2 pages
Electrical Safety Practices in EIM Students
No ratings yet
Electrical Safety Practices in EIM Students
4 pages
Expert Consensus on Nursing Health Promotion
No ratings yet
Expert Consensus on Nursing Health Promotion
10 pages
Slm-3rd-Pr1-Module 14
No ratings yet
Slm-3rd-Pr1-Module 14
16 pages
Statistical Methods for Data Analysis
No ratings yet
Statistical Methods for Data Analysis
4 pages
Understanding Customer Needs Analysis
No ratings yet
Understanding Customer Needs Analysis
27 pages
Dental Crowding and Tooth Size Analysis
No ratings yet
Dental Crowding and Tooth Size Analysis
6 pages
Children’s Reading Culture in Digital Age
No ratings yet
Children’s Reading Culture in Digital Age
12 pages
Global Planetary Defense Preparedness Gaps
No ratings yet
Global Planetary Defense Preparedness Gaps
5 pages
Religiosity and The Malay Muslim Investors in Malaysia - An Analysis On Some Aspects of Ethical Investment Decision
No ratings yet
Religiosity and The Malay Muslim Investors in Malaysia - An Analysis On Some Aspects of Ethical Investment Decision
16 pages
Financial Leverage and Earnings Management
No ratings yet
Financial Leverage and Earnings Management
47 pages
GenAI Pinnacle Program Overview
No ratings yet
GenAI Pinnacle Program Overview
54 pages
Factors Influencing Exclusive Breastfeeding in Somalia
No ratings yet
Factors Influencing Exclusive Breastfeeding in Somalia
52 pages
Understanding Psychological Measurement
No ratings yet
Understanding Psychological Measurement
15 pages
Business Success: Education vs. Experience
No ratings yet
Business Success: Education vs. Experience
101 pages
Introduction to Statistical Concepts
100% (3)
Introduction to Statistical Concepts
120 pages
Pharmacy Education Article Page 107
No ratings yet
Pharmacy Education Article Page 107
42 pages
Ethical Issues in Psychological Research
No ratings yet
Ethical Issues in Psychological Research
19 pages
1 - The Role of Peer Support in Managing Occupational Stress
No ratings yet
1 - The Role of Peer Support in Managing Occupational Stress
8 pages
Non-Audit Services and Regulatory Scrutiny
No ratings yet
Non-Audit Services and Regulatory Scrutiny
50 pages
OUHS Thesis Synopsis Submission Format
No ratings yet
OUHS Thesis Synopsis Submission Format
5 pages
Creative Mindset and Global Thinking Insights
No ratings yet
Creative Mindset and Global Thinking Insights
9 pages
Strategic Management Paper Template
No ratings yet
Strategic Management Paper Template
3 pages
Store Cues & Customer Emotions
No ratings yet
Store Cues & Customer Emotions
8 pages
CDI Questionnaire for Investigators
No ratings yet
CDI Questionnaire for Investigators
5 pages
Ethics of AI in Education: Key Issues
No ratings yet
Ethics of AI in Education: Key Issues
86 pages
TYBBA Project Report Guidelines
No ratings yet
TYBBA Project Report Guidelines
7 pages

Understanding Bayesian Statistics Basics

Uploaded by

Understanding Bayesian Statistics Basics

Uploaded by

Outline Motivating example Bayesian statistics Why and how it works Example (continuation) Summary/conclusions

(|x): Posterior distribution of

(): Prior distribution of

(|x), and thus estimate all desirable

(|x) even though we only know L(x|) f

(|x) even though

(|x) can be determined at

(|x) results are exact rather

You might also like