0% found this document useful (0 votes)

77 views13 pages

SQL Vs Pythons

The document compares how to perform various types of joins in SQL and Python Pandas. It shows examples of inner, left, right, full, union, intersect, except, semi, anti, and cross joins displayed in tables and explains how to write the equivalent SQL and Pandas code to perform each type of join.

Uploaded by

Abhijeet Patil

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

77 views13 pages

SQL Vs Pythons

Uploaded by

Abhijeet Patil

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

SQL Joins

v/s
Python Pandas
@vimanyuchaturvedi
INNER JOIN
LEFT_TABLE RIGHT_TABLE
ID LEFT_VALUE ID RIGHT_VALUE

1 LEFT 1 1 RIGHT 1 ID LEFT_VALUE RIGHT_VALUE

2 LEFT 2 4 RIGHT 2 1 LEFT 1 RIGHT 1

3 LEFT 3 5 RIGHT 3 4 LEFT 4 RIGHT 2

4 LEFT 4 6 RIGHT 4

SQL
SELECT * FROM LEFT_TABLE AS LT INNER JOIN RIGHT_TABLE AS RT
ON [Link] = [Link]

pandas
SELF JOIN
LEFT_TABLE LEFT_TABLE

ID LEFT_VALUE ID LEFT_VALUE

1 LEFT 1 1 LEFT 1

2 LEFT 2 2 LEFT 2

3 LEFT 3 3 LEFT 3

4 LEFT 4 4 LEFT 4

ID LEFT_VALUE LEFT_VALUE2

1 LEFT 1 LEFT 1

2 LEFT 2 LEFT 2

3 LEFT 3 LEFT 3

4 LEFT 4 LEFT 4

SQL
SELECT * FROM LEFT_TABLE AS LT INNER JOIN LEFT_TABLE AS LT2
ON [Link] = [Link]

pandas
LEFT JOIN

LEFT_TABLE RIGHT_TABLE

ID LEFT_VALUE ID RIGHT_VALUE

1 LEFT 1 1 RIGHT 1

2 LEFT 2 4 RIGHT 2

3 LEFT 3 5 RIGHT 3

4 LEFT 4 6 RIGHT 4

ID LEFT_VALUE RIGHT_VALUE

1 LEFT 1 RIGHT 1

2 LEFT 2 NULL

3 LEFT 3 NULL

4 LEFT 4 RIGHT 2

SQL
SELECT * FROM LEFT_TABLE AS LT LEFT JOIN RIGHT_TABLE AS RT
ON [Link] = [Link]

pandas
RIGHT JOIN

LEFT_TABLE RIGHT_TABLE
ID LEFT_VALUE ID RIGHT_VALUE

1 LEFT 1 1 RIGHT 1

2 LEFT 2 4 RIGHT 2

3 LEFT 3 5 RIGHT 3

4 LEFT 4 6 RIGHT 4

ID LEFT_VALUE RIGHT_VALUE

1 LEFT 1 RIGHT 1

4 LEFT 4 RIGHT 2

5 NULL RIGHT 3

6 NULL RIGHT 4

SQL
SELECT * FROM LEFT_TABLE AS LT RIGHT JOIN RIGHT_TABLE AS RT
ON [Link] = [Link]

pandas
FULL JOIN
LEFT_TABLE RIGHT_TABLE
ID LEFT_VALUE ID RIGHT_VALUE

1 LEFT 1 1 RIGHT 1

2 LEFT 2 4 RIGHT 2

3 LEFT 3 5 RIGHT 3

4 LEFT 4 6 RIGHT 4

ID LEFT_VALUE RIGHT_VALUE

1 LEFT 1 RIGHT 1

2 LEFT 2 NULL

3 LEFT 3 NULL

4 LEFT 4 RIGHT 2

5 NULL RIGHT 3

6 NULL RIGHT 4

SQL
SELECT * FROM LEFT_TABLE AS LT FULL OUTER JOIN RIGHT_TABLE
AS RT ON [Link] = [Link]

pandas
UNION ALL
LEFT_TABLE RIGHT_TABLE
ID VALUE ID VALUE ID VALUE

1 VALUE 1 1 VALUE 1 1 VALUE 1

2 VALUE 2 4 VALUE 2 2 VALUE 2

3 VALUE 3 5 VALUE 3 3 VALUE 3

4 VALUE 4 6 VALUE 4 4 VALUE 4

1 VALUE 1

4 VALUE 2

5 VALUE 3

6 VALUE 4

SQL
SELECT * FROM LEFT_TABLE UNION ALL SELECT * FROM RIGHT_TABLE

pandas
UNION
LEFT_TABLE RIGHT_TABLE
ID VALUE ID VALUE

1 VALUE 1 1 VALUE 1

2 VALUE 2 4 VALUE 2

3 VALUE 3 5 VALUE 3

4 VALUE 4 6 VALUE 4

ID VALUE

1 VALUE 1

2 VALUE 2

3 VALUE 3

4 VALUE 4

4 VALUE 2

5 VALUE 3

6 VALUE 4

SQL
SELECT * FROM LEFT_TABLE UNION SELECT * FROM RIGHT_TABLE

pandas
INTERSECT
LEFT_TABLE RIGHT_TABLE

ID VALUE ID VALUE

1 VALUE 1 1 VALUE 1

2 VALUE 2 4 VALUE 2

3 VALUE 3 5 VALUE 3

4 VALUE 4 6 VALUE 4

ID VALUE

1 VALUE 1

SQL
SELECT * FROM LEFT_TABLE INTERSECT SELECT * FROM RIGHT_TABLE

pandas
EXCEPT
LEFT_TABLE RIGHT_TABLE

ID VALUE ID VALUE

1 VALUE 1 1 VALUE 1

2 VALUE 2 4 VALUE 2

3 VALUE 3 5 VALUE 3

4 VALUE 4 6 VALUE 4

ID VALUE

2 VALUE 2

3 VALUE 3

4 VALUE 4

SQL
SELECT * FROM LEFT_TABLE EXCEPT SELECT * FROM RIGHT_TABLE

pandas
SEMI JOIN
LEFT_TABLE RIGHT_TABLE

ID VALUE VALUE ID VALUE

VALUE 2 2 VALUE 2
1 VALUE 1
VALUE 3 3 VALUE 3
2 VALUE 2

3 VALUE 3

4 VALUE 4

SQL
SELECT * FROM LEFT_TABLE WHERE VALUE IN (SELECT VALUE FROM
RIGHT_TABLE )

pandas
ANTI JOIN
LEFT_TABLE RIGHT_TABLE
VALUE ID VALUE
ID VALUE

VALUE 2 1 VALUE 1
1 VALUE 1
VALUE 3 4 VALUE 4
2 VALUE 2

3 VALUE 3

4 VALUE 4

SQL
SELECT * FROM LEFT_TABLE WHERE VALUE NOT IN (SELECT VALUE
FROM RIGHT_TABLE )

pandas
CROSS JOIN

ID1 ID2
LEFT_TABLE RIGHT_TABLE
1 1
ID ID
1 2
1 1
2 1
2 2
2 2
3
3 1

3 2

SQL
SELECT * FROM LEFT_TABLE CROSS JOIN RIGHT_TABLE

pandas

Common questions

A SEMI JOIN returns rows from the left table where one or more matches are found in the right table but does not duplicate rows from the left table based on the right table contents. Useful for subsetting data to rows that have related entries in another table, implemented using a WHERE EXISTS subquery .

INTERSECT in SQL returns the common rows that appear in both SELECT statements with duplicates removed. It is useful for finding common records across datasets, such as identifying shared members between groups or common attributes from different sources .

An ANTI JOIN returns rows from the left table that do not match any row in the right table, effectively doing the reverse of a regular JOIN. An EXCEPT operation, on the other hand, returns distinct rows from the left table that are not in the right table, removing duplicates as well .

An INNER JOIN in both SQL and Pandas returns only the rows with matching keys in both tables. FULL OUTER JOIN returns all rows when there is a match in either left or right table records, filling in with NULLs where no match is found. It is achieved in Pandas by setting the 'how' parameter to 'outer' in the 'merge' function .

A RIGHT JOIN returns all rows from the right table and the matched rows from the left table, adding NULLs for non-matches. To find unmatched rows from the right table, filter for NULLs in left table columns post join. In Pandas, perform a merge with 'how' set to 'right' and filter using isnull or similar function .

A SELF JOIN is used when a table is joined with itself to query hierarchical data or when comparing rows within the same table for finding duplicates or calculating successive differences. In SQL, it involves joining a table with itself using an alias; in Pandas, it can be done using the merge method with the same DataFrame as both inputs .

UNION ALL is chosen over UNION when duplicates need to be preserved, as UNION ALL does not remove duplicate rows while UNION does by default, which can be less efficient with large datasets where duplicates are known to exist .

A CROSS JOIN in SQL returns the Cartesian product of the two tables, meaning every row in the first table is combined with every row in the second table. This join is useful when all possible combinations of two datasets are needed, as opposed to INNER or OUTER JOINs which are used to combine datasets based on matching keys .

SQL is optimized for handling large-scale data efficiently, using indexes and optimized query plans. Pandas, being an in-memory data manipulation tool, can become constrained by RAM limits and less efficient for very large datasets without optimization steps like chunking. SQL databases can better handle concurrent requests and distributed data .

A LEFT JOIN in SQL returns all rows from the left table and the matched rows from the right table, with NULLs for non-matching rows from the right table. In Python Pandas, this is implemented using the 'merge' function with the parameter 'how' set to 'left' .

Java Hotel Management System Project
No ratings yet
Java Hotel Management System Project
14 pages
SQL Data Definition and Constraints Guide
No ratings yet
SQL Data Definition and Constraints Guide
4 pages
Codd's 12 Rules for RDBMS Explained
No ratings yet
Codd's 12 Rules for RDBMS Explained
4 pages
SQL Practice and Revision Guide
No ratings yet
SQL Practice and Revision Guide
87 pages
Student Database Schema Overview
No ratings yet
Student Database Schema Overview
1 page
Open Sales Order Procedure Overview
No ratings yet
Open Sales Order Procedure Overview
9 pages
Utilities Guide
No ratings yet
Utilities Guide
96 pages
SQL Commands for Big Data Analytics
No ratings yet
SQL Commands for Big Data Analytics
17 pages
SQL Queries for Data Analysis Tasks
No ratings yet
SQL Queries for Data Analysis Tasks
24 pages
Netflix Cookies Overview 2023
No ratings yet
Netflix Cookies Overview 2023
6 pages
Shashwat Arya's Informatics Project
No ratings yet
Shashwat Arya's Informatics Project
84 pages
Database Management System MCQs
No ratings yet
Database Management System MCQs
8 pages
SQL Always On Setup Guide
No ratings yet
SQL Always On Setup Guide
17 pages
Coimbatore Sahodaya Class 12 Exam Paper
No ratings yet
Coimbatore Sahodaya Class 12 Exam Paper
10 pages
Simple Linear Models Worksheet in R
No ratings yet
Simple Linear Models Worksheet in R
5 pages
Database Design for Employee System
No ratings yet
Database Design for Employee System
5 pages
SAP Export Data Structure Overview
No ratings yet
SAP Export Data Structure Overview
35 pages
XII IP Model 1
No ratings yet
XII IP Model 1
10 pages
OneDrive App Debug Log Analysis
No ratings yet
OneDrive App Debug Log Analysis
9 pages
MySQL Database Creation Guide
No ratings yet
MySQL Database Creation Guide
41 pages
Document 1156523.1
No ratings yet
Document 1156523.1
3 pages
SQL SELECT Statement Essentials
No ratings yet
SQL SELECT Statement Essentials
23 pages
KV Sangathan Chennai Computer Science Test
No ratings yet
KV Sangathan Chennai Computer Science Test
5 pages
Appian User Interface Overview
100% (2)
Appian User Interface Overview
12 pages
Relational Set Operations in DBMS
No ratings yet
Relational Set Operations in DBMS
36 pages
Class 11 IP Syllabus 2025-26
No ratings yet
Class 11 IP Syllabus 2025-26
3 pages
Overview of Database Languages
No ratings yet
Overview of Database Languages
19 pages
Madhu - Software - Sparks - SQL - PLSQL Guide
No ratings yet
Madhu - Software - Sparks - SQL - PLSQL Guide
215 pages
Renaming Columns in Pyspark
No ratings yet
Renaming Columns in Pyspark
4 pages
dbt Fundamentals Exam Overview
No ratings yet
dbt Fundamentals Exam Overview
7 pages

SQL Vs Pythons

Uploaded by

SQL Vs Pythons

Uploaded by

SQL Joins

1 LEFT 1 1 RIGHT 1 ID LEFT_VALUE RIGHT_VALUE

2 LEFT 2 4 RIGHT 2 1 LEFT 1 RIGHT 1

3 LEFT 3 5 RIGHT 3 4 LEFT 4 RIGHT 2

1 VALUE 1 1 VALUE 1 1 VALUE 1

2 VALUE 2 4 VALUE 2 2 VALUE 2

3 VALUE 3 5 VALUE 3 3 VALUE 3

4 VALUE 4 6 VALUE 4 4 VALUE 4

ID VALUE VALUE ID VALUE

Common questions

Describe the implementation and use-case scenarios for a SEMI JOIN in SQL.

What is the significance of using INTERSECT in SQL, and how is it practically applied?

How does an ANTI JOIN operation differ from an EXCEPT operation in SQL?

What differences can be observed when performing an INNER JOIN vs. a FULL OUTER JOIN in SQL and Python Pandas?

How can a RIGHT JOIN be used to identify unmatched rows from the right table in SQL and Pandas?

When would a SELF JOIN be necessary and how is it implemented both in SQL and Pandas?

In what scenarios would you choose to use a UNION ALL statement instead of a UNION in SQL?

Explain how CROSS JOIN works in SQL and compare its practical uses to other join types.

What are the performance implications of large scale data operations using SQL vs. Python Pandas?

How does a LEFT JOIN in SQL function and how is it implemented in Python Pandas?

You might also like