0% found this document useful (0 votes)

92 views23 pages

Python Machine Learning Implementations

The document discusses implementations of various machine learning algorithms in Python including linear regression, logistic regression, Naive Bayes, SVM, KNN, K-means clustering, and decision trees. It provides code examples to demonstrate how to apply each algorithm for classification or regression tasks using scikit-learn and pandas. For algorithms like KNN and K-means clustering, it also shows how to predict cluster assignments for new data points.

Uploaded by

Roopa 18-19-36

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

92 views23 pages

Python Machine Learning Implementations

Uploaded by

Roopa 18-19-36

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

1) Implementation of Linear Regression using python

2) Implementation of Logistic Regression using python

3) Implementation of Naïve Bayes, SVM
4) Implementation of K NEAREST NEIGHBOURS (KNN)
5) Implementation of K means
6) Implementation of Decision Trees
7) Implementation of Random

Implementation of Linear Regression

## Importing the libraries

import numpy as np

import [Link] as plt

import pandas as pd

## Importing the dataset

dataset = pd.read_csv('/content/Salary_Data (1).csv')

X = [Link][:, :-1].values

y = [Link][:, -1].values

## Splitting the dataset into the Training set and Test set

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 1/3, random_state = 0)

## Training the Simple Linear Regression model on the Training set

from sklearn.linear_model import LinearRegression

regressor = LinearRegression()

[Link](X_train, y_train)

## Predicting the Test set results

y_pred = [Link](X_test)

## Visualising the Training set results

[Link](X_train, y_train, color = 'red')

[Link](X_train, [Link](X_train), color = 'blue')

[Link]('Salary vs Experience (Training set)')

[Link]('Years of Experience')

[Link]('Salary')

[Link]()

## Visualising the Test set results

[Link](X_test, y_test, color = 'red')

[Link](X_train, [Link](X_train), color = 'blue')

[Link]('Salary vs Experience (Test set)')

[Link]('Years of Experience')

[Link]('Salary')

[Link]()
Implementation of Logistic Regression
import numpy as np

import [Link] as plt

import pandas as pd

df = pd.read_csv("/content/Social_Network_Ads (1).csv")

[Link]()

x = df[['Age','EstimatedSalary']]

[Link]()
y = df['Purchased']

[Link]()

from sklearn.model_selection import train_test_split

x_train,x_test,y_train,y_test = train_test_split(x,y,test_size = 0.2)

from [Link] import StandardScaler

sc= StandardScaler()

x_train = sc.fit_transform(x_train)

x_test = sc.fit_transform(x_test)

from sklearn.linear_model import LogisticRegression

lr = LogisticRegression()

[Link](x_train,y_train)

y_pred = [Link](x_test)

from [Link] import accuracy_score

accuracy_score(y_test,y_pred)

[Link](x_test,y_test)

#check

[Link]([Link]([[19,19000]]))

import seaborn as sns

[Link](x='Age', y='Purchased', data=df, logistic=True)

Implementation of Naïve Bayes , SVM
import numpy as np

import [Link] as plt

import pandas as pd

dataset = pd.read_csv('Social_Network_Ads.csv')

[Link]()

[Link].value_counts()

X = [Link][:, :-1].values

y = [Link][:, -1].values
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)

from [Link] import StandardScaler

sc = StandardScaler()

X_train = sc.fit_transform(X_train)

X_test = [Link](X_test)

from [Link] import SVC

SV_classifier = SVC(kernel = 'rbf', random_state = 0)

SV_classifier.fit(X_train, y_train)

y_pred_SVC = SV_classifier.predict(X_test)

from [Link] import classification_report

print(classification_report(y_test, y_pred_SVC))

from sklearn.naive_bayes import GaussianNB

NB_classifier = GaussianNB()

NB_classifier.fit(X_train, y_train)

y_pred_NB = NB_classifier.predict(X_test)

from [Link] import classification_report

print(classification_report(y_test,y_pred_NB))
Implementation of K NEAREST NEIGHBOURS KNN
#importing libraries and dataset from sklearn

import [Link] as plt

import sklearn

import pandas as pd

import numpy as np

import [Link] as plt

import seaborn as sns

%matplotlib inline

from [Link] import load_iris

from [Link] import KNeighborsClassifier

from sklearn.model_selection import train_test_split

from [Link] import accuracy_score, confusion_matrix, classification_report

#loading the dataset

iris = load_iris()

df = [Link]([

([Link](data=iris['data'], columns=iris['feature_names'])),

([Link](data=iris['target'], columns=['target']))],

axis=1)

[Link]({'target':{0:'setosa', 1:'versicolor', 2:'virginica'}}, inplace = True)

#labels

[Link]

Index(['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)', 'target'],
dtype='object')

#values

[Link]

array([[5.1, 3.5, 1.4, 0.2, 'setosa'],

[4.9, 3.0, 1.4, 0.2, 'setosa'],

[4.7, 3.2, 1.3, 0.2, 'setosa'],

[4.6, 3.1, 1.5, 0.2, 'setosa'],……

[Link]()

[Link](style="ticks")
[Link](df, hue="target", palette={"setosa": "red", "versicolor": "yellow", "virginica": "blue"})

[Link](loc='upper right')

[Link]()

[Link](style="whitegrid")

[Link](figsize=(10, 6))

[Link](x='sepal length (cm)', y='sepal width (cm)', hue='target', palette={'setosa': 'red',

'versicolor': 'yellow', 'virginica': 'blue'}, data=df)

[Link]('Sepal Length (cm)')

[Link]('Sepal Length vs Sepal Width by Species')

[Link](title='Species', loc='upper right')

[Link]()

# Split the dataset into features (X) and target (y)

X = [Link]('target', axis=1)

y = df['target']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=2401)

len(X_train), len(X_test)

knn = KNeighborsClassifier(n_neighbors=10)

[Link](X_train, y_train)

y_pred = [Link](X_test)

y_pred

array(['setosa', 'setosa', 'versicolor', 'virginica', 'versicolor', 'setosa', 'setosa', 'setosa', 'versicolor',

'versicolor', 'virginica', 'versicolor', 'versicolor', 'versicolor', 'versicolor', 'setosa', 'setosa', 'setosa',
'virginica', 'setosa', 'virginica', 'setosa', 'versicolor', 'virginica', 'setosa', 'versicolor', 'setosa', 'setosa',
'virginica', 'virginica'], dtype=object)

y_test
39 setosa

46 setosa

60 versicolor …….

Name: target, dtype: object

accuracy_score(y_test,y_pred)

0.9666666666666667

print(classification_report(y_test, y_pred))

confusion_matrix(y_test, y_pred)

array([[13, 0, 0], [ 0, 9, 0], [ 0, 1, 7]])

[Link]()

predicted_classes = {0: 'setosa', 1: 'versicolor', 2: 'virginica'}

sepal_length = float(input("Enter sepal length (cm): "))

sepal_width = float(input("Enter sepal width (cm): "))

petal_length = float(input("Enter petal length (cm): "))

petal_width = float(input("Enter petal width (cm): "))

new_data = [Link]({

'sepal length (cm)': [sepal_length],

'sepal width (cm)': [sepal_width],

'petal length (cm)': [petal_length],

'petal width (cm)': [petal_width]

})

new_data

predicted_class = [Link](new_data)

predicted_class

array(['setosa'], dtype=object)

predicted_class_name = predicted_class[0]

predicted_class_name

setosa

Implementation of K Means
import [Link] as px

from [Link] import KMeans

from [Link] import KElbowVisualizer

# the elbow method

x = [Link][:, [0, 1, 2, 3]].values

wcss = []

for i in range(1, 11):

kmeans = KMeans(n_clusters = i, init = 'k-means++', max_iter = 300, n_init = 10, random_state

=2041)

[Link](x)
[Link](kmeans.inertia_)

fig = [Link](df, x=range(1, 11), y=wcss)

[Link]()

kmeans = KMeans(n_clusters = 3, init = 'k-means++',

max_iter = 300, n_init = 10, random_state =2041 )

y_kmeans = kmeans.fit_predict(x)

[Link](x[y_kmeans == 0, 0], x[y_kmeans == 0, 1],

s = 100, c = 'red', label = 'setosa')

[Link](x[y_kmeans == 1, 0], x[y_kmeans == 1, 1],

s = 100, c = 'yellow', label = 'versicolour')

[Link](x[y_kmeans == 2, 0], x[y_kmeans == 2, 1],

s = 100, c = 'blue', label = 'virginica')

# Plotting the centroids of the clusters

[Link](kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:,1],

s = 100, c = 'orange', label = 'Centroids')

[Link]()
kmeans = KMeans(n_clusters = 3, init = 'k-means++',

max_iter = 300, n_init = 10, random_state = 2041)

y_kmeans = kmeans.fit_predict(x)

[Link](x[y_kmeans == 0, 0], x[y_kmeans == 0, 1],

s = 100, c = 'red', label = 'setosa')

[Link](x[y_kmeans == 1, 0], x[y_kmeans == 1, 1],

s = 100, c = 'yellow', label = 'versicolour')

[Link](x[y_kmeans == 2, 0], x[y_kmeans == 2, 1],

s = 100, c = 'blue', label = 'virginica')

# Plotting the centroids of the clusters

[Link](kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:,1],

s = 100, c = 'orange', label = 'Centroids')

[Link]()
kmeans = KMeans(n_clusters=3, init='k-means++', max_iter=300, n_init=10, random_state=2041)

[Link](x)

sepal_length = float(input("Enter Sepal Length (in cm): "))

sepal_width = float(input("Enter Sepal Width (in cm): "))

petal_length = float(input("Enter Petal Length (in cm): "))

petal_width = float(input("Enter Petal Width (in cm): "))

new_data = [Link]([sepal_length, sepal_width, petal_length, petal_width]).reshape(1, -1)

new_cluster_assignment = [Link](new_data)

print("Predicted cluster assignment:", new_cluster_assignment[0])

Enter Sepal Length (in cm): 4.3

Enter Sepal Width (in cm): 1.2

Enter Petal Length (in cm): 3.4

Enter Petal Width (in cm): 2.1

Predicted cluster assignment: 1

import warnings

[Link]("ignore")
#formation of clusters with varied values of 'k'

import numpy as np

import [Link] as plt

from [Link] import KMeans

from [Link] import load_iris

from [Link] import FuncAnimation

iris = load_iris()

X = [Link]

y = [Link]

max_clusters = 10

fig, ax = [Link]()

def update(frame):

[Link]()

kmeans = KMeans(n_clusters=frame + 1, random_state=2401)

[Link](X)

cluster_labels = kmeans.labels_

for cluster in range(frame + 1):

[Link](X[cluster_labels == cluster, 0], X[cluster_labels == cluster, 1], label=f'Cluster {cluster + 1}')

ax.set_title(f'Cluster Formation (K = {frame + 1})')

ax.set_xlabel('Sepal Length (cm)')

ax.set_ylabel('Sepal Width (cm)')

[Link](loc='upper right')

ani = FuncAnimation(fig, update, frames=max_clusters, repeat=False)

from [Link] import HTML

HTML(ani.to_jshtml())

#[Link]('cluster_formation.mp4', writer='ffmpeg', fps=2)

Implementation of Decision Trees
from [Link] import load_iris

data = load_iris()

df = [Link](data["data"], columns=data["feature_names"])

df["target"] = data["target"]

[Link]({"target":{0:"setosa", 1:"versicolor", 2:"virginica"}}, inplace=True)

df
feature_cols = ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']

X1 = df[feature_cols] # Features

y1 = [Link]

# Split dataset into training set and test set

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1) # 70% training

and 30% test

from [Link] import DecisionTreeClassifier

# Create a decision tree classifier object

clf = DecisionTreeClassifier(criterion="gini", max_depth=3, min_samples_split=10,

min_samples_leaf=5)

# Fit the classifier to the training data

clf=[Link](X_train, y_train)

y_pred=[Link](X_test)
print("Accuracy:",metrics.accuracy_score(y_test, y_pred))

from [Link] import export_graphviz

from [Link] import Image

import pydotplus

dot_data = StringIO()

clf

export_graphviz(clf, out_file=dot_data,

filled=True, rounded=True,

special_characters=True,class_names=['0','1','2'])

graph = pydotplus.graph_from_dot_data(dot_data.getvalue())

graph.write_png('flower_data.png')

Image(graph.create_png())
Implementation of Random Forest
# Data Processing

import pandas as pd

import numpy as np

import pandas as pd

dataset=pd.read_csv("/content/drive/MyDrive/Colab Notebooks/[Link]")

dataset

# Split the data into features (X) and target (y)

X = [Link]([Link][:,:-1])

X
y=[Link]([Link][:,-1])

from sklearn.model_selection import train_test_split

X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.20)

from [Link] import RandomForestRegressor

regressor=RandomForestRegressor(n_estimators=20,random_state=0)
[Link](X_train,y_train)

y_pred=[Link](X_test)

from sklearn import metrics

print("Mean Absolute Error", metrics.mean_absolute_error(y_test,y_pred))

print("Mean Squared Error", metrics.mean_squared_error(y_test,y_pred))

print("Root Mean Squared Error", [Link](metrics.mean_squared_error(y_test,y_pred)))

Mean Absolute Error 2.6388235294117646

Mean Squared Error 17.72390980392157

Root Mean Squared Error 4.2099774113315105

ds lab 6-10 2
No ratings yet
ds lab 6-10 2
4 pages
KMeans Clustering with PCA Analysis
No ratings yet
KMeans Clustering with PCA Analysis
11 pages
K-Means and GMM Classification of Iris Data
No ratings yet
K-Means and GMM Classification of Iris Data
3 pages
Iris Dataset Decision Tree Analysis
No ratings yet
Iris Dataset Decision Tree Analysis
5 pages
KNN Classification on Iris Dataset
No ratings yet
KNN Classification on Iris Dataset
3 pages
KNN Classification on Iris Dataset
No ratings yet
KNN Classification on Iris Dataset
3 pages
Machine Learning Techniques Overview
No ratings yet
Machine Learning Techniques Overview
7 pages
KNN Classifier for News Classification
No ratings yet
KNN Classifier for News Classification
11 pages
K-Nearest Neighbors Model Evaluation
No ratings yet
K-Nearest Neighbors Model Evaluation
3 pages
Data Analysis with Python: Visualizations & Models
No ratings yet
Data Analysis with Python: Visualizations & Models
9 pages
Python Machine Learning Algorithms Guide
No ratings yet
Python Machine Learning Algorithms Guide
9 pages
KNN Classifier for Iris Dataset Analysis
No ratings yet
KNN Classifier for Iris Dataset Analysis
7 pages
EM vs K-Means Clustering Analysis
No ratings yet
EM vs K-Means Clustering Analysis
3 pages
K-means Clustering Implementation Guide
No ratings yet
K-means Clustering Implementation Guide
4 pages
K-Means and GMM Classification in Python
No ratings yet
K-Means and GMM Classification in Python
3 pages
Linear and Nonlinear SVM Analysis
No ratings yet
Linear and Nonlinear SVM Analysis
13 pages
California Housing Data Analysis
No ratings yet
California Housing Data Analysis
14 pages
Naïve Bayes and KNN Classifier Code
No ratings yet
Naïve Bayes and KNN Classifier Code
13 pages
Decision Tree Tuning with Sklearn
No ratings yet
Decision Tree Tuning with Sklearn
15 pages
Machine Learning Algorithms in Python
No ratings yet
Machine Learning Algorithms in Python
34 pages
KNN and Clustering Techniques Overview
No ratings yet
KNN and Clustering Techniques Overview
8 pages
Machine Learning Models for Classification
No ratings yet
Machine Learning Models for Classification
12 pages
KNN Classification with Iris Dataset
No ratings yet
KNN Classification with Iris Dataset
8 pages
K-Means Clustering on Iris Dataset
No ratings yet
K-Means Clustering on Iris Dataset
4 pages
ML L - Ab
No ratings yet
ML L - Ab
13 pages
Synthetic Data for LDA Evaluation in MATLAB
No ratings yet
Synthetic Data for LDA Evaluation in MATLAB
14 pages
Machine Learning Algorithms Implementation
No ratings yet
Machine Learning Algorithms Implementation
12 pages
Python Data Science Techniques
No ratings yet
Python Data Science Techniques
18 pages
Oalican Css 181 1 K NN Activity
No ratings yet
Oalican Css 181 1 K NN Activity
3 pages
Prac - 4 Explaination
No ratings yet
Prac - 4 Explaination
12 pages
Simple Linear Regression Implementation
No ratings yet
Simple Linear Regression Implementation
14 pages
Data Visualization and Analysis Techniques
No ratings yet
Data Visualization and Analysis Techniques
9 pages
Iris Classification with KNN and SVM
No ratings yet
Iris Classification with KNN and SVM
11 pages
Implementing KNN Algorithm Steps
No ratings yet
Implementing KNN Algorithm Steps
6 pages
Machine Learning Applications Overview
No ratings yet
Machine Learning Applications Overview
32 pages
Data Analysis with Python Visualizations
No ratings yet
Data Analysis with Python Visualizations
14 pages
Classifier Accuracy on Iris Dataset
No ratings yet
Classifier Accuracy on Iris Dataset
5 pages
Data Analysis and Machine Learning Techniques
No ratings yet
Data Analysis and Machine Learning Techniques
13 pages
Machine Learning Algorithms Explained
No ratings yet
Machine Learning Algorithms Explained
4 pages
Iris Dataset Classification Models
No ratings yet
Iris Dataset Classification Models
29 pages
Data Analysis and ML Techniques Overview
No ratings yet
Data Analysis and ML Techniques Overview
2 pages
k-NN Classification on Iris Dataset
No ratings yet
k-NN Classification on Iris Dataset
11 pages
Machine Learning Programs with Python
No ratings yet
Machine Learning Programs with Python
23 pages
KNN Classifier for Iris Species Prediction
No ratings yet
KNN Classifier for Iris Species Prediction
3 pages
Data Visualization and Analysis Techniques
No ratings yet
Data Visualization and Analysis Techniques
4 pages
California Housing Data Analysis Techniques
No ratings yet
California Housing Data Analysis Techniques
4 pages
Data Analysis and ML Experiments
No ratings yet
Data Analysis and ML Experiments
23 pages
Iris Dataset Classification Models
No ratings yet
Iris Dataset Classification Models
11 pages
K-Means Clustering and KNN Analysis
No ratings yet
K-Means Clustering and KNN Analysis
4 pages
DMW Record
No ratings yet
DMW Record
28 pages
K-Nearest Neighbors Algorithm Explained
No ratings yet
K-Nearest Neighbors Algorithm Explained
6 pages
CP4252-Lab Manual
No ratings yet
CP4252-Lab Manual
14 pages
California Housing Data Analysis
No ratings yet
California Housing Data Analysis
8 pages
K-means Clustering on Iris Dataset
No ratings yet
K-means Clustering on Iris Dataset
5 pages
K-Nearest Neighbors Algorithm in Python
No ratings yet
K-Nearest Neighbors Algorithm in Python
15 pages
Machine Learning Lab Programs
No ratings yet
Machine Learning Lab Programs
17 pages
Naïve Bayes and Clustering Techniques
No ratings yet
Naïve Bayes and Clustering Techniques
13 pages
Machine Learning From (6-7)
No ratings yet
Machine Learning From (6-7)
8 pages
Pad Footing Design Report for Building 225
No ratings yet
Pad Footing Design Report for Building 225
12 pages
Mastering Analytical Exposition Skills
No ratings yet
Mastering Analytical Exposition Skills
9 pages
Ultima Pro 450
No ratings yet
Ultima Pro 450
1 page
Life of Pi: Themes of Growth and Faith
No ratings yet
Life of Pi: Themes of Growth and Faith
4 pages
Flooring Preparation Standards for Renovation
No ratings yet
Flooring Preparation Standards for Renovation
34 pages
Public Speaking - Group 6 (Nanda, Darma, Rama)
No ratings yet
Public Speaking - Group 6 (Nanda, Darma, Rama)
17 pages
Crop Production Course Timetable 2017
No ratings yet
Crop Production Course Timetable 2017
3 pages
Evolution of Modern and Contemporary Art
No ratings yet
Evolution of Modern and Contemporary Art
10 pages
Senate Order Paper - November 13, 2025
No ratings yet
Senate Order Paper - November 13, 2025
35 pages
John Carney's Magic Teaching DVDs
No ratings yet
John Carney's Magic Teaching DVDs
8 pages
2019 SH Legal Compliance Plan
100% (1)
2019 SH Legal Compliance Plan
3 pages
Terms and Concepts in Sociology
No ratings yet
Terms and Concepts in Sociology
7 pages
AM-Thinking-v1: 32B Reasoning Model
No ratings yet
AM-Thinking-v1: 32B Reasoning Model
16 pages
Higher Degree Polynomials
No ratings yet
Higher Degree Polynomials
58 pages
Future Trends in Computer Science
No ratings yet
Future Trends in Computer Science
6 pages
High-Sulphidation Vuggy Silica Atlas
100% (1)
High-Sulphidation Vuggy Silica Atlas
56 pages
Year 1 Math Practice: Decimals & Rounding
No ratings yet
Year 1 Math Practice: Decimals & Rounding
5 pages
Fall 25-26 EEE Admission Test Results
No ratings yet
Fall 25-26 EEE Admission Test Results
2 pages
Mixed-Use Development Plan in Infanta
No ratings yet
Mixed-Use Development Plan in Infanta
9 pages
Control Systems Midterm Exam 2020-2021
No ratings yet
Control Systems Midterm Exam 2020-2021
2 pages
CALIB4 PDF
No ratings yet
CALIB4 PDF
9 pages
Martha Peláez & Rafael Moreno - Four Dimensions of Rules and Their Correspondence To Rule-Governed Behavior: A Taxonomy
No ratings yet
Martha Peláez & Rafael Moreno - Four Dimensions of Rules and Their Correspondence To Rule-Governed Behavior: A Taxonomy
7 pages
NBA Visit Schedule June 2025
No ratings yet
NBA Visit Schedule June 2025
8 pages
Bridge Vibration and Low-Frequency Noise Analysis
No ratings yet
Bridge Vibration and Low-Frequency Noise Analysis
17 pages
ExamFactor: Tailored CUET UG Prep Solutions
No ratings yet
ExamFactor: Tailored CUET UG Prep Solutions
2 pages
Produt IMO NEU
No ratings yet
Produt IMO NEU
2 pages
Key Ethical Principles in Research
No ratings yet
Key Ethical Principles in Research
14 pages
Science 7-10-2023 Sample Unit Stage 5 Reactions
No ratings yet
Science 7-10-2023 Sample Unit Stage 5 Reactions
17 pages
Perspectives in Autism Syllabus
No ratings yet
Perspectives in Autism Syllabus
7 pages
Crafting a Winning Purdue SOP
No ratings yet
Crafting a Winning Purdue SOP
2 pages