import warnings
warnings.filterwarnings('ignore')
import pandas as pd
import pickle
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, LabelEncoder
from xgboost import XGBClassifier
from sklearn.metrics import classification_report

# -----------------------------
# 1. Load dataset
# -----------------------------
# You can get the dataset from: https://www.kaggle.com/datasets/ealaxi/paysim1
# File name: PS_20174392719_1491204439457_log.csv
print("📥 Loading dataset (PaySim synthetic transaction data)...")
df = pd.read_csv("data/PS_20174392719_1491204439457_log.csv")

# -----------------------------
# 2. Keep relevant columns
# -----------------------------
cols = [
    'type', 'amount', 'oldbalanceOrg', 'newbalanceOrig',
    'oldbalanceDest', 'newbalanceDest', 'isFraud'
]
df = df[cols]

# -----------------------------
# 3. Encode and clean
# -----------------------------
le = LabelEncoder()
df['type'] = le.fit_transform(df['type'])  # e.g., TRANSFER, CASH_OUT, PAYMENT, etc.

# Replace NaN and inf
df = df.replace([float('inf'), float('-inf')], 0).fillna(0)

# -----------------------------
# 4. Split features/target
# -----------------------------
X = df.drop('isFraud', axis=1)
y = df['isFraud']

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

X_train, X_test, y_train, y_test = train_test_split(
    X_scaled, y, test_size=0.2, random_state=42, stratify=y
)

# -----------------------------
# 5. Train model
# -----------------------------
print("🧠 Training XGBoost model...")
model = XGBClassifier(
    n_estimators=300,
    learning_rate=0.05,
    max_depth=5,
    subsample=0.8,
    colsample_bytree=0.8,
    scale_pos_weight=(y_train.value_counts()[0] / y_train.value_counts()[1]),
    eval_metric='logloss',
    random_state=42
)
model.fit(X_train, y_train)

# -----------------------------
# 6. Evaluate
# -----------------------------
y_pred = model.predict(X_test)
print("\n📊 Classification Report:\n")
print(classification_report(y_test, y_pred))

# -----------------------------
# 7. Save model and scaler
# -----------------------------
with open("./pickles/fraud_model.pkl", "wb") as f:
    pickle.dump(model, f)

with open("./pickles/scaler.pkl", "wb") as f:
    pickle.dump(scaler, f)

with open("./pickles/label_encoder.pkl", "wb") as f:
    pickle.dump(le, f)

print("\n✅ Model, scaler, and encoder saved successfully!")

📥 Loading dataset (PaySim synthetic transaction data)...
🧠 Training XGBoost model...

📊 Classification Report:

              precision    recall  f1-score   support

           0       1.00      1.00      1.00     85492
           1       0.12      0.84      0.21        44

    accuracy                           1.00     85536
   macro avg       0.56      0.92      0.61     85536
weighted avg       1.00      1.00      1.00     85536


✅ Model, scaler, and encoder saved successfully!

import streamlit as st
import pandas as pd
import pickle
import numpy as np

# -----------------------------
# 1. Load Model and Preprocessors
# -----------------------------
@st.cache_resource
def load_artifacts():
    model = pickle.load(open("./pickles/fraud_model.pkl", "rb"))
    scaler = pickle.load(open("./pickles/scaler.pkl", "rb"))
    le = pickle.load(open("./pickles/label_encoder.pkl", "rb"))
    return model, scaler, le

model, scaler, le = load_artifacts()

# -----------------------------
# 2. Streamlit App UI
# -----------------------------
st.set_page_config(page_title="Realistic Fraud Detection App", layout="centered")

st.title("💳 Transaction Fraud Detection")
st.write("Model trained on the **PaySim synthetic transaction dataset** — features mimic real financial data.")

# Input fields
st.subheader("Enter Transaction Details")

transaction_type = st.selectbox(
    "Transaction Type",
    le.classes_.tolist()
)
amount = st.number_input("💰 Transaction Amount ($)", 0.0, 100000.0, 2500.0, step=100.0)
oldbalanceOrg = st.number_input("🏦 Sender’s Old Balance", 0.0, 1000000.0, 5000.0, step=100.0)
newbalanceOrig = st.number_input("🏦 Sender’s New Balance", 0.0, 1000000.0, 2500.0, step=100.0)
oldbalanceDest = st.number_input("💼 Receiver’s Old Balance", 0.0, 1000000.0, 10000.0, step=100.0)
newbalanceDest = st.number_input("💼 Receiver’s New Balance", 0.0, 1000000.0, 12500.0, step=100.0)

# Convert to model input
type_encoded = le.transform([transaction_type])[0]
input_df = pd.DataFrame([{
    'type': type_encoded,
    'amount': amount,
    'oldbalanceOrg': oldbalanceOrg,
    'newbalanceOrig': newbalanceOrig,
    'oldbalanceDest': oldbalanceDest,
    'newbalanceDest': newbalanceDest
}])

# -----------------------------
# 3. Prediction Trigger Button
# -----------------------------
if st.button("🔍 Predict Fraud"):
    # Scale input
    input_scaled = scaler.transform(input_df)
    prob = model.predict_proba(input_scaled)[0][1]
    pred = model.predict(input_scaled)[0]

    st.write("---")
    st.subheader("🔍 Prediction Result")
    if pred == 1:
        st.error(f"⚠️ Fraudulent Transaction Detected! (Probability: {prob:.2f})")
    else:
        st.success(f"✅ Legitimate Transaction (Probability of Fraud: {prob:.2f})")

else:
    st.info("🧭 Fill out the form above and click **'🔍 Predict Fraud'** to see results.")

st.caption("This demo uses the PaySim synthetic dataset (simulating mobile money transactions).")

!docker run -idt -p 8501:8501 --name dev_fraud_container python:3.11.12-slim

67cbd3737e3fa0a45c4c414bba61f4ffbb83fb357086a9f7b533f45909d29bd9

!docker ps

CONTAINER ID   IMAGE                 COMMAND     CREATED                  STATUS                  PORTS                    NAMES
67cbd3737e3f   python:3.11.12-slim   "python3"   Less than a second ago   Up Less than a second   0.0.0.0:8501->8501/tcp   dev_fraud_container

!docker cp . dev_fraud_container:/app

!docker container commit dev_fraud_container docker.io/mrezvandehy/contrizing_ml_model_with_docker:v1

sha256:8b354c628b4c000432112a7990acfa320abbdd49d878c0e51091a8e0e45b908a

!docker image ls

REPOSITORY                                    TAG            IMAGE ID       CREATED             SIZE
mrezvandehy/contrizing_ml_model_with_docker   v1             8b354c628b4c   1 second ago        294MB
<none>                                        <none>         2fcf0c708a13   5 minutes ago       369MB
<none>                                        <none>         a15bd71a2cd7   About an hour ago   3.35GB
python                                        3.11.12-slim   dbf1de478a55   7 months ago        195MB

!docker image push docker.io/mrezvandehy/contrizing_ml_model_with_docker:v1

The push refers to repository [docker.io/mrezvandehy/contrizing_ml_model_with_docker]
9d545c45fb8c: Waiting
09c4893e5320: Waiting
9121df072490: Waiting
fa70febde0f6: Waiting
61320b01ae5e: Waiting
9121df072490: Waiting
fa70febde0f6: Waiting
61320b01ae5e: Waiting
9d545c45fb8c: Waiting
09c4893e5320: Waiting
9d545c45fb8c: Waiting
09c4893e5320: Waiting
9121df072490: Waiting
fa70febde0f6: Waiting
61320b01ae5e: Waiting
9121df072490: Waiting
fa70febde0f6: Waiting
61320b01ae5e: Waiting
9d545c45fb8c: Waiting
09c4893e5320: Waiting
09c4893e5320: Waiting
9121df072490: Waiting
fa70febde0f6: Waiting
61320b01ae5e: Waiting
9d545c45fb8c: Waiting
9121df072490: Waiting
fa70febde0f6: Waiting
61320b01ae5e: Layer already exists
9d545c45fb8c: Layer already exists
09c4893e5320: Waiting
fa70febde0f6: Layer already exists
09c4893e5320: Layer already exists
9121df072490: Waiting
9121df072490: Pushed
v1: digest: sha256:8b354c628b4c000432112a7990acfa320abbdd49d878c0e51091a8e0e45b908a size: 1402

docker image build -t user/repo:version .

FROM python:3.11-slim

# Set working directory
WORKDIR /app

# Copy only requirements first (for caching)
COPY requirements.txt .

# Install dependencies
RUN pip install --no-cache-dir -r requirements.txt

# Copy the rest of the app
COPY . .

# Expose the Streamlit default port
EXPOSE 8501

# Set environment variable to avoid Streamlit asking for email, etc.
ENV STREAMLIT_DISABLE_VERSION_CHECK=true \
    STREAMLIT_SERVER_HEADLESS=true \
    PYTHONUNBUFFERED=1

# Command to run the Streamlit app
CMD ["streamlit", "run", "app.py", "--server.port=8501", "--server.address=0.0.0.0"]

!docker image ls mrezvandehy/contrizing_ml_model_with_docker

REPOSITORY                                    TAG       IMAGE ID       CREATED         SIZE
mrezvandehy/contrizing_ml_model_with_docker   v2        a8c0608e41a0   2 minutes ago   2.16GB
mrezvandehy/contrizing_ml_model_with_docker   v1        8b354c628b4c   4 minutes ago   294MB

!docker run -idt -p 8502:8501 mrezvandehy/contrizing_ml_model_with_docker:v2

dee9d8f30f9cb9ab3b5d4cdfec9643904b45d28a3352fcb28d2639f3e63e4987

!docker ps

CONTAINER ID   IMAGE                                            COMMAND                  CREATED              STATUS              PORTS                    NAMES
dee9d8f30f9c   mrezvandehy/contrizing_ml_model_with_docker:v2   "streamlit run app.pâ€¦"   About a minute ago   Up About a minute   0.0.0.0:8502->8501/tcp   eloquent_lamarr

!docker image ls mrezvandehy/contrizing_ml_model_with_docker

REPOSITORY                                    TAG       IMAGE ID       CREATED         SIZE
mrezvandehy/contrizing_ml_model_with_docker   v2        a8c0608e41a0   4 minutes ago   2.16GB
mrezvandehy/contrizing_ml_model_with_docker   v1        8b354c628b4c   6 minutes ago   294MB

!docker history mrezvandehy/contrizing_ml_model_with_docker:v1

IMAGE          CREATED         CREATED BY                                      SIZE      COMMENT
8b354c628b4c   6 minutes ago   python3                                         61MB      
dbf1de478a55   7 months ago    CMD ["python3"]                                 0B        buildkit.dockerfile.v0
<missing>      7 months ago    RUN /bin/sh -c set -eux;  for src in idle3 pâ€¦   16.4kB    buildkit.dockerfile.v0
<missing>      7 months ago    RUN /bin/sh -c set -eux;   savedAptMark="$(aâ€¦   51.7MB    buildkit.dockerfile.v0
<missing>      7 months ago    ENV PYTHON_SHA256=849da87af4df137710c1796e27â€¦   0B        buildkit.dockerfile.v0
<missing>      7 months ago    ENV PYTHON_VERSION=3.11.12                      0B        buildkit.dockerfile.v0
<missing>      7 months ago    ENV GPG_KEY=A035C8C19219BA821ECEA86B64E628F8â€¦   0B        buildkit.dockerfile.v0
<missing>      7 months ago    RUN /bin/sh -c set -eux;  apt-get update;  aâ€¦   10.4MB    buildkit.dockerfile.v0
<missing>      7 months ago    ENV LANG=C.UTF-8                                0B        buildkit.dockerfile.v0
<missing>      7 months ago    ENV PATH=/usr/local/bin:/usr/local/sbin:/usrâ€¦   0B        buildkit.dockerfile.v0
<missing>      7 months ago    # debian.sh --arch 'amd64' out/ 'bookworm' 'â€¦   85.2MB    debuerreotype 0.15

!docker history mrezvandehy/contrizing_ml_model_with_docker:v2

IMAGE          CREATED         CREATED BY                                      SIZE      COMMENT
a8c0608e41a0   4 minutes ago   CMD ["streamlit" "run" "app.py" "--server.poâ€¦   0B        buildkit.dockerfile.v0
<missing>      4 minutes ago   ENV STREAMLIT_DISABLE_VERSION_CHECK=true STRâ€¦   0B        buildkit.dockerfile.v0
<missing>      4 minutes ago   EXPOSE map[8501/tcp:{}]                         0B        buildkit.dockerfile.v0
<missing>      4 minutes ago   COPY . . # buildkit                             60.1MB    buildkit.dockerfile.v0
<missing>      4 minutes ago   RUN /bin/sh -c pip install --no-cache-dir -râ€¦   1.28GB    buildkit.dockerfile.v0
<missing>      5 minutes ago   COPY requirements.txt . # buildkit              12.3kB    buildkit.dockerfile.v0
<missing>      5 minutes ago   WORKDIR /app                                    8.19kB    buildkit.dockerfile.v0
<missing>      2 weeks ago     CMD ["python3"]                                 0B        buildkit.dockerfile.v0
<missing>      2 weeks ago     RUN /bin/sh -c set -eux;  for src in idle3 pâ€¦   16.4kB    buildkit.dockerfile.v0
<missing>      2 weeks ago     RUN /bin/sh -c set -eux;   savedAptMark="$(aâ€¦   48.4MB    buildkit.dockerfile.v0
<missing>      2 weeks ago     ENV PYTHON_SHA256=8d3ed8ec5c88c1c95f5e558612â€¦   0B        buildkit.dockerfile.v0
<missing>      2 weeks ago     ENV PYTHON_VERSION=3.11.14                      0B        buildkit.dockerfile.v0
<missing>      2 weeks ago     ENV GPG_KEY=A035C8C19219BA821ECEA86B64E628F8â€¦   0B        buildkit.dockerfile.v0
<missing>      2 weeks ago     RUN /bin/sh -c set -eux;  apt-get update;  aâ€¦   4.94MB    buildkit.dockerfile.v0
<missing>      2 weeks ago     ENV LANG=C.UTF-8                                0B        buildkit.dockerfile.v0
<missing>      2 weeks ago     ENV PATH=/usr/local/bin:/usr/local/sbin:/usrâ€¦   0B        buildkit.dockerfile.v0
<missing>      2 weeks ago     # debian.sh --arch 'amd64' out/ 'trixie' '@1â€¦   87.4MB    debuerreotype 0.16

!docker ps

CONTAINER ID   IMAGE                                            COMMAND                  CREATED         STATUS         PORTS                    NAMES
dee9d8f30f9c   mrezvandehy/contrizing_ml_model_with_docker:v2   "streamlit run app.pâ€¦"   2 minutes ago   Up 2 minutes   0.0.0.0:8502->8501/tcp   eloquent_lamarr

# make v2 as latest
!docker image tag mrezvandehy/contrizing_ml_model_with_docker:v2  mrezvandehy/contrizing_ml_model_with_docker:latest

!docker image ls mrezvandehy/contrizing_ml_model_with_docker

REPOSITORY                                    TAG       IMAGE ID       CREATED         SIZE
mrezvandehy/contrizing_ml_model_with_docker   latest    a8c0608e41a0   5 minutes ago   2.16GB
mrezvandehy/contrizing_ml_model_with_docker   v2        a8c0608e41a0   5 minutes ago   2.16GB
mrezvandehy/contrizing_ml_model_with_docker   v1        8b354c628b4c   7 minutes ago   294MB

Table of Contents

Train a Simple ML Model¶

Streamlit App¶

Build Container Image¶

Manual Procedure¶

Clone Repo with Codes and Dependencies¶

Create Containerized Environment¶

Copy the Source Code to Container¶

Go Inside the Application¶

Run App inside Container¶

Convert the Container to Image¶

Using Docker File¶

Create Dockerfile¶

Build Image¶

Test Image¶

Publish Container Image¶

Deploy containerized Streamlit app on Hugging Face¶