Chapter 59

বিগিনার প্রজেক্ট

Beginner Projects
🌱 প্রথম ৫টি প্রজেক্ট
Theory পড়া শেষ — এবার build। এই প্রজেক্টগুলো কয়েক দিনে শেষ হবে, কিন্তু full pipeline (data → model → API → deploy) শেখাবে।
Project #1
Iris/Titanic Classifier + REST API
Stack: scikit-learn, FastAPI, Docker, Render

লক্ষ্য: ছোট tabular dataset দিয়ে end-to-end ML lifecycle অনুশীলন।

  1. EDA + feature engineering (pandas)।
  2. Logistic Regression + Random Forest train, accuracy/F1 compare।
  3. joblib দিয়ে save, FastAPI দিয়ে /predict endpoint।
  4. Dockerize → Render/Fly.io-তে free deploy।
  5. GitHub README + Swagger docs।

Stretch: MLflow দিয়ে experiment tracking যোগ করুন।

Project #2
Handwritten Digit Recognizer
Stack: PyTorch, MNIST, Gradio

লক্ষ্য: CNN বানিয়ে digit recognition + interactive web demo।

  1. MNIST dataloader + simple CNN (Conv → ReLU → Pool ×2 → FC)।
  2. 10 epoch train, test accuracy >98%।
  3. Gradio canvas — user হাতে আঁকে, model predict করে।
  4. HuggingFace Spaces-এ free deploy।

Stretch: Bangla digit (NumtaDB) দিয়ে retrain।

Project #3
Sentiment Analysis on Movie Reviews
Stack: HuggingFace Transformers, DistilBERT, Streamlit

লক্ষ্য: Pretrained model fine-tune করে IMDB sentiment classifier।

  1. datasets লাইব্রেরি থেকে IMDB load।
  2. DistilBERT fine-tune (3 epoch, lr=2e-5)।
  3. Confusion matrix + per-class metrics।
  4. Streamlit app — text box → positive/negative + probability।

Stretch: Bangla review (Daraz/Pathao) দিয়ে multilingual BERT fine-tune।

Project #4
Image Classifier — Cats vs Dogs (Transfer Learning)
Stack: PyTorch, EfficientNet-B0, Kaggle

লক্ষ্য: Pretrained CNN fine-tune করে real-world image classification।

  1. Kaggle dataset download (timm/torchvision)।
  2. Data augmentation — flip, rotate, color jitter।
  3. EfficientNet-B0 head replace + 5 epoch train।
  4. Grad-CAM দিয়ে decision visualization।
  5. ONNX export → web demo।

Stretch: অন্য animal class যোগ করে multi-class।

Project #5
Personal RAG Chatbot (PDF Q&A)
Stack: LangChain, OpenAI/Ollama, Chroma, Streamlit

লক্ষ্য: নিজের PDF (বই/নোট) থেকে প্রশ্নের উত্তর দিতে পারে এমন bot।

  1. PyPDF দিয়ে text extract → chunk (500 token, 50 overlap)।
  2. sentence-transformers embedding → Chroma store।
  3. Query embed → top-k retrieve → LLM-এ context+question।
  4. Streamlit chat UI + source citation।

Stretch: History memory + multi-PDF support।

সফলতার মানদণ্ড

  • প্রতিটি প্রজেক্ট GitHub-এ public, README সহ।
  • Live demo link (HF Spaces / Render / Streamlit Cloud)।
  • Screenshot/GIF — recruiter-রা পড়ে না, দেখে।
  • "কী শিখলাম" section — ৩-৫ bullet।
💡 শেষ করে এগোন
১০টা অর্ধেক প্রজেক্টের চেয়ে ৩টা polished প্রজেক্ট ভালো — deployment, docs, demo video — সব মিলিয়ে।

সারসংক্ষেপ

✨ এই অধ্যায়ে যা শিখলাম
  • ৫টি beginner project — tabular, vision, NLP, RAG।
  • Full lifecycle: data → train → API → deploy।
  • Portfolio-ready GitHub + live demo।