Chapter 59
বিগিনার প্রজেক্ট
Beginner Projects
🌱 প্রথম ৫টি প্রজেক্ট
Theory পড়া শেষ — এবার build। এই প্রজেক্টগুলো কয়েক দিনে শেষ হবে, কিন্তু full pipeline (data → model → API → deploy) শেখাবে।
Project #1
Iris/Titanic Classifier + REST API
Stack: scikit-learn, FastAPI, Docker, Render
লক্ষ্য: ছোট tabular dataset দিয়ে end-to-end ML lifecycle অনুশীলন।
- EDA + feature engineering (pandas)।
- Logistic Regression + Random Forest train, accuracy/F1 compare।
- joblib দিয়ে save, FastAPI দিয়ে /predict endpoint।
- Dockerize → Render/Fly.io-তে free deploy।
- GitHub README + Swagger docs।
Stretch: MLflow দিয়ে experiment tracking যোগ করুন।
Project #2
Handwritten Digit Recognizer
Stack: PyTorch, MNIST, Gradio
লক্ষ্য: CNN বানিয়ে digit recognition + interactive web demo।
- MNIST dataloader + simple CNN (Conv → ReLU → Pool ×2 → FC)।
- 10 epoch train, test accuracy >98%।
- Gradio canvas — user হাতে আঁকে, model predict করে।
- HuggingFace Spaces-এ free deploy।
Stretch: Bangla digit (NumtaDB) দিয়ে retrain।
Project #3
Sentiment Analysis on Movie Reviews
Stack: HuggingFace Transformers, DistilBERT, Streamlit
লক্ষ্য: Pretrained model fine-tune করে IMDB sentiment classifier।
- datasets লাইব্রেরি থেকে IMDB load।
- DistilBERT fine-tune (3 epoch, lr=2e-5)।
- Confusion matrix + per-class metrics।
- Streamlit app — text box → positive/negative + probability।
Stretch: Bangla review (Daraz/Pathao) দিয়ে multilingual BERT fine-tune।
Project #4
Image Classifier — Cats vs Dogs (Transfer Learning)
Stack: PyTorch, EfficientNet-B0, Kaggle
লক্ষ্য: Pretrained CNN fine-tune করে real-world image classification।
- Kaggle dataset download (timm/torchvision)।
- Data augmentation — flip, rotate, color jitter।
- EfficientNet-B0 head replace + 5 epoch train।
- Grad-CAM দিয়ে decision visualization।
- ONNX export → web demo।
Stretch: অন্য animal class যোগ করে multi-class।
Project #5
Personal RAG Chatbot (PDF Q&A)
Stack: LangChain, OpenAI/Ollama, Chroma, Streamlit
লক্ষ্য: নিজের PDF (বই/নোট) থেকে প্রশ্নের উত্তর দিতে পারে এমন bot।
- PyPDF দিয়ে text extract → chunk (500 token, 50 overlap)।
- sentence-transformers embedding → Chroma store।
- Query embed → top-k retrieve → LLM-এ context+question।
- Streamlit chat UI + source citation।
Stretch: History memory + multi-PDF support।
সফলতার মানদণ্ড
- প্রতিটি প্রজেক্ট GitHub-এ public, README সহ।
- Live demo link (HF Spaces / Render / Streamlit Cloud)।
- Screenshot/GIF — recruiter-রা পড়ে না, দেখে।
- "কী শিখলাম" section — ৩-৫ bullet।
💡 শেষ করে এগোন
১০টা অর্ধেক প্রজেক্টের চেয়ে ৩টা polished প্রজেক্ট ভালো — deployment, docs, demo video — সব মিলিয়ে।
সারসংক্ষেপ
✨ এই অধ্যায়ে যা শিখলাম
- ৫টি beginner project — tabular, vision, NLP, RAG।
- Full lifecycle: data → train → API → deploy।
- Portfolio-ready GitHub + live demo।