Chapter 60
ইন্টারমিডিয়েট প্রজেক্ট
Intermediate Projects
🚀 ৫টি Intermediate প্রজেক্ট
এই level-এ multiple model, real dataset, proper evaluation, এবং production concern (caching, monitoring) যুক্ত হবে।
Project #1
Real-time Object Detection (YOLOv8 + Webcam)
Stack: Ultralytics YOLOv8, OpenCV, FastAPI, WebSocket
লক্ষ্য: Browser webcam stream নিয়ে real-time detection + bounding box overlay।
- YOLOv8n pretrained দিয়ে inference test।
- Custom dataset (Roboflow) — 3-5 class fine-tune।
- FastAPI + WebSocket — frame in, detection out।
- React frontend → canvas-এ box draw।
- FPS counter, mAP report।
Stretch: ONNX/TensorRT export — latency 2× কমান।
Project #2
Multi-source RAG with Reranker
Stack: LangChain, Qdrant, BGE-reranker, Llama-3, FastAPI
লক্ষ্য: PDF + web + Notion থেকে hybrid search + reranker + cited answer।
- Multiple loader (PDF, URL, markdown) → unified chunk।
- Dense (BGE-large) + sparse (BM25) hybrid retrieval।
- Cross-encoder reranker — top-50 → top-5।
- Llama-3-8B (Ollama) দিয়ে answer + citation।
- RAGAS দিয়ে faithfulness/precision metric।
Stretch: Streaming response + chat history।
Project #3
Bengali Speech-to-Text + Summarizer
Stack: Whisper, mBART, Gradio
লক্ষ্য: বাংলা audio → transcript → summary pipeline।
- Whisper-large-v3 দিয়ে Bangla transcribe।
- WER metric দিয়ে accuracy মাপুন।
- mBART/BanglaT5 দিয়ে summary generate।
- Gradio UI — audio upload, transcript+summary দেখায়।
- YouTube URL support (yt-dlp)।
Stretch: Speaker diarization (pyannote)।
Project #4
Fine-tuned LLM with LoRA (Domain Chatbot)
Stack: PEFT, QLoRA, Llama-3-8B, bitsandbytes, Unsloth
লক্ষ্য: নিজের domain (legal/medical/recipe) data দিয়ে LLM fine-tune।
- Instruction dataset (1k-5k pair) তৈরি/সংগ্রহ।
- QLoRA config — r=16, alpha=32, 4-bit base।
- 3 epoch train (Colab/Kaggle T4-তেই সম্ভব)।
- Eval — LLM-as-judge দিয়ে base vs fine-tuned।
- GGUF export → Ollama-তে local run।
Stretch: DPO দিয়ে preference alignment।
Project #5
AI-powered E-commerce Search
Stack: CLIP, Qdrant, FastAPI, Next.js
লক্ষ্য: Text বা image দিয়ে product search (semantic + visual)।
- Product image+title → CLIP embedding → Qdrant index।
- Text query embed → cosine search।
- Image query (upload) → একইভাবে search।
- Filter (price, category) + faceted UI।
- Click log → eval (NDCG, recall@k)।
Stretch: Personalization — user history থেকে rerank।
Production Touches
- Docker + docker-compose।
- Redis cache (embedding/response)।
- Prometheus + Grafana dashboard।
- GitHub Actions CI — test, lint, build।
- Demo video (Loom/YouTube) README-এ।
💡 Blog লিখুন
প্রতিটি project-এ একটি Medium/dev.to blog — "যা শিখলাম, যা কঠিন ছিল" — recruiter ও community-তে আপনাকে আলাদা করবে।
সারসংক্ষেপ
✨ এই অধ্যায়ে যা শিখলাম
- ৫টি intermediate project — vision, RAG, audio, LLM FT, search।
- Production concern — cache, metric, CI।
- Blog + demo video = portfolio-এর পূর্ণতা।