Chapter 60

ইন্টারমিডিয়েট প্রজেক্ট

Intermediate Projects
🚀 ৫টি Intermediate প্রজেক্ট
এই level-এ multiple model, real dataset, proper evaluation, এবং production concern (caching, monitoring) যুক্ত হবে।
Project #1
Real-time Object Detection (YOLOv8 + Webcam)
Stack: Ultralytics YOLOv8, OpenCV, FastAPI, WebSocket

লক্ষ্য: Browser webcam stream নিয়ে real-time detection + bounding box overlay।

  1. YOLOv8n pretrained দিয়ে inference test।
  2. Custom dataset (Roboflow) — 3-5 class fine-tune।
  3. FastAPI + WebSocket — frame in, detection out।
  4. React frontend → canvas-এ box draw।
  5. FPS counter, mAP report।

Stretch: ONNX/TensorRT export — latency 2× কমান।

Project #2
Multi-source RAG with Reranker
Stack: LangChain, Qdrant, BGE-reranker, Llama-3, FastAPI

লক্ষ্য: PDF + web + Notion থেকে hybrid search + reranker + cited answer।

  1. Multiple loader (PDF, URL, markdown) → unified chunk।
  2. Dense (BGE-large) + sparse (BM25) hybrid retrieval।
  3. Cross-encoder reranker — top-50 → top-5।
  4. Llama-3-8B (Ollama) দিয়ে answer + citation।
  5. RAGAS দিয়ে faithfulness/precision metric।

Stretch: Streaming response + chat history।

Project #3
Bengali Speech-to-Text + Summarizer
Stack: Whisper, mBART, Gradio

লক্ষ্য: বাংলা audio → transcript → summary pipeline।

  1. Whisper-large-v3 দিয়ে Bangla transcribe।
  2. WER metric দিয়ে accuracy মাপুন।
  3. mBART/BanglaT5 দিয়ে summary generate।
  4. Gradio UI — audio upload, transcript+summary দেখায়।
  5. YouTube URL support (yt-dlp)।

Stretch: Speaker diarization (pyannote)।

Project #4
Fine-tuned LLM with LoRA (Domain Chatbot)
Stack: PEFT, QLoRA, Llama-3-8B, bitsandbytes, Unsloth

লক্ষ্য: নিজের domain (legal/medical/recipe) data দিয়ে LLM fine-tune।

  1. Instruction dataset (1k-5k pair) তৈরি/সংগ্রহ।
  2. QLoRA config — r=16, alpha=32, 4-bit base।
  3. 3 epoch train (Colab/Kaggle T4-তেই সম্ভব)।
  4. Eval — LLM-as-judge দিয়ে base vs fine-tuned।
  5. GGUF export → Ollama-তে local run।

Stretch: DPO দিয়ে preference alignment।

Project #5
AI-powered E-commerce Search
Stack: CLIP, Qdrant, FastAPI, Next.js

লক্ষ্য: Text বা image দিয়ে product search (semantic + visual)।

  1. Product image+title → CLIP embedding → Qdrant index।
  2. Text query embed → cosine search।
  3. Image query (upload) → একইভাবে search।
  4. Filter (price, category) + faceted UI।
  5. Click log → eval (NDCG, recall@k)।

Stretch: Personalization — user history থেকে rerank।

Production Touches

  • Docker + docker-compose।
  • Redis cache (embedding/response)।
  • Prometheus + Grafana dashboard।
  • GitHub Actions CI — test, lint, build।
  • Demo video (Loom/YouTube) README-এ।
💡 Blog লিখুন
প্রতিটি project-এ একটি Medium/dev.to blog — "যা শিখলাম, যা কঠিন ছিল" — recruiter ও community-তে আপনাকে আলাদা করবে।

সারসংক্ষেপ

✨ এই অধ্যায়ে যা শিখলাম
  • ৫টি intermediate project — vision, RAG, audio, LLM FT, search।
  • Production concern — cache, metric, CI।
  • Blog + demo video = portfolio-এর পূর্ণতা।