Chapter 43

AI এজেন্ট

AI Agents
🎬 LLM থেকে Autonomous System
AI Agent = LLM + tools + memory + planning loop। শুধু একটি উত্তর নয় — agent নিজেই সিদ্ধান্ত নেয়, tool কল করে, ফলাফল observe করে, পরের পদক্ষেপ ঠিক করে। লক্ষ্য পূরণ পর্যন্ত চলে।

Agent Loop (ReAct)

while not done:
    thought  = llm("আমি এখন কী করব? কারণ?")
    action   = parse_tool_call(thought)
    if action == FINISH: break
    obs      = run_tool(action)
    memory.append((thought, action, obs))
return final_answer

একটি Agent-এর উপাদান

  1. LLM brain — reasoning ও decision।
  2. Tools / Functions — search, calculator, code-exec, DB, API।
  3. Memory — short-term (context), long-term (vector store)।
  4. Planner — goal decompose, sub-task।
  5. Controller / Loop — orchestration ও stopping rule।

Tool / Function Calling

from openai import OpenAI
client = OpenAI()

tools = [{
  "type": "function",
  "function": {
    "name": "get_weather",
    "description": "Get current weather for a city.",
    "parameters": {
      "type": "object",
      "properties": {"city":{"type":"string"}},
      "required": ["city"]
    }}}]

resp = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role":"user","content":"Dhaka-এর weather?"}],
    tools=tools, tool_choice="auto")

call = resp.choices[0].message.tool_calls[0]
result = get_weather(**json.loads(call.function.arguments))

Agent Frameworks

Framework
শক্তি
LangGraph
state-machine, production-ready
LlamaIndex Agents
RAG-centric agent
CrewAI
role-based multi-agent
AutoGen (MS)
conversational multi-agent
OpenAI Agents SDK
simple, tool-native

LangGraph উদাহরণ

from langgraph.prebuilt import create_react_agent
from langchain_openai import ChatOpenAI
from langchain_core.tools import tool

@tool
def calc(expr: str) -> str:
    "Evaluate a math expression."
    return str(eval(expr))

agent = create_react_agent(ChatOpenAI(model="gpt-4o-mini"), tools=[calc])
out = agent.invoke({"messages":[("user","12*13 + 7^2 কত?")]})
print(out["messages"][-1].content)

Multi-Agent Pattern

  • Supervisor: central agent task delegate করে।
  • Pipeline: Researcher → Writer → Editor।
  • Debate: দুই agent তর্ক, judge সিদ্ধান্ত।
  • Swarm: অনেক agent parallel কাজ।

Memory

  • Short-term: conversation context।
  • Long-term: vector store-এ সংরক্ষিত past interaction।
  • Episodic: পূর্ববর্তী task summary।
  • Procedural: শেখা workflow / tool usage।

Safety ও Guardrails

  • Max iteration limit (loop নয়)।
  • Tool whitelisting + arg validation।
  • Cost/token budget cap।
  • Human-in-the-loop approval critical action-এ।
  • Sandboxed code execution।
  • PII/secret filter।
⚠️ Agent-এর বিপদ
  • Prompt injection — untrusted data tool কল করাতে পারে।
  • Infinite loop / runaway cost।
  • ভুল tool কল production system-এ ক্ষতি।
  • Non-deterministic — debug কঠিন।

Real-world Examples

  • Coding agents (Devin, Cursor, Lovable)।
  • Research / browsing agents (Perplexity, OpenAI Deep Research)।
  • Customer support automation।
  • Data analysis agent (SQL + chart)।
  • Workflow automation (n8n-style)।
🔑 Start Simple
শুরুতে ১-২টি tool, max 5 iteration, deterministic prompt। জটিলতা ধাপে বাড়ান — মাল্টি-এজেন্ট না হলে চলে না, এমন না হলে এড়িয়ে চলুন।

অনুশীলন

১. Calculator + web-search tool নিয়ে ReAct agent বানান।

২. LangGraph দিয়ে Researcher → Writer pipeline।

৩. Memory যোগ করে multi-turn conversation।

সারসংক্ষেপ

✨ এই অধ্যায়ে যা শিখলাম
  • Agent = LLM + tools + memory + loop।
  • ReAct = Thought → Action → Observation।
  • Guardrails ছাড়া agent production-ready নয়।
  • এই অধ্যায়ে Phase 5 শেষ। পরের Phase-এ Advanced Deep Learning।