Chapter 43
AI এজেন্ট
AI Agents
🎬 LLM থেকে Autonomous System
AI Agent = LLM + tools + memory + planning loop। শুধু একটি উত্তর নয় — agent নিজেই সিদ্ধান্ত নেয়, tool কল করে, ফলাফল observe করে, পরের পদক্ষেপ ঠিক করে। লক্ষ্য পূরণ পর্যন্ত চলে।
Agent Loop (ReAct)
while not done:
thought = llm("আমি এখন কী করব? কারণ?")
action = parse_tool_call(thought)
if action == FINISH: break
obs = run_tool(action)
memory.append((thought, action, obs))
return final_answerএকটি Agent-এর উপাদান
- LLM brain — reasoning ও decision।
- Tools / Functions — search, calculator, code-exec, DB, API।
- Memory — short-term (context), long-term (vector store)।
- Planner — goal decompose, sub-task।
- Controller / Loop — orchestration ও stopping rule।
Tool / Function Calling
from openai import OpenAI
client = OpenAI()
tools = [{
"type": "function",
"function": {
"name": "get_weather",
"description": "Get current weather for a city.",
"parameters": {
"type": "object",
"properties": {"city":{"type":"string"}},
"required": ["city"]
}}}]
resp = client.chat.completions.create(
model="gpt-4o-mini",
messages=[{"role":"user","content":"Dhaka-এর weather?"}],
tools=tools, tool_choice="auto")
call = resp.choices[0].message.tool_calls[0]
result = get_weather(**json.loads(call.function.arguments))Agent Frameworks
Framework
শক্তি
LangGraph
state-machine, production-ready
LlamaIndex Agents
RAG-centric agent
CrewAI
role-based multi-agent
AutoGen (MS)
conversational multi-agent
OpenAI Agents SDK
simple, tool-native
LangGraph উদাহরণ
from langgraph.prebuilt import create_react_agent
from langchain_openai import ChatOpenAI
from langchain_core.tools import tool
@tool
def calc(expr: str) -> str:
"Evaluate a math expression."
return str(eval(expr))
agent = create_react_agent(ChatOpenAI(model="gpt-4o-mini"), tools=[calc])
out = agent.invoke({"messages":[("user","12*13 + 7^2 কত?")]})
print(out["messages"][-1].content)Multi-Agent Pattern
- Supervisor: central agent task delegate করে।
- Pipeline: Researcher → Writer → Editor।
- Debate: দুই agent তর্ক, judge সিদ্ধান্ত।
- Swarm: অনেক agent parallel কাজ।
Memory
- Short-term: conversation context।
- Long-term: vector store-এ সংরক্ষিত past interaction।
- Episodic: পূর্ববর্তী task summary।
- Procedural: শেখা workflow / tool usage।
Safety ও Guardrails
- Max iteration limit (loop নয়)।
- Tool whitelisting + arg validation।
- Cost/token budget cap।
- Human-in-the-loop approval critical action-এ।
- Sandboxed code execution।
- PII/secret filter।
⚠️ Agent-এর বিপদ
- Prompt injection — untrusted data tool কল করাতে পারে।
- Infinite loop / runaway cost।
- ভুল tool কল production system-এ ক্ষতি।
- Non-deterministic — debug কঠিন।
Real-world Examples
- Coding agents (Devin, Cursor, Lovable)।
- Research / browsing agents (Perplexity, OpenAI Deep Research)।
- Customer support automation।
- Data analysis agent (SQL + chart)।
- Workflow automation (n8n-style)।
🔑 Start Simple
শুরুতে ১-২টি tool, max 5 iteration, deterministic prompt। জটিলতা ধাপে বাড়ান — মাল্টি-এজেন্ট না হলে চলে না, এমন না হলে এড়িয়ে চলুন।
অনুশীলন
১. Calculator + web-search tool নিয়ে ReAct agent বানান।
২. LangGraph দিয়ে Researcher → Writer pipeline।
৩. Memory যোগ করে multi-turn conversation।
সারসংক্ষেপ
✨ এই অধ্যায়ে যা শিখলাম
- Agent = LLM + tools + memory + loop।
- ReAct = Thought → Action → Observation।
- Guardrails ছাড়া agent production-ready নয়।
- এই অধ্যায়ে Phase 5 শেষ। পরের Phase-এ Advanced Deep Learning।