AI Chat, fully equipped
Dari RAG retrieval hingga conversation memory. Semua yang Anda butuhkan untuk membangun chatbot cerdas.
RAG Pipeline
Jawaban akurat dari knowledge base Anda. TUTUR menggabungkan retrieval dan generation untuk menghasilkan respons yang kontekstual dan factual.
- Hybrid search — gabungan vector similarity dan keyword matching untuk coverage maksimal
- Pipeline search — multi-stage retrieval dengan filtering, scoring, dan reranking
- Chunk management — automatic chunking dengan overlap untuk konteks yang lengkap
- Score threshold — hanya dokumen dengan relevansi tinggi yang masuk ke prompt
- Source attribution — setiap jawaban dilengkapi referensi sumber dokumen
- Configurable top-k — atur jumlah dokumen relevan per query sesuai kebutuhan
4-Layer Memory System
Chatbot yang benar-benar mengingat. Empat layer memory bekerja bersama untuk memberikan pengalaman percakapan yang koheren.
- Session memory — conversation history dalam session, otomatis di-summarize saat panjang
- Semantic memory — fakta dan preferensi user yang di-extract otomatis dari percakapan
- Temporal memory — awareness waktu: "kemarin saya bilang..." dipahami dengan benar
- Entity extraction — nama, lokasi, preferensi otomatis di-detect dan disimpan
- Memory decay — informasi lama gradually berkurang relevansinya, seperti ingatan manusia
- Cross-session recall — user bisa melanjutkan konteks dari percakapan sebelumnya
Multi-Provider AI
Tidak terkunci di satu provider. Pilih model terbaik untuk setiap use case, switch kapan saja tanpa ubah kode.
- OpenAI — GPT-4o, GPT-4o-mini untuk general purpose dan reasoning
- DeepSeek — DeepSeek V3/R1 untuk coding dan technical tasks dengan harga kompetitif
- Groq — Ultra-fast inference untuk use case yang butuh latensi rendah
- Streaming built-in — Server-Sent Events untuk real-time response di semua provider
- Per-tenant config — setiap tenant bisa pilih provider dan model sendiri
- Fallback chain — automatic failover ke provider lain jika primary down
Multi-Tenant Architecture
Satu deployment TUTUR melayani banyak tenant. Setiap tenant sepenuhnya terisolasi dengan konfigurasi independen.
- Tenant isolation — data, knowledge base, dan session sepenuhnya terpisah
- Per-tenant LLM config — provider, model, temperature, max tokens, semua bisa berbeda
- Per-tenant RAG config — strategy, top-k, score threshold bisa diatur per tenant
- Feature flags — aktifkan/nonaktifkan memory, streaming, summarization per tenant
- API key management — setiap tenant punya API keys sendiri dengan permission granular
- Usage tracking — monitor penggunaan per tenant untuk billing dan capacity planning
Knowledge Base
Upload dokumen, TUTUR otomatis memproses dan membuat knowledge base yang siap di-query oleh AI.
- Document upload — support berbagai format (PDF, TXT, Markdown, dan lainnya)
- Auto-chunking — dokumen dipecah menjadi chunks optimal dengan overlap
- Vector embedding — text-embedding-3-small dari OpenAI untuk semantic representation
- Qdrant vector DB — high-performance vector database untuk similarity search
- Metadata filtering — filter dokumen berdasarkan tag, source, atau metadata custom
- Real-time indexing — dokumen baru langsung searchable tanpa rebuild
Developer-Friendly API
API yang bersih dan konsisten. Integrasikan TUTUR ke aplikasi Anda dalam hitungan menit.
- RESTful API — endpoint yang intuitif dan well-documented dengan OpenAPI spec
- SSE streaming — Server-Sent Events untuk real-time chat responses
- Tenant-scoped — semua endpoint di-scope per tenant via API key
- Session management — create, list, get, delete sessions via API
- Knowledge CRUD — upload, search, dan manage knowledge base via API
- Rate limiting — configurable per API key untuk fair usage