Gemma 7B RAG Chatbot
Kurum İçi Verilerle Çalışan Yüksek Doğruluklu RAG Asistanı

Proje Özeti
Bu akıllı asistan projesi, veri gizliliğine önem veren kurumlar için tasarlanmış bağımsız bir RAG (Retrieval-Augmented Generation) sistemidir. Şirket içi belgeleri analiz ederek, kullanıcı sorularına tamamen belgelerdeki verilere sadık kalarak, halüsinasyon (uydurma) üretmeden %92'ye varan doğruluk oranlarıyla yanıtlar hazırlar.
Temel Özellikler
- Kurum içi PDF, Word, Excel, Markdown ve metin dosyalarını otomatik işleme
- LangChain framework'ü ile oluşturulmuş gelişmiş belge parçalama (chunking) ve geri çağırma (retrieval) pipeline'ı
- Gemma 7B açık kaynaklı büyük dil modeliyle lokalde (on-premise) güvenli çıkarım yapabilme
- ChromaDB / FAISS vektör veritabanları ile ultra hızlı semantik arama
Teknik Altyapı ve Mimari
- Veri İşleme: PyPDF ve Docx2txt kütüphaneleri ile ham metin çıkarma
- Semantik İndeksleme: Metin parçalarını vektör embedding'e (bölgesel gömmelere) çevirip ChromaDB üzerinde indeksleme
- Sorgulama Modülü: LangChain RetrievalQA zinciri aracılığıyla en alakalı metin parçalarını tespit etme
- Üretim Paneli: Streamlit veya FastAPI tabanlı bir istemci arayüzü ile asistan sohbet penceresi
Bağlantılar
Teknoloji Yığını
PythonGemma 7B LLMLangChainChromaDBHuggingFace TransformersSentenceTransformers