Gemma 7B RAG Chatbot

Kurum İçi Verilerle Çalışan Yüksek Doğruluklu RAG Asistanı

Gemma 7B RAG Chatbot

Proje Özeti

Bu akıllı asistan projesi, veri gizliliğine önem veren kurumlar için tasarlanmış bağımsız bir RAG (Retrieval-Augmented Generation) sistemidir. Şirket içi belgeleri analiz ederek, kullanıcı sorularına tamamen belgelerdeki verilere sadık kalarak, halüsinasyon (uydurma) üretmeden %92'ye varan doğruluk oranlarıyla yanıtlar hazırlar.

Temel Özellikler

  • Kurum içi PDF, Word, Excel, Markdown ve metin dosyalarını otomatik işleme
  • LangChain framework'ü ile oluşturulmuş gelişmiş belge parçalama (chunking) ve geri çağırma (retrieval) pipeline'ı
  • Gemma 7B açık kaynaklı büyük dil modeliyle lokalde (on-premise) güvenli çıkarım yapabilme
  • ChromaDB / FAISS vektör veritabanları ile ultra hızlı semantik arama

Teknik Altyapı ve Mimari

  • Veri İşleme: PyPDF ve Docx2txt kütüphaneleri ile ham metin çıkarma
  • Semantik İndeksleme: Metin parçalarını vektör embedding'e (bölgesel gömmelere) çevirip ChromaDB üzerinde indeksleme
  • Sorgulama Modülü: LangChain RetrievalQA zinciri aracılığıyla en alakalı metin parçalarını tespit etme
  • Üretim Paneli: Streamlit veya FastAPI tabanlı bir istemci arayüzü ile asistan sohbet penceresi

Bağlantılar

Teknoloji Yığını

PythonGemma 7B LLMLangChainChromaDBHuggingFace TransformersSentenceTransformers