services / llama-cpp /
..
embeddings first commit 3 hours ago
translation-moderation first commit 3 hours ago
README.md first commit 3 hours ago
README.md

llama.cpp

Статус: draft

У системі два окремі інстанси llama.cpp із різними моделями, параметрами запуску та портами. Це головне джерело плутанини — не змішувати.

ІнстансМодельРежимПризначення
embeddingsbge-m3-fp16--embeddingВекторизація для пошуку
translation-moderation(уточнити)генеративнийПереклад новин + AI-модерація

Backend-бік цих інтеграцій описано в backend/docs/ai-integration.md.