Newer
Older
services / llama-cpp / README.md
@nightfall nightfall 2 hours ago 817 bytes first commit

llama.cpp

Статус: draft

У системі два окремі інстанси llama.cpp із різними моделями, параметрами запуску та портами. Це головне джерело плутанини — не змішувати.

ІнстансМодельРежимПризначення
embeddingsbge-m3-fp16--embeddingВекторизація для пошуку
translation-moderation(уточнити)генеративнийПереклад новин + AI-модерація

Backend-бік цих інтеграцій описано в backend/docs/ai-integration.md.