Анонимный кейс эксплуатации

Контур подготовки знаний для RAG

Эксплуатационный контур FOXOPS для подготовки корпоративных знаний: корзины знаний, документы, извлечение текста, сервис разбиения контента, чанки, эмбеддинги, векторный поиск, файловое и S3-совместимое хранилище, а также API для управляемой загрузки и обработки материалов.

Проблема

Почему RAG начинается не с чата, а с подготовки знаний

Файлы сами по себе не становятся базой знаний

Для AI-поиска недостаточно просто загрузить документы в хранилище без корзин, статусов, извлечения текста и связанного контура обработки.

Нужна воспроизводимая подготовка

Документы должны проходить единый процесс загрузки, извлечения текста, разбиения, индексирования и подготовки эмбеддингов.

Источники и хранилища отличаются

Система должна уметь работать как с локальным диском, так и с S3-совместимым хранилищем без смены общей модели.

RAG требует сервисного слоя

Поверх документов нужны API, переиндексация корзин, поиск с контекстным окном и единая модель подготовки данных для последующего поиска.

Подход

Как FOXOPS собрал этот RAG-контур

Подход 01

Корзины знаний и документы как сущности

Контур строился вокруг корзин знаний, документов, статусов и API-операций, а не вокруг набора разрозненных файлов.

Подход 02

Извлечение текста, разбиение и эмбеддинги

Подготовка знаний была вынесена в отдельный управляемый слой: извлечение текста из файлов, вызов сервиса разбиения контента, построение чанков и сохранение эмбеддингов.

Подход 03

Векторный поиск и интеграция

Система проектировалась так, чтобы связывать API загрузки, pgvector-хранилище, локальный или S3-совместимый storage и внешний AI-контур в одной модели.

Контур решения
Корзины границы знаний
Документы файлы / текст
Splitter разбиение контента
Чанки индексируемый контекст
Эмбеддинги Ollama / pgvector
Поиск RAG / контекстное окно

В результате документы и корзины превращаются в управляемый контур подготовки знаний, который можно использовать для similarity search, извлечения контекста с окном соседних чанков и ответов поверх корпоративных материалов.

Инженерные сигналы

Что подтверждает зрелость решения

API для корзин и документов

Есть отдельные операции создания, обновления, списка, загрузки, удаления и переиндексации, а не только внутренние сервисные вызовы.

Внешний сервис разбиения

Разбиение текста вынесено в отдельный сервис, что позволяет управлять логикой чанкинга независимо от основного API.

Гибкость хранения

Контур допускает работу с локальным диском и S3-совместимым хранилищем в рамках одной модели загрузки данных.

Контекстный векторный поиск

Поиск уже учитывает векторную близость, фильтрацию по корзине и подмешивание соседних чанков как рабочего контекста.

Технологии

Техническая основа

Kotlin / Spring Boot

Использовались как основа серверного API, бизнес-логики и управляемого сервисного контура.

PostgreSQL / Flyway

Применялись для хранения сущностей контента, миграций схемы и воспроизводимого управления состоянием данных.

pgvector и Ollama

Контур использует локальную генерацию эмбеддингов и векторное хранилище в PostgreSQL как часть RAG-архитектуры.

Сервис разбиения / диск / S3

Контур включает отдельный сервис разбиения и абстракцию хранилища, чтобы один и тот же сервисный слой работал в разных режимах хранения и разбиения текста.

Результат

Что этот кейс показывает про FOXOPS

Понимание RAG как инфраструктуры

FOXOPS работает не только с ответами модели, но и с корзинами знаний, загрузкой документов, разбиением, векторным поиском и жизненным циклом контента.

Умение строить сервисный слой вокруг AI

Кейс показывает подход, где AI-сценарий опирается на API, splitter-сервис, миграции, поиск и наблюдаемое состояние данных.

Инженерную воспроизводимость

Контур подготовки знаний оформлен как управляемая система, а не как набор скриптов для единичного запуска.

Задел для корпоративных AI-сервисов

Такой подход создаёт основу для внутренних поисковых систем, ассистентов и прикладных RAG-сценариев поверх корпоративных данных.

Следующий шаг

Если вам нужен внутренний контур подготовки знаний для AI, такую задачу можно разбирать отдельно

FOXOPS поможет определить, где нужен каталог знаний, где важны фоновые задачи подготовки, а где требуется полноценный RAG-контур с API и векторным поиском.