Базы знаний
База знаний — это информация, на основе которой AI-консультант формирует ответы. Правильно подготовленная база знаний — ключевой элемент для эффективной работы бота.
Типы источников данных
В Wikilect вы можете использовать различные типы источников данных для создания базы знаний:
1. Файлы
Поддерживаемые форматы: - DOC/DOCX (Microsoft Word) - PDF - TXT (текстовые файлы)
2. URL-адреса
Добавьте список URL-адресов, и система автоматически извлечет информацию с указанных веб-страниц.
3. Текст
Введите информацию напрямую в интерфейсе Wikilect.
Создание базы знаний
- Перейдите в раздел Настройки → Базы знаний
- Нажмите кнопку Добавить базу знаний
- Введите название базы знаний
- Добавьте информацию одним из способов:
- Настройте параметры обработки
- Сохраните базу знаний
Настройки базы знаний
Эмбеддинги
Эмбеддинги — это способ преобразования текстовой информации в числовые векторы, которые позволяют AI более эффективно находить релевантную информацию. В Wikilect вы можете выбрать тип эмбеддингов, подходящий для ваших задач.
Размер чанка
Размер чанка определяет, на какие части будет разделена ваша база знаний при индексации. Оптимальный размер чанка зависит от типа вашей информации:
- Небольшие чанки (256-512 токенов) - подходят для коротких, структурированных данных
- Средние чанки (512-1024 токенов) - подходят для большинства случаев
- Большие чанки (1024+ токенов) - подходят для сложной информации, где важен широкий контекст
Примеры информации для базы знаний
Пример табличной базы знаний
Таблицы — удобный формат для хранения структурированной информации, например:
- Каталог продуктов с характеристиками
- Часто задаваемые вопросы и ответы
- Контакты сотрудников или филиалов
Пример текстовой базы знаний
Текстовый формат подходит для хранения более детальной информации:
- Инструкции и руководства
- Политики и правила компании
- Описание услуг и процессов
Рекомендации по подготовке базы знаний
- Структурируйте информацию — разделяйте контент на логические блоки
- Используйте заголовки и подзаголовки — это помогает системе лучше понимать структуру документа
- Избегайте избыточности — дублирующаяся информация может снизить качество ответов
- Регулярно обновляйте базу знаний — добавляйте новую информацию и удаляйте устаревшую
- Тестируйте базу знаний — проверяйте, насколько хорошо бот отвечает на вопросы с использованием вашей базы знаний
Использование базы знаний в навыках
Одна база знаний может быть использована в нескольких навыках. Это позволяет создавать различных консультантов с разной специализацией, но использующих общую информационную базу.
В настройках навыка есть опция "Использовать базу знаний при любых запросах пользователя", которая позволяет:
- Включить — бот всегда будет использовать базу знаний при ответе
- Выключить — бот будет использовать базу знаний только когда это необходимо (например, через плагин "Поисковик по контексту")