Self-hosted · Локальные модели (Ollama) · Без vendor lock-in

Команда AI-агентов
с долгосрочной памятью

Разверните персональных AI-ассистентов для вашего бизнеса. Каждый агент помнит контекст, использует ваши инструменты и работает в Telegram, Web или API.

Локальные модели через Ollama — ни один запрос не покидает ваш сервер.

12
поисковых провайдеров
5
каналов связи
100%
self-hosted
AGPLv3
открытый исходный код

Что делают AI-агенты Memoh

Реальные сценарии из нашей практики. Каждый агент изолирован, имеет свою память и инструменты.

🤖

AI-ассистент с памятью

Помнит контекст всех предыдущих диалогов. Знает задачи, предпочтения, историю. Не нужно каждый раз объяснять «кто вы».

Telegram / Web
📊

Аналитик и стратег

Собирает сигналы рынка, анализирует конкурентов, строит еженедельные планы. Интегрируется с n8n, Google Sheets, любыми API через MCP.

n8n / API / Планирование
💬

Поддержка клиентов

Отвечает на вопросы по базе знаний компании, эскалирует сложные случаи, сохраняет историю каждого клиента в векторной БД.

Telegram / Email

Автоматизация процессов

Агент по расписанию выполняет задачи: мониторинг, отчёты, обработка заявок. Умеет работать с браузером через Playwright.

Расписание / Browser
✍️

Контент и коммуникации

Пишет посты, письма, отчёты в вашем стиле. Помнит tone of voice и прошлые публикации. Публикует напрямую в Telegram-каналы.

Контент / Telegram
🔗

Мультиагентные системы

Несколько специализированных агентов работают как команда: один собирает данные, второй анализирует, третий принимает решение.

Оркестрация агентов

Технические возможности

Всё что нужно для production-grade AI агентов

🧠 Долгосрочная память

  • Векторный поиск через Qdrant — агент находит нужный контекст из тысяч диалогов
  • Summary-память — сжатая история сессий без потери смысла
  • Episodic memory — агент помнит события, не только факты
  • Персональный контекст на каждого пользователя

🔧 MCP-инструменты

  • Model Context Protocol — стандарт для подключения любых инструментов
  • Поиск в интернете, работа с файлами, базами данных
  • Browser automation через Playwright
  • Легко добавить свои инструменты через MCP SDK

🌐 Каналы коммуникации

  • Telegram — боты, группы, каналы
  • Web-интерфейс с чатом в браузере
  • Email-интеграция
  • REST API для интеграции в любое приложение

🔒 Полная приватность данных

  • Локальные модели через Ollama — запросы не покидают ваш сервер вообще
  • Изоляция агентов в containerd-контейнерах с сетевым контролем
  • Открытый исходный код (AGPLv3) — можно проверить что именно работает
  • При необходимости — YandexGPT, GigaChat (данные в РФ) или любой OpenAI-совместимый API

Как это работает

От идеи до рабочего агента за несколько часов

1

Описываете задачу агента

Задаёте личность, цели, инструкции в IDENTITY.md. Агент работает согласно вашим правилам — без отклонений.

2

Подключаете инструменты

Через MCP-протокол даёте агенту доступ к нужным системам: CRM, базы данных, внешние API, web-браузер, файловая система.

3

Агент учится и запоминает

Каждый диалог сохраняется в векторной БД. Агент использует контекст для точных ответов. Чем больше работает — тем лучше понимает ваш бизнес.

4

Работает автономно

Агент выполняет задачи по расписанию или по запросу. Уведомляет в Telegram, пишет отчёты, принимает решения в рамках своей компетенции.

Установка одной командой

# Автоматическая установка (требуется Docker)
curl -fsSL https://memoh.sh | sudo sh
# Или вручную
git clone https://github.com/memohai/Memoh
cd Memoh && sudo docker compose up -d
# Веб-интерфейс
http://localhost:8082

Открытый исходный код · github.com/memohai/Memoh · AGPLv3

Форматы работы

Self-hosted — ваши данные остаются у вас

Open Source
Бесплатно

Self-hosted, установка одной командой

  • Неограниченные агенты
  • Telegram, Discord, Lark, Email, Web
  • MCP-интеграции
  • Долгосрочная память
  • Нет поддержки
GitHub →
Популярный
Внедрение под ключ
от 50 000 ₽

Разворачиваем на вашем сервере + настраиваем агентов под ваши задачи

  • Установка и настройка
  • 1-3 агента под ваши задачи
  • Интеграция с вашими системами
  • Обучение команды
  • 1 месяц поддержки
Обсудить проект
Поддержка
от 15 000 ₽

Ежемесячное сопровождение и развитие системы

  • Обновления и мониторинг
  • Добавление новых агентов
  • Приоритетная поддержка
  • Новые интеграции
  • Консультации по AI
Подключить →

Стоимость инфраструктуры для локальных моделей

Для полной приватности (Ollama) нужен сервер с GPU. Ориентировочные цены на аренду в РФ (Yandex Cloud, Selectel, VK Cloud):

CPU-only
от 5 000 ₽/мес
Любой VPS. Подходит для небольшой нагрузки, ответ ~10-30 сек. Модели: Mistral 7B, Llama 3 8B в режиме CPU.
GPU T4 / RTX Рекомендуем
25 000 — 45 000 ₽/мес
16-24 GB VRAM. Ответ 1-3 сек. Модели: Mistral 7B, Llama 3 8B, Qwen 14B — качество на уровне GPT-3.5.
GPU A100 / H100
от 100 000 ₽/мес
40-80 GB VRAM. Модели: Llama 3 70B, Qwen 72B — качество уровня GPT-4. Для высоконагруженных систем.

Альтернатива: использовать YandexGPT или GigaChat — данные остаются в РФ, дешевле GPU, но покидают ваш сервер.

Готовы обсудить?

Расскажите о вашей задаче — предложим решение и стоимость внедрения