Опубликовано: 10 ноября 2025 г.
При создании веб-сайтов и веб-приложений с использованием ИИ вы, возможно, создавали прототип с помощью крупной языковой модели (LLM) , такой как ChatGPT, Gemini или Claude, а затем развёртывали эту реализацию в рабочей среде. LLM — это разновидность фундаментальной модели , очень большой, предварительно обученной модели, которая требует больших ресурсов, стоит дорого и часто не является лучшим инструментом для решения конкретной задачи. Более мелкие, локальные, ориентированные на конкретную задачу модели потребляют меньше ресурсов и часто обеспечивают более качественные и быстрые ответы при меньших затратах, чем универсальные фундаментальные модели.
Выбирая лучшую модель, вы выбираете более устойчивый подход, который мы назовём «оптимизированным ИИ» . Оптимизированный ИИ обеспечивает:

- Меньшая задержка для пользователей , когда модели работают локально, а не передаются на удаленные серверы.
- Снижение затрат на API, поскольку вам не приходится платить за неиспользуемые возможности.
- Доступ автономного приложения к клиентским моделям на устройстве, что обеспечивает более надежную работу.
Хотя базовые модели отлично подходят для общих рассуждений и диалога, их использование для конкретных задач (например, классификации текста или извлечения данных) подобно использованию болида Формулы-1 для поездок в «Макдоналдс». Технически это возможно, но крайне неэффективно (и неудобно для пассажиров). Вместо этого адаптируйте свою реализацию к вашим реальным потребностям.
Устойчивые практики использования ИИ и оптимальный пользовательский опыт — это не конкурирующие приоритеты. Это один и тот же приоритет, выраженный по-разному.
Один из способов оценки воздействия ИИ на окружающую среду :
- Обучение : первоначальное обучение модели требует значительных ресурсов. Оптимизацией и «обучением» управляет поставщик модели.
- Вывод : Вывод выполняется, когда обучаемой модели предоставляются новые входные данные (запрос) для генерации выходных данных (текста ответа). По сравнению с обучением, вывод требует значительно меньше ресурсов.
Обучение — это фиксированная стоимость, но стоимость вывода масштабируется по мере использования, что делает выбор модели ключевым фактором, который вы можете контролировать. Вы можете принимать обоснованные решения для своего варианта использования и для планеты, поддерживая ответственную разработку ИИ.
Внедрить искусственный интеллект, ориентированный на пользователя
Вместо того, чтобы создавать ИИ, ориентированный на модель, создавайте ИИ, ориентированный на пользователя. Подумайте, какие задачи ИИ мог бы выполнять, чтобы сделать ваше приложение более простым в использовании, снизить нагрузку на пользователей или уменьшить количество переключений контекста.
Например, у вас есть компания Rewarding Eats, которая начисляет пользователям баллы за посещение определённых ресторанов. Вы можете использовать ИИ для сканирования изображения чека, чтобы узнать название ресторана и общую сумму заказа, вместо того, чтобы заставлять клиентов вводить эти данные вручную. Эта функция, вероятно, улучшит пользовательский опыт вашего приложения.
При создании ИИ, ориентированного на пользователя:
- Определите требования к вашей задаче . Какие задачи должен выполнять ИИ? Они полностью основаны на тексте или включают аудио- и визуальные компоненты?
- Выберите подходящую модель . Разные модели более эффективны при выполнении разных задач и зачастую занимают меньше места.
- Поймите ограничения, связанные с вашим развертыванием . Где целесообразно разместить модель? Где будут расположены данные? Будет ли у пользователя надежное соединение?
- Реализуйте с помощью прогрессивных улучшений наиболее быстрый и безопасный пользовательский интерфейс.
Определите требования к вашей задаче
Вместо того, чтобы искать «места для использования ИИ» или «функции ИИ, которые можно добавить», задайте себе вопрос: «Как будет выглядеть беспроблемный опыт?» В зависимости от размера вашей компании, этот вопрос следует обсудить с менеджерами по продукту.
Возьмём для примера наше приложение Rewarding Eats. Первый вопрос, который следует задать: «Нужен ли для него ИИ?»

Базовая модель может сформировать расход на основе чека с некоторыми подсказками. Но более эффективный способ решения этой задачи вообще не требует большой модели. Используйте оптическое распознавание символов (OCR) для анализа текста с изображения и передачи его специализированной модели, например, модели классификации текстов, для определения товаров и стоимости в разобранном тексте. Это можно сделать на устройстве пользователя, без отправки данных на серверы.
В большинстве случаев, если вы считаете, что вам нужна базовая модель, вам, вероятно, придется разбить проблему на отдельные задачи.
Выберите подходящую модель
Определив задачи, вы сможете выбрать подходящий тип и модель. Хотя проще всего приобрести модель Foundation, модели меньшего размера справятся с задачей быстрее и дешевле. Поняв задачу, вы сможете выбрать подходящую модель малого размера, подходящую именно для неё.
Существует множество различных типов и моделей, поэтому прочитайте подробный обзор выбора моделей , чтобы сделать правильный выбор для вашего проекта.
Выберите правильное место для вашей модели
В то время как базовые модели слишком велики для размещения даже на самых мощных настольных компьютерах, меньшие LLM , малые языковые модели (SLM) и модели, ориентированные на конкретные задачи, могут работать на многих устройствах.
| Не рекомендуется | Не рекомендуется | Рекомендуется | |
| Малая языковая модель (SLM) | Рекомендуется | Рекомендуется | Рекомендуется |
| Модели фундамента | Не рекомендуется | Не рекомендуется | Рекомендуется |
SLM удобны, но не распространены. Существуют миллиарды мобильных телефонов, и только самые последние и дорогие модели поддерживают локальные SLM. Это небольшая доля рынка.
Используйте эту матрицу для определения наилучшего местоположения вашей модели:
| Метрическая | Клиентская сторона / Локальная | Серверная/удалённая |
|---|---|---|
| Связность | Требуется автономный режим, нестабильная сеть, защищенные объекты | Всегда онлайн-среды |
| Расположение данных | Обработка фотографий пользователей, текстового ввода, личных файлов | Работа с серверными документами, базами данных |
| Модель использования | Высокочастотные звонки (перевод чата, анализ в реальном времени) | Иногда сложные задачи |
| Пропускная способность | Мобильные пользователи, сельская местность, большие файлы вывода | Неограниченный широкополосный доступ, небольшие отклики |
| Конфиденциальность и безопасность | Регулируемые данные (здравоохранение, финансы), строгое соблюдение | Стандартные бизнес-данные, налаженная инфраструктура безопасности |
| Воздействие батареи | Приложения для настольных компьютеров, энергосберегающие варианты использования | Мобильные приложения с ограниченным ресурсом батареи |
Вывод на стороне клиента, прогрессивное улучшение и гибрид
Благодаря таким библиотекам, как TensorFlow.js , Transformers.js и ONNX.js , ваши приложения могут выполнять вывод пользовательских данных на стороне клиента. Вы конвертируете свою модель в подходящий формат, а затем размещаете её удалённо или встраиваете непосредственно в своё приложение. Для достижения наилучшего пользовательского опыта используется гармоничное сочетание предзагруженных, загружаемых и удалённых моделей, что позволяет пользователям работать без компромиссов.
Даже если из соображений безопасности (или размера) предпочтительнее использовать удаленную модель, размещенную в облаке, обеспечение достаточного количества локальных моделей, доступных при потере подключения, может обеспечить гибкость.
В конечном счёте, существует три подхода к развёртыванию модели. Выберите наиболее подходящий для ваших нужд.
- Ориентировано на локальность: приложение требует работы в автономном режиме, частого использования, конфиденциальных данных.
- Удалённо-ориентированный подход: сложные рассуждения, большие модели, редкое использование.
- Гибридный подход: загрузка небольших моделей с использованием API, переключение по мере готовности.
Ваши следующие шаги
Технология часто следует за реализацией. Лучший способ для разработчиков повлиять на развитие отрасли, чтобы улучшить пользовательский опыт и принести пользу миру, — это:
- Выберите правильный инструмент для работы . Модели меньшего размера потребляют меньше ресурсов и часто работают так же хорошо, как и большие, благодаря быстрому проектированию . Они имеют меньшую задержку.
- Требуйте прозрачности данных о затратах на обучение и вывод данных . Рекомендуйте вашей компании отдавать приоритет моделям, раскрывающим эти данные.
- Разместите модель рядом с данными , чтобы сократить расходы на передачу данных на сервер.
- Используйте то, что уже доступно . Если на устройстве уже есть модели, отдайте предпочтение им в первую очередь.
Ресурсы
Если вы хотите глубже изучить эти темы, при написании этой статьи я использовал следующие ресурсы. Они отлично подойдут для чтения.
Эффективность модели и исследования
- Малые языковые модели — будущее агентного ИИ (исследовательская работа NVIDIA) : поддержка исследований возможностей SLM
- Аудит воздействия на окружающую среду компании Mistral : прозрачность затрат на обучение и выводы
- Исследование стоимости выводов Google : измерение воздействия на окружающую среду
- Исследование природы: ИИ и воздействие человека на окружающую среду : сравнительный анализ выполнения задач ИИ и человеком
- Обсуждение воздействия искусственного интеллекта на окружающую среду : контекст экологического дискурса
Инструменты внедрения и разработки
- Загрузка модели TensorFlow.js : развертывание модели на стороне клиента
- Примеры Transformers.js : вывод модели на основе браузера
- ONNX.js Runtime : кроссплатформенное развертывание модели
- Руководство по гибридному ИИ Firebase : локальная и удаленная интеграция моделей