Посты с тегом #api

Аватар пользователя
@vBaMnup

7

Изображение поста

OpenAI представила GPT-4.1 — улучшенная модель с контекстом в 1 миллион токенов

OpenAI анонсировала новую флагманскую языковую модель GPT-4.1, которая превосходит GPT-4o почти по всем параметрам. Среди ключевых улучшений:

  • Контекстное окно до 1 миллиона токенов, что позволяет обрабатывать большие объемы текста и кода.
  • Улучшенные возможности в программировании: производительность в задачах программирования увеличилась на 21% по сравнению с GPT-4o и на 27% по сравнению с GPT-4.5.
  • Повышенная точность следования инструкциям и обработки длинных контекстов.
  • Снижение стоимости: GPT-4.1 дешевле GPT-4o на 26%, что делает её более доступной для разработчиков.
  • Доступность через API: Модель доступна только через OpenAI API и не интегрирована в ChatGPT. Вместо этого, улучшения постепенно внедряются в GPT-4o.

GPT-4.1 доступна в трёх версиях: - GPT-4.1 — основная модель с максимальной производительностью. - GPT-4.1 Mini — сбалансированная версия с меньшими затратами. - GPT-4.1 Nano — самая быстрая и экономичная модель, идеально подходящая для задач с низкой задержкой.

OpenAI также объявила о планах поэтапного отказа от предыдущих моделей: GPT-4 будет выведена из ChatGPT 30 апреля, а доступ к предварительной версии GPT-4.5 через API будет закрыт 14 июля.

📌 Подробнее о GPT-4.1 — на официальном сайте OpenAI

Комментарии(0) ИИ/Нейронные Сети
Аватар пользователя
@vBaMnup

38

Изображение поста

Baide Ernie 4.5 — Лучшая альтернатива GPT-4.5

Китайцы уничтожили GPT-4.5! Компания Baide выпустила модель Ernie 4.5, которая демонстрирует более высокую производительность при сотни раз более низких затратах.

  • Бесплатная версия доступна на сайте.
  • API: Стоимость составляет всего $0,55 и $2,20 по сравнению с $75 и $150 в OpenAI.
Комментарии(0) ИИ/Нейронные Сети
Аватар пользователя
@Admin

35

slowapi — Библиотека для Rate-Limiting в FastAPI

slowapi — мощный инструмент для Python, позволяющий ограничивать количество запросов в веб-приложениях на базе FastAPI. Используя библиотеку limits, slowapi обеспечивает гибкую настройку лимитов по различным критериям, таким как IP-адрес или уникальный идентификатор пользователя.

Основные возможности:

  • Гибкая конфигурация: Поддержка стратегий, основанных на фиксированных временных окнах и алгоритме «токен-ведро».
  • Настройка по параметрам: Ограничение запросов по IP, идентификаторам и другим метрикам.
  • Легкая интеграция: Автоматическая обработка превышения лимита с возвратом HTTP 429 (Too Many Requests).

🌐 Github

Комментарии(0) Python