OpenAI Rate Limiter

Description

A Python tool for managing rate limits and token consumption when interacting with the OpenAI API. It ensures compliance with OpenAI's request and token limits by tracking input and output token usage, with an added 50% buffer for maximum token outputs. The tool supports sending multiple requests in parallel while respecting API rate limits.

Features

Rate Limiting: Enforces request and token limits per minute.
Token Tracking: Tracks input and output tokens, dynamically adjusting based on the maximum tokens used in responses.
Concurrency Management: Handles multiple concurrent API requests.
50% Output Buffer: Adds a 50% buffer to the maximum token usage to avoid exceeding token limits.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.gitignore		.gitignore
Dockerfile		Dockerfile
GCRARateLimiter.py		GCRARateLimiter.py
MakeFile		MakeFile
OpenAIGPTClient.py		OpenAIGPTClient.py
README.md		README.md
custom_logger.py		custom_logger.py
docker-compose.yml		docker-compose.yml
limits.json		limits.json
main.py		main.py
requirements.txt		requirements.txt
send_requests.py		send_requests.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

OpenAI Rate Limiter

Description

Features

About

Releases

Packages

Languages

ofirsteinherz/openai-rate-limiter

Folders and files

Latest commit

History

Repository files navigation

OpenAI Rate Limiter

Description

Features

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages