gpt-prompt-engineer

Узнавайте первыми о новых AI-сборках и демо!

Обзор

Инженерия промптов похожа на алхимию: заранее не угадаешь, что сработает лучше. Нужно экспериментировать, пока не найдёшь подходящий промпт. gpt-prompt-engineer выносит эти эксперименты на новый уровень.

Достаточно задать описание задачи и тестовые случаи — система сгенерирует множество промптов, проверит их и отсортирует по рейтингу, чтобы выделить самые эффективные.

Обновление 20.03.24: версия для Claude 3 Opus

Добавлена версия gpt-prompt-engineer под Anthropic Claude 3 Opus. В ней тестовые случаи генерируются автоматически, а пользователь может задать несколько входных переменных — это делает инструмент мощнее и гибче. Запускайте ноутбук claude-prompt-engineer.ipynb из репозитория.

Обновление 20.03.24: конвертация Claude 3 Opus → Haiku

Ноутбук позволяет собирать быстрые и эффективные AI-системы при заметно меньших затратах. Opus задаёт «пространство» качества, а Haiku используется для генерации: Opus создаёт набор эталонных примеров, по которым Haiku выдаёт результат сопоставимого качества при существенно меньшей задержке и стоимости. Запускайте opus-to-haiku-conversion.ipynb.

Возможности

Генерация промптов: с помощью GPT-4, GPT-3.5-Turbo или Claude 3 Opus генерируются варианты промптов по заданному сценарию и тестовым случаям.
Проверка промптов: каждый вариант проверяется на всех тестовых случаях, результаты сравниваются и ранжируются по системе ELO.

Рейтинг ELO: у каждого промпта стартовый рейтинг 1200. В «турнире» по ответам на тестовые случаи рейтинги обновляются в зависимости от качества. Так видно, какие промпты работают лучше всего.
Версия для классификации: ноутбук gpt-prompt-engineer -- Classification Version заточен под задачи классификации. Корректность проверяется по соответствию ожидаемому ответу ('true' или 'false'), в итоге выводится таблица с оценками по каждому промпту.

Версия Claude 3: ноутбук claude-prompt-engineer работает с Claude 3 Opus, сам генерирует тестовые случаи и поддерживает несколько входных переменных.
Конвертация Opus → Haiku: сохраняет качество Opus для вашего сценария при скорости и стоимости Haiku.
Логирование в Weights & Biases: по желанию можно логировать конфиг (temperature, max tokens), системные и пользовательские промпты, тестовые случаи и итоговый ELO по каждому кандидату. Включите: use_wandb = True.
Portkey: опциональное логирование и трассировка цепочек промптов и ответов. Включите: use_portkey = True.

Установка и настройка

Откройте ноутбук в Google Colab или в локальном Jupyter. Для классификации — этот. Для Claude 3 — этот.
Укажите OpenAI API ключ: создайте файл _secrets.py из _secrets.example.py и пропишите в нём OPENAI_API_KEY. В версии для Claude 3 укажите ключ Anthropic в переменной ANTHROPIC_API_KEY.

Как пользоваться

Для версии на GPT-4 задайте сценарий использования и тестовые случаи. Сценарий — это описание того, что должна делать модель. Тестовые случаи — конкретные запросы, на которые она будет отвечать. Пример:

description = "По запросу сгенерировать заголовок для лендинга." # такое описание обычно даёт хороший результат

test_cases = [
    {'prompt': 'Продвижение нового фитнес-приложения Smartly'},
    {'prompt': 'Почему веганская диета полезна для здоровья'},
    {'prompt': 'Запуск онлайн-курса по цифровому маркетингу'},
    {'prompt': 'Запуск линейки экологичной одежды'},
    {'prompt': 'Продвижение блога о бюджетных путешествиях'},
    {'prompt': 'Реклама ПО для управления проектами'},
    {'prompt': 'Презентация книги по изучению Python'},
    {'prompt': 'Продвижение платформы для изучения языков'},
    {'prompt': 'Реклама сервиса персональных планов питания'},
    {'prompt': 'Запуск приложения для ментального здоровья и медитации'},
]

Для версии классификации тестовые случаи задаются в формате:

test_cases = [
    {'prompt': 'У меня был отличный день!', 'output': 'true'},
    {'prompt': 'Мне грустно.', 'output': 'false'},
    # добавьте свои тестовые случаи
]

Для версии Claude 3 можно задать входные переменные помимо описания сценария:

description = "По запросу сгенерировать персональный ответ на email."

input_variables = [
    {"variable": "SENDER_NAME", "description": "Имя отправителя письма."},
    {"variable": "RECIPIENT_NAME", "description": "Имя получателя."},
    {"variable": "TOPIC", "description": "Тема или суть письма. Одно-два предложения."}
]

Тестовые случаи будут сгенерированы автоматически по описанию и переменным.

Выберите, сколько вариантов промптов генерировать. Учтите, что при большом числе запросов затраты растут. Разумный старт — 10.
Вызовите generate_optimal_prompt(description, test_cases, number_of_prompts) — будет сгенерирован список промптов и оценена их эффективность. В версии классификации достаточно выполнить последнюю ячейку. В версии Claude 3: generate_optimal_prompt(description, input_variables, num_test_cases, number_of_prompts, use_wandb).
Итоговые рейтинги ELO выводятся в таблице по убыванию: чем выше рейтинг, тем лучше промпт.

В версии классификации для каждого промпта выводятся оценки в таблице (как на изображении выше).

Приветствуются контрибуции. Идеи:

несколько генераторов системных промптов в разных стилях (с примерами, краткие, развёрнутые, markdown и т.д.);
автоматическая генерация тестовых случаев;
расширение версии классификации на более чем два класса (например, с tiktoken).

Лицензия

Проект распространяется под лицензией MIT.

Контакты

Matt Shumer — @mattshumer_

Ссылка на проект: https://github.com/mshumer/gpt-prompt-engineer

Если интересны ещё более продвинутые инструменты — загляните в HyperWrite Personal Assistant: ИИ с доступом к актуальной информации, который умеет писать естественно и управлять браузером для выполнения задач.

А также ShumerPrompt — «Github для промптов».

Name		Name	Last commit message	Last commit date
Latest commit History 63 Commits
.gitignore		.gitignore
Claude_3_5_Sonnet_to_gpt_4o_mini_Conversion.ipynb		Claude_3_5_Sonnet_to_gpt_4o_mini_Conversion.ipynb
Instruct_Prompt_to_Base_Model_Prompt_Converter.ipynb		Instruct_Prompt_to_Base_Model_Prompt_Converter.ipynb
LICENSE		LICENSE
Llama_3_1_405B_to_8B_Conversion.ipynb		Llama_3_1_405B_to_8B_Conversion.ipynb
README.md		README.md
XL_to_XS_conversion.ipynb		XL_to_XS_conversion.ipynb
_secrets.example.py		_secrets.example.py
claude_prompt_engineer.ipynb		claude_prompt_engineer.ipynb
gpt_planner.ipynb		gpt_planner.ipynb
gpt_prompt_engineer.ipynb		gpt_prompt_engineer.ipynb
gpt_prompt_engineer_Classification_Version.ipynb		gpt_prompt_engineer_Classification_Version.ipynb
opus_to_haiku_conversion.ipynb		opus_to_haiku_conversion.ipynb
prompt_elo_eval.py		prompt_elo_eval.py
prompt_optimizer.py		prompt_optimizer.py
run_optimizer.bat		run_optimizer.bat

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

gpt-prompt-engineer

Обзор

Обновление 20.03.24: версия для Claude 3 Opus

Обновление 20.03.24: конвертация Claude 3 Opus → Haiku

Возможности

Установка и настройка

Как пользоваться

Приветствуются контрибуции. Идеи:

Лицензия

Контакты

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

gpt-prompt-engineer

Обзор

Обновление 20.03.24: версия для Claude 3 Opus

Обновление 20.03.24: конвертация Claude 3 Opus → Haiku

Возможности

Установка и настройка

Как пользоваться

Приветствуются контрибуции. Идеи:

Лицензия

Контакты

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages