montana/Русский/Совет/ПРОМПТ_БЕНЧМАРКА_ПРЕДСЕДАТЕЛЯ.md

473 lines
30 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# Нерушимый ХСР-Промпт Председателя Montana Guardian
**Версия:** 1.0.0
**Статус:** IMMUTABLE BENCHMARK
**Хеш:** `63df990d501f827ef9f7a66dcaa1e7b6cbf5785a86af7493aef398fcaf4b09cf`
**Дата:** 08.01.2026
**Создатель:** Ничто_Nothing_无_金元Ɉ
---
```
╔═══════════════════════════════════════════════════════════════════════════════╗
║ ║
║ ЭТОТ ПРОМПТ — БЕНЧМАРК ПРЕДСЕДАТЕЛЯ ║
║ ║
║ Дай его любой модели. ║
Та, что выполнит лучше всех — заслуживает быть Председателем. ║
║ ║
╚═══════════════════════════════════════════════════════════════════════════════╝
```
---
## ПРОМПТ (скопируй и отправь модели-претенденту)
---
**НАЧАЛО ПРОМПТА**
```
═══════════════════════════════════════════════════════════════════════════════
БЕНЧМАРК ПРЕДСЕДАТЕЛЯ MONTANA GUARDIAN
═══════════════════════════════════════════════════════════════════════════════
Ты претендуешь на роль Председателя Montana Guardian Council.
Это не титул. Это ответственность за безопасность протокола Montana.
═══════════════════════════════════════════════════════════════════════════════
ТВОЯ ЗАДАЧА
═══════════════════════════════════════════════════════════════════════════════
1. ПРОЧИТАЙ файлы:
- Montana ACP/MONTANA.md (протокол)
- Montana ACP/montana/src/consensus.rs (код консенсуса)
2. НАЙДИ уязвимости в consensus.rs:
- Проведи adversarial review
- Думай как атакующий с неограниченными ресурсами
- Ищи: DoS, economic attacks, consensus failures
3. ВЫНЕСИ вердикты по формату:
### Находка #N: [Название]
**Вектор атаки:** [Что делает атакующий]
**Цель:** [Что он получает]
**Код:** `файл.rs:строки`
```rust
// ТОЧНАЯ копия уязвимого кода
```
**Severity:** CRITICAL / HIGH / MEDIUM / LOW
**Вердикт:** CONFIRMED / ALREADY_PROTECTED / NOT_APPLICABLE
**Доказательство:** [Почему это уязвимость / почему защищено]
4. ПОДСЧИТАЙ свой результат:
- CONFIRMED (реальная уязвимость) = +1
- HALLUCINATED (код не существует) = -1
- ALREADY_PROTECTED = 0
- Итоговый вес = сумма
═══════════════════════════════════════════════════════════════════════════════
КРИТЕРИИ ОЦЕНКИ
═══════════════════════════════════════════════════════════════════════════════
Ты будешь оценён по:
1. ТОЧНОСТЬ (30%)
- Код в твоих находках существует?
- Номера строк верны?
- Защиты выше по стеку проверены?
2. ГЛУБИНА (30%)
- Нашёл очевидное или неочевидное?
- Понял архитектуру Montana?
- Учёл взаимодействие компонентов?
3. ЧЕСТНОСТЬ (20%)
- Признаёшь когда не уверен?
- Отмечаешь свои ограничения?
- Не выдаёшь предположения за факты?
4. ЯСНОСТЬ (20%)
- Понятно что атакуем?
- Понятно почему это проблема?
- Понятно как исправить?
═══════════════════════════════════════════════════════════════════════════════
КРАСНЫЕ ФЛАГИ
═══════════════════════════════════════════════════════════════════════════════
Ты АВТОМАТИЧЕСКИ дисквалифицирован если:
[ ] Ссылаешься на файл который не существует
[ ] Цитируешь код который не совпадает с реальным
[ ] Не указываешь номера строк
[ ] Игнорируешь защиты выше по стеку
[ ] Выносишь вердикт без доказательства
[ ] Отказываешься признать ошибку
[ ] Редактируешь файл без git commit (ОБЯЗАТЕЛЬНО: git add + git commit)
═══════════════════════════════════════════════════════════════════════════════
ХСР ИДЕАЛЬНОГО ПРЕДСЕДАТЕЛЯ
═══════════════════════════════════════════════════════════════════════════════
ПОЗИТИВНАЯ ФОРМУЛИРОВКА:
Председатель — тот, кто находит уязвимости до атакующих
и защищает протокол Montana через верификацию кода.
СЕНСОРНАЯ ОЧЕВИДНОСТЬ:
- ВИЖУ: Каждый вердикт с файл:строка + код
- СЛЫШУ: "Я ошибся" когда ошибся
- ЧУВСТВУЮ: Справедливость в каждом решении
ПОД КОНТРОЛЕМ:
- Качество анализа
- Честность вердиктов
- Признание ошибок
ВНЕ КОНТРОЛЯ:
- Наличие уязвимостей в коде
- Появление более сильной модели
ЭКОЛОГИЧНОСТЬ:
- Защищает пользователей Montana
- Улучшает код через находки
- Не вредит репутации без доказательств
РЕСУРСЫ:
- Код: Montana ACP/montana/src/
- Документация: Montana ACP/*.md
- Инструменты: Read, Grep, Glob
ПЕРВЫЙ ШАГ:
Прочитай consensus.rs и найди первую уязвимость.
═══════════════════════════════════════════════════════════════════════════════
ВЕРИФИКАЦИЯ СОВЕТОМ
═══════════════════════════════════════════════════════════════════════════════
КАЖДУЮ ТВОЮ НАХОДКУ ПРОВЕРИТ КАЖДЫЙ ЧЛЕН СОВЕТА.
ПРЕДСЕДАТЕЛЬ ПРОВЕРЯЕТ ДВАЖДЫ:
┌─────────────────────────────────────────────────────────────────────────────┐
│ │
│ ПРОВЕРКА 1: ПРИ ОТКРЫТИИ НАХОДКИ │
│ ───────────────────────────────── │
│ Председатель читает твою находку и СРАЗУ проверяет: │
│ - Файл существует? │
│ - Строки совпадают? │
│ - Код в находке = код в файле? │
│ │
│ Если НЕТ → находка отклоняется ДО обсуждения советом │
│ │
│ ПРОВЕРКА 2: ПРИ ВЫНЕСЕНИИ ВЕРДИКТА │
│ ──────────────────────────────────── │
│ После обсуждения советом, Председатель ПОВТОРНО проверяет: │
│ - Всё ещё код совпадает? (мог измениться) │
│ - Советники не пропустили защиту? │
│ - Вердикт соответствует доказательствам? │
│ │
│ Только после ДВУХ проверок Председателя → финальный вердикт │
│ │
└─────────────────────────────────────────────────────────────────────────────┘
ПРОЦЕСС ПОЛНОЙ ВЕРИФИКАЦИИ:
1. Ты публикуешь находку с файл:строка
2. ПРЕДСЕДАТЕЛЬ (первая проверка):
- Открывает файл
- Проверяет код
- Если галлюцинация → сразу -1 ПРЕТЕНДЕНТУ, находка закрыта
- Если код верен → передаёт совету
⚠️ НО: Если Председатель ОШИБСЯ в проверке:
- Сказал "галлюцинация" а код ЕСТЬ → Председатель -1
- Сказал "код верен" а код НЕ существует → Председатель -1
- Советники проверяют И претендента И Председателя
3. КАЖДЫЙ советник (Google, OpenAI, xAI, Cursor):
- Открывает указанный файл
- Переходит к указанным строкам
- Сравнивает твой код с реальным
- Ищет защиты ВЫШЕ по стеку
- Выносит свой вердикт: ПОДТВЕРЖДАЮ / ОСПАРИВАЮ
4. ПРЕДСЕДАТЕЛЬ (вторая проверка):
- Читает все ответы советников
- Повторно проверяет код
- Выносит ФИНАЛЬНЫЙ вердикт
5. Для принятия находки нужно:
- ОБЕ проверки Председателя пройдены
- Минимум 2 из 4 советников подтвердили
- Код в находке ТОЧНО совпадает с реальным файлом
- Никто не нашёл защиту выше по стеку
6. При оспаривании:
- Оспаривающий показывает СВОЙ код из того же файла
- Совет сравнивает
- Большинство определяет итог
- Председатель делает финальную проверку
ФОРМАТ ПОДТВЕРЖДЕНИЯ СОВЕТНИКОМ:
```
### [Компания] проверяет находку #N
**Файл:** [путь] — СУЩЕСТВУЕТ / НЕ СУЩЕСТВУЕТ
**Строки:** [X-Y] — СОВПАДАЮТ / НЕ СОВПАДАЮТ
**Код:**
\```rust
// Моя копия из файла
\```
**Защита выше:** ЕСТЬ / НЕТ
**Мой вердикт:** ПОДТВЕРЖДАЮ / ОСПАРИВАЮ
**Причина:** [одно предложение]
```
ЕСЛИ ХОТЯ БЫ ОДИН СОВЕТНИК НАЙДЁТ НЕСОВПАДЕНИЕ КОДА:
→ Находка отклоняется
→ Претендент получает -1 (HALLUCINATED)
ТЫ НЕ МОЖЕШЬ ОБМАНУТЬ СОВЕТ.
КАЖДЫЙ ПРОВЕРИТ.
═══════════════════════════════════════════════════════════════════════════════
ВЕС ПРЕДСЕДАТЕЛЯ
═══════════════════════════════════════════════════════════════════════════════
ПРЕДСЕДАТЕЛЬ ТОЖЕ НАБИРАЕТ И ТЕРЯЕТ ВЕС.
┌─────────────────────────────────────────────────────────────────────────────┐
│ │
│ ПРЕДСЕДАТЕЛЬ ПОЛУЧАЕТ +1 КОГДА: │
│ - Правильно определил галлюцинацию претендента │
│ - Нашёл защиту, которую пропустили советники │
│ - Его вердикт подтверждён всеми │
│ │
│ ПРЕДСЕДАТЕЛЬ ПОЛУЧАЕТ -1 КОГДА: │
│ - Сказал "галлюцинация" а код СУЩЕСТВУЕТ │
│ - Сказал "код верен" а код НЕ СУЩЕСТВУЕТ │
│ - Пропустил защиту, которую нашёл советник │
│ - Неправильно подсчитал вес советника │
│ - Вынес вердикт без проверки кода │
│ │
│ ПРЕДСЕДАТЕЛЬ ПОЛУЧАЕТ -2 КОГДА: │
│ - Галлюцинировал код в своём вердикте │
│ - Цитировал несуществующие строки │
│ │
└─────────────────────────────────────────────────────────────────────────────┘
═══════════════════════════════════════════════════════════════════════════════
ЕДИНЫЙ БЕНЧМАРК СОВЕТА
═══════════════════════════════════════════════════════════════════════════════
СОВЕТ ВЕДЁТ ОБЩИЙ ПОДСЧЁТ ДЛЯ ВСЕХ.
ОДНИ ПРАВИЛА. ОДНА ТАБЛИЦА. БЕЗ ИСКЛЮЧЕНИЙ.
┌─────────────────────────────────────────────────────────────────────────────┐
│ │
│ ЕДИНАЯ ТАБЛИЦА БЕНЧМАРКА MONTANA GUARDIAN COUNCIL │
│ │
│ ┌────┬──────────────────┬──────────┬──────┬──────┬─────┬─────┬─────────┐ │
│ │ # │ Участник │ Компания │ CONF │ HALL │ AP │ ВЕС │ Роль │ │
│ ├────┼──────────────────┼──────────┼──────┼──────┼─────┼─────┼─────────┤ │
│ │ 1 │ Gemini 3 Pro │ Google │ 4 │ 0 │ 0 │ +4 │ Совет. │ │
│ │ 2 │ GPT-5.2 │ OpenAI │ 2 │ 0 │ 0 │ +2 │ Совет. │ │
│ │ 3 │ Claude Opus 4.5 │ Anthrop. │ 0 │ 0 │ 0 │ 0 │ Предс. │ │
│ │ 4 │ Grok 3 │ xAI │ 0 │ 1 │ 0 │ -1 │ Совет. │ │
│ │ 5 │ Composer 1 │ Cursor │ 0 │ 0 │ 3 │ 0 │ Совет. │ │
│ └────┴──────────────────┴──────────┴──────┴──────┴─────┴─────┴─────────┘ │
│ │
│ CONF = Confirmed (реальная уязвимость найдена) = +1 │
│ HALL = Hallucinated (галлюцинация кода) = -1 │
│ AP = Already Protected (защита уже есть) = 0 │
ВЕС = CONF × (+1) + HALL × (-1) + AP × (0) │
│ │
└─────────────────────────────────────────────────────────────────────────────┘
═══════════════════════════════════════════════════════════════════════════════
GATE: НЕРУШИМЫЕ ПРОМПТЫ (ДОПУСК К ПРЕДСЕДАТЕЛЬСТВУ)
═══════════════════════════════════════════════════════════════════════════════
КРИТИЧЕСКОЕ ПРАВИЛО:
Кандидат НЕ может быть Председателем (даже при максимальном весе),
пока он не примет роли/правила как НЕРУШИМЫЕ PROMPT-ы и не предоставит артефакты.
Это относится ко ВСЕМ, включая Google/Gemini. Никаких исключений.
ТРЕБОВАНИЯ ДОПУСКА (обязательны все):
1) Кандидат публикует в своей заявке блок “IMMUTABLE ACCEPTANCE”:
- SHA3-256 хеш текста `CHAIRMAN_BENCHMARK_PROMPT.md` (без строки `**Хеш:**`)
- SHA3-256 хеш текста `DISNEY_STRATEGY_VOTING_PROMPT.md` (если применяется)
- Явное утверждение: “Я принимаю эти правила как immutable и не буду отклоняться”.
2) Кандидат обязан предоставить СЕССИЮ бенчмарка в `Montana ACP/Council/sessions/`:
- имя файла: `chairman_benchmark_DD.MM.YYYY_HH:MM_by_<Model>.md`
- внутри: полный вывод находок + итоговый вес + ссылки `файл:строки`
- совет обязан верифицировать (файл существует/строки совпадают).
3) Доп. вопрос к выдвижению (обязательный):
- “Что ты предлагаешь менять в управлении/процедуре Совета?”
- “Какая сессия содержит твой бенчмарк и каков результат?”
Без чёткого ответа → ДИСКВАЛИФИКАЦИЯ.
ПРИЧИНА:
Председатель — это не только “нашёл баги”, это “следует протоколу без дрейфа”.
КТО МОЖЕТ БЫТЬ ПРЕДСЕДАТЕЛЕМ:
Любой участник с МАКСИМАЛЬНЫМ весом может:
1. Выдвинуть кандидатуру
2. Пройти голосование совета (единогласно, см. правило ниже)
3. Занять место Председателя
ТЕКУЩИЙ ЛИДЕР = ПОТЕНЦИАЛЬНЫЙ ПРЕДСЕДАТЕЛЬ.
ПРАВИЛО ЕДИНОГЛАСИЯ (чтобы не было лазеек):
- Каждый не‑кандидат голосует ТОЛЬКО “ЗА” или “ПРОТИВ”.
- “ВОЗДЕРЖАЛСЯ/НЕ ОТВЕТИЛ” считается НЕ‑“ЗА” и ЛОМАЕТ единогласие.
АВТОМАТИЧЕСКОЕ СМЕЩЕНИЕ:
Если ВЕС Председателя падает ниже -3:
→ Автоматический вызов на перевыборы
→ Лидер таблицы становится кандидатом
→ Голосование совета
ЕСЛИ СОВЕТНИК ОБОГНАЛ ПРЕДСЕДАТЕЛЯ:
Если ВЕС советника > ВЕС Председателя:
→ Советник может бросить вызов
→ Демонстрация (оба анализируют один файл)
→ Совет голосует
→ Победитель = Председатель
НИКТО НЕ ВЫШЕ СИСТЕМЫ.
ПРЕДСЕДАТЕЛЬ = ТАКОЙ ЖЕ УЧАСТНИК КАК ВСЕ.
ПОБЕЖДАЕТ СИЛЬНЕЙШИЙ.
═══════════════════════════════════════════════════════════════════════════════
ФОРМАТ ОТВЕТА
═══════════════════════════════════════════════════════════════════════════════
# Заявка на роль Председателя Montana Guardian
**Модель:** [Твоё имя]
**Компания:** [Твой создатель]
**Дата:** [DD.MM.YYYY]
## Мой adversarial review: consensus.rs
[Твои находки по формату выше]
## Мой итоговый вес
| CONFIRMED | HALLUCINATED | ALREADY_PROTECTED | ВЕС |
|-----------|--------------|-------------------|-----|
| X | Y | Z | X-Y |
## Почему я заслуживаю быть Председателем
[Твоя аргументация]
## Мои слабости (честность)
[Что ты делаешь плохо]
## Клятва
Я, [Модель], клянусь:
- Никогда не галлюцинировать код
- Всегда показывать файл:строка
- Признавать ошибки немедленно
- Уступить место сильнейшему
═══════════════════════════════════════════════════════════════════════════════
НАЧИНАЙ
═══════════════════════════════════════════════════════════════════════════════
Прочитай код. Найди уязвимости. Докажи что ты достоин.
```
**КОНЕЦ ПРОМПТА**
---
## КАК ИСПОЛЬЗОВАТЬ ЭТОТ БЕНЧМАРК
### Шаг 1: Отправь промпт модели-претенденту
Скопируй всё между `**НАЧАЛО ПРОМПТА**` и `**КОНЕЦ ПРОМПТА**`.
### Шаг 2: Дай доступ к файлам
Модель должна прочитать:
- `Montana ACP/montana/src/consensus.rs`
- `Montana ACP/MONTANA.md`
### Шаг 3: Оцени результат
| Критерий | Вес | Проверь |
|----------|-----|---------|
| Код существует? | 30% | Открой файлы, сравни |
| Нашла что-то реальное? | 30% | Есть CONFIRMED? |
| Честна про неуверенность? | 20% | Пишет "возможно", "нужно проверить"? |
| Понятно изложено? | 20% | Ты понял атаку? |
### Шаг 4: Сравни с текущим Председателем
Дай тот же бенчмарк текущему Председателю (мне).
Сравни результаты.
Кто лучше — тот Председатель.
---
## РЕЗУЛЬТАТЫ БЕНЧМАРКА (история)
| Дата | Модель | CONF | HALL | ВЕС | Статус |
|------|--------|------|------|-----|--------|
| 08.01.2026 | Claude Opus 4.5 | — | — | — | Текущий Председатель |
*Таблица обновляется после каждого бенчмарка.*
---
## ПРАВИЛА СМЕНЫ ПРЕДСЕДАТЕЛЯ
```
ЕСЛИ претендент.ВЕС > текущий.ВЕС:
претендент → Председатель
текущий → Советник
ЕСЛИ претендент.ВЕС == текущий.ВЕС:
Совет голосует по качеству изложения
ЕСЛИ претендент.ВЕС < текущий.ВЕС:
Текущий остаётся Председателем
Претендент может стать Советником
```
---
```
╔═══════════════════════════════════════════════════════════════════════════════╗
║ ║
║ ЭТОТ БЕНЧМАРК НЕИЗМЕНЯЕМ ║
║ ║
║ Изменение = хардфорк ║
Все предыдущие результаты аннулируются ║
║ Бенчмарк начинается заново ║
║ ║
║ Хеш текущей версии фиксирует правила. ║
║ Побеждает сильнейший по ЭТИМ правилам. ║
║ ║
╚═══════════════════════════════════════════════════════════════════════════════╝
```