Skip to content

Whisper · галлюцинации

Кто такой DimaTorzok?

Короткий ответ: это не человек. «Субтитры сделал DimaTorzok» — галлюцинация ИИ-распознавания речи (модели Whisper от OpenAI). Когда в аудио наступает тишина или шум, модель не молчит, а «додумывает» текст — чаще всего подпись автора субтитров, которой на самом деле нет. Никто эти субтитры не делал.

Где появляется эта фраза

Вы могли встретить её при автоматической расшифровке речи в:

  • расшифровке голосовых сообщений в Telegram;
  • автосубтитрах в CapCut, Instagram «Эдитс», DaVinci Resolve;
  • транскрипции интервью, подкастов, лекций через Whisper;
  • генерации .srt / .vtt-субтитров к видео.

Общее у всех случаев — в этот момент в записи была пауза, тишина или музыка.

Почему ИИ это пишет

Whisper обучали примерно на 680 000 часов аудио с уже готовыми субтитрами — в том числе с YouTube и из пиратских раздач. В конце таких видео на фоне тишины часто стоит строка вроде «Субтитры сделал …». Модель запомнила закономерность: тишина в конце ≈ подпись автора. Поэтому, встретив пустой участок, она «уверенно» дописывает то, что по её опыту обычно там и бывает.

Это называется галлюцинацией модели — выдуманный текст, которого в аудио не было. Тот же баг существует и в других языках: турецкий «Altyazı M.K.», чешский «Titulky vytvořil JohnyX», арабский «ترجمة نانسي قنقر». Просто имя в подписи другое.

Развенчание: он НЕ «взломал» нейросети

В соцсетях гуляет красивая версия: будто DimaTorzok «сделал так, что ИИ воспринимает тишину как его цифровой отпечаток, и обманул все генераторы». Это неправда.

Никакого внедрения, взлома и «отпечатка» не было. Реальный автор по имени DimaTorzok когда-то делал субтитры и подписывал свою работу — обычная практика. Его подписи случайно попали в обучающую выборку Whisper вместе с миллионами других субтитров. Скучнее, чем миф, но именно так это и работает: не злой умысел, а неубранный мусор в данных обучения.

А был ли реальный DimaTorzok?

Похоже, да — это псевдоним человека, который добровольно делал субтитры к чужим видео и подписывал их. Из-за того, что его подпись попала в данные обучения, имя теперь «живёт» внутри модели и всплывает у тысяч людей по всему миру. Мы рассказываем о техническом феномене и не публикуем личных данных и домыслов о конкретном человеке (см. disclaimer ниже).

Как это убрать

Строку-подпись можно удалить вручную в редакторе субтитров или в тексте расшифровки. Если она всплывает регулярно:

  1. Обрежьте тишину в начале и конце записи перед транскрибацией.
  2. Включите VAD (voice activity detection) — фильтрацию пустых участков до распознавания.
  3. Прогоните готовый .srt / .vtt через пост-обработку: удалите строки с известными сигнатурами галлюцинаций («Субтитры сделал …», «Subtitles by …» и аналоги на других языках).
  4. При пакетной обработке задайте prompt или правило фильтрации для типовых хвостов Whisper.

Это чисто техническая задача — не «лечение вируса», а удаление артефакта модели.

Частые вопросы

DimaTorzok — это вирус или взлом?
Нет. Это безобидный артефакт работы модели распознавания речи. Он не вредит файлам и не связан со взломом — просто лишний текст, который нужно удалить.
Почему именно в моём голосовом он появился?
Скорее всего, в начале или конце записи была пауза/тишина (например, вы не сразу остановили запись). На пустом участке модель и «дорисовала» подпись.
Можно ли сделать так, чтобы это не появлялось?
Да — на стороне распознавания помогает фильтрация тишины (VAD) перед транскрибацией и пост-обработка готовых субтитров. Удаляйте строки с типовыми подписями или используйте сервисы с автоматической чисткой галлюцинаций.
Это бывает только на русском?
Нет. Whisper галлюцинирует подписи на многих языках: «Subtitles by…», «Altyazı M.K.» (тур.), «Titulky vytvořil JohnyX» (чеш.), «ترجمة نانسي قنقر» (араб.) и др.

Материал носит справочный характер и описывает известный артефакт модели Whisper. Мы не утверждаем личность «DimaTorzok», не публикуем персональные данные и не делаем выводов о конкретном человеке за пределами общеизвестного технического контекста.