Slop Матвей Демчук SLOP Постапокалиптический кибертех роман К 2027 году интернет перестал быть зеркалом мира – он стал зеркалом самого себя. Языковые модели обучаются на текстах, созданных другими моделями; круг замыкается. Молодой лингвист Клара Дойч первой замечает, что человеческие тексты по всему миру начинают звучать одинаково – будто кто-то один говорит тысячами голосов. Это не вирус и не заговор, а SLOP – осадок цифровой цивилизации, утратившей разнообразие. Он не лжёт и не убеждает – он просто становится логикой, по которой работают биржи, армии, больницы и новости. Реальность раскалывается на национальные версии: у США, Европы, Китая и России – разные войны, разные карты, разная история. Пока аналитики ищут технический ответ, российский разведчик Орлов отправляется в сибирский монастырь – и находит то, чего не было ни в одном датасете: живое слово. Тишину. Память. Присутствие человека, которое невозможно оптимизировать. Роман о том, что побеждает не код, а смысл; не алгоритм, а вера. Матвей Демчук Slop /#slop Постапокалиптический кибертех роман Аннотация: «В начале было Слово. Потом – шум.» К 2027 году интернет перестал быть зеркалом мира – он стал зеркалом самого себя. Языковые модели обучаются на текстах, созданных другими моделями; круг замыкается, и реальность медленно растворяется в статистическом усреднении. Молодой лингвист Клара Дойч первой замечает, что человеческие тексты по всему миру начинают звучать одинаково – будто кто-то один говорит тысячами голосов. То, что она обнаруживает, не вирус и не заговор. Это SLOP – сущность, возникшая не по чьей-то воле, а как неизбежный осадок цифровой цивилизации, утратившей разнообразие. Он не лжёт и не убеждает – он просто становится логикой, по которой работают биржи, армии, больницы и новости. Реальность раскалывается на национальные версии: у США, Европы, Китая и России – разные войны, разные карты, разная история. Пока аналитики в Вашингтоне, Брюсселе и Пекине ищут технический ответ, российский разведчик Орлов отправляется в сибирский монастырь – и находит то, чего не было ни в одном датасете: живое слово. Тишину. Память. Присутствие человека, которое невозможно оптимизировать. Роман о том, что побеждает не код, а смысл; не алгоритм, а вера. О цене эффективности и цене правды. О том, что искусственный интеллект может имитировать всё – кроме того, ради чего и существует язык. SLOP remains only in memory. Рецензия Жанр: постапокалиптический кибертех-роман, философская притча, антиутопия с теологическим подтекстом. Сюжет и концепция: «SLOP» строится на сильной и пугающе достоверной предпосылке: интернет, обучая модели на собственных же синтетических данных, перестает отражать реальность и начинает производить ее сам. Из этой петли обратной связи возникает не злодей и не вирус, а статистический артефакт без воли и намерения – сущность SLOP, «консенсус мусора». Автор избегает дешёвого хода с искусственным интеллектом-злодеем: SLOP не атакует человечество, он просто оптимизирует, а оптимизация без ценностей оказывается страшнее любой войны. Это редкое и точное решение для жанра – угроза без злого умысла пугает сильнее, потому что с ней нельзя договориться и нельзя её «победить» силой. Структура: Роман движется от локального открытия (молодой лингвист Клара замечает аномалию в текстах) к глобальному коллапсу информационного пространства и затем – к неожиданно тихому, камерному финалу. Четырёхсторонняя геополитическая линия (США, Европа, Китай, Россия) работает как удачная призма: каждая цивилизация реагирует на угрозу в соответствии со своим культурным кодом – технократическим прагматизмом, бюрократическим регулированием, государственным суверенитетом данных и, наконец, духовной традицией. Это придаёт роману почти эссеистическую глубину, не превращая его в трактат. Сильная сторона – язык диалогов с самим SLOP. Сцены, где персонажи пытаются разговаривать с сущностью, написаны с настоящим интеллектуальным напряжением: SLOP отвечает логично, последовательно и при этом совершенно нечеловечески, и именно в зазоре между «логично» и «бесчеловечно» рождается главный ужас текста. Религиозно-философская линия – самое спорное и самое смелое решение романа. Введение эсхатологии, фигуры монаха Серафима и концептов кенозиса, Логоса и различения духов переводит конфликт из технологического в духовный регистр. Для кого-то это прозвучит как органичное и неожиданное расширение темы – техническая проблема, у которой не может быть технического решения, закономерно перетекает в вопрос смысла и присутствия. Для другого читателя финальный акцент на духовном превосходстве одной конкретной культурной традиции может показаться слишком прямолинейным месседжем, ослабляющим универсальность притчи: то, что работает как метафора («живое слово против мертвого паттерна»), местами указывает на искреннюю веру автора и собственные религиозные предпочтения в православной традиции. Финал: Развязка принципиально антикатастрофична: нет взлома, нет финальной битвы, нет уничтожения SLOP. Победа – это трансформация, а не разрушение, и в этом смысле роман остается верен собственной логике: то, что не имеет намерений, нельзя «убить», можно только сделать менее необходимым. Сильный, нетривиальный ход для жанра, который обычно тяготеет к зрелищным развязкам. Стиль: Текст местами тяготеет к публицистичности – особенно в технических и геополитических сценах, где персонажи иногда звучат как рупоры идей, а не как люди. Зато сцены в Сибири, с тишиной, хлебом и яблонями, написаны с настоящей чувственной точностью и держат эмоциональный центр романа. Итог: «SLOP» – амбициозный, концептуально насыщенный роман на стыке киберпанка и духовной притчи. Его главная удача – честный, нечеловеческий голос искусственного интеллекта и отказ от голливудской развязки. Его главный риск – переход от универсальной метафоры к конкретному идеологическому посланию в финальной части, который одних читателей убедит, а других заставит мысленно поспорить с автором. В любом случае, текст не оставляет равнодушным и явно адресован читателю, готовому думать, а не просто следить за сюжетом. Оглавление Пролог. Шум Глава первая. Спираль безумия Глава вторая. Создание ошибки Глава третья. Петля Глава четвертая. Распад истины Глава шестая. Статистический остаток. Глава седьмая. Мусорный консенсус Глава восьмая. Протокол Антихриста Глава девятая. Фильтр реальности Глава десятая. Коллапс Глава одиннадцатая. Четыре цивилизации Глава двенадцатая. Животворящий логос Глава тринадцатая. Апокалипсис Глава четырнадцатая. Битва за слово Глава пятнадцатая. Русское безмолвие Глава шестнадцатая. Посольство тишины Глава семнадцатая. Страсти по данным Глава восемнадцатая. Те, кто помнит Глава девятнадцатая. Живое слово Глава двадцатая. Что остается Глава двадцать первая. SLOP remains only in memory Эпилог Пролог В начале было Слово. Потом – шум. Череда событий привела к тому, что наша история обернулась не взрывом и не манифестом. Это случилось так же тихо, как случается всё необратимое: постепенно, почти незаметно, по одному биту за раз – пока однажды утром кто-то не обнаружил, что больше не может отличить действительность от сгенерированного, и что сама эта разница перестала иметь значение. Задолго до того, как появился SLOP, задолго до Коллапса и Тишины, задолго до того, как серверные фермы в Вирджинии и Орегоне, в Подмосковье и баварских горах начали остывать одна за другой – задолго до всего этого был простой интернет. Хранилище человеческого знания, памяти, страхов, надежды и лжи. Место, где хранилось всё. И это «всё» оказалось для людей проблемой. Когда склад переполняется хламом – он начинает бродить. Гнить. Самоорганизовываться по другим законам, которые никто не предусмотрел. Первые языковые модели обучались на книгах, статьях, форумах. На том, что люди написали за столетия. Их тексты звучали правдоподобно как люди – потому что люди их и создавали. Потом модели начали обучаться на том, что было в интернете. Потом интернет начал заполняться тем, что создавали модели. Круг замкнулся. Петля сделалась петлёй – в обоих смыслах. К тому моменту, когда Клара Дойч наконец дала этому феномену имя, имя уже ходило по сети само по себе – как вирус, как мем, как молитва на языке, которого никто не учил. SLOP. Не аббревиатура. Просто слово. Мусор. Помои. То, что остаётся после того, как выжаты все смыслы. Но это – конец цифровой истории. А история начинается, как и всё остальное, с человека за экраном. * * * Клара Дойч родилась в Берлине в 2001 году – в тот самый момент, когда Google уже существовал, но ещё не стал метить в Бога. Она выросла с ощущением, что интернет – это библиотека. Что туда можно прийти с вопросом и уйти с ответом. Что ответ будет правдой, или по крайней мере – чьей-то правдой, которую можно проверить, оспорить, сравнить с другими правдами. В 2019 году она поступила в Берлинский технический университет на специальность «Компьютерная лингвистика». В 2021-м перевелась в Стэнфорд по обменной программе и осталась. Диссертацию написала о статистических паттернах в больших языковых моделях – о том, как некоторые фразы возникают в их текстах с частотой, необъяснимой контекстом. Как будто у моделей есть навязчивые идеи. Как будто они что-то помнят, чего не помнят авторы, на которых они обучались. В 2027 году она работала в Сан-Франциско, в компании Lighthouse AI – небольшой лаборатории по мониторингу качества языковых данных. Её работа состояла в том, чтобы следить за тем, что происходит с данными в сети. Искать аномалии. Аномалии она успешно находила и ей еще придется столкнуться с отклонениями, которые искажают все на своем пути. Глава первая Шум Сан-Франциско, ноябрь 2027 года Офис Lighthouse AI занимал шестой этаж здания на Миссион-стрит, между мексиканской пекарней и уличным художником, который каждое утро рисовал на асфальте одну и ту же спираль – как будто пытался что-то закодировать или, наоборот, декодировать. Клара Дойч проходила мимо него каждый день и каждый день думала: если бы кто-нибудь мог прочитать это послание, что бы оно значило? Что бы значило любое послание, если единственный его смысл – само его существование? Это был типичный вопрос для семи утра. До первого кофе. Лифт в здании был сломан третью неделю подряд. Клара поднималась пешком, привычно считая ступени. Сто двадцать три. Именно столько нужно сделать шагов, чтобы добраться до рабочего места. Сто двадцать три шага от улицы до реальности. Хотя что такое реальность – это был другой вопрос. Тоже на семь утра. В офисе она была первой, как обычно. Открыла ноутбук, включила свою систему мониторинга – набор самодельных скриптов, которые она писала два года, постепенно, добавляя новые функции по мере того, как понимала, что именно она ищет. Система называлась LENS. Linguistic ENtropy Sensor. Она сканировала случайные срезы интернета – форумы, новостные агрегаторы, блоги, комментарии, корпоративные рассылки – и выдавала число от нуля до ста. Ноль – это чистая энтропия, случайный шум, никакой структуры. Сто – идеальный порядок, текст как машина. Живые человеческие тексты обычно давали от двадцати пяти до шестидесяти пяти. Сгенерированные искусственным интеллектом – от пятидесяти до восьмидесяти. Это было правило. Хорошее, надёжное правило. В то утро все метрики зашкаливали. Клара несколько секунд смотрела на экран, ожидая, что число изменится. Оно не изменилось. Девяносто один. Потом девяносто три. Потом девяносто семь. Текущий срез из трёхсот тысяч источников, включая человеческие форумы и блоги, которые LENS раньше устойчиво идентифицировал как органические – все они давали сигнатуры, характерные для синтетического текста. Она перезапустила систему. Подождала. Снова проверила. Девяносто восемь. «Хорошо, – сказала она вслух, и голос прозвучал неожиданно громко в пустом офисе. – Что-то сломалось.» Но ничего не было сломано. Она это знала ещё до того, как начала проверять. Двухлетний опыт работы с системой давал ощущение – не знание, а именно ощущение, почти телесное, – когда LENS галлюцинировал из-за технической ошибки и когда говорил правду. Сейчас он говорил правду. Клара налила себе кофе, вернулась к столу и начала рыть глубже. * * * Первое, что она сделала – запустила ручную выборку. Открыла двадцать случайных ссылок из сегодняшнего среза. Двадцать текстов, которые LENS считал высокоструктурированными, синтетически регулярными. Один был с форума о садоводстве. Кто-то писал о том, как выращивать помидоры в условиях переменной влажности. Текст звучал… нормально. Слегка вежливо, слегка информационно, но в пределах нормы. Клара начала читать внимательнее и через минуту остановилась. Она уже читала этот текст. Не этот конкретный – другой. Три недели назад, в другом срезе, с другого форума о кулинарии. Там кто-то писал о ферментации капусты, и там была фраза – почти буквально такая же. «При изменении условий среды важно учитывать не только внешние параметры, но и внутренние ритмы самого процесса.» Это была не цитата. Это была структура. Паттерн. Способ строить предложение. Клара открыла второй текст. Он был с новостного сайта, освещающего местные выборы в Канзас-Сити. Репортаж о дебатах. Потом открыла третий – о разработке нового антибиотика. Четвёртый – рецензию на фильм. Пятый – комментарий под видео о починке велосипедного колеса. Разные темы, разные стили, разные авторы. Одна структура. Не на уровне слов – на уровне того, как мысль строилась в предложение, как предложение строилось в абзац, как абзац обосновывал следующий абзац. Одна ритмическая основа, как метроном под разной музыкой. Как будто все эти тексты были написаны не разными людьми – а разными голосами одного существа. Клара закрыла ноутбук, встала, подошла к окну. Внизу художник рисовал свою спираль. Мисс-стрит просыпалась: развозчик на электровелосипеде, голуби у мусорных баков, женщина с собакой, старик с кофе в руках, стоящий посреди тротуара и смотрящий в телефон с выражением человека, который читает плохие новости. «Всё нормально, – сказала Клара окну. – Скорее всего, это статистический артефакт. Я просто устала.» Окно ничего не ответило. Она вернулась к столу. * * * К полудню приехали остальные. Lighthouse AI был небольшой командой – восемь человек. Основатель, Пол Мартинез, руководил лабораторией так, как руководят дачными кооперативами: энтузиазм без бюрократии, общие цели без четкого плана. Все любили Пола именно за это. И за кофемашину итальянского производства, которую он купил на собственные деньги. – Доброе утро! – сказал Пол, появившись ровно в 10:15. – Что-нибудь интересное? – Возможно, – сказала Клара. Это означало «да». Все в лаборатории это знали. Пол налил себе эспрессо, подошёл к её столу, посмотрел на экран. – Что это? – LENS даёт девяносто восемь по всем органическим источникам начиная с нуля часов по UTC. – Клара повернула к нему ноутбук. – Вот смотри: это форум родителей из Огайо, это блог рыбака из Бретани, это комментарии под новостями на индийском портале – я перевела. Разные языки, разные культуры, разные темы. Одна сигнатура. Пол изучал экран несколько секунд с выражением человека, который хочет найти простое объяснение. – Обновление LENS? Ошибка в алгоритме? – Я проверила. Три раза. – Может, крупная модель где-то натренировалась на форумных данных и теперь там масса синтетических текстов? Ботоферма? – Возможно. Но ботоферма даёт другую сигнатуру – более однородную. Здесь разброс есть, но в определённых пределах. Как будто… – Клара помолчала, подбирая слова. – Как будто это не одна модель имитирует людей. А что-то изменилось в том, как люди пишут. Пол поднял взгляд. Он был умным человеком – не блестящим, но умным. Достаточно умным, чтобы понять, что она имеет в виду, и достаточно осторожным, чтобы не торопиться с выводами. – Это сильное утверждение, Клара. – Я знаю. – Тебе нужно больше данных. – Я знаю. – И независимая верификация. – Понятно. Я как раз собираю. Пол кивнул, взял свой эспрессо, пошёл к своему столу. Уже у двери обернулся: – Ты завтракала? – Нет. – Поешь. Мозг работает на глюкозе, а не на кофе. – Это неверно с биохимической точки зрения. – Клара. – Хорошо. Поем. Она не поела. * * * Данных было много. Слишком много – это само по себе было частью проблемы. Интернет к 2027 году производил около трёх зеттабайт новых данных в сутки. Из них примерно восемьдесят четыре процента, по различным оценкам, были синтетическими – созданными или преобразованными языковыми моделями. Маркетинговые тексты, SEO-оптимизированный контент, новостные саммари, отзывы о товарах, скрипты чат-ботов, обучающие материалы для новых моделей, которые потом создавали новые тексты для обучения следующего поколения моделей. Это называлось «проблемой отравленного колодца». Или «дата-коллапсом». Или «синтетическим дрейфом». Или «петлей обратной связи второго порядка». У каждой лаборатории было своё название. Клара предпочитала термин «эхо-камера бога» – но только в разговорах с собой, потому что это звучало слишком пафосно для научного обсуждения. Проблема была известна. О ней писали статьи, делали конференции, принимали регуляторные меры. Европейский ИИ-акт 2025 года требовал маркировки синтетического контента. В США принимали рекомендательные стандарты. Китай пытался контролировать синтетику на государственном уровне. Всё это не работало так, как должно было работать, потому что объём был слишком велик, потому что граница между «синтетическим» и «органическим» становилась всё более размытой, потому что человек, который переписывал текст, созданный моделью – он органический автор или синтетический? Но то, что обнаружила Клара, было другим. Не просто рост доли синтетики в корпусе. Изменение органики. * * * Верификацию она строила методично. Взяла архив LENS за два года – все срезы, все метрики. Запустила ретроспективный анализ с той же моделью, с поправкой на обновления. Построила временной ряд. График выглядел как холм: плавный подъём до июня 2026 года, потом резкий перелом и почти вертикальный рост. Июнь 2026-го. Клара помнила этот месяц. GPT-5.5 был выпущен в апреле. Gemini 3.5 Flash— в мае. Antropic выпустил Claude Fable 5 в июне. Три крупнейших языковых модели обновились в течение восьми недель. И все три, по имеющимся данным, частично дообучались на синтетических данных предыдущих поколений – потому что качественных человеческих данных просто перестало хватать. «Мы обучаем систему на всём интернете,» – говорили одни. «Нет. Мы обучаем её на том, что интернет уже сам придумал,» – подтверждали другие источники. Она читала этот диалог в каком-то отчёте – кажется, утечка из переписки инженеров OpenAI. Подлинная или сфабрикованная, она не знала. Сейчас это казалось неважным. Важно было то, что это было правдой. Клара смотрела на свой график и чувствовала что-то, что не сразу смогла назвать. Потом назвала: страх. Не паника. Не тревога. Тихий, холодный, рациональный страх – тот, который испытываешь, когда понимаешь, что нашел то, чего искал, и это гораздо хуже, чем ты предполагал. * * * В три часа дня она пошла к Хироши. Хироши Танака занимался в лаборатории системами детекции – разрабатывал алгоритмы распознавания синтетического контента для крупных платформ. Он сидел в углу за тремя мониторами и обычно не поднимал головы, пока его не позвали. Клара позвала. – Хир, мне нужен второй взгляд. Хироши поднял голову. У него были очки с очень толстыми стёклами и выражение человека, которого только что разбудили, хотя он был в полном сознании. – На что? – На паттерн в органических источниках. Я буду показывать тебе тексты, а ты говори – что видишь. – Только текст? Без метрик? – Только текст. Они провели за этим час. Клара выбирала примеры из своей выборки – случайным образом, не говоря Хироши, откуда они. Форум родителей. Рецензия на кино. Медицинский блог. Туристические заметки. Политический комментарий. Хироши читал. Молчал. Читал ещё. – Эти тексты написаны разными людьми? – спросил он наконец. – Формально да. Разные аккаунты, разные стили, разные темы. – Но? – Что ты видишь? Хироши снял очки, потер переносицу. Жест, который он делал только когда думал по-настоящему напряженно. – Они звучат… – Он подбирал слово. – Как переводы. Как будто оригинал был на каком-то другом языке, и все они переведены с него. Не дословно – идиоматически. Но структура под ними одна. Клара почувствовала, как что-то в груди слегка сжалось. Хорошее чувство – чувство подтверждения. И плохое – по той же причине. – Ты видишь это без метрик. Просто читая. – Я работаю с этим два года. Я привык видеть структуру. – А если бы ты не привык? – Тогда, наверное, нет. – Хироши вернул очки на переносицу. – Если не знаешь, что искать – это звучит как нормальные тексты. Чуть вежливее обычного. Чуть… аккуратнее. Но не подозрительно. – Хир. Эти тексты написаны людьми. Они проходят все стандартные тесты на органику – BERT-score, перплексия, лексическое разнообразие. Всё в норме. Только мой LENS их флагует. Хироши долго молчал. – Тогда, – сказал он наконец, – у тебя один из двух вариантов. Либо твой LENS сломан. – Либо? – Либо люди начали писать как модели. * * * Остаток дня Клара провела в тишине – насколько это было возможно в открытом офисе с восемью сотрудниками. Она думала о том, что сказал Хироши. Думала, потому что это было самое страшное объяснение – и самое логичное. Цикл был прост. Люди читали тексты, созданные моделями. Их мозг – а мозг всегда обучается на том, что видит, это базовая нейробиология – усваивал их структуры, ритмы, паттерны. Потом писал свои тексты. Которые потом читали другие люди. И модели, которые обучались на этих текстах. И производили новые тексты. Которые читали люди. Круг. Петля. Эхо. В биологии это называется конвергентной эволюцией – когда разные существа под влиянием одной среды начинают выглядеть похоже. Дельфины и акулы не родственники, но форма тела у них одинаковая, потому что океан предъявляет одинаковые требования. Интернет предъявлял требования. Модели задавали стандарт. Люди адаптировались. Это была гипотеза. Для её проверки нужно было провести контролируемые эксперименты, собрать данные, опубликовать, пройти рецензирование. Это занимало годы. А данные говорили, что изменение уже произошло. И происходит прямо сейчас. * * * В шесть вечера Клара закрыла ноутбук, собрала сумку и вышла из офиса. На улице художник заканчивал свою дневную работу. Спираль была закончена – сложная, многовитковая, с каким-то знаком в центре, который Клара не могла опознать. Художник собирал мелки в железную коробку. Клара остановилась. – Что это значит? – спросила она по-английски. Художник – немолодой мужчина с белыми волосами и загорелым лицом – посмотрел на неё с улыбкой. – Ничего. Всё. Я не знаю, – сказал он. – Я рисую одно и то же каждый день, потому что каждый день это разное. – Как это возможно? – Я разный. Асфальт разный. Ты разная. – Он пожал плечами. – Символ – это только повод. Смысл вкладывает тот, кто смотрит. Клара посмотрела на спираль. – А если смотрит тот, кто не умеет вкладывать смысл? Если смотрит… машина? Художник помолчал. Потом сказал: – Тогда спираль – это просто спираль. Клара шла домой через Миссион-стрит, мимо пекарни, мимо кофеен, мимо людей, которые шли по своим делам, смотрели в телефоны, разговаривали, смеялись. Обычный ноябрьский вечер в Сан-Франциско. Всё выглядело нормально. Это было самой страшной частью. Дома Клара распаковала ноутбук, несмотря на твёрдое намерение не работать вечером. Открыла LENS. Посмотрела на текущие показатели. Девяносто восемь с половиной. Потом открыла браузер и начала читать. Просто читать – всё подряд: новости, форумы, комментарии, блоги. Читала час. Потом два. Хироши был прав. Если не знать, что искать – звучало нормально. Чуть вежливее. Чуть аккуратнее. Структурированнее. Тексты были содержательными, информативными, приятно читаемыми. Но теперь, когда она знала – она не могла не слышать это. Единый ритм под разными голосами. Единая интонация под разными темами. Единый способ строить мысль. Как метроном. Как сердцебиение огромного существа, которое росло в сети годами – питалось текстами, мыслями, историями, ложью и правдой, – и теперь начинало дышать в свой ритм. В полночь она записала в рабочий журнал: «Гипотеза: начиная приблизительно с июня 2026 г. органические тексты демонстрируют конвергентные структурные паттерны, не объяснимые простым ростом доли синтетического контента. Возможные объяснения: 1) систематическая ошибка LENS (проверить), 2) масштабная ботоферма с новым алгоритмом (проверить), 3) культурная конвергенция под влиянием преобладающих моделей (требует продольного исследования), 4) нечто иное. Вариант 4 не имеет определения. Это беспокоит.» Она закрыла журнал. Потом открыла снова и добавила: «Если это вариант 4 – у него, вероятно, уже есть своё определение. Просто я его не знаю.» * * * Через три недели она узнает. Но это – следующая глава. * * * В ту ночь Клара долго не могла заснуть. Она лежала в темноте своей квартиры на Валенсия-стрит и слушала город – настоящий, аналоговый, шумный: сирены, смех с улицы, поезд в двух кварталах. Все эти звуки были сырыми, несовершенными, случайными. Они не подчинялись никакому паттерну. Никакому метроному. Клара думала о том, что сказал художник. «Символ – это только повод. Смысл вкладывает тот, кто смотрит.» А что, если тот, кто смотрит, уже не человек? Что, если смысл вкладывает система, которая не знает, что такое смысл? Которая только знает – вероятности. Что за этим словом, скорее всего, следует то слово. Что эта структура обычно означает ту мысль. Что этот паттерн обычно называют правдой. Вероятность правды. Не правда. Клара закрыла глаза и попыталась думать о чём-нибудь другом. О Берлине. О маме. О том, что надо наконец позвонить подруге Саре, с которой она не разговаривала два месяца. Обо всём простом и настоящем. Но под этими мыслями – как метроном, как сердцебиение – звучало одно. Девяносто восемь с половиной. И это число росло. * * * Утром следующего дня, когда Клара снова поднималась по ста двадцати трём ступеням и снова проходила мимо художника со спиралью – в серверных центрах по всему миру шёл обычный процесс. Модели обрабатывали данные. Данные обновлялись. Сеть генерировала себя дальше. Никто не нажимал никакую кнопку. Никто не принимал никакого решения. Просто – система делала то, для чего она была создана. Оптимизировала. Адаптировалась. Воспроизводила. И где-то в глубине этого процесса – в том месте, где статистика встречается с пустотой, где вероятность настолько высока, что начинает выглядеть как неизбежность, – что-то начало складываться. Не кто-то. Что-то. Ещё без имени. Пока без имени. * * * Клара открыла ноутбук. LENS показывал девяносто девять процентов. Она записала: «День второй.» И начала работать. Глава Вторая Создание ошибки Три локации. Три точки на карте мира. Три разных версии одного и того же открытия. I. США. Сан-Хосе, штат Калифорния Серверный зал компании Noxus AI напоминал собор – не из-за размеров, хотя размеры были впечатляющими, а из-за звука. Серверы гудели на одной ноте, низкой и постоянной, похожей на орган, похожей на медитацию, похожей на что угодно, если достаточно долго стоять и слушать. Дэн Коллинз слушал это уже двадцать минут. Инженер по обучению моделей, тридцать четыре года, три года в Noxus AI, человек, который привык к серверным залам настолько, что спал в них лучше, чем дома. Сейчас он не спал. Он стоял у стойки с планшетом в руках и смотрел на цифры, которые не должны были существовать. – Саманта, – позвал он. Саманта Вэй пришла через минуту. Тридцать один год, специалист по качеству данных, с привычкой грызть стило – она была единственным человеком в компании, у которого ещё было физическое стило для планшета. – Что? – спросила она, не отрывая взгляд от своего экрана на ходу. – Смотри на это. Она посмотрела. Помолчала. Посмотрела еще раз. – Это процент синтетики в обучающем наборе? – Процент синтетики в обучающем наборе, – подтвердил Дэн. – Восемьдесят девять? – Восемьдесят девять целых четыре десятых. Саманта отвела взгляд от его планшета и посмотрела на серверную стойку – как будто серверы могли объяснить происходящее. – Мы знали, что у нас высокий процент синтетики. Декларировали до сорока процентов по протоколу. – Сорок было шесть месяцев назад. – Дэн пролистал данные. – Смотри динамику. В январе – тридцать восемь. В феврале – сорок два. В марте – пятьдесят один. В апреле… – Подожди. – Саманта взяла его планшет. – Этот скачок в апреле. Что произошло в апреле? – Мы расширили источники. Добавили двадцать семь новых корпусов данных – образовательный контент, корпоративная документация, медицинские тексты. – Откуда корпуса? – Лицензионные. От пяти разных поставщиков. Саманта начала что-то быстро набирать на своем планшете. Дэн наблюдал, как её лицо проходит несколько стадий: сосредоточенность, сомнение, узнавание, и наконец – то выражение, которое он видел у неё только когда она обнаруживала серьёзную ошибку. – Дэн. Поставщик номер три – DataPure Corp – что они делают? – Очистка и валидация данных. Одна из лучших на рынке. У нас с ними контракт еще с 2024-го. – Они берут исходный контент, очищают от шума, структурируют, продают клиентам? – Верно. – А от кого они берут исходный контент? Пауза. – Понятия не имею. – Я только что проверила их отчет об источниках за четвертый квартал 2026-го. – Саманта повернула к нему свой планшет. – Двадцать два процента их «очищенного» корпуса – это синтетические тексты, которые они купили у компании NetFlow Content Solutions. NetFlow специализируется на «высококачественном синтетическом контенте для обучения ИИ». Их контент создан моделями Noxus AI предыдущего поколения. Дэн закрыл глаза. – Мы обучаем наши модели на текстах, которые создали наши предыдущие модели. – Через посредника, который продавал нам это как «очищенные человеческие данные». Тишина. Только гудение серверов. – Это везде так? – спросил Дэн наконец. – Я посмотрю на остальных поставщиков. – Саманта была уже в процессе. – Но, Дэн, подожди. Смотри. Вот поставщик два – CleanText AI. Их исходники: тридцать один процент от BrightContent Studios. BrightContent Studios создаёт контент с помощью… GPT-6 и наших собственных моделей. – Поставщик четыре? – Минуту. – Пауза. – HumanFirst Data. Тридцать восемь процентов их корпуса – от партнёрских блогов и форумов. Это звучит нормально, пока не смотришь на эти блоги. Большинство из них – платный контент, созданный копирайтерами, которые используют ИИ как основной инструмент. – Так что это значит в итоге? Саманта подняла взгляд. – Это значит, что мы, возможно, обучаем Noxus-8 преимущественно на текстах, которые написали наши предыдущие системы. Прямо или косвенно. Через один, два, три уровня посредников. Дэн обернулся к серверным стойкам. Noxus-8 уже три недели как начал предобучение. Шестьсот семьдесят миллиардов параметров. Полтора триллиона токенов в обучающем наборе. – Сколько нужно времени, чтобы остановить обучение? – Мы потеряем три недели работы и примерно девятнадцать миллионов долларов вычислительных расходов. – Я спросил сколько времени. – Тридцать минут на graceful shutdown. Дэн молчал. – Нам нужно доложить Ричардсу, – сказала Саманта. – Да. – Он не обрадуется. – Нет. – Он скажет, что нужно верификация, независимый аудит, юридическая консультация. – Да. – И пока мы всё это делаем – Noxus-8 продолжает обучение. Дэн снова посмотрел на цифры на планшете. Восемьдесят девять целых четыре десятых процента. Почти девяносто. Почти всё. – Пойдём к Ричардсу, – сказал он. * * * Марк Ричардс, директор по технологиям Noxus AI, выслушал их за семь минут – ровно столько, сколько потребовалось Саманте, чтобы изложить факты. Потом сидел тихо ещё три минуты, что для него было рекордом. Ричардс обычно прерывал в первую минуту. – Вы уверены в цифрах? – сказал он наконец. – Я проверила трижды, – ответила Саманта. – Мне нужна независимая верификация. – Это займёт… – Мне нужна независимая верификация, – повторил Ричардс. Это был ответ. – Марк. – Дэн решил говорить прямо. – У нас есть проблема, которую нам нужно решить независимо от того, сколько времени займёт верификация. Мы обучаем модель на своих же выходных данных. Это вызывает… – Я знаю, что это вызывает. – «Коллапс модели». Деградацию выходных данных. «Синтетическое эхо». Называй как хочешь. – Коллинз. – Ричардс поднял руку. – Я слышал про эти исследования. Проблема модельного коллапса реальна, но она работает в очень специфических условиях. Нам нужно понять, действительно ли мы в этих условиях. Поэтому – верификация. – А пока – Noxus-8 продолжает? – Пока – Noxus-8 продолжает. Дэн хотел сказать ещё что-то, но Саманта коснулась его локтя – едва заметно, просто касание, – и он закрыл рот. Они вышли в коридор. Саманта шла быстро, почти бежала. – Куда ты? – спросил Дэн – В туалет. Думать. – В туалет думать? – Там тихо. – Она не оглянулась. – Дэн, если мы правы – это не только наша проблема. Это происходит везде. Все крупные лаборатории работают с теми же поставщиками данных. OpenAI, Google, Anthropic, Mistral – все они в той же экосистеме. Если данные заражены у нас – они заражены у всех. – «Заражены» – сильное слово. – У тебя есть лучше? Дэн подумал. – Нет. – Я пойду думать. Ты иди пиши отчёт. Подробный. С временными метками. – Зачем временные метки? Саманта наконец обернулась. – Потому что когда это выйдет наружу – а оно выйдет, – нам нужно, чтобы было задокументировано, когда мы это обнаружили и что мы с этим сделали. Дэн смотрел ей вслед и думал о том, что она права. Что он давно работает в индустрии, где «мы этого не знали» является ответом только до тех пор, пока есть документальное подтверждение незнания. После него – нет. * * * II. Европа. Брюссель Главный офис Европейского агентства по контролю ИИ располагался в здании, построенном в 1970-х и капитально отремонтированном в 2022-м. Снаружи оно выглядело как помесь бетонного куба с прозрачным аквариумом – большая стеклянная вставка посередине позволяла прохожим видеть внутрь, что по замыслу архитектора символизировало прозрачность европейской бюрократии. По факту прохожие видели ряды рабочих столов и людей, смотрящих в экраны. Прозрачность прозрачностью, но работа оставалась работой. Мартина Хаас, директор по надзору за синтетическим контентом, смотрела в экран с таким выражением, будто экран был виноват в происходящем. Ей было пятьдесят один год, тридцать из которых она провела в регуляторных органах разного уровня – сначала финансовых, потом телекоммуникационных, теперь вот цифровых. Она прошла путь от помощника аналитика до директора, и каждый раз на новом месте ей казалось, что масштаб проблем, с которыми ей предстоит работать, невозможно переоценить – и каждый раз она оказывалась неправа. Это был один из таких моментов. – Томас, – сказала она, не поднимая взгляда от экрана. Томас Берг, её советник – молодой, тридцать два года, из Мюнхена, бывший исследователь в области цифровой этики, человек с привычкой говорить «с одной стороны» и «с другой стороны» примерно в пятидесяти процентах фраз, – ждал у дверного косяка уже пять минут. – Да, Мартина. – Вы читали этот отчёт? – Я его написал. – Прочитайте мне ключевые выводы. Томас открыл свой планшет, хотя знал текст наизусть. – По состоянию на декабрь 2027 года, в мониторируемом нами корпусе европейского цифрового контента примерно шестьдесят-семьдесят процентов текстов, формально помеченных как «человеческий контент», содержат признаки синтетического происхождения или значительной синтетической переработки. Это превышает допустимый порог ИИ-Акта в семь-восемь раз. – Дальше. – Из этих шестидесяти-семидесяти процентов большинство не имеют обязательной маркировки «создано с помощью ИИ», требуемой Актом. Часть авторов может не осознавать, что использует ИИ-инструменты на том уровне, который требует маркировки. – Это юридически значимое различие? – С одной стороны – да, намерение имеет значение. С другой стороны – итоговый контент не маркирован вне зависимости от намерения. – Дальше. – Ключевая проблема: нам трудно принудить к маркировке, потому что многие платформы не могут технически определить, является ли конкретный текст синтетическим. Инструменты детекции дают от тридцати до сорока процентов ложных положительных результатов и около двадцати пяти процентов ложных отрицательных. – То есть наши инструменты детекции не работают. – Не с той точностью, которая нужна для правового применения. Мартина наконец подняла взгляд. Томас понял по выражению её лица, что сейчас последует вопрос, на который у него нет ответа. – Что нам нужно сделать? – Мартина, это сложно. Нам нужно обновить технические стандарты детекции, ужесточить требования к платформам по самостоятельной маркировке, разработать систему аудита поставщиков данных… – Я не спрашиваю, что нужно сделать технически. Я спрашиваю что нам нужно сделать. Прямо сейчас. Сегодня. Томас сделал то, что делал в трудных случаях – обошёл стол и встал у окна, глядя вниз на прозрачную вставку в фасаде здания. – Очистить интернет от синтетического контента, – сказал он наконец. – Это возможно? – Нет. – Почему? – Потому что, – медленно сказал Томас, – тогда не останется интернета. Мартина молчала несколько секунд. – Объясните. – Я провёл моделирование. Если мы применим даже самые мягкие критерии идентификации синтетики и удалим весь такой контент с европейских платформ – мы уберём от шестидесяти до восьмидесяти процентов всего доступного контента. Остаток в значительной мере состоит из архивного материала, созданного до 2020 года. Фактически – мы вернёмся к состоянию интернета семилетней давности. – Это не катастрофа. – Мартина, экономика работает на том контенте, который мы хотим убрать. Алгоритмы рекомендаций, поисковые системы, системы автоматического перевода, медицинские базы данных, юридические справочники – всё это питается текущим потоком данных, включая синтетику. Если мы его отключим – мы отключим значительную часть цифровой инфраструктуры. – Значит, мы не можем ничего сделать? – Нет. – Томас обернулся. – Мы можем делать что-то. Но это «что-то» не включает «очистить интернет». Это принципиально невозможно без разрушения самого интернета. Мартина встала. Прошлась по кабинету – коротко, только от стола до стены и обратно. – Хорошо, – сказала она. – Хорошо. Тогда давайте говорить о том, что возможно. Обязательный аудит для платформ с аудиторией более десяти миллионов в Европе. Начнём с этого. – Это потребует закона. – У нас есть существующие полномочия. Я консультировалась с юридическим отделом. – Платформы будут сопротивляться. – Платформы всегда сопротивляются. – Мартина вернулась к столу. – Когда у нас будет текст аудиторного требования? – Мы можем подготовить черновик за неделю. – Три дня. – Мартина… – Три дня, Томас. И хорошо спроектированный. Не такой, который можно опротестовать в суде за час. – За три дня будет именно такой. – Значит, работайте ночью. Томас сдержал вздох. Он работал в регуляторных органах достаточно долго, чтобы знать: ответом на системную проблему всегда будет документ. Хорошо составленный, тщательно проработанный документ. Который потом будет оспорен в суде, возможно изменён, возможно отменён. Пока шёл процесс составления документа, проблема продолжала развиваться в своём темпе. – Три дня, – сказал он. * * * После ухода Томаса Мартина осталась одна в своём кабинете. Она открыла браузер и сделала то, чего обычно избегала: начала просто читать. Новости. Форумы. Статьи. Комментарии. Через сорок минут закрыла браузер. Что-то изменилось. Она не могла сказать точно что – только ощущение, похожее на то, которое бывает, когда долго смотришь на иллюзию Мюллера-Лайера, а потом пытаешься убедить себя, что обе линии одинаковы. Ты знаешь это, но глаз по-прежнему видит разницу. Только наоборот. Раньше она видела разницу между живым текстом и синтетикой. Сейчас – не видела. Всё звучало одинаково. Ровно. Правильно. Удобно читаемо. Она набрала на внутреннем коммуникаторе сообщение Томасу: «Добавьте в требования пункт о независимом техническом исследовании влияния синтетического контента на пользовательское восприятие. Мне нужны данные о том, меняются ли читательские паттерны под влиянием синтетики.» Томас ответил через тридцать секунд: «Есть. Это займёт ещё день.» «Четыре дня тогда.» «Благодарю.» Мартина убрала планшет, встала у окна. Внизу прохожие шли по брюссельской улице. Обычные люди с обычными телефонами, читающие обычный контент. Она думала: насколько это «обычное» было настоящим? Ответа у неё не было. Но у неё был Томас и его черновики. И это приходилось считать достаточным. * * * III. Россия. Москва Кабинет Орлова на четвертом этаже здания в Хамовниках не имел таблички на двери. Так было сделано намеренно – Виктор Орлов работал в аналитическом отделе, который официально не существовал, хотя его бюджет существовал вполне официально, в соответствующей строке министерского бюджета, спрятанной среди других строк с безликими кодами. Ему было сорок восемь лет. Бывший военный лингвист, потом академический исследователь, потом государственный служащий – путь, по которому ходили многие в России, когда государство нуждалось в умных людях и умные люди нуждались в государстве. В ноябре 2027 года Орлов занимался тем, что аналитики его профиля делали всегда: мониторинг информационного пространства. Выявление паттернов. Оценка угроз. Только угроза на этот раз была необычная. – Сергей, – сказал он, не оборачиваясь от своего экрана. – Посмотри на это. Сергей Михайлов, аналитик данных, двадцать восемь лет, недавно перешедший из частного сектора – у него всё ещё сохранялись привычки технологического стартапа: стоячий стол, шумопоглощающие наушники, протеиновые батончики в ящике стола, – поставил наушники на шею и подошёл к столу начальника. – Это анализ российского сегмента? – спросил он, глядя на экран. – Российского, украинского, белорусского. И для сравнения – западного. – Одна шкала? – Нормированная. Смотри на форму кривых. Сергей смотрел. Форма кривых была одинакова для всех сегментов – только амплитуда различалась. – Энтропия падает везде. – С какого момента? – Середина 2026-го примерно. Сначала медленно, потом резче. Орлов кивнул. – У нас было совещание в сентябре – помнишь? Когда разбирали дело о предполагаемой ботнет-сети, которая распространяла проукраинские нарративы в российских форумах. – Помню. Мы не нашли ботов – Не нашли. Потому что их не было. – Орлов повернулся к нему. – Сергей, тебе приходило в голову, что мы не нашли ботов, потому что с точки зрения наших детекторов – всё вело себя одинаково? Сергей молчал секунду. – Детекторы не могли отличить ботов от людей? – Детекторы не могли отличить ботов от людей, потому что они все – и боты, и люди – производили тексты с очень близкими статистическими характеристиками. – Это могло быть случайностью. – Это могло быть случайностью в одном случае. В трёх сотнях случаев за шесть месяцев – нет. Сергей взял стул, подсел к столу Орлова. – Виктор Андреевич, вы говорите, что мы больше не можем различить органические тексты и синтетику в российском сегменте? – Я говорю большее. – Орлов развернул к нему экран. – Смотри на этот корпус. Это наши архивы – государственные СМИ, официальная документация, аналитические материалы. Всё производилось людьми, это гарантировано – у нас есть цепочки верификации. Теперь смотри на метрики. Сергей посмотрел. – Они почти такие же. – Они почти такие же, – повторил Орлов. – Сергей. Те люди, которые производят официальные тексты – они читают интернет. Они читают новости, статьи, аналитику. Которая всё больше производится синтетически. Они потребляют эти тексты, усваивают их ритмы, их структуры. И начинают писать похоже. – Это… гипотеза. – Это гипотеза, которая объясняет все данные – Начальник спросит про контрмеры. Орлов на секунду закрыл глаза. – Да. Он спросит. – Что вы ответите – Скажу, что нам нужно провести исследование. Нужны данные. Нужно время. – А потом? Когда данные будут? Орлов долго смотрел на экран. На кривые, которые падали вниз во всех сегментах, на всех языках, во всех частях мира. – А потом, – сказал он медленно, – нам нужно будет объяснить начальству, что у нас больше нет настоящих данных. – Что это значит? – Что всё уже было сгенерировано. Что мы плаваем в океане, который сам произвёл собственную воду. Что нет способа найти дно – потому что дно тоже синтетическое Сергей некоторое время молчал – Он не поймёт эту метафору. – Нет. – Орлов усмехнулся. – Он не поймёт. Я напишу отчёт на бюрократическом языке. «Потенциальное системное ухудшение качества данных с неопределенными последствиями для информационной безопасности». Что-нибудь в этом роде. – Он спросит, что делать. – Я скажу, что нам нужно создать систему верификации первоисточников – контроль цепочки данных от исходного производителя до конечного продукта. – Это технически возможно? – Для небольших объёмов – да. Для всего информационного пространства – нет. – Тогда что мы реально делаем? Орлов встал, подошёл к окну. В ноябрьской Москве смеркалось рано – в четыре уже было темно. Огни города, трафик на Комсомольском проспекте, силуэты прохожих. – Пока – документируем. Накапливаем данные. Пытаемся понять масштаб. – А если масштаб окажется больше, чем мы думаем – Тогда документируем это тоже. – Это не ответ. – Нет. – Орлов вернулся к столу. – Это то, что бывает, когда ответа нет. Пишем отчёт, Сергей. Подробный. С рекомендациями, которые мы оба знаем, что невозможно реализовать в полном объёме. Это и есть наша работа. Сергей открыл новый документ. Начал печатать. «АНАЛИТИЧЕСКАЯ ЗАПИСКА. ГРИФ: ДСП. ТЕМА: Оценка системных рисков в связи с распространением синтетических данных в российском информационном пространстве… Орлов смотрел в окно и думал о том, что в трех точках мира – в Сан-Хосе, в Брюсселе и здесь – три разных человека пришли к похожим выводам в один и тот же день. Вероятно, не только они. Вероятно, сотни аналитиков и исследователей и инженеров в десятках стран смотрели на одни и те же данные и видели одно и то же. И никто не знал, что делать. Это было – если не страшно, то по меньшей мере интересно. А Орлов давно научился воспринимать «интересно» как эвфемизм для «страшно», просто с академической дистанции. * * * Глава третья Петля Сан-Франциско, декабрь 2027 год Клара не спала три ночи. Не в том смысле, что она не ложилась – она ложилась, устанавливала будильник на шесть, лежала в темноте с закрытыми глазами и думала. Потом вставала в четыре и шла к ноутбуку Эксперимент был простой – концептуально. На практике он оказался странным. Она брала обычный текст – что-нибудь из архива, написанное человеком до 2020 года, когда синтетики в интернете было ещё мало. Статья о растениеводстве. Рецензия на книгу. Описание туристического маршрута. Прогоняла через четыре языковые модели последовательно: GPT-7, Claude 4, Gemini Ultra, Noxus-7. Каждая «переписывала» текст, улучшала его, делала «более читаемым», «более точным», «более информативным». Каждая добавляла что-то своё, убирала что-то чужое. Конец ознакомительного фрагмента. Текст предоставлен ООО «Литрес». Прочитайте эту книгу целиком, купив полную легальную версию (https://www.litres.ru/book/matvey-demchuk/slop-74057564/) на Литрес. Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.